JP2007274161A - リップシンク装置 - Google Patents
リップシンク装置 Download PDFInfo
- Publication number
- JP2007274161A JP2007274161A JP2006095158A JP2006095158A JP2007274161A JP 2007274161 A JP2007274161 A JP 2007274161A JP 2006095158 A JP2006095158 A JP 2006095158A JP 2006095158 A JP2006095158 A JP 2006095158A JP 2007274161 A JP2007274161 A JP 2007274161A
- Authority
- JP
- Japan
- Prior art keywords
- video
- signal
- output
- video signal
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Television Receiver Circuits (AREA)
Abstract
【課題】
互いに関連付けられた音声信号と映像信号を受け取って、音声と映像を時間的に対応させて出力するリップシンク装置において、使用する全ての装置に統一されたハードウェアとソフトウェアの組み込みが不要で、音声の出力の遅延時間をその都度設定する必要がなく、映像データがI/P変換されずに出力される映像信号であっても適応でき、映像データに特別な制御用データの付加を不要とすることを目的とする。
【解決手段】
入力の映像信号の解像度と種類を検出するビデオデコーダ9と、その検出結果に対応する音声の遅延出力の時間を記憶するEEPROM15と、音声信号に遅延加工を行うDSP4を備え、その映像信号で決まる処理時間分だDSP4で遅延させる構成とした。
【選択図】 図1
互いに関連付けられた音声信号と映像信号を受け取って、音声と映像を時間的に対応させて出力するリップシンク装置において、使用する全ての装置に統一されたハードウェアとソフトウェアの組み込みが不要で、音声の出力の遅延時間をその都度設定する必要がなく、映像データがI/P変換されずに出力される映像信号であっても適応でき、映像データに特別な制御用データの付加を不要とすることを目的とする。
【解決手段】
入力の映像信号の解像度と種類を検出するビデオデコーダ9と、その検出結果に対応する音声の遅延出力の時間を記憶するEEPROM15と、音声信号に遅延加工を行うDSP4を備え、その映像信号で決まる処理時間分だDSP4で遅延させる構成とした。
【選択図】 図1
Description
この発明は、例えば家庭用のホームシアターシステムにおいて、互いに関連付けられた映像に係るデータと音声に係るデータがAVレシーバ、DVD記録媒体等から供給され、映像に係るデータを再生してスクリーン上にプロジェクタ光を投射したり液晶表示装置の画面上に映像を映し出す等によって、映像を得ることができる。
他方、音声に係るデータを再生して、スピーカからその音声を出力させることが可能である。
他方、音声に係るデータを再生して、スピーカからその音声を出力させることが可能である。
ここで、上記の映像と音声は、本来互いに時間的に対応して出力されるべきである。つまり、具体的には、例えばDVD再生用媒体のデータを再生して音声と映像を出力させ、そのデータに係る登場人物が開口して言葉を発する場合では、ここで発する言葉の音声と関連付けられた映像の人物の唇の動きは、本来時間的に対応付いているべきである。或いは、ごく近くで起きた破裂を示す映像と破裂音の音声の再生出力では、その破裂の瞬間を示す映像と破裂音は同時に出力されなければならない。
然るに、再生用媒体において互いに関連付けられた映像に係るデータと音声に係るデータは本来的に時間的に対応付けられてつまりリップシンクで出力されるべきであるが、実際にそれぞれを再生して映像と音声を出力させると、互いに同期せず映像に対して音声が時間的に先に出力されるということが生じる。
然るに、再生用媒体において互いに関連付けられた映像に係るデータと音声に係るデータは本来的に時間的に対応付けられてつまりリップシンクで出力されるべきであるが、実際にそれぞれを再生して映像と音声を出力させると、互いに同期せず映像に対して音声が時間的に先に出力されるということが生じる。
つまり、具体的には、登場人物が音声を発してから唇が動いたり、爆発の音声が出力されてから破裂の画面が映し出されるということが生じ、結果的に、その映像と音声を楽しんでいる者に違和感を与えるという問題がある。
この互いに関連付けられた映像と音声が互いに時間的に対応せずに出力される不具合に対し、それらを互いに時間的に対応させるリップシンクロナイゼーションという技術が知られている。
この発明は、互いに関連付けられた映像と音声が時間的に対応して出力させるためのリップシンク装置に関する。
この互いに関連付けられた映像と音声が互いに時間的に対応せずに出力される不具合に対し、それらを互いに時間的に対応させるリップシンクロナイゼーションという技術が知られている。
この発明は、互いに関連付けられた映像と音声が時間的に対応して出力させるためのリップシンク装置に関する。
AVレシーバからの互いに関連付けられた映像データと音声データ、記録用媒体からの互いに関連付けられた映像データと音声データ等に基づき、映像と音声を互いに時間的に対応して出力させるためのリップシンク装置に関し、以下の公報で開示された技術が知られている。
従来、AVレシーバ等からの互いに関連付けられた映像信号と音声信号を時間的に対応付けて出力させるリップシンク機能の具体的な方式として、映像信号に対して音声信号を予めユーザーによって設定された唯一種類の時間だけ遅延させて出力することによって実現されている。
しかし、実際は出力する映像信号の条件である解像度、種類等によって映像信号の処理時間や伝送手段が異なり、従って、映像と音声が的確に時間的に対応付いて出力させるために必要な音声信号の遅延時間は一様ではなく、異なるものになる。
しかし、実際は出力する映像信号の条件である解像度、種類等によって映像信号の処理時間や伝送手段が異なり、従って、映像と音声が的確に時間的に対応付いて出力させるために必要な音声信号の遅延時間は一様ではなく、異なるものになる。
然るに、この異なる時間が考慮されずに、実際に映像の出力で発生している音声の出力に対する遅延の時間差とは無関係に常に固定された一種類の遅延時間よって音声信号の出力すべき時間の加工処理が行われ、当該音声信号はその状態のままオーディオ増幅器によって増幅されスピーカから出力されている。
よって、本来は互いに関連付けられる筈の映像と音声が、互いに時間的に対応付いてつまりリップシンクして出力されないという場合が生じることになる。
よって、本来は互いに関連付けられる筈の映像と音声が、互いに時間的に対応付いてつまりリップシンクして出力されないという場合が生じることになる。
この問題に対して、特許文献1に開示された発明においては、各々の機器間においてデジタルインターフェースを介して映像データ又は音声データの復号処理を行う際に、その時間情報(タイムスタンプ)を映像信号の側と音声信号の側の間で送受信することによって映像信号と音声信号の同期を行う方式が提案されている。
斯かる構成であれば、映像信号と音声信号は互いに同期付けられていて、それぞれの出力は時間的に対応付くことになり問題はない。
しかしながら、斯かる構成のリップシンクを実施して上記複合処理に係る情報伝達を得るためには、上記送受信が可能とさせるように、使用する全ての機器に統一されたハードウェアとソフトウェアの組み込みが必要であるが、データの複合処理において互いに対応していない機器間では実現が不可能である問題が生じる。
斯かる構成であれば、映像信号と音声信号は互いに同期付けられていて、それぞれの出力は時間的に対応付くことになり問題はない。
しかしながら、斯かる構成のリップシンクを実施して上記複合処理に係る情報伝達を得るためには、上記送受信が可能とさせるように、使用する全ての機器に統一されたハードウェアとソフトウェアの組み込みが必要であるが、データの複合処理において互いに対応していない機器間では実現が不可能である問題が生じる。
特許文献2に開示されている装置は、リップシンク・データ用のデータベースが備えられ、そのデータベース内に設定される遅延時間の値を読み出すことによって映像信号と音声信号に同期付けを行う方式が提案されている。
斯かる方式によれば、映像信号と音声信号が互いに同期付けられるので、映像と音声はリップシンクされて出力されることになり、問題はない。
しかしながら、斯かる構成の装置は、映像の出力と音声の出力をリップシンクさせるための音声信号の遅延時間の値は前記データベース内の値をユーザーがその都度操作部からマニュアルで選択しなければならず、取り扱いが煩雑であるという問題が生じる。
斯かる方式によれば、映像信号と音声信号が互いに同期付けられるので、映像と音声はリップシンクされて出力されることになり、問題はない。
しかしながら、斯かる構成の装置は、映像の出力と音声の出力をリップシンクさせるための音声信号の遅延時間の値は前記データベース内の値をユーザーがその都度操作部からマニュアルで選択しなければならず、取り扱いが煩雑であるという問題が生じる。
特許文献3に開示されている装置は、光ディスク再生装置において映像データがI/P変換され順次(プログレシブ)走査方式の映像信号を出力する際に、映像信号に同期するように音声信号を遅延して出力させる方式が提案されている。
斯かる構成によれば、音声信号は映像信号に対応して同期付けられて、映像と音声が互いに対応付いて出力されることになり、問題はない。
しかしながら、特許文献3に開示されている装置では、映像データがI/P変換せずに出力される場合の映像信号については何ら考慮されていない。又、例え映像信号がI/P変換される場合であってもそのI/P変換に要する時間を固定の時間として捉え、その固定の時間分で音声を遅延させている。I/P変換に要する時間が、映像信号毎で異なる場合には、結果的に、リップシンクが得られないということになる。
斯かる構成によれば、音声信号は映像信号に対応して同期付けられて、映像と音声が互いに対応付いて出力されることになり、問題はない。
しかしながら、特許文献3に開示されている装置では、映像データがI/P変換せずに出力される場合の映像信号については何ら考慮されていない。又、例え映像信号がI/P変換される場合であってもそのI/P変換に要する時間を固定の時間として捉え、その固定の時間分で音声を遅延させている。I/P変換に要する時間が、映像信号毎で異なる場合には、結果的に、リップシンクが得られないということになる。
更に、テレビ受信機等の放送信号に固有のシンクロ制御用データを付加し、映像信号と音声信号の同期を行い、結果的に映像と音声が時間的に対応付いて出力される方式が考えられる。
斯かる方式も、映像信号と音声信号が同期付けられるから、映像と音声はリップシンクされて出力されることになり、問題はない。
斯かる方式も、映像信号と音声信号が同期付けられるから、映像と音声はリップシンクされて出力されることになり、問題はない。
しかしながら、斯かる方式では固有のシンクロ制御用データが必要であり、放送用のソース信号の製作段階で制御用データを付加する事が前提となり、斯かる方式を実際に実施するには予め放送用のソース信号に制御用データが付加されている必要があるという問題が生じる。
又、既存のDVDソフトや放送用の映像データ等に基づいて映像と音声を出力させようとする場合では、制御用データを持たないためリップシンクの制御を行うことが不可能であるという問題が生じる。
又、既存のDVDソフトや放送用の映像データ等に基づいて映像と音声を出力させようとする場合では、制御用データを持たないためリップシンクの制御を行うことが不可能であるという問題が生じる。
この発明は、上記の事情に鑑みてなされたものであり、AVレシーバ、DVD再生用媒体等からの互いに関連付けられた映像に係るデータと音声に係るデータに基づいて、関連する映像と音声を互いに時間的に対応付けてつまりリップシンクさせて出力させるためのリップシンク装置において、映像と音声が互いに確実に対応付いて出力され、リップシンクを実現するために使用する全ての機器に統一されたハードウェアとソフトウェアの組み込みを必要とせず、リップシンクを得るために音声の出力の遅延時間の値の設定をその都度必要としないことから取り扱いが簡便であって、映像データがI/P変換されずに出力される映像信号であってもリップシンクが得られ、映像データにリップシンクのための制御用データの付加がなくともリップシンクが可能であることを目的とする。
この発明は、映像信号に係る解像度及び種類によって決まる音声信号の出力に係る複数の遅延時間を予め記憶させ、その記憶内容と入力されて来る当該映像信号の解像度及び種類に基づく遅延時間で当該映像信号に関連付けられた音声信号を出力するように構成したリップシンクロ装置である。
その詳細な構成は、互いに関連付けられた映像信号及び音声信号を受け取って、前記映像信号に係る映像と前記音声信号に係る音声を時間的に対応付けて出力させるリップシンク装置であって、
上記映像信号に係る複数の解像度及び種類によって決まる、音声信号の遅延して出力すべき遅延時間を記憶する記憶部と、入力する音声信号を所望の遅延時間だけ遅延して出力させるデジタル信号処理部と、入力される映像信号に係る解像度及び種類を検出して、その検出した解像度及び種類に対応する音声信号の出力の遅延時間を前記記憶部から呼び出し、前記デジタル信号処理部に、その遅延時間分だけ音声信号を遅延して出力するように制御する制御部を備えてなるリップシンク装置である。
その詳細な構成は、互いに関連付けられた映像信号及び音声信号を受け取って、前記映像信号に係る映像と前記音声信号に係る音声を時間的に対応付けて出力させるリップシンク装置であって、
上記映像信号に係る複数の解像度及び種類によって決まる、音声信号の遅延して出力すべき遅延時間を記憶する記憶部と、入力する音声信号を所望の遅延時間だけ遅延して出力させるデジタル信号処理部と、入力される映像信号に係る解像度及び種類を検出して、その検出した解像度及び種類に対応する音声信号の出力の遅延時間を前記記憶部から呼び出し、前記デジタル信号処理部に、その遅延時間分だけ音声信号を遅延して出力するように制御する制御部を備えてなるリップシンク装置である。
つまり、この発明では、互いに関連付けられた映像信号及び音声信号において、音声信号が映像信号に対して時間的に対応付くように、映像信号の解像度・種類によってその対応付けるための遅延時間を求めるように構成されている。
ここで、映像信号の種類とは、その映像信号がインターレース映像(I)であるかプログレッシブ映像(P)であるか等を意味する。
ここで、映像信号の種類とは、その映像信号がインターレース映像(I)であるかプログレッシブ映像(P)であるか等を意味する。
又、遅延時間のメモリへのプリセットは、音声信号を遅延して出力させる遅延時間は映像信号の解像度と種類によって決まるので、考えられ得る可能な数だけ設定するとよい。 遅延時間のメモリへのプリセットは、具体的に、ユーザーが機器のセットアップメニューを用いて行うが挙げられる。
音声信号の出力の遅延時間は、装置において信号遅延を行うDSPが対応可能な範囲が設定範囲となる。
音声信号の出力の遅延時間は、装置において信号遅延を行うDSPが対応可能な範囲が設定範囲となる。
本発明のリップシンク装置は、リップシンク機能についてオート選択モードに設定している場合、適用するプリセット値番号の選択は、映像信号の解像度と種類に基づき判別して自動的に行い、操作上の煩雑はない。
遅延時間のプリセット値の設定可能な種類(数)は、そのプリセット値は機器に内蔵の記憶部である不揮発性メモリ(例えば、EEPROM)に保存されるためその容量に依存する。
遅延時間のプリセット値の設定可能な種類(数)は、そのプリセット値は機器に内蔵の記憶部である不揮発性メモリ(例えば、EEPROM)に保存されるためその容量に依存する。
ここで、もし同じ解像度で設定されたプリセット値が複数ある場合はプリセット値番号の上位に設定された音声の遅延時間の値を優先する。
装置をマニュアル選択モードに設定している場合は、機器の操作部より映像信号に関係なくユーザーが自由にプリセット値の中より一つをマニュアル選択することが可能である。
装置をマニュアル選択モードに設定している場合は、機器の操作部より映像信号に関係なくユーザーが自由にプリセット値の中より一つをマニュアル選択することが可能である。
本発明によれば、AVレシーバ、DVD再生装置等から互いに関連付けられた映像信号と音声信号を受け取ると、映像信号から解像度及び種類に基づいて映像信号を処理して出力するための時間が特定され、この時間に基づいて音声信号が映像信号に時間的に対応して出力される構成としたことにより、リップシンク機能を構成する機器間で共通するハードウェアとソフトウェアの組み込みを必要とせず、リップシンク機能を得るための作業が不要であることから取り扱いが簡便であって、映像データがI/P変換される・されないに拘わらずリップシンク機能が得られ、映像データにリップシンク機能を奏させるのための制御用データが付加されなくとも、リップシンク機能を確実で簡便に奏するリップシンク装置である。
この発明を、以下において図面と共に最良の形態に基づき説明する。しかし、この形態によって、この発明が限定されるものではない。
リップシンク装置1は、図1に示すように、音声信号入力端子2と、A/D変換器3と、デジタル信号処理部であるDSP4と、D/A変換器5と、音声信号出力端子6と、揮発性メモリであるRAM7,11と、映像信号入力端子8と、ビデオデコーダ9と、I/Pコンバータ・スケーラ10と、ビデオエンコーダ12と、映像信号出力端子13と、制御部MPU14と、記憶部であって不揮発性メモリであるEEPROM15と、操作部16と、表示部17が備えられている。
リップシンク装置1は、図1に示すように、音声信号入力端子2と、A/D変換器3と、デジタル信号処理部であるDSP4と、D/A変換器5と、音声信号出力端子6と、揮発性メモリであるRAM7,11と、映像信号入力端子8と、ビデオデコーダ9と、I/Pコンバータ・スケーラ10と、ビデオエンコーダ12と、映像信号出力端子13と、制御部MPU14と、記憶部であって不揮発性メモリであるEEPROM15と、操作部16と、表示部17が備えられている。
音声信号入力端子2は、互いに関連付けられた映像に係るデータ及び音声に係るデータを含むオーディオ・ヴィジュアル信号(AV信号)をAVレシーバで受信すると、そのAV信号のうち、音声信号を入力する端子である。
A/D変換器3は、音声信号入力端子2の後段に接続され、音声信号入力端子2から入力されて来るアナログ信号をデジタルに変換するものである。
A/D変換器3は、音声信号入力端子2の後段に接続され、音声信号入力端子2から入力されて来るアナログ信号をデジタルに変換するものである。
DSP4は、A/D変換器3の後段に接続され、A/D変換器3からのデジタルの音声信号を入力すると、サラウンド処理、レベル変換等の音声デコーダ処理を行う。
D/A変換器5は、DSP4の後段に接続され、DSP4からのデコーダ処理され且つ遅延されたデジタルの音声信号をアナログ信号に変換して後段に出力するものである。
D/A変換器5は、DSP4の後段に接続され、DSP4からのデコーダ処理され且つ遅延されたデジタルの音声信号をアナログ信号に変換して後段に出力するものである。
音声信号出力端子6は、D/A変換器5の後段に接続され、D/A変換器5からのアナログの音声信号を最終的にスピーカから音声で出力されるように、オーディオ増幅装置の前段の端子となるなるものである。
メモリであるRAM7は、アクセス可能にDSP4に接続されている。RAM7は、A/D変換器3からDSP4に入力される音声信号を一時的に記憶するものである。
メモリであるRAM7は、アクセス可能にDSP4に接続されている。RAM7は、A/D変換器3からDSP4に入力される音声信号を一時的に記憶するものである。
そして、DSP4は、制御部14からの制御信号に基づき、RAM7に一時的に記憶している音声信号を、EEPROM15からの遅延時間に対応させてつまり各映像信号に係る解像度及び種類によって決まる処理時間に基づく遅延時間だけ、関連付けられた音声信号を遅延して出力させるように機能するものである。
映像信号入力端子8は、AVレシーバが互いに関連付けられた映像に係るデータ及び音声に係るデータを含むAV信号を受信すると、そのAV信号のうち映像信号を入力する端子である。
映像信号入力端子8は、AVレシーバが互いに関連付けられた映像に係るデータ及び音声に係るデータを含むAV信号を受信すると、そのAV信号のうち映像信号を入力する端子である。
ビデオデコーダ9は、映像信号入力端子8の後段に接続され、映像信号入力端子8から入力されて来る映像信号をデコード処理してI/Pコンバータ・スケーラ10に送出するものである。
又、ビデオデコーダ9は、その映像信号に係る解像度及び種類を検出し、その検出結果を制御部14に送るものである。
又、ビデオデコーダ9は、その映像信号に係る解像度及び種類を検出し、その検出結果を制御部14に送るものである。
I/Pコンバータ・スケーラ10は、映像信号入力端子8から入力された映像信号を出力して映像を得るための走査線の有効数、インターレース映像(I)かプログレッシブ映像(P)を決定する。
メモリであるRAM11は、アクセス可能にI/Pコンバータ・スケーラ10に接続されている。RAM11は、ビデオデコーダ93からI/Pコンバータ・スケーラ10に入力される映像信号を一時的に記憶するものである。
メモリであるRAM11は、アクセス可能にI/Pコンバータ・スケーラ10に接続されている。RAM11は、ビデオデコーダ93からI/Pコンバータ・スケーラ10に入力される映像信号を一時的に記憶するものである。
ビデオエンコーダ12は、I/Pコンバータ・スケーラ10からの映像に係る信号を受け取ると、映像信号として出力する際の解像度及び種類を決定し、映像信号出力端子13に送出するものである。
制御部14は、ビデオデコーダ9からの入力される映像信号の解像度及び種類の検出結果に基づいて、映像信号に対して音声信号をリップシンクさせるには音声信号をどれだけの時間を遅延させて出力させるべきかに係る情報をDSP4に送るものである。
制御部14は、ビデオデコーダ9からの入力される映像信号の解像度及び種類の検出結果に基づいて、映像信号に対して音声信号をリップシンクさせるには音声信号をどれだけの時間を遅延させて出力させるべきかに係る情報をDSP4に送るものである。
DSP4は、制御部14からの上記情報を受け取ると、EEPROM15に記録されている映像信号の解像度及び種類によって決まる音声信号の遅延して出力させるべき時間の関係を示すテーブルから、該当する遅延時間を読み出し、その遅延時間分だけ音声信号の出力を遅延させる。
より具体的には、制御部14はEEPROM15の定義テーブルからその時の入力映像信号に一致する解像度を検索し、検索結果の解像度に係るプリセット番号を決定する。
より具体的には、制御部14はEEPROM15の定義テーブルからその時の入力映像信号に一致する解像度を検索し、検索結果の解像度に係るプリセット番号を決定する。
制御部14は、装置全体の制御、つまり、例えば各部の制御、リップシンク機能のON/OFF、プリセット値選択のオートとマニュアルの設定、プリセット値番号の自動選択、更には、ユーザーインターフェースを行うものである。
EEPROM15は、制御部14とアクセス可能に接続された不揮発性メモリであって、装置のセットアップメニューによって設定されたプリセット値等を記憶するものである。
EEPROM15は、制御部14とアクセス可能に接続された不揮発性メモリであって、装置のセットアップメニューによって設定されたプリセット値等を記憶するものである。
EEPROM15には、図2に示すように、入力の映像信号と出力の映像信号の組み合わせによって決まる信号処理に要する時間、つまり、映像信号を音声信号に時間的にリップシンクして出力させる際に音声信号を遅延して出力させるべき遅延時間がテーブルとなってプリセット値として記憶されている。
尚、遅延時間のプリセット値の設定可能な種類(数)は、EEPROM15の容量に依存する。
尚、遅延時間のプリセット値の設定可能な種類(数)は、EEPROM15の容量に依存する。
又、もし同じ解像度で設定されたプリセット値が複数ある場合はプリセット値番号の上位に設定された音声の遅延時間の値を優先するように構成されている。
装置をマニュアル選択モードに設定している場合には、装置1の操作部16より映像信号に関係なくユーザーが自由にプリセット値の中から一つの遅延時間をマニュアル選択することも可能である。
装置をマニュアル選択モードに設定している場合には、装置1の操作部16より映像信号に関係なくユーザーが自由にプリセット値の中から一つの遅延時間をマニュアル選択することも可能である。
EEPROM15のプリセット値は、音声信号の遅延時間を設定する際に、DSP4に読み出して参照される。
操作部16は、操作信号入力部である操作釦類が装置1のフロント面に配設されている。操作部16は、前記操作釦類を操作することによって、装置1のプリセット値の設定やリップシンク機能のON/OFFを行うためのものである。
操作部16は、操作信号入力部である操作釦類が装置1のフロント面に配設されている。操作部16は、前記操作釦類を操作することによって、装置1のプリセット値の設定やリップシンク機能のON/OFFを行うためのものである。
表示部17は、セットアップメニューや装置1のその時の機能状態を表示するものである。表示部17は、表示面が装置1のフロント面に位置するように組み込まれたLCD、FL等である。
又、表示部17として、本装置1とは別体のディスプレイモニタ、ビデオプロジェクタによるOSD(オンスクリーンディスプレイ)によって、セットアップメニューや装置のその時の機能状態を表示することも可能である。
又、表示部17として、本装置1とは別体のディスプレイモニタ、ビデオプロジェクタによるOSD(オンスクリーンディスプレイ)によって、セットアップメニューや装置のその時の機能状態を表示することも可能である。
リップシンク装置1は、上述したように構成されている。以下において、図3のフローチャートを参照しながら、リップシンク装置1の機能を説明する。
ユーザーは、リップシンク装置1の前段側にAVレシーバ(図示省略)を、リップシンク装置1の後段側にアンプ(図示省略)とプロジェクタ(図示省略)を、それぞれ接続する。このアンプには、スピーカが接続されている。
この時、前記アンプの音声の出力の設定も行われる。同様に、前記プロジェクタで出力される映像の解像度と種類も一義的に決まる。
ユーザーは、リップシンク装置1の前段側にAVレシーバ(図示省略)を、リップシンク装置1の後段側にアンプ(図示省略)とプロジェクタ(図示省略)を、それぞれ接続する。このアンプには、スピーカが接続されている。
この時、前記アンプの音声の出力の設定も行われる。同様に、前記プロジェクタで出力される映像の解像度と種類も一義的に決まる。
ユーザーは、操作部16を操作してメイン電源をONとして装置1を機能させるとリップシンク装置1は出力状態とし、操作部16からEEPROM15に、図2で示す映像信号の解像度及び種類と音声信号の遅延時間のペアの数値を、セットアップメニューを使用してプリセット値として記憶させる。
尚、このプリセット値の選択は、映像信号の解像度及び種類により判別して自動的に行われるように構成されている。
尚、このプリセット値の選択は、映像信号の解像度及び種類により判別して自動的に行われるように構成されている。
又、ユーザーは、操作部16を操作してリップシンク装置1のリップシンク機能を作用させるように設定する。
更に、リップシンク装置1のリップシンク機能では、マニュアル操作つまりユーザーが音声信号の出力の遅延時間を選択することと自動的につまり制御部14に選択させることが可能になっていて、ユーザーは操作部16を操作して、自動的に音声信号の出力の遅延時間が選択される方を設定する。
更に、リップシンク装置1のリップシンク機能では、マニュアル操作つまりユーザーが音声信号の出力の遅延時間を選択することと自動的につまり制御部14に選択させることが可能になっていて、ユーザーは操作部16を操作して、自動的に音声信号の出力の遅延時間が選択される方を設定する。
続いて、ユーザーは、前記AVレシーバ、前記アンプ、前記プロジェクタの電源をONにすると、音声信号及び映像信号がそれぞれリップシンク装置1の音声信号入力端子2及び映像信号入力端子8に入力される(図3におけるS1)。
ユーザーは、リップシンク装置1のリップシンク機能をONさせるつまり出力させるように設定しているので、リップシンク機能が出力される選択になる(同S2)。
ユーザーが、リップシンク装置1のリップシンク機能を自動的に出力させるつまり音声信号の出力の遅延時間を自動的に選択させるように設定しているので、リップシンク機能が自動的に出力される(同S3)。
ユーザーは、リップシンク装置1のリップシンク機能をONさせるつまり出力させるように設定しているので、リップシンク機能が出力される選択になる(同S2)。
ユーザーが、リップシンク装置1のリップシンク機能を自動的に出力させるつまり音声信号の出力の遅延時間を自動的に選択させるように設定しているので、リップシンク機能が自動的に出力される(同S3)。
ここで、音声信号は、音声信号入力端子2からA/D変換器3でアナログ信号からデジタル信号に変換され、DSP4に送られRAM7に一時記憶される。
他方、映像信号は、映像信号入力端子8からビデオデコーダ9に送られて、その映像信号の解像度と種類が検出され(同S4)、その検出結果が制御部14に送られる。
制御部14は、操作部16から設定された、映像信号出力端子13から前記プロジェクタに出力される映像信号に係る解像度及び種類のデータと上記検出結果に基づいて、EEPROM15から対応する音声出力に係る遅延時間呼び出す。
他方、映像信号は、映像信号入力端子8からビデオデコーダ9に送られて、その映像信号の解像度と種類が検出され(同S4)、その検出結果が制御部14に送られる。
制御部14は、操作部16から設定された、映像信号出力端子13から前記プロジェクタに出力される映像信号に係る解像度及び種類のデータと上記検出結果に基づいて、EEPROM15から対応する音声出力に係る遅延時間呼び出す。
ここで、制御部14は、EEPROM15から、映像信号の解像度及び種類によって決まる音声信号の遅延して出力させるべき時間の関係を示す上記のテーブルに基づいて、音声信号の遅延して出力させる対応する遅延時間(プリセット値)を読み出し(S5)、その対応する遅延時間をDSP4に送る。
DSP4は、その対応する遅延時間を受け取ると、A/D変換器3から送られて来る上記デジタルの音声信号に対して、その対応する遅延時間分だけ遅延加工して(S6)、D/A変換器5に送る。
DSP4は、その対応する遅延時間を受け取ると、A/D変換器3から送られて来る上記デジタルの音声信号に対して、その対応する遅延時間分だけ遅延加工して(S6)、D/A変換器5に送る。
D/A変換器5は、DSP4からの対応する時間分だけ遅延されたデジタルの音声信号をアナログの音声信号に変換し、音声信号出力端子6を介して前記アンプに送る。
前記アンプにおいて、その遅延の音声信号はユーザーの所望通りに加工されて、結果的に、前記スピーカから前記対応する遅延時間だけ遅延して音声となって出力される。
前記アンプにおいて、その遅延の音声信号はユーザーの所望通りに加工されて、結果的に、前記スピーカから前記対応する遅延時間だけ遅延して音声となって出力される。
映像信号は、I/Pコンバータ・スケーラ10においてインターレース映像(I)の信号からプログレッシブ映像(P)の信号に変換され、ビデオエンコーダ12においてコード化されて、映像信号出力端子13を介して前記プロジェクタに送られる。
ここで、前記アンプへの音声信号の出力とその音声信号に関連付けられている映像信号の前記プロジェクタへの出力は、リップシンクの状態が得られている(S7)。
前記プロジェクタは、映像信号出力端子13からの映像信号に基づいて、映像光を出力し、結果的に、その映像光はスクリーン上で映像となって現れる。
ここで、前記アンプへの音声信号の出力とその音声信号に関連付けられている映像信号の前記プロジェクタへの出力は、リップシンクの状態が得られている(S7)。
前記プロジェクタは、映像信号出力端子13からの映像信号に基づいて、映像光を出力し、結果的に、その映像光はスクリーン上で映像となって現れる。
ここで、前記スピーカから出力される音声は、前記スクリーン上で出力されている映像の元になる映像信号に対し、映像信号の加工に要する時間、つまり、映像信号入力端子8から入力する映像信号の解像度及び種類と映像信号出力端子13から出力する映像信号の解像度及び種類によって実質的に決まる信号加工時間に対応させて遅延して出力させているので、前記スピーカからの音声と前記スクリーン上の映像は互いに時間的に対応して出力されており、リップシンクの状態が得られている。
ここで、ユーザーは前記AVレシーバの現在受信しているチャンネルから、別な新たなチャンネルに切り替える。
ユーザーのこの受信チャンネルの切り替えによって、音声信号入力端子2及び映像信号入力端子8にはそれぞれ、前記新たなチャンネルに対応した音声信号及び映像信号が入力される。
ユーザーのこの受信チャンネルの切り替えによって、音声信号入力端子2及び映像信号入力端子8にはそれぞれ、前記新たなチャンネルに対応した音声信号及び映像信号が入力される。
ここで入力される音声信号と映像信号は互いに関連付けられたもの同士であるが、それぞれを音声及び映像として出力する際には、このままでは映像信号を処理するのに時間がかかり、映像が音声より遅れて出力されることが考えられる。
しかしながら、前記新たなチャンネルに係る映像信号は、ビデオデコーダ9においてその映像信号の解像度と種類が特定され、その特定された映像信号の解像度と種類からEEPROM15に記憶されている前記テーブルから、上記関連付けられている音声信号の遅延して出力させるべき時間(遅延時間)が求められDSP4に送られる。
しかしながら、前記新たなチャンネルに係る映像信号は、ビデオデコーダ9においてその映像信号の解像度と種類が特定され、その特定された映像信号の解像度と種類からEEPROM15に記憶されている前記テーブルから、上記関連付けられている音声信号の遅延して出力させるべき時間(遅延時間)が求められDSP4に送られる。
DSP4はEEPROM15から新たな遅延時間を受け取ると、音声信号入力端子2から入力され、A/D変換器3でデジタルに変換された前記新たなチャンネルに係る音声信号にその新たな遅延時間だけ遅く出力するように加工を行う。
従って、結果的に、前記新たなチャンネルに係る互いに関連付けられた音声信号及び映像信号は、その映像信号の加工に要する時間に対応させて音声を出力させることになるから、前記スピーカから出力される前記新たなチャンネルに係る音声と前記スクリーン上で出力される前記新たなチャンネルに係る映像は、互いに時間的に対応していてリップシンクの状態が得られている。
従って、結果的に、前記新たなチャンネルに係る互いに関連付けられた音声信号及び映像信号は、その映像信号の加工に要する時間に対応させて音声を出力させることになるから、前記スピーカから出力される前記新たなチャンネルに係る音声と前記スクリーン上で出力される前記新たなチャンネルに係る映像は、互いに時間的に対応していてリップシンクの状態が得られている。
つまり、ユーザーは、新たに入力されて来る互いに関連付けられた音声信号と映像信号をリップシンクの状態で出力させるために、音声信号の遅延時間をその都度設定したり切り替えたりする必要はなく、取り扱いが簡便になっている。
又、上述したように、音声信号と映像信号をリップシンクの状態で出力させるために、
使用する全ての機器に統一されたハードウェアとソフトウェアの組み込む必要はなく、映像信号が映像データのI/P変換の有無に拘わらずリップシンク状態を得ることができ、入力される映像データにリップシンクのための制御用データを必要としていない。
尚、上記において、リップシンク装置1への音声信号及び映像信号の入力で前記AVレシーバの受信チャンネルを切り替えを行った説明したが、音声信号及び映像信号の入力は前記AVレシーバからDVDプレーヤへの切り替えた場合であっても、リップシンク装置1は同様な効果をえることができる。
又、上述したように、音声信号と映像信号をリップシンクの状態で出力させるために、
使用する全ての機器に統一されたハードウェアとソフトウェアの組み込む必要はなく、映像信号が映像データのI/P変換の有無に拘わらずリップシンク状態を得ることができ、入力される映像データにリップシンクのための制御用データを必要としていない。
尚、上記において、リップシンク装置1への音声信号及び映像信号の入力で前記AVレシーバの受信チャンネルを切り替えを行った説明したが、音声信号及び映像信号の入力は前記AVレシーバからDVDプレーヤへの切り替えた場合であっても、リップシンク装置1は同様な効果をえることができる。
リップシンク装置1において、ビデオデコーダ9が行う映像信号の解像度と種類は例えば、1080i、 1080p、 1035i、 720p、 576i、 576p、 540p、 480i、 480pが挙げられる。
この映像信号の解像度と種類に対して、音声信号を遅延して出力させる遅延時間は、例えば、実験値に基づき0〜200ミリ秒の範囲内を10ミリ秒の単位で設定されている。 尚、0ミリ秒に設定された場合には、リップシンク装置1は機能がOFFとなる。
EEPROM15の前記テーブルは、これらの値の組み合わせを示すものである。
この映像信号の解像度と種類に対して、音声信号を遅延して出力させる遅延時間は、例えば、実験値に基づき0〜200ミリ秒の範囲内を10ミリ秒の単位で設定されている。 尚、0ミリ秒に設定された場合には、リップシンク装置1は機能がOFFとなる。
EEPROM15の前記テーブルは、これらの値の組み合わせを示すものである。
EEPROM15の前記テーブルへのプリセット値の最大登録可能数は、EEPROM15そのもの容量のサイズによって決められる。別言すると、前記テーブルのプリセット数が大きい場合には、その数の大きさに対応して、EEPROM15の容量のサイズを大きくするとよい。
尚、もし同じ解像度と種類で設定されたプリセット値が複数ある場合は、プリセット値番号の上位に設定された音声信号の遅延時間の値を優先する構成が挙げられる。
尚、もし同じ解像度と種類で設定されたプリセット値が複数ある場合は、プリセット値番号の上位に設定された音声信号の遅延時間の値を優先する構成が挙げられる。
又、ユーザーが、スピーカからの音声をスクリーン上の映像の出力に対し、それら二つの出力が時間的に対応付くリップシンクではなく所望する特定の時間差だけズラして出力させたい場合には、マニュアル操作によって前記所望する特定の時間をEEPROM15に記憶されているテーブルから遅延時間を指定することで(S8)、所望する時間差の音声の出力と映像の出力を得ることができる。
リップシンク装置1は単独で使用される構成になっているが、AVレシーバ、DVDプレーヤの記録データ再生装置に組み込んで一体化させることも可能である。
1 :リップシンク装置
2 :音声信号入力端子
3 :A/D変換器
4 :DSP
5 :D/A変換器
6 :音声信号出力端子
7,11 :RAM(メモリ)
8 :映像信号入力端子
9 :ビデオデコーダ
10 :I/Pコンパレータ・スケーラ
12 :ビデオエンコーダ
13 :映像信号出力端子
14 :制御部
15 :EEPROM(記憶部)
16 :操作部
17 :表示部
2 :音声信号入力端子
3 :A/D変換器
4 :DSP
5 :D/A変換器
6 :音声信号出力端子
7,11 :RAM(メモリ)
8 :映像信号入力端子
9 :ビデオデコーダ
10 :I/Pコンパレータ・スケーラ
12 :ビデオエンコーダ
13 :映像信号出力端子
14 :制御部
15 :EEPROM(記憶部)
16 :操作部
17 :表示部
Claims (3)
- 互いに関連付けられた映像信号及び音声信号を受け取って、前記映像信号に係る映像と前記音声信号に係る音声を時間的に対応付けて出力させるリップシンク装置であって、
上記映像信号に係る複数の解像度及び種類によって決まる、音声信号の遅延して出力すべき遅延時間を記憶する記憶部と、入力する音声信号を所望の遅延時間だけ遅延して出力させるデジタル信号処理部と、入力される映像信号に係る解像度及び種類を検出して、その検出した解像度及び種類に対応する音声信号の出力の遅延時間を前記記憶部から呼び出し、前記デジタル信号処理部に、その遅延時間分だけ音声信号を遅延して出力するように制御する制御部を備えてなるリップシンク装置。 - 互いに関連付けられた映像信号及び音声信号を、AVレシーバ、DVDプレーヤから入力する請求項1に記載のリップシンク装置。
- 記憶部に記憶されている音声を遅延して出力させる遅延時間が、テーブル化されている請求項1に記載のリップシンク装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006095158A JP2007274161A (ja) | 2006-03-30 | 2006-03-30 | リップシンク装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006095158A JP2007274161A (ja) | 2006-03-30 | 2006-03-30 | リップシンク装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007274161A true JP2007274161A (ja) | 2007-10-18 |
Family
ID=38676529
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006095158A Pending JP2007274161A (ja) | 2006-03-30 | 2006-03-30 | リップシンク装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007274161A (ja) |
-
2006
- 2006-03-30 JP JP2006095158A patent/JP2007274161A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4575324B2 (ja) | Av装置及びその制御方法 | |
US8903523B2 (en) | Audio processing device, audio processing method, and program | |
JP5008677B2 (ja) | 映像音声装置ネットワークおよび信号再生方法 | |
US20100053471A1 (en) | Television apparatus and method for controlling the same | |
JP2010187158A (ja) | コンテンツ処理装置 | |
JP2009141843A (ja) | テレビジョン装置 | |
JP2007318604A (ja) | ディジタル音声信号処理装置 | |
US8654261B2 (en) | Video and audio processing device and program thereof | |
US20110131616A1 (en) | Terminal device, media processing apparatus connected to terminal device, and controlling method thereof | |
JP4837018B2 (ja) | Av装置 | |
EP1889488B1 (en) | Audio-video processing system | |
JP5506239B2 (ja) | 映像処理装置、制御方法及びプログラム | |
JP2007235519A (ja) | 映像音声同期方法及び映像音声同期システム | |
JP2007274161A (ja) | リップシンク装置 | |
JP2010154249A (ja) | 映像音声再生システム及び配信装置 | |
JP2007325059A (ja) | 増幅装置 | |
JP2007243460A (ja) | 中継装置、av再生システムおよびavソース装置 | |
US7801408B2 (en) | Apparatus and method for converting operation mode in image display compound device | |
KR100808201B1 (ko) | 음성/영상 데이터의 동기화 방법 | |
JP2010093614A (ja) | 映像信号再生装置 | |
KR20100072681A (ko) | 영상표시기기에서 동영상 재생 장치 및 방법 | |
JP2008066931A (ja) | 映像音声再生システムおよびこれを構成する映像音声同期再生装置 | |
JP2007123964A (ja) | ディスク装置内蔵型テレビジョン受信装置 | |
JP2014143724A (ja) | 映像信号処理装置 | |
JP5248663B2 (ja) | インターフェース方式 |