JP2007274161A

JP2007274161A - リップシンク装置

Info

Publication number: JP2007274161A
Application number: JP2006095158A
Authority: JP
Inventors: Ken Inaba; 建稲葉
Original assignee: D&M Holdings Inc
Current assignee: D&M Holdings Inc
Priority date: 2006-03-30
Filing date: 2006-03-30
Publication date: 2007-10-18

Abstract

【課題】
互いに関連付けられた音声信号と映像信号を受け取って、音声と映像を時間的に対応させて出力するリップシンク装置において、使用する全ての装置に統一されたハードウェアとソフトウェアの組み込みが不要で、音声の出力の遅延時間をその都度設定する必要がなく、映像データがＩ／Ｐ変換されずに出力される映像信号であっても適応でき、映像データに特別な制御用データの付加を不要とすることを目的とする。
【解決手段】
入力の映像信号の解像度と種類を検出するビデオデコーダ９と、その検出結果に対応する音声の遅延出力の時間を記憶するＥＥＰＲＯＭ１５と、音声信号に遅延加工を行うＤＳＰ４を備え、その映像信号で決まる処理時間分だＤＳＰ４で遅延させる構成とした。
【選択図】図１

Description

この発明は、例えば家庭用のホームシアターシステムにおいて、互いに関連付けられた映像に係るデータと音声に係るデータがＡＶレシーバ、ＤＶＤ記録媒体等から供給され、映像に係るデータを再生してスクリーン上にプロジェクタ光を投射したり液晶表示装置の画面上に映像を映し出す等によって、映像を得ることができる。
他方、音声に係るデータを再生して、スピーカからその音声を出力させることが可能である。

ここで、上記の映像と音声は、本来互いに時間的に対応して出力されるべきである。つまり、具体的には、例えばＤＶＤ再生用媒体のデータを再生して音声と映像を出力させ、そのデータに係る登場人物が開口して言葉を発する場合では、ここで発する言葉の音声と関連付けられた映像の人物の唇の動きは、本来時間的に対応付いているべきである。或いは、ごく近くで起きた破裂を示す映像と破裂音の音声の再生出力では、その破裂の瞬間を示す映像と破裂音は同時に出力されなければならない。
然るに、再生用媒体において互いに関連付けられた映像に係るデータと音声に係るデータは本来的に時間的に対応付けられてつまりリップシンクで出力されるべきであるが、実際にそれぞれを再生して映像と音声を出力させると、互いに同期せず映像に対して音声が時間的に先に出力されるということが生じる。

つまり、具体的には、登場人物が音声を発してから唇が動いたり、爆発の音声が出力されてから破裂の画面が映し出されるということが生じ、結果的に、その映像と音声を楽しんでいる者に違和感を与えるという問題がある。
この互いに関連付けられた映像と音声が互いに時間的に対応せずに出力される不具合に対し、それらを互いに時間的に対応させるリップシンクロナイゼーションという技術が知られている。
この発明は、互いに関連付けられた映像と音声が時間的に対応して出力させるためのリップシンク装置に関する。

ＡＶレシーバからの互いに関連付けられた映像データと音声データ、記録用媒体からの互いに関連付けられた映像データと音声データ等に基づき、映像と音声を互いに時間的に対応して出力させるためのリップシンク装置に関し、以下の公報で開示された技術が知られている。

特開２００１-１２８１６７号公報特開２００２-２９０９３２号公報特開２００２-２０４４１６号公報

従来、ＡＶレシーバ等からの互いに関連付けられた映像信号と音声信号を時間的に対応付けて出力させるリップシンク機能の具体的な方式として、映像信号に対して音声信号を予めユーザーによって設定された唯一種類の時間だけ遅延させて出力することによって実現されている。
しかし、実際は出力する映像信号の条件である解像度、種類等によって映像信号の処理時間や伝送手段が異なり、従って、映像と音声が的確に時間的に対応付いて出力させるために必要な音声信号の遅延時間は一様ではなく、異なるものになる。

然るに、この異なる時間が考慮されずに、実際に映像の出力で発生している音声の出力に対する遅延の時間差とは無関係に常に固定された一種類の遅延時間よって音声信号の出力すべき時間の加工処理が行われ、当該音声信号はその状態のままオーディオ増幅器によって増幅されスピーカから出力されている。
よって、本来は互いに関連付けられる筈の映像と音声が、互いに時間的に対応付いてつまりリップシンクして出力されないという場合が生じることになる。

この問題に対して、特許文献１に開示された発明においては、各々の機器間においてデジタルインターフェースを介して映像データ又は音声データの復号処理を行う際に、その時間情報（タイムスタンプ）を映像信号の側と音声信号の側の間で送受信することによって映像信号と音声信号の同期を行う方式が提案されている。
斯かる構成であれば、映像信号と音声信号は互いに同期付けられていて、それぞれの出力は時間的に対応付くことになり問題はない。
しかしながら、斯かる構成のリップシンクを実施して上記複合処理に係る情報伝達を得るためには、上記送受信が可能とさせるように、使用する全ての機器に統一されたハードウェアとソフトウェアの組み込みが必要であるが、データの複合処理において互いに対応していない機器間では実現が不可能である問題が生じる。

特許文献２に開示されている装置は、リップシンク・データ用のデータベースが備えられ、そのデータベース内に設定される遅延時間の値を読み出すことによって映像信号と音声信号に同期付けを行う方式が提案されている。
斯かる方式によれば、映像信号と音声信号が互いに同期付けられるので、映像と音声はリップシンクされて出力されることになり、問題はない。
しかしながら、斯かる構成の装置は、映像の出力と音声の出力をリップシンクさせるための音声信号の遅延時間の値は前記データベース内の値をユーザーがその都度操作部からマニュアルで選択しなければならず、取り扱いが煩雑であるという問題が生じる。

特許文献３に開示されている装置は、光ディスク再生装置において映像データがＩ／Ｐ変換され順次（プログレシブ）走査方式の映像信号を出力する際に、映像信号に同期するように音声信号を遅延して出力させる方式が提案されている。
斯かる構成によれば、音声信号は映像信号に対応して同期付けられて、映像と音声が互いに対応付いて出力されることになり、問題はない。
しかしながら、特許文献３に開示されている装置では、映像データがＩ／Ｐ変換せずに出力される場合の映像信号については何ら考慮されていない。又、例え映像信号がＩ／Ｐ変換される場合であってもそのＩ／Ｐ変換に要する時間を固定の時間として捉え、その固定の時間分で音声を遅延させている。Ｉ／Ｐ変換に要する時間が、映像信号毎で異なる場合には、結果的に、リップシンクが得られないということになる。

更に、テレビ受信機等の放送信号に固有のシンクロ制御用データを付加し、映像信号と音声信号の同期を行い、結果的に映像と音声が時間的に対応付いて出力される方式が考えられる。
斯かる方式も、映像信号と音声信号が同期付けられるから、映像と音声はリップシンクされて出力されることになり、問題はない。

しかしながら、斯かる方式では固有のシンクロ制御用データが必要であり、放送用のソース信号の製作段階で制御用データを付加する事が前提となり、斯かる方式を実際に実施するには予め放送用のソース信号に制御用データが付加されている必要があるという問題が生じる。
又、既存のＤＶＤソフトや放送用の映像データ等に基づいて映像と音声を出力させようとする場合では、制御用データを持たないためリップシンクの制御を行うことが不可能であるという問題が生じる。

この発明は、上記の事情に鑑みてなされたものであり、ＡＶレシーバ、ＤＶＤ再生用媒体等からの互いに関連付けられた映像に係るデータと音声に係るデータに基づいて、関連する映像と音声を互いに時間的に対応付けてつまりリップシンクさせて出力させるためのリップシンク装置において、映像と音声が互いに確実に対応付いて出力され、リップシンクを実現するために使用する全ての機器に統一されたハードウェアとソフトウェアの組み込みを必要とせず、リップシンクを得るために音声の出力の遅延時間の値の設定をその都度必要としないことから取り扱いが簡便であって、映像データがＩ／Ｐ変換されずに出力される映像信号であってもリップシンクが得られ、映像データにリップシンクのための制御用データの付加がなくともリップシンクが可能であることを目的とする。

この発明は、映像信号に係る解像度及び種類によって決まる音声信号の出力に係る複数の遅延時間を予め記憶させ、その記憶内容と入力されて来る当該映像信号の解像度及び種類に基づく遅延時間で当該映像信号に関連付けられた音声信号を出力するように構成したリップシンクロ装置である。
その詳細な構成は、互いに関連付けられた映像信号及び音声信号を受け取って、前記映像信号に係る映像と前記音声信号に係る音声を時間的に対応付けて出力させるリップシンク装置であって、
上記映像信号に係る複数の解像度及び種類によって決まる、音声信号の遅延して出力すべき遅延時間を記憶する記憶部と、入力する音声信号を所望の遅延時間だけ遅延して出力させるデジタル信号処理部と、入力される映像信号に係る解像度及び種類を検出して、その検出した解像度及び種類に対応する音声信号の出力の遅延時間を前記記憶部から呼び出し、前記デジタル信号処理部に、その遅延時間分だけ音声信号を遅延して出力するように制御する制御部を備えてなるリップシンク装置である。

つまり、この発明では、互いに関連付けられた映像信号及び音声信号において、音声信号が映像信号に対して時間的に対応付くように、映像信号の解像度・種類によってその対応付けるための遅延時間を求めるように構成されている。
ここで、映像信号の種類とは、その映像信号がインターレース映像（Ｉ）であるかプログレッシブ映像（Ｐ）であるか等を意味する。

又、遅延時間のメモリへのプリセットは、音声信号を遅延して出力させる遅延時間は映像信号の解像度と種類によって決まるので、考えられ得る可能な数だけ設定するとよい。遅延時間のメモリへのプリセットは、具体的に、ユーザーが機器のセットアップメニューを用いて行うが挙げられる。
音声信号の出力の遅延時間は、装置において信号遅延を行うＤＳＰが対応可能な範囲が設定範囲となる。

本発明のリップシンク装置は、リップシンク機能についてオート選択モードに設定している場合、適用するプリセット値番号の選択は、映像信号の解像度と種類に基づき判別して自動的に行い、操作上の煩雑はない。
遅延時間のプリセット値の設定可能な種類（数）は、そのプリセット値は機器に内蔵の記憶部である不揮発性メモリ（例えば、ＥＥＰＲＯＭ）に保存されるためその容量に依存する。

ここで、もし同じ解像度で設定されたプリセット値が複数ある場合はプリセット値番号の上位に設定された音声の遅延時間の値を優先する。
装置をマニュアル選択モードに設定している場合は、機器の操作部より映像信号に関係なくユーザーが自由にプリセット値の中より一つをマニュアル選択することが可能である。

本発明によれば、ＡＶレシーバ、ＤＶＤ再生装置等から互いに関連付けられた映像信号と音声信号を受け取ると、映像信号から解像度及び種類に基づいて映像信号を処理して出力するための時間が特定され、この時間に基づいて音声信号が映像信号に時間的に対応して出力される構成としたことにより、リップシンク機能を構成する機器間で共通するハードウェアとソフトウェアの組み込みを必要とせず、リップシンク機能を得るための作業が不要であることから取り扱いが簡便であって、映像データがＩ／Ｐ変換される・されないに拘わらずリップシンク機能が得られ、映像データにリップシンク機能を奏させるのための制御用データが付加されなくとも、リップシンク機能を確実で簡便に奏するリップシンク装置である。

この発明を、以下において図面と共に最良の形態に基づき説明する。しかし、この形態によって、この発明が限定されるものではない。
リップシンク装置１は、図１に示すように、音声信号入力端子２と、Ａ／Ｄ変換器３と、デジタル信号処理部であるＤＳＰ４と、Ｄ／Ａ変換器５と、音声信号出力端子６と、揮発性メモリであるＲＡＭ７，１１と、映像信号入力端子８と、ビデオデコーダ９と、Ｉ／Ｐコンバータ・スケーラ１０と、ビデオエンコーダ１２と、映像信号出力端子１３と、制御部ＭＰＵ１４と、記憶部であって不揮発性メモリであるＥＥＰＲＯＭ１５と、操作部１６と、表示部１７が備えられている。

音声信号入力端子２は、互いに関連付けられた映像に係るデータ及び音声に係るデータを含むオーディオ・ヴィジュアル信号（ＡＶ信号）をＡＶレシーバで受信すると、そのＡＶ信号のうち、音声信号を入力する端子である。
Ａ／Ｄ変換器３は、音声信号入力端子２の後段に接続され、音声信号入力端子２から入力されて来るアナログ信号をデジタルに変換するものである。

ＤＳＰ４は、Ａ／Ｄ変換器３の後段に接続され、Ａ／Ｄ変換器３からのデジタルの音声信号を入力すると、サラウンド処理、レベル変換等の音声デコーダ処理を行う。
Ｄ／Ａ変換器５は、ＤＳＰ４の後段に接続され、ＤＳＰ４からのデコーダ処理され且つ遅延されたデジタルの音声信号をアナログ信号に変換して後段に出力するものである。

音声信号出力端子６は、Ｄ／Ａ変換器５の後段に接続され、Ｄ／Ａ変換器５からのアナログの音声信号を最終的にスピーカから音声で出力されるように、オーディオ増幅装置の前段の端子となるなるものである。
メモリであるＲＡＭ７は、アクセス可能にＤＳＰ４に接続されている。ＲＡＭ７は、Ａ／Ｄ変換器３からＤＳＰ４に入力される音声信号を一時的に記憶するものである。

そして、ＤＳＰ４は、制御部１４からの制御信号に基づき、ＲＡＭ７に一時的に記憶している音声信号を、ＥＥＰＲＯＭ１５からの遅延時間に対応させてつまり各映像信号に係る解像度及び種類によって決まる処理時間に基づく遅延時間だけ、関連付けられた音声信号を遅延して出力させるように機能するものである。
映像信号入力端子８は、ＡＶレシーバが互いに関連付けられた映像に係るデータ及び音声に係るデータを含むＡＶ信号を受信すると、そのＡＶ信号のうち映像信号を入力する端子である。

ビデオデコーダ９は、映像信号入力端子８の後段に接続され、映像信号入力端子８から入力されて来る映像信号をデコード処理してＩ／Ｐコンバータ・スケーラ１０に送出するものである。
又、ビデオデコーダ９は、その映像信号に係る解像度及び種類を検出し、その検出結果を制御部１４に送るものである。

Ｉ／Ｐコンバータ・スケーラ１０は、映像信号入力端子８から入力された映像信号を出力して映像を得るための走査線の有効数、インターレース映像（Ｉ）かプログレッシブ映像（Ｐ）を決定する。
メモリであるＲＡＭ１１は、アクセス可能にＩ／Ｐコンバータ・スケーラ１０に接続されている。ＲＡＭ１１は、ビデオデコーダ９３からＩ／Ｐコンバータ・スケーラ１０に入力される映像信号を一時的に記憶するものである。

ビデオエンコーダ１２は、Ｉ／Ｐコンバータ・スケーラ１０からの映像に係る信号を受け取ると、映像信号として出力する際の解像度及び種類を決定し、映像信号出力端子１３に送出するものである。
制御部１４は、ビデオデコーダ９からの入力される映像信号の解像度及び種類の検出結果に基づいて、映像信号に対して音声信号をリップシンクさせるには音声信号をどれだけの時間を遅延させて出力させるべきかに係る情報をＤＳＰ４に送るものである。

ＤＳＰ４は、制御部１４からの上記情報を受け取ると、ＥＥＰＲＯＭ１５に記録されている映像信号の解像度及び種類によって決まる音声信号の遅延して出力させるべき時間の関係を示すテーブルから、該当する遅延時間を読み出し、その遅延時間分だけ音声信号の出力を遅延させる。
より具体的には、制御部１４はＥＥＰＲＯＭ１５の定義テーブルからその時の入力映像信号に一致する解像度を検索し、検索結果の解像度に係るプリセット番号を決定する。

制御部１４は、装置全体の制御、つまり、例えば各部の制御、リップシンク機能のＯＮ／ＯＦＦ、プリセット値選択のオートとマニュアルの設定、プリセット値番号の自動選択、更には、ユーザーインターフェースを行うものである。
ＥＥＰＲＯＭ１５は、制御部１４とアクセス可能に接続された不揮発性メモリであって、装置のセットアップメニューによって設定されたプリセット値等を記憶するものである。

ＥＥＰＲＯＭ１５には、図２に示すように、入力の映像信号と出力の映像信号の組み合わせによって決まる信号処理に要する時間、つまり、映像信号を音声信号に時間的にリップシンクして出力させる際に音声信号を遅延して出力させるべき遅延時間がテーブルとなってプリセット値として記憶されている。
尚、遅延時間のプリセット値の設定可能な種類（数）は、ＥＥＰＲＯＭ１５の容量に依存する。

又、もし同じ解像度で設定されたプリセット値が複数ある場合はプリセット値番号の上位に設定された音声の遅延時間の値を優先するように構成されている。
装置をマニュアル選択モードに設定している場合には、装置１の操作部１６より映像信号に関係なくユーザーが自由にプリセット値の中から一つの遅延時間をマニュアル選択することも可能である。

ＥＥＰＲＯＭ１５のプリセット値は、音声信号の遅延時間を設定する際に、ＤＳＰ４に読み出して参照される。
操作部１６は、操作信号入力部である操作釦類が装置１のフロント面に配設されている。操作部１６は、前記操作釦類を操作することによって、装置１のプリセット値の設定やリップシンク機能のＯＮ／ＯＦＦを行うためのものである。

表示部１７は、セットアップメニューや装置１のその時の機能状態を表示するものである。表示部１７は、表示面が装置１のフロント面に位置するように組み込まれたＬＣＤ、ＦＬ等である。
又、表示部１７として、本装置１とは別体のディスプレイモニタ、ビデオプロジェクタによるＯＳＤ（オンスクリーンディスプレイ）によって、セットアップメニューや装置のその時の機能状態を表示することも可能である。

リップシンク装置１は、上述したように構成されている。以下において、図３のフローチャートを参照しながら、リップシンク装置１の機能を説明する。
ユーザーは、リップシンク装置１の前段側にＡＶレシーバ（図示省略）を、リップシンク装置１の後段側にアンプ（図示省略）とプロジェクタ（図示省略）を、それぞれ接続する。このアンプには、スピーカが接続されている。
この時、前記アンプの音声の出力の設定も行われる。同様に、前記プロジェクタで出力される映像の解像度と種類も一義的に決まる。

ユーザーは、操作部１６を操作してメイン電源をＯＮとして装置１を機能させるとリップシンク装置１は出力状態とし、操作部１６からＥＥＰＲＯＭ１５に、図２で示す映像信号の解像度及び種類と音声信号の遅延時間のペアの数値を、セットアップメニューを使用してプリセット値として記憶させる。
尚、このプリセット値の選択は、映像信号の解像度及び種類により判別して自動的に行われるように構成されている。

又、ユーザーは、操作部１６を操作してリップシンク装置１のリップシンク機能を作用させるように設定する。
更に、リップシンク装置１のリップシンク機能では、マニュアル操作つまりユーザーが音声信号の出力の遅延時間を選択することと自動的につまり制御部１４に選択させることが可能になっていて、ユーザーは操作部１６を操作して、自動的に音声信号の出力の遅延時間が選択される方を設定する。

続いて、ユーザーは、前記ＡＶレシーバ、前記アンプ、前記プロジェクタの電源をＯＮにすると、音声信号及び映像信号がそれぞれリップシンク装置１の音声信号入力端子２及び映像信号入力端子８に入力される（図３におけるＳ１）。
ユーザーは、リップシンク装置１のリップシンク機能をＯＮさせるつまり出力させるように設定しているので、リップシンク機能が出力される選択になる（同Ｓ２）。
ユーザーが、リップシンク装置１のリップシンク機能を自動的に出力させるつまり音声信号の出力の遅延時間を自動的に選択させるように設定しているので、リップシンク機能が自動的に出力される（同Ｓ３）。

ここで、音声信号は、音声信号入力端子２からＡ／Ｄ変換器３でアナログ信号からデジタル信号に変換され、ＤＳＰ４に送られＲＡＭ７に一時記憶される。
他方、映像信号は、映像信号入力端子８からビデオデコーダ９に送られて、その映像信号の解像度と種類が検出され（同Ｓ４）、その検出結果が制御部１４に送られる。
制御部１４は、操作部１６から設定された、映像信号出力端子１３から前記プロジェクタに出力される映像信号に係る解像度及び種類のデータと上記検出結果に基づいて、ＥＥＰＲＯＭ１５から対応する音声出力に係る遅延時間呼び出す。

ここで、制御部１４は、ＥＥＰＲＯＭ１５から、映像信号の解像度及び種類によって決まる音声信号の遅延して出力させるべき時間の関係を示す上記のテーブルに基づいて、音声信号の遅延して出力させる対応する遅延時間（プリセット値）を読み出し（Ｓ５）、その対応する遅延時間をＤＳＰ４に送る。
ＤＳＰ４は、その対応する遅延時間を受け取ると、Ａ／Ｄ変換器３から送られて来る上記デジタルの音声信号に対して、その対応する遅延時間分だけ遅延加工して（Ｓ６）、Ｄ／Ａ変換器５に送る。

Ｄ／Ａ変換器５は、ＤＳＰ４からの対応する時間分だけ遅延されたデジタルの音声信号をアナログの音声信号に変換し、音声信号出力端子６を介して前記アンプに送る。
前記アンプにおいて、その遅延の音声信号はユーザーの所望通りに加工されて、結果的に、前記スピーカから前記対応する遅延時間だけ遅延して音声となって出力される。

映像信号は、Ｉ／Ｐコンバータ・スケーラ１０においてインターレース映像（Ｉ）の信号からプログレッシブ映像（Ｐ）の信号に変換され、ビデオエンコーダ１２においてコード化されて、映像信号出力端子１３を介して前記プロジェクタに送られる。
ここで、前記アンプへの音声信号の出力とその音声信号に関連付けられている映像信号の前記プロジェクタへの出力は、リップシンクの状態が得られている（Ｓ７）。
前記プロジェクタは、映像信号出力端子１３からの映像信号に基づいて、映像光を出力し、結果的に、その映像光はスクリーン上で映像となって現れる。

ここで、前記スピーカから出力される音声は、前記スクリーン上で出力されている映像の元になる映像信号に対し、映像信号の加工に要する時間、つまり、映像信号入力端子８から入力する映像信号の解像度及び種類と映像信号出力端子１３から出力する映像信号の解像度及び種類によって実質的に決まる信号加工時間に対応させて遅延して出力させているので、前記スピーカからの音声と前記スクリーン上の映像は互いに時間的に対応して出力されており、リップシンクの状態が得られている。

ここで、ユーザーは前記ＡＶレシーバの現在受信しているチャンネルから、別な新たなチャンネルに切り替える。
ユーザーのこの受信チャンネルの切り替えによって、音声信号入力端子２及び映像信号入力端子８にはそれぞれ、前記新たなチャンネルに対応した音声信号及び映像信号が入力される。

ここで入力される音声信号と映像信号は互いに関連付けられたもの同士であるが、それぞれを音声及び映像として出力する際には、このままでは映像信号を処理するのに時間がかかり、映像が音声より遅れて出力されることが考えられる。
しかしながら、前記新たなチャンネルに係る映像信号は、ビデオデコーダ９においてその映像信号の解像度と種類が特定され、その特定された映像信号の解像度と種類からＥＥＰＲＯＭ１５に記憶されている前記テーブルから、上記関連付けられている音声信号の遅延して出力させるべき時間（遅延時間）が求められＤＳＰ４に送られる。

ＤＳＰ４はＥＥＰＲＯＭ１５から新たな遅延時間を受け取ると、音声信号入力端子２から入力され、Ａ／Ｄ変換器３でデジタルに変換された前記新たなチャンネルに係る音声信号にその新たな遅延時間だけ遅く出力するように加工を行う。
従って、結果的に、前記新たなチャンネルに係る互いに関連付けられた音声信号及び映像信号は、その映像信号の加工に要する時間に対応させて音声を出力させることになるから、前記スピーカから出力される前記新たなチャンネルに係る音声と前記スクリーン上で出力される前記新たなチャンネルに係る映像は、互いに時間的に対応していてリップシンクの状態が得られている。

つまり、ユーザーは、新たに入力されて来る互いに関連付けられた音声信号と映像信号をリップシンクの状態で出力させるために、音声信号の遅延時間をその都度設定したり切り替えたりする必要はなく、取り扱いが簡便になっている。
又、上述したように、音声信号と映像信号をリップシンクの状態で出力させるために、
使用する全ての機器に統一されたハードウェアとソフトウェアの組み込む必要はなく、映像信号が映像データのＩ／Ｐ変換の有無に拘わらずリップシンク状態を得ることができ、入力される映像データにリップシンクのための制御用データを必要としていない。
尚、上記において、リップシンク装置１への音声信号及び映像信号の入力で前記ＡＶレシーバの受信チャンネルを切り替えを行った説明したが、音声信号及び映像信号の入力は前記ＡＶレシーバからＤＶＤプレーヤへの切り替えた場合であっても、リップシンク装置１は同様な効果をえることができる。

リップシンク装置１において、ビデオデコーダ９が行う映像信号の解像度と種類は例えば、１０８０ｉ、１０８０ｐ、１０３５ｉ、７２０ｐ、５７６ｉ、５７６ｐ、５４０ｐ、４８０ｉ、４８０ｐが挙げられる。
この映像信号の解像度と種類に対して、音声信号を遅延して出力させる遅延時間は、例えば、実験値に基づき０〜２００ミリ秒の範囲内を１０ミリ秒の単位で設定されている。尚、０ミリ秒に設定された場合には、リップシンク装置１は機能がＯＦＦとなる。
ＥＥＰＲＯＭ１５の前記テーブルは、これらの値の組み合わせを示すものである。

ＥＥＰＲＯＭ１５の前記テーブルへのプリセット値の最大登録可能数は、ＥＥＰＲＯＭ１５そのもの容量のサイズによって決められる。別言すると、前記テーブルのプリセット数が大きい場合には、その数の大きさに対応して、ＥＥＰＲＯＭ１５の容量のサイズを大きくするとよい。
尚、もし同じ解像度と種類で設定されたプリセット値が複数ある場合は、プリセット値番号の上位に設定された音声信号の遅延時間の値を優先する構成が挙げられる。

又、ユーザーが、スピーカからの音声をスクリーン上の映像の出力に対し、それら二つの出力が時間的に対応付くリップシンクではなく所望する特定の時間差だけズラして出力させたい場合には、マニュアル操作によって前記所望する特定の時間をＥＥＰＲＯＭ１５に記憶されているテーブルから遅延時間を指定することで（Ｓ８）、所望する時間差の音声の出力と映像の出力を得ることができる。

リップシンク装置１は単独で使用される構成になっているが、ＡＶレシーバ、ＤＶＤプレーヤの記録データ再生装置に組み込んで一体化させることも可能である。

この発明の実施の最良の形態の構成を説明するブロック図である。映像信号の解像度及び種類と音声を遅延して出力させる遅延時間の関係を示すプリセット値のテーブルである。図１に示す形態において、音声信号及び映像信号の入力から出力までのプロセスを説明するフローチャートである。

符号の説明

１：リップシンク装置
２：音声信号入力端子
３：Ａ／Ｄ変換器
４：ＤＳＰ
５：Ｄ／Ａ変換器
６：音声信号出力端子
７，１１：ＲＡＭ（メモリ）
８：映像信号入力端子
９：ビデオデコーダ
１０：Ｉ／Ｐコンパレータ・スケーラ
１２：ビデオエンコーダ
１３：映像信号出力端子
１４：制御部
１５：ＥＥＰＲＯＭ（記憶部）
１６：操作部
１７：表示部

Claims

互いに関連付けられた映像信号及び音声信号を受け取って、前記映像信号に係る映像と前記音声信号に係る音声を時間的に対応付けて出力させるリップシンク装置であって、
上記映像信号に係る複数の解像度及び種類によって決まる、音声信号の遅延して出力すべき遅延時間を記憶する記憶部と、入力する音声信号を所望の遅延時間だけ遅延して出力させるデジタル信号処理部と、入力される映像信号に係る解像度及び種類を検出して、その検出した解像度及び種類に対応する音声信号の出力の遅延時間を前記記憶部から呼び出し、前記デジタル信号処理部に、その遅延時間分だけ音声信号を遅延して出力するように制御する制御部を備えてなるリップシンク装置。
互いに関連付けられた映像信号及び音声信号を、ＡＶレシーバ、ＤＶＤプレーヤから入力する請求項１に記載のリップシンク装置。
記憶部に記憶されている音声を遅延して出力させる遅延時間が、テーブル化されている請求項１に記載のリップシンク装置。