本発明の一実施の形態による送信装置1について図面とともに説明する。
図1は、本発明の一実施の形態による送信装置及び受信装置を用いた通信システムの一実施例のシステム構成図である。
図1において、通信システム100は、送信装置1と受信装置2とを備えて構成され、送信装置1と受信装置2とは例えば公衆電話回線等のネットワーク3を介してデータ接続されている。
送信装置1は、一対の映像入力端4A,音声入力端4Bを備えた入力端4を複数組(図示の場合は入力端4-1,4-2の2組)備え、各入力端4にそれぞれ供給される映像データと音声データとを符号化し、映像と音声とのストリームデータを生成して、ネットワーク3を介して受信装置2に送信する。図示の例では、2組ある入力端4の中の一方の入力端4-1には、テレビ電話に用いるためのカメラ5とマイク6とが接続され、他方の入力端4-2には映像記録装置7の映像出力7A及び音声出力7Bが接続されている。
受信装置2は、一対の映像出力端8A,音声出力端8Bを備えた出力端8を1組備え、映像出力端8Aには表示手段としてのディスプレイ9が接続され、音声出力端8Bには音声出力手段としてのスピーカ10が接続されている。これにより、受信装置2は、送信装置1から受信したストリームデータを復号化し、映像及び音声をディスプレイ9及びスピーカ10からそれぞれ出力する構成になっている。
図2は、本実施の形態に係る送信装置の構成を示した論理ブロック図である。
送信装置1は、入力部11、入力選択部12、符号化制御部13、符号化情報生成部14、符号化情報送信部15、音声データ符号化部16、複合データ符号化部17、データ送信部18、ユーザ入力処理部19、設定保持部20、ネットワーク情報解析部21、ネットワーク情報受信部22、及び通信部23を備えた構成になっている。
入力部11は、各入力端4-1,4-2に対応した第1入力部11-1及び第2入力部11-2を有して構成されている。第1入力部11-1及び第2入力部11-2は、それぞれ一対の映像入力部11-1A(11-2A)と音声入力部11-1B(11-2B)とを備えている。
本実施の形態では、第1入力部11-1は受信装置2との間でのテレビ電話に使用するための部位として使用されている。そのため、第1入力部11-1の映像入力部11-1Aはカメラ5と接続され、音声入力部11-1Bはマイク6と接続されている。
また、第2入力部11-1はビデオ、デジタルカメラ等の外部の映像記録装置5からの映像データを入力する部位として使用されている。そのために、第2入力部11-2の映像入力部11-2Aは映像記録装置7の映像出力7Aと接続され、音声入力部11-1Bは映像記録装置7の音声出力7Bと接続されている。
そして、これら入力部11の第1映像入力部11-1A,第1音声入力部11-1B,第2映像入力部11-2A,第2音声入力部11-2Bのそれぞれ出力は入力選択部12に供給される。
入力選択部12は、第1映像入力部11-1Aから入力された映像データと第1音声入力部11-1Bから入力された音声データとの対、又は第2映像入力部11-2Aから入力された映像データと第2音声入力部11-2Bから入力された音声データとの対の中、いずれか一方の映像データと音声データとの対を選択し、選択された対の映像データと音声データとを符号化制御部13に出力する。
入力選択部12は、第1入力部11-1又は第2入力部11-2からそれぞれ供給される映像データと音声データとの対の中、どちらの入力部11-1,11-2から供給される映像データと音声データとの対を選択するかを、設定保持部20に保持されている設定情報に基づいて行う。
符号化制御部13は、入力選択部12で選択された一対の映像データ及び音声データの符号化に関し、その映像データと音声データとを多重化して符号化するか、その映像データと音声データとをそれぞれ独立に符号化するかを制御する。符号化制御部13は、この選択制御を、設定保持部20に保持されている設定情報に基づいて行う。
そのため、符号化制御部13は、この設定保持部20に保持されている設定情報に基づき、両者を多重化して符号化する場合は、入力選択部12から供給される一対の映像データ及び音声データを複合データ符号化部17に供給し、両者独立に符号化する場合は、入力選択部12から供給される一対の映像データ及び音声データの中、映像データを複合データ符号化部17に供給する一方で、音声データを音声データ符号化部16に供給する。
符号化情報生成部14は、符号化制御部13の制御結果を受けて、入力選択部12から供給される一対の映像データ及び音声データの符号化に用いたコーデック(CODEC)に関する情報(符号化情報)を生成し、生成した符号化情報を符号化情報送信部15に供給する。この符号化情報は、前述した符号化制御部13がその符号化処理方法を切り替えた際に、送信装置1側で符号化処理方法を切り替えたことを受信装置2に通知するために使用される。ここで、符号化情報生成部14によって生成される符号化情報について説明する。
図3は、本実施の形態の送信装置における符号化情報生成部によって生成される符号化情報のデータ構造を示す図である。
符号化情報110は、メディアのタイプを表わしたメディアタイプ情報111と、符号化に用いたコーデック名を表わしたコーデック情報112とを備えて構成されている。この符号化情報110としては、例えばSDP(Session Description Protocol)が用いられる。この符号化情報110において、メディアタイプ情報111は、メディアが映像であるか、音声であるか、又は映像と音声とが多重化されたシステムであるかを表したものである。また、コーデック情報112は、符号化に用いたコーデック名を表したものである。このコーデック情報112には、コーデック名のような文字列、又はペイロードタイプ(Payload type)のような数値を用いることができる。
図2に戻り、符号化情報送信部15は、符号化情報生成部14から供給される符号化情報110から通信パケットを生成して、後述の通信部23からネットワーク3を介して受信装置2に送信する。
音声データ符号化部16は、前述の符号化制御部13から供給される音声データを一連のストリームデータに符号化し、データ送信部18に供給する。符号化に用いるコーデックとしては、例えばITU−T(International Telecommunication Union-Telecommunication sector )の音声符号化方式に関する勧告G.711が用いられる。
複合データ符号化部17は、前述の符号化制御部13から供給される映像データと音声データとを多重化して一連のストリームデータに符号化し、データ送信部18に供給する。複合データ符号化部17は、映像データと音声データとを多重化するに際しては、映像と音声とを同期させるための時刻情報も付加する。また、複合データ符号化部17は、前述の符号化制御部13から供給される入力データが映像データのみである場合でも符号化可能なように、音声データを多重化せず、映像データのみを符号化する処理も行える構成になっている。この複合データ符号化部17では、映像データの符号化に用いるコーデックとして、例えばMPEG-2やMPEG-4が用いられる。
データ送信部18は、音声データ符号化部16と複合データ符号化部17とで生成されたストリームデータから通信パケットを生成し、通信部23からネットワーク3を介して受信装置2に送信する。データ送信部18は、通信パケットを生成するに当たり、音声データ符号化部16及び複合データ符号化部17それぞれからストリームデータを受け取った場合には、音声ストリームデータ,映像ストリームデータ,映像データと音声データとが多重化された[映像+音声]ストリームデータそれぞれに対応した別々の通信パケットを生成する。また、データ送信部18は、音声ストリームデータと映像ストリームデータとの両方が入力されている場合には、音声ストリームデータを優先的に送信する構成になっている。
図4は、本実施の形態の送信装置によって通信されるストリーム通信データのデータ構造を示す図である。
ストリーム通信データ120は、符号化された映像,音声,又は多重化された[映像+音声]の中の何れかよりなる符号化されたストリームデータ124に、シーケンス番号121、送信時のタイムスタンプ122、データ識別子123を付加した構成になっている。
シーケンス番号121は、符号化された音声ストリームデータ,映像ストリームデータ,又は[映像+音声]ストリームデータ124の送信するパケットの順番を表したものである。このシーケンス番号121を基にして、受信装置2では、受信したパケットの並び替えや、パケット喪失の検出を行うことができる。
タイムスタンプ122は、パケットを送信したときの時刻情報であり、受信装置2でジッタ(jitter)値を得るために用いられる。
データ識別子123は、符号化されたストリームデータ124の種別、すなわち符号化されたストリームデータ124が、音声ストリームデータ,映像ストリームデータ,又は[映像+音声]ストリームデータの中の何れであるかを識別するために用いられる。通信には、例えば音声や動画等のデータストリームをリアルタイムに配送するためのデータ転送プロトコルであるRTP(Realtime Transport Protocol)が用いられる。
図2に戻り、ユーザ入力処理部19は、送信装置1へのユーザの指示を受け付け、設定保持部20に保持されている設定情報を更新するための入力部である。ユーザ入力処理部19には、図示せぬキーボード,マウス,リモコン操作器等といった入力操作部が有線又は無線接続されている。
設定保持部20は、入力選択部12及び符号化制御部13それぞれの動作を決定する設定情報を保持する。設定保持部20には、動作モード,入力設定,符号化設定の3種類の設定情報が保持される。
動作モードは、送信装置1の現在の各部に対しての動作モードについて、入力操作部のユーザによる操作に応じて「テレビ電話モード」か「コンテンツ送信モード」かの何れかに設定される。設定保持部20の動作モード保持部20aには、この送信装置1各部に対しての現在の動作モード情報が保持されている。
入力設定は、入力操作部のユーザ操作に応じて「入力1」か「入力2」に設定され、「入力1」の場合は第1音声入力部11-1B及び第1映像入力部11-1Aからなる第1入力部11-1が入力選択部12の入力として選択され、「入力2」の場合は第2音声入力部11-2Bと第2映像入力部11-2Aからなる第2入力部11-2が入力選択部12の入力として選択される。設定保持部20の入力設定保持部20bには、この入力選択部12に対する入力設定情報が保持されている。
符号化設定は、入力操作部のユーザ操作に応じて「同期なし」か「同期あり」かの何れかに設定され、「同期なし」の場合は符号化制御部13に音声データと映像データとを別々に符号化するように制御させ、「同期あり」の場合は符号化制御部13に音声データと映像データとを多重化して符号化させるように制御させる。設定保持部20の符号化設定保持部20cには、この符号化制御部13に対する符号化設定情報が保持されている。
ネットワーク情報受信部22は、受信装置2から送信されてくるネットワーク情報を、通信部23を介して受信し、ネットワーク情報解析部21に供給する。
図5は、本実施の形態の送信装置によって通信されるネットワーク情報のデータ構造を示す図である。
ネットワーク情報130は、ジッタ情報131とパケット喪失数情報132とを有する構成になっている。ジッタ情報131は、受信装置2が受信した送信装置1から送信されたパケットの到着時刻の揺らぎを表している。パケット喪失数情報132は、送信装置1から送信されたが受信装置2まで届かなかったパケットのパケット数を表している。このネットワーク情報130の通信には、例えばRTPでデータを送受信するためのセッションを制御するプロトコルであるRTCP(Realtime Transport Control Protocol)が用いられる。
その上で、図2に示されたネットワーク情報解析部21は、このネットワーク情報受信部22から供給される図5に示されたネットワーク情報130のジッタ情報131及びパケット喪失数情報132のそれぞれデータに基づいて、ネットワーク3の状態を判断する。
そして、ネットワーク情報解析部21は、ネットワーク3の状態に応じて、設定保持部20に保持されている設定情報(符号化設定)を更新する。
通信部23は、ネットワーク3に接続され、受信装置2との間で通信を行う。具体的には、図4に示した映像,音声,又は[映像+音声]の符号化されたストリームデータ124を含むストリーム通信データ120の送信、図3に示した符号化に用いたコーデック等に関しての符号化情報110の送信、及び図5に示した受信装置2からのネットワーク情報130の受信を行う。
図6は、本実施の形態による送信装置を用いた通信システムに適用される受信装置の一実施例のシステム構成図である。
受信装置2は、通信部31、符号化情報受信部32、符号化情報解析部33、データ受信部34、ネットワーク情報送信部35、ネットワーク情報生成部36、音声データ復号化部37、複合データ復号化部38、及び出力部39を備えた構成になっている。
通信部31は、ネットワーク3に接続され、送信装置1との間で通信を行う。具体的には、図4に示した映像,音声又は[映像+音声]の符号化されたストリームデータ124を含むストリーム通信データ120の受信、図3に示した符号化に用いたコーデック等に間する情報(符号化情報)110の受信、及び送信装置1への図5に示したネットワーク情報130の送信を行う。
符号化情報受信部32は、受信信号から送信装置1によって送信された図3に示した符号化情報110を受信し、符号化情報解析部33に供給する。
符号化情報解析部33は、符号化情報受信部32から供給される符号化情報110からメディアタイプ情報111とコーデック情報112とを取得し、当該取得した符号化情報110に対応した映像および音声の復号化に必要な情報、すなわちメディアが映像であるか、音声であるか、映像と音声とが多重化されたシステムであるかといったメディアタイプと、符号化に用いられたコーデック名といった情報をデータ受信部34に供給する。
データ受信部34は、受信信号から送信装置1によって送信された図4に示したストリーム通信データ120を受信する。データ受信部34は、この受信したストリーム通信データ120に含まれる映像,音声又は[映像+音声]の符号化されたストリームデータ124について、符号化情報解析部33から供給される上述の情報や当該受信したストリーム通信データ120に含まれているデータ識別子123に基づいて、音声データ復号化部37又は複合データ復号化部38の何れを使用して復号化するかを判断する。そして、データ受信部34は、適切な復号化部37,38へ符号化されたストリームデータ124を供給する。
ネットワーク情報生成部36は、データ受信部34で受信したストリーム通信データ120中の情報を基に、ネットワーク3の通信状況に関する情報を生成する。
図4に示したように、データ受信部34で受信したストリーム通信データ120のヘッダ情報121〜123には、シーケンス番号121と送信時タイムスタンプ122の情報が含まれているため、ネットワーク情報生成部36は、これら情報を基にして、ジッタやパケット喪失数を得ることができる。
ネットワーク情報送信部35は、ネットワーク情報生成部36で得られたジッタやパケット喪失数から図5に示したネットワーク情報130の通信パケットを生成して通信部31に供給する。これにより、通信部31は、このネットワーク情報130を送信装置1にネットワーク3を介して送信する。
音声データ復号化部37は、データ受信部34から供給される音声ストリームデータからなるストリームデータ124を音声データに復号化し、音声出力部39Bに出力する。
複合データ復号化部38は、データ受信部34から供給されるストリームデータ124が映像又は[映像+音声]何れのストリームデータであるかを判別して、映像データのみを含むストリームデータ124であれば復号化した映像データを映像出力部39Aに出力し、映像データと音声データとが多重化された[映像+音声]のストリームデータ124であれば、復号化した映像データを映像出力部39Aに出力すると共に、復号化した音声データをこの復号化した映像データと同期させて音声出力部39Bに出力する。
出力部39は、本実施例の場合は一対の映像出力部39Aと音声出力部39Bとを備えて構成されている。
映像出力部39Aは、受信した映像データを例えばテレビ,ディスプレイ等に表示出力するためのもので、図1に示した映像出力端8Aに対応する。また、音声出力部39Bは、受信した音声データを例えばスピーカ等に音声出力するためのもので、図1に示した音声出力端8Bに対応する。
次に、送信装置1におけるユーザ入力に応じた設定保持部20の設定変更について説明する。
図7は、本実施の形態の送信装置におけるユーザ入力による設定変更のフローチャートである。
送信装置1は、ユーザ入力処理部19がユーザ入力を受信すると(ST101)、ユーザ入力処理部19はそのユーザ入力の指示内容を判定する(ST102)。
ユーザ入力としては、テレビ電話を行うための「テレビ電話モード」と、手元にあるコンテンツを受信装置に送信するための「コンテンツ送信モード」との中のいずれか一方の動作モードを、入力操作部によって排他的に選択する構成になっている。
ユーザ入力処理部19は、「テレビ電話モード」を指示された場合は、設定保持部20の入力設定保持部20bに保持されている現在の入力設定を「入力1」(第1入力部11-1側)に更新設定し(ST103)、符号化設定保持部20cに保持されている現在の符号化設定を「同期なし」に更新設定し(ST104)、動作モード保持部20aに保持されている現在の動作モードを「テレビ電話モード」に更新設定する(ST105)。
これに対し、ユーザ入力処理部19は、「コンテンツ送信モード」を指示された場合は、設定保持部20の入力設定保持部20bに保持されている現在の入力設定を「入力2」(第2入力部11-2側)に更新設定し(ST106)、符号化設定保持部20cに保持されている現在の符号化設定を「同期あり」に更新設定し(ST107)、動作モード保持部20aに保持されている現在の動作モードを「コンテンツ送信モード」に更新設定する(ST108)。
次に、送信装置1における受信装置2から受信したネットワーク情報130に応じた設定保持部20の設定変更について説明する。
図8は、本形態の送信装置における受信装置からのネットワーク情報による設定変更のフローチャートである。
送信装置1のネットワーク情報受信部22が受信装置2から図5に示したネットワーク情報130を受信すると(ST201)、このネットワーク情報130が供給されたネットワーク情報解析部21は、現在の動作モードを設定保持部20の動作モード保持部20aから取得し(ST202)、現在の動作モードが「テレビ電話モード」であるか「コンテンツ送信モード」であるかを判定する(ST203)。
ネットワーク情報解析部21は、この設定保持部20の動作モード保持部20aに設定されている現在の動作モードが「テレビ電話モード」である場合は、今回の受信装置2から送信されたネットワーク情報130の受信に対しては何もせずに、再度ネットワーク情報受信部22が受信装置2からのネットワーク情報130を受信するのを待つ。
これに対して、ネットワーク情報解析部21は、設定保持部20の動作モード保持部20aに設定されている現在の動作モードが「コンテンツ送信モード」である場合は、ネットワーク情報解析部21はネットワーク情報130に基づいてネットワーク3における遅延の値を判定する(ST204)。
この遅延の値の判定は、ネットワーク情報130に含まれるジッタ情報131のジッタ値を用いて推測することより行われる。すなわち、ネットワーク情報解析部21は、ジッタ値が“0”に近ければ平均的な時間がかかったということであるから遅延は小さいと判断し、このジッタ値が大きな値である場合には平均よりも時間がかかったということであるから遅延が大きいと判断する構成になっている。
このジッタ情報131のジッタ値に基づく遅延の程度判定によって、ネットワーク情報解析部21は、ネットワーク3における遅延が小さいと判断した場合は、設定保持部20の符号化設定保持部20cに保持されている現在の符号化設定を「同期あり」に更新設定する(ST205)。これに対し、ネットワーク情報解析部21は、ネットワーク3における遅延が大きいと判断した場合は、できるだけ音声の遅延を減らすために、設定保持部20の符号化設定保持部20cに保持されている現在の符号化設定を「同期なし」に更新設定する(ST206)。
したがって、図7に示したユーザ入力による設定変更によって、「コンテンツ送信モード」を指示され、設定保持部20の入力設定保持部20bに「入力2」(第2入力部11-2側)が、符号化設定保持部20cに「同期あり」が、動作モード保持部20aに「コンテンツ送信モード」が設定されている状態であっても(ST106〜ST108)、受信装置2側でネットワーク3における遅延が大きくなると、送信装置1側では、ネットワーク情報解析部21によって、設定保持部20の符号化設定保持部20cは「同期あり」から「同期なし」にユーザ入力によらず自動的に設定変更される(ST204,ST206)。また、その後、受信装置2側でネットワーク3における遅延が小さくなり解消した場合は、ネットワーク情報解析部21によって、再び設定保持部20の符号化設定保持部20cは「同期なし」から「同期あり」にユーザ入力によらず自動的に設定変更される(ST204,ST205)。
次に、送信装置1における受信装置2へのストリームデータの送信について説明する。
図9は、本実施の形態の送信装置によるストリームデータの送信フローチャートである。
まず、送信装置1においては、入力選択部12が、設定保持部20からその入力設定保持部20bに保持されている入力設定を取得する(ST301)。そして、入力選択部12は、この取得した入力設定の設定内容と、入力選択部12自身が保持している現在の入力設定の設定内容と比較し(ST302)、両者の設定内容が異なり、映像データ及び音声データの供給元としての第1入力部11-1と第2入力部11-2とを切り替える必要があれば、入力選択部12は自身が保持している現在の入力設定の設定内容を、設定保持部20の入力設定保持部20bから取得した入力設定の設定内容に変更して、第1入力部11-1と第2入力部11-2との間で現在の音声入力と映像入力との供給元を切り替える(ST303)。
続いて、符号化制御部13が、設定保持部20からその符号化設定保持部20cに保持されている符号化設定を取得する(ST304)。そして、符号化制御部13は、この取得した符号化設定の内容と、符号化制御部13自身が保持している現在の符号化設定の設定内容と比較し(ST305)、両者の設定内容が異なり、送信時における映像データと音声データとの同期の有無を切り替える必要があれば、符号化制御部13自身が保持している現在の符号化設定の設定内容を、設定保持部20の符号化設定保持部20cから取得した符号化設定の設定内容に変更して、符号化制御部13自身が今まで行っていた符号化処理を、新たに取得した符号化設定の設定内容に対応する符号化処理に変更する(ST306)。そして、符号化制御部13は、符号化処理を変更した場合は、符号化処理を切り替わったことを受信装置2に通知するため、符号化処理の変更と、自身の変更した符号化設定の設定内容を符号化情報生成部14に供給する。符号化情報生成部14は、符号化制御部13から符号化処理の変更及び自身の変更した符号化設定の設定内容が供給されると、これに基づき符号化情報110を生成し、符号化情報送信部15に供給する。これにより、符号化情報送信部15はこの生成された符号化情報110の通信パケットを生成して、後述の通信部23からネットワーク3を介して受信装置2に送信する(ST307)。
続いて、符号化制御部13は、現在の符号化設定に基づいて、以下の処理のどちらを行うかを選択する(ST308)。
符号化設定が「同期なし」の場合、符号化制御部13は、入力選択部12から供給される音声データを音声データ符号化部16に供給し、入力選択部12から供給される映像データのみを複合データ符号化部17に供給する。
これにより、入力選択部12から供給される音声データは音声データ符号化部16で符号化され(ST309)、同じく入力選択部12から供給される映像データは複合データ符号化部17で符号化される(ST310)。この場合、複合データ符号化部17では映像データと音声データとの多重化は行わない。
生成された音声のストリームデータ及び映像のストリームデータはそれぞれデータ送信部18に供給され、データ送信部18は音声ストリームデータ,映像ストリームデータそれぞれに対応した別々のストリーム通信データ120の通信パケットを生成して、通信部23を介して受信装置2に送信する(ST311)。
この際、通信部23は、音声ストリームデータの通信パケットを映像ストリームデータの通信パケットに対して優先して送信することで、できるだけ音声の遅延が少なくなるようにする。
一方、符号化設定が「同期あり」の場合、符号化制御部13は、入力選択部12から供給される音声データ及び映像データを複合データ符号化部17に供給する。
これにより、音声データは複合データ符号化部17で符号化され(ST312)、映像データも複合データ符号化部17で符号化され(ST313)、複合データ符号化部17は共に符号化された映像データ及び音声データを多重化して一連の[映像+音声]のストリームデータを生成し(ST314)、データ送信部18に供給する。そして、データ送信部18は、[映像+音声]のストリームデータに対応したストリーム通信データ120の通信パケットを生成して、通信部23を介して受信装置2に送信する(ST315)。
次に、受信装置2における送信装置1から上述のように送信された音声,映像,又は[映像+音声]のストリームデータの受信について説明する。
受信装置2は、通信部31が送信装置1からの送信信号を受信すると、通信部31はその受信信号を符号化情報受信部32及びデータ受信部34に供給する。
図10は、本実施の形態の送信装置からの符号化情報を受信する受信装置の受信フローチャートである。
符号化受信部32は、通信部31から供給される受信信号から符号化情報110の通信パケットを受信し、受信した符号化情報110を符号化情報解析部33に供給する(SR101)。符号化情報解析部33は、符号化受信部32から供給される図3に示した符号化情報110を基に、送信装置1から受信装置2に送信されるストリーム通信データ120の符号化されたデータ124が音声ストリームデータと映像ストリームデータとで符号化を分けられたシステムによるものか、又は映像と音声とが多重化されて符号化されたシステムによるものであるかを、そのメディアのタイプ111により解析し、符号化されたデータ124についてのコーデックに関する情報をコーデック情報112により解析する。そして、符号化情報解析部33は、その解析結果をデータ受信部34に供給可能なように更新設定する(SR102)。
図11は、本実施の形態の送信装置を適用した通信システムにおける受信装置のストリームデータの受信フローチャートである。
まず、受信装置2の通信部31は、送信装置1から送信される通信パケットを受信し、データ受信部34にストリーム通信データ120を供給する(SR201)。
データ受信部34は、受信したこれらストリーム通信データ120をネットワーク情報生成部36に供給するとともに、音声データ復号化部37,複合データ復号化部38にこれらストリーム通信データ120の符号化されたデータ124を供給制御する。
このデータ受信部34からストリーム通信データ120が供給されるネットワーク情報生成部36では、これら受信したストリーム通信データのパケット120に付加されているシーケンス番号121及び送信時タイムスタンプ122を基に、ジッタやパケット損失率等のネットワークの情報を取得する(SR202)。そして、ネットワーク情報生成部36は、取得したジッタやパケット損失率等のネットワークの情報を、ネットワーク情報送信部35に供給する。
ネットワーク情報送信部35は、図5に示したネットワーク情報130を生成して、通信部31を介して送信装置1に送信する。その頻度はデータ受信部34がストリーム通信データ120のパケットを受信する頻度に比べて少なくてよいので、内部に備えられたタイマによって、ネットワーク情報の送信装置1への前回送信から一定時間経過したか否か判定し(SR203)、一定時間経過している場合は、ネットワーク情報生成部36で得られたジッタやパケット喪失数からネットワーク情報130の通信パケットを生成し、通信部31を介して送信装置1に送信する(SR204)。そして、ネットワーク情報送信部35は、再び前述した一定時間の経過を判定する。
これに対して、ネットワーク情報130の送信装置1への前回送信から一定時間経過していない場合には、ネットワーク情報130を送信装置1へ送信しない構成になっている。これにより、送信装置1には、受信装置2から一定期間毎にネットワーク情報130が送信されるようになっている。
また、データ受信部34では、上述したネットワーク情報生成部36及びネットワーク情報送信部35による送信装置1へのネットワーク情報130の生成処理及び送信処理と並行して、データ受信部34から供給されるストリーム通信データ120の復号化制御処理を行う。
データ受信部34は、送信装置1からのストリーム通信データ120が通信部31から供給されると、上述の符号化情報解析部33に設定保持されているコーデックに関する情報を読み込み(SR205)、このコーデックに関する情報(すなわち、メディアのタイプ及び符号化に用いたコーデック)に基づいて、ストリーム通信データ120が映像データ及び音声データをそれぞれ別々に送信するシステムによるものか、映像及び音声データを多重化して送信するシステムによるものか、受信したストリーム通信データ120の符号化されたデータ124に関してのシステムに応じた復号化処理の仕方を選択する(SR206)。
データ受信部34は、ストリーム通信データ120が映像データ及び音声データをそれぞれ別々に送信するシステムによるものであると選択されている場合は、通信部31から供給されたストリーム通信データ120に関して、そのデータ識別子123に応じて、音声データ復号化部37又は復号データ復号化部38に供給制御する。
これにより、ストリーム通信データ120がそのデータ識別子123により音声のストリームデータである場合には、ストリーム通信データ120は音声データ復号化部37に供給されてその符号化されたデータ124が復号化される(SR207)。そして、音声データ復号化部37から音声データが音声出力部39Bに出力される(SR208)。
また、ストリーム通信データ120がそのデータ識別子123により映像のストリームデータである場合には、ストリーム通信データ120は複合データ復号化部38に供給されてその符号化されたデータ124が復号化される(SR209)。そして、複合データ復号化部38から映像データが映像出力部39Aに出力される(SR210)。
一方、データ受信部34は、そのデータ識別子123によりストリーム通信データが映像及び音声データを多重化して送信するシステムによるものである場合は、通信部31から供給されたストリーム通信データ120の符号化されたデータ124に関して、復号データ復号化部38に供給制御する。
これにより、復号データ復号化部38は、ストリーム通信データ120がそのデータ識別子123により映像及び音声データを多重化されたストリームデータである場合には、ストリーム通信データ120を、符号化された音声のストリームデータと符号化された映像のストリームデータとに分離した上(SR211)、分離した符号化された音声のストリームデータ及び符号化された映像のストリームデータそれぞれを復号化し(SR212,SR213)、得られた音声データと映像データとをそれぞれ音声出力部39Bと映像出力部39Aとに同期して出力する(SR214)。
続いて、本実施の形態の送信装置1を適用した通信システム100のより具体的なシーンを想定し、本実施の形態の送信装置1の作用について説明を行う。
まず、ユーザがテレビ電話をかける場合を想定し、送信装置1のユーザ入力処理部19に無線接続されるリモコンのテレビ電話ボタンを操作した場合について説明する。
この場合、「テレビ電話モード」というユーザ入力を受信し、送信装置1のユーザ入力処理部22は、図7に示したフローにしたがって、まず、設定保持部20の入力設定保持部20bにおける入力設定内容を、第1入力部11-1の第1映像入力部11-1A及び第1音声入力部11-1Bを入力とする「入力1」に設定する(ST103)。次に、ユーザ入力処理部22は、設定保持部20の符号化設定保持部20cに保持されている現在の符号化設定を「同期なし」に更新設定し(ST104)、動作モード保持部20aを「テレビ電話モード」に更新設定する(ST105)。
その上で、送信装置1は、図9で示した送信フローにしたがって送信処理を行う。
まず、入力選択部12は、上述のようにして設定保持部20に設定保持された入力設定を取得し(ST301)、第1入力部11-1の第1映像入力部11-1A及び第1音声入力部11-1Bを入力として選択する(ST302,ST303)。この場合は、第1入力部11-1の第1映像入力部11-1Aにはカメラ5が接続されており、第1音声入力部11-1Bにはマイク6が接続されていることにより、送信装置1はテレビ電話が可能な状態となる。
一方、符号化制御部13は、上述のようにして設定保持部20に設定保持された符号化設定を読み込み(ST304)、音声データは音声データ符号化部16で符号化し、映像データは複合データ符号化部17で符号化する処理を選択する(ST305,ST306)。このとき、符号化情報生成部14は、符号化制御部13の制御が切り替えられた場合には、その切り替えを受信装置2に伝えるため、図12に示すような符号化情報110を生成し、符号化情報送信部15を介して通信部23から送信する(ST307)。
図12は、本実施の形態の送信装置において「テレビ電話モード」がユーザ入力された場合に生成される符号化情報の説明図である。
図12に示した符号化情報110は、図3におけるメディアのタイプ111が音声(audio)の場合は、そのコーデック112としてG.711が用いられ、メディアのタイプ111が映像(video)の場合は、そのコーデック112としてMPEG-4が用いられていることを表している。
したがって、「テレビ電話モード」の送信装置1では、マイク6から入力された通話音声信号は、入力選択部12,符号化制御部13により音声データ符号化部16に供給されて符号化される。また、カメラ4から入力された撮影映像信号は、入力選択部12,複合データ符号化部17により供給されて符号化される。この際、複合データ符号化部17は、音声との多重化は行われず、映像のみのストリームデータが出力される。
このようにして、それぞれ音声データ符号化部16及び複合データ符号化部17で生成された音声のストリームデータ及び映像のストリームデータはデータ送信部18に供給され、データ送信部18は音声ストリームデータ,映像ストリームデータそれぞれに対応した別々の通信パケットを生成して、通信部23を介して受信装置2に送信する。その際、データ送信部18は、音声の遅延をできるだけ少なくするために、音声のストリームデータを映像ストリームデータに対して優先して送信する。
これに対して、受信装置2は、図11で示した受信フローにしたがって受信処理を行う。
受信装置2は、その符号化情報受信部32が送信装置1から送信される符号化情報110をまず受信し(SR205)、受信した符号化情報110を符号化情報解析部33に供給する。符号化情報解析部33は供給される符号化情報110を解析し、この場合はG.711で符号化された音声ストリームデータとMPEG-4で符号化された映像ストリームデータが、送信装置1から送信されることを理解する(SR206)。このG.711及びMPEG-4といった符号化情報解析部33による解析情報はデータ受信部34に供給される。
データ受信部34は、通信部31を介して供給されるストリーム通信データ120のデータ識別子123に基づいて、受信したストリーム通信データ120が音声のストリームデータである場合はそのストリーム通信データ120の符号化されたデータ124を音声データ復号化部37に供給する一方、映像のストリームデータである場合はそのストリーム通信データ120の符号化されたデータ124を複合データ復号化部38に供給する。
これにより、音声データ復号化部37では供給された符号化されたデータ124から音声データが復号化され(SR207)、音声出力部39Bから送信側の通話音声が出力される(SR208)。また、複合データ複合部38では供給された符号化されたデータ124から映像データが復号化され(SR209)、映像出力部39Aから送信側のカメラ撮影映像が出力される(SR210)。
上述したように、「テレビ電話モード」である場合には、送信機1から別々に送信され映像のストリームデータと音声のストリームデータとは、受信装置2の映像出力部39A及び音声出力部39Bからそれぞれ出力される映像と音声は、通信部23が音声ストリームデータの通信パケットを映像ストリームデータの通信パケットに対して優先して送信することによって同期していないが、代わりに送信装置1側に対する音声の遅延は極力少なくなっている。
次に、ユーザがテレビ電話による通話途中に自身の手元にあるビデオの映像を送信する場合を想定し、「テレビ電話モード」になっている送信装置1のユーザ入力処理部19に無線接続されるリモコンのコンテンツ送信ボタンを押した場合について説明する。
この場合、「コンテンツ送信入力」というユーザ入力を受信し、送信装置1のユーザ入力処理部22は、図7に示したフローにしたがって、まず、設定保持部20の入力設定保持部20bにおける入力設定内容を、第1入力部11-2の第1映像入力部11-2A及び第2音声入力部11-2Bを入力とする「入力2」に設定する(ST103)。次に、ユーザ入力処理部22は、設定保持部20の符号化設定保持部20cに保持されている現在の符号化設定を音声と映像とを多重化して符号化する「同期あり」に更新設定し(ST104)、動作モード保持部20aを「コンテンツ送信入力」に更新設定する(ST105)。
送信装置1は、動作モードが「コンテンツ送信モード」に設定が変更されると、図9で示した送信フローにしたがって送信処理を行う。
まず、入力選択部12は、上述のようにして設定保持部20に設定保持された入力設定を取得し(ST301)、入力の切り替えが必要と判断され、第2入力部11-2の第2映像入力部11-2A及び第2音声入力部11-2Bを入力として選択する(ST302,ST303)。この場合は、第2入力部11-2の第2映像入力部11-2Aには映像記憶装置7の映像出力7Aが接続されており、第2音声入力部11-2Bには映像記憶装置7の音声出力7Bが接続されていることにより、送信装置1は映像記憶装置7に記憶されているコンテンツの送信が可能な状態となる。
一方、符号化制御部13は、設定保持部20に設定保持された「同期あり」の符号化設定を読み込み、音声データ及び映像データを複合データ符号化部17へ共に出力する状態になる。
一方、符号化制御部13は、上述のようにして設定保持部20に設定保持された「同期あり」の符号化設定を読み込み(ST304)、音声データ及び映像データを複合データ符号化部17へ共に出力する処理を選択する(ST305,ST306)。このとき、符号化情報生成部14は、符号化制御部13の制御が切り替えられているので、その切り替えを受信装置2に伝えるため、図13に示すような符号化情報110を生成し、符号化情報送信部15を介して通信部23から送信する(ST307)。
図13は、本実施の形態の送信装置において「コンテンツ送信モード」がユーザ入力された場合に生成される符号化情報の説明図である。
図13に示した符号化情報110は、図3におけるメディアのタイプ111が映像データ及び音声データを多重化した[映像+音声](system)の場合は、そのコーデック112としてMPEG-2が用いられていることを表し、すなわち映像及び音声が同じ1本のストリームで送信されることを表わしている。
これにより、映像記憶装置7の映像出力7Aから供給される映像声データ及び音声データは、複合データ符号化部17に共に供給され、それぞれ符号化される(ST312,ST313)。複合データ符号化部17では、さらにそれぞれ符号化された映像声データ及び音声データの多重化処理を行い、1本の[映像+音声]のストリームデータを生成してデータ送信部18に供給する(ST314)。データ送信部18は、この複合データ符号化部17から供給された1本の[映像+音声]のストリームデータに対応した通信パケットを生成して、通信部23を介して受信装置2に送信する(ST315)。
これに対して、受信装置2は、図11で示した受信フローにしたがって送信処理を行う。
受信装置2は、その符号化情報受信部32が送信装置1から送信される符号化情報110をまず受信し(SR205)、受信した符号化情報110を符号化情報解析部33に供給する。符号化情報解析部33は供給される符号化情報110を解析し、この場合は、MPEG-2によって映像及び音声が多重化された1本の[映像+音声]のストリームデータが、送信装置1から送信されることを理解する(SR206)。このMPEG-2といった符号化情報解析部33による解析情報はデータ受信部34に供給される。
データ受信部34は、通信部31を介して供給されるストリーム通信データ120のデータ識別子123に基づいて、受信したストリーム通信データ120の符号化されたデータ124を複合データ復号化部38に供給する。
これにより、複合データ復号化部38では、データ受信部34から供給される[映像+音声]の多重化されたデータ124を、符号化された音声ストリームデータと符号化された映像ストリームデータとに分離し(SR211)、分離された後のそれぞれ符号化された音声ストリームデータ及び映像ストリームデータはそれぞれ映像声データ及び音声データに復号化されてから(SR212,SR213)、同期して音声出力部39Bと映像出力部39Aに出力される(SR214)。
このようにして、コンテンツを送信する際には、送信装置1から音声と映像とを多重化して送信し、受信装置2ではその映像及び音声をそれぞれ映像出力部39A及び音声出力部39Bから同期をとって出力することが実現できる。
図14は、本実施の形態の送信装置を適用した通信システムで、送信装置と受信装置との間で通信されるデータの模式図である。
ユーザによる「テレビ電話モード」のリモコン入力を送信装置1が受信すると、送信装置1は、従前の符号化処理が切り替えられた場合には、符号化情報C11を受信装置2へ送信する(図9記載のST304〜ST307参照)。
この符号化情報C11には、図12に示した符号化情報110のように、音声と映像の2つのストリームデータを送信することが記述されている。
その後、送信装置1から受信装置2へは、図4に示したような、例えば、マイク6から入力された通話音声のストリームデータA11,A12と、カメラ5によって撮影された映像のストリームデータV11,V12,V13とが、順次送信される。
なお、この場合、一般的に音声のストリームデータAに比べ、映像のストリームデータVの方がデータ量が多いので、映像のストリームデータVの方が音声のストリームデータAに比して送信する回数が多くなっている。
また、送信装置1では、受信装置2から例えば所定時間tn間隔で送信される図3に示したようなネットワーク情報N11の受信も行っている(図11記載のSR203〜SR205、及び図8記載のST201〜ST206をそれぞれ参照)。
その後、ユーザによる「コンテンツ送信モード」のリモコン入力を受信すると、送信装置1は、従前の「テレビ電話モード」の符号化処理を「コンテンツ送信モード」の符号化処理に切り替えるために、符号化情報C21を受信装置2へ送信する(図9記載のST304〜ST307参照)。
この符号化情報C21には、図13に示した符号化情報110のように、音声と映像を多重化したシステムのストリームデータSを送信することが記述されている。
その後、送信装置1から受信装置2へは、図4に示したような、例えば、映像記録装置7から供給される音声データと映像データとを多重化したシステムのストリームデータS21,S22,・・・が、順次送信される。
また、送信装置1では、この間も、受信装置2から例えば所定時間tn間隔で送信される図3に示したようなネットワーク情報N21,N22,・・・の受信も行っている(図11記載のSR203〜SR205、及び図8記載のST201〜ST206をそれぞれ参照)。なお、図14においては、ネットワーク情報N21,N22,・・・は、ネットワーク3における遅延も小さく、図3に示したネットワーク情報130のジッダ情報131とパケット喪失数情報132のそれぞれ値は、予め定められた所定値よりも小さくなっているものとする。
以上、図14に示した送信装置と受信装置との間で通信されるデータの模式図では、通信途中にネットワークの状況が悪化していない平常の場合を示したが、通信中にネットワークの状況が悪化した場合について、図15により説明する。
図15は、本実施の形態の送信装置を適用した通信システムで、通信途中にネットワークの状況が悪化した場合の、送信装置と受信装置との間で通信されるデータの模式図である。
先に図11におけるステップSR203〜SR205で説明したように、受信装置2のネットワーク情報生成部36では、受信したストリーム通信データ120のヘッダ情報121〜123を基にジッタやパケット喪失数といったネットワーク3の情報を生成し、ネットワーク情報送信部35及び通信部31を介して、図5に示したネットワーク情報130を定期的に送信装置1に送信している。これにより、送信装置1では、通信中にネットワーク3の状況が悪化した場合、例えばジッタ値の増加として検出することが可能である。
図15は、ユーザによる「コンテンツ送信モード」の入力設定に基づき、それぞれ符号化された映像データと音声データとを多重化した[映像+音声]のストリームデータS31〜S40の送信途中で、ネットワーク3の状況が悪化し、またその悪化したネットワーク3の状況が回復した場合の例を示したものである。
図15に示すように、受信装置2から定期的に送信されるネットワーク情報N31の受信に基づき、そのジッタ情報(図5記載のジッタ情報131)により送信装置1が[映像+音声]ストリームデータS31〜S33の遅延が小さく、ネットワーク3の状況が悪化していないと判断した場合は、送信装置1は、それまで以前S31〜S33と同様に、例えば、映像記録装置7から供給される音声データと映像データとをそれぞれ符号化して多重化し、[映像+音声]のストリームデータS34〜S36を生成して送信する。
ところが、図15の[映像+音声]のストリームデータS36に関する受信装置2による受信タイミングに表わしたような大きな遅延が生じると、これにより受信装置2のネットワーク情報生成部36で生成されるネットワーク3の情報としてのジッタ値は通常に対して増加することになる。
このジッタ値が通常に対して増加した大きな値からなる受信装置2からのネットワーク情報N32を受信すると、送信装置1のネットワーク情報解析部21は、図8に示した設定変更によって、ユーザによって入力設定された設定保持部20における動作モード20aの「コンテンツ送信モード」に対応する符号化設定20cの「同期あり」を、「同期なし」に切り替える必要があるか否かを判断して、これを切り替える。
これにより、送信装置1では、符号化制御部13が、音声データは音声データ符号化部16へ出力し、映像データは複合データ符号化部17へ出力するよう制御開始する。また、符号化情報生成部14は、図12に示すようなG.711の音声ストリームとMPEG4の映像ストリームとを送信することを示す符号化情報110を生成し、送信装置1はこれを図15に示す符号化情報C32として受信装置2に送信する。
したがって、ネットワーク3の状況が悪化した場合は、送信装置1は、映像記録装置7から供給される音声データと映像データとの多重化を行わずに、図9におけるステップST308〜ST311で説明したように、音声データは音声データ符号化部16で符号化し、複合データ符号化部17では、映像データのみを符号化するようになる。
これにより、図15においては、送信装置1は、ネットワーク3の状況が悪化した場合には、符号化情報C32を送信した後、音声のストリームデータA37,A38,A39と、映像のストリームデータV37,V38とが、順次送信する。
また、その際には、送信装置1は、音声の遅延をできるだけ少なくするため、例えば、音声のストリームデータA39を音声のストリームデータA38に対応する映像のストリームデータVに対して優先して送信する。
さらに、その後、例えば、受信装置2から供給されるネットワーク情報N34に基づき、送信装置1のネットワーク情報解析部21が上述の悪化したネットワーク3の状況が回復したと判断した場合は、送信装置1は、符号化設定20cの「同期あり」を「同期なし」に切り替える図13に示したような符号化情報C33を受信装置2へ送信し、それぞれ符号化された映像データと音声データとを多重化した[映像+音声]のストリームデータS40を送信する。
このようにして、本実施の形態の送信装置1によれば、コンテンツを送信中にネットワーク3の状況が悪化した場合でも、音声の遅延をできるだけ少なくするように自動的に処理を切り替えることが可能となり、また、その後、ネットワーク3の状況が回復した場合には、再び映像と音声を同期させて送信する処理に自動的に復帰することが可能になる。
以上のように、本発明の一実施の形態による送信装置1について説明を行ったが、その具体的な構成及び制御手順についてはその例示された構成及び制御手順に限られるものではない。
また、上記実施の形態の送信装置1と当該送信装置1を利用した通信システム100を構成する受信装置2を一体的に備えた送受信装置を構成することも可能である。
さらに、この送受信装置の場合は、送信装置部側のネットワーク情報受信部22、及び受信装置部側のネットワーク情報送信部35を廃して、送受信装置間で図5に示したネットワーク情報130の送受信を省略することも可能である。
図16は、上述の送受信装置間で図5に示したネットワーク情報130の送受信を省略した、本発明の一実施の形態による送受信装置の構成を示した構成ブロック図である。
なお、本実施の形態の送受信装置40の説明にあたって、前述の図2に示した送信装置1の構成、及び図6に示した受信装置2の構成と同一又は同様の構成について、同一符号を付し、その詳細な説明は省略する。
本実施の形態の送受信装置40は、送受信共通の通信部41を有し、受信装置部側のネットワーク情報生成部36のネットワーク情報出力は、送信装置部側のネットワーク情報解析部21に供給され、受信装置部側の符号化情報解析部33の解析出力は、データ受信部34に供給されているとともに、設定保持部20にも供給され、設定保持部20の符号化設定20cの記憶内容を変更可能になっている。
本実施の形態の送受信装置40によれば、相手方の送受信装置40’による「コンテンツ送信モード」の入力設定に基づく、相手方の送受信装置40’から送信された[映像+音声]のストリームデータSの受信中、受信した[映像+音声]のストリームデータ120のヘッダ情報121〜123に基づき、ネットワーク情報生成部36が前述の図5で説明した如くのジッダ情報131及びパケット喪失数132を生成し、ネットワーク情報解析部21がこれらに基づきネットワーク3の状況が悪化していると判断した場合は、設定保持部20の符号化設定20cの記憶内容を「同期あり」から「同期なし」に切り替える。そして、符号化制御部13が送信データの入力に関係なく定期的に設定保持部20の記録内容を読み出す構成になっているため、この符号化制御部13の符号化設定20cの切り替えの検出に基づいて、符号化情報生成部14により、前述の図3に示したような符号化情報110が生成され、符号化情報送信部15及び通信部41を介して相手方のコンテンツ送信側の送受信装置40’に対して、符号化情報110が送信される。
これにより、この符号化情報110を受信した相手方のコンテンツ送信側の送受信装置40’では、その符号化情報受信部32及び符号化解析部33によって、データ受信部34,符号化保持部20,及び符号化制御部13における符号化設定20cの内容が「同期あり」から「同期なし」に切り替わる。
したがって、本実施の形態の送受信装置40によれば、コンテンツ受信側で、コンテンツ送信側の送受信装置40’における符号化設定20cの内容を切り替えることができる。
以上、本発明の送信装置、受信装置、及び通信システムの実施の形態について説明したが、その具体的構成及び制御手順は、上述した実施の形態に示した具体的構成及び制御手順に限られるものではなく、種々の変形例が可能である。