JP2010136220A - 通信端末装置、通信量制御方法および集積回路 - Google Patents

通信端末装置、通信量制御方法および集積回路 Download PDF

Info

Publication number
JP2010136220A
JP2010136220A JP2008311584A JP2008311584A JP2010136220A JP 2010136220 A JP2010136220 A JP 2010136220A JP 2008311584 A JP2008311584 A JP 2008311584A JP 2008311584 A JP2008311584 A JP 2008311584A JP 2010136220 A JP2010136220 A JP 2010136220A
Authority
JP
Japan
Prior art keywords
unit
packet
bit rate
packets
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008311584A
Other languages
English (en)
Inventor
Kazunobu Konishi
一暢 小西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp filed Critical Panasonic Corp
Priority to JP2008311584A priority Critical patent/JP2010136220A/ja
Publication of JP2010136220A publication Critical patent/JP2010136220A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【課題】動画像の符号化により得られるデータのビットレートを所定のビットレート以下に保ちつつ動画像の劣化の度合いを小さくする。
【解決手段】符号化部411は動画像を構成する複数のフレームの各々から符号化データを生成する。分割部411Nは符号化データを分割し、複数のパケットを生成する。通信量監視部412は単位時間で生成された複数のパケットに基づいてビットレートを算出する。算出ビットレートが所定のビットレートより大きい場合、パケット制御部413は算出ビットレートの算出に使用された複数のパケットの一部を削除する。符号化部411が削除されたパケットに対応する符号化データの次の符号化データを生成する場合、次の符号化データから得られるフレームにおいて削除されたパケットに対応するスライスの位置と同じ位置のスライスをイントラスライスとするようにスライス指示部414は符号化部411を制御する。
【選択図】図4

Description

本発明は、通信端末装置、通信量制御方法および集積回路に関し、特に、動画像を符号化する処理を行う通信端末装置、通信量制御方法および集積回路に関する。
広帯域のインターネット環境の普及に伴って、複数の通信端末装置において、高品質な映像および音声のデータを双方向に送受信するAV(Audio Visual)コミュニケーションサービスが広まってきている。以下においては、映像および音声のデータを、AVデータという。
ここで、通信端末装置Aが、AVデータを、通信端末装置Bへ送信するとする。すなわち、通信端末装置Aは、データを送信する送信端末であるとする。また、通信端末装置Bは、データを受信する受信端末であるとする。また、通信端末装置Aに映像および音声が入力されてから、当該映像および音声に基づくAVデータを通信端末装置Bが通信端末装置Aから受信し、通信端末装置Bが受信したAVデータに基づく映像および音声を出力するまでに要する時間を遅延時間とする。
この場合、通信端末装置Aおよび通信端末装置Bにおいて、円滑なコミュニケーションを実現するためには、通信端末装置Aと通信端末装置Bとの間で行われる通信における遅延時間を短くしなければならない。もし、遅延時間が長ければ会話が重なったり、通信相手となる通信端末装置からの反応が遅れたりして、スムーズな会話を行うことができない。
また、インターネットは帯域やパケット損失、遅延が保証されないベストエフォート型のネットワークであった。しかしながら、近年、NGN(Next Generation Network)と呼ばれる帯域、遅延を保証したネットワークの普及が始まっている。
NGNは、通信に使用する最大帯域(以下、最大通信帯域という)を通信開始前に予約(設定)することにより、最大通信帯域が保証されたネットワークである。最大通信帯域の設定はSIP(Session Initiation Protocol)などの通話制御プロトコルを用いて行われる。以下においては、設定された最大通信帯域を、設定通信帯域または設定レートという。
NGNにおいて、設定通信帯域が設定されると、他の通信の影響を受けず、かつ、設定通信帯域以下のビットレートで通信する場合、パケット損失が発生しない通信を実現できる。また、インターネットのような公衆網を利用するのではなく、他の通信が存在しない専用回線を利用することでも、NGNと同様の効果を得ることができる。
ネットワークを介したAVコミュニケーションを実現するためには、例えば、送信端末としての通信端末装置Aが、リアルタイムに取得した映像をエンコード処理によって圧縮し、圧縮により得られたデータを分割することにより複数のパケットを生成し、当該複数のパケットをネットワークを介して、受信端末としての通信端末装置Bへ送信する。
通信端末装置Bは受信した複数のパケットを結合したデータに対しデコード処理を行いプラズマディスプレイのような表示デバイスに表示させる。エンコード処理に用いる符号化方式には、例えば、H.264がある。H.264は複数のフレーム間の動き情報といった依存関係を元にして圧縮効率を高める符号化方式である。H.264ではフレームをスライスという単位で細かく分割し、スライス単位で圧縮を行う。
このスライスにはI(Intra)スライスとP(Predictive)スライスの2種類が存在する。Iスライスとは他のスライスと依存関係がなく、そのスライス単体で含まれた映像を復元することができる。それに対し、Pスライスは、対応するフレームより前のフレームのスライスからの差分情報のみを保持しており、Pスライス単体では映像を得ることができない。
そのため、Pスライスの参照元のスライスが損失した場合、当該Pスライスだけを受信したとしてもデコード処理を行うことができず映像の劣化が長引いてしまう。また、H.264と似たような処理を行うMPEG4−AVCなど別の符号化方式を用いてもよい。
H.264によって圧縮した映像をNGNに対してデータを送信する場合、設定レート以下の送信レートでデータを送信すれば損失のない伝送を実現できる。しかしながら、エンコーダはエンコードするビットレートを設定したとしても設定レート通りにエンコードできるとは限らない。
例えば、NGNの設定レートが8Mbpsである場合、エンコーダが動画像を8Mbpsでエンコードしようとしたとする。このとき、エンコードの対象となる動画像が、複雑な動画像、または、連続する複数のフレームにおける相関がほとんどない動画像であるとする。この場合、エンコーダは動画像を8Mbpsでエンコードしようとしても、8Mbpsを上回るレートでエンコード済みのデータを出力する可能性がある。
このとき、エンコーダから出力されたビットレート通りに、データがネットワークに送信された場合、設定通信帯域(設定レート)を超えた分のデータに関しては帯域保証されずパケット損失が発生する。その結果、受信端末としての通信端末装置Bから出力される映像に乱れが生じる。
このとき、送信端末としての通信端末Aがパケット損失を発生させないようにエンコーダから出力されたレートを無視して設定レートと同じレートでデータを送信した場合、通信端末装置A内に送りきれなかったデータが蓄積される。そのため、前述した遅延時間が大きくなり通信端末装置Aおよび通信端末装置Bにおいて、円滑なコミュニケーションが実現できない。
上記課題を解決するために、例えば、特許文献1には、動画像を符号化するエンコーダが設定レートを超えたビットレートの符号化データを出力した場合に、フレームを間引くことで送信レートを設定通信帯域(設定レート)以内に抑える技術(以下、従来技術Aという)が開示されている。なお、特許文献1の技術では、間引いたフレーム以降のフレームが間引いたフレームと依存関係があった場合、完全なデコードができないために映像が劣化するという問題がある。
特許文献2には、複数のフレームからなる動画像を符号化する場合において、フレームを間引くと同時に次以降のフレームを他のフレームと依存関係のないIフレームとすることで映像劣化が長時間続くことを回避する技術(以下、従来技術Bという)が開示されている。
特開2006−345166号公報 特開2005−277982号公報
しかしながら、従来技術Aでは、フレーム単位で間引きを行うため、フレーム間の参照関係が崩れ動画像の画質の劣化の度合いが大きいという問題があった。また、従来技術Bでは、フレームのデータ量が大きいIフレームが頻繁に使用された場合、動画像におけるフレーム毎のデータ量の変化が大きくなる。この場合、エンコーダが動画像を前述した設定レートで符号化するよう設定されていたとしても、符号化後のデータのビットレートが、設定レートを上回ることが多くなるという問題がある。
本発明は、上述の問題点を解決するためになされたものであって、その目的は、動画像の符号化により得られるデータのビットレートを所定のビットレート以下に保ちつつ、動画像の劣化の度合いを小さくすることを可能とする通信端末装置等を提供することである。
上述の課題を解決するために、この発明のある局面に従う通信端末装置は、動画像を構成する複数のフレームを処理する。通信端末装置は、複数のフレームの各々を順次取得する取得部と、取得部によりフレームが取得される毎に、該フレームをスライス単位で符号化する処理であって、連続するフレームの相関を利用した符号化処理を行うことにより、該フレームに対応する符号化データを生成する符号化部と、符号化部により符号化データが生成される毎に、該符号化データを分割することにより複数のパケットを生成する分割部と、分割部により複数のパケットが生成される毎に、該複数のパケットを記憶するパケット蓄積部と、所定の単位時間経過毎に、該所定の単位時間において分割部により生成された複数のパケットに基づいてビットレートを算出し、かつ、算出したビットレートが所定のビットレートより大きいか否かを判定する監視部と、監視部により算出されたビットレートである算出ビットレートが所定のビットレートより大きいと判定された場合、該算出ビットレートを算出するために使用された複数のパケットの一部を選択するパケット制御部とを備える。パケット制御部は、パケット蓄積部に記憶されている複数のパケットのうち、選択したパケットを削除する。符号化部により生成される符号化データは、複数のスライスから構成される。通信端末装置は、さらに、パケット制御部により削除されたパケットに対応する符号化データの次の符号化データを符号化部が生成する場合、次の符号化データから得られるフレームにおいて、削除されたパケットに対応するスライスの位置と同じ位置のスライスを、他のフレームに依存しないイントラスライスとするように、符号化部を制御する指示部を備える。
すなわち、符号化部は、動画像を構成する複数のフレームの各々を符号化することにより符号化データを生成する。分割部は、フレームに対応する符号化データを分割することにより複数のパケットを生成する。監視部は、所定の単位時間において分割部により生成された複数のパケットに基づいてビットレートを算出する。算出したビットレートである算出ビットレートが所定のビットレートより大きい場合、パケット制御部は、算出ビットレートを算出するために使用された複数のパケットの一部を選択し、選択したパケットを削除する。指示部は、削除されたパケットに対応する符号化データの次の符号化データを符号化部が生成する場合、次の符号化データから得られるフレームにおいて、削除されたパケットに対応するスライスの位置と同じ位置のスライスを、イントラスライスとするように符号化部を制御する。
つまり、算出されたビットレートが所定のビットレートより大きい場合であっても、フレームに対応する全てのパケットが削除されることなく、フレーム内の一部に対応するパケットが削除されるのみである。また、この場合、符号化データの次の符号化データを符号化部が生成する場合、次の符号化データから得られるフレームにおいて、削除されたパケットに対応するスライスの位置と同じ位置のスライスを、イントラスライスとするように符号化部が制御される。
つまり、算出されたビットレートが所定のビットレートより大きい場合であっても、フレームに対応する全てのパケットが削除されることなく、フレーム内の一部に対応するパケットが削除されるのみである。また、この場合、符号化データの次の符号化データを符号化部が生成する場合、次の符号化データから得られるフレームにおいて、削除されたパケットに対応するスライスの位置と同じ位置のスライスを、イントラスライスとするように符号化部が制御される。
したがって、動画像の符号化により得られるデータのビットレートを所定のビットレート以下に保ちつつ、動画像の劣化の度合いを小さくすることができる。
また、パケット制御部が選択する一部のパケットのデータ量は、該算出ビットレートと所定のビットレートとの差分の値の所定の単位時間あたりのデータ量以上であってもよい。
また、通信端末装置は、さらに、パケット蓄積部に記憶されている複数のパケットの各々を、該パケットがパケット蓄積部に記憶された順で、順次、外部のネットワークへ、所定のビットレート以下のビットレートで送信する送信部を備えてもよい。
また、分割部は、符号化データを複数の所定単位データに分割し、複数の所定単位データのうち、データ量が所定値より大きい所定単位データが存在する場合、該所定単位データを、データ量が所定値以下である複数のデータに分割し、複数のデータの各々をパケットに変換してもよい。
また、分割部は、符号化データを複数の所定単位データに分割し、複数の所定単位データのうち、データ量が所定値未満である複数の所定単位データが存在する場合、該データ量が所定値未満である複数の所定単位データを1つのパケットに変換してもよい。
また、所定単位データは、NAL(Network Abstraction Layer)ユニットであってもよい。
これにより、データ量が所定値未満である複数のNALユニットが存在する場合、複数のNALユニットが1つのパケットに変換される。そのため、変換された当該パケットを含む複数のパケットに基づいて算出されるビットレートを低減することができる。その結果、算出されたビットレートが所定のビットレートより大きい場合に削除されるパケットの数を少なくすることができる。つまり、1フレームに対応する、ネットワークへ送信するパケットの数を少なくすることができ、ネットワークの伝送効率を高めるが可能となる。
また、分割部が生成する複数のパケットの各々は、1つのスライスを含んでもよい。
この発明の他の局面に従うと、動画像を構成する複数のフレームを処理し、メモリと、符号化部とを備える通信端末装置が行う通信量制御方法は、複数のフレームの各々を順次取得する取得ステップと、符号化部が、取得ステップによりフレームが取得される毎に、該フレームをスライス単位で符号化する処理であって、連続するフレームの相関を利用した符号化処理を行うことにより、該フレームに対応する符号化データを生成する符号化ステップと、符号化ステップにより符号化データが生成される毎に、該符号化データを分割することにより複数のパケットを生成する分割ステップと、分割ステップにより複数のパケットが生成される毎に、該複数のパケットをメモリに記憶させる記憶ステップと、所定の単位時間経過毎に、該所定の単位時間において分割ステップにより生成された複数のパケットに基づいてビットレートを算出し、かつ、算出したビットレートが所定のビットレートより大きいか否かを判定する監視ステップと、監視ステップにより算出されたビットレートである算出ビットレートが所定のビットレートより大きいと判定された場合、該算出ビットレートを算出するために使用された複数のパケットの一部を選択するパケット制御ステップとを備える。符号化ステップにより生成される符号化データは、複数のスライスから構成される。通信量制御方法は、さらに、メモリに記憶されている複数のパケットのうち、パケット制御ステップにより選択されたパケットを削除する削除ステップと、パケット制御ステップにより削除されたパケットに対応する符号化データの次の符号化データを符号化部が生成する場合、次の符号化データから得られるフレームにおいて、削除されたパケットに対応するスライスの位置と同じ位置のスライスを、他のフレームに依存しないイントラスライスとするように、符号化部を制御する指示ステップとを備える。
つまり、算出されたビットレートが所定のビットレートより大きい場合であっても、フレームに対応する全てのパケットが削除されることなく、フレーム内の一部に対応するパケットが削除されるのみである。また、この場合、符号化データの次の符号化データを符号化部が生成する場合、次の符号化データから得られるフレームにおいて、削除されたパケットに対応するスライスの位置と同じ位置のスライスを、イントラスライスとするように符号化部が制御される。
これにより、動画像の符号化により得られるデータのビットレートを所定のビットレート以下に保ちつつ、動画像の劣化の度合いを小さくすることができる。
この発明のさらに他の局面に従うと、動画像を構成する複数のフレームを処理する集積回路は、複数のフレームの各々を順次取得する取得部と、取得部によりフレームが取得される毎に、該フレームをスライス単位で符号化する処理であって、連続するフレームの相関を利用した符号化処理を行うことにより、該フレームに対応する符号化データを生成する符号化部と、符号化部により符号化データが生成される毎に、該符号化データを分割することにより複数のパケットを生成する分割部と、分割部により複数のパケットが生成される毎に、該複数のパケットを記憶するパケット蓄積部と、所定の単位時間経過毎に、該所定の単位時間において分割部により生成された複数のパケットに基づいてビットレートを算出し、かつ、算出したビットレートが所定のビットレートより大きいか否かを判定する監視部と、監視部により算出されたビットレートである算出ビットレートが所定のビットレートより大きいと判定された場合、該算出ビットレートを算出するために使用された複数のパケットの一部を選択するパケット制御部とを備える。パケット制御部は、パケット蓄積部に記憶されている複数のパケットのうち、選択したパケットを削除する。符号化部により生成される符号化データは、複数のスライスから構成される。集積回路は、さらに、パケット制御部により削除されたパケットに対応する符号化データの次の符号化データを符号化部が生成する場合、次の符号化データから得られるフレームにおいて、削除されたパケットに対応するスライスの位置と同じ位置のスライスを、他のフレームに依存しないイントラスライスとするように、符号化部を制御する指示部を備える。
つまり、算出されたビットレートが所定のビットレートより大きい場合であっても、フレームに対応する全てのパケットが削除されることなく、フレーム内の一部に対応するパケットが削除されるのみである。また、この場合、符号化データの次の符号化データを符号化部が生成する場合、次の符号化データから得られるフレームにおいて、削除されたパケットに対応するスライスの位置と同じ位置のスライスを、イントラスライスとするように符号化部が制御される。
これにより、動画像の符号化により得られるデータのビットレートを所定のビットレート以下に保ちつつ、動画像の劣化の度合いを小さくすることができる。
本発明により、動画像の符号化により得られるデータのビットレートを所定のビットレート以下に保ちつつ、動画像の劣化の度合いを小さくすることができる。
以下、図面を参照しつつ、本発明の実施の形態について説明する。以下の説明では、同一の部品には同一の符号を付してある。それらの名称および機能も同じである。したがって、それらについての詳細な説明は繰り返さない。
<第1の実施の形態>
(システムの構成)
図1は、本実施の形態に係る2拠点でのコミュニケーションサービスを実現するコミュニケーションシステム1000の構成を示す図である。
図1において、第1の拠点に配置されるコミュニケーション装置11と、第2の拠点に配置されるコミュニケーション装置12とは、通信機能を有する映像音声制御装置であり、ネットワーク10を介して相互接続が可能である。
コミュニケーション装置11は、第1の拠点におけるリアルタイムな映像音声データを、カメラおよびマイクから取得し、取得した映像音声データを、ネットワーク10を介してコミュニケーション装置12に送信する。また、コミュニケーション装置11は、第2の拠点におけるリアルタイムな映像音声データを、コミュニケーション装置12から受信し、受信した映像音声データを、自装置のディスプレイおよびスピーカに出力する。
また、ネットワーク10を介しているにもかかわらず、距離による影響を低減した、よりリアルなコミュニケーションサービスを提供するために、コミュニケーション装置11,12は、複数個のディスプレイ、カメラ、マイク、およびスピーカを備える。これらの入出力装置は、予め適した位置に配置されており、この配置に特徴を有している。これについては、図を用いて後で詳細に説明する。
ネットワーク10は、前述したNGNである。NGNは、通信に使用する最大通信帯域が保証されたネットワークである。なお、ネットワーク10は、NGNに限定されることなく、その他のネットワークであってもよい。
また、コミュニケーション装置11とコミュニケーション装置12との間の通信には、例えば、RTP(Real-time Transport Protocol)を用いたデジタル通信が用いられる。
また、コミュニケーション装置11,12は、ネットワーク上の位置を示すアドレス情報としてIP(Internet Protocol)アドレスが割り当てられているものとする。なお、IPアドレスでなく、電話番号など他の情報をアドレス情報として用いてもよい。
また、コミュニケーション装置11,12が送受信するデータは、リアルタイムな映像音声データとしたが、光ディスクまたはハードディスクなどの記憶媒体に記録されている映像音声データも、リアルタイムな映像音声データと共に送受信することができる。また、コミュニケーション装置11,12が送受信するデータは、静止画データ、テキスト、またはHTMLなどの文書データでもよい。
以上により、コミュニケーション装置11とコミュニケーション装置12とは、予め適した位置に配置された複数個の入出力装置を用いて、他拠点のリアルタイムな映像および音声を出力することが可能となり、よりリアルなコミュニケーションサービスを提供することができる。
また、図1に示した2拠点でのコミュニケーションサービスだけでなく、3拠点以上での相互接続によるコミュニケーションサービスが可能である。
図2は、前述したコミュニケーション装置11,12以外の機器も備えたコミュニケーションシステム1001の構成の一例を示す図である。
図2に示すコミュニケーションシステム1001では、コミュニケーション装置11と、コミュニケーション装置12と、ノートPC(Personal Computer)13と、PDA(Personal Digital Assistant)15と、携帯電話16と、デスクトップPC19とが接続され、5拠点でのコミュニケーションシステムが実施される。なお、ここでは、ネットワーク10とインターネット18とが、インターネットサービスプロバイダであるサーバ17を介して接続されているものとする。
コミュニケーション装置11,12は、図1と同じであるため、それ以外の機器について説明する。なお、図2に示した通り、コミュニケーション装置11および12を構成する構成要素の一部または全部は、1個のシステムLSI(Large Scale Integration:大規模集積回路)から構成されてもよい。
ノートPC13は、カメラ機能を内蔵しておらず、外付けでカメラ14が接続されている。カメラ14は、デジタルビデオカメラなどの動画撮影が可能な機器である。ノートPC13は、カメラ14により撮影された映像音声データを、自拠点でのリアルタイムな映像音声データとして、ネットワーク10を介して、他機器に送信する。なお、カメラ14が、動画撮影機能を有しておらず、静止画撮影機能のみの場合、撮影した静止画データを一定間隔で送信してもよい。
PDA15は、カメラ機能を有しておらず、自拠点のリアルタイムな映像データを送信することができない。PDA15は、ネットワーク10を介して、受信した映像データをディスプレイおよびスピーカに出力するとともに、自拠点でのリアルタイムな音声データを他機器に送信する。なお、PDA15がカメラ機能を有している場合は、映像音声データを送受信することが可能となる。
携帯電話16は、CCD(Charge Coupled Device)カメラなどのカメラ付けの携帯電話である。携帯電話16は、自拠点でのリアルタイムな映像音声データをカメラおよびマイクから取得し、ネットワーク10を介して他機器に送信する。また、受信した映像音声データを自装置のディスプレイおよびスピーカに出力する。
また、携帯電話16は、PDC(Personal Digital Communications)方式、CDMA(Code Division Multiple Access)方式、GSM(Global System for Mobile Communications)方式、W−CDMA(Wideband−Code Division Multiple Access)方式、CDMA1x(Code Division Multiple Access)方式、およびLTE(Long Term Evolution)などのうち、いずれの通信方式を用いてもよい。
また、携帯電話16は、SDカードなどの記録媒体である蓄積メディアを装着可能なスロット部を有しており、記録メディアに記録されているデータを、コミュニケーションサービスに参加している他機器と共有することが可能である。さらに、携帯電話16によるネットワーク10への接続は、WiMAXなど他の無線通信機能を用いてもよい。
デスクトップPC19は、カメラ機能を内蔵しており、自拠点でのリアルタイムな映像音声データをカメラおよびマイクから取得し、映像音声データを、インターネット18とネットワーク10を介して他機器に送信する。なお、インターネット18とネットワーク10とは、インターネットサービスプロバイダのサーバ17を介して接続されているものとする。
また、デスクトップPC19は、受信した映像音声データを自装置のディスプレイおよびスピーカに出力する。なお、デスクトップPC19は、光ディスクまたはSDカードなどの記録媒体である蓄積メディアの読み取りが可能なデバイスと、外付けHDDまたは内部メモリとのうち1以上を有しており、これらに記録されているデータを、コミュニケーションサービスに参加している他機器と共有することが可能である。
また、各機器は、ネットワーク上の位置を示すアドレス情報として電話番号またはIPアドレスが割り当てられているものとする。なお、IPv6対応のIPアドレスを用いることで、各機器が物理的に移動しても、同じアドレスを用いてコミュニケーションサービスに参加することが可能となる。
また、各機器は、コミュニケーションサービスに参加している他機器へマルチキャストで映像音声データの送信を行ってもよい。当該マルチキャストは、IPマルチキャストまたは端末間がパケット複製転送するアプリケーションレベルマルチキャストである。また、特定の機器(例えばコミュニケーション装置11)をサーバと設定し、サーバが他機器から映像音声データを受信して処理を行った後、映像音声データを他機器へユニキャストやIPマルチキャストで転送してもよい。
以上により、コミュニケーション装置11とコミュニケーション装置12は、複数拠点に位置する各機器が送信したリアルタイムな映像や音声を出力することが可能となり、よりリアルなコミュニケーションサービスを提供することができる。
(コミュニケーション装置の構成)
次に、コミュニケーション装置11,12が備える入出力装置の配置について説明する。
図3は、コミュニケーション装置11,12の構成の一例を示す図である。
コミュニケーション装置11,12は、通信端末装置400と、ディスプレイ21a、21b,21cと、カメラ22a,22b,22c,22d,22eと、マイク23と、スピーカ24a,24b,24cと、リモコン26とを備えている。
また、各入出力装置(ディスプレイ21a,21b,21c、カメラ22a,22b、22c,22d,22e、マイク23、スピーカ24a,24b,24c、およびリモコン26)は、通信端末装置400と接続されている。この接続は、有線回線であっても無線回線であってもよい。また、コミュニケーションサービスに参加する1人以上のユーザは、ディスプレイ21a,21b,21cの方向に向いて机25の席に着くことを想定している。
通信端末装置400は、CPUおよびメモリを備えた情報処理装置である。通信端末装置400は、各入出力装置の制御と、入出力装置から入力された映像音声データの符号化処理と、ネットワーク10を介した通信制御処理と、ネットワーク10を介して受信した映像音声データの復号化処理と、復号化した映像音声データの入出力装置への出力処理などとを行う。
ディスプレイ21a,21b,21cは、映像などを表示する装置である。ディスプレイ21a,21b,21cは、例えば、LCD(Liquid Crystal Display)パネルまたはPDP(Plasma Display Panel)パネルを使用した表示装置である。このディスプレイ21a,21b,21cは、コミュニケーションサービスに参加するユーザの正面に位置するよう、机25の前面に並べて配置される。
ここでは3個のディスプレイが接続されている。この3個のディスプレイには、他拠点での参加者の映像が、机25の席に着いているよう表示される。つまり、他拠点の映像は、ディスプレイの個数に合わせて分割して表示される。なお、4個以上のディスプレイを接続してもよい。
カメラ22a,22b,22c,22d,22eは、デジタルビデオカメラなどの動画撮影機能を有する撮影装置である。このカメラ22a,22b,22c,22d,22eは、ディスプレイ21a,21b,21cの上部に配置される。ここでは5個のカメラが接続されている。
カメラ22aは、左に位置するディスプレイ21aの左右方向の中央に配置される。カメラ22eは、右に位置するディスプレイ21cの左右方向の中央に配置される。カメラ22b,22c,22dは、中央に位置するディスプレイ21bの左右方向の中央に並べて配置される。また、隣り合わせに配置されたカメラの撮影対象は、映像の端が一部重なるものとする。これにより、コミュニケーション装置11,12は、ディスプレイ21a,21b,21cの方向に向いて机25の席に着いたユーザの映像を、切れ目なく撮影して、他拠点に送信することが可能となる。
マイク23は、周辺の音声の集音を行う入力装置である。このマイク23は、机25の中央に配置される。また、机25の席に着いたユーザの人数に合わせた個数の指向性マイクを、各ユーザの正面位置するように配置してもよい。また、1個の無指向性マイクと1個以上の指向性マイクを組み合わせて配置してもよい。これにより、他拠点において、どの方向からの音声かを把握することが可能となり、他拠点は音声を出力する方向を制御することが可能となる。
スピーカ24a,24b,24cは、それぞれ、ディスプレイ21a,21b,21cの背後に配置される。ディスプレイの個数に合わせて、ここでは3個のスピーカが接続されている。これにより、ディスプレイ21a,21b,21cに表示されている映像に合わせて、音声を出力するスピーカを制御することが可能となる。つまり、ディスプレイ21aに表示されているユーザの声が、スピーカ24aから出力されることになる。
リモコン26は、ユーザからの入力指示を受け、通信端末装置400への操作入力信号を送信する操作入力装置である。なお、リモコン26は、机25の席に着いたユーザにより操作可能であればよい。また、ここでは、操作入力装置はリモコンとしたが、キーボードおよびマウスなど、他の操作入力装置を用いてもよい。また、机25の席に着いたユーザの人数に合わせた個数の操作入力装置を、各ユーザの正面に位置するように配置してもよい。
以上により、コミュニケーション装置11,12は、他拠点とのコミュニケーションサービスを提供することが可能となる。つまり、ユーザがリモコン26を操作して接続先(他拠点)を設定して通信を確立し、コミュニケーションサービスを開始する。コミュニケーションサービス実行中は、カメラ22a,22b,22c,22d,22eが、机25の席に着いたユーザの映像を撮影し、同時に、マイク23が、音声を収音する。
通信端末装置400は、カメラ22a,22b,22c,22d,22eとマイク23とから、自拠点のリアルタイムな映像音声データを取得し、取得した映像音声データに符号化処理を行い、符号化した映像音声データを他拠点へ送信する。また、通信端末装置400は、他拠点の映像音声データを受信し、受信した映像音声データに復号化処理を行い、復号化した映像音声データをディスプレイ21a,21b,21cと、スピーカ24a,24b,24cとへ出力する。
これにより、複数拠点間で相互にリアルタイムな映像および音声を出力することが可能となり、よりリアルなコミュニケーションサービスを提供することができる。また、コミュニケーションサービス実行中に、ユーザがリモコン26を操作して、光ディスクまたはSDカードなどの記録媒体である蓄積メディアに記録されているデータを取得し、ネットワーク10を介して送受信することで、コミュニケーションサービスに参加している他機器と当該データを共有することが可能となる。
(通信端末装置の構成)
次に、通信端末装置400について詳細に説明する。
図4は、通信端末装置400の内部構成を示したブロック図である。なお、図4には説明のために、前述したネットワーク10が示される。
ネットワーク10は、前述したNGNである。NGNは、前述したように、最大通信帯域を通信開始前に設定することにより、最大通信帯域が保証されたネットワークである。以下においては、設定された最大通信帯域を、設定通信帯域または設定レートという。設定レートは、所定のビットレートである。この場合、ネットワーク10において、設定通信帯域以下のビットレートでパケットが送信された場合、当該パケットの損失は発生しない。なお、ネットワーク10は、他の通信がなく、利用できる通信帯域が事前に判明している専用回線を使用したネットワークであってもよい。
図4に示されるように、通信端末装置400は、取得部410と、符号化部411と、分割部411Nと、通信量監視部412と、ネットワーク制御部417とを備える。
取得部410は、前述した図3のカメラ22a,22b,22c,22d,22eのいずれかから、動画像を構成する複数のフレームの各々を順次取得する。取得部410は、フレームを取得する毎に、取得した当該フレームを、符号化部411へ送信する。
なお、カメラ22a,22b,22c,22d,22eは、デジタルスチルカメラなどの静止画撮影機能のみを有する撮影装置であってもよい。この場合、取得部410は、カメラ22a,22b,22c,22d,22eのいずれかが撮影により得た静止画像としてのフレームを、所定時間毎に取得する。
ネットワーク制御部417は、ネットワーク10に対し、SIPなどの制御プロトコルを用いて、最大通信帯域を設定する。最大通信帯域は、例えば、20Mbpsであるとする。ネットワーク制御部417が設定する最大通信帯域は、ユーザにより指定された帯域である。なお、本実施の形態においては、説明を簡単にするために、最大通信帯域は、映像のみに使用される帯域であるとする。
最大通信帯域の設定が終了すると、ネットワーク制御部417は、設定した最大通信帯域としての設定レート(例えば20Mbps)を示す設定レート情報を、符号化部411、通信量監視部412および後述する送信部416へ送信する。
なお、ネットワーク10が専用回線を使用したネットワークである場合、ネットワーク制御部417は、最大通信帯域の設定を行わず、当該専用回線の最大通信帯域としてのビットレート(設定レート)を示す設定レート情報を、符号化部411、通信量監視部412および後述する送信部416へ送信する。
符号化部411は、フレームを受信する毎に、受信したフレームを、H.264に基づく画像圧縮技術により符号化する符号化処理を行う。すなわち、当該符号化処理は、フレームをスライス単位で符号化する処理であって、連続するフレームの相関を利用した画像圧縮処理である。以下においては、符号化部411が行う符号化処理により得られたデータを、符号化データという。
本実施の形態では、1つの符号化データは、1つのフレームを得るためのデータであるとする。以下においては、符号化部411が行う符号化処理により得られた1つの符号化データを、符号化データOCDという。符号化データOCDは、複数のスライスから構成される。
なお、本実施の形態においては、符号化データOCDを構成する複数のスライスの各々は、I(Intra)スライスまたはP(Predictive)スライスであるとする。すなわち、本実施の形態における符号化処理は、B(Bi-predictive)スライスを使用しない処理であるとする。すなわち、符号化データOCDは、当該符号化データOCDに対応するフレーム(以下、処理対象フレームという)より前に取得されたフレームに対応する符号化データを参照して、処理対象フレームを得るためのデータである。
図5は、符号化データOCDから得られるフレームFLと、符号化データOCDを構成する複数のスライスとの対応関係を示す図である。
図5において、フレームFLは、符号化データOCDを復号することにより得られるフレームである。符号化データOCDは、スライスSL1,SL2,SL3,・・・,SLm(自然数)から構成される。すなわち、符号化データOCDは、m個のスライスから構成される。mが“15”である場合、符号化データOCDは、15個のスライスから構成される。以下においては、スライスSLpを、p番目のスライスという。例えば、スライスSL3は、3番目のスライスである。
図5に示されるように、符号化データOCDを構成するスライスSL1,SL2,SL3,・・・,SLmは、それぞれ、フレームFL内のスライスSL1,SL2,SL3,・・・,SLmの位置に対応するスライスである。
なお、スライスは、図5のように、対応するフレームにおいて行単位で分割されたものに限定されることなく、例えば、行の途中で分割されたものであってもよい。
なお、符号化部411は、符号化データのビットレートが、受信した設定レート情報が示す設定レートとほぼ同一となるように前述の符号化処理を行う。符号化部411は、符号化データを生成する毎に、当該符号化データを、分割部411Nへ送信する。
分割部411Nは、符号化データを受信する毎に、当該符号化データを、NAL(Network Abstraction Layer)ユニットという単位で分割するためのデータ分割処理を行う。NALユニットは、スライス、エンコードパラメータセット、SEI(Supplemental Enhancement Information)などのデータをパケット化する単位である。
図6は、NALユニットの格納形式を示す図である。図6において、「NALユニット・データ」とは、NALユニットのデータ部を示す。「サイズ」とは、NALユニットのデータサイズを示す。すなわち、NALユニットの先頭には、当該NALユニットのデータサイズを示すフィールド(文字列「サイズ」に対応)が付加される。
また、分割部411Nは、データ分割処理を行う毎に、データ分割処理により得られたNALユニットをネットワークに対して送信するために、当該NALユニットを、RTP(Real-time Transport Protocol)パケットに変換するためのRTPパケット変換処理を行う。
本実施の形態では、RTPパケット変換処理において、NALユニットを、単一NALユニット・パケット(Single NAL Unit Packet)形式のRTPパケットに変換する。単一NALユニット・パケット形式のRTPパケットは、1つのRTPパケットに、1つのNALユニットを格納するパケットである。なお、単一NALユニット・パケット形式のRTPパケットへの変換は、非特許文献(RFC3984,“RTP Payload Format for H.264 Video”,February,2005)に開示されている方法で行うとする。
なお、NALユニットをパケット化する際に、RTPパケットの形式を用いず、独自のパケット形式を使用してもよい。
以上の処理により、符号化データOCDを構成するm個のスライスは、それぞれ、m個のRTPパケットに変換される。本実施の形態では、RTPパケット変換処理により得られたm個のRTPパケットの各々は、1つのスライスを含むとする。分割部411Nは、m個のRTPパケットの各々に含まれるスライスの位置情報(以下、スライス位置情報という)を、当該RTPパケットと対応付けておく。
スライス位置情報は、例えば、図5のように、フレームFLに対応する符号化データOCDが、所定数であるm個のスライスに分割されている場合、“1”〜“m”のいずれかの番号を示す情報である。例えば、スライス位置情報が“3”を示す場合、対応するRTPパケットに含まれるスライスは、フレームFL内のスライスSL3の位置のスライスとなる。
なお、フレームに対応する符号化データが可変数のスライスに分割されている場合、スライスの開始ピクセル番号と、スライスの幅、スライスの高さの情報等を、スライス位置情報としてもよい。
分割部411Nは、RTPパケット変換処理によりm個のRTPパケットを得る毎に、当該m個のRTPパケットの各々を、順次、通信量監視部412へ送信する。なお、分割部411Nは、RTPパケットを通信量監視部412へ送信する場合、当該RTPパケットとともに、データ種別情報、サイズ情報および前述したスライス位置情報を、通信量監視部412へ送信する。データ種別情報は、対応するRTPパケットに含まれるNALユニットのデータの種類(例えば、映像のデータ等)を示す情報である。サイズ情報は、対応するRTPパケットのデータサイズ(単位:バイト)を示す情報である。
通信端末装置400は、さらに、パケット制御部413と、スライス指示部414と、パケット蓄積部415とを備える。
パケット蓄積部415は、データを一時的に記憶するメモリである。
通信量監視部412は、所定の単位時間経過毎に、当該所定の単位時間において、分割部411Nから受信した複数のRTPパケットを、パケット蓄積部415に記憶させる。なお、通信量監視部412は、分割部411Nから受信するRTPパケットとともに受信するスライス位置情報およびサイズ情報も、当該RTPパケットに対応付けてパケット蓄積部415に記憶させる。ここで、所定の単位時間は、例えば、30msである。所定の単位時間において、分割部411Nから受信した複数のパケットは、当該所定の単位時間において分割部411Nが生成したパケットである。
また、通信量監視部412は、所定の単位時間経過毎に、当該所定の単位時間において、分割部411Nから受信した複数のパケットのデータサイズの合計値を算出する。そして、通信量監視部412は、算出した合計値を、所定の単位時間で除算することにより、ビットレート(以下、出力レートという)を算出する。なお、通信量監視部412は、s(自然数)枚のフレームに対応する複数のRTPパケットを受信する毎に、ビットレートを算出してもよい。
通信量監視部412は、算出した出力レートが、ネットワーク制御部417から受信した設定レート情報が示す設定レート(例えば20Mbps)より大きいか否かを判定する。算出した出力レートが、設定レートより大きい場合、通信量監視部412は、削除データ量を算出する。削除データ量は、((出力レート−設定レート)/所定の単位時間)の式により算出される。
通信量監視部412は、削除情報を、パケット制御部413へ送信する。削除情報は、削除データ量と、当該削除データ量を算出する対象となった複数のRTPパケットを特定するための情報を示す。
パケット制御部413は、受信した削除情報が示す削除データ量を算出する対象となった、パケット蓄積部415に記憶されている複数のRTPパケットのうち、一部のRTPパケットを選択する。パケット制御部413は、当該一部のRTPパケットを選択する場合、当該一部のRTPパケットのデータサイズの合計値(データ量)が、削除データ量以上となるように、当該一部のRTPパケットを選択する。ここで、選択されたRTPパケットの数は、k(自然数)個であるとする。
なお、RTPパケットの選択方法は、RTPパケットをランダムに選択する方法であってもよい。また、RTPパケットの選択方法は、削除データ量を算出する対象となった複数のRTPパケットのうち、選択するRTPパケットのデータサイズの合計値が、削除データ量より大きい値であって、当該値が最小となるように、RTPパケットを選択する方法であってもよい。また、RTPパケットの選択方法は、RTPパケットに含まれるスライスの数が少ないものを優先的に選択する方法であってもよい。
また、RTPパケットの選択方法は、スライス位置情報により特定されるスライスの位置がばらけるように、RTPパケットを選択する方法であってもよい。また、RTPパケットの選択方法は、後述する処理により、スライスの種類がIスライスに変更されたスライスをRTPパケットが含む場合があるので、Pスライスが格納されたRTPパケットを優先的に選択する方法であってもよい。
そして、パケット制御部413は、選択したk個のRTPパケットにそれぞれ対応するk個のスライス位置情報をパケット蓄積部415から読み出すとともに、パケット蓄積部415に記憶されている当該選択したk個のRTPパケットを削除する。
そして、パケット制御部413は、読み出したk個のスライス位置情報を、スライス指示部414へ送信する。
スライス指示部414は、受信したk個のスライス位置情報に基づいて、スライス変更指示を、符号化部411へ送信する。スライス変更指示は、k個のスライス位置情報に対応するk個のRTPパケットに対応する符号化データの次の符号化データを符号化部411が生成する場合、当該次の符号化データから得られるフレームにおいて、k個のスライス位置情報にそれぞれ対応するk個の位置と同じ位置のk個のスライスを、Iスライスとするように符号化部411に符号化処理を行わせるための指示である。
ここで、kは“2”であるとする。この場合、2個のスライス位置情報は、図5のフレームFL内のスライスSL1,SL3の位置を示す情報であるとする。また、パケット蓄積部415に記憶されている2個のスライス位置情報の各々に対応するRTPパケットが削除されたとする。
この場合、パケット蓄積部415に記憶されている、フレームFLに対応する複数のRTPパケットから復元されるフレームは、以下のフレームFLAとなる。
図7は、状態の異なる複数のフレームを示す図である。図7において、フレームFLは、図5のフレームFLと同じなので詳細な説明は繰り返さない。
前述したように、RTPパケットが削除された場合、パケット蓄積部415に記憶されている、フレームFLに対応する複数のRTPパケットから復元されるフレームは、フレームFLAとなる。すなわち、フレームFL内のスライスSL1,SL3の位置と同じ位置にある、フレームFLA内のスライスSL1,SL3の各々は、画像を示さないスライスとなる。
なお、ここでは、スライスは画像を示さないとしたが、スライスは、黒色などの特定の色を表示したり、前のフレームの同じ位置のスライスの画像と同じ画像を表示したりするスライスでもよい。
ここで、仮に、パケット制御部413がRTPパケットを削除したにも関わらず、スライス指示部414がスライス変更指示を符号化部411へ送信しなかったとする。また、符号化部411は、前述した符号化処理を行うことによりフレームFLNが得られる符号化データNを生成したとする。また、生成された符号化データNに含まれるスライスSL3が、Pスライスであるとする。
この場合、フレームFLNに対するスライスSL3は、フレームFLNの前のフレームFLAに対応するスライスSL3のデータを参照したデータとなる。前述したように、フレームFLAに対応するスライスSL3は画像を示さないスライスである。そのため、フレームFLNに対するスライスSL3は、画像を示さないスライスとなる。したがって、フレームFLNには、画像が示されない部分が生じてしまう。
しかしながら、本実施の形態では、フレームFLAに対応する複数のRTPパケットがパケット蓄積部415に記憶されている場合、スライス指示部414は、以下のスライス変更指示Aを、符号化部411へ送信する。ここで、フレームFLAの次に表示されるフレームは、フレームFLBであるとする。
スライス変更指示Aは、図7のフレームFLAに対応する符号化データの次の符号化データから得られる図7のフレームFLBにおいて、2個のスライス位置情報にそれぞれ対応する2個の位置と同じ位置の2個のスライスを、Iスライスとするように符号化部411に符号化処理を行わせるための指示である。
符号化部411は、スライス変更指示Aに応じて符号化処理を行うことにより、復号によりフレームFLBが得られる符号化データを生成する。この場合、フレームFLB内のスライスSL1,SL3は、他のフレームに依存しないIスライスである。
したがって、フレームFLAの次に表示されるフレームFLBは、フレームFLNのような画像が示されない部分があるフレームではなく、画像が示されない部分が生じないフレームとなる。
なお、フレームFLA,FLBは、例えば、1/60秒間隔で、連続して表示される。そのため、ユーザが連続して表示されるフレームFLA,FLBを見たとしても、フレームFLA内の欠如した部分の画像(スライスSL1,SL3に対応する画像)には気づかないことが多い。
なお、スライス指示部414は、フレームFLAに対応する複数のRTPパケットがパケット蓄積部415に記憶されている場合、以下のスライス変更指示Pを、符号化部411へ送信してもよい。
スライス変更指示Pは、フレームFLAに対応するスライスSL1,SL3の位置と同じ位置の2つのスライスをPスライスとし、当該PスライスがフレームFLAに対応するスライスSL1,SL3以外のスライスを参照するように符号化部411に符号化処理を行わせるための指示である。符号化部411は、このようなスライス変更指示Pに応じて符号化処理を行った場合、欠如した部分のないフレームを得るための符号化データを生成することができる。
通信端末装置400は、さらに、送信部416を備える。
送信部416は、パケット送信処理を行う。パケット送信処理では、送信部416が、n(自然数)番目のフレームに対応する、パケット蓄積部415に記憶されている複数のRTPパケットの各々を、当該RTPパケットがパケット蓄積部415に記憶された順で、順次、ネットワーク10へ送信する。また、送信部416は、複数のRTPパケットの各々を、設定レートで、順次、ネットワーク10へ送信する。設定レートは、ネットワーク制御部417から受信した設定レート情報が示すビットレートである。なお、nの初期値は“1”である。
送信部416は、パケット送信処理を行う毎に、nの値を1インクリメントして、パケット送信処理を行う。なお、送信部416は、複数のRTPパケットの各々を、設定レート以下で、順次、ネットワーク10へ送信してもよい。
なお、通信端末装置400に含まれる複数の構成要素の一部または全部は、1個のシステムLSIから構成されてもよい。すなわち、通信端末装置400は、集積回路であってもよい。
(フレーム対応処理)
次に、通信端末装置400が、外部から取得するフレームに対して行う処理(以下、フレーム対応処理という)について説明する。
なお、前述したように、ネットワーク制御部417は、以下のフレーム対応処理が行われる前に、ネットワーク10に対し、SIPなどの制御プロトコルを用いて、最大通信帯域を設定する。
そして、ネットワーク制御部417は、設定した最大通信帯域としての設定レート(例えば20Mbps)を示す設定レート情報を、符号化部411、通信量監視部412および送信部416へ送信する。
図8は、フレーム対応処理のフローチャートである。
ステップS111では、フレーム取得処理が行われる。フレーム取得処理では、取得部410が、前述した図3のカメラ22a,22b,22c,22d,22eのいずれかから、動画像を構成する複数のフレームのうち、n(自然数)番目のフレームを取得する。なお、当該動画像を構成する複数のフレームの各々は、1/60秒間隔で、連続して表示されるフレームであるとする。なお、nの初期値は“1”である。取得部410は、n番目のフレームを取得すると、nの値を1インクリメントする。取得部410は、取得したフレームを、符号化部411へ送信する。
ステップS112では、符号化部411が、受信したフレームを、H.264に基づく画像圧縮技術により符号化する前述した符号化処理を行う。前述したように、符号化部411が行う符号化処理により得られたデータを、符号化データという。本実施の形態では、1つの符号化データは、1つのフレームを得るためのデータであるとする。また、符号化データは、図5で説明したように、m個のスライスから構成される。
なお、符号化部411は、符号化データのビットレートが、受信した設定レート情報が示す設定レートとほぼ同一となるように前述の符号化処理を行う。
なお、符号化部411は、スライス指示部414から、前述したスライス変更指示を受信している場合、前述したようにスライス変更指示に基づいて、符号化処理を行う。
そして、符号化部411は、生成した符号化データを、分割部411Nへ送信する。
ステップS113では、前述したデータ分割処理が行われる。データ分割処理では、分割部411Nが、受信した符号化データを、複数のNALユニットに分割する。
ステップS114では、前述したRTPパケット変換処理が行われる。RTPパケット変換処理では、分割部411Nが、前述したように、データ分割処理により得られた複数のNALユニットの各々を、RTPパケットに変換する。本実施の形態では、前述したように、NALユニットを、単一NALユニット・パケット形式のRTPパケットに変換する。RTPパケット変換処理により、符号化データを構成するm個のスライスは、それぞれ、m個のRTPパケットに変換されるとする。
分割部411Nは、前述したように、m個のRTPパケットの各々に含まれるスライスの位置情報(スライス位置情報)を、当該RTPパケットと対応付けておく。分割部411Nは、前述したように、m個のRTPパケットの各々を、順次、通信量監視部412へ送信する。なお、分割部411Nは、前述したように、RTPパケットを通信量監視部412へ送信する場合、当該RTPパケットとともに、データ種別情報、サイズ情報および前述したスライス位置情報を、通信量監視部412へ送信する。m個のRTPパケットの送信が終了すると、このRTPパケット変換処理は終了する。
ステップS115では、パケット対応処理が行われる。
なお、初めて、パケット対応処理が行われる場合、パケット対応処理が開始されると同時に、時間測定処理が実行される。時間測定処理は、他の処理とは独立して行われる処理である。
時間測定処理では、通信量監視部412が、時間カウンタTCの値を、1ミリ秒経過する毎に1インクリメントする。時間カウンタTCは、時間を測定するためのカウンタである。時間カウンタTCの初期値は“0”である。
図9は、パケット対応処理のフローチャートである。
ステップS211では、パケット取得処理が行われる。パケット取得処理では、通信量監視部412が、RTPパケット、データ種別情報、サイズ情報およびスライス位置情報を受信する。なお、パケット取得処理では、1つのRTPパケットが受信される。
ステップS212では、パケット合計値tot_sizeの更新が行われる。パケット合計値tot_size(単位:バイト)は、通信量監視部412が、所定の単位時間において受信した複数のRTPパケットのデータサイズの合計値を算出するための変数である。パケット合計値tot_sizeの初期値は、“0”である。
具体的には、通信量監視部412が、現時点のパケット合計値tot_sizeが示す値に、受信したサイズ情報が示すRTPパケットのデータサイズの値(以下、pk_sizeと表す)を加算した値を、パケット合計値tot_sizeが示す値に設定する。
すなわち、サイズ情報が示すRTPパケットのデータサイズを、pk_sizeと表した場合、更新後のパケット合計値tot_sizeは、以下の式(1)により表される。
tot_size=tot_size+pk_size ・・・式(1)
ステップS213では、通信量監視部412が、所定の単位時間が経過したか否かを判定する。具体的には、通信量監視部412が、現時点の時間カウンタTCの値が、所定値以上であるか否かを判定する。
ここで、所定の単位時間は、1/60(0.017)秒であるとする。この場合、所定値は“17”となる。この場合、通信量監視部412は、現時点の時間カウンタTCの値が“17”以上であるか否かを判定する。
ステップS213において、YESならば、処理は後述するステップS215に移行する。一方、ステップS213において、NOならば、処理はステップS214に移行する。ここでは、所定の単位時間が経過していないとして、処理はステップS214に移行する。
なお、本実施の形態では、1フレーム単位で処理しているため、所定の単位時間は、1フレームを処理する時間(例えば、0.017秒)としているが、これに限定されない。例えば、複数のフレーム単位で処理する場合、所定の単位時間は、0.017秒より長い時間に設定される。この場合、所定値は“17”より大きい値となる。
ステップS214では、パケット記憶処理が行われる。パケット記憶処理では、通信量監視部412が、受信したRTPパケットと、受信したスライス位置情報およびサイズ情報とを対応付けてパケット蓄積部415に記憶させる。そして、再度、ステップS211の処理が行われる。
そして、ステップS211,S212,S213,S214の処理が複数回繰り返された後、ステップS213でYESと判定されたとする。すなわち、所定の単位時間が経過したとする。この場合、処理はステップS215に移行する。
ステップS215では、出力レート算出処理が行われる。出力レート算出処理では、通信量監視部412が、以下の式(2)より、前述した出力レートEncRate(単位:bps)を算出する。
EncRate=tot_size×8/t ・・・式(2)
式(2)において、tは、所定の単位時間(単位:秒)である。
ステップS216では、通信量監視部412が、現時点のパケット合計値tot_sizeの値を0に設定する。
ステップS217では、パケット記憶処理が行われる。パケット記憶処理は、ステップS214のパケット記憶処理と同様なので詳細な説明は繰り返さない。
ステップS218では、時間カウンタがリセットされる。具体的には、パケット記憶処理が、時間カウンタTCを、“0”に設定する。
ステップS219では、通信量監視部412が、出力レートEncRateが、設定レートより大きいか否かを判定する。設定レート(単位:bps)は、ネットワーク制御部417から受信した設定レート情報が示すビットレートである。以下においては、設定レートを、設定レートSetRateともいう。
ステップS219において、YESならば、処理はステップS221に移行する。一方、ステップS219において、NOならば、処理は後述するステップS225に移行する。ここでは、出力レートEncRateが、設定レートより大きいとして、処理はステップS221に移行する。
ステップS221では、削除データ量算出処理が行われる。削除データ量算出処理では、通信量監視部412が、前述した削除データ量(以下、削除データ量Delという)(単位:バイト)を、以下の式(3)より算出する。
Del=(EncRate−SetRate)/8×t ・・・式(3)
式(3)において、tは、前述した所定の単位時間(単位:秒)である。また、通信量監視部412は、前述したように、削除情報を、パケット制御部413へ送信する。削除情報は、削除データ量Delと、当該削除データ量Delを算出する対象となった複数のRTPパケットを特定するための情報を示す。
ステップS222では、パケット選択処理が行われる。パケット選択処理では、パケット制御部413が、前述したように、受信した削除情報が示す削除データ量Delを算出する対象となった、パケット蓄積部415に記憶されている複数のRTPパケットのうち、一部のRTPパケットを選択する。パケット制御部413は、当該一部のRTPパケットを選択する場合、当該一部のRTPパケットのデータサイズの合計値が、削除データ量Del以上となるように、当該一部のRTPパケットを選択する。ここで、選択されたRTPパケットの数は、k(自然数)個であるとする。なお、RTPパケットの選択方法は、前述したので詳細な説明は繰り返さない。
ステップS223では、パケット削除処理が行われる。パケット削除処理では、パケット制御部413が、前述したように、選択したk個のRTPパケットにそれぞれ対応するk個のスライス位置情報をパケット蓄積部415から読み出すとともに、パケット蓄積部415に記憶されている当該選択したk個のRTPパケットを削除する。そして、パケット制御部413は、読み出したk個のスライス位置情報を、スライス指示部414へ送信する。
ステップS224では、スライス変更処理が行われる。スライス変更処理では、スライス指示部414が、前述したように、受信したk個のスライス位置情報に基づいて、スライス変更指示を、符号化部411へ送信する。
前述したように、スライス変更指示は、k個のスライス位置情報に対応するk個のRTPパケットに対応する符号化データの次の符号化データを符号化部411が生成する場合、当該次の符号化データから得られるフレームにおいて、k個のスライス位置情報にそれぞれ対応するk個の位置と同じ位置のk個のスライスを、Iスライスとするように符号化部411に符号化処理を行わせるための指示である。
ここで、kは“2”であるとする。この場合、2個のスライス位置情報は、図7のフレームFL内のスライスSL1,SL3の位置を示す情報であるとする。また、パケット蓄積部415に記憶されている2個のスライス位置情報の各々に対応するRTPパケットが削除されたとする。
この場合、パケット蓄積部415に記憶されている、フレームFLに対応する複数のRTPパケットから復元されるフレームは、フレームFLAとなる。すなわち、フレームFL内のスライスSL1,SL3の位置と同じ位置にある、フレームFLA内のスライスSL1,SL3の各々は、画像を示さないスライスとなる。
また、この場合、スライス指示部414が送信するスライス変更指示は、前述したスライス変更指示Aとなる。スライス変更指示Aは、図7のフレームFLAに対応する符号化データの次の符号化データから得られる図7のフレームFLBにおいて、2個のスライス位置情報にそれぞれ対応する2個の位置と同じ位置の2個のスライスを、Iスライスとするように符号化部411に符号化処理を行わせるための指示である。そして、ステップS224の処理は終了する。
符号化部411は、スライス変更指示Aに応じて、再度、図8のステップS112の符号化処理を行うことにより、復号によりフレームFLBが得られる符号化データを生成する。この場合、フレームFLB内のスライスSL1,SL3は、Iスライスである。
したがって、フレームFLAの次に表示されるフレームFLBは、フレームFLNのように画像が示されない部分があるフレームではなく、画像が示されない部分が生じないフレームとなる。
なお、図7のフレームFLA,FLBは、例えば、1/60秒間隔で、連続して表示される。そのため、ユーザが連続して表示されるフレームFLA,FLBを見たとしても、フレームFLA内の欠如した部分の画像(スライスSL1,SL3に対応する画像)には気づかない。
ステップS224の処理の後、処理はステップS225に移行する。
ステップS225では、通信量監視部412が、1フレームに対応する全てのパケットを受信したか否かを判定する。ここで、1フレームに対応する全てのパケットは、前述した、m個のRTPパケットであるとする。この場合、通信量監視部412は、1フレームに対応するm個のRTPパケットを受信したか否かを判定する。
ステップS225において、YESならば、このパケット対応処理は終了し、処理は図8のフレーム対応処理に戻り、処理はステップS115の次のステップS116に移行する。一方、ステップS225において、NOならば、再度、ステップS211の処理が行われる。
再び、図8を参照して、ステップS115の処理の後、ステップS116の処理が行われる。
ステップS116では、次のフレームがあるか否かが判定される。具体的には、取得部410が、ステップS111で取得したフレームの次のフレームが、外部の装置から送信されているか否かを判定する。ステップS116において、YESならば、再度、ステップS111の処理が行われる。一方、ステップS116において、NOならば、このフレーム対応処理は終了する。
ここでは、次のフレームがあると判定されて、再度、ステップS111の処理が行われるとする。
そして、前述したステップS111の処理の後、ステップS112の処理が行われる。ここで、符号化部411は、スライス指示部414から、前述したスライス変更指示Aを受信しているとする。この場合、符号化部411は、スライス変更指示Aに応じて、前述した符号化処理を行う。
次に、通信端末装置400の送信部416が行う送信処理について説明する。送信処理は、他の処理とは独立して行われる処理である。
図10は、送信処理のフローチャートである。
ステップS311では、前述したパケット送信処理が行われる。前述したように、パケット送信処理では、送信部416が、u(自然数)番目のフレームに対応する、パケット蓄積部415に記憶されている複数のRTPパケットの各々を、当該RTPパケットがパケット蓄積部415に記憶された順で、順次、ネットワーク10へ送信する。また、送信部416は、複数のRTPパケットの各々を、設定レートで、順次、ネットワーク10へ送信する。設定レートは、ネットワーク制御部417から受信した設定レート情報が示すビットレートである。なお、uの初期値は“1”である。
送信部416は、パケット送信処理を行う毎に、uの値を1インクリメントして、パケット送信処理を行う。
なお、送信部416は、複数のRTPパケットの各々を、設定レート以下で、順次、ネットワーク10へ送信してもよい。
以上説明したように、本実施の形態においては、動画像を構成する複数のフレームのうち、処理対象フレームに対する符号化処理により得られた符号化データに対応する複数のRTPパケットに基づくビットレートとしての出力レートが、予め設定したビットレートとしての設定レートより大きい場合、以下の処理が行われる。
まず、出力レートが設定レート以下になるように、処理対象フレームに対応する複数のRTPパケットのうち、k個のRTPパケットが削除される。k個のRTPパケットにそれぞれ対応するk個のスライス位置情報の各々は、処理対象フレームにおける、対応するRTPパケットに対応するスライスの位置を示す。
また、削除されたk個のRTPパケットに対応する符号化データの次の符号化データを符号化部411が生成する場合、当該次の符号化データから得られるフレームにおいて、k個のスライス位置情報にそれぞれ対応するk個の位置と同じ位置のk個のスライスを、Iスライスとするように符号化部411が符号化処理を行わせるための処理が行われる。
これにより、符号化データに対応する複数のRTPパケットに基づくビットレートとしての出力レートが、設定レートより大きい場合、フレーム単位で間引かれることなく、フレームの一部が変化するのみである。
つまり、算出された出力レートが設定レートより大きい場合であっても、フレームに対応する全てのRTPパケットが削除されることなく、フレーム内の一部に対応するRTPパケットが削除されるのみである。また、この場合、符号化データの次の符号化データを符号化部411が生成する場合、次の符号化データから得られるフレームにおいて、削除されたRTPパケットに対応するスライスの位置と同じ位置のスライスを、Iスライスとするように符号化部411が制御される。
したがって、動画像の符号化により得られるデータのビットレートとしての出力レートを所定のビットレートとしての設定レート以下に保ちつつ、動画像の劣化の度合いを小さくすることができる。
すなわち、動画像を構成する複数のパケットを、設定レートで送信する場合において、動画像の画質劣化を最小限に抑えることができ、かつ、出力レートの揺れを低減することができる。そのため、安定したデータ通信を実現することができ、円滑なAVコミュニケーションを実現できる。
また、本実施の形態においては、通信端末装置400が、ネットワーク上で欠落する恐れのある、パケット(帯域(設定レート)超過分)を、ネットワークへ送信する前に削除し、削除したパケット(スライス)の位置に対応する、次のフレームのスライスの符号化時に、削除されたスライスを参照させない(Iスライスにする)処理を行う。
パケットを削除する処理は、通信端末装置400内で行われる。そのため、遅延時間を小さくことができ、また、ネットワークのリソースを消費することもない。
また、本実施の形態における通信端末装置400は、設定レート以下でパケットを送信すればパケットの損失が発生しないネットワーク10を利用する場合、符号化処理により得られた符号化データに基づく出力レートが、設定レートを超える場合、当該出力レートが設定レート以下になるようにRTPパケットを削除する。
したがって、ネットワーク10に対し、設定レート以下出力レートで、パケットを送信することができるため、パケットの損失が発生しない。
<第2の実施の形態>
第1の実施の形態では、1つのRTPパケットは、1つのNALユニットを格納するようにしていた。なお、1つのNALユニットには、1つのスライスを含む。本実施の形態では、NALユニットのサイズに応じて、NALユニットを複数に分割する処理、または、複数のNALユニットを1つのRTPパケット内に格納する処理を行う。
なお、本実施の形態におけるコミュニケーションシステムは、図1のコミュニケーションシステム1000または図2のコミュニケーションシステム1001である。また、本実施の形態における通信端末装置は、図4の通信端末装置400である。そのため、通信端末装置400の構成について、詳細な説明は繰り返さない。
(フレーム対応処理)
次に、本実施の形態において、通信端末装置400が、外部から取得するフレームに対して行う処理(以下、フレーム対応処理Aという)について説明する。
図11は、フレーム対応処理Aのフローチャートである。図11において、図8のステップ番号と同じステップ番号の処理は、第1の実施の形態で説明した処理と同様な処理が行われるので詳細な説明は繰り返さない。
まず、ステップS111〜S113の処理が、第1の実施の形態と同様に行われる。この処理により、フレームに対し符号化処理が行われることにより得られた符号化データが、複数のNALユニットに分割される。
ステップS114Aでは、RTPパケット変換処理Aが行われる。RTPパケット変換処理Aでは、以下の条件Aが満たされる場合、以下の複数パケット統合処理が行われる。また、RTPパケット変換処理Aでは、後述する条件Bが満たされる場合、以下のパケット分割処理が行われる。
条件Aは、ステップS113の処理により得られた複数のNALユニットのうち、データサイズの合計値(データ量)が、最大パケット化サイズ以下となる複数のNALユニット(以下、統合対象NALユニットという)が存在するという条件である。ここで、最大パケット化サイズ(単位:バイト)とは、(MTU(Maximum Transmission Unit)サイズ−IPヘッダサイズ−UDP(User Datagram Protocol)ヘッダサイズ−RTPヘッダサイズ)の式により得られるサイズである。
MTUサイズ(単位:バイト)は、ネットワーク10に対して、1回の転送で送信できるデータの最大値である。MTUサイズは、一例として“1500”であるとする。IPヘッダサイズとは、IPヘッダのデータサイズである。UDPヘッダサイズとは、UDPヘッダのデータサイズである。RTPヘッダサイズとは、RTPヘッダのデータサイズである。ここで、最大パケット化サイズは、一例として、“1460”であるとする。
条件Aが満たされる場合、複数パケット統合処理が行われる。
複数パケット統合処理では、分割部411Nが、複数の統合対象ユニットを、RTPパケットとしての集合パケット(Aggregation Packet)に変換する。当該集合パケットは、前述した非特許文献に開示されているものである。
なお、集合パケットに変換される対象となる複数の統合対象NALユニットは、データサイズの合計値が最大パケット化サイズに最も近づくNALユニットが選択されるものとする。
図12は、一例としての集合パケットを示す図である。
集合パケットには、先頭8ビットに集合パケット識別子が記載される。集合パケット識別子には、F(ゼロ固定ビット)、NRI(Nal Ref Idc)(NAL参照インデックス)、type(NALユニットタイプ)が格納される。
集合パケットには、複数の統合対象NALユニットが格納される。複数の統合対象NALユニットの各々は、図6に示すように、NALユニットのデータサイズを示す部分と、NALユニットのデータ部分とから構成される。
したがって、複数の統合対象NALユニットは、図12に示されるように、集合パケットに格納される。なお、図12に示されるように、集合パケットにおける各行のデータが32ビット単位にならない場合はパディングが行われる。
また、RTPパケット変換処理Aでは、条件Bが満たされる場合、以下のパケット分割処理が行われる。
条件Bは、ステップS113の処理により得られた複数のNALユニットのうち、データサイズの合計値が、前述の最大パケット化サイズより大きいNALユニット(以下、分割対象NALユニットという)が存在するという条件である。
パケット分割処理では、分割部411Nが、分割対象NALユニットを分割することにより、RTPパケットとしての複数の分割ユニット(Fragmentation Unit)(以下、FUユニットという)を生成する。当該分割ユニットは、前述した非特許文献に開示されているものである。
図13は、一例としての分割ユニットを示す図である。
分割ユニットは、NALユニットのヘッダと同一のシンタックスをもつFU識別子を有する。FU識別子は、8ビットの識別情報である。また、FUヘッダにはNALユニットの開始や終端を示す情報が記載されている。DON(Decoding Order Number)には、ピクチャを復号する順番が記載されている。
また、分割ユニットには、FUペイロードの部分に、FUユニットのデータが格納される。なお、図13に示されるように、分割ユニットにおける各行のデータが32ビット単位にならない場合はパディングが行われる。
なお、ストリームデータをパケット分割する場合、前述した集合パケットまたは分割ユニットを用いず、単純にストリームデータをパケットサイズで分割してパケット化してもよいし、SEIなどの情報とスライス情報を分けて別のパケットに格納するように分割してもよい。
以上のように、RTPパケット変換処理Aにおいて、複数パケット統合処理およびパケット分割処理が行われることにより、RTPパケットとしての1以上の集合パケットと、RTPパケットとしての複数の分割ユニットとが生成される。これにより、f(3以上の整数)個のRTPパケット(集合パケットまたは分割ユニット)が生成されるとする。
そして、分割部411Nは、f個のRTPパケットの各々に含まれるスライスの位置情報(スライス位置情報)を、当該RTPパケットと対応付けておく。また、分割部411Nは、f個のRTPパケットの各々を、順次、通信量監視部412へ送信する。なお、分割部411Nは、RTPパケットを通信量監視部412へ送信する場合、当該RTPパケットとともに、データ種別情報、サイズ情報および前述したスライス位置情報を、通信量監視部412へ送信する。f個のRTPパケットの送信が終了すると、このRTPパケット変換処理Aは終了する。
ステップS115では、第1の実施の形態と同様に、図9のパケット対応処理が行われるので詳細な説明は繰り返さない。なお、初めて、パケット対応処理が行われる場合、第1の実施の形態と同様、パケット対応処理が開始されると同時に、時間測定処理が実行される。
図9のステップS222では、第1の実施の形態と同様にパケット選択処理が行われるので詳細な説明は繰り返さない。
なお、本実施の形態における、パケット選択処理において、パケット制御部413により選択された、削除対象となるRTPパケットが前述の分割ユニットであり、かつ、図10のパケット送信処理が行われた場合、分割ユニットとしてのRTPパケットが欠けたデータを、送信部416がネットワーク10へ送信することになる。
1つの分割ユニットは、1つのNALユニットが分割されることにより生成される複数の分割ユニットのうちの1つである。この場合、送信部416がネットワーク10へ送信するデータは、NALユニットの一部か欠けたデータとなる。その結果、ネットワーク10を介して、NALユニットの一部が欠けたデータを受信した装置は、一部のデータが欠けたNALユニットを全て破棄する可能性がある。
そこで、パケット制御部413が、分割ユニットとしてのRTPパケットを選択する場合、当該分割ユニットと同じNALユニットから生成された別の分割ユニットとしてのRTPパケットを優先的に選択してもよい。また、パケット選択処理において、パケット制御部413は、集合パケットとしてのRTPパケットを優先的に選択してもよい。
なお、パケット制御部413が、削除対象となるRTPパケットを選択するときに、集合パケットとしての複数のRTPパケットが存在する場合、集合パケットとしてのRTPパケットに含まれるNALユニットの数が少ないRTPパケットを優先的に選択してもよい。これは、削除するNALユニット数が少ないとIスライスにすべきスライス数が少なくなり、符号化部411は設定レートに近いレートで符号化しやすくなるためである。
以上説明したように、本実施の形態では、NALユニットのサイズに応じて、NALユニットを複数に分割する処理、または、複数のNALユニットを1つのRTPパケット内に格納する処理を行う。
本実施の形態により、サイズの小さいNALユニットが多く生成された場合、複数のNALユニットが格納される集合パケットとしてのRTPパケットが多く生成されるほど、RTPヘッダのオーバーヘッドをより多く低減することができる。そのため、複数のNALユニットが格納される集合パケットとしてのRTPパケットが多く生成されるほど、図9のステップS221の削除データ量算出処理により算出される削除データ量が小さくなる。
そのため、出力レートが設定レートより大きい場合、削除するRTPパケットの数を減らすことができる。すなわち、送信部416がネットワーク10に送信する、1フレームに対応するRTPパケットの数を減らすことができる。その結果、ネットワークの伝送効率を高めるが可能となる。
なお、本発明は、図8、図9、図10、図11のフローチャートに示される各ステップを、コンピュータに実行させるプログラムとしても実現することもできる。また、本発明は、当該プログラムを格納するコンピュータ読み取り可能な記録媒体、集積回路としても実現することができる。
今回開示された実施の形態は全ての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内での全ての変更が含まれることが意図される。
本願発明は、NGNや専用回線などのように予め利用できる通信帯域が判明しているネットワークにおいて、エンコーダが設定帯域以上のレートでデータを出力した場合でも、設定帯域以内の出力レートでパケットを送信するとともに、画質劣化を抑えることが可能である。そのため、本発明は、TV会議システム、映像配信システム、遠隔教育システム等に含まれる通信端末装置として利用できる。
本実施の形態に係る2拠点でのコミュニケーションサービスを実現するコミュニケーションシステムの構成を示す図である。 前述したコミュニケーション装置以外の機器も備えたコミュニケーションシステムの構成の一例を示す図である。 コミュニケーション装置の構成の一例を示す図である。 通信端末装置の内部構成を示したブロック図である。 符号化データから得られるフレームと、符号化データを構成する複数のスライスとの対応関係を示す図である。 NALユニットの格納形式を示す図である。 状態の異なる複数のフレームを示す図である。 フレーム対応処理のフローチャートである。 パケット対応処理のフローチャートである。 送信処理のフローチャートである。 フレーム対応処理Aのフローチャートである。 一例としての集合パケットを示す図である。 一例としての分割ユニットを示す図である。
符号の説明
10 ネットワーク
11,12 コミュニケーション装置
400 通信端末装置
410 取得部
411 符号化部
411N 分割部
412 通信量監視部
416 送信部
417 ネットワーク制御部
1000,1001 コミュニケーションシステム

Claims (9)

  1. 動画像を構成する複数のフレームを処理する通信端末装置であって、
    前記複数のフレームの各々を順次取得する取得部と、
    前記取得部によりフレームが取得される毎に、該フレームをスライス単位で符号化する処理であって、連続するフレームの相関を利用した符号化処理を行うことにより、該フレームに対応する符号化データを生成する符号化部と、
    前記符号化部により前記符号化データが生成される毎に、該符号化データを分割することにより複数のパケットを生成する分割部と、
    前記分割部により前記複数のパケットが生成される毎に、該複数のパケットを記憶するパケット蓄積部と、
    所定の単位時間経過毎に、該所定の単位時間において前記分割部により生成された複数のパケットに基づいてビットレートを算出し、かつ、算出したビットレートが所定のビットレートより大きいか否かを判定する監視部と、
    前記監視部により算出されたビットレートである算出ビットレートが前記所定のビットレートより大きいと判定された場合、該算出ビットレートを算出するために使用された複数のパケットの一部を選択するパケット制御部とを備え、
    前記パケット制御部は、前記パケット蓄積部に記憶されている複数のパケットのうち、選択したパケットを削除し、
    前記符号化部により生成される前記符号化データは、複数のスライスから構成され、
    前記通信端末装置は、さらに、
    前記パケット制御部により削除されたパケットに対応する符号化データの次の符号化データを前記符号化部が生成する場合、前記次の符号化データから得られるフレームにおいて、前記削除されたパケットに対応するスライスの位置と同じ位置のスライスを、他のフレームに依存しないイントラスライスとするように、前記符号化部を制御する指示部を備える、
    通信端末装置。
  2. 前記パケット制御部が選択する一部のパケットのデータ量は、該算出ビットレートと前記所定のビットレートとの差分の値の前記所定の単位時間あたりのデータ量以上である、
    請求項1に記載の通信端末装置。
  3. 前記通信端末装置は、さらに、
    前記パケット蓄積部に記憶されている複数のパケットの各々を、該パケットが前記パケット蓄積部に記憶された順で、順次、外部のネットワークへ、前記所定のビットレート以下のビットレートで送信する送信部を備える、
    請求項1または2に記載の通信端末装置。
  4. 前記分割部は、前記符号化データを複数の所定単位データに分割し、前記複数の所定単位データのうち、データ量が所定値より大きい所定単位データが存在する場合、該所定単位データを、データ量が前記所定値以下である複数のデータに分割し、前記複数のデータの各々をパケットに変換する、
    請求項1〜3のいずれかに記載の通信端末装置。
  5. 前記分割部は、前記符号化データを複数の所定単位データに分割し、前記複数の所定単位データのうち、データ量が所定値未満である複数の所定単位データが存在する場合、該データ量が所定値未満である複数の所定単位データを1つのパケットに変換する、
    請求項1〜4のいずれかに記載の通信端末装置。
  6. 前記所定単位データは、NAL(Network Abstraction Layer)ユニットである、
    請求項4または5に記載の通信端末装置。
  7. 前記分割部が生成する前記複数のパケットの各々は、1つのスライスを含む、
    請求項1〜3のいずれかに記載の通信端末装置。
  8. 動画像を構成する複数のフレームを処理し、メモリと、符号化部とを備える通信端末装置が行う通信量制御方法であって、
    前記複数のフレームの各々を順次取得する取得ステップと、
    前記符号化部が、前記取得ステップによりフレームが取得される毎に、該フレームをスライス単位で符号化する処理であって、連続するフレームの相関を利用した符号化処理を行うことにより、該フレームに対応する符号化データを生成する符号化ステップと、
    前記符号化ステップにより前記符号化データが生成される毎に、該符号化データを分割することにより複数のパケットを生成する分割ステップと、
    前記分割ステップにより前記複数のパケットが生成される毎に、該複数のパケットを前記メモリに記憶させる記憶ステップと、
    所定の単位時間経過毎に、該所定の単位時間において前記分割ステップにより生成された複数のパケットに基づいてビットレートを算出し、かつ、算出したビットレートが所定のビットレートより大きいか否かを判定する監視ステップと、
    前記監視ステップにより算出されたビットレートである算出ビットレートが前記所定のビットレートより大きいと判定された場合、該算出ビットレートを算出するために使用された複数のパケットの一部を選択するパケット制御ステップとを備え、
    前記符号化ステップにより生成される前記符号化データは、複数のスライスから構成され、
    前記通信量制御方法は、さらに、
    前記メモリに記憶されている複数のパケットのうち、前記パケット制御ステップにより選択されたパケットを削除する削除ステップと、
    前記パケット制御ステップにより削除されたパケットに対応する符号化データの次の符号化データを前記符号化部が生成する場合、前記次の符号化データから得られるフレームにおいて、前記削除されたパケットに対応するスライスの位置と同じ位置のスライスを、他のフレームに依存しないイントラスライスとするように、前記符号化部を制御する指示ステップとを備える、
    通信量制御方法。
  9. 動画像を構成する複数のフレームを処理する集積回路であって、
    前記複数のフレームの各々を順次取得する取得部と、
    前記取得部によりフレームが取得される毎に、該フレームをスライス単位で符号化する処理であって、連続するフレームの相関を利用した符号化処理を行うことにより、該フレームに対応する符号化データを生成する符号化部と、
    前記符号化部により前記符号化データが生成される毎に、該符号化データを分割することにより複数のパケットを生成する分割部と、
    前記分割部により前記複数のパケットが生成される毎に、該複数のパケットを記憶するパケット蓄積部と、
    所定の単位時間経過毎に、該所定の単位時間において前記分割部により生成された複数のパケットに基づいてビットレートを算出し、かつ、算出したビットレートが所定のビットレートより大きいか否かを判定する監視部と、
    前記監視部により算出されたビットレートである算出ビットレートが前記所定のビットレートより大きいと判定された場合、該算出ビットレートを算出するために使用された複数のパケットの一部を選択するパケット制御部とを備え、
    前記パケット制御部は、前記パケット蓄積部に記憶されている複数のパケットのうち、選択したパケットを削除し、
    前記符号化部により生成される前記符号化データは、複数のスライスから構成され、
    前記集積回路は、さらに、
    前記パケット制御部により削除されたパケットに対応する符号化データの次の符号化データを前記符号化部が生成する場合、前記次の符号化データから得られるフレームにおいて、前記削除されたパケットに対応するスライスの位置と同じ位置のスライスを、他のフレームに依存しないイントラスライスとするように、前記符号化部を制御する指示部を備える、
    集積回路。
JP2008311584A 2008-12-05 2008-12-05 通信端末装置、通信量制御方法および集積回路 Pending JP2010136220A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008311584A JP2010136220A (ja) 2008-12-05 2008-12-05 通信端末装置、通信量制御方法および集積回路

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008311584A JP2010136220A (ja) 2008-12-05 2008-12-05 通信端末装置、通信量制御方法および集積回路

Publications (1)

Publication Number Publication Date
JP2010136220A true JP2010136220A (ja) 2010-06-17

Family

ID=42347024

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008311584A Pending JP2010136220A (ja) 2008-12-05 2008-12-05 通信端末装置、通信量制御方法および集積回路

Country Status (1)

Country Link
JP (1) JP2010136220A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012153450A1 (ja) * 2011-05-11 2012-11-15 パナソニック株式会社 動画像送信装置および動画像送信方法
JPWO2013132541A1 (ja) * 2012-03-09 2015-07-30 ネクシオン株式会社 映像データ伝送システム
JP2018093497A (ja) * 2013-09-20 2018-06-14 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 送信方法、受信方法、送信装置及び受信装置
US10390076B2 (en) 2016-03-29 2019-08-20 Mitsubishi Electric Corporation Image receiving/reproducing device, image generating/transmitting device, display system, image receiving/reproducing method, image generating/transmitting method, and computer readable medium
US10674172B2 (en) 2016-04-19 2020-06-02 Mitsubishi Electric Corporation Image processing apparatus, image processing method, and computer-readable recording medium
JP2021090150A (ja) * 2019-12-04 2021-06-10 日本放送協会 パケット生成装置及びプログラム
JP2022003834A (ja) * 2013-09-20 2022-01-11 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 送信方法、受信方法、送信装置及び受信装置

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012153450A1 (ja) * 2011-05-11 2012-11-15 パナソニック株式会社 動画像送信装置および動画像送信方法
CN102972024A (zh) * 2011-05-11 2013-03-13 松下电器产业株式会社 动态图像发送装置以及动态图像发送方法
JPWO2013132541A1 (ja) * 2012-03-09 2015-07-30 ネクシオン株式会社 映像データ伝送システム
JP2022003834A (ja) * 2013-09-20 2022-01-11 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 送信方法、受信方法、送信装置及び受信装置
US10499113B2 (en) 2013-09-20 2019-12-03 Panasonic Intellectual Property Corporation Of America Transmission method, reception method, transmitting apparatus, and receiving apparatus
JP2021007258A (ja) * 2013-09-20 2021-01-21 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 送信方法、受信方法、送信装置及び受信装置
JP2018093497A (ja) * 2013-09-20 2018-06-14 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 送信方法、受信方法、送信装置及び受信装置
JP7238066B2 (ja) 2013-09-20 2023-03-13 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 送信方法、受信方法、送信装置及び受信装置
JP7472345B2 (ja) 2013-09-20 2024-04-22 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 送信方法、受信方法、送信装置及び受信装置
US12010395B2 (en) 2013-09-20 2024-06-11 Panasonic Intellectual Property Corporation Of America Transmission method, reception method, transmitting apparatus, and receiving apparatus
US10390076B2 (en) 2016-03-29 2019-08-20 Mitsubishi Electric Corporation Image receiving/reproducing device, image generating/transmitting device, display system, image receiving/reproducing method, image generating/transmitting method, and computer readable medium
US10674172B2 (en) 2016-04-19 2020-06-02 Mitsubishi Electric Corporation Image processing apparatus, image processing method, and computer-readable recording medium
JP2021090150A (ja) * 2019-12-04 2021-06-10 日本放送協会 パケット生成装置及びプログラム
JP7396881B2 (ja) 2019-12-04 2023-12-12 日本放送協会 パケット生成装置及びプログラム

Similar Documents

Publication Publication Date Title
US8988486B2 (en) Adaptive video communication channel
US9024997B2 (en) Virtual presence via mobile
US8364024B2 (en) Constructing video frames and synchronizing audio data in a media player from data received via a plurality of diverse protocol stack paths
US9509953B2 (en) Media detection and packet distribution in a multipoint conference
Li et al. Content-aware playout and packet scheduling for video streaming over wireless links
JP2010136220A (ja) 通信端末装置、通信量制御方法および集積回路
US20120300016A1 (en) Integrated media gateway processing and control to reduce latency for 2-way video conference applications
JP2007158410A (ja) 画像符号化装置、画像復号装置、および画像処理システム
US11290512B2 (en) Codec selection for end-to-end communication without intermediate transcoding
US9306987B2 (en) Content message for video conferencing
JP4331049B2 (ja) データ伝送装置およびデータ伝送方法
Adeyemi-Ejeye et al. Impact of packet loss on 4K UHD video for portable devices
KR100703421B1 (ko) 트랜스코딩을 이용한 동영상메일 통신장치 및 방법
JP2008079228A (ja) 動画像・音声再生携帯端末、及び、動画像・音声配信端末、及び、システム
JP4799191B2 (ja) 通信端末、通信システムおよび通信方法
KR100747664B1 (ko) 대역폭에 적응적인 멀티미디어 데이터 처리방법 및 이를적용한 호스트장치
US20120113150A1 (en) Multimedia communication apparatus and processing method for group media communication
JP5170278B2 (ja) 表示制御装置、表示制御方法、プログラム、および表示制御システム
Hidayat et al. Impact of Ad Hoc Network Parameters and Conditions on Video Conferencing Quality
JP7124483B2 (ja) 通信端末、データ送信方法、プログラム
JP2009055469A (ja) 送信端末
JP2022006536A (ja) 通信システム、通信装置、及び通信プログラム
Singh Rate-control for conversational H. 264 video communication in heterogeneous networks
Yeo Finding perceptually optimal operating points of a real time interactive video-conferencing system
Doshi Experimental Investigation of Audio and Video Quality in Multi-Video Streaming Environments