JP6279415B2 - 合成データ提供装置、合成データ提供方法及びプログラム - Google Patents
合成データ提供装置、合成データ提供方法及びプログラム Download PDFInfo
- Publication number
- JP6279415B2 JP6279415B2 JP2014121858A JP2014121858A JP6279415B2 JP 6279415 B2 JP6279415 B2 JP 6279415B2 JP 2014121858 A JP2014121858 A JP 2014121858A JP 2014121858 A JP2014121858 A JP 2014121858A JP 6279415 B2 JP6279415 B2 JP 6279415B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- user
- users
- buffer area
- providing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 60
- 239000000872 buffer Substances 0.000 claims description 154
- 239000002131 composite material Substances 0.000 claims description 52
- 230000002194 synthesizing effect Effects 0.000 claims description 38
- 230000006870 function Effects 0.000 claims description 16
- 230000015572 biosynthetic process Effects 0.000 description 51
- 238000003786 synthesis reaction Methods 0.000 description 51
- 230000008569 process Effects 0.000 description 49
- 238000004891 communication Methods 0.000 description 44
- 230000005540 biological transmission Effects 0.000 description 38
- 239000000203 mixture Substances 0.000 description 30
- 238000006243 chemical reaction Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 10
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000008929 regeneration Effects 0.000 description 3
- 238000011069 regeneration method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 229930091051 Arenine Natural products 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Landscapes
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Telephonic Communication Services (AREA)
Description
図1は、本発明の実施形態に係る配信システム1の全体構成を示す図である。図1に示すように、本実施形態に係る配信システム1は、中継装置20(合成データ提供装置の一例)と、中継装置20を介して対話を行う複数のユーザ(参加者)U−1〜N(Nは3以上の整数)がそれぞれ操作するユーザ端末10−1〜N,及びユーザU−1〜Nの対話の様子を、中継装置20を介して視聴するユーザ(視聴者)UGが操作するユーザ端末10−Gを含む。中継装置20、ユーザ端末10−1〜N、及びユーザ端末10GはネットワークNWに接続される。これにより、中継装置20、ユーザ端末10−1〜N、及びユーザ端末10Gとの間で相互にデータ通信が可能である。なお、本実施形態では、ユーザ端末10−1〜N、及びユーザ端末10Gはハードウェア構成を同一として説明することとし、ユーザ端末10−1〜N、及びユーザ端末10Gについて共通する内容についてはユーザ端末10と表記して説明することがある。
次に、図2乃至図10に示したユーザ端末10のディスプレイ18に表示される画面例に基づいて、配信システム11において実行される。ユーザ端末10−1〜Nが中継装置20を介して、複数ユーザの対話を配信(以下、コラボ配信とする)する処理の概要について説明する。なお、以下に説明する例においては、ユーザ端末10−1がコラボ配信を開始し、ユーザ端末10−2〜Nが、ユーザ端末10−1が開始したコラボ配信に参加することとする。そして、ユーザ端末10Gが、ユーザ端末10−1〜Nにより実行されるコラボ配信を視聴することとする。
図4に示されるように、配信データの再生画面G201には、カメラ画像表示領域A100とチャット表示領域A101、配信モード表示アイコンP101、チャット開始アイコンP103、参加アイコンP104が表示される。この段階では、カメラ表示領域A100には、中継装置20から受信しているユーザ端末10−1が単独で配信する配信データに基づいて、ユーザ端末10−1のカメラ画像が表示されている。また、参加アイコンP104は、ユーザ端末10−1が開始したデータ配信への参加を申請する操作を行うためのものであり、例えば配信モード表示アイコンP101の示す配信モードがコラボ配信である場合に表示されることとしてよい。そして、参加アイコンP104が選択されると、ユーザ端末10−2から中継装置20を介してユーザ端末10−1に対して参加が申請される。
次に、以上に説明したような処理を実現するために配信システム1に含まれるユーザ端末と中継装置20にそれぞれ備えられる機能について説明する。
まず、ユーザ端末10に備えられる機能について説明する。図11は、配信システム1で実現される機能のうち、ユーザ端末10について本発明に関連する機能を示す機能ブロック図である。図11に示すように、ユーザ端末10は、機能として入力変換部102、エンコード部104、パケット送信部106、パケット受信部108、デコード部110、及び出力変換部112を備える。
入力変換部102は、主に制御部11及び記憶部12によって実現されることとしてよい。入力変換部102は、カメラ15により撮影されたカメラ画像と、マイク16により集音された音声とを取得し、取得したカメラ画像と音声とを所定の形式のデジタルデータに変換する。例えば、入力変換部102は、取得したカメラ画像と音声がアナログ信号である場合にはデジタル信号に変換することとしてもよい。例えば、入力変換部102は、カメラ15からは所定の周期(例えば、1/30秒や1/60秒ごと等)で撮影されたカメラ画像を順次取得することとしてよい。また例えば、入力変換部102は、カメラ15から取得したカメラ画像に対して、所定の標本化、量子化、符号化の処理を施すことにより、所定の形式の画像データに変換することとしてよい。また、同様に入力変換部102は、マイク16から取得した音声に対して、所定の標本化、量子化、符号化の処理を施すことにより、所定の形式の音声データに変換することとしてよい。入力変換部102は、デジタルデータに変換したカメラ画像データと音声データとをエンコード部104に出力する。
エンコード部104は、主に制御部11及び記憶部12によって実現されることとしてよい。エンコード部104は、入力変換部102で変換されたカメラ画像データ(映像データ)と音声データとをそれぞれ所定の圧縮規格に基づいて圧縮する。そして、エンコード部104は、圧縮したカメラ画像データと音声データをパケット送信部106に出力する。
パケット送信部106は、主に制御部11、記憶部12及び通信部13によって実現されることとしてよい。パケット送信部106は、エンコード部104により圧縮されたカメラ画像データと、音声データをそれぞれ送信するパケットのサイズに応じて分割し、例えばTCP(Transmission Control Protocol)ヘッダ及びIP(Internet Protocol)ヘッダを付加してパケット化する。なお、カメラ画像データのパケットと、音声データのパケットにはそれぞれ時刻同期情報を含んでいることとし、時刻同期情報に基づいてカメラ画像データと音声データとが同期再生可能である。そして、パケット送信部106は、パケット化したカメラ画像データ、音声データ、及び制御情報を多重化した送信パケットを生成し、送信パケットを送信バッファ106Aに格納する。そして、パケット送信部106は、送信バッファ106Aに格納された送信パケットを中継装置20に対して順次送信する。
パケット受信部108は、主に制御部11、記憶部12及び通信部13によって実現されることとしてよい。パケット受信部108は、中継装置20からパケットを受信し、受信したパケット(受信パケット)を受信バッファ108Aに格納する。例えば受信パケットには、画像(合成画像)、合成音声及び制御情報のそれぞれのパケットが多重化されていることとしてよい。
デコード部110は、主に制御部11及び記憶部12によって実現されることとしてよい。デコード部110は、パケット受信部108の受信バッファに格納された受信パケットに多重化された画像データと、音声データのパケットを、それぞれの予め定められた基準(例えば予め規定された仕様)に沿ったTCPヘッダの情報に基づく順序で読み出して、読み出したパケットを展開する。そして、デコード部110は、展開した画像データと音声データを出力変換部112に出力する。
出力変換部112は、主に制御部11及び記憶部12によって実現されることとしてよい。出力変換部112は、デコード部110から入力された画像データと音声データをそれぞれデジタルデータから所定の形式の出力信号に変換する。例えば、出力信号は、デジタル信号であってもよいし、アナログ信号であってもよい。そして、出力変換部112は、画像データと音声データの時刻同期情報に基づいて、所定の形式の出力信号に変換した画像と音声とを同期させながら、それぞれディスプレイ18とスピーカ17に出力してデータ再生する。
次に、図12乃至図16に基づいて、中継装置20に備えられる機能について説明する。
パケット受信部200−i(iは1〜Nの任意の整数)は、主に制御部21、記憶部22及び通信部23によって実現されることとしてよい。パケット受信部200−iは、ユーザ端末10−iのパケット送信部106により送信されたパケットを受信する。パケット受信部200−iは、ユーザ端末10−iから受信したパケットを、パケット受信部200−iの受信バッファに格納することとしてよい。
デコード部210−i(iは1〜Nの任意の整数)は、主に制御部21及び記憶部22によって実現されることとしてよい。デコード部210−iは、パケット受信部200−iの受信バッファに格納されたパケットに多重化された画像データと、音声データのパケットを、それぞれの予め定められた基準(例えば予め規定された仕様)に沿ったTCPヘッダの情報に基づく順序で読み出して、読み出したパケットを展開する。そして、デコード部210−iは、展開した画像データと音声データ(例えば音声データは波形データとしてよい)を参加者用合成部220−1〜N及び視聴者用合成部220−Gに出力する。なお、デコード部210−iは、参加者用合成部220−1〜Nに出力する画像データについては画像サイズ(解像度)が、視聴者用合成部220−Gに出力する画像データよりも小さくなるように変換することとしてもよい。
参加者用合成部220−i(iは1〜Nの任意の整数)は、主に制御部21及び記憶部22によって実現されることとしてよい。参加者用合成部220−iは、ユーザ端末10−iに提供する合成画像と、合成音声を生成する。なお、ユーザ端末10−iに提供する合成画像は、ユーザ端末10−1〜Nのうち、ユーザ端末10−i以外のユーザ端末から受信したカメラ画像を合成(例えば1つの画像に連結)したものである。また、ユーザ端末10−iに提供する合成音声は、ユーザ端末10−1〜Nのうち、ユーザ端末10−i以外のユーザ端末から受信した音声を合成(例えば音声の波形を合成)したものである。以下、図13に基づいて、参加者用合成部220−iの構成の詳細について説明する。
視聴者用合成部220−Gは、主に制御部21及び記憶部22によって実現されることとしてよい。視聴者用合成部220−Gは、ユーザ端末10Gに提供する合成画像と、合成音声を生成する。なお、ユーザ端末10Gに提供する合成画像は、ユーザ端末10−1〜Nから受信したカメラ画像を合成したものである。また、ユーザ端末10Gに提供する合成音声は、ユーザ端末10−1〜Nから受信した音声を合成(例えば音声の波形を合成)したものである。以下、図16に基づいて、視聴者用合成部220−Gの構成の詳細について説明する。
エンコード部240−1〜N及びエンコード部240−Gは、主に制御部21及び記憶部22によって実現されることとしてよい。
パケット送信部250−1〜N及びパケット送信部250−Gは、主に制御部11、記憶部12及び通信部13によって実現されることとしてよい。
図18乃至図22は、配信システム1において実行される処理を示す図である。図18乃至図22においてユーザ端末10に関する処理は、ユーザ端末10の制御部11が記憶部12に記憶されたプログラムに基づいて実行し、中継装置20に関する処理は、中継装置20の制御部21が記憶部22に記憶されたプログラムに基づいて実行するものとしてよい。
図18は、配信システム1において実行されるコラボ配信開始処理の一例を示すシーケンス図である。図18に示す例では、ユーザ端末10−1が中継装置20と通信することによりコラボ配信を開始する際の処理について説明する。
図19は、配信システム1において実行されるコラボ配信への参加処理の一例を示すシーケンス図である。図19に示す例では、ユーザ端末10−2が、ユーザ端末10−1が開始したコラボ配信に参加する際の処理について説明する。
次に、中継装置20で実行される配信制御処理の一例について説明する。図20は、中継装置20において実行される配信制御処理の一例を示すフロー図である。図20に示す例では、ユーザ端末10−1に対して、コラボ配信に参加するユーザ端末10−2〜Nから受信したデータを合成する処理について説明する。
次に、中継装置20で実行される合成画像生成処理の一例について説明する。図21は、中継装置20において実行される合成画像処理の一例を示すフロー図である。図21に示す例では、ユーザ端末10−1に対して、コラボ配信に参加するユーザ端末10−2〜Nから受信した画像データを合成して合成画像を生成する処理について説明する。
次に、ユーザ端末10−1〜N、及びユーザ端末10Gで実行される再生制御処理の一例について説明する。図22は、ユーザ端末10−1〜N、及びユーザ端末10Gにおいて実行される再生制御処理の一例を示すフロー図である。図22に示す例では、ユーザ端末10−1が、中継装置20から受信したパケットに基づいてデータを再生する処理について説明する。
なお、本発明は以上に説明した実施の形態に限定されるものではない。
Claims (9)
- 対話に参加する複数のユーザのユーザ端末のそれぞれから、該それぞれのユーザの音声と画像の少なくとも一方を含むデータを符号化したパケットを順次受信する手段と、
前記受信したパケットに基づいて、前記複数のユーザの一のユーザごとに用いられる第1のバッファ領域に、前記複数のユーザのうち該一のユーザ以外のユーザのそれぞれのデータを順次記憶させる第1の記憶制御手段と、
前記受信したパケットに基づいて、前記対話に参加しないユーザについて用いられる前記第1のバッファ領域よりもサイズが大きい第2のバッファ領域に、前記複数のユーザのそれぞれのデータを順次記憶させる第2の記憶制御手段と、
前記対話に参加する複数のユーザのそれぞれに対して、該それぞれのユーザについて用いられる前記第1のバッファ領域に記憶されたデータを合成した合成データをそれぞれ提供する第1の提供手段と、
前記対話に参加しないユーザに対して、前記第2のバッファ領域に記憶されたデータを合成した合成データを提供する第2の提供手段と、
を含むことを特徴とする合成データ提供装置。 - 請求項1に記載の合成データ提供装置であって、
前記第1のバッファ領域は、第1の時間長のデータが記憶可能な記憶領域であり、
前記第2のバッファ領域は、前記第1の時間長よりも長い第2の時間長のデータが記憶可能な記憶領域である
ことを特徴とする合成データ提供装置。 - 請求項1又は2に記載の合成データ提供装置であって、
前記第1の提供手段は、前記第1のバッファ領域に記憶されるユーザのデータのうち同一の時間長の部分を合成した合成データを提供する
ことを特徴とする合成データ提供装置。 - 請求項3に記載の合成データ提供装置であって、
前記第1の提供手段は、前記第1のバッファ領域に記憶されるいずれのユーザのデータの時間長も0より大きい場合には、最小の時間長のユーザのデータに基づいて決定した部分を少なくとも合成した前記合成データを提供する
ことを特徴とする合成データ提供装置。 - 請求項3又は4に記載の合成データ提供装置であって、
前記第1の提供手段は、所定時間を待機した後に、前記第1のバッファ領域に記憶される少なくとも1つのユーザのデータの時間長が0である場合には、該時間長が0であるユーザのデータについての合成部分を空データとした前記合成データを提供する
ことを特徴とする合成データ提供装置。 - 請求項5に記載の合成データ提供装置であって、
前記パケットに符号化されるデータは、音声を含み、
ユーザごとの遅延時間を管理する遅延時間管理手段と、
前記第1のバッファ領域に記憶されるそれぞれのユーザの遅延時間に基づいて、該それぞれのユーザのデータに含まれる音声の無音部分を削除する手段と、を含み、
前記遅延時間管理手段は、前記無音部分を削除した場合に、該無音部分に相当する時間に基づいて前記遅延時間を更新する
ことを特徴とする合成データ提供装置。 - 請求項1乃至6のいずれかに記載の合成データ提供装置であって、
前記パケットに符号化されるデータは、画像を含み、
前記第1のバッファ領域に記憶される画像のデータサイズを、前記第2のバッファ領域に記憶される画像のデータサイズよりも小さくした
ことを特徴とする合成データ提供装置。 - 対話に参加する複数のユーザのユーザ端末のそれぞれから、該それぞれのユーザの音声と画像の少なくとも一方を含むデータを符号化したパケットを順次受信するステップと、
前記受信したパケットに基づいて、前記複数のユーザの一のユーザごとに用いられる第1のバッファ領域に、前記複数のユーザのうち該一のユーザ以外のユーザのそれぞれのデータを順次記憶させる第1の記憶制御ステップと、
前記受信したパケットに基づいて、前記対話に参加しないユーザについて用いられる前記第1のバッファ領域よりもサイズが大きい第2のバッファ領域に、前記複数のユーザのそれぞれのデータを順次記憶させる第2の記憶制御ステップと、
前記対話に参加する複数のユーザのそれぞれに対して、該それぞれのユーザについて用いられる前記第1のバッファ領域に記憶されたデータを合成した合成データをそれぞれ提供する第1の提供ステップと、
前記対話に参加しないユーザに対して、前記第2のバッファ領域に記憶されたデータを合成した合成データを提供する第2の提供ステップと、
を含むことを特徴とする合成データ提供方法。 - 対話に参加する複数のユーザのユーザ端末のそれぞれから、該それぞれのユーザの音声と画像の少なくとも一方を含むデータを符号化したパケットを順次受信する手段と、
前記受信したパケットに基づいて、前記複数のユーザの一のユーザごとに用いられる第1のバッファ領域に、前記複数のユーザのうち該一のユーザ以外のユーザのそれぞれのデータを順次記憶させる第1の記憶制御手段と、
前記受信したパケットに基づいて、前記対話に参加しないユーザについて用いられる前記第1のバッファ領域よりもサイズが大きい第2のバッファ領域に、前記複数のユーザのそれぞれのデータを順次記憶させる第2の記憶制御手段と、
前記対話に参加する複数のユーザのそれぞれに対して、該それぞれのユーザについて用いられる前記第1のバッファ領域に記憶されたデータを合成した合成データをそれぞれ提供する第1の提供手段と、
前記対話に参加しないユーザに対して、前記第2のバッファ領域に記憶されたデータを合成した合成データを提供する第2の提供手段
としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014121858A JP6279415B2 (ja) | 2014-06-12 | 2014-06-12 | 合成データ提供装置、合成データ提供方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014121858A JP6279415B2 (ja) | 2014-06-12 | 2014-06-12 | 合成データ提供装置、合成データ提供方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016001857A JP2016001857A (ja) | 2016-01-07 |
JP6279415B2 true JP6279415B2 (ja) | 2018-02-14 |
Family
ID=55077239
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014121858A Active JP6279415B2 (ja) | 2014-06-12 | 2014-06-12 | 合成データ提供装置、合成データ提供方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6279415B2 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005244898A (ja) * | 2004-02-27 | 2005-09-08 | Fujitsu Ltd | ビデオ符号化データ合成装置 |
WO2006116659A2 (en) * | 2005-04-28 | 2006-11-02 | Apple Computer, Inc. | Video processing in a multi-participant video conference |
JP4422734B2 (ja) * | 2007-02-23 | 2010-02-24 | 富士通株式会社 | サーバ |
-
2014
- 2014-06-12 JP JP2014121858A patent/JP6279415B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016001857A (ja) | 2016-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2016001446A (ja) | 変換画像提供装置、変換画像提供方法及びプログラム | |
US11974006B2 (en) | Live and recorded content watch parties | |
US10335691B2 (en) | System and method for managing audio and video channels for video game players and spectators | |
CN101502111B (zh) | 同步化媒体体验 | |
US10987597B2 (en) | System and method for managing audio and video channels for video game players and spectators | |
JP6174501B2 (ja) | 映像会議サーバ、映像会議システム、および、映像会議方法 | |
CN110910860B (zh) | 线上ktv实现方法、装置、电子设备及存储介质 | |
US20060008117A1 (en) | Information source selection system and method | |
JP2005318535A (ja) | 帯域幅制御をして会議を開催する方法及び装置 | |
CN115053518A (zh) | 用于在网络会议会话内同步共享视频内容的延迟补偿 | |
WO2006073565A2 (en) | Data mixer for portable communications devices | |
WO2014186662A1 (en) | Method and system for displaying speech to text converted audio with streaming video content data | |
WO2012021174A2 (en) | EXPERIENCE OR "SENTIO" CODECS, AND METHODS AND SYSTEMS FOR IMPROVING QoE AND ENCODING BASED ON QoE EXPERIENCES | |
CN113077799A (zh) | 具有两个音频链路的解码器装备 | |
EP1722566A1 (en) | Information distributing system and method, information distributing apparatus therefor, receiver terminal, and information relaying apparatus | |
WO2021235048A1 (ja) | 無観客ライブ配信方法及びシステム | |
Rudkin et al. | Real-time applications on the Internet | |
EP2695389B1 (en) | Processing media streams for synchronised output at multiple end points | |
JP6279415B2 (ja) | 合成データ提供装置、合成データ提供方法及びプログラム | |
JP6610076B2 (ja) | 情報処理装置、情報処理システム、プログラム、及び記録媒体 | |
JP2022016424A (ja) | ストリーミング配信及びテレビ会議のためのシステム | |
JP3241225U (ja) | 無観客ライブ配信システム | |
JP2017092802A (ja) | 会議通話システム及びそれに用いられるバックエンドシステム | |
Dutta et al. | A group synchronization algorithm for VoIP conferencing | |
Radenkovic et al. | A scaleable audio service to support many simultaneous speakers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170322 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171228 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180109 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180117 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6279415 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |