JP6825703B2 - 送信装置、通信システム、通信方法、及びプログラム - Google Patents

送信装置、通信システム、通信方法、及びプログラム Download PDF

Info

Publication number
JP6825703B2
JP6825703B2 JP2019525486A JP2019525486A JP6825703B2 JP 6825703 B2 JP6825703 B2 JP 6825703B2 JP 2019525486 A JP2019525486 A JP 2019525486A JP 2019525486 A JP2019525486 A JP 2019525486A JP 6825703 B2 JP6825703 B2 JP 6825703B2
Authority
JP
Japan
Prior art keywords
throughput
pattern
division
video data
bit rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019525486A
Other languages
English (en)
Other versions
JPWO2018235697A1 (ja
Inventor
夏季 甲斐
夏季 甲斐
裕志 吉田
裕志 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2018235697A1 publication Critical patent/JPWO2018235697A1/ja
Application granted granted Critical
Publication of JP6825703B2 publication Critical patent/JP6825703B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • H04N17/02Diagnosis, testing or measuring for television systems or their details for colour television signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/156Availability of hardware or computational resources, e.g. encoding based on power-saving criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Information Transfer Between Computers (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Description

本発明は、送信装置、通信システム、通信方法、及び記録媒体に関し、例えば、ネットワークを介して、圧縮した映像データを送信する送信装置に関する。
LTE(Long Term Evolution)やWi−Fi(登録商標)などのベストエフォート型ネットワークを介した通信のスループットは、大きく変動しうる。そのため、通信のスループットの変動に応じて、映像データを圧縮するための符号化パラメータを動的に変更する技術が必要とされている。
符号化パラメータには、例えば、ビットレート、フレームレート、およびGOP(Group of picture)サイズ(あるいはキーフレーム間隔)が含まれる。コーデックをリセットすることによって、符号化パラメータを変更することができる。GOPサイズが小さいほど、ビットレートをより高い粒度で制御することができる。
特許文献1に記載の音声合成装置(送信装置)は、ロス率(パケットの損失率)が小さい場合、すなわちスループットが高い場合、映像データのGOPサイズを大きくすることによって、映像の画質の向上を図る。一方、ロス率が大きい場合、すなわちスループットが低い場合、映像データのGOPサイズを小さくする。これにより、特許文献1に記載の音声合成装置は、ビットレートを高い粒度で制御可能である。
特開2005−151600号公報
「TCPスループットの確率的拡散予測に基づく映像配信制御(Video Streaming Control by Predicting Stochastic Diffusion of TCP Throughput)」 吉田裕志ら インターネットコンファレンス2011(IC2011) (2011年10月27日) Constructing Stochastic Model of TCP Throughput on Basis of Stationarity Analysis, Hiroshi Yoshida et al. Global Communications Conference (GLOBECOM), 2013 IEEE, date of conference: 9-13 Dec. 2013
しかしながら、特許文献1に記載の音声合成装置(送信装置)による通信方法では、GOPサイズとビットレートの組み合わせがQoE(Quality of Experience)に与える影響を考慮していない。そのため、GOPサイズとビットレートとの組み合わせによって、QoEが著しく低下する可能性がある。
例えば、特許文献1に記載の送信装置が、ビットレートを高い粒度で制御するために、GOPサイズを小さくした場合、符号量の制御が破綻して、ブロックに歪み(ブロックノイズ)が生じる可能性がある。ブロックノイズは、QoEに大きく影響する。
本発明の目的は、ネットワークを介して伝送される映像の体感品質を向上させることにある。
本発明の一様態に係わる送信装置は、上記課題を解決するために、受信装置との間の通信のスループットを計測するスループット計測手段と、前記スループット計測手段が計測した前記スループットに基づいて、未来のスループットを予測するスループット予測手段と、所定時間を分割することによって、複数の分割時間でそれぞれ構成される複数のパターンを生成するパターン生成手段と、前記パターン生成手段が生成した前記パターンに応じた前記分割時間ごとに、前記スループット予測手段が予測した前記未来のスループットの下限値を超えないような最大ビットレートで前記受信端末へ映像データを送信した場合に、該映像データから再生される映像の体感品質を算出する体感品質算出手段と、前記パターン生成手段が生成した前記複数のパターンのうち、前記体感品質算出手段が算出した前記映像の体感品質が最大になる1つのパターンを選択するパターン選択手段と、前記パターン選択手段が選択した前記1つのパターンに応じた前記分割時間ごとに、前記映像データの圧縮処理のための符号化パラメータを決定するパラメータ決定手段と、を有する。
本発明の一様態に係わる通信方法は、上記課題を解決するために、受信装置との間の通信のスループットを計測し、計測した前記スループットに基づいて、未来のスループットを予測し、所定時間を分割することによって、複数の分割時間でそれぞれ構成される複数のパターンを生成し、生成した前記パターンに応じた前記分割時間ごとに、前記未来のスループットの下限値を超えないような最大ビットレートで前記受信装置へ映像データを送信した場合に、該映像データから再生される映像の体感品質を算出し、前記複数のパターンのうち、前記映像の体感品質が最大になる1つのパターンを選択し、 選択した前記1つのパターンに応じた前記分割時間ごとに、前記映像データの圧縮処理のための符号化パラメータを決定する。
本発明の一様態に係わる記録媒体は、上記課題を解決するために、受信装置との間の通信のスループットを計測することと、計測した前記スループットに基づいて、未来のスループットを予測することと、所定時間を分割することによって、複数の分割時間でそれぞれ構成される複数のパターンを生成することと、生成した前記パターンに応じた前記分割時間ごとに、前記未来のスループットの下限値を超えないような最大ビットレートで前記受信装置へ映像データを送信した場合に、該映像データから再生される映像の体感品質を算出することと、前記複数のパターンのうち、前記映像の体感品質が最大になる1つのパターンを選択することと、選択した前記1つのパターンに応じた前記分割時間ごとに、前記映像データの圧縮処理のための符号化パラメータを決定することと、をコンピュータに実行させるためのプログラムを格納している。
本発明の目的は、ネットワークを介して伝送される映像の体感品質を向上させる送信装置を提供することにある。
実施形態1に係わる通信システムのブロック図であり、通信システムを構成する送信端末および受信端末の各構成を示す図である。 所定時間を構成する複数の分割時間の例を示す図である。 実施形態1に係わる送信端末が実行するQoE(Quality of Experience)算出処理の流れを示すフローチャートである。 実施形態1に係わる送信端末と受信端末との間の通信のスループットの例、および、予測される未来のスループットの例を示す図である。 未来のスループットの予測値に応じて決定される、分割時間ごとの符号化パラメータの例を示す図である。 未来のスループットの予測値に応じて決定される、分割時間ごとの符号化パラメータの他の例を示す図である。 実施形態1に係わる通信システムの送信端末と受信端末との間の通信の流れを示すシーケンス図である。 実施形態2に係わる送信端末のブロック図である。 実施形態3に係わる送信端末のハードウェア構成を示す図である。
本発明の実施の形態について、図面を参照して詳細に説明する。
〔実施形態1〕
(通信システム)
図1は、本実施形態1に係わる通信システムのブロック図である。図1に示すように、通信システムは、送信端末1および受信端末2を備えている。送信端末1および受信端末2は、それぞれ、パーソナルコンピュータまたはスマートフォンなどの端末装置である。送信端末1および受信端末2は、ネットワークを介して通信する。本実施形態1に係わる通信システムのネットワークは、インターネットやモバイルネットワークなどであり、ヘテロジニアス(Heterogeneous)な構造を有する。
(送信端末1)
図1に示すように、送信端末1は、エンコーダ101と、送信部102と、データ受信部103と、スループット計測部104と、分割パターン生成部105と、QoE算出部106と、パラメータ決定部107とを備えている。
エンコーダ101は、映像を圧縮符号化して、映像データを出力する。送信部102は、エンコーダ101によって圧縮符号化された映像データを受信端末2に送信する。データ受信部103は、通信のスループットを計測するためのデータを受信端末2から受信する。スループット計測部104は、データ受信部103が受信したデータに基づいて、スループットを計測する。
分割パターン生成部105は、所定時間を分割することによって、複数の分割時間でそれぞれ構成される複数のパターン(後述)を生成する。
QoE算出部106は、スループット計測部104が計測したスループットに基づいて、未来のスループットを予測する。加えて、QoE算出部106は、分割パターン生成部105が生成したパターンごとに、QoE、すなわち映像を視聴するユーザの体感品質を算出する。
パラメータ決定部107は、分割パターン生成部105が生成した複数のパターンの中から、QoE算出部106が算出したQoEが最大となる1つのパターンを選択し、選択した1つのパターンに基づいて、映像の符号化パラメータを決定する。
分割パターン生成部105、QoE算出部106、およびパラメータ決定部107がそれぞれ実行する処理の詳細を後で順番に説明する。
(受信端末2)
図1に示すように、受信端末2は、受信部201と、データ送信部202とを備えている。受信部201は、送信端末1の送信部102から送信された映像データを受信する。
データ送信部202は、受信部201から、スループットを算出するために必要なデータを取得あるいは生成して、取得あるいは生成したデータを送信端末1に送信する。
(分割パターン生成部105)
送信端末1の分割パターン生成部105の動作を説明する。分割パターン生成部105は、時刻0から所定の時刻T(>0)までの所定時間Tを、最大分割数m(mは自然数)以下で分割する。所定時間Tおよび最大分割数mは、任意の値であってよい。あるいは、所定時間Tおよび最大分割数mは、ユーザが予め設定することが可能であってもよい。
図2は、最大分割数m=3である場合に、所定時間T=t3から生成される複数のパターンの例を示す。図2に示すように、この場合、分割パターン生成部105は、4通りのパターン、すなわち、{0,t1,t2,t3}、{0,t2,t3}、{0,t1,t3}、または{0,t3}を生成する。ここで、0<t1<t2<t3=Tである。一般的に、最大分割数がmである場合、パターンの総数は2^(m−1)である。
所定時間Tのパターンを、以下では、集合R_j(ただし0<=j<2^(m−1))と呼ぶ。また、集合R_jの集合を、集合Rと呼ぶ。各集合R_jの要素は、分割時刻T_i(i=0、1、2、・・・)である。集合R_jごとに、要素すなわち分割時刻T_iの数は異なる。
図2に示すように、最大分割数m=3である場合、集合Rは、分割時刻T_i(0<=i<=3)を用いて、R={R_0={T_0,T_1,T_2,T_3},R_1={T_0,T_1,T_2},R_2={T_0,T_1,T_2},R_3={T_0,T_1}}と表わされる。
ここで、集合Rの異なる集合R_jの対応する要素同士は、必ずしも同一ではない。例えば、図2を参照すれば、集合R_1の要素T_1はt2であるが、集合R_2の要素T_1はt1である。また、互いに隣接する要素間の(時間軸上における)“距離”は、必ずしも一定ではない。
例えば、図2を参照すれば、集合R_0では、要素間の“距離”は一定(ただし、t1=t2−t1=t3−t2である場合)である。一方、集合R_2では、要素間の“距離”は一定ではない。以下では、集合R_jの要素T_iと要素T_{i−1}との間の“距離”を、分割時間(T_i−T_{i−1})と呼ぶ。
(QoE算出部106)
QoE算出部106は、分割時間(T_i−T_{i−1})ごとに、QoEすなわち体感品質を算出する。通常、QoEは、1から5までの実数で表される。QoEが低いほど、体感品質が低い。一方、QoEが高いほど、体感品質が高い。
QoEの算出関数は、オーディオビジュアルメディアのストリーミング品質に関する規格(例えばInternational Telecommunication Union/ITU Telecommunication Sectorが作成したITU−T P.1201)にしたがう。本実施形態1では、QoEの算出関数を、Q(b,g)と表す。ここで、bはビットレートであり、gはGOPサイズである。すなわち、Q(b,g)は、ビットレートおよびGOPサイズに依存する。
本実施形態では、QoE算出部106は、通信スループット予測法を用いて、未来のスループットを表す関数x(t)(tは時刻)を算出する。通信スループット予測法とは、過去のスループットに関する情報を、時系列に沿って解析することによって、未来のスループットを表す確率密度関数の期待値および分散を得る方法である。通信スループット予測法に関する技術は、例えば、非特許文献1または非特許文献2に記載されている。本実施形態では、通信スループット予測法に関する技術の説明を省略する。
また、QoE算出部106は、未来のスループットから、最大ビットレートを決定する。最大ビットレートとは、関数x(t)で表される未来のスループットの下限値を超えないビットレートの最大値である。したがって、最大ビットレートは、未来のスループットの下限値と一致する。
あるいは、QoE算出部106は、通信スループット予測法を用いずに、未来のスループットの下限値を算出してもよい。例えば、QoE算出部106は、スループットの計測値に基づいて、未来のスループットを予測することができる。この場合、QoE算出部106は、分割時間(T_i−T_{i−1})における最大ビットレートb_iを、以下の計算式にしたがって算出してもよい。
b_i=a^i×x_0
ここで、aは、ユーザが予め設定した感度係数である。また、x_0は、現在時刻T_0=0におけるスループットの計測値である。一般的に、最大ビットレートは、時間が経過するとともに低下する。
送信端末1から受信端末2へ伝送される映像データのビットレートが未来のスループットの下限値を超えない限り、受信端末2側で映像データの再生が途絶する可能性は十分に低い。
(QoEの算出方法)
図3を参照して、本実施形態1に係わるQoE算出部106が、QoEを算出する方法の流れを説明する。図3は、QoE算出部106の動作を示すフローチャートである。
図3に示すように、QoE算出部106は、まず、分割パターン生成部105から、集合Rを受け取る。そして、QoE算出部106は、集合Rから、一つの集合R_jを取り出す(S1)。最初、j=0である。
j<|R|の場合(S2でNO)、QoE算出部106は、R_jの要素(分割時刻)T_iを取り出し、iを初期化(すなわちi=0)する(S3)。ここで、|R|は、集合Rの要素数を表す。j=|R|の場合(S2でYES)、QoE算出部106の動作は終了する。
i<|R_j|の場合(S4でNO)、QoE算出部106は、予め算出したスループットの予測値を表す関数x(t)(tは時刻)に基づいて、分割時間(T_i−T_{i−1})における最大ビットレートb_iを算出する。ここで、|R_j|は、集合R_jの要素数を表す。
QoE算出部106は、以下の計算式にしたがって、分割時間(T_i−T_{i−1})におけるGOPサイズg_iを算出する(S5)。
g_i=f×(T_i−T_{i−1})
ここで、fはフレームレートである。本実施形態1では、フレームレートは一定であるので、fは定数である。
次に、QoE算出部106は、集合R_jの各分割時間におけるQoEを算出する(S6)。以下では、集合R_jの分割時間(T_i−T_{i−1})におけるQoEを、Q_j_iと表す。Q_j_iは、以下のように表される。
Q_j_i=Q(b_i,g_i)=Q(b_i,f×(T_i−T_{i−1}))
なお、前述したように、集合R_jによって、T_iが表わす時刻は異なる。したがって、集合R_jによって、Q_j_iは異なる値を取ることを注意する。
S6の後、iに1が加算されて(S7)、S4に戻る。i=|R_j|の場合(S4でYES)、jに1が加算されて(S8)、S2に戻る。
本実施形態1の構成によれば、スループットの予測値に基づいて、最大ビットレートおよびGOPサイズを最適に制御するので、QoEが低下することを抑制することができる。
(パラメータ決定部107)
パラメータ決定部107は、分割パターン生成部105が生成した集合Rを受け取るとともに、QoE算出部106が算出したQoE、すなわちQ_j_iを受け取る。
パラメータ決定部107は、集合Rの全ての集合R_j(0<=j<|R|)の中から、以下の計算式(1)にしたがって、いずれか1つの集合R_jを選択する。
Figure 0006825703
式(1)によれば、パラメータ決定部107は、集合R_jの分割時間(T_i−T_{i−1})ごとのQ_j_iを該分割時間(T_i−T_{i−1})で重みづけした値の総和が最大になる集合R_jを選択する。
パラメータ決定部107は、選択した集合R_jの各分割時間(T_i−T_{i−1})における最大ビットレートb_iおよびGOPサイズg_iを、映像データの圧縮符号化のための符号化パラメータとして決定する。
(エンコーダ101)
エンコーダ101は、パラメータ決定部107から、最大ビットレートおよびGOPサイズの情報を受け取る。そして、エンコーダ101は、コーデックをリセットして、受け取った最大ビットレートおよびGOPサイズの情報に基づいて、符号化パラメータを更新する。
(符号化パラメータを決定する方法)
図4および図5を参照して、本実施形態1に係わる送信端末1が符号化パラメータを決定する方法の流れを説明する。図4および図5は、スループットの時間変化の一例を示すグラフである。グラフの横軸tは時刻を表し、グラフの縦軸bはスループットを表す。図4において、実線のグラフは、スループットの計測値を示している。また、3つの破線のグラフは、いずれも、スループットの予測値を示している。
図4において、3つの破線のグラフは、それぞれ、スループットの“期待値”(図4ではy(t))、“期待値+(プラス)分散”(図4ではz(t))、および“期待値−(マイナス)分散”(図4ではx(t))に対応している。これらの破線のグラフのうち、“期待値−分散” x(t)は、予測されるスループットの下限値を表す。
最大ビットレートがスループットの下限値を上回った場合、受信端末2側において、映像の再生が途絶する可能性がある。したがって、最大ビットレートは、スループットの下限値を超えないように制限される。
所定時間T=2[sec]であり、最大分割数m=2であるとする。図5では、T_0=0[sec]〜T_2=2[sec]における最大ビットレートb_0〜b_2は、それぞれ、b_0=2[Mbps]、b_1=1.7[Mbps]、b_2=1.3[Mbps]である。
この場合、分割パターン生成部105は、2つのパターンR_0={T_0,T_1,T_2}およびR_1={T_0,T_2}}を生成する。図5では、T_0=0、T_1=1、T_2=2である。
QoE算出部106は、集合R_0の各分割時間についてのQoE、すなわちQ_0_0=Q(b_1,f×T_1)およびQ_0_1=Q(b_2,f×(T_2−T_1))を算出する。また、集合R_1についてのQoE、すなわちQ_1_0=Q(b_2,f×T_2)を算出する。ここで、フレームレートfは定数である。
その後、パラメータ決定部107は、下記計算式(2)に基づいて、分割時間(T_i−T_{i−1})で重み付けしたQ_j_i(0<=i<|R_j|,0<=j<|R|)の総和を算出する。
Figure 0006825703
R_0の場合、式(2)で表される総和は、Q_0_0+Q_0_1である。また、R_1の場合、総和は、2×Q_1_0である。総和が大きいほど、所定時間TにおけるQoEは大きいと言える。
例えば、Q_0_0=3.5、Q_0_1=3.2、Q_1_0=3.3であるとする。この場合、R_0についての総和は、Q_0_0+Q_0_1=3.5+3.2=6.7である。また、R_1についての総和は、2×Q_1_0=2×3.3=6.6である。
したがって、R_0についての総和のほうが、R_1についての総和よりも大きい。そのため、パラメータ決定部107は、集合R_0を選択する。
また、パラメータ決定部107は、選択した集合R_0の分割時間(T_1−T_0)における最大ビットレートb_1=1.7[Mbps]、および、分割時間(T_2−T_1)における最大ビットレートb_2=1.3[Mbps]を、エンコーダ101に通知する。
また、パラメータ決定部107は、符号化パラメータとして、分割時間(T_1−T_0)におけるGOPサイズg=f×(T_1−T_0)、および、分割時間(T_2−T_1)におけるGOPサイズg=f×(T_2−T_1)も、エンコーダ101に通知する。
他の例では、Q_0_0=3.83、Q_0_1=3.72、Q_1_0=3.81であるとする。この場合、R_0についての総和(式(2)参照)は、Q_0_0+Q_0_1=3.83+3.72=7.55である。一方、R_1についての総和は、2×Q_1_0=7.62である。
したがって、R_1についての総和のほうが、R_0についての総和よりも大きい。そのため、パラメータ決定部107は、集合R_1を選択する。また、パラメータ決定部107は、集合R_1の分割時間(T_2−T_0)における最大ビットレートb_2=1.3[Mbps]を、エンコーダ101に通知する。
また、パラメータ決定部107は、符号化パラメータとして、分割時間(T_2−T_0)におけるGOPサイズg=f×(T_2−T_0)も、エンコーダ101に通知する。
一般的に、スループットの計測値の揺らぎが大きい(小さい)ほど、未来のスループットの予測値の分散も大きく(小さく)なる。図6は、スループットの時間変化の他の一例を示すグラフである。図6に示すグラフは、図5に示すグラフと比較して、スループットの計測値の揺らぎが小さい。その結果、スループットの予測値の分散が小さい。図6に示すグラフx´(t)、すなわち予測されるスループットの下限値は、図5に示すグラフx(t)と比較して、緩やかに減少している。実際、図5に示すグラフx(t)では、x(t=1)=1.7、x(t=2)=1.3である一方、図6に示すグラフx´(t)では、x´(t=1)=1.8、x´(t=2)=1.7である。
本実施形態1の構成によれば、ユーザの体感品質(QoE)を最大化するように、GOPサイズおよびビットレートの最適な組み合わせを選択することができる。なぜならば、所定時間を分割する複数のパターンについて、それぞれQoEを算出して、QoEが最大になるパターンを選択するからである。また、本実施形態1の構成によれば、スループットの変動が大きい場合であっても、QoEが低下することを抑制することができる。なぜならば、最大ビットレートは、予測されるスループットの下限値を超えないので、映像の再生が途絶する可能性が低いからである。
(通信方法)
図7を参照して、本実施形態1に係わる通信システムによる通信方法を説明する。図7は、通信システムを構成する送信端末1と受信端末2とが通信を行う際の送信端末1および受信端末2の各動作の流れを示すシーケンス図である。
図7に示すように、受信端末2のデータ送信部202が、スループットに関するデータ、言い換えれば、スループットを算出するために必要なデータを、送信端末1へ送信する(S201)。
例えば、データ送信部202は、受信端末2の受信部201が単位時間に受信する映像データの量の情報、および、ロス率の情報を、スループットに関するデータとして、送信端末1へ送信する。
送信端末1のデータ受信部103は、受信端末2から、スループットに関するデータを受信する。スループット計測部104は、データ受信部103が受信したデータを用いて、送信端末1と受信端末2との間の通信のスループットを計測する(S101)。
次に、送信端末1のQoE算出部106は、スループット計測部104が計測したスループットに基づいて、未来のスループットを予測する(S102)。
また、送信端末1の分割パターン生成部105は、所定時間(例えば、図2では0からt3まで)を分割することによって、複数の分割時間で構成されるパターンを生成する(S103)。
次に、QoE算出部106は、分割パターン生成部105が生成したパターンに応じた分割時間ごとに、先に予測した未来のスループットの下限値を超えないような最大ビットレートで受信端末2へ映像データを送信した場合に、該映像データから再生される映像の体感品質を算出する(S104)。なお、S104の詳細については、先に、図3に基づいて説明した。
その後、パラメータ決定部107は、分割パターン生成部105が生成した複数のパターンのうち、QoE算出部106が算出する体感品質が最大になるような1つのパターンを選択する(S105)。
続いて、送信端末1のパラメータ決定部107は、選択した1つのパターンに応じた分割時間ごとに、符号化パラメータを決定する(S106)。
例えば、図4に示す例において、パラメータ決定部107は、前記1つのパターンとして集合R_0={T_0,T_1,T_2}を選択した場合、分割時間(T_1−T_0)における符号化パラメータ(ビットレートb_1およびGOPサイズg=f×T_1)、および、分割時間(T_2−T_1)における符号化パラメータ(ビットレートb_2およびGOPサイズg=f×T_2)をそれぞれ決定する。
送信端末1のエンコーダ101は、パラメータ決定部107が決定した符号化パラメータを用いて、映像データを圧縮符号化する(S107)。
送信端末1の送信部102は、エンコーダ101が圧縮符号化した映像データを、受信端末2へ送信する(S108)。
受信端末2の受信部201は、送信端末1から、圧縮符号化された映像データを受信する(S202)。その後、フローはS201へ戻る。
〔実施形態2〕
本実施形態2として、本発明の最小構成について説明する。
図8は、本実施形態2に係わる送信端末3の構成を示す概略構成図である。図8に示すように、本実施形態2に係わる送信端末3は、スループット計測部301と、スループット予測部302と、パターン生成部303と、体感品質算出部304と、パターン選択部305と、パラメータ決定部306とを備える。
本実施形態2のスループット計測部301は、例えば、前記実施形態1のスループット計測部104と対応する。本実施形態2のスループット予測部302および体感品質算出部304は、例えば、前記実施形態1のQoE算出部106に対応する。
また、本実施形態2のパターン生成部303は、例えば、前記実施形態1の分割パターン生成部105と対応する。本実施形態2のパターン選択部305およびパラメータ決定部306は、例えば、前記実施形態1のパラメータ決定部107と対応する。
なお、本実施形態2に係わる送信端末3は、前記実施形態1の送信端末1が備えたエンコーダ101および送信部102と対応する構成要素を更に備えていてもよい。
スループット計測部301は、受信端末(図示せず)との間の通信のスループットを計測する。スループット予測部302は、スループット計測部301が計測したスループットに基づいて、未来のスループットを予測する。
パターン生成部303は、所定時間を分割することによって、複数の分割時間でそれぞれ構成される複数のパターンを生成する。
体感品質算出部304は、パターン生成部303が生成したパターンに応じた分割時間ごとに、スループット予測部302が予測した未来のスループットの下限値を超えないような最大ビットレートで受信端末へ映像データを送信した場合に、該映像データから再生される映像の体感品質を算出する。
パターン選択部305は、パターン生成部303が生成した複数のパターンのうち、体感品質算出部304が算出した映像の体感品質が最大になる1つのパターンを選択する。
パラメータ決定部306は、パターン選択部305が選択した1つのパターンに応じた分割時間ごとに、映像データの圧縮処理のための符号化パラメータを決定する。
本実施形態2の構成によれば、所定時間をどのように分割するかを規定する複数のパターンの中から、映像の体感品質が最大になる1つのパターンを特定し、特定したパターンに基づいて、符号化パラメータを決定する。したがって、ネットワークを介した映像伝送において、映像の体感品質を向上させることができる。
〔実施形態3〕
図9は、本実施形態3に係わる送信端末4のハードウェア構成を示すブロック図である。図9に示すように、本実施形態3に係わる送信端末は、CPU(Central Processing Unit)401、エンコーダ402、およびインターフェース403を備えている。本実施形態に係わる送信端末4は、例えば、前記実施形態1に係わる送信端末1、または、前記実施形態2に係わる送信端末3に対応する。
CPU401は、本実施形態に係わる送信端末4の制御機能を実現する。エンコーダ402は、例えば、前記実施形態1のエンコーダ101に対応する。インターフェース403は、例えば、前記実施形態1の送信部102およびデータ受信部103に対応する。
本実施形態に係わる送信端末4は、前記実施形態1に係わる送信端末1の制御機能(図1に示す、スループット計測部104、分割パターン生成部105、QoE算出部106、パラメータ決定部107、およびエンコーダ101)の全部または一部を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをCPU401に読み込ませ、実行することにより各部の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
あるいは、本実施形態に係わる送信端末4は、前記実施形態2に係わる送信端末3の制御機能(図8に示す、スループット計測部301、スループット予測部302、パターン生成部303、体感品質算出部304、パターン選択部305、およびパラメータ決定部306)の全部または一部を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをCPU401に読み込ませ、実行することにより各部の処理を行ってもよい。
ここで、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM(Read Only Memory)、CD(Compact Disc)−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
また、CPU401が読み込んで実行するプログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
本実施形態3の構成によれば、前記実施形態1または前記実施形態2と同様の効果を奏する。
以上、図面を参照して、本発明の実施形態を詳述してきたが、本発明を実施するための具体的な構成はこれらの実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計等も含まれる。
この出願は、2017年6月19日に出願された日本出願特願2017−119257を基礎とする優先権を主張し、その開示の全てをここに取り込む。
1 送信端末(送信装置)
2 受信端末(受信装置)
3 送信端末(送信装置)
4 送信端末(送信装置)
101 エンコーダ
102 送信部(送信手段)
104 スループット計測部(スループット計測手段)
105 分割パターン生成部(パターン生成手段、パターン選択手段)
106 QoE算出部(スループット予測手段、体感品質算出手段)
107 パラメータ決定部(パラメータ決定手段)
201 受信部(受信手段)
202 データ送信部
301 スループット計測部(スループット計測手段)
302 スループット予測部(スループット予測手段)
303 パターン生成部(パターン生成手段)
304 体感品質算出部(体感品質算出手段)
305 パターン選択部(パターン選択手段)
306 パターン決定部(パターン決定手段)
402 エンコーダ

Claims (10)

  1. 受信装置との間の通信のスループットを計測するスループット計測手段と、
    前記スループット計測手段が計測した前記スループットに基づいて、未来のスループットを予測するスループット予測手段と、
    所定時間を分割することによって、複数の分割時間でそれぞれ構成される複数のパターンを生成するパターン生成手段と、
    前記パターン生成手段が生成した前記パターンに応じた前記分割時間ごとに、前記スループット予測手段が予測した前記未来のスループットの下限値を超えないような最大ビットレートで前記受信装置へ映像データを送信した場合に、該映像データから再生される映像の体感品質を、前記複数の分割時間の各々における前記最大ビットレートおよびGOP(Group of picture)サイズを変数として含む算出関数に基づいて算出する体感品質算出手段と、
    前記パターン生成手段が生成した前記複数のパターンのうち、前記体感品質算出手段が算出した前記映像の体感品質が最大になる1つのパターンを選択するパターン選択手段と、
    前記パターン選択手段が選択した前記1つのパターンに応じた前記分割時間ごとに、前記映像データの圧縮処理のための符号化パラメータを決定するパラメータ決定手段と、
    を有する送信装置。
  2. 前記パラメータ決定手段が決定した前記符号化パラメータを用いて、前記映像データの圧縮処理を行うエンコーダと、
    前記エンコーダが圧縮した前記映像データを前記受信装置へ送信する送信手段と、
    をさらに有することを特徴とする請求項1に記載の送信装置。
  3. 前記符号化パラメータは、GOPサイズおよびビットレートを少なくとも含むことを特徴とする請求項1または2に記載の送信装置。
  4. 前記パターン生成手段が生成する前記パターンは、複数の分割時刻T_i(i=1、2、・・・)を含み、前記複数の分割時刻T_iは、前記複数の分割時間(T_i−T_{i−1})を規定し、
    前記体感品質算出手段は、前記複数の分割時間(T_i−T_{i−1})の各々における前記最大ビットレートb_iおよびGOPサイズg_iを変数として含む算出関数Q(b_i,g_i)に基づいて、前記体感品質を算出し、
    算出される前記体感品質は以下の数式で表されることを特徴とする請求項1から3のいずれか1項に記載の送信装置。
    Figure 0006825703
    (ここで、g_i=f*(T_i−T_{i−1})であり、fは前記映像データのフレームレートである)
  5. 前記パラメータ決定手段は、前記パターン選択手段が選択した前記パターンの分割時間(T_i−T_{i−1})における前記最大ビットレートb_iを、前記分割時間(T_i−T_{i−1})における前記符号化パラメータとして決定することを特徴とする請求項4に記載の送信装置。
  6. 前記スループット予測手段は、前記スループット計測手段が計測した前記スループットに基づいて、前記未来のスループットの期待値および分散を算出し、
    前記体感品質算出手段は、前記スループット予測手段が算出した前記期待値マイナス前記分散を、前記下限値として設定することを特徴とする請求項1から5のいずれか1項に記載の送信装置。
  7. 請求項1から6のいずれか1項に記載の送信装置と、
    前記受信装置と、を含む通信システム。
  8. 前記受信装置は、
    前記送信装置から前記映像データを受信する受信手段と、
    前記スループット計測手段が前記スループットを計測するための情報を前記送信装置へ送信するスループット計測用データ送信手段と、
    を有することを特徴とする請求項7に記載の通信システム。
  9. 受信装置との間の通信のスループットを計測し、
    計測した前記スループットに基づいて、未来のスループットを予測し、
    所定時間を分割することによって、複数の分割時間でそれぞれ構成される複数のパターンを生成し、
    生成した前記パターンに応じた前記分割時間ごとに、前記未来のスループットの下限値を超えないような最大ビットレートで前記受信装置へ映像データを送信した場合に、該映像データから再生される映像の体感品質を、前記複数の分割時間の各々における前記最大ビットレートおよびGOPサイズを変数として含む算出関数に基づいて算出し、
    前記複数のパターンのうち、前記映像の体感品質が最大になる1つのパターンを選択し、
    選択した前記1つのパターンに応じた前記分割時間ごとに、前記映像データの圧縮処理のための符号化パラメータを決定する、
    通信方法。
  10. 受信装置との間の通信のスループットを計測することと、
    計測した前記スループットに基づいて、未来のスループットを予測することと、
    所定時間を分割することによって、複数の分割時間でそれぞれ構成される複数のパターンを生成することと、
    生成した前記パターンに応じた前記分割時間ごとに、前記未来のスループットの下限値を超えないような最大ビットレートで前記受信装置へ映像データを送信した場合に、該映像データから再生される映像の体感品質を、前記複数の分割時間の各々における前記最大ビットレートおよびGOPサイズを変数として含む算出関数に基づいて算出することと、
    前記複数のパターンのうち、前記映像の体感品質が最大になる1つのパターンを選択することと、
    選択した前記1つのパターンに応じた前記分割時間ごとに、前記映像データの圧縮処理のための符号化パラメータを決定することと、
    をコンピュータに実行させるプログラム。
JP2019525486A 2017-06-19 2018-06-13 送信装置、通信システム、通信方法、及びプログラム Active JP6825703B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2017119257 2017-06-19
JP2017119257 2017-06-19
PCT/JP2018/022595 WO2018235697A1 (ja) 2017-06-19 2018-06-13 送信装置、通信システム、通信方法、及び記録媒体

Publications (2)

Publication Number Publication Date
JPWO2018235697A1 JPWO2018235697A1 (ja) 2020-04-02
JP6825703B2 true JP6825703B2 (ja) 2021-02-03

Family

ID=64737091

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019525486A Active JP6825703B2 (ja) 2017-06-19 2018-06-13 送信装置、通信システム、通信方法、及びプログラム

Country Status (2)

Country Link
JP (1) JP6825703B2 (ja)
WO (1) WO2018235697A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2022185534A1 (ja) * 2021-03-05 2022-09-09

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5721700B2 (ja) * 2010-04-02 2015-05-20 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 無線通信装置及び無線通信方法
US9271186B2 (en) * 2011-01-28 2016-02-23 Nec Corporation Throughput estimation device

Also Published As

Publication number Publication date
WO2018235697A1 (ja) 2018-12-27
JPWO2018235697A1 (ja) 2020-04-02

Similar Documents

Publication Publication Date Title
JP7229261B2 (ja) ビデオ符号化のビットレート制御方法、装置、機器、記憶媒体及びプログラム
JP5318424B2 (ja) 関心領域映像符号化に関するコンテンツ適応型背景スキップ
TWI717776B (zh) 應用於視訊內容編碼之多重參考鄰邊之畫面內預測之自適應性濾波方法、使用上述方法的視訊編碼裝置及視訊解碼裝置
KR100988177B1 (ko) 품질 및 레이트 정보에 기초하여 멀티미디어 콘텐츠를 리사이징하기 위한 방법 및 시스템
JP5164866B2 (ja) ビデオ画像シーケンスの時間的頻度を適合させる方法および装置
CN107547154B (zh) 一种建立视频流量预测模型的方法及装置
CN114845106A (zh) 视频编码方法、装置和存储介质及电子设备
CN113938682A (zh) 视频编码方法、装置和电子设备
CN111617466B (zh) 编码格式的确定方法、装置及云游戏的实现方法
Hu et al. TVG-streaming: Learning user behaviors for QoE-optimized 360-degree video streaming
JP6825703B2 (ja) 送信装置、通信システム、通信方法、及びプログラム
JP5804060B2 (ja) パラメータ推定装置、パラメータ推定方法、及び、パラメータ推定プログラム
JP7136084B2 (ja) 通信装置、メディア配信システム、メディア配信方法およびプログラム
JP2008193661A (ja) 多重記述トランスコーディングのためのトランスコーディング・ノード及びトランスコーディング方法
JP6802136B2 (ja) 量子化パラメータ補正装置、量子化パラメータ補正方法及び量子化パラメータ補正プログラム
JP6145069B2 (ja) 主観画質推定装置及び主観画質推定プログラム
US20130343449A1 (en) Image encoding apparatus and its control method
JP2016510568A (ja) コンテキストベースのビデオ品質評価のための方法および装置
JP7310148B2 (ja) メディア符号化方法および装置
JP6954289B2 (ja) ビットレート指示装置、ビットレート指示方法、及び、ビットレート指示プログラム
Triki et al. Anticipating resource management and QoE for mobile video streaming under imperfect prediction
JP7280535B2 (ja) 符号化データ生成方法、符号化データ生成装置、及びプログラム
CN104521222A (zh) 通信系统、服务器装置、服务器装置控制方法和程序
Kumar et al. Adaptive video streaming over HTTP using stochastic bitrate prediction in 4G wireless networks
WO2011158421A1 (ja) モデル特定装置

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191202

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200623

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200728

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201215

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201228

R150 Certificate of patent or registration of utility model

Ref document number: 6825703

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150