JP2020141225A - 送信装置、送信方法、及びプログラム - Google Patents

送信装置、送信方法、及びプログラム Download PDF

Info

Publication number
JP2020141225A
JP2020141225A JP2019034736A JP2019034736A JP2020141225A JP 2020141225 A JP2020141225 A JP 2020141225A JP 2019034736 A JP2019034736 A JP 2019034736A JP 2019034736 A JP2019034736 A JP 2019034736A JP 2020141225 A JP2020141225 A JP 2020141225A
Authority
JP
Japan
Prior art keywords
segment
receiving device
data
media data
predetermined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019034736A
Other languages
English (en)
Other versions
JP7292901B2 (ja
Inventor
亨 強矢
Toru Suneya
亨 強矢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2019034736A priority Critical patent/JP7292901B2/ja
Priority to US16/797,595 priority patent/US11303940B2/en
Publication of JP2020141225A publication Critical patent/JP2020141225A/ja
Application granted granted Critical
Publication of JP7292901B2 publication Critical patent/JP7292901B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/23439Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements for generating different versions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/239Interfacing the upstream path of the transmission network, e.g. prioritizing client content requests
    • H04N21/2393Interfacing the upstream path of the transmission network, e.g. prioritizing client content requests involving handling client requests
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/262Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists
    • H04N21/26258Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists for generating a list of items to be played back in a given order, e.g. playlist, or scheduling item distribution according to such list
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/643Communication protocols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8455Structuring of content, e.g. decomposing content into time segments involving pointers to the content, e.g. pointers to the I-frames of the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/858Linking data to content, e.g. by linking an URL to a video object, by creating a hotspot
    • H04N21/8586Linking data to content, e.g. by linking an URL to a video object, by creating a hotspot by using a URL

Abstract

【課題】メディアデータの配信に係る遅延時間を短縮すること。【解決手段】受信装置へメディアデータを送信する送信装置は、メディアデータの所定時間長の部分に対応するセグメントであって、そのメディアデータの再生のための基準となる所定の基準データを含んだ第1のセグメントと、所定の基準データを含まない第2のセグメントとを生成し、受信装置からのセグメントの要求に応じて、生成したセグメントを受信装置へ送信する。送信装置は、受信装置から要求されたセグメントが第2のセグメントであったことに基づいて、その第2のセグメントを第1のセグメントへ変更して受信装置へ送信する。【選択図】図5

Description

本発明は、メディアデータの配信技術に関する。
音声データや映像データ等により構成されるストリーミング形式のコンテンツをリアルタイムに配信し、ユーザは、自身が保持する端末装置を介して、そのようなコンテンツを視聴するシステムが存在する。このとき、端末装置は様々な能力を有し、また、様々な環境でコンテンツの再生が行われるため、コンテンツ再生の環境への適応技術が要求される。このような要求に対して、MPEG(Moving Picture Experts Group)−DASH(Dynamic Adaptive Streaming over Http)が注目されている(非特許文献1参照)。MPEG−DASHは、取得されるストリームを動的に変更することを可能とする映像配信規格である。
MPEG−DASHでは、映像データが所定の時間長のセグメントに分割され、セグメントを取得するためのURL(Uniform Resource Locator)がプレイリストと呼ばれるファイルに記述される。映像データを受信する受信側装置は、最初にこのプレイリストを取得し、プレイリストに記述されている情報を用いて要求する映像データを選択して、その選択された映像データの配信元の配信側装置に対して、映像データの配信を要求する。そして、受信側装置は、その映像データを配信側装置から取得する。なお、この映像データは、1つの映像データが分割されて得られるセグメントとして取得されうる。このとき、プレイリスト中にビットレートや解像度などが異なる複数のバージョンのセグメントに対するURLが記載されることにより、受信側装置は、自身の能力や通信環境に適したバージョンのセグメントを取得することができる。
セグメントは、ISO Base Media File Format(以下では、このフォーマットのことを「ISOBMFF」と呼ぶ。)のファイル形式で取り扱われる(非特許文献2参照)。ここで、ISOBMFFは、ヘッダ情報を格納する部分と符号化データを格納する部分とに大きく分けられる。ヘッダ情報には、セグメントに格納される符号化データのサイズや、タイムスタンプを示す情報などが含まれる。したがって、1つのセグメントを完成させるために、そのセグメントに格納される符号化データの生成が全て完了している必要がある。
一方、映像データのセグメントについては、H.264の様なフレーム間予測を用いて符号化したデータを使用する事が一般的である。MPEG−DASHの普及活動を行っている業界団体のDASH Industry Forum(http://dashif.org/)では、これに基づいて、最適なバージョンのセグメントへの切り替えを容易にするためのガイドラインが作成されている。例えば、ガイドラインでは、各セグメントが、単体でのデコードが可能なイントラ圧縮されたフレーム(以下では、このフレームを「I−Frame」と呼ぶ。)を含み、ランダムアクセス可能となることなどが規定されている。
I−Frameは、参照画像と予測画像との差分を圧縮したフレームと比較して符号量が大きいため、符号量を抑えるためにI−Frameを生成する間隔を延ばす方法が用いられることがある。このとき、DASH Industry Forumのガイドラインを遵守すると、各セグメントは少なくとも1つのI−Frameを含む必要があるため、セグメントの最短の時間長がI−Frameの生成間隔となる。このため、セグメントの最短の時間長が、I−Frameの間隔に従って長くなる。
ISO/IEC 23009−1 ISO/IEC 14496−12
ライブ映像をストリーミング配信する場合、1つのセグメントを構成する最後のフレームの符号化が完了してセグメントのヘッダを生成するまで、そのセグメントを配信することができない。このため、セグメント時間長が、映像データの生成(撮影等)から配信までの遅延時間にそのまま加算される。このため、ライブ映像の配信時におけるリアルタイム性が著しく損なわれうる。また、これは、配信するコンテンツの符号量を抑えるためにI−Frameの生成間隔を長くした場合にさらに顕著になりうる。
本発明は、メディアデータの配信に係る遅延時間を短縮する技術を提供する。
本発明の一態様による送信装置は、受信装置へメディアデータを送信する送信装置であって、前記メディアデータの所定時間長の部分に対応するセグメントであって、前記メディアデータの再生のための基準となる所定の基準データを含んだ第1のセグメントと、前記所定の基準データを含まない第2のセグメントとを生成する生成手段と、前記受信装置からのセグメントの要求に応じて、前記生成したセグメントを前記受信装置へ送信する送信手段と、を有し、前記送信手段は、前記所定の基準データを受信していない前記受信装置から要求されたセグメントが前記第2のセグメントであったことに基づいて、当該第2のセグメントを前記第1のセグメントへ変更して前記受信装置へ送信する、ことを特徴とする。
本発明によれば、メディアデータの配信に係る遅延時間を短縮することができる。
システム構成例を示す図である。 送信装置のハードウェア構成例を示す図である。 送信装置の機能構成例を示す図である。 ライブ映像配信の遅延が発生する仕組みを説明するための図である。 セグメント生成の概要を説明するための図である。 セグメント生成の別の概要を説明するための図である。 セグメントの取得要求から配信までの処理の流れの例を示す図である。
以下、添付図面を参照して実施形態を詳しく説明する。尚、以下の実施形態は特許請求の範囲に係る発明を限定するものでない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
(システム構成)
図1に、本実施形態におけるコンテンツ配信システムの構成例を示す。本システムでは、映像コンテンツや音声コンテンツ等のメディアコンテンツが配信されるシステムであり、メディアコンテンツを配信する送信装置100と、そのメディアコンテンツを受信する受信装置200とを含んで構成される。送信装置100は、一例において、通信路300を介して、受信装置200と通信可能に構成される。なお、図1の例では、1つの送信装置100と1つの受信装置200とが示されているが、これらの装置の少なくともいずれかが複数存在してもよい。
送信装置100は、例えば、カメラ、ビデオカメラ、スマートフォン、PC(パーソナルコンピュータ)、携帯電話などでありうるが、後述の機能を実行可能な任意の他の電子機器であってもよい。受信装置200は、コンテンツの再生・表示機能、通信機能、及びユーザからの入力を受け付ける機能を有する限りにおいて、スマートフォン、PC、テレビ、携帯電話等の任意の電子機器でありうる。通信路300は、例えば有線と無線とを問わない任意の通信ネットワークでありうる。通信ネットワークは、インターネット/イントラネット、LAN(Local Area Network)/WAN(Wide Area Network)等の各種ネットワークのいずれかでありうる。また、有線通信インタフェースは、Ethernet(登録商標)規格に従うインタフェースでありうるが、他のインタフェースが用いられてもよい。無線通信インタフェースは、IEEE802.11規格シリーズに準拠した無線LAN規格に準拠したインタフェースであってもよいし、3G/4G/LTE等のWAN、Bluetooth(登録商標)等の規格に準拠するインタフェースが用いられてもよい。なお、無線接続形態として、インフラストラクチャネットワークでの接続が用いられてもよいし、アドホックネットワークでの接続が用いられてもよい。また、通信路300は、有線通信路と無線通信路との組み合わせであってもよい。すなわち、送信装置100と受信装置200との間で接続が確立されて通信が行われる限りにおいて、通信路300は任意の形式を有してもよい。
(送信装置の構成)
図2に、本実施形態に係る送信装置100のハードウェア構成を示す。送信装置100は、そのハードウェア構成として、例えば、記憶部121、制御部122、機能部123、入力部124、出力部125、及び通信部126を有する。なお、図2の構成は一例であり、送信装置100は、図2に示す構成の一部のみを有してもよいし、図2に示される以外の構成を有してもよい。
記憶部121は、ROM、RAMの両方、または、いずれか一方の、1以上のメモリにより構成され、後述する各種動作を行うためのプログラムや、無線通信のための通信パラメータ等の各種情報を記憶する。ここで、ROMはRead Only Memoryの略であり、RAMはRandom Access Memoryの略である。なお、記憶部121として、ROM、RAM等のメモリの他に、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、DVDなどの記憶媒体が用いられてもよい。
制御部122は、例えば、CPUやMPU等の1つ以上のプロセッサ、ASIC(特定用途向け集積回路)、DSP(デジタルシグナルプロセッサ)、FPGA(フィールドプログラマブルゲートアレイ)等により構成される。ここで、CPUはCentral Processing Unitの、MPUは、Micro Processing Unitの頭字語である。制御部122は、記憶部121に記憶されたプログラムを実行することにより送信装置100の全体を制御する。なお、制御部122は、記憶部121に記憶されたプログラムとOS(Operating System)との協働により送信装置100の全体を制御するようにしてもよい。
また、制御部122は、機能部123を制御して、撮像や印刷、投影等の所定の処理を実行する。機能部123は、送信装置100が所定の処理を実行するためのハードウェアである。例えば、送信装置100がカメラである場合、機能部123は撮像部であり、撮像処理を行う。機能部123が処理するデータは、記憶部121に記憶されているデータであってもよいし、後述する通信部126を介してSTAと通信したデータであってもよい。
入力部124は、ユーザからの各種操作の受付を行う。出力部125は、ユーザに対して各種出力を行う。ここで、出力部125による出力とは、画面上への表示や、スピーカによる音声出力、振動出力等の少なくとも1つを含む。なお、タッチパネルのように入力部124と出力部125の両方を1つのモジュールで実現するようにしてもよい。
通信部126は、有線通信又は無線通信の制御や、IP通信の制御を行う。送信装置100は通信部126を介して、映像データや音声データ等のメディアコンテンツを他の通信装置(受信装置200)と通信する。
図3は、送信装置100の機能構成例を示す図である。送信装置100は、一例において、メディアデータ取得部141、セグメント生成部142、プレイリスト生成部143、通信部144、要求処理部145を含んで構成される。メディアデータ取得部141は、符号化された映像データや音声データ等のメディアデータを取得する。セグメント生成部142は、メディアデータ取得部141によって取得されたメディアデータを、所定の時間ごとにまとめてセグメントを生成する。プレイリスト生成部143は、セグメント生成部142からセグメントが生成されたことを通知されたことに基づいて、セグメントの取得を可能とするURLが記述されたプレイリストを生成する。通信部144は、通信路300を介して、受信装置200からの要求信号の受信や、プレイリスト及びセグメントの送信等の処理を実行する。要求処理部145は、受信装置200からの要求に応じて、生成されたプレイリスト及びセグメントを、通信部144を介して受信装置200に送信するための処理を実行する。なお、図3に示す各機能部は、ASIC等の専用のハードウェア又はソフトウェアとして送信装置に実装されうる。ハードウェアとして実装される場合は、各機能部それぞれ又はいくつかをまとめた専用のハードウェアモジュールとして実装可能である。ソフトウェアとして実装される場合には、各機能部を実行するためのプログラムが前述の送信装置の記憶部121に記憶され、制御部122のプロセッサにより適宜読み出されて実行される。
(映像配信の遅延)
本実施形態において送信装置100が実行する処理について説明する前に、図4を用いて、ライブ映像配信において遅延が発生する仕組みについて概説する。図4において、送信装置100は、符号化データを30秒毎にまとめてヘッダを生成し、セグメントを生成している。ここで、MPEG(Moving Picture Expert Group)で標準化された動画圧縮技術では、符号化されたフレームデータを1枚以上まとめた集まりがGOP(Group Of Pictures)と呼ばれる。本実施形態では、先頭にのみI−Frameが存在し、残りは前方参照フレームであるP−Frameによって構成されるGOPを例として説明する。
図4では、30秒分の符号化データが1つのGOPとされ、GOP401は、そのGOPの最後のフレームが生成されてから、ヘッダが付与され、そのGOP401とヘッダとを含んだ「セグメント(1)」が生成される。受信装置200は、プレイリスト受信後に、プレイリストに記載されたコンテンツ情報に基づいて、セグメント(1)の取得を送信装置100に対して要求する。図4では、送信装置100は、時刻T1において受信装置200からセグメント取得要求402を受信すると、生成済みのセグメント(1)の配信403を実行し、受信装置200は、受信したセグメント(1)の再生処理を実行する。
以降、セグメントごとに生成・取得・再生を繰り返すことでストリーミング再生が行われる。図4の404で再生されるセグメント(1)は、GOP401のデータが格納されたものであるため、図4に示す時間405が、実際のライブ映像と、再生される映像との時間差である遅延時間となる。受信装置200が取得を要求するセグメントは、生成済みセグメントのうち最新のものである事が期待される。しかしながら、図4に示すように、期待通りの要求をした場合でも、遅延時間405は、少なくとも1セグメントから最大2セグメント分の遅延が発生する。すなわち、図4のように、GOPの時間長が30秒のケースでは、30秒から1分程度の遅延が発生することになる。なお、実際の遅延時間には、映像データの符号化/復号にかかる時間や通信路での伝送遅延など様々な要素が含まれうるが、本実施形態では、遅延時間に大きな影響を与えるセグメントの時間長と取得タイミングによって決まる時間405を主として取り扱う。
(処理の概要)
続いて、上述のような遅延時間を削減する方法の例について、説明する。
<方法1>
図5に、遅延時間を削減するセグメント生成の概要を示す。図5では、送信装置100は、時間長30秒のGOPを6分割し、時間長5秒のセグメントを生成する。この場合、5秒分のフレームが生成され次第、順次セグメントが生成される。なお、上述のように、GOPは、先頭がI−Frameで、以降のフレームは全てP−Frameである。このため、30秒の1つのGOPに対応する6個のセグメントのうち、先頭の1つはI−Frameを含み、それ以外のセグメントはI−Frameを含まずにP−Frameのみを含んで構成される。
図5では、送信装置100は、時刻Tnに受信装置200からセグメント(n)の取得要求501を受信したものとする。このとき、要求されたセグメント(n)がI−Frameを含まない場合、セグメント(n)の先頭のP−Frameを、I−Frameに変更502し、変更したセグメント(n)を受信装置200に配信する。なお、P−FrameからI−Frameへの変更は、対象のP−FrameをI−Frameとして再エンコードする事によって行われうる。例えば、直前のI−Frameを基準として符号化されることによって得られていたP−Frameについて、対応するフレームを、そのような基準を用いずに符号化することによって、I−Frameとする。また、各セグメントの先頭フレームは、GOPの生成とは別に、事前にI−Frameを重複して生成し、変更が必要な場合に先頭フレームを入れ替えるようにしてもよい。また、MPEG−DASH(Dynamic Adaptive Streaming over Http)のように、プレイリストを利用するストリーミング手法では、プレイリストの配信後にセグメントの取得要求が受信される。このため、送信装置100は、常にI−Frameを重複して生成することに代えて、プレイリスト配信後の所定の期間だけI−Frameを重複して生成するようにしてもよい。
受信装置200は、以降、各セグメントを5秒ごとに順次取得し、再生処理することにより、ストリーミングでの動画再生を継続的に実行する。上述のように、遅延時間はセグメントの時間長に依存する。このため、図5の例では、遅延時間を、分割後のセグメントの時間長である5秒(〜2セグメント分の10秒)程度の遅延時間504に抑える事ができる。
<方法2>
図6に、遅延時間を削減するセグメント生成の別の概要を示す。図6では、送信装置100は、先頭がI−Frameで残りがP−Frameで構成される符号化シーケンスを持つGOPの生成を繰り返し、1つのGOPを分割したセグメントを生成する。ここで、送信装置100は、時刻Tnにおいて受信装置200からセグメント(n)の取得要求601を受信すると、セグメント(n)、現在生成中のセグメント、及び、次に生成するセグメント(m)がI−Frameを含まない予定であるかを判定する。そして、送信装置100は、これらのセグメントがI−Frameを含まない予定である場合に、セグメント(m)がI−Frameを含むように符号化シーケンスの変更602を行う。そして、送信装置100は、セグメント(n)ではなくセグメント(m)の受信装置200への配信603を実行する。これにより、セグメント(m)は、生成完了後すぐに配信されるため、遅延時間は図6の時間604によって示される長さとなり、ほぼ1セグメント分の遅延に抑える事が可能となる。なお、ここでは、要求されたセグメントと、その次のセグメントがI−Frameを含む予定であるか否かが判定されたが、要求されたセグメントから後の時間に対応する任意の所定数のセグメントにI−Frameを含む予定であるか否かが判定されてもよい。
なお、時刻Tnにおいて生成中のセグメントがI−Frameを含む場合、送信装置100は、符号化シーケンスを変更することなく時刻Tnにおいて生成中のセグメントの生成が完了し次第、配信しうる。また、次に生成するセグメント(m)から比較的短い所定の時間内に次のI−Frameを含むセグメントを生成予定であった場合は、送信装置100は、符号化シーケンスを変更せずに、次のI−Frameを含むセグメントを配信するようにしてもよい。
(処理の流れ)
上述のような本実施形態の送信装置100が実行する一連の処理の流れについて、図7を用いて概説する。図7のフローチャートに示す各ステップは、例えば、送信装置の制御部122が記憶部121に記憶されたプログラムを読み出して実行することにより実施される。図7において、送信装置100は、セグメント取得要求を受信する(S701)。なお、送信装置100は、S701に至るまでの処理において、MPEG−DASHの場合、受信装置200とのプレイリストのやり取りなどが行われるが、この説明については従来の処理と同様であるため、ここでの説明については省略する。送信装置100は、要求されたセグメントがI−Frameを含むか判定し(S702)、要求されたセグメントがI−Frameを含んでいる場合(S702でYES)は、そのセグメントを受信装置200へ配信する(S705)。一方、送信装置100は、要求されたセグメントがI−Frameを含んでいない場合(S702でNO)は、次に生成するセグメントから所定の時間内にI−Frameを含むセグメントが生成される予定であるか否かを判定する(S703)。そして、送信装置100は、所定の時間内にI−Frameを含んだセグメントが生成される予定の場合(S703でYES)は、そのI−Frameを含んだセグメントが生成されるのを待って、そのセグメントを受信装置200へ配信する(S705)。送信装置100は、所定の時間内にI−Frameを含んだセグメントが生成される予定でない場合(S703でNO)は、次に生成するセグメントをI−Frameを含むように変更する(S704)。そして、送信装置100は、I−Frameを含むように変更したセグメントを受信装置200へ配信する(S705)。これにより、送信装置100は、受信装置200へ、I−Frameを含むセグメントを所定の時間内に配信することができる。
なお、同じストリームを複数の受信装置が受信している場合、符号化シーケンスを変更すると、他の受信装置にビットレート変動の影響がある。そこで、ビットレート変動の影響を緩和するため、符号化シーケンスを変更して生成されるI−Frameの画像品質を落とすことなどにより、通常のI−Frameよりサイズを小さくしてもよい。これによれば、I−Frameを未受信の受信装置に、I−Frameを含んだセグメントを配信すると共に、I−Frameを既に取得していた受信装置のビットレートを一定に保つことが可能となる。
なお、MPEG−DASHによれば、解像度やビットレート等が異なる複数のストリームをサーバが生成し、クライアントは、受信するストリームを動的に切り替えることができる。このとき、クライアントは、ストリームの切り替え時には、切り替え後のストリームについてのI−Frameを含んだセグメントを取得できていないと、切り替え後のストリームを再生することができない。このため、サーバは、ストリーミングの開始時だけでなく、ストリーミングの切り替え時にも、上述の手法を適用することができる。すなわち、異なるストリームへの切り替えが行われた場合には、そのタイミングで上述の処理を実行し、I−Frameを含んだセグメントがクライアントに提供される。これにより、ストリーミングの開始時のみならず、ストリーミングの切り替え時にも、遅延時間を抑制することができる。
なお、上述の説明は、H.264規格を用いることを前提としたが、これに限られない。すなわち、メディアデータの一部であると共に再生の基準となるI−Frameのような所定の基準データと、その基準データを用いてメディアデータを再生するための他のデータとからなる任意の形式のメディアファイルに上述の議論を適用可能である。送信装置は、上述の所定の基準データを含んだ所定時間長のメディアデータ部分に対応するセグメントと、その基準データを含まない所定時間長のメディアデータ部分に対応するセグメントとを生成する。そして、送信装置は、所定の基準データを送信済みでない受信装置から、その所定の基準データを含まないセグメントを要求する信号を受信した場合、例えば、そのセグメントを、所定の基準データを含んだセグメントへと変換して送信する。これにより、受信装置において、メディアデータの再生に必要なデータを取得することができるまでの時間を短縮することができる。
なお、上述の説明では、送信装置100がプレイリストを生成して受信装置200へ送信すると説明したが、これに限られない。例えば、送信装置100は、プレイリストを生成する生成装置に対して、生成が完了したセグメントの情報を逐次的に通知し、その生成装置が、その通知に基づいてプレイリストを生成するようにしてもよい。この場合、送信装置100自身は、プレイリストを生成する必要がなくなる。
<その他の実施形態>
以上、実施形態例を詳述したが、本発明は例えば、システム、装置、方法、プログラム、または、記録媒体(記憶媒体)等としての実施態様をとることが可能である。具体的には、複数の機器(例えば、ホストコンピュータ、インタフェース機器、撮像装置、webアプリケーション等)から構成されるシステムに適用してもよいし、また、一つの機器からなる装置に適用してもよい。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。
100:送信装置、141:メディアデータ取得部、142:セグメント生成部、144:通信部、145:要求処理部、200:受信装置

Claims (11)

  1. 受信装置へメディアデータを送信する送信装置であって、
    前記メディアデータの所定時間長の部分に対応するセグメントであって、前記メディアデータの再生のための基準となる所定の基準データを含んだ第1のセグメントと、前記所定の基準データを含まない第2のセグメントとを生成する生成手段と、
    前記受信装置からのセグメントの要求に応じて、前記生成したセグメントを前記受信装置へ送信する送信手段と、
    を有し、
    前記送信手段は、前記受信装置から要求されたセグメントが前記第2のセグメントであったことに基づいて、当該第2のセグメントを前記第1のセグメントへ変更して前記受信装置へ送信する、
    ことを特徴とする送信装置。
  2. 前記所定の基準データは、前記第1のセグメントに対応する所定時間長の前記メディアデータのうちの一部を、基準を用いずに符号化して得られるデータであり、
    前記送信手段は、前記第2のセグメントに対応する前記メディアデータの所定時間長の部分に含まれる一部を、基準を用いずに符号化して前記所定の基準データとすることにより、当該第2のセグメントを前記第1のセグメントへ変更する、
    ことを特徴とする請求項1に記載の送信装置。
  3. 前記所定の基準データは、前記第1のセグメントに対応する所定時間長の前記メディアデータのうちの一部を、基準を用いずに符号化して得られるデータであり、
    前記生成手段は、前記第2のセグメントを生成する際に、当該第2のセグメントに対応する前記メディアデータの所定時間長の部分に含まれる一部について、基準を用いずに符号化した所定のデータを事前に生成しておき、
    前記送信手段は、前記第2のセグメントの前記一部を、前記事前に生成された前記所定のデータと置き換えることにより、当該第2のセグメントを前記第1のセグメントへ変更する、
    ことを特徴とする請求項1に記載の送信装置。
  4. 前記受信装置は、前記メディアデータを含んだプレイリストに基づいて、前記セグメントを要求し、
    前記生成手段は、前記プレイリストが前記受信装置に配信されてから所定の期間の間だけ、前記第2のセグメントを生成する際に前記所定のデータを生成する、
    ことを特徴とする請求項3に記載の送信装置。
  5. 前記プレイリストは、MPEG(Moving Picture Experts Group)−DASH(Dynamic Adaptive Streaming over Http)のプレイリストである、
    ことを特徴とする請求項4に記載の送信装置。
  6. 前記送信手段は、前記所定の基準データが送信されている前記受信装置からセグメントが要求された場合、又は、前記所定の基準データが送信されていない前記受信装置から要求されたセグメントが前記第1のセグメントである場合に、前記変更を行わない、
    ことを特徴とする請求項1から5のいずれか1項に記載の送信装置。
  7. 前記送信手段は、前記所定の基準データが送信されていない前記受信装置から要求されたセグメントが前記第2のセグメントであった場合であっても、当該セグメントより後の時間に対応する所定数のセグメントのうちのいずれかが第1のセグメントであることが予定されている場合には、前記変更を行わず、前記要求されたセグメントとして、当該第1のセグメントを前記受信装置へ送信する、
    ことを特徴とする請求項1から6のいずれか1項に記載の送信装置。
  8. 前記所定の基準データは、H.264規格のI−Frameである、
    ことを特徴とする請求項1から7のいずれか1項に記載の送信装置。
  9. 前記送信手段は、前記第2のセグメントを前記第1のセグメントへ変更する場合、当該第2のセグメントから変更されたものでない前記第1のセグメントより品質を落としたセグメントを、当該変更の後のセグメントとして送信する、
    ことを特徴とする請求項1から8のいずれか1項に記載の送信装置。
  10. 送信装置によって実行される受信装置へメディアデータを送信する送信方法であって、
    前記メディアデータの所定時間長の部分に対応するセグメントであって、前記メディアデータの再生のための基準となる所定の基準データを含んだ第1のセグメントと、前記所定の基準データを含まない第2のセグメントとを生成する生成工程と、
    前記受信装置からのセグメントの要求に応じて、前記生成したセグメントを前記受信装置へ送信する送信工程と、
    を有し、
    前記送信工程では、前記受信装置から要求されたセグメントが前記第2のセグメントであったことに基づいて、当該第2のセグメントを前記第1のセグメントへ変更して前記受信装置へ送信する、
    ことを特徴とする送信方法。
  11. コンピュータを、請求項1から9のいずれか1項に記載の送信装置が有する各手段として機能させるためのプログラム。
JP2019034736A 2019-02-27 2019-02-27 送信装置、送信方法、及びプログラム Active JP7292901B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019034736A JP7292901B2 (ja) 2019-02-27 2019-02-27 送信装置、送信方法、及びプログラム
US16/797,595 US11303940B2 (en) 2019-02-27 2020-02-21 Transmission apparatus, transmission method, and non-transitory computer-readable storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019034736A JP7292901B2 (ja) 2019-02-27 2019-02-27 送信装置、送信方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2020141225A true JP2020141225A (ja) 2020-09-03
JP7292901B2 JP7292901B2 (ja) 2023-06-19

Family

ID=72141877

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019034736A Active JP7292901B2 (ja) 2019-02-27 2019-02-27 送信装置、送信方法、及びプログラム

Country Status (2)

Country Link
US (1) US11303940B2 (ja)
JP (1) JP7292901B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014531878A (ja) * 2011-10-05 2014-11-27 クアルコム,インコーポレイテッド メディアデータのネットワークストリーミング
JP2018182447A (ja) * 2017-04-07 2018-11-15 キヤノン株式会社 映像配信装置、映像配信方法及びプログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1383334B1 (en) * 2002-07-17 2012-02-01 Panasonic Corporation Video data transmitting apparatus, video data receiving apparatus, and broadcasting system
KR100492567B1 (ko) * 2003-05-13 2005-06-03 엘지전자 주식회사 이동통신 시스템의 http 기반 비디오 스트리밍 장치및 방법
AP3358A (en) * 2008-08-26 2015-07-31 Csir Scientia A method of switching from a first encoded video stream to a second encoded video stream
CN104641638B (zh) * 2012-06-28 2018-08-03 阿克西斯股份公司 使用虚拟帧内帧对视频内容进行编码的系统和方法
WO2014204366A1 (en) * 2013-06-19 2014-12-24 Telefonaktiebolaget L M Ericsson (Publ) Arrangements and method thereof for a channel change during streaming
US9654804B2 (en) * 2014-09-03 2017-05-16 Vigor Systems Inc. Replacing video frames in a transport stream

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014531878A (ja) * 2011-10-05 2014-11-27 クアルコム,インコーポレイテッド メディアデータのネットワークストリーミング
JP2018182447A (ja) * 2017-04-07 2018-11-15 キヤノン株式会社 映像配信装置、映像配信方法及びプログラム

Also Published As

Publication number Publication date
US11303940B2 (en) 2022-04-12
JP7292901B2 (ja) 2023-06-19
US20200275135A1 (en) 2020-08-27

Similar Documents

Publication Publication Date Title
JP6981257B2 (ja) 情報処理装置および情報処理方法
US8818021B2 (en) Watermarking of digital video
JP5147278B2 (ja) 映像配信装置およびキーフレーム配信方法
WO2016049987A1 (zh) 一种数据处理方法、装置及相关服务器
US20110138018A1 (en) Mobile media server
EP3095247B1 (en) Robust live operation of dash
JP2015136060A (ja) 通信装置、通信データ生成方法、および通信データ処理方法
KR20150131175A (ko) Http를 통한 동적 적응형 스트리밍에서 미디어 세그먼트들의 손실 존재시의 회복력
JP2008193510A (ja) 映像送信装置、映像受信装置、及び映像伝送システム
CN108696505B (zh) 视频分发设备、视频接收设备、视频分发方法和记录介质
JP2020072461A (ja) 送信装置、サーバ装置、送信方法およびプログラム
JP6116240B2 (ja) 送信装置、送信方法、及びプログラム
JP4526294B2 (ja) ストリームデータ送信装置、受信装置、プログラムを記録した記録媒体、およびシステム
JP2015136057A (ja) 通信装置、通信データ生成方法、および通信データ処理方法
US9571790B2 (en) Reception apparatus, reception method, and program thereof, image capturing apparatus, image capturing method, and program thereof, and transmission apparatus, transmission method, and program thereof
TW201138464A (en) Network device, information processing apparatus, stream switching method, information processing method, program, and content distribution system
JP2019092133A (ja) 送信装置、受信装置、通信システムおよびプログラム
JP6501127B2 (ja) 情報処理装置および方法
JP6597604B2 (ja) 受信装置、送信装置、データ通信方法、およびデータ処理方法
JP5031230B2 (ja) データ送信装置及び方法
JP7292901B2 (ja) 送信装置、送信方法、及びプログラム
JP6400163B2 (ja) 受信装置、受信方法、送信装置、送信方法、及びプログラム
KR101452269B1 (ko) 콘텐트 가상 세그멘테이션 방법과, 이를 이용한 스트리밍 서비스 제공 방법 및 시스템
JP7229696B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP6890977B2 (ja) 送信装置、送信方法、およびプログラム

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20210103

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210113

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220127

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221223

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230509

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230607

R151 Written notification of patent or utility model registration

Ref document number: 7292901

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151