JP7247707B2 - Transmission node, broadcasting station system, control node and transmission control method - Google Patents

Transmission node, broadcasting station system, control node and transmission control method Download PDF

Info

Publication number
JP7247707B2
JP7247707B2 JP2019062658A JP2019062658A JP7247707B2 JP 7247707 B2 JP7247707 B2 JP 7247707B2 JP 2019062658 A JP2019062658 A JP 2019062658A JP 2019062658 A JP2019062658 A JP 2019062658A JP 7247707 B2 JP7247707 B2 JP 7247707B2
Authority
JP
Japan
Prior art keywords
essence
node
stream
data
rtp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019062658A
Other languages
Japanese (ja)
Other versions
JP2020162090A (en
Inventor
俊喜 佐藤
正幸 菅原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2019062658A priority Critical patent/JP7247707B2/en
Publication of JP2020162090A publication Critical patent/JP2020162090A/en
Application granted granted Critical
Publication of JP7247707B2 publication Critical patent/JP7247707B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本開示は、送信ノード、放送局システム、制御ノード及び送信制御方法に関する。 The present disclosure relates to a transmission node, a broadcasting station system, a control node, and a transmission control method.

既存の放送局の多くは、映像、音声及び補助(ancillary)データといった放送素材を局内で伝送するための専用ネットワークを有している。専用ネットワークには、例えば、カメラ及びマイクロフォンといったキャプチャデバイス、コンテンツデータを蓄積するストレージサーバ、コンテンツを再生する再生デバイス、及び伝送される信号の形式を変換するゲートウェイデバイスといった、様々な装置が接続される。専用ネットワーク上での放送素材の伝送のための信号形式として、SDI(Serial Digital Interface)がこれまで広く利用されている。 Many existing broadcast stations have dedicated networks for transmitting broadcast material such as video, audio and ancillary data within the station. Various devices are connected to the dedicated network, such as capture devices such as cameras and microphones, storage servers that accumulate content data, playback devices that play back content, and gateway devices that convert the format of transmitted signals. . SDI (Serial Digital Interface) has hitherto been widely used as a signal format for transmission of broadcast material on dedicated networks.

しかし、近年のIP(Internet Protocol)技術の目覚ましい性能の向上の結果、放送事業者は、より汎用性の高いIP技術を活用することにメリットを見出し、局内のネットワークをIPネットワークへ更新する取り組みを開始した。IPベースのネットワークアーキテクチャを採用すれば、例えば、汎用のルータ及びスイッチといったネットワーク装置を用いて高速かつ大容量のネットワークを低コストで構築することが可能となる。 However, as a result of the remarkable improvement in performance of IP (Internet Protocol) technology in recent years, broadcasters have discovered the merits of using IP technology with greater versatility, and are making efforts to upgrade their intra-office networks to IP networks. started. Adopting an IP-based network architecture makes it possible to build a high-speed, large-capacity network at low cost using network devices such as general-purpose routers and switches.

放送素材をIP技術を活用して伝送するためのプロトコルの標準化も、現在進められている。例えば、SMPTE(Society of Motion Picture and Television Engineers)は、映像、音声及び補助データの混成であるSDIイメージをIPパケットで伝送するためのプロトコルであるSMPTE ST2022-6を規格化済みである(非特許文献1参照)。さらに、SMPTEは、映像、音声及び補助データを別々のストリームで伝送するためのプロトコル群であるSMPTE ST2110シリーズの規格化も進めている(非特許文献2参照)。中でも、SMPTE ST2110-10によれば、放送局システムに参加するノードがPTP(Precision Time Protocol)の仕組みに基づいて相互に高い精度で同期する。この高精度の同期によって、IPネットワーク上で異なる経路に沿って伝送される異なるストリームを受信側で適切に時間合わせすることが可能となる。 Standardization of protocols for transmitting broadcast materials using IP technology is also currently underway. For example, SMPTE (Society of Motion Picture and Television Engineers) has standardized SMPTE ST2022-6, which is a protocol for transmitting SDI images, which are a mixture of video, audio, and ancillary data, in IP packets (non-patent Reference 1). Furthermore, SMPTE is also standardizing the SMPTE ST2110 series, which is a set of protocols for transmitting video, audio, and auxiliary data in separate streams (see Non-Patent Document 2). Among others, according to SMPTE ST2110-10, nodes participating in a broadcasting station system synchronize with each other with high accuracy based on the mechanism of PTP (Precision Time Protocol). This high-precision synchronization allows the receiver to properly time-align different streams transmitted along different paths over an IP network.

日本国内の標準化団体であるARIB(Association of Radio Industries and Businesses)は、映像、音声及び補助データを単一のストリームで伝送するためのデータ構造の規定として、ARIB STD-B73を規格化済みである(非特許文献3参照)。 ARIB (Association of Radio Industries and Businesses), a standardization body in Japan, has standardized ARIB STD-B73 as a data structure specification for transmitting video, audio and auxiliary data in a single stream. (See Non-Patent Document 3).

さらに、多様な装置の間の相互運用性を確保するために、AMWA(Advanced Media Workflow Association)は、装置間のストリームの伝送を管理し及び制御するための制御インタフェース規格の集合であるNMOS(Networked Media Open Specifications)規格の策定を進めている。例えば、NMOS IS-04は、ネットワークリソースの発見及び登録(Discovery and Registration)のための制御インタフェース規格である(非特許文献4参照)。NMOS IS-05は、デバイスの接続管理(Device Connection Management)のための制御インタフェース規格である(非特許文献5参照)。NMOS規格が利用される場合、送信ノードは、自ノードにより送信可能な放送信号ストリームの属性を記述するSDP(Session Description Protocol)オブジェクトを制御ノードへ提供し、制御ノードは、そのSDPオブジェクトの記述に基づいてストリームの伝送をセットアップする。 Furthermore, in order to ensure interoperability between various devices, AMWA (Advanced Media Workflow Association) has established NMOS (Networked Streaming Interface), a set of control interface standards for managing and controlling stream transmission between devices. Media Open Specifications) standards are being formulated. For example, NMOS IS-04 is a control interface standard for discovery and registration of network resources (see Non-Patent Document 4). NMOS IS-05 is a control interface standard for device connection management (see Non-Patent Document 5). When the NMOS standard is used, the transmitting node provides the control node with an SDP (Session Description Protocol) object describing the attributes of a broadcast signal stream that can be transmitted by the own node, and the control node uses the description of the SDP object. set up the transmission of the stream based on

特許文献1及び2は、放送コンテンツのストリーミングの際に利用され得るSDPオブジェクトの例を開示している。 Patent Documents 1 and 2 disclose examples of SDP objects that can be used when streaming broadcast content.

Thomas Edwards, “SMPTE ST 2022: Moving Serial Interfaces (ASI & SDI) to IP”, [online], 2017年8月17日, SMPTE Standards Webcast Series, [平成31年2月15日検索], インターネット<URL:https://www.smpte.org/sites/default/files/2017-08-17-ST-2022-Edwards-V4-Handout.pdf>Thomas Edwards, "SMPTE ST 2022: Moving Serial Interfaces (ASI & SDI) to IP", [online], August 17, 2017, SMPTE Standards Webcast Series, [searched on February 15, 2019], Internet < URL : https://www.smpte.org/sites/default/files/2017-08-17-ST-2022-Edwards-V4-Handout.pdf> SMPTE, “SMPTE ST 2110 FAQ”, [online], [平成31年2月15日検索], インターネット<URL:https://www.smpte.org/st-2110>SMPTE, “SMPTE ST 2110 FAQ”, [online], [searched on February 15, 2019], Internet <URL: https://www.smpte.org/st-2110> ARIB, “制作用IPインタフェースにおけるエッセンス独立単一ストリームのRTPデータグラムのデータ構造 標準規格(ARIB STD-B73 1.0版)”, [online], 2018年7月26日, [平成31年2月15日], インターネット<URL:https://www.arib.or.jp/kikaku/kikaku_hoso/desc/std-b73.html>ARIB, “Data Structure Standard for Essence-Independent Single Stream RTP Datagram in IP Interface for Production (ARIB STD-B73 Version 1.0)”, [online], July 26, 2018, [February 15, 2019 Japan], Internet <URL: https://www.arib.or.jp/kikaku/kikaku_hoso/desc/std-b73.html> AMWA, “AMWA IS-04 NMOS Discovery and Registration Specification (Stable)”, [online], [平成31年2月15日], インターネット<URL:https://amwa-tv.github.io/nmos-discovery-registration/>AMWA, “AMWA IS-04 NMOS Discovery and Registration Specification (Stable)”, [online], [February 15, 2019], Internet <URL: https://amwa-tv.github.io/nmos-discovery -registration/> AMWA, “AMWA IS-05 NMOS Device Connection Management Specification”, [online], [平成31年2月15日], インターネット<URL:https://amwa-tv.github.io/nmos-device-connection-management/>AMWA, “AMWA IS-05 NMOS Device Connection Management Specification”, [online], [February 15, 2019], Internet <URL: https://amwa-tv.github.io/nmos-device-connection- management/>

特開2015-73197号公報JP 2015-73197 A 特表2007-531368号公報Japanese Patent Publication No. 2007-531368

相互に関連する映像、音声及び補助データをSMPTE ST2110のように別々のストリームで伝送すると、トランスポートレイヤでそれらストリームのポート番号が相違することから、受信側でもとのコンテンツを再構築する処理が複雑化する。ポート番号が相違すれば、IPネットワーク上での経路制御の結果として、個々のストリームが辿る伝送経路の違いからストリームごとに異なる遅延を受ける可能性もある。これに対し、ARIB STD-B73の映像、音声及び補助データのストリームは、トランスポートレイヤで同一のポート番号を有するために、上述したSMPTE ST2110に固有の問題点を有しない。しかし、ARIB STD-B73は、放送局システムに参加するノード間でどのように協調的に動作してストリームを処理すべきかを規定していない。 When video, audio and ancillary data that are related to each other are transmitted in separate streams like SMPTE ST2110, the port numbers of these streams are different in the transport layer, so processing to reconstruct the original contents on the receiving side is required. Complicated. If the port numbers are different, each stream may receive a different delay due to the difference in the transmission path followed by each stream as a result of path control on the IP network. On the other hand, ARIB STD-B73 video, audio and auxiliary data streams have the same port number in the transport layer, so they do not have the above-mentioned problem specific to SMPTEST ST2110. However, ARIB STD-B73 does not specify how the nodes participating in the broadcasting station system should operate cooperatively to process streams.

例えば、ストリームの伝送に関与するノード間で高精度の同期が確立されておらず、パケット間の時間合わせのために使用すべき時刻情報用のフィールドに合意が無ければ、放送局システム内でやり取りされる多様なエッセンスを柔軟に組み合わせて放送コンテンツを構成することができない。 For example, if high-precision synchronization is not established between nodes involved in stream transmission, and if there is no consensus on the field for time information that should be used for time alignment between packets, communication within the broadcasting station system Broadcast contents cannot be configured by flexibly combining various essences.

また、SMPTE ST2110ストリームのために通常利用されるSDPオブジェクトのフォーマットは、フォーマット構造においても、記述される情報の内容においても、ARIB STD-B73ストリームの特性に必ずしも適していない。 Also, the format of the SDP objects normally used for SMPTE ST2110 streams is not necessarily suitable for the characteristics of ARIB STD-B73 streams, either in format structure or in the information content described.

本開示に係る技術は、上述した課題のうちの少なくとも1つを解決することを目的とする。 An object of the technology according to the present disclosure is to solve at least one of the above-described problems.

ある観点によれば、異なるタイプのエッセンスデータを単一のポート番号で伝送する放送信号ストリームを、放送局のIPネットワークへ送信する送信部と、上記放送信号ストリームの属性を記述するSDP(Session Description Protocol)オブジェクトを他のノードへ提供する制御部と、を備え、上記SDPオブジェクトは、映像エッセンスデータが圧縮されるかを示す圧縮関連情報、音声エッセンスデータに関連する音声チャンネル数情報、及びエッセンスデータへ適用される誤り訂正方式を示す誤り訂正情報、のうちの1つ以上を、上記放送信号ストリームのフォーマット固有のパラメータを記述する属性フィールド内に含む、送信ノードが提供される。 According to one aspect, a transmitter for transmitting a broadcast signal stream that transmits different types of essence data with a single port number to an IP network of a broadcast station, and an SDP (Session Description) that describes attributes of the broadcast signal stream a control unit for providing a protocol object to other nodes, wherein the SDP object includes compression-related information indicating whether video essence data is compressed, audio channel number information related to audio essence data, and essence data. error correction information indicating an error correction scheme to be applied to the broadcast signal stream in attribute fields describing format-specific parameters of said broadcast signal stream.

また別の観点によれば、上記送信ノードと、上記SDPオブジェクトの記述に従ってセットアップされる上記放送信号ストリームを受信する受信ノードと、を含む放送局システムが提供される。 According to yet another aspect, there is provided a broadcast station system including said transmitting node and a receiving node for receiving said broadcast signal stream set up according to said SDP object description.

また別の観点によれば、放送局のIPネットワークにおける、異なるタイプのエッセンスデータを単一のポート番号で伝送する放送信号ストリームの送信ノードから受信ノードへの送信を制御する制御ノードであって、上記放送信号ストリームの属性を記述するSDP(Session Description Protocol)オブジェクトを上記送信ノードから取得する制御部、を備え、上記SDPオブジェクトは、映像エッセンスデータが圧縮されるかを示す圧縮関連情報、音声エッセンスデータに関連する音声チャンネル数情報、及びエッセンスデータへ適用される誤り訂正方式を示す誤り訂正情報、のうちの1つ以上を、上記放送信号ストリームのフォーマット固有のパラメータを記述する属性フィールド内に含む、制御ノードが提供される。 According to another aspect, a control node for controlling transmission from a transmitting node to a receiving node of a broadcast signal stream carrying different types of essence data on a single port number in an IP network of a broadcast station, comprising: a control unit that acquires an SDP (Session Description Protocol) object describing attributes of the broadcast signal stream from the transmission node, the SDP object including compression-related information indicating whether video essence data is to be compressed, audio essence including one or more of audio channel number information associated with the data and error correction information indicating an error correction scheme applied to the essence data in an attribute field describing format specific parameters of the broadcast signal stream. , a control node is provided.

また別の観点によれば、異なるタイプのエッセンスデータを単一のポート番号で伝送する放送信号ストリームの属性を記述するSDP(Session Description Protocol)オブジェクトを他のノードへ提供することと、上記放送信号ストリームを、放送局のIPネットワークへ送信することと、を含み、上記SDPオブジェクトは、映像エッセンスデータが圧縮されるかを示す圧縮関連情報、音声エッセンスデータに関連する音声チャンネル数情報、及びエッセンスデータへ適用される誤り訂正方式を示す誤り訂正情報、のうちの1つ以上を、上記放送信号ストリームのフォーマット固有のパラメータを記述する属性フィールド内に含む、送信制御方法が提供される。当該送信制御方法をプロセッサに実行させるコンピュータプログラムが提供されてもよい。上記コンピュータプログラムを記憶した非一時的なコンピュータ読取可能な記憶媒体が提供されてもよい。 According to another aspect, providing other nodes with an SDP (Session Description Protocol) object describing attributes of a broadcast signal stream that transmits different types of essence data with a single port number; sending the stream to the broadcast station's IP network, wherein the SDP object includes compression related information indicating whether video essence data is compressed, audio channel number information related to audio essence data, and essence data. error correction information indicating an error correction scheme to be applied to the broadcast signal stream in an attribute field describing format-specific parameters of said broadcast signal stream. A computer program may be provided that causes a processor to execute the transmission control method. A non-transitory computer-readable storage medium storing the computer program may be provided.

また別の観点によれば、放送局のIPネットワークにおける、異なるタイプのエッセンスデータを単一のポート番号で伝送する放送信号ストリームの送信ノードから受信ノードへの送信を制御するための送信制御方法であって、上記放送信号ストリームの属性を記述するSDP(Session Description Protocol)オブジェクトを上記送信ノードから取得すること、を含み、上記SDPオブジェクトは、映像エッセンスデータが圧縮されるかを示す圧縮関連情報、音声エッセンスデータに関連する音声チャンネル数情報、及びエッセンスデータへ適用される誤り訂正方式を示す誤り訂正情報、のうちの1つ以上を、上記放送信号ストリームのフォーマット固有のパラメータを記述する属性フィールド内に含む、送信制御方法が提供される。当該送信制御方法をプロセッサに実行させるコンピュータプログラムが提供されてもよい。上記コンピュータプログラムを記憶した非一時的なコンピュータ読取可能な記憶媒体が提供されてもよい。 According to another aspect, a transmission control method for controlling transmission from a transmission node to a reception node of a broadcast signal stream that transmits different types of essence data with a single port number in an IP network of a broadcast station obtaining from the transmitting node an SDP (Session Description Protocol) object describing attributes of the broadcast signal stream, wherein the SDP object is compression-related information indicating whether video essence data is to be compressed; One or more of audio channel number information associated with the audio essence data and error correction information indicating an error correction method applied to the essence data in the attribute field describing the format-specific parameters of the broadcast signal stream. A transmission control method is provided, comprising: A computer program may be provided that causes a processor to execute the transmission control method. A non-transitory computer-readable storage medium storing the computer program may be provided.

本開示に係る技術によれば、放送局のIPネットワーク上で映像データ、音声データ又は補助データといったエッセンスデータを単一のストリームで伝送するプロトコルを利用する際に、当該ストリームの伝送を適切にセットアップすることが可能となる。なお、本開示に係る技術により、当該効果の代わりに、又は当該効果とともに、他の効果が奏されてもよい。 According to the technology according to the present disclosure, when using a protocol for transmitting essence data such as video data, audio data, or auxiliary data in a single stream on an IP network of a broadcasting station, the transmission of the stream is appropriately set up. It becomes possible to It should be noted that the technology according to the present disclosure may produce other effects instead of or in addition to the above effects.

本開示の実施形態に係る放送局システムの構成の一例を示す概略図である。1 is a schematic diagram showing an example of a configuration of a broadcasting station system according to an embodiment of the present disclosure; FIG. 本開示の実施形態に係る放送局システムのIPドメインの論理的な構成の一例について説明するための説明図である。FIG. 2 is an explanatory diagram for describing an example of a logical configuration of IP domains of a broadcasting station system according to an embodiment of the present disclosure; FIG. SMPTE ST2110-10により規定されたシステムタイミングモデルについて説明するための説明図である。1 is an explanatory diagram for explaining a system timing model defined by SMPTE ST2110-10; FIG. 図3を用いて説明したシステムタイミングモデルに基づく映像エッセンスと音声エッセンスとの間の時間合わせについて説明するための説明図である。FIG. 4 is an explanatory diagram for explaining time alignment between a video essence and an audio essence based on the system timing model described with reference to FIG. 3; ARIB STD-B73におけるデータグラムの構成について説明するための説明図である。FIG. 4 is an explanatory diagram for explaining the structure of a datagram in ARIB STD-B73; ARIB STD-B73に従った単一ストリームでの映像エッセンス及び音声エッセンスの伝送について説明するための説明図である。FIG. 4 is an explanatory diagram for explaining transmission of video essence and audio essence in a single stream according to ARIB STD-B73; 第1の実施形態に係る放送信号処理ノードの構成の一例を示すブロック図である。2 is a block diagram showing an example of the configuration of a broadcast signal processing node according to the first embodiment; FIG. 図7に示した受信ストリーム処理部の詳細な構成の一例を示すブロック図である。8 is a block diagram showing an example of a detailed configuration of a reception stream processing unit shown in FIG. 7; FIG. 2つのRTPパケットの間のエッセンスデータの時間合わせのための手法の第1の例について説明するための説明図である。FIG. 4 is an explanatory diagram for describing a first example of a technique for time alignment of essence data between two RTP packets; 2つのRTPパケットの間のエッセンスデータの時間合わせのための手法の第2の例について説明するための説明図である。FIG. 10 is an explanatory diagram for explaining a second example of a technique for time alignment of essence data between two RTP packets; 2つのRTPパケットの間のエッセンスデータの時間合わせのための手法の第3の例について説明するための説明図である。FIG. 11 is an explanatory diagram for explaining a third example of a technique for time alignment of essence data between two RTP packets; 2つのRTPパケットの間のエッセンスデータの時間合わせのための手法の第4の例について説明するための説明図である。FIG. 11 is an explanatory diagram for explaining a fourth example of a technique for time alignment of essence data between two RTP packets; 第1の実施形態に係るストリーム送信処理の流れの一例を示すフローチャートである。6 is a flow chart showing an example of the flow of stream transmission processing according to the first embodiment; 第1の実施形態に係るストリーム受信処理の流れの一例を示すフローチャートである。6 is a flow chart showing an example of the flow of stream reception processing according to the first embodiment; 第2の実施形態に係る放送信号処理ノードの構成の一例を示すブロック図である。FIG. 9 is a block diagram showing an example of the configuration of a broadcast signal processing node according to the second embodiment; FIG. 第2の実施形態の第1の変形例に係る放送信号処理ノードの構成の一例を示すブロック図である。FIG. 11 is a block diagram showing an example of the configuration of a broadcast signal processing node according to the first modified example of the second embodiment; FIG. 第2の実施形態の第2の変形例に係る放送信号処理ノードの構成の一例を示すブロック図である。FIG. 12 is a block diagram showing an example of the configuration of a broadcast signal processing node according to a second modified example of the second embodiment; FIG. エッセンス分離型ストリーム用のSDPオブジェクトの典型的なフォーマット構造について説明するための説明図である。FIG. 4 is an explanatory diagram for describing a typical format structure of an SDP object for an essence-separated stream; 図15を用いて説明したフォーマット構造を有する、SMPTE ST2110ストリームの属性を記述したSDPオブジェクトの一例を示す説明図である。FIG. 16 is an explanatory diagram showing an example of an SDP object describing attributes of an SMPTEST ST2110 stream having the format structure explained with reference to FIG. 15; 第3の実施形態においてエッセンス混在型ストリームのために定義されるSDPオブジェクトのフォーマット構造について説明するための説明図である。FIG. 11 is an explanatory diagram for explaining the format structure of an SDP object defined for an essence-mixed stream in the third embodiment; 図17を用いて説明したフォーマット構造を有する、ARIB STD-B73ストリームの属性を記述したSDPオブジェクトの一例を示す説明図である。FIG. 18 is an explanatory diagram showing an example of an SDP object describing attributes of an ARIB STD-B73 stream having the format structure explained with reference to FIG. 17; 第3の実施形態に係る放送局システムの概略的な構成の一例を示すブロック図である。FIG. 11 is a block diagram showing an example of a schematic configuration of a broadcasting station system according to a third embodiment; FIG. 第3の実施形態に係る送信ノードの構成の一例を示すブロック図である。FIG. 12 is a block diagram showing an example of the configuration of a transmission node according to the third embodiment; FIG. 図20に示した送信ノードにより実行され得る送信制御処理の流れの第1の例を示すフローチャートである。21 is a flow chart showing a first example of the flow of transmission control processing that can be executed by the transmission node shown in FIG. 20; 図20に示した送信ノードにより実行され得る送信制御処理の流れの第2の例を示すフローチャートである。21 is a flow chart showing a second example of the flow of transmission control processing that can be executed by the transmission node shown in FIG. 20; 第3の実施形態に係る制御ノードの構成の一例を示すブロック図である。FIG. 12 is a block diagram showing an example of the configuration of a control node according to the third embodiment; FIG. 図23に示した制御ノードにより実行され得る送信制御処理の流れの第1の例を示すフローチャートである。FIG. 24 is a flow chart showing a first example of the flow of transmission control processing that can be executed by the control node shown in FIG. 23; FIG. 図23に示した制御ノードにより実行され得る送信制御処理の流れの第2の例を示すフローチャートである。24 is a flow chart showing a second example of the flow of transmission control processing that can be executed by the control node shown in FIG. 23; 第4の実施形態に係る送信ノードの構成の一例を示すブロック図である。FIG. 12 is a block diagram showing an example of the configuration of a transmission node according to the fourth embodiment; FIG. 第4の実施形態に係る制御ノードの構成の一例を示すブロック図である。FIG. 14 is a block diagram showing an example of the configuration of a control node according to the fourth embodiment; FIG.

以下、添付の図面を参照して本開示に係る技術の実施形態を詳細に説明する。なお、本明細書及び図面において、同様に説明されることが可能な要素については、同一の符号を付することにより重複説明が省略され得る。 Hereinafter, embodiments of the technology according to the present disclosure will be described in detail with reference to the accompanying drawings. In addition, in the present specification and drawings, elements that can be described in the same manner can be omitted from redundant description by assigning the same reference numerals.

説明は、以下の順序で行われる。
1.概要
2.第1の実施形態
2-1.放送信号処理ノードの構成例
2-2.受信ストリーム処理部の詳細な構成例
2-3.処理の流れ
3.第2の実施形態
3-1.放送信号処理ノードの構成例
3-2.変形例
4.第1の実施形態及び第2の実施形態のまとめ
5.第3の実施形態
5-1.既存のSDPオブジェクトの例
5-2.SDPオブジェクトの新たなフォーマット
5-3.放送局システムの構成例
5-4.送信ノードの構成例
5-5.制御ノードの構成例
6.第4の実施形態
6-1.送信ノードの構成例
6-2.制御ノードの構成例
7.第3の実施形態及び第4の実施形態のまとめ
The description is given in the following order.
1. Overview 2. First Embodiment 2-1. Configuration example of broadcast signal processing node 2-2. Detailed configuration example of reception stream processing unit 2-3. Flow of processing3. Second Embodiment 3-1. Configuration example of broadcast signal processing node 3-2. Modification 4. Summary of the first embodiment and the second embodiment5. Third Embodiment 5-1. Example of existing SDP object 5-2. New format of SDP object 5-3. Configuration example of broadcasting station system 5-4. Configuration example of transmission node 5-5. Configuration example of control node6. Fourth Embodiment 6-1. Configuration example of transmission node 6-2. Configuration example of control node7. Summary of the third embodiment and the fourth embodiment

<<1.概要>>
まず、図1を用いて、本開示のいくつかの実施形態が適用され得る放送局システムの概要について説明する。図1は、本開示の実施形態に係る放送局システム1の構成の一例を示す概略図である。図1を参照すると、放送局システム1は、1つ以上のネットワーク装置12、カメラ20a、モニタ20b、IPゲートウェイ20c、IPゲートウェイ20d、カメラ22、マイクロフォン24、データサーバ26、統合プレイアウト(Integrated Playout)32、モニタ34、APS(Automatic Program control System)40及び制御端末50を含む。ネットワーク装置12、カメラ20a、モニタ20b、IPゲートウェイ20c、IPゲートウェイ20d、APS40、及び制御端末50は、IPドメイン10に属する。
<<1. Overview>>
First, using FIG. 1, an outline of a broadcasting station system to which some embodiments of the present disclosure can be applied will be described. FIG. 1 is a schematic diagram showing an example configuration of a broadcasting station system 1 according to an embodiment of the present disclosure. Referring to FIG. 1, the broadcasting station system 1 includes one or more network devices 12, a camera 20a, a monitor 20b, an IP gateway 20c, an IP gateway 20d, a camera 22, a microphone 24, a data server 26, an integrated playout ) 32 , a monitor 34 , an APS (Automatic Program Control System) 40 and a control terminal 50 . Network device 12 , camera 20 a , monitor 20 b , IP gateway 20 c , IP gateway 20 d , APS 40 and control terminal 50 belong to IP domain 10 .

(1)様々な装置の説明
ネットワーク装置12は、IPネットワークにおけるストリームの転送を担当する装置である。ネットワーク装置12の各々は、例えばルータ、スイッチ、ブリッジ又はリピータなど、いかなる種類のネットワーク装置であってもよい。ネットワーク装置12の各々は、低コストで導入可能な汎用品(COTS(Commercial Off-The-Shelf)ともいう)であってもよい。図1には6つのネットワーク装置12が示されているが、かかる例に限定されず、放送局システム1はいくつのネットワーク装置12を含んでもよい。IPドメイン10は、単一のネットワークで構成されてもよく、又は複数のサブネットワークを含んでもよい。
(1) Description of Various Devices The network device 12 is a device in charge of transferring streams in the IP network. Each of network devices 12 may be any type of network device, such as a router, switch, bridge or repeater. Each of the network devices 12 may be a general-purpose product (also called COTS (Commercial Off-The-Shelf)) that can be introduced at low cost. Although six network devices 12 are shown in FIG. 1 , the broadcasting station system 1 may include any number of network devices 12 without being limited to such an example. IP domain 10 may consist of a single network or may include multiple sub-networks.

カメラ20aは、放送素材を生成するキャプチャデバイスの一種である。例えば、カメラ20aは、何らかの対象を撮影して、映像データを生成する。カメラ20aは、内蔵されるマイクロフォンを通じて音声を取得して、音声データを生成してもよい。カメラ20aは、IPドメイン10に属し、映像データ及び音声データのデータストリームを一連のIPパケットへパケット化してIPネットワークへ送信することができる。 Camera 20a is a type of capture device that generates broadcast material. For example, the camera 20a shoots some object and generates video data. The camera 20a may acquire audio through a built-in microphone and generate audio data. The camera 20a belongs to the IP domain 10 and is capable of packetizing a data stream of video and audio data into a series of IP packets for transmission over the IP network.

モニタ20bは、放送素材を受信してコンテンツを再生する再生デバイスの一種である。例えば、モニタ20bは、映像データを受信して映像を再生する。モニタ20bは、音声データを受信して音声を再生してもよい。モニタ20bは、追加的に伝送される補助データを受信して、補助データを処理(例えば、字幕を再生)してもよい。モニタ20bは、コンテンツを編集するための編集機能をユーザへ提供してもよい。モニタ20bは、IPドメイン10へ属し、IPネットワーク上で転送されて来る一連のIPパケットを受信することができる。 The monitor 20b is a type of reproduction device that receives broadcast material and reproduces content. For example, the monitor 20b receives video data and reproduces the video. The monitor 20b may receive audio data and reproduce audio. The monitor 20b may receive additionally transmitted auxiliary data and process the auxiliary data (eg, play closed captions). The monitor 20b may provide the user with editing functions for editing content. The monitor 20b belongs to the IP domain 10 and can receive a series of IP packets transferred over the IP network.

IPゲートウェイ20cは、IPドメイン10と他の信号ドメインとの境界に位置するゲートウェイデバイスである。IPゲートウェイ20cは、1つ又は複数のネットワーク装置12へ接続する。図1の例において、IPゲートウェイ20cには、カメラ22、マイクロフォン24及びデータサーバ26がさらに接続されている。例えば、IPゲートウェイ20cは、映像データを搬送するSDI信号をカメラ22から受信し得る。また、IPゲートウェイ20cは、音声データを搬送するSDI信号をマイクロフォン24から受信し得る。また、IPゲートウェイ20cは、映像データ、音声データ及び補助データのうちの1つ以上を搬送するSDI信号をデータサーバ26から受信し得る。なお、IPドメイン10の外部で伝送される信号の信号形式は、例えばSD-SDI、HD-SDI、3G-SDI、6G-SDI若しくは12G-SDIといったSDIの任意の派生であってもよく、又は、SDI以外の信号形式であってもよい。IPゲートウェイ20cは、上述したようにカメラ22、マイクロフォン24及びデータサーバ26から受信される放送素材を搬送する信号を、必要に応じて多重化し又は逆多重化した後、一連のIPパケットへパケット化してIPネットワークへ送信することができる。 IP gateway 20c is a gateway device located at the boundary between IP domain 10 and other signaling domains. IP gateway 20 c connects to one or more network devices 12 . In the example of FIG. 1, a camera 22, a microphone 24 and a data server 26 are also connected to the IP gateway 20c. For example, IP gateway 20c may receive SDI signals carrying video data from camera 22 . IP gateway 20 c may also receive SDI signals carrying audio data from microphone 24 . IP gateway 20c may also receive SDI signals from data server 26 that carry one or more of video data, audio data and ancillary data. It should be noted that the signal format of signals transmitted outside the IP domain 10 may be any derivative of SDI, such as SD-SDI, HD-SDI, 3G-SDI, 6G-SDI or 12G-SDI, or , SDI may be used. IP gateway 20c packetizes signals carrying broadcast material received from cameras 22, microphones 24 and data server 26 as described above, into a series of IP packets after multiplexing or demultiplexing as necessary. can be sent to the IP network via

IPゲートウェイ20dもまた、IPドメイン10と他の信号ドメインとの境界に位置するゲートウェイデバイスである。IPゲートウェイ20dは、1つ又は複数のネットワーク装置12へ接続する。図1の例では、IPゲートウェイ20dには、統合プレイアウト32及びモニタ34がさらに接続されている。例えば、IPゲートウェイ20dは、IPネットワーク上で転送されて来るIPパケットを受信し、それらIPパケットをSDI信号(又は他の信号形式の信号)へ変換して、統合プレイアウト32及びモニタ34の一方又は双方へ送信することができる。なお、当然ながら、IPゲートウェイ20cがIPゲートウェイ20dと同様にIPパケットをSDI信号へ変換する機能を有していてもよい。また、IPゲートウェイ20dがIPゲートウェイ20cと同様にSDI信号をIPパケットへ変換する機能を有していてもよい。 IP gateway 20d is also a gateway device located at the boundary between IP domain 10 and other signaling domains. IP gateway 20 d connects to one or more network devices 12 . In the example of FIG. 1, an integrated playout 32 and a monitor 34 are further connected to the IP gateway 20d. For example, IP gateway 20d receives IP packets transferred over an IP network, converts the IP packets to SDI signals (or signals in other signal formats), and sends them to one of integrated playout 32 and monitor 34. Or you can send to both. Of course, the IP gateway 20c may have the function of converting IP packets into SDI signals, like the IP gateway 20d. Also, the IP gateway 20d may have a function of converting an SDI signal into an IP packet like the IP gateway 20c.

APS40は、予め決定されるスケジュールに従って、テレビジョン番組の放送を進行させるシステムである。例えば、APS40は、IPネットワークへ制御メッセージを送信して、所定の時刻に所与の送信元(例えば、カメラ及びマイクロフォン、又はデータサーバ)から出力されるデータストリームを統合プレイアウト32へ伝送させる。データストリームを受信した統合プレイアウト32は、放送局の回線を通じてアンテナへテレビジョン番組の放送信号を送出する。データストリームは、例えばモニタ20b又はモニタ34にも配信され、放送局内でも放送コンテンツが再生され得る。 The APS 40 is a system that advances broadcasting of television programs according to a predetermined schedule. For example, APS 40 sends control messages to the IP network to cause transmission of data streams output from given sources (eg, cameras and microphones, or data servers) at predetermined times to integrated playout 32 . The integrated playout 32, which has received the data stream, transmits a broadcast signal of the television program to the antenna through the line of the broadcasting station. The data stream may also be delivered to monitor 20b or monitor 34, for example, to reproduce the broadcast content within the broadcast station.

制御端末50は、放送局システム1に含まれるノードの管理及び制御に関連するユーザインタフェースをユーザへ提供する端末装置である。制御端末50は、放送局システム1に専用のユーザ端末であってもよく、又はPC(Personal Computer)若しくはスマートフォンといった汎用的な端末であってもよい。制御端末50は、例えば、放送局内のネットワーク上でのストリームの伝送に関連する設定情報を、ユーザインタフェースを介して取得してシステム内のデータベースへ登録する。また、制御端末50は、例えば、ユーザインタフェースを介して所与のノード間のストリームの伝送を求めるリクエストを受け付ける。 The control terminal 50 is a terminal device that provides a user with a user interface related to management and control of nodes included in the broadcasting station system 1 . The control terminal 50 may be a user terminal dedicated to the broadcasting station system 1, or may be a general-purpose terminal such as a PC (Personal Computer) or a smart phone. The control terminal 50 acquires, for example, setting information related to stream transmission on the network within the broadcasting station via the user interface and registers it in the database within the system. The control terminal 50 also accepts requests for transmission of streams between given nodes via, for example, a user interface.

(2)IPマルチキャスト
放送局システム1のIPドメイン10内の放送信号ストリームの伝送は、典型的には、マルチキャストで行われる。マルチキャストされるパケットの送信元IPアドレスは送信ノードのIPアドレスであり、宛て先IPアドレスは特定のアドレス範囲に属するマルチキャストアドレスである。個々のマルチキャストアドレスを宛て先とするマルチキャストパケットを受信するノードの集合をマルチキャストグループといい、マルチキャストアドレスをグループアドレスともいう。あるストリームを受信することを意図する受信ノードは、そのストリームに対応するマルチキャストグループへの加入(join)を通知するメッセージ(例えば、IGMP(Internet Group Management Protocol) JOIN)を近傍のルータへ送信する。すると、ルータ間でマルチキャストツリーを更新するためのメッセージ交換が行われ、特定の送信ノードから送信されるストリームがIPネットワークを介して受信ノードへ配信されるようになる。受信ノードは、マルチキャストストリームの受信を終了する際には、マルチキャストグループからの離脱(leave)を通知するメッセージを近傍のルータへ送信する。なお、上述した例に限定されず、本開示に係る技術は、ストリームがユニキャストで伝送されるケースにも適用可能である。
(2) IP Multicast Transmission of broadcast signal streams within the IP domain 10 of the broadcasting station system 1 is typically performed by multicast. The source IP address of the multicast packet is the IP address of the sending node, and the destination IP address is a multicast address belonging to a specific address range. A set of nodes that receive multicast packets destined for individual multicast addresses is called a multicast group, and a multicast address is also called a group address. A receiving node that intends to receive a stream sends a message (eg, Internet Group Management Protocol (IGMP) JOIN) to its neighboring routers to join the multicast group corresponding to that stream. Messages are then exchanged between the routers to update the multicast tree, and a stream transmitted from a specific sending node is delivered to the receiving node via the IP network. When the receiving node finishes receiving the multicast stream, the receiving node sends a message notifying of leaving the multicast group to the neighboring routers. It should be noted that the technology according to the present disclosure is not limited to the example described above, and can also be applied to cases where streams are transmitted by unicast.

(3)IPドメインの論理的構成例
図2は、図1に示した放送局システム1のIPドメイン10の論理的な構成の一例を示している(簡明さのために、ここではAPS40及び制御端末50は省略されている)。図2を参照すると、カメラ20aに相当する第1ノードは、センダ(sender)60aを含む。「センダ」とは、ストリームを送信する能力を有する機能エンティティである。IPゲートウェイ20cに相当する第2ノードは、センダ60b、60c及び60dを含む。センダ60b、60c及び60dは、IPゲートウェイ20cにより収容される個々のストリームの送信元の装置に相当し得る。モニタ20bに相当する第3ノードは、レシーバ65aを含む。「レシーバ」とは、ストリームを受信する能力を有する機能エンティティである。IPゲートウェイ20dに相当する第4ノードは、レシーバ65b及び65cを含む。レシーバ65b及び65cは、IPゲートウェイ20dにより収容される個々のストリームの受信先の装置に相当し得る。
(3) Logical Configuration Example of IP Domain FIG. 2 shows an example of a logical configuration of the IP domain 10 of the broadcasting station system 1 shown in FIG. terminal 50 is omitted). Referring to FIG. 2, the first node corresponding to camera 20a includes sender 60a. A "sender" is a functional entity capable of sending a stream. A second node corresponding to IP gateway 20c includes senders 60b, 60c and 60d. Senders 60b, 60c and 60d may correspond to devices from which individual streams are served by IP gateway 20c. A third node, corresponding to monitor 20b, includes a receiver 65a. A "receiver" is a functional entity capable of receiving a stream. A fourth node corresponding to IP gateway 20d includes receivers 65b and 65c. Receivers 65b and 65c may correspond to devices to which individual streams are received by IP gateway 20d.

上の説明から理解されるように、1つのノード(「カード」と呼ばれてもよい)は、1つの物理エンティティを表現する。図1の例に限定されず、1つのノードは、機能エンティティとして、任意の数のセンダ及び/又は任意の数のレシーバを含んでよい。また、1つのノード内で複数の機能エンティティを包含する論理的な単位(例えば、図中の破線枠参照)が定義されてもよい(例えば、1つのIPゲートウェイに収容される1つのデバイスが複数のストリームを送信し又は受信するケース)。例えば、AMWAにより検討されているNMOSは、こうした論理的なシステムモデルを前提として、IPドメインでのストリームの伝送を管理し及び制御するためのアプリケーションプロトコルインタフェース(API)の仕様を規定している。 As understood from the above description, one node (which may be called a "card") represents one physical entity. Without being limited to the example of FIG. 1, a node may include any number of senders and/or any number of receivers as functional entities. Also, a logical unit (for example, see the dashed frame in the figure) that includes multiple functional entities within one node may be defined (for example, one device accommodated in one IP gateway may be (case of sending or receiving a stream of For example, NMOS, which is being considered by AMWA, presupposes such a logical system model and specifies an application protocol interface (API) specification for managing and controlling the transmission of streams in the IP domain.

なお、本明細書において、ノード20a、20b、20c及び20dを互いに区別する必要が無い場合には、符号の末尾のアルファベットを省略することによりこれらをノード20と総称する。センダ60a、60b、60c、60d(センダ60)及びレシーバ65a、65b、65c(レシーバ65)、並びに他の構成要素の符号についても同様である。 In this specification, when there is no need to distinguish between the nodes 20a, 20b, 20c, and 20d, they are collectively referred to as nodes 20 by omitting the alphabet at the end of the reference numerals. The same applies to senders 60a, 60b, 60c, 60d (sender 60) and receivers 65a, 65b, 65c (receiver 65), as well as other component numbers.

(4)エッセンスとストリーム
上述したように、テレビジョン番組のコンテンツは、概して、映像データ、音声データ及び補助データという3種類の放送素材のデータから構成される。本明細書では、放送素材の種類を区別してこれらコンテンツの構成要素へ言及するために、「エッセンス」との語を用いる。言い換えると、エッセンスは、データとして表現された放送素材である。エッセンスをIPネットワーク上で伝送しようとする場合、エッセンスは、あるIPベースのプロトコルに従って、デジタル信号へ変換されパケット化される。エッセンスを搬送する一連のIPパケットには、ストリーム単位で共通するポート番号が付与される。即ち、ストリームは、IPアドレス及びポート番号が共通するIPパケットのシーケンスであり得る。IPベースのストリーム伝送プロトコルとして、後述するどのプロトコルが使用される場合にも、通常、パケットは、アプリケーションレイヤではRTP(Real-time Transport Protocol)、トランスポートレイヤではUDP(User Datagram Protocol)に従って伝送される。
(4) Essence and Stream As described above, television program content generally consists of three types of broadcast material data: video data, audio data, and auxiliary data. The term "essence" is used herein to distinguish between types of broadcast material and to refer to these content components. In other words, the essence is broadcast material represented as data. When an essence is to be transmitted over an IP network, it is converted into digital signals and packetized according to some IP-based protocol. A series of IP packets carrying the essence is assigned a common port number for each stream. That is, a stream can be a sequence of IP packets with a common IP address and port number. No matter which protocol is used as the IP-based stream transmission protocol, packets are normally transmitted according to RTP (Real-time Transport Protocol) in the application layer and UDP (User Datagram Protocol) in the transport layer. be.

(5)IPベースのストリーム伝送プロトコル
IPベースのストリーム伝送のための代表的なプロトコルの1つは、SMPTE ST2022-6である。SMPTE ST2022-6は、SDI信号をそのままIPパケットへマッピングする。そのため、単一のST2022-6ストリームが、異なる種類のエッセンスとブランキング期間に相当するデータとを含む。ST2022-6ストリームは、IPドメイン及びSDIドメインが混在する過渡期の放送局システムにおいて好適であり得る。
(5) IP-based stream transmission protocol One of the representative protocols for IP-based stream transmission is SMPTE ST2022-6. SMPTE ST 2022-6 maps the SDI signal as-is to the IP packet. Therefore, a single ST2022-6 stream contains different types of essence and data corresponding to blanking periods. The ST2022-6 stream may be suitable for transitional broadcast station systems with mixed IP and SDI domains.

IPベースのストリーム伝送のための代表的なプロトコルの他の1つは、SMPTE ST2110である。SMPTE ST2110は、異なる種類のエッセンスをそれぞれ異なるストリームへマッピングする。そのため、単一のストリームは単一の種類のエッセンスのみを含み、どのストリームもブランキング期間に相当するデータを含まない。SMPTE ST2110-10は、PTPの仕組みに基づく、放送局システムに参加するノード間の高精度の同期のための手法を規定している。SMPTE ST2110-20は、非圧縮の映像エッセンスの伝送フォーマットを規定している。SMPTE ST2110-21は、映像エッセンスのトラフィックシェーピングのための手法を規定している。SMPTE ST2110-30は、非圧縮のPCM音声エッセンスの伝送フォーマットを規定している。SMPTE ST2110-31は、AES3音声エッセンスの伝送フォーマットを規定している。SMPTE ST2110-40は、補助データエッセンスの伝送フォーマットを規定している。なお、SMPTE ST2110シリーズでは、映像エッセンスの圧縮はサポートされておらず、誤り訂正符号化/復号も行われない。 Another typical protocol for IP-based stream transmission is SMPTE ST2110. SMPTE ST 2110 maps different types of essences to different streams. Therefore, a single stream contains only a single type of essence, and no stream contains data corresponding to blanking periods. SMPTE ST2110-10 defines a technique for highly accurate synchronization between nodes participating in a broadcasting station system based on the PTP mechanism. SMPTE ST2110-20 defines a transmission format for uncompressed video essence. SMPTE ST2110-21 defines a technique for traffic shaping of video essence. SMPTE ST2110-30 defines a transmission format for uncompressed PCM audio essence. SMPTE ST2110-31 defines a transmission format for AES3 voice essence. SMPTE ST2110-40 defines the transmission format of the auxiliary data essence. It should be noted that the SMPTE ST2110 series does not support compression of video essence, nor does error correction encoding/decoding.

(6)SMPTE ST2110-10での時刻同期
テレビジョン番組を正確なスケジュールに従って放送するためには、システム内のノードが正確な時刻を認識していることを要する。また、異なる複数のノードから受信されるストリームを多重化し、複数の映像を合成し、又は映像と音声とを同時に再生する場合にも、ノード間で時刻の精細な同期が確立されていることを要する。図3は、こうした時刻同期の目的のための、SMPTE ST2110-10により規定されたシステムタイミングモデルについて説明するための説明図である。
(6) Time Synchronization in SMPTE ST2110-10 In order to broadcast television programs according to an accurate schedule, nodes in the system must know the exact time. Also, when multiplexing streams received from different nodes, synthesizing multiple videos, or reproducing video and audio simultaneously, it is necessary to ensure that fine time synchronization is established between nodes. need. FIG. 3 is an explanatory diagram for explaining the system timing model defined by SMPTE ST2110-10 for the purpose of such time synchronization.

図3には、一例として、放送局システム1のノード20a及びノード20b、並びに共通基準クロック70が示されている。共通基準クロック70は、高精度の時刻源(例えば、GPS(Global Positioning System)衛星などのGNSS(Global Navigation Satellite System)衛星)に同期し、いわゆるPTPグランドマスタとして動作する。共通基準クロック70は、PTPの仕組みに従って、システム内のスレーブノードへ同期メッセージを配信する。 FIG. 3 shows the nodes 20a and 20b of the broadcasting station system 1 and the common reference clock 70 as an example. The common reference clock 70 synchronizes with a highly accurate time source (for example, a GNSS (Global Navigation Satellite System) satellite such as a GPS (Global Positioning System) satellite) and operates as a so-called PTP grandmaster. Common reference clock 70 distributes synchronization messages to slave nodes in the system according to the PTP mechanism.

ノード20aは、PTPのスレーブノードである。ノード20aは、自身のデバイス内部クロック72aを共通基準クロック70に同期させ、共通基準クロック70から受信される同期メッセージに基づいてその同期を維持(例えば、遅延を調整)する。ノード20aの映像用メディアクロック73aは、デバイス内部クロック72aにロックされ、映像固有の周波数で進行する。音声用メディアクロック76aは、デバイス内部クロック72aにロックされ、音声固有の周波数で進行する。SMPTE ST2110-20により規定された映像固有の周波数は90kHzであり、SMPTE ST2110-30により規定された音声固有の周波数は48kHzである。 The node 20a is a PTP slave node. Node 20 a synchronizes its device internal clock 72 a to common reference clock 70 and maintains that synchronization (eg, adjusts delay) based on synchronization messages received from common reference clock 70 . The video media clock 73a of the node 20a is locked to the device internal clock 72a and runs at a video-specific frequency. Audio media clock 76a is locked to device internal clock 72a and runs at audio-specific frequencies. The video specific frequency specified by SMPTE ST2110-20 is 90 kHz and the audio specific frequency specified by SMPTE ST2110-30 is 48 kHz.

通常、RTPパケットにはメディアクロックに対してランダムに生成されるオフセットを有するタイムスタンプが付与されるが、SMPTE ST2110-10ではオフセットはゼロとされる。それにより、何らかの障害に起因してセンダがリスタートした場合のストリーム伝送の迅速な復旧が可能とされる(なぜなら、ランダムオフセットの決定のための処理が省略されるためである)。即ち、ノード20aの映像用RTPクロック74aは、映像用メディアクロック73aに対してオフセットを有さず、映像用メディアクロック73aと同一の時刻を示す。そして、ノード20aが送信する映像エッセンスのRTPストリームの各パケットのRTPヘッダには、映像用RTPクロック74aに従ってRTPタイムスタンプが付与される。同様に、ノード20aの音声用RTPクロック77aは、音声用メディアクロック76aに対してオフセットを有さず、音声用メディアクロック76aと同一の時刻を示す。そして、ノード20aが送信する音声エッセンスのRTPストリームの各パケットのRTPヘッダには、音声用RTPクロック77aに従ってRTPタイムスタンプが付与される。 Normally, RTP packets are timestamped with a randomly generated offset relative to the media clock, but in SMPTE ST2110-10 the offset is zero. This allows rapid restoration of stream transmission when the sender is restarted due to some failure (because the process for determining the random offset is omitted). That is, the video RTP clock 74a of the node 20a has no offset with respect to the video media clock 73a and indicates the same time as the video media clock 73a. An RTP time stamp is added to the RTP header of each packet of the RTP stream of the video essence transmitted by the node 20a according to the video RTP clock 74a. Similarly, the audio RTP clock 77a of the node 20a has no offset with respect to the audio media clock 76a and indicates the same time as the audio media clock 76a. An RTP time stamp is added to the RTP header of each packet of the RTP stream of the audio essence transmitted by the node 20a according to the audio RTP clock 77a.

概していうと、SMPTE ST2110-10において、映像又は音声をキャプチャするデバイスは、キャプチャ時刻をRTPタイムスタンプとして各パケットに付与する。コンテンツをストレージからプレイバックするデバイスは、通信インタフェースからのエッセンスの出力時刻をRTPタイムスタンプとして各パケットに付与する。SDI信号をIPパケットへ変換するデバイスは、アラインメント時点のSDI信号のクロック値をRTPタイムスタンプとして各パケットに付与する。 Generally speaking, in SMPTE ST2110-10, a device that captures video or audio attaches the capture time as an RTP timestamp to each packet. A device that plays back content from a storage attaches the essence output time from the communication interface to each packet as an RTP time stamp. A device that converts an SDI signal into IP packets attaches the clock value of the SDI signal at the time of alignment to each packet as an RTP timestamp.

ノード20bもまた、PTPのスレーブノードである。ノード20bは、自身のデバイス内部クロック72bを共通基準クロック70に同期させ、共通基準クロック70から受信される同期メッセージに基づいてその同期を維持(例えば、遅延を調整)する。図には示していないものの、ノード20aと同様に、ノード20bも、デバイス内部クロック72bにロックされたメディアクロックと、メディアクロックに対しオフセットを有しないRTPクロックとを有する。ノード20bは、例えばノード20aから送信される映像エッセンスのRTPストリーム及び音声エッセンスのRTPストリームをそれぞれ異なるポート番号で受信する。そして、ノード20bは、自身のRTPクロックと、受信したRTPストリームの各パケットのRTPヘッダに付与されたRTPタイムスタンプとに基づいて、パケット間の時間合わせ(time alignment)を行う。PTPを活用するこうした仕組みにより、放送局のIPネットワークへ参加するノード間で、誤差10μ秒以下という高精度の時間同期が可能とされる。 Node 20b is also a PTP slave node. Node 20 b synchronizes its device internal clock 72 b to common reference clock 70 and maintains that synchronization (eg, adjusts delay) based on synchronization messages received from common reference clock 70 . Although not shown, like node 20a, node 20b also has a media clock locked to device internal clock 72b and an RTP clock that has no offset relative to the media clock. The node 20b receives, for example, the RTP stream of the video essence and the RTP stream of the audio essence transmitted from the node 20a with different port numbers. Then, the node 20b performs time alignment between packets based on its own RTP clock and the RTP timestamp added to the RTP header of each packet of the received RTP stream. Such a scheme that utilizes PTP enables high-precision time synchronization with an error of 10 μs or less between nodes participating in the IP network of a broadcasting station.

図4は、図3を用いて説明したSMPTE ST2110-10のシステムタイミングモデルに基づく映像エッセンスと音声エッセンスとの間の時間合わせについて説明するための説明図である。図4を参照すると、ノード20aは、映像エッセンスのRTPストリーム81及び音声エッセンスのRTPストリーム82を並列的にネットワークへ送出する。RTPストリーム81に含まれるパケット(V、V、V、…)の各々は、映像用RTPクロックに従って付与されたRTPタイムスタンプとシーケンス番号とをRTPヘッダ内に有する。RTPストリーム82に含まれるパケット(A、A、A、…)の各々は、音声用RTPクロックに従って付与されたRTPタイムスタンプとシーケンス番号とをRTPヘッダ内に有する。ノード20bは、UDPポートPにおいて、RTPストリーム81の一連のRTPパケットを受信し、受信したRTPパケットをシーケンス番号順に処理する。また、ノード20bは、UDPポートPにおいて、RTPストリーム82の一連のRTPパケットを受信し、受信したRTPパケットをシーケンス番号順に処理する。例えば、ノード20bは、映像及び音声を同期的に再生しようする場合、RTPストリーム81の各パケットのRTPタイムスタンプとRTPストリーム82の各パケットのRTPタイムスタンプとを比較して、映像及び音声の再生時刻(例えば、フレームタイミング)を互いに同期させる。なお、複数の映像エッセンスの間、複数の音声エッセンスの間、及び映像エッセンス又は音声エッセンスと補助データエッセンスとの間の時間合わせも同様に行われ得る。 FIG. 4 is an explanatory diagram for explaining time alignment between a video essence and an audio essence based on the SMPTE ST2110-10 system timing model described with reference to FIG. Referring to FIG. 4, the node 20a transmits an RTP stream 81 of video essence and an RTP stream 82 of audio essence in parallel to the network. Each packet (V 1 , V 2 , V 3 , . . . ) included in the RTP stream 81 has an RTP time stamp and a sequence number assigned according to the video RTP clock in the RTP header. Each of the packets (A 1 , A 2 , A 3 , . . . ) included in the RTP stream 82 has an RTP timestamp and a sequence number assigned according to the audio RTP clock in the RTP header. Node 20b receives a series of RTP packets of RTP stream 81 at UDP port PV and processes the received RTP packets in sequence number order. Node 20b also receives a series of RTP packets of RTP stream 82 at UDP port PA and processes the received RTP packets in sequence number order. For example, when reproducing video and audio synchronously, the node 20b compares the RTP time stamp of each packet of the RTP stream 81 with the RTP time stamp of each packet of the RTP stream 82, and reproduces video and audio. Synchronize times (eg, frame timing) with each other. It should be noted that time alignment between video essences, between audio essences, and between video or audio essences and auxiliary data essences can be performed as well.

(7)ARIB STD-B73
相互に関連する映像、音声及び補助データをSMPTE ST2110のように別々のストリームで伝送すると、トランスポートレイヤでそれらストリームのポート番号が相違することから、受信側でもとのコンテンツを再構築する処理が複雑化する。ポート番号が相違すれば、IPネットワーク上での経路制御の結果として、個々のストリームが辿る伝送経路の違いからストリームごとに異なる遅延を受ける可能性もある。こうした不都合を解消するために、日本国内の標準化団体であるARIBは、映像、音声及び補助データを単一のストリームで伝送するためのデータ構造の規定として、ARIB STD-B73を規格化済みである。
(7) ARIB STD-B73
When video, audio and ancillary data that are related to each other are transmitted in separate streams like SMPTE ST2110, the port numbers of these streams are different in the transport layer, so processing to reconstruct the original contents on the receiving side is required. Complicated. If the port numbers are different, each stream may receive a different delay due to the difference in the transmission path followed by each stream as a result of path control on the IP network. In order to eliminate these inconveniences, ARIB, a standardization organization in Japan, has standardized ARIB STD-B73 as a data structure specification for transmitting video, audio and auxiliary data in a single stream. .

図5は、ARIB STD-B73 1.0版の第2章に記述されているデータグラムの構成について説明するための説明図である。図5に太線の枠で示したデータグラムは、先行するネットワークヘッダ及び後続するFCS(Frame Check Sequence)と共に、1つのパケットを構成する。ネットワークヘッダは、例えば、MAC(Medium Access Control)ヘッダ(例えば、イーサネットヘッダ)、IPヘッダ及びUDPヘッダを含む。エッセンスデータのためのRTPデータグラムは、RTPヘッダ及び共通ヘッダを含むトランスポートヘッダと、エッセンスヘッダと、エッセンスペイロードとを含む。エッセンスデータグラムは、エッセンスヘッダと、エッセンスペイロードとを含む。共通ヘッダ、エッセンスヘッダ及びエッセンスペイロードを含む部分をRTPペイロードともいう。一方、図には示していないものの、FECデータのためのRTPデータグラムは、エッセンスヘッダ及びエッセンスペイロードの代わりにFECペイロードを含む。なお、本明細書において、パケット及びデータグラムという用語は、互換可能に使用される。これら用語の意味は、当業者により容易に理解されるであろう。 FIG. 5 is an explanatory diagram for explaining the structure of a datagram described in Chapter 2 of ARIB STD-B73 Version 1.0. A datagram indicated by a thick frame in FIG. 5 constitutes one packet together with a preceding network header and a subsequent FCS (Frame Check Sequence). Network headers include, for example, MAC (Medium Access Control) headers (eg, Ethernet headers), IP headers, and UDP headers. An RTP datagram for essence data includes a transport header including an RTP header and a common header, an essence header, and an essence payload. An essence datagram includes an essence header and an essence payload. The portion including the common header, essence header and essence payload is also called RTP payload. On the other hand, although not shown, the RTP datagram for FEC data contains the FEC payload instead of the essence header and essence payload. Note that the terms packet and datagram are used interchangeably herein. The meaning of these terms will be readily understood by those skilled in the art.

RTPヘッダは、例えば、データ項目として「ペイロードタイプ」、「シーケンス番号」及び「タイムスタンプ」を含む。「ペイロードタイプ」には固定的な値(例えば、110)が設定される。「シーケンス番号」の値は各伝送で1インクリメントされる。その初期値はランダムに設定され得る。「タイムスタンプ」の値は単調に線形的にインクリメントされるものの、ARIB STD-B73 1.0版は本フィールドを同期に使用しないことを規定している。 The RTP header includes, for example, "payload type", "sequence number" and "time stamp" as data items. A fixed value (for example, 110) is set in the “payload type”. The "sequence number" value is incremented by one with each transmission. Its initial value can be set randomly. Although the "timestamp" value is monotonically linearly incremented, ARIB STD-B73 Version 1.0 specifies that this field is not used for synchronization.

共通ヘッダは、例えば、データ項目として「フレームカウント」、「データグラムタイプ」及び「シーケンス番号」を含む。共通ヘッダの「フレームカウント」には、対応するエッセンスヘッダの「フレームカウント」と同じ値が設定される。「データグラムタイプ」には、対応するデータグラムがエッセンスデータグラムであるか又はFEC(Forward Error Correction)データグラムであるかを示す値が設定される。「シーケンス番号」の値は、映像エッセンス、音声エッセンス及び補助データエッセンス(並びにFEC)で別々に、伝送の都度1インクリメントされる。その初期値はランダムに設定され得る。 The common header includes, for example, "frame count", "datagram type" and "sequence number" as data items. The "frame count" of the common header is set to the same value as the "frame count" of the corresponding essence header. A value indicating whether the corresponding datagram is an essence datagram or an FEC (Forward Error Correction) datagram is set in the "datagram type". The "sequence number" value is incremented by one for each transmission separately for video essence, audio essence and auxiliary data essence (and FEC). Its initial value can be set randomly.

エッセンスヘッダは、例えば、データ項目として「ペイロードタイプ」及び「フレームカウント」を含む。「ペイロードタイプ」には、後続するエッセンスペイロードに含まれるエッセンスのタイプを示す値が設定される(0:映像、1:音声、2:補助データ、など)。エッセンスヘッダの「フレームカウント」には、受信側で各エッセンスのデータグラムの同期を取るための値が設定される。SMPTE ST2059-1で定義されているエポックの時刻が「フレームカウント」の初期値ゼロとして使用される。「フレームカウント」の値は新しい映像フレームの開始の都度1インクリメントされ、同じ映像フレームに属する全てのエッセンスデータグラムに同じ値が設定される。 The essence header includes, for example, "payload type" and "frame count" as data items. "Payload type" is set with a value indicating the type of essence contained in the subsequent essence payload (0: video, 1: audio, 2: auxiliary data, etc.). A value for synchronizing datagrams of each essence on the receiving side is set in the "frame count" of the essence header. The epoch time defined in SMPTE ST2059-1 is used as the initial value of zero for the "frame count". The "frame count" value is incremented by one at the start of each new video frame, and all essence datagrams belonging to the same video frame are set to the same value.

図6は、ARIB STD-B73に従った単一ストリームでの映像エッセンス及び音声エッセンスの伝送について説明するための説明図である。図6を参照すると、ノード20cは、映像エッセンスのためのパケット及び音声エッセンスのためのパケットの双方を含むRTPストリーム83をネットワークへ送出する。RTPストリーム83に含まれるパケット(V、A、V、A、…)の各々は、フレームカウント値をエッセンスヘッダ内に有する。ノード20dは、単一のポートPにおいて、RTPストリーム83の一連のRTPパケットを受信し、受信したRTPパケットをシーケンス番号順に処理する。上述したように、ARIB STD-B73によれば、RTPヘッダ内のシーケンス番号の順で前後に並ぶ一群のRTPパケットが同じ映像フレームに属し、同じフレームカウント値を有する。そのため、ノード20dは、映像エッセンス及び音声エッセンスを含む当該一群のRTPパケットを同期的に処理することができる。 FIG. 6 is an explanatory diagram for explaining transmission of video essence and audio essence in a single stream according to ARIB STD-B73. Referring to FIG. 6, node 20c sends an RTP stream 83 containing both packets for video essence and packets for audio essence to the network. Each of the packets (V 1 , A 1 , V 2 , A 2 , . . . ) contained in RTP stream 83 has a frame count value in its essence header. Node 20d receives a series of RTP packets of RTP stream 83 at a single port PM and processes the received RTP packets in sequence number order. As described above, according to ARIB STD-B73, a group of RTP packets that are arranged one behind the other in the order of sequence numbers in the RTP header belong to the same video frame and have the same frame count value. Therefore, the node 20d can synchronously process the group of RTP packets containing video essence and audio essence.

しかし、ARIB STD-B73は、放送局システムに参加するノード間でどのように協調的に動作してストリームを処理すべきかを規定していない。 However, ARIB STD-B73 does not specify how the nodes participating in the broadcasting station system should operate cooperatively to process streams.

例えば、ストリームの伝送に関与するノード間で高精度の同期が確立されておらず、パケット間の時間合わせのために使用すべき時刻情報用のフィールドに合意が無ければ、放送局システム内でやり取りされる多様なエッセンスを柔軟に組み合わせて放送コンテンツを構成することができない。そこで、後述する第1の実施形態及び第2の実施形態において、放送局のIPネットワーク上で映像データ、音声データ又は補助データといったエッセンスデータを単一のストリームで伝送するプロトコル(例えば、ARIB STD-B73)を利用する際に、エッセンスデータの適切な時間合わせを行う仕組みを提案する。 For example, if high-precision synchronization is not established between nodes involved in stream transmission, and if there is no consensus on the field for time information that should be used for time alignment between packets, communication within the broadcasting station system Broadcast contents cannot be configured by flexibly combining various essences. Therefore, in a first embodiment and a second embodiment to be described later, a protocol (for example, ARIB STD- B73), we propose a mechanism for appropriately adjusting the time of essence data.

加えて、SMPTE ST2110ストリームのために通常利用されるSDPオブジェクトのフォーマットは、フォーマット構造においても、記述される情報の内容においても、ARIB STD-B73ストリームの特性に必ずしも適していない。そこで、後述する第3の実施形態及び第4の実施形態において、放送局のIPネットワーク上で映像データ、音声データ又は補助データといったエッセンスデータを単一のストリームで伝送するプロトコルを利用する際に、当該ストリームの伝送を適切にセットアップすることを可能にする手法を説明する。 In addition, the format of the SDP objects normally used for SMPTE ST2110 streams is not necessarily suitable for the characteristics of ARIB STD-B73 streams, either in format structure or in the information content described. Therefore, in the third and fourth embodiments described later, when using a protocol for transmitting essence data such as video data, audio data, or auxiliary data in a single stream on an IP network of a broadcasting station, Techniques are described that allow the transmission of the stream to be properly set up.

なお、本明細書において、異なる種類のエッセンスデータが単一のストリームで伝送されるようなストリームを、エッセンス混在型ストリームともいう。エッセンス混在型ストリームの例は、ARIB STD-B73ストリーム及びSMPTE ST2022-6ストリームを含む。また、本明細書において、異なる種類のエッセンスデータがそれぞれ異なるストリームで伝送されるようなストリームを、エッセンス分離型ストリームともいう。エッセンス分離型ストリームの例は、SMPTE ST2110ストリームを含む。 In this specification, a stream in which different types of essence data are transmitted in a single stream is also called an essence-mixed stream. Examples of mixed-essence streams include ARIB STD-B73 streams and SMPTE ST2022-6 streams. Also, in this specification, a stream in which different types of essence data are transmitted in different streams is also referred to as an essence separation type stream. Examples of essence-separated streams include SMPTE ST2110 streams.

<<2.第1の実施形態>>
本章で説明する放送信号処理ノード100は、上述したセンダ60及びレシーバ65の双方の機能性を含む。しかしながら、当業者にとって明らかなように、放送信号処理ノード100において、センダ60及びレシーバ65のうちの一方の機能性が省略されてもよい。放送信号処理ノード100は、放送局システム1において、例えば、図1及び図2を用いて説明したノード20a~20dのいずれかに相当し得る。
<<2. First Embodiment>>
The broadcast signal processing node 100 described in this section includes the functionality of both the sender 60 and receiver 65 described above. However, as will be apparent to those skilled in the art, in broadcast signal processing node 100 the functionality of one of sender 60 and receiver 65 may be omitted. The broadcast signal processing node 100 can correspond to any one of the nodes 20a to 20d described with reference to FIGS. 1 and 2 in the broadcasting station system 1, for example.

<2-1.放送信号処理ノードの構成例>
図7は、第1の実施形態に係る放送信号処理ノード100の構成の一例を示すブロック図である。図7を参照すると、放送信号処理ノード100は、デバイス内部クロック110、メディアクロック112、RTPクロック114、PTP処理部116、通信部120、送信ストリーム処理部130、受信ストリーム処理部140、データ処理部180及び制御部190を備える。
<2-1. Configuration example of broadcast signal processing node>
FIG. 7 is a block diagram showing an example of the configuration of the broadcast signal processing node 100 according to the first embodiment. Referring to FIG. 7, broadcast signal processing node 100 includes device internal clock 110, media clock 112, RTP clock 114, PTP processing unit 116, communication unit 120, transmission stream processing unit 130, reception stream processing unit 140, data processing unit 180 and a control unit 190 .

(1)デバイス内部クロック
デバイス内部クロック(機器内部クロックともいう)110は、放送信号処理ノード100が保持する固有の内部的なクロックである。本実施形態において、デバイス内部クロック110は、PTPの時刻源に直接的に又は間接的に同期する。典型的には、放送信号処理ノード100がPTPスレーブである場合、デバイス内部クロック110は、PTPグランドマスタを介してPTPの時刻源に間接的に同期する。一方、放送信号処理ノード100がPTPマスタである場合、デバイス内部クロック110は、PTPの時刻源に直接的に同期する。例えば、後述する制御部190は、放送信号処理ノード100がPTPマスタにならないように自身を設定してもよい。
(1) Device Internal Clock The device internal clock (also called device internal clock) 110 is a unique internal clock held by the broadcast signal processing node 100 . In this embodiment, the device internal clock 110 is directly or indirectly synchronized to the PTP's time source. Typically, when the broadcast signal processing node 100 is a PTP slave, the device internal clock 110 is indirectly synchronized to the PTP's time source via the PTP grandmaster. On the other hand, if the broadcast signal processing node 100 is the PTP master, the device internal clock 110 is directly synchronized to the PTP's time source. For example, the control unit 190, which will be described later, may set itself so that the broadcast signal processing node 100 does not become the PTP master.

(2)メディアクロック
メディアクロック112は、デジタルメディア信号の処理(例えば、サンプリング及び再構成)のために使用されるクロックである。本実施形態において、メディアクロック112は、SMPTE ST2059-1で定義されているエポックの時刻を初期値ゼロとして使用し、デバイス内部クロック110に周波数ロックされて、正確なレートで進行する。放送信号処理ノード100が共通基準クロックを取得できず、ローカルタイムベース上で動作している場合には、SMPTE ST2059-1で定義されている上記エポックを前提として、利用可能な時刻源のうち最良のものがメディアクロック112及び後述するRTPクロック114のために用いられ得る。
(2) Media Clock Media clock 112 is a clock used for processing (eg, sampling and reconstruction) of digital media signals. In this embodiment, the media clock 112 uses the epoch time defined in SMPTE ST2059-1 as an initial value of zero and is frequency locked to the device internal clock 110 to run at the correct rate. If the broadcast signal processing node 100 cannot obtain a common reference clock and is operating on a local timebase, it will use the best available time source given the above epoch defined in SMPTEST ST2059-1. can be used for the media clock 112 and the RTP clock 114 described below.

本実施形態において、放送信号処理ノード100は、異なる種類のエッセンスデータを単一のストリームで伝送するための伝送プロトコルであるARIB STD-B73をサポートする。ARIB STD-B73では、映像エッセンス、音声エッセンス及び補助データエッセンスの各々のタイミングは、映像フレームに関連付けられる。この場合、RTPタイムスタンプの基礎となるメディアクロックはエッセンスデータの種類によらず単一であってよい。後述するRTPクロック114も同様である。 In this embodiment, the broadcast signal processing node 100 supports ARIB STD-B73, which is a transmission protocol for transmitting different types of essence data in a single stream. In ARIB STD-B73, the timing of each video essence, audio essence and ancillary data essence is associated with a video frame. In this case, the media clock on which the RTP timestamp is based may be a single one regardless of the type of essence data. The same applies to the RTP clock 114, which will be described later.

SMPTE ST2110-20では、映像エッセンスのためのメディアクロック周波数は、90kHzと規定されている。一方、既存の多くの放送用機器は、27.0MHzのクロックを有する。SDIイメージを伝送するSMPTE ST2022-6ストリームをSMPTE ST2110-10システムへ統合するために検討されているSMPTE ST2022-8では、27.0MHzのメディアクロック周波数が規定されている。メディアクロック周波数を90kHzとした場合、当該周波数は、映像フレームの周波数として利用されることの多い60/1.001Hzの整数倍にならない。一方、メディアクロック周波数を27.0MHzとした場合、当該周波数は60/1.001Hzの整数倍となる。この点を考慮し、本実施形態では、フレーム期間を正確に一定にして、クロック値を単調増加させる点において取り扱い上有利な27.0MHzを、メディアクロック112のクロック周波数として利用する。 SMPTE ST2110-20 specifies that the media clock frequency for video essence is 90 kHz. On the other hand, many existing broadcasting equipment have a clock of 27.0 MHz. SMPTE ST2022-8, which is under consideration for integrating SMPTE ST2022-6 streams carrying SDI images into the SMPTE ST2110-10 system, specifies a media clock frequency of 27.0 MHz. When the media clock frequency is 90 kHz, the frequency is not an integer multiple of 60/1.001 Hz, which is often used as the frequency of video frames. On the other hand, when the media clock frequency is 27.0 MHz, the frequency is an integer multiple of 60/1.001 Hz. Considering this point, in the present embodiment, 27.0 MHz is used as the clock frequency of the media clock 112, which is advantageous in terms of handling in that the frame period is accurately kept constant and the clock value is monotonously increased.

(3)RTPクロック
RTPクロック114は、RTPパケットのRTPヘッダへ付与されるタイムスタンプの基礎となるクロックである。本実施形態において、RTPクロック114は、SMPTE ST2110-10の規定に従い、メディアクロック112に対しオフセットを有しないものとする。即ち、RTPクロック114は、関連付けられるメディアクロック112と同一の値を有する。したがって、本実施形態において、RTPクロック114のクロック周波数は、メディアクロック112のクロック周波数と同様に27.0MHzに等しい。
(3) RTP Clock The RTP clock 114 is a clock that forms the basis of time stamps added to the RTP headers of RTP packets. In this embodiment, the RTP clock 114 shall have no offset with respect to the media clock 112 as specified in SMPTE ST2110-10. That is, the RTP clock 114 has the same value as the associated media clock 112 . Therefore, in this embodiment, the clock frequency of RTP clock 114 is equal to 27.0 MHz, as is the clock frequency of media clock 112 .

(4)PTP処理部
本実施形態において、放送信号処理ノード100は、例えばSMPTE ST2059-2のPTPプロファイルをサポートする。そして、PTP処理部116は、PTPマスタ(例えば、図3を用いて説明した共通基準クロック70)との間で通信部120を介して同期メッセージを交換することにより、デバイス内部クロック110のPTP時刻源との同期を維持する。それにより、放送信号処理ノード100は、同じくPTP時刻源と同期したクロックを有する他のノードとの間で、高精度で同期的に動作することが可能となる。
(4) PTP Processing Unit In this embodiment, the broadcast signal processing node 100 supports the PTP profile of SMPTE ST2059-2, for example. Then, the PTP processing unit 116 exchanges synchronization messages with the PTP master (for example, the common reference clock 70 described using FIG. 3) via the communication unit 120 to obtain the PTP time of the device internal clock 110. Stay synchronized with the source. Thereby, the broadcast signal processing node 100 can operate synchronously with high precision with other nodes having clocks synchronized with the PTP time source as well.

(5)通信部
通信部120は、放送信号処理ノード100による他のノードとの通信を仲介するインタフェースである。通信部120は、有線通信のための接続端子及び接続回路を含んでもよく、又は無線通信のためのアンテナ、RF(Radio Frequency)回路及びベースバンド回路を含んでもよい。本実施形態において、通信部120は、送信部122及び受信部124を含む。
(5) Communication Unit The communication unit 120 is an interface that mediates communication between the broadcast signal processing node 100 and other nodes. The communication unit 120 may include connection terminals and connection circuits for wired communication, or may include an antenna, an RF (Radio Frequency) circuit, and a baseband circuit for wireless communication. In this embodiment, the communication unit 120 includes a transmitter 122 and a receiver 124 .

送信部122には、後述する送信ストリーム処理部130により生成される、放送信号ストリームのための一連のRTPパケットが入力される。各RTPパケットは、映像データ、音声データ及び補助データのうちのいずれかに相当するエッセンスデータをRTPペイロードに含む。各RTPパケットのRTPヘッダには、デバイス内部クロック110にロックされたメディアクロック112に対しオフセットを有しないRTPクロック114に従ってRTPタイムスタンプが付与されている。送信部122は、入力される各RTPパケットにネットワークヘッダを追加して、各パケットを放送局システム1に参加する他のノードへ送信する。上記ストリームがARIB STD-B73ストリームである場合、ネットワークヘッダ内に記述されるポート番号は、映像データを搬送するパケット、音声データを搬送するパケット及び補助データを搬送するパケットで共通的である。 A series of RTP packets for a broadcast signal stream generated by a transmission stream processing unit 130 (to be described later) are input to the transmission unit 122 . Each RTP packet contains essence data corresponding to any one of video data, audio data and ancillary data in the RTP payload. The RTP header of each RTP packet is given an RTP timestamp according to the RTP clock 114 which has no offset with respect to the media clock 112 locked to the device internal clock 110 . The transmitting unit 122 adds a network header to each input RTP packet and transmits each packet to other nodes participating in the broadcasting station system 1 . If the stream is an ARIB STD-B73 stream, the port number described in the network header is common to packets carrying video data, packets carrying audio data, and packets carrying auxiliary data.

受信部124は、一連のRTPパケットからなる放送信号ストリームを、放送信号処理ノード100の送信ストリーム処理部130及び送信部122と同様のセンダ機能を有する他のノードから受信する。各RTPパケットは、映像データ、音声データ及び補助データのうちのいずれかに相当するエッセンスデータをRTPペイロードに含む。上記ストリームがARIB STD-B73ストリームである場合、一連のRTPパケットは、共通的なポート番号を介して、単一のストリームとして受信される。各RTPパケットのRTPヘッダは、送信側のノードのデバイス内部クロックにロックされたメディアクロックに対しオフセットを有しないRTPクロックに従って付与されたRTPタイムスタンプを含む。各RTPパケットのRTPペイロード内のヘッダは、同じRTPクロックに基づくフレームカウント情報を含む。放送信号処理ノード100及び送信側のノードは、上述したようにPTPの時刻源に直接的に又は間接的に同期している。したがって、それらノード間のクロックの誤差は、例えば10μ秒以下であり得る。 The receiver 124 receives a broadcast signal stream consisting of a series of RTP packets from another node having the same sender function as the transmission stream processor 130 and the transmitter 122 of the broadcast signal processing node 100 . Each RTP packet contains essence data corresponding to any one of video data, audio data and ancillary data in the RTP payload. If the stream is an ARIB STD-B73 stream, a series of RTP packets are received as a single stream through a common port number. The RTP header of each RTP packet contains an RTP timestamp appended according to the RTP clock with no offset relative to the media clock locked to the device internal clock of the sending node. The header in the RTP payload of each RTP packet contains frame count information based on the same RTP clock. The broadcast signal processing node 100 and the node on the transmitting side are directly or indirectly synchronized with the PTP time source as described above. Therefore, the clock error between those nodes can be, for example, 10 μs or less.

受信部124は、ARIB STD-B73ストリーム以外の放送信号ストリームを他のノードから受信してもよい。例えば、受信部124は、ARIB STD-B73ストリームと同様のエッセンス混在型ストリーム(例えば、SMPTE ST2022-6ストリーム)を受信してもよい。また、受信部124は、SMPTE ST2110ストリームのようなエッセンス分離型ストリームを受信してもよい。 The receiving unit 124 may receive broadcast signal streams other than the ARIB STD-B73 stream from other nodes. For example, the receiver 124 may receive a mixed-essence stream similar to the ARIB STD-B73 stream (eg, SMPTE ST2022-6 stream). The receiver 124 may also receive an essence-separated stream such as an SMPTE ST2110 stream.

受信部124は、受信した放送信号ストリームの各パケットからネットワークヘッダを除去して、RTPヘッダ及びRTPペイロードからなるRTPパケットを受信ストリーム処理部140へ出力する。 The receiving unit 124 removes the network header from each packet of the received broadcast signal stream and outputs RTP packets composed of the RTP header and RTP payload to the received stream processing unit 140 .

(6)送信ストリーム処理部
送信ストリーム処理部130は、データ処理部180から入力される映像データ、音声データ又は補助データのシーケンスを処理して、放送信号ストリームのための一連のRTPパケットを生成する。送信ストリーム処理部130は、例えば、入力されるデータシーケンスを1つ以上のエッセンスペイロードへセグメント化し、各ペイロードにエッセンスヘッダを追加する。エッセンスヘッダ内のペイロードタイプは、対応するエッセンスのタイプを示す値に設定され、フレームカウントの値は新しい映像フレームの開始の都度1インクリメントされる。送信ストリーム処理部130は、さらに、各パケットにトランスポートヘッダ(共通ヘッダ及びRTPヘッダ)を追加する。共通ヘッダ内のシーケンス番号の値は、映像エッセンス、音声エッセンス及び補助データエッセンスで別々に、伝送の都度1インクリメントされる。RTPヘッダ内のペイロードタイプは固定的な値に設定され、シーケンス番号の値はペイロードタイプによらず各伝送で1インクリメントされる。送信ストリーム処理部130は、さらに、RTPクロック114に従ってRTPヘッダへRTPタイムスタンプを付与する。送信ストリーム処理部130は、このように生成される一連のRTPパケットを送信部122へ出力する。
(6) Transmission Stream Processing Unit The transmission stream processing unit 130 processes a sequence of video data, audio data or auxiliary data input from the data processing unit 180 to generate a series of RTP packets for the broadcast signal stream. . The transmission stream processor 130 may, for example, segment an incoming data sequence into one or more essence payloads and add an essence header to each payload. The payload type in the essence header is set to a value that indicates the type of the corresponding essence, and the frame count value is incremented by one at the start of each new video frame. The transmission stream processing unit 130 further adds a transport header (common header and RTP header) to each packet. The value of the sequence number in the common header is incremented by 1 for each transmission separately for video essence, audio essence and ancillary data essence. The payload type in the RTP header is set to a fixed value and the sequence number value is incremented by 1 for each transmission regardless of the payload type. The transmission stream processing unit 130 further adds an RTP timestamp to the RTP header according to the RTP clock 114 . The transmission stream processing unit 130 outputs a series of RTP packets generated in this way to the transmission unit 122 .

(7)受信ストリーム処理部
受信ストリーム処理部140は、他のノードから受信部124を介して受信される放送信号ストリームの一連のRTPパケットを処理して、映像データ、音声データ又は補助データを復元する。そして、受信ストリーム処理部140は、復元したデータのシーケンスをデータ処理部180へ出力する。とりわけ、本実施形態において、受信ストリーム処理部140は、受信されるRTPパケットのRTPヘッダから取得されるRTPタイムスタンプ、又は、受信されるRTPパケットのRTPペイロード内のヘッダ(例えば、エッセンスヘッダ又は共通ヘッダ)から取得されるフレームカウント情報に基づいて、当該RTPパケットと他のRTPパケットとの間でエッセンスデータの時間合わせを行う。こうした時間合わせのための受信ストリーム処理部140のより詳細な構成の一例について、後にさらに説明する。
(7) Received Stream Processing Unit The received stream processing unit 140 processes a series of RTP packets of the broadcast signal stream received from other nodes via the receiving unit 124 to restore video data, audio data or auxiliary data. do. Then, reception stream processing section 140 outputs the restored data sequence to data processing section 180 . In particular, in this embodiment, the received stream processing unit 140 uses the RTP timestamp obtained from the RTP header of the received RTP packet, or the header (e.g., essence header or common Based on the frame count information obtained from the header), time alignment of essence data is performed between the RTP packet and other RTP packets. An example of a more detailed configuration of the received stream processing unit 140 for such time adjustment will be further described later.

(8)データ処理部
データ処理部180は、映像データ、音声データ又は補助データを生成して、生成したデータのシーケンスを送信ストリーム処理部130へ出力する。データ処理部180は、例えば、図示しないデータソースから入力される映像データを圧縮して、圧縮済みの映像データを生成してもよい。また、データ処理部180は、受信ストリーム処理部140により復元される映像データ、音声データ又は補助データを処理する。データ処理部180は、例えば、受信ストリーム処理部140により復元され、互いに時間合わせされたエッセンスデータに基づいて、複数のエッセンス(例えば、映像エッセンス、音声エッセンス及び補助データエッセンスのうちの2つ以上、又は複数の映像エッセンスなど)を同期的に再生してもよい。また、データ処理部180は、受信ストリーム処理部140により復元される映像データ、音声データ又は補助データを所定のファイルフォーマットで記録媒体(図示せず)に記録してもよい。また、データ処理部180は、受信ストリーム処理部140から入力される映像データが圧縮済みの映像データである場合には、当該圧縮済みの映像データを逆圧縮して、もとの映像データを復元してもよい。
(8) Data Processing Unit The data processing unit 180 generates video data, audio data, or auxiliary data, and outputs the generated data sequence to the transmission stream processing unit 130 . The data processing unit 180 may, for example, compress video data input from a data source (not shown) to generate compressed video data. Also, the data processing unit 180 processes video data, audio data, or auxiliary data restored by the reception stream processing unit 140 . The data processing unit 180 extracts a plurality of essences (for example, two or more of a video essence, an audio essence and an auxiliary data essence, or multiple video essences) may be played back synchronously. Also, the data processing unit 180 may record the video data, audio data, or auxiliary data restored by the reception stream processing unit 140 in a recording medium (not shown) in a predetermined file format. Further, when the video data input from the reception stream processing unit 140 is compressed video data, the data processing unit 180 decompresses the compressed video data to restore the original video data. You may

(9)制御部
制御部190は、放送信号処理ノード100の上述した動作の全般を制御する。制御部190は、例えば、APS40又は制御端末50といった外部装置から受信される指示に応じて、放送信号ストリームを送信部122から送信させ、又は放送信号ストリームを受信部124により受信させる。放送信号処理ノード100が複数の伝送プロトコルをサポートする場合には、制御部190は、例えば外部装置からの指示において選択される伝送プロトコルのための動作を、各処理部に実行させる。制御部190は、通信部120を介して他のノードへ、放送信号処理ノード100の機能性(例えば、サポートするプロトコル、送信/受信可能なエッセンスのタイプ、クロック周波数及びその他の属性)を通知してもよい。
(9) Control Unit The control unit 190 controls the overall operations of the broadcast signal processing node 100 described above. The control unit 190 causes the transmission unit 122 to transmit the broadcast signal stream or causes the reception unit 124 to receive the broadcast signal stream in accordance with instructions received from an external device such as the APS 40 or the control terminal 50 . If the broadcast signal processing node 100 supports a plurality of transmission protocols, the control unit 190 causes each processing unit to perform operations for the transmission protocol selected by instructions from the external device, for example. The control unit 190 notifies other nodes via the communication unit 120 of the functionality of the broadcast signal processing node 100 (for example, the supported protocol, the type of essence that can be transmitted/received, the clock frequency and other attributes). may

本明細書で説明するいくつかの実施形態において、RTPストリームである放送信号ストリームの属性は、SDPオブジェクトに記述される。SMPTE ST2110-10によれば、1つ以上のセンダを含むデバイスは、RTPストリームごとに1つのSDPオブジェクトを構築するものとされている。本実施形態においても、センダとしての役割を有する送信ストリーム処理部130及び送信部122により送信可能なストリームの属性を記述したSDPオブジェクトが、放送信号処理ノード100の記憶部(図示せず)に予め記憶され得る。そして、制御部190は、ストリームの送信の開始に先立って、予め定義される管理用のアプリケーションプロトコルインタフェース(例えば、NMOS API)を介して当該SDPオブジェクトを外部装置へ提供する。一方、制御部190は、受信部124及び受信ストリーム処理部140に他の送信ノードから放送信号ストリームを受信させる場合、当該送信ノードにより提供されるSDPオブジェクトの記述に従って、受信される放送信号ストリームを正しく処理できるように受信側の処理を構成する。なお、ARIB STD-B73ストリームの特性に適したSDPオブジェクトのフォーマットについて、後述する第3の実施形態及び第4の実施形態で詳しく説明する。 In some embodiments described herein, attributes of broadcast signal streams that are RTP streams are described in SDP objects. According to SMPTE ST2110-10, a device containing one or more senders shall construct one SDP object per RTP stream. Also in this embodiment, an SDP object describing attributes of a stream that can be transmitted by the transmission stream processing unit 130 and the transmission unit 122, which serve as senders, is stored in advance in the storage unit (not shown) of the broadcast signal processing node 100. can be stored. Then, prior to starting stream transmission, the control unit 190 provides the SDP object to the external device via a predefined management application protocol interface (for example, NMOS API). On the other hand, when the control unit 190 causes the reception unit 124 and the reception stream processing unit 140 to receive a broadcast signal stream from another transmission node, the control unit 190 processes the received broadcast signal stream according to the description of the SDP object provided by the transmission node. Configure receiver processing for correct processing. The format of the SDP object suitable for the characteristics of the ARIB STD-B73 stream will be described in detail in third and fourth embodiments, which will be described later.

<2-2.受信ストリーム処理部の詳細な構成例>
図8は、図7に示した受信ストリーム処理部140の詳細な構成の一例を示すブロック図である。図8を参照すると、受信ストリーム処理部140は、トランスポート処理部142、エッセンスデータグラム処理部150及びFECデータグラム処理部170を含む。
<2-2. Detailed Configuration Example of Reception Stream Processing Unit>
FIG. 8 is a block diagram showing an example of a detailed configuration of reception stream processing section 140 shown in FIG. Referring to FIG. 8 , the received stream processor 140 includes a transport processor 142 , an essence datagram processor 150 and an FEC datagram processor 170 .

(1)トランスポート処理部
トランスポート処理部142は、トランスポートヘッダ(TH)除去部144を含む。TH除去部144は、受信部124から入力される放送信号ストリームのRTPパケットの先頭のRTPヘッダ及び共通ヘッダ(即ち、トランスポートヘッダ)を除去する。そして、TH除去部144は、共通ヘッダ内の「データグラムタイプ」の値に依存して、当該RTPパケットのデータグラムを、エッセンスデータグラム処理部150又はFECデータグラム処理部170へ分配する。例えば、「データグラムタイプ」の値がエッセンスデータグラムを示す場合には、当該エッセンスデータグラムがエッセンスデータグラム処理部150へ出力される。一方、「データグラムタイプ」の値がFECデータグラムを示す場合には、当該FECデータグラムがFECデータグラム処理部170へ出力される。
(1) Transport Processing Section The transport processing section 142 includes a transport header (TH) removing section 144 . The TH removing unit 144 removes the RTP header and the common header (that is, transport header) at the beginning of the RTP packets of the broadcast signal stream input from the receiving unit 124 . Then, the TH removal unit 144 distributes the datagram of the RTP packet to the essence datagram processing unit 150 or the FEC datagram processing unit 170 depending on the value of "datagram type" in the common header. For example, when the value of “datagram type” indicates an essence datagram, the essence datagram is output to the essence datagram processing unit 150 . On the other hand, when the value of “datagram type” indicates an FEC datagram, the FEC datagram is output to the FEC datagram processing unit 170 .

トランスポート処理部142からエッセンスデータグラム処理部150又はFECデータグラム処理部170へのデータグラムの出力は、RTPヘッダ内の「シーケンス番号」の順に行われ得る。欠落したシーケンス番号に対応するデータグラムの処理は、スキップされてよい。トランスポート処理部142は、エッセンスデータグラムに対応するRTPヘッダ内のRTPタイムスタンプの値を、アラインメント部160へ出力する。 Datagrams are output from the transport processing unit 142 to the essence datagram processing unit 150 or the FEC datagram processing unit 170 in the order of the "sequence number" in the RTP header. Processing of datagrams corresponding to missing sequence numbers may be skipped. The transport processing unit 142 outputs the value of the RTP timestamp in the RTP header corresponding to the essence datagram to the alignment unit 160 .

(2)エッセンスデータグラム処理部
エッセンスデータグラム処理部150は、エッセンスヘッダ(EH)除去部152、映像エッセンス処理部154、音声エッセンス処理部156、補助データエッセンス処理部158、及びアラインメント部160を含む。
(2) Essence Datagram Processing Unit The essence datagram processing unit 150 includes an essence header (EH) removal unit 152, a video essence processing unit 154, an audio essence processing unit 156, an auxiliary data essence processing unit 158, and an alignment unit 160. .

EH除去部152は、トランスポート処理部142から入力されるエッセンスデータグラムの先頭のエッセンスヘッダを除去する。そして、EH除去部152は、エッセンスヘッダ内の「ペイロードタイプ」の値に依存して、当該エッセンスデータグラムのエッセンスペイロードを、映像エッセンス処理部154、音声エッセンス処理部156、又は補助データエッセンス処理部158へ分配する。例えば、「ペイロードタイプ」の値が映像エッセンスを示す場合には、当該映像エッセンスが映像エッセンス処理部154へ出力される。「ペイロードタイプ」の値が音声エッセンスを示す場合には、当該音声エッセンスが音声エッセンス処理部156へ出力される。「ペイロードタイプ」の値が補助データエッセンスを示す場合には、当該補助データエッセンスが補助データエッセンス処理部158へ出力される。また、EH除去部152は、エッセンスヘッダ内の「フレームカウント」の値をアラインメント部160へ出力する。 The EH remover 152 removes the essence header at the beginning of the essence datagram input from the transport processor 142 . Then, the EH removal unit 152 converts the essence payload of the essence datagram into a video essence processing unit 154, an audio essence processing unit 156, or an ancillary data essence processing unit, depending on the value of "payload type" in the essence header. 158. For example, when the value of “payload type” indicates video essence, the video essence is output to video essence processing section 154 . When the value of “payload type” indicates voice essence, the voice essence is output to voice essence processing section 156 . When the value of “payload type” indicates an auxiliary data essence, the auxiliary data essence is output to auxiliary data essence processing section 158 . The EH removal section 152 also outputs the value of “frame count” in the essence header to the alignment section 160 .

映像エッセンス処理部154は、EH除去部152から順次入力される映像エッセンスを処理して、映像データを復元する。例えば、映像エッセンス処理部154は、ARIB STD-B73ストリームが受信された場合には、ARIB STD-B73により規定された映像ペイロードのパッキング形式に従って映像エッセンスを逆パッキングして、映像データを復元し得る。映像エッセンスが圧縮済みの映像データを含む場合には、映像エッセンス処理部154は、映像エッセンスを逆圧縮して映像データを復元してもよい(逆圧縮は、上述したようにデータ処理部180により行われてもよい)。 The image essence processor 154 processes the image essence sequentially input from the EH remover 152 to restore image data. For example, when an ARIB STD-B73 stream is received, the video essence processing unit 154 can restore the video data by depacking the video essence according to the video payload packing format defined by ARIB STD-B73. . If the video essence includes compressed video data, the video essence processing unit 154 may decompress the video essence to restore the video data (the decompression is performed by the data processing unit 180 as described above). may be done).

音声エッセンス処理部156は、EH除去部152から順次入力される音声エッセンスを処理して、音声データを復元する。例えば、音声エッセンス処理部156は、ARIB STD-B73ストリームが受信された場合には、ARIB STD-B73により規定された音声ペイロードのパッキング形式に従って音声エッセンスを逆パッキングして、音声データを復元し得る。 The voice essence processing unit 156 processes the voice essence sequentially input from the EH removal unit 152 to restore voice data. For example, when an ARIB STD-B73 stream is received, the audio essence processing unit 156 can depack the audio essence according to the audio payload packing format defined by ARIB STD-B73 to restore the audio data. .

補助データエッセンス処理部158は、EH除去部152から順次入力される補助データエッセンスを処理して、補助データを復元する。例えば、補助データエッセンス処理部158は、ARIB STD-B73ストリームが受信された場合には、ARIB STD-B73により規定された補助データペイロードのパッキング形式に従って補助データエッセンスを逆パッキングして、補助データを復元し得る。 The auxiliary data essence processor 158 processes the auxiliary data essence sequentially input from the EH remover 152 to restore the auxiliary data. For example, when the ARIB STD-B73 stream is received, the auxiliary data essence processing unit 158 reverse-packs the auxiliary data essence according to the auxiliary data payload packing format defined by ARIB STD-B73, and converts the auxiliary data to can be restored.

アラインメント部160は、各RTPパケットのRTPヘッダからトランスポート処理部142において取得されるRTPタイムスタンプ、又は、各RTPパケットのRTPペイロード内のヘッダから取得されるフレームカウント情報に基づいて、エッセンスデータ間の時間合わせを行う。 The alignment unit 160 aligns the essence data based on the RTP timestamp acquired by the transport processing unit 142 from the RTP header of each RTP packet or the frame count information acquired from the header in the RTP payload of each RTP packet. time adjustment.

本実施形態において、少なくとも第1のRTPパケットは、エッセンス混在型ストリームのためのプロトコルに従って生成されるパケットである。エッセンス混在型ストリームのためのプロトコルは、例えば、ARIB STD-B73であってよい。ARIB STD-B73が利用される場合、エッセンス混在型ストリームのRTPパケットの各々は、ブランキング期間に相当するデータを含まず、映像データ、音声データ及び補助データのうちのいずれかに相当するエッセンスデータをRTPペイロードに含む。 In this embodiment, at least the first RTP packets are packets generated according to the protocol for mixed-essence streams. The protocol for mixed-essence streams may be, for example, ARIB STD-B73. When ARIB STD-B73 is used, each RTP packet of the essence-mixed stream does not contain data corresponding to the blanking period, and essence data corresponding to any one of video data, audio data and ancillary data. in the RTP payload.

図9Aは、2つのRTPパケットの間のエッセンスデータの時間合わせのための手法の第1の例について説明するための説明図である。図9Aには、第1のRTPパケット161a及び第2のRTPパケット166aが示されている。第1のRTPパケット161a及び第2のRTPパケット166aは、共にARIB STD-B73に従って生成されたものとする。第1のRTPパケット161a及び第2のRTPパケット166aは、単一のポートPを介して受信される。 FIG. 9A is an explanatory diagram for explaining a first example of a technique for time alignment of essence data between two RTP packets. FIG. 9A shows a first RTP packet 161a and a second RTP packet 166a. It is assumed that both the first RTP packet 161a and the second RTP packet 166a are generated according to ARIB STD-B73. A first RTP packet 161a and a second RTP packet 166a are received via a single port PM .

第1のRTPパケット161aは、RTPヘッダ162a内に「タイムスタンプ」を含み、エッセンスヘッダ163a内に「ペイロードタイプ」及び「フレームカウント」を含む。エッセンスヘッダ163aの「ペイロードタイプ」の値は対応するエッセンスペイロードが映像エッセンスを含むことを示し、「フレームカウント」は値F1を示す。値F1は、例えば、SMPTE ST2059-1で定義されているエポックの時刻をゼロとした場合の、映像エッセンスが属する映像フレームのキャプチャ時刻に対応する。 The first RTP packet 161a contains a "timestamp" in the RTP header 162a and a "payload type" and "frame count" in the essence header 163a. The "payload type" value of the essence header 163a indicates that the corresponding essence payload contains video essence, and the "frame count" indicates the value F1. The value F1 corresponds to the capture time of the video frame to which the video essence belongs, for example, when the epoch time defined in SMPTE ST2059-1 is zero.

第2のRTPパケット166aは、RTPヘッダ167a内に「タイムスタンプ」を含み、エッセンスヘッダ168a内に「ペイロードタイプ」及び「フレームカウント」を含む。エッセンスヘッダ168aの「ペイロードタイプ」の値は対応するエッセンスペイロードが音声エッセンスを含むことを示し、「フレームカウント」は値F1を示す。値F1は、例えば、SMPTE ST2059-1で定義されているエポックの時刻をゼロとした場合の、音声エッセンスが属する映像フレームのキャプチャ時刻に対応する。 The second RTP packet 166a includes a "timestamp" in the RTP header 167a and a "payload type" and "frame count" in the essence header 168a. The "payload type" value of the essence header 168a indicates that the corresponding essence payload contains audio essence, and the "frame count" indicates the value F1. The value F1 corresponds to the capture time of the video frame to which the audio essence belongs, for example, when the epoch time defined by SMPTE ST2059-1 is zero.

図9Aに示した第1の例において、アラインメント部160は、これらRTPパケット161a、166aのエッセンスヘッダ163a、168aから取得されるフレームカウント情報に基づいて、RTPパケット161aとRTPパケット166aとの間でエッセンスデータの時間合わせを行う。このようにエッセンスヘッダ内のフレームカウント情報のみに基づいて時間合わせが行われる場合、トランスポート処理部142からアラインメント部160へタイムスタンプ情報を出力することが不要となり、プロトコルレイヤをまたいだ情報の参照が抑制されることから、受信ストリーム処理部140の構成を簡略化することができる。 In the first example shown in FIG. 9A, the alignment unit 160 aligns the RTP packets 161a and 166a between the RTP packets 161a and 166a based on the frame count information obtained from the essence headers 163a and 168a of these RTP packets 161a and 166a. Adjust the time of the essence data. In this way, when time alignment is performed based only on the frame count information in the essence header, it becomes unnecessary to output time stamp information from the transport processing unit 142 to the alignment unit 160, and reference to information across protocol layers becomes unnecessary. is suppressed, the configuration of the reception stream processing unit 140 can be simplified.

図9Bは、2つのRTPパケットの間のエッセンスデータの時間合わせのための手法の第2の例について説明するための説明図である。図9Bには、第3のRTPパケット161b及び第4のRTPパケット166bが示されている。第3のRTPパケット161b及び第4のRTPパケット166bは、共にARIB STD-B73に従って生成されたものとする。第3のRTPパケット161b及び第4のRTPパケット166bは、単一のポートPを介して受信される。 FIG. 9B is an explanatory diagram for explaining a second example of a technique for time alignment of essence data between two RTP packets. FIG. 9B shows a third RTP packet 161b and a fourth RTP packet 166b. It is assumed that both the third RTP packet 161b and the fourth RTP packet 166b are generated according to ARIB STD-B73. A third RTP packet 161b and a fourth RTP packet 166b are received via a single port PM .

第3のRTPパケット161bは、RTPヘッダ162b内に「タイムスタンプ」を含み、エッセンスヘッダ163b内に「ペイロードタイプ」及び「フレームカウント」を含む。RTPヘッダ162bの「タイムスタンプ」は、値T2を示す。エッセンスヘッダ163bの「ペイロードタイプ」の値は、対応するエッセンスペイロードが映像エッセンスを含むことを示す。値T2は、例えば、映像エッセンスが属する映像フレームのキャプチャ時刻に対応する。 The third RTP packet 161b contains a "timestamp" in the RTP header 162b and a "payload type" and "frame count" in the essence header 163b. The "timestamp" of the RTP header 162b indicates the value T2. The "payload type" value of the essence header 163b indicates that the corresponding essence payload contains video essence. The value T2 corresponds, for example, to the capture time of the video frame to which the video essence belongs.

第4のRTPパケット166bは、RTPヘッダ167b内に「タイムスタンプ」を含み、エッセンスヘッダ168b内に「ペイロードタイプ」及び「フレームカウント」を含む。RTPヘッダ167bの「タイムスタンプ」は、値T2を示す。エッセンスヘッダ168bの「ペイロードタイプ」の値は、対応するエッセンスペイロードが音声エッセンスを含むことを示す。値T2は、例えば、音声エッセンスが属する映像フレームのキャプチャ時刻に対応する。 The fourth RTP packet 166b includes a "timestamp" in the RTP header 167b and a "payload type" and "frame count" in the essence header 168b. The "timestamp" of the RTP header 167b indicates the value T2. The "payload type" value of essence header 168b indicates that the corresponding essence payload contains audio essence. The value T2 corresponds, for example, to the capture time of the video frame to which the audio essence belongs.

図9Bに示した第2の例において、アラインメント部160は、これらRTPパケット161b、166bのRTPヘッダ162b、167bから取得されるRTPタイムスタンプに基づいて、RTPパケット161bとRTPパケット166bとの間でエッセンスデータの時間合わせを行う。このようにRTPタイムスタンプに基づいて時間合わせが行われる場合、同じくRTPタイムスタンプを利用するSMPTE ST2110-10のシステムタイミングモデルのための実装を再利用して、アラインメント部160を簡易に構成することができる。 In the second example shown in FIG. 9B, the alignment unit 160 aligns the RTP packets 161b and 166b between the RTP packets 161b and 166b based on the RTP timestamps obtained from the RTP headers 162b and 167b of these RTP packets 161b and 166b. Adjust the time of the essence data. When time alignment is performed based on RTP timestamps in this way, the alignment unit 160 can be configured simply by reusing the implementation for the system timing model of SMPTE ST2110-10, which also uses RTP timestamps. can be done.

図9Cは、2つのRTPパケットの間のエッセンスデータの時間合わせのための手法の第3の例について説明するための説明図である。図9Cには、第5のRTPパケット161c及び第6のRTPパケット166cが示されている。第5のRTPパケット161cはARIB STD-B73に従って生成され、第6のRTPパケット166cはSMPTE ST2110-30に従って生成されたものとする。例えば、第5のRTPパケット161cはポートPを介して受信され、第6のRTPパケット166cは音声エッセンスを含むエッセンス分離型ストリームのためのポートPを介して受信される。 FIG. 9C is an explanatory diagram for explaining a third example of a technique for time alignment of essence data between two RTP packets. FIG. 9C shows a fifth RTP packet 161c and a sixth RTP packet 166c. Assume that the fifth RTP packet 161c is generated according to ARIB STD-B73 and the sixth RTP packet 166c is generated according to SMPTE ST2110-30. For example, the fifth RTP packet 161c is received via port PM and the sixth RTP packet 166c is received via port PA for essence separated streams containing audio essence.

第5のRTPパケット161cは、RTPヘッダ162c内に「タイムスタンプ」を含み、エッセンスヘッダ163c内に「ペイロードタイプ」及び「フレームカウント」を含む。エッセンスヘッダ163cの「ペイロードタイプ」の値は対応するエッセンスペイロードが映像エッセンスを含むことを示し、「フレームカウント」は値F3を示す。値F3は、映像エッセンスが属する映像フレームのキャプチャ時刻に対応する。 The fifth RTP packet 161c contains a 'timestamp' in the RTP header 162c and a 'payload type' and a 'frame count' in the essence header 163c. The "payload type" value of the essence header 163c indicates that the corresponding essence payload contains video essence, and the "frame count" indicates the value F3. The value F3 corresponds to the capture time of the video frame to which the video essence belongs.

第6のRTPパケット166cは、RTPヘッダ167c内に「タイムスタンプ」を含む。RTPヘッダ167cの「タイムスタンプ」は、値T3を示す。値T3は、例えば、音声エッセンス内の音声データの最も早いサンプリング時刻に対応する。 The sixth RTP packet 166c includes a "timestamp" in the RTP header 167c. The "timestamp" of the RTP header 167c indicates the value T3. The value T3 corresponds, for example, to the earliest sampling time of the audio data within the audio essence.

図9Cに示した第3の例において、アラインメント部160は、第5のRTPパケット161cのエッセンスヘッダ163cから取得されるフレームカウント情報、及び、第6のRTPパケット166cのRTPヘッダ167cから取得されるRTPタイムスタンプに基づいて、RTPパケット161cとRTPパケット166cとの間でエッセンスデータの時間合わせを行う。例えば、アラインメント部160は、値T3に対応するサンプリング時刻が値F3に対応する映像フレームのフレーム期間に含まれる場合には、第6のRTPパケット166cから復元される音声データが第5のRTPパケット161cから復元される映像データと同じ映像フレームへ同期されるべきであると判定し得る。このような手法によれば、ARIB STD-B73ストリームのRTPパケットのRTPタイムスタンプに実効的なタイムスタンプ値が設定されない場合にも、ARIB STD-B73ストリームとSMPTE ST2110ストリームとの間で適切に時間合わせを行うことができる。 In the third example shown in FIG. 9C, the alignment unit 160 uses the frame count information obtained from the essence header 163c of the fifth RTP packet 161c and the RTP header 167c of the sixth RTP packet 166c. Based on the RTP timestamp, time alignment of essence data is performed between the RTP packet 161c and the RTP packet 166c. For example, when the sampling time corresponding to the value T3 is included in the frame period of the video frame corresponding to the value F3, the alignment unit 160 transfers the audio data restored from the sixth RTP packet 166c to the fifth RTP packet. 161c should be synchronized to the same video frame as the video data recovered from 161c. According to such a method, even if an effective timestamp value is not set for the RTP timestamp of the RTP packet of the ARIB STD-B73 stream, the time can be properly set between the ARIB STD-B73 stream and the SMPTE ST2110 stream. Alignment can be done.

図9Dは、2つのRTPパケットの間のエッセンスデータの時間合わせのための手法の第4の例について説明するための説明図である。図9Dには、第7のRTPパケット161d及び第8のRTPパケット166dが示されている。第7のRTPパケット161dはARIB STD-B73に従って生成され、第8のRTPパケット166dはSMPTE ST2110-20に従って生成されたものとする。例えば、第7のRTPパケット161dはポートPを介して受信され、第8のRTPパケット166dは映像エッセンスを含むエッセンス分離型ストリームのためのポートPを介して受信される。 FIG. 9D is an explanatory diagram for explaining a fourth example of a technique for time alignment of essence data between two RTP packets. FIG. 9D shows a seventh RTP packet 161d and an eighth RTP packet 166d. It is assumed that the seventh RTP packet 161d is generated according to ARIB STD-B73 and the eighth RTP packet 166d is generated according to SMPTE ST2110-20. For example, the seventh RTP packet 161d is received via port PM and the eighth RTP packet 166d is received via port PV for essence separated streams containing video essence.

第7のRTPパケット161dは、RTPヘッダ162d内に「タイムスタンプ」を含み、エッセンスヘッダ163d内に「ペイロードタイプ」及び「フレームカウント」を含む。RTPヘッダ162dの「タイムスタンプ」は、値T4を示す。エッセンスヘッダ163dの「ペイロードタイプ」の値は、対応するエッセンスペイロードが音声エッセンスを含むことを示す。値T4は、例えば、音声エッセンスが属する映像フレームのキャプチャ時刻に対応する。 The seventh RTP packet 161d contains a "timestamp" in the RTP header 162d and a "payload type" and "frame count" in the essence header 163d. The "timestamp" of the RTP header 162d indicates the value T4. The "payload type" value of essence header 163d indicates that the corresponding essence payload contains audio essence. The value T4 corresponds, for example, to the capture time of the video frame to which the audio essence belongs.

第8のRTPパケット166dは、RTPヘッダ167d内に「タイムスタンプ」を含む。RTPヘッダ167dの「タイムスタンプ」は、値T4´を示す。値T4´は、例えば、映像エッセンスが属する映像フレームのキャプチャ時刻(インターレース方式の第2フィールドの場合には、フレーム期間の半分だけオフセットされた時刻)に対応する。 The eighth RTP packet 166d includes a "timestamp" in the RTP header 167d. The "timestamp" of the RTP header 167d indicates the value T4'. The value T4' corresponds, for example, to the capture time of the video frame to which the video essence belongs (in the case of an interlaced second field, the time offset by half the frame period).

図9Dに示した第7の例において、アラインメント部160は、第7のRTPパケット161dのRTPヘッダ162dから取得されるRTPタイムスタンプ、及び、第8のRTPパケット166dのRTPヘッダ167dから取得されるRTPタイムスタンプに基づいて、RTPパケット161dとRTPパケット166dとの間でエッセンスデータの時間合わせを行う。このような手法によれば、RTPタイムスタンプを利用するSMPTE ST2110-10のシステムタイミングモデルのための実装をARIB STD-B73ストリームの処理のために再利用して、アラインメント部160を簡易に構成することができる。 In the seventh example shown in FIG. 9D, the alignment unit 160 uses the RTP timestamp obtained from the RTP header 162d of the seventh RTP packet 161d and the RTP timestamp obtained from the RTP header 167d of the eighth RTP packet 166d. Based on the RTP timestamp, the essence data is time aligned between the RTP packet 161d and the RTP packet 166d. According to such an approach, the implementation for the system timing model of SMPTE ST2110-10, which utilizes RTP timestamps, is reused for the processing of ARIB STD-B73 streams to simplify the configuration of alignment section 160. be able to.

(3)FECデータグラム処理部
上述したように、SMPTE ST2110シリーズでは、誤り訂正処理は行われない。一方、ARIB STD-B73は、RS(Reed-Solomon)ベースの手法又はXORベースの手法でのFECをサポートしている。FECデータグラム処理部170は、この誤り訂正処理を担当する。即ち、FECデータグラム処理部170は、トランスポート処理部142から入力されるFECデータグラムについて誤り訂正処理を実行する。
(3) FEC Datagram Processing Unit As described above, the SMPTEST ST2110 series does not perform error correction processing. On the other hand, ARIB STD-B73 supports FEC with RS (Reed-Solomon)-based technique or XOR-based technique. The FEC datagram processing unit 170 takes charge of this error correction processing. That is, the FEC datagram processing unit 170 performs error correction processing on the FEC datagrams input from the transport processing unit 142 .

例えば、FECデータグラム処理部170は、誤り訂正方式としてRSベースの手法が選択される場合には、制御部190により設定されるデータグラム数(n,k)をRS復号の処理単位として、RS復号を実行する。ここで、nは、FEC演算の対象とされるエッセンスデータグラム数と、対応するFECデータグラム数との合計を表す。kは、当該エッセンスデータグラム数を表す。また、FECデータグラム処理部170は、誤り訂正方式としてXORベースの手法が選択される場合には、制御部190により設定されるサイズ(L,D)のFECブロックを処理単位として、XORベースの復号を実行する。ここで、Lは、行方向のエッセンスデータグラム数を表し、Dは列方向のエッセンスデータグラム数を表す。 For example, when the RS-based method is selected as the error correction method, the FEC datagram processing unit 170 uses the number of datagrams (n, k) set by the control unit 190 as the processing unit of RS decoding. Perform decryption. Here, n represents the sum of the number of essence datagrams to be subjected to FEC calculation and the number of corresponding FEC datagrams. k represents the number of essence datagrams concerned. In addition, when the XOR-based method is selected as the error correction method, the FEC datagram processing unit 170 performs XOR-based processing on an FEC block of size (L, D) set by the control unit 190 as a processing unit. Perform decryption. Here, L represents the number of essence datagrams in the row direction and D represents the number of essence datagrams in the column direction.

<2-3.処理の流れ>
次に、図10及び図11を用いて、第1の実施形態において実行され得る主な処理の流れについて説明する。
<2-3. Process Flow>
Next, the flow of main processing that can be executed in the first embodiment will be described with reference to FIGS. 10 and 11. FIG.

(1)ストリーム送信処理
図10は、第1の実施形態に係るストリーム送信処理の流れの一例を示すフローチャートである。ここでは、ストリーム送信処理が放送信号処理ノード100により実行されるものとして説明するが、ストリーム送信処理は、上述したセンダ60の機能を有するいかなるノードにより実行されてもよい。
(1) Stream Transmission Processing FIG. 10 is a flowchart showing an example of the flow of stream transmission processing according to the first embodiment. Here, the stream transmission processing is described as being performed by the broadcast signal processing node 100, but the stream transmission processing may be performed by any node having the functions of the sender 60 described above.

まず、PTP処理部116は、デバイス内部クロック110をPTPの時刻源に直接的に又は間接的に同期させる(ステップS101)。PTPの時刻源とのデバイス内部クロック110の同期は、この後も継続的に維持される。 First, the PTP processing unit 116 directly or indirectly synchronizes the device internal clock 110 with the PTP time source (step S101). Synchronization of the device internal clock 110 with the PTP's time source continues to be maintained thereafter.

送信ストリーム処理部130は、例えば制御部190による制御の下で、データ処理部180から入力されるエッセンスデータからエッセンスペイロードを生成する(ステップS103)。エッセンスデータは、映像データ、音声データ又は補助データのいずれかを含む。エッセンスペイロードは、例えば、ARIB STD-B73により規定された映像データ、音声データ又は補助データのパッキング形式に従ってエッセンスデータをパッキングすることにより生成され得る。 The transmission stream processing unit 130 generates an essence payload from the essence data input from the data processing unit 180 under the control of the control unit 190, for example (step S103). Essence data includes either video data, audio data or auxiliary data. The essence payload can be generated by packing essence data according to the packing format for video data, audio data or auxiliary data defined by ARIB STD-B73, for example.

次いで、送信ストリーム処理部130は、デバイス内部クロック110にロックされたメディアクロック112に対しオフセットを有しないRTPクロック114に従って、フレームカウント値(及び/又はRTPタイムスタンプ)を算出する(ステップS105)。フレームカウント値は、同じ映像フレームに属するエッセンスデータが処理されている間は、同じ値に維持される。 Next, the transmission stream processing unit 130 calculates a frame count value (and/or RTP timestamp) according to the RTP clock 114 that has no offset with respect to the media clock 112 locked to the device internal clock 110 (step S105). The frame count value remains the same while essence data belonging to the same video frame is being processed.

次いで、送信ストリーム処理部130は、フレームカウント値を含むエッセンスヘッダをエッセンスペイロードの先頭に追加して、エッセンスデータグラムを生成する(ステップS107)。エッセンスヘッダは、エッセンスペイロードに含まれるエッセンスのタイプを示す「ペイロードタイプ」をも含む。 Next, the transmission stream processing unit 130 adds an essence header including the frame count value to the beginning of the essence payload to generate an essence datagram (step S107). The essence header also contains a "payload type" that indicates the type of essence contained in the essence payload.

次いで、送信ストリーム処理部130は、RTPクロック114に従った値を有するRTPタイムスタンプを含むトランスポートヘッダをエッセンスデータグラムに追加して、RTPパケットを生成する(ステップS109)。送信ストリーム処理部130は、さらに誤り訂正符号化処理を実行して、FECデータグラムを含むRTPパケットを生成してもよい。 Next, the transmission stream processing unit 130 adds a transport header including an RTP timestamp having a value according to the RTP clock 114 to the essence datagram to generate an RTP packet (step S109). The transmission stream processing unit 130 may further perform error correction coding processing to generate RTP packets containing FEC datagrams.

次いで、送信部122は、送信ストリーム処理部130により生成されたRTPパケットにネットワーク(NW)ヘッダを追加して、IPパケットを生成する(ステップS111)。IPパケットのUDPヘッダ内のポート番号は、包含されるエッセンスのタイプに関わらず、ARIB STD-B73ストリームに割り当てられる共通的な値を示す。IPヘッダ内の宛て先IPアドレスは、例えば、当該ストリームに割り当てられるマルチキャストアドレスを示す。 Next, the transmission unit 122 adds a network (NW) header to the RTP packet generated by the transmission stream processing unit 130 to generate an IP packet (step S111). The port number in the UDP header of an IP packet indicates a common value assigned to ARIB STD-B73 streams, regardless of the type of essence contained. A destination IP address in the IP header indicates, for example, a multicast address assigned to the stream.

次いで、送信部122は、生成したIPパケットをネットワークへ送信する(ステップS113)。送信されたIPパケットは、対応するマルチキャストグループへ加入した受信側のノードにより受信される。 Next, the transmission unit 122 transmits the generated IP packet to the network (step S113). A transmitted IP packet is received by a receiving node that has subscribed to the corresponding multicast group.

上述したステップS103~S113の処理は、未処理のエッセンスデータが残っている間、反復的に実行され得る(ステップS115)。全てのエッセンスデータが処理されると、図10に示したストリーム送信処理は終了する。 The processing of steps S103 to S113 described above can be repeatedly performed while unprocessed essence data remains (step S115). When all the essence data have been processed, the stream transmission process shown in FIG. 10 ends.

(2)ストリーム受信処理
図11は、第1の実施形態に係るストリーム受信処理の流れの一例を示すフローチャートである。
(2) Stream Reception Processing FIG. 11 is a flowchart showing an example of the flow of stream reception processing according to the first embodiment.

まず、放送信号処理ノード100のPTP処理部116は、デバイス内部クロック110をPTPの時刻源に直接的に又は間接的に同期させる(ステップS151)。PTPの時刻源とのデバイス内部クロック110の同期は、この後も継続的に維持される。 First, the PTP processing unit 116 of the broadcast signal processing node 100 directly or indirectly synchronizes the device internal clock 110 with the PTP time source (step S151). Synchronization of the device internal clock 110 with the PTP's time source continues to be maintained thereafter.

次いで、受信部124は、図10を用いて説明したストリーム送信処理と同様の処理を通じて他のノードから送信される放送信号ストリームのIPパケットを受信する(ステップS153)。放送信号処理ノード100のデバイス内部クロック110がPTPの時刻源と同期していることから、放送信号処理ノード100は、IPパケットの送信元の上記他のノードとも高い精度で同期している。 Next, the receiving unit 124 receives IP packets of broadcast signal streams transmitted from other nodes through the same process as the stream transmission process described using FIG. 10 (step S153). Since the device internal clock 110 of the broadcast signal processing node 100 is synchronized with the PTP time source, the broadcast signal processing node 100 is also highly accurately synchronized with the above-mentioned other node that is the transmission source of the IP packet.

次いで、受信部124は、受信したIPパケットのネットワークヘッダを除去することにより、RTPデータグラムを抽出する(ステップS153)。そして、受信部124は、抽出したRTPデータグラムを受信ストリーム処理部140へ出力する。 Next, the receiving unit 124 extracts the RTP datagram by removing the network header of the received IP packet (step S153). The receiving unit 124 then outputs the extracted RTP datagram to the reception stream processing unit 140 .

次いで、受信ストリーム処理部140は、RTPデータグラムのトランスポートヘッダ及びエッセンスヘッダを除去することにより、エッセンスペイロードを抽出する(ステップS155)。 Next, the reception stream processing unit 140 extracts the essence payload by removing the transport header and essence header of the RTP datagram (step S155).

次いで、受信ストリーム処理部140は、エッセンスヘッダ内のペイロードタイプの値に応じて、ARIB STD-B73により規定された映像データ、音声データ又は補助データのパッキング形式に従ってエッセンスペイロードを逆パッキングすることにより、エッセンスデータを復元する(ステップS157)。なお、図11には示していないものの、受信ストリーム処理部140は、エッセンスデータグラムと共にFECデータグラムが受信される場合には、FECデータグラムに基づいて誤り訂正復号を実行して、受信データに含まれるビット誤りを検出してもよい。 Next, according to the value of the payload type in the essence header, the received stream processing unit 140 reverse-packs the essence payload according to the packing format of video data, audio data or auxiliary data defined by ARIB STD-B73. The essence data is restored (step S157). Although not shown in FIG. 11, when an FEC datagram is received together with an essence datagram, the reception stream processing unit 140 performs error correction decoding based on the FEC datagram to convert the reception data to Bit errors may be detected.

次いで、受信ストリーム処理部140のアラインメント部160は、RTPヘッダ内のRTPタイムスタンプ、又はRTPペイロード内のフレームカウント情報に基づいて、異なるRTPパケットに由来するエッセンスデータ間の時間合わせを行う(ステップS159)。 Next, the alignment unit 160 of the reception stream processing unit 140 performs time alignment between essence data derived from different RTP packets based on the RTP timestamp in the RTP header or the frame count information in the RTP payload (step S159). ).

次いで、データ処理部180は、アラインメント部160により時間合わせされたエッセンスデータに基づく処理を実行する(ステップS161)。ここで実行される処理は、例えば、複数のエッセンスの同期的な再生、又はエッセンスデータのSDI信号への変換などであってよい。 Next, the data processing unit 180 executes processing based on the essence data time-aligned by the alignment unit 160 (step S161). The processing performed here may be, for example, the synchronous reproduction of multiple essences, or the conversion of essence data into SDI signals.

上述したステップS153~S161の処理は、同一のストリームのパケットが継続的に受信されている間、反復的に実行され得る(ステップS163)。パケットの受信が停止すると、図11に示したストリーム受信処理は終了する。 The processing of steps S153 to S161 described above can be repeatedly performed while packets of the same stream are continuously received (step S163). When packet reception stops, the stream reception processing shown in FIG. 11 ends.

<<3.第2の実施形態>>
次いで、図12を用いて、第2の実施形態について説明する。上述した第1の実施形態は具体的な実施形態であり、一方で第2の実施形態はより一般化された実施形態である。
<<3. Second Embodiment>>
Next, a second embodiment will be described with reference to FIG. 12 . The first embodiment described above is a specific embodiment, while the second embodiment is a more general embodiment.

<3-1.放送信号処理ノードの構成例>
図12は、第2の実施形態に係る放送信号処理ノード200の構成の一例を示すブロック図である。放送信号処理ノード200は、放送信号ストリームを1つ以上の他のノードから受信するノードである。放送信号処理ノード200により受信されるストリームは、限定ではないものの、ARIB STD-B73ストリームなどのエッセンス混在型ストリームを含む。図12を参照すると、放送信号処理ノード200は、通信部210及びアラインメント部220を備える。
<3-1. Configuration example of broadcast signal processing node>
FIG. 12 is a block diagram showing an example configuration of a broadcast signal processing node 200 according to the second embodiment. Broadcast signal processing node 200 is a node that receives broadcast signal streams from one or more other nodes. Streams received by broadcast signal processing node 200 include, but are not limited to, mixed-essence streams such as ARIB STD-B73 streams. Referring to FIG. 12, the broadcast signal processing node 200 includes a communication section 210 and an alignment section 220.

通信部210は、PTPの時刻源に直接的に又は間接的に同期したデバイス内部クロックにロックされたメディアクロックに対しオフセットを有しないRTPクロックに従ってRTPヘッダへタイムスタンプを付与されたRTPパケットであって、映像データ、音声データ及び補助データのうちのいずれかに相当するエッセンスデータをRTPペイロードに含む当該RTPパケット(第1のRTPパケット)を受信する。通信部210は、さらに他のRTPパケット(第2のRTPパケット)をも受信する。第1のRTPパケットと第2のRTPパケットとは、同一の放送信号ストリームに含まれるパケットであってもよく、又は互いに異なる放送信号ストリームに含まれるパケットであってもよい。 The communication unit 210 is an RTP packet whose RTP header is time-stamped according to the RTP clock, which has no offset to the media clock locked to the device internal clock that is directly or indirectly synchronized to the PTP time source. Then, the RTP packet (first RTP packet) containing the essence data corresponding to any one of the video data, the audio data and the auxiliary data in the RTP payload is received. The communication unit 210 also receives another RTP packet (second RTP packet). The first RTP packet and the second RTP packet may be packets included in the same broadcast signal stream, or may be packets included in different broadcast signal streams.

アラインメント部220は、受信される上記RTPパケットの上記RTPヘッダから取得される上記タイムスタンプ、又は、受信される上記RTPパケットの上記RTPペイロード内のヘッダから取得されるフレームカウント情報に基づいて、上記RTPパケットと上記他のRTPパケットとの間でエッセンスデータの時間合わせを行う。 The alignment unit 220 , based on the time stamp obtained from the RTP header of the received RTP packet or the frame count information obtained from the header in the RTP payload of the received RTP packet, Time alignment of essence data is performed between the RTP packet and the other RTP packet.

エッセンスデータの時間合わせのための放送信号処理が、放送信号処理ノード200の上記動作ステップを含んでもよい。また、それら動作ステップをプロセッサに実行させるコンピュータプログラムが提供されてもよい。また、それら動作ステップをプロセッサに実行させるコンピュータプログラムを記憶した非一時的なコンピュータ読取可能な記憶媒体が提供されてもよい。加えて、第1の実施形態において説明した任意の機能又は処理が本実施形態に適用されてよい。 Broadcast signal processing for time alignment of essence data may include the above operational steps of the broadcast signal processing node 200 . A computer program may also be provided that causes a processor to perform those operational steps. A non-transitory computer-readable storage medium storing a computer program that causes a processor to perform those operational steps may also be provided. Additionally, any function or process described in the first embodiment may be applied to this embodiment.

<3-2.変形例>
図13は、第2の実施形態の第1の変形例に係る放送信号処理ノード200の構成の一例を示すブロック図である。図13を参照すると、放送信号処理ノード200は、図12を用いて説明した通信部210及びアラインメント部220に加えて、再生部230を備える。
<3-2. Variation>
FIG. 13 is a block diagram showing an example configuration of a broadcast signal processing node 200 according to the first modification of the second embodiment. Referring to FIG. 13, broadcast signal processing node 200 includes reproducing section 230 in addition to communication section 210 and alignment section 220 described using FIG.

再生部230は、アラインメント部220により時間合わせされた上記RTPパケット(第1のRTPパケット)及び上記他のRTPパケット(第2のRTPパケット)の上記エッセンスデータに基づいて、エッセンスを同期的に再生する。例えば、複数のカメラから受信される映像が同時に再生されてもよく、映像及び音声が同期的に再生されてもよく、又は、映像及び/若しくは音声と共に補助データが再生されてもよい。 The reproduction unit 230 synchronously reproduces the essence based on the essence data of the RTP packet (first RTP packet) and the other RTP packet (second RTP packet) time-aligned by the alignment unit 220. do. For example, video received from multiple cameras may be played simultaneously, video and audio may be played synchronously, or auxiliary data may be played along with video and/or audio.

図14は、第2の実施形態の第2の変形例に係る放送信号処理ノード200の構成の一例を示すブロック図である。図14を参照すると、放送信号処理ノード200は、第1通信部215、アラインメント部220、変換部240及び第2通信部250を備える。 FIG. 14 is a block diagram showing an example configuration of a broadcast signal processing node 200 according to the second modification of the second embodiment. Referring to FIG. 14, broadcast signal processing node 200 includes first communication unit 215 , alignment unit 220 , conversion unit 240 and second communication unit 250 .

第1通信部215は、PTPの時刻源に直接的に又は間接的に同期したデバイス内部クロックにロックされたメディアクロックに対しオフセットを有しないRTPクロックに従ってRTPヘッダへタイムスタンプを付与されたRTPパケットであって、映像データ、音声データ及び補助データのうちのいずれかに相当するエッセンスデータをRTPペイロードに含む当該RTPパケット(第1のRTPパケット)を受信する。第1通信部215は、さらに他のRTPパケット(第2のRTPパケット)をも受信する。第1のRTPパケットと第2のRTPパケットとは、同一の放送信号ストリームに含まれるパケットであってもよく、又は互いに異なる放送信号ストリームに含まれるパケットであってもよい。 The first communication unit 215 generates RTP packets whose RTP headers are time-stamped according to the RTP clock that has no offset with respect to the media clock locked to the device internal clock that is directly or indirectly synchronized with the PTP time source. and receives an RTP packet (first RTP packet) containing essence data corresponding to any one of video data, audio data, and auxiliary data in the RTP payload. The first communication unit 215 also receives another RTP packet (second RTP packet). The first RTP packet and the second RTP packet may be packets included in the same broadcast signal stream, or may be packets included in different broadcast signal streams.

変換部240は、アラインメント部220による上記RTPパケット(第1のRTPパケット)と上記他のRTPパケット(第2のRTPパケット)との間のエッセンスデータの時間合わせに基づいて、それらRTPパケットに由来するエッセンスデータをSDI信号へ変換する。変換部240により生成されるSDI信号の信号形式は、例えばSD-SDI、HD-SDI、3G-SDI、6G-SDI又は12G-SDIといった、SDIの任意の派生であってよい。 Based on the time alignment of the essence data between the RTP packet (first RTP packet) and the other RTP packet (second RTP packet) by the alignment unit 220, the conversion unit 240 extracts data derived from these RTP packets. The essence data to be converted into an SDI signal. The signal format of the SDI signal produced by converter 240 may be any derivative of SDI, eg SD-SDI, HD-SDI, 3G-SDI, 6G-SDI or 12G-SDI.

第2通信部250は、上述した時間合わせに基づいて変換部240により生成されるSDI信号を、SDIドメインに属する他のノードへ送信する。 The second communication unit 250 transmits the SDI signal generated by the conversion unit 240 based on the time adjustment described above to other nodes belonging to the SDI domain.

<<4.第1の実施形態及び第2の実施形態のまとめ>>
ここまで、本開示の第1の実施形態及び第2の実施形態について詳細に説明した。上述した実施形態では、映像データ、音声データ及び補助データのうちのいずれかに相当するエッセンスデータをRTPペイロードに含むRTPパケットと、他のRTPパケットとの間のエッセンスデータの時間合わせが、RTPヘッダ内のRTPタイムスタンプ、又は、RTPペイロード内のヘッダから取得されるフレームカウント情報に基づいて行われる。RTPタイムスタンプは、PTPの時刻源に直接的に又は間接的に同期したデバイス内部クロックにロックされたメディアクロックに対しオフセットを有しないRTPクロックに従って付与される。かかる構成によれば、放送局のIPネットワーク上で映像データ、音声データ又は補助データといったエッセンスデータを単一のストリームで伝送するプロトコルを利用する際に、エッセンスデータの適切な時間合わせを行うことが可能である。
<<4. Summary of First Embodiment and Second Embodiment>>
So far, the first and second embodiments of the present disclosure have been described in detail. In the above-described embodiment, time alignment of essence data between an RTP packet containing essence data corresponding to any one of video data, audio data, and auxiliary data in the RTP payload and other RTP packets is performed in the RTP header. or based on the frame count information obtained from the header in the RTP payload. RTP timestamps are applied according to the RTP clock, which has no offset to the media clock locked to the device internal clock that is directly or indirectly synchronized to the PTP time source. According to this configuration, when using a protocol for transmitting essence data such as video data, audio data, or auxiliary data in a single stream on the IP network of a broadcasting station, it is possible to perform appropriate time adjustment of the essence data. It is possible.

ある例において、上記RTPパケットは、エッセンス混在型ストリームのためのプロトコルに従って生成されるパケットである。上記エッセンス混在型ストリームは、例えば、ARIB STD-B73ストリームであってよい。ARIB STD-B73ストリームは、ブランキング期間に相当するデータを含まない。こうした例によれば、受信側でもとのコンテンツを再構築する処理を複雑にすることなく、かつエッセンスタイプごとにネットワーク上で異なる遅延を受ける可能性を回避しつつ、エッセンスデータを容易に時間合わせすることができる。 In one example, the RTP packets are packets generated according to a protocol for mixed-essence streams. The mixed-essence stream may be, for example, an ARIB STD-B73 stream. The ARIB STD-B73 stream does not contain data corresponding to blanking periods. These examples make it easy to time-align essence data without complicating the process of reconstructing the original content at the receiving end, and avoiding the potential for different delays over the network for each essence type. can do.

ある例において、上記メディアクロックのクロック周波数は、27.0MHzに等しい。かかる構成によれば、メディアクロックのクロック周波数を映像フレーム周波数の整数倍にしてフレーム期間を正確に一定にしつつ、映像データ、音声データ及び補助データを含み得る単一のエッセンス混在型ストリームに、そのメディアクロックのクロック周波数に基づいて共通的なやり方で時間合わせのための情報を付与することができる。 In one example, the clock frequency of the media clock is equal to 27.0 MHz. According to such a configuration, the clock frequency of the media clock is set to an integer multiple of the video frame frequency to accurately keep the frame period constant, and a single mixed-essence stream that can include video data, audio data, and ancillary data is generated. Information for time alignment can be provided in a common manner based on the clock frequency of the media clock.

<<5.第3の実施形態>>
上で既に述べたように、SMPTE ST2110ストリームのために通常利用されるSDPオブジェクトのフォーマットは、フォーマット構造においても、記述される情報の内容においても、ARIB STD-B73ストリームの特性に必ずしも適していない。ARIB STD-B73ストリームの伝送を適切にセットアップするためには、当該ストリームの特性に適したSDPオブジェクトのフォーマットを定義する必要がある。
<<5. Third Embodiment>>
As already mentioned above, the format of SDP objects normally used for SMPTE ST2110 streams is not necessarily suitable for the characteristics of ARIB STD-B73 streams, neither in format structure nor in the information content described. . In order to properly set up the transmission of an ARIB STD-B73 stream, it is necessary to define the format of the SDP objects suitable for the characteristics of the stream.

<5-1.既存のSDPオブジェクトの例>
SDPは、ストリーミング(又はその他の何らかのセッション)に使用されるパラメータセットをテキスト形式で記述する際のフォーマットを規定するプロトコルである、典型的には、ストリーミングの開始に先立って、ストリームの送信側と受信側との間でSDPオブジェクト(例えば、SDP形式で記述されたデータファイル)を送受信することにより、どういったパラメータ値を実際に使用すべきかに関する交渉が行われ、合意が結ばれる。あるいは、ストリームのセットアップに制御ノードが一元的に関与する場合には、SDPオブジェクトは、当該制御ノードへ提供され得る。
<5-1. Example of an existing SDP object>
SDP is a protocol that defines a format for textually describing parameter sets used in streaming (or any other session). By transmitting and receiving an SDP object (for example, a data file described in SDP format) to and from the receiving side, negotiations are made regarding what parameter values should actually be used, and an agreement is reached. Alternatively, if the control node is centrally involved in setting up the stream, the SDP object may be provided to the control node.

図15は、エッセンス分離型ストリーム用のSDPオブジェクトの典型的なフォーマット構造について説明するための説明図である。図15に示したように、SDPオブジェクトは、セッションレベルの(セッションに属する個々のメディアよりもむしろセッションにとって固有の)属性を記述するためのセッションレベルセクションと、1つ以上のメディアのそれぞれの属性を記述するための1つ以上のメディアレベルセクションとを含む。図15のSDPオブジェクトは、映像エッセンス用、音声エッセンス用及び補助データエッセンス用のそれぞれのメディアレベルセクションを含んでいる。オプションとして、可用性向上のために映像エッセンスに冗長RTPストリーム方式が適用される場合には、プライマリの映像エッセンス用のメディアレベルセクションに加えて、セカンダリの映像エッセンス用のメディアレベルセクションがSDPオブジェクトに含められ得る。なお、かかる例に限定されず、冗長RTPストリーム方式は、映像エッセンス、音声エッセンス及び補助データエッセンスのうちの任意の1つ以上に適用されてよい。各メディアレベルセクションは、対応するエッセンスタイプのストリームの属性を記述する属性フィールド群を含む。即ち、映像エッセンス用のメディアレベルセクションは、映像関連属性フィールド群を、音声エッセンス用のメディアレベルセクションは、音声関連属性フィールド群を、補助データエッセンス用のメディアレベルセクションは、補助データ関連属性フィールド群を含み得る。 FIG. 15 is an explanatory diagram for explaining a typical format structure of an SDP object for an essence-separated stream. As shown in Figure 15, an SDP object consists of a session-level section for describing session-level attributes (specific to a session rather than individual media belonging to the session) and attributes for each of one or more media. and one or more media-level sections for describing The SDP object of FIG. 15 contains media level sections for video essence, audio essence and ancillary data essence respectively. Optionally, in addition to the media level section for the primary video essence, the media level section for the secondary video essence is included in the SDP object if a redundant RTP stream scheme is applied to the video essence for increased availability. can be Note that the redundant RTP stream scheme may be applied to any one or more of video essence, audio essence, and ancillary data essence without being limited to such an example. Each media level section contains attribute fields that describe the attributes of the stream of the corresponding essence type. That is, the media level section for video essence contains video-related attribute fields, the media-level section for audio essence contains audio-related attribute fields, and the media-level section for auxiliary data essence contains auxiliary data-related attribute fields. can include

図16は、図15を用いて説明したフォーマット構造を有する、SMPTE ST2110ストリームの属性を記述したSDPオブジェクトの一例を示している。 FIG. 16 shows an example of an SDP object describing attributes of an SMPTE ST2110 stream having the format structure described with reference to FIG.

図16を参照すると、SDPオブジェクト301は、セッションレベルセクション302と、4つのメディアレベルセクション303、304、305及び306とを含む。セッションレベルセクション302は、プロトコルバージョンフィールド(“v=…”)、送信元フィールド(“o=…”)及びセッション名フィールド(“s=…”)など、セッションに固有の情報を記述するためのフィールド群を有する。 Referring to FIG. 16, SDP object 301 includes session level section 302 and four media level sections 303 , 304 , 305 and 306 . The session level section 302 is for describing session-specific information such as a protocol version field ("v=..."), a source field ("o=..."), and a session name field ("s=..."). It has a group of fields.

個々のメディアレベルセクションの開始は、メディア記述フィールド(“m=…”)により識別される。メディアレベルセクション303及び304は、映像エッセンスのストリームのためのセクションである。図16の例では、メディアレベルセクション303にプライマリの映像エッセンスのストリームの属性が記述されており、メディアレベルセクション304にセカンダリの映像エッセンスのストリームの属性が記述されている。メディアレベルセクション305には、音声エッセンスのストリームの属性が記述されている。メディアレベルセクション306には、補助データエッセンスのストリームの属性が記述されている。 The start of each media level section is identified by a media description field ("m=..."). Media level sections 303 and 304 are for streams of video essence. In the example of FIG. 16, the media level section 303 describes the attributes of the primary video essence stream, and the media level section 304 describes the attributes of the secondary video essence stream. The media level section 305 describes the attributes of the audio essence stream. The media level section 306 describes attributes of the stream of auxiliary data essence.

映像用のメディアレベルセクション303の冒頭のメディア記述フィールド(“m=…”)には、メディアタイプ(“video”)、送信ポート番号(“50000”)、トランスポートプロトコル(“RTP/AVP”)、及びフォーマット形式番号(“112”)が記述されている。このメディア記述フィールドに加えて、メディアレベルセクション303は、映像関連属性フィールド群307を含む。映像関連属性フィールド群307は、ソースフィルタ属性フィールド(“a=source-filter:…”)、RTPマップ属性フィールド(“a=rtpmap:…”)、フォーマット固有パラメータ属性フィールド(“a=fmtp:…”)、基準クロック属性フィールド(“a=ts-refclk:…”)、メディアクロック属性フィールド(“a=mediaclk:…”)、及びマップID属性フィールド(“a=mid:…”)を含む。これらのうち、RTPマップ属性フィールド(“a=rtpmap:…”)は、対応するメディア記述フィールドのフォーマット形式番号と同じ値を有するペイロードタイプ番号(“112”)、サブタイプ名(“raw”)及びメディアクロック周波数(“90000”)を示す。フォーマット固有パラメータ属性フィールド(“a=fmtp:…”)には、フォーマット形式番号(“112”)に続いて、フォーマット固有の1つ以上のパラメータのパラメータ名とパラメータ値のペアが列挙される。マップID属性フィールド(“a=mid:…”)は、冗長RTPストリームが使用される場合にプライマリストリームとセカンダリストリームとを区別するために使用される。メディアレベルセクション304の内容は、メディア記述フィールドの送信ポート番号及びマップID属性フィールドを除いてメディアレベルセクション303と同様であってよいため、図16では省略されている。 The media description field ("m=...") at the beginning of the media level section 303 for video contains the media type ("video"), transmission port number ("50000"), transport protocol ("RTP/AVP"). , and the format type number (“112”). In addition to this media description field, media level section 303 includes video related attribute fields 307 . The video-related attribute field group 307 includes a source filter attribute field ("a=source-filter:..."), an RTP map attribute field ("a=rtpmap:..."), and a format-specific parameter attribute field ("a=fmtp:..."). ”), a reference clock attribute field (“a=ts-refclk: …”), a media clock attribute field (“a=mediaclk: …”), and a map ID attribute field (“a=mid: …”). Of these, the RTP map attribute field ("a=rtpmap:...") has the same value as the format type number of the corresponding media description field, payload type number ("112"), subtype name ("raw"). and the media clock frequency (“90000”). The format-specific parameter attribute field ("a=fmtp:...") lists the format type number ("112") followed by parameter name and parameter value pairs for one or more format-specific parameters. The Map ID attribute field ("a=mid:...") is used to distinguish between primary and secondary streams when redundant RTP streams are used. The contents of media level section 304 are omitted in FIG. 16 because they may be similar to media level section 303 except for the transmission port number and map ID attribute fields in the media description field.

音声用のメディアレベルセクション305の冒頭のメディア記述フィールド(“m=…”)には、メディアタイプ(“audio”)、送信ポート番号(“51200”)、トランスポートプロトコル(“RTP/AVP”)、及びフォーマット形式番号(“97”)が記述されている。このメディア記述フィールドに加えて、メディアレベルセクション305は、音声関連属性フィールド群308を含む。音声関連属性フィールド群308は、RTPマップ属性フィールド(“a=rtpmap:…”)、パケット時間属性フィールド(“a=ptime:…”)、基準クロック属性フィールド(“a=ts-refclk:…”)、メディアクロック属性フィールド(“a=mediaclk:…”)、フォーマット固有パラメータ属性フィールド(“a=fmtp:…”)、及びマップID属性フィールド(“a=mid:…”)を含む。これらのうち、RTPマップ属性フィールド(“a=rtpmap:…”)は、対応するメディア記述フィールドのフォーマット形式番号と同じ値を有するペイロードタイプ番号(“97”)、サブタイプ名(“L24”)、メディアクロック周波数(“48000”)及び符号化パラメータ(“6”)を示す。なお、サブタイプ名“L24”は、音声エッセンスが24ビットのリニアエンコーディングで符号化されることを示す。符号化パラメータ“6”は、音声チャンネル数が6であることを示す。フォーマット固有パラメータ属性フィールド(“a=fmtp:…”)には、フォーマット形式番号(“97”)に続いて、フォーマット固有の1つ以上のパラメータのパラメータ名とパラメータ値のペアが列挙される。 The media description field ("m=...") at the beginning of the media level section 305 for audio contains the media type ("audio"), transmission port number ("51200"), transport protocol ("RTP/AVP"). , and the format type number (“97”). In addition to this media description field, media level section 305 includes audio-related attribute fields 308 . Audio-related attribute fields 308 include an RTP map attribute field (“a=rtpmap: …”), a packet time attribute field (“a=ptime: …”), a reference clock attribute field (“a=ts-refclk: …”). ), a media clock attribute field ("a=mediaclk:..."), a format specific parameter attribute field ("a=fmtp:..."), and a map ID attribute field ("a=mid:..."). Of these, the RTP map attribute field ("a=rtpmap:...") has a payload type number ("97"), subtype name ("L24") that has the same value as the format type number of the corresponding media description field. , indicates the media clock frequency (“48000”) and the coding parameter (“6”). Note that the subtype name "L24" indicates that the voice essence is encoded by 24-bit linear encoding. The encoding parameter "6" indicates that the number of audio channels is six. The format-specific parameter attribute field ("a=fmtp:...") lists the format type number ("97") followed by parameter name and parameter value pairs for one or more format-specific parameters.

補助データ用のメディアレベルセクション306の冒頭のメディア記述フィールド(“m=…”)には、メディアタイプ(“video”)、送信ポート番号(“51300”)、トランスポートプロトコル(“RTP/AVP”)、及びフォーマット形式番号(“98”)が記述されている。このメディア記述フィールドに加えて、メディアレベルセクション306は、補助データ関連属性フィールド群309を含む。補助データ関連属性フィールド群309は、RTPマップ属性フィールド(“a=rtpmap:…”)、基準クロック属性フィールド(“a=ts-refclk:…”)、メディアクロック属性フィールド(“a=mediaclk:…”)、及びマップID属性フィールド(“a=mid:…”)を含む。これらのうち、RTPマップ属性フィールド(“a=rtpmap:…”)は、対応するメディア記述フィールドのフォーマット形式番号と同じ値を有するペイロードタイプ番号(“98”)、サブタイプ名(“smpte291”)及びメディアクロック周波数(“90000”)を示す。 The media description field ("m=...") at the beginning of the media level section 306 for ancillary data includes media type ("video"), transmission port number ("51300"), transport protocol ("RTP/AVP"), ), and the format type number (“98”). In addition to this media description field, media level section 306 includes auxiliary data related attribute fields 309 . The auxiliary data-related attribute field group 309 includes an RTP map attribute field ("a=rtpmap:..."), a reference clock attribute field ("a=ts-refclk:..."), and a media clock attribute field ("a=mediaclk:..."). ”), and a map ID attribute field (“a=mid: …”). Of these, the RTP map attribute field ("a=rtpmap:...") has a payload type number ("98"), subtype name ("smpte291") that has the same value as the format type number of the corresponding media description field. and the media clock frequency (“90000”).

図16から理解されるように、SMPTE ST2110ストリーム向けのSDPオブジェクトは、複数のエッセンスタイプのそれぞれのメディアレベルセクションを含み、それらメディアレベルセクションが、対応するエッセンスタイプに依存して異なるフィールドのセットを有する。こうしたフォーマット構造は、SMPTE ST2110ストリームと同様のエッセンス分離型ストリームには再利用可能であるが、ARIB STD-B73ストリームのようなエッセンス混在型ストリームの属性を記述するためには適しない。なぜなら、エッセンス混在型ストリームは、単一のストリーム内に複数のエッセンスタイプのデータを含むためである。さらに、映像エッセンスの圧縮をサポートし、かつ誤り訂正符号化/復号も可能なARIB STD-B73ストリームをセットアップするために要する情報項目が、図16に例示したSDPオブジェクトのフォーマットには不足している。 As can be seen from Figure 16, the SDP object for an SMPTE ST2110 stream contains media level sections for each of multiple essence types, which have different sets of fields depending on the corresponding essence type. have. Such format structures are reusable for essence-separated streams like SMPTE ST2110 streams, but are not suitable for describing attributes of mixed-essence streams like ARIB STD-B73 streams. This is because the mixed-essence stream contains multiple essence-type data in a single stream. Furthermore, the SDP object format illustrated in FIG. 16 lacks the information items required to set up an ARIB STD-B73 stream that supports compression of video essence and is also capable of error correction encoding/decoding. .

<5-2.SDPオブジェクトの新たなフォーマット>
図17は、本実施形態においてエッセンス混在型ストリームのために定義されるSDPオブジェクトのフォーマット構造について説明するための説明図である。
<5-2. New Format of SDP Object>
FIG. 17 is an explanatory diagram for explaining the format structure of the SDP object defined for the mixed-essence stream in this embodiment.

図17に示したように、新たなフォーマットにおいて、SDPオブジェクトは、セッションレベルの属性を記述するセッションレベルセクションと、複数のエッセンスタイプにとって共通のメディアレベルセクションとを含む。そして、1つの共通的なメディアレベルセクションが、映像エッセンスに関連する属性、音声エッセンスに関連する属性、及び補助データエッセンスに関連する属性を記述するための属性フィールド群を含む。とりわけ、本実施形態では、SDPの規格において独立した属性フィールドを割り当てられていないパラメータは、フォーマット固有パラメータ属性フィールド内に記述される。このようにして、エッセンス混在型ストリーム(あるいはARIB STD-B73ストリーム)の特性にSDPオブジェクトの構造を適合させることで、ストリームに固有の情報を曖昧性無くSDPオブジェクトに記述することができる。 As shown in Figure 17, in the new format, the SDP object contains a session-level section that describes session-level attributes and a media-level section that is common to multiple essence types. And one common media level section contains attribute fields for describing attributes related to video essence, attributes related to audio essence, and attributes related to auxiliary data essence. Notably, in this embodiment, parameters that are not assigned separate attribute fields in the SDP standard are described in format-specific parameter attribute fields. In this way, by adapting the structure of the SDP object to the characteristics of the mixed-essence stream (or ARIB STD-B73 stream), stream-specific information can be described in the SDP object without ambiguity.

オプションとして、可用性向上のために冗長RTPストリーム方式が適用される場合には、SDPオブジェクトは、プライマリのエッセンス共通のメディアレベルセクションに加えて、セカンダリのエッセンス共通のメディアレベルセクションを含み得る。 Optionally, in addition to the primary essence-common media-level section, the SDP object may contain a secondary essence-common media-level section if a redundant RTP stream scheme is applied for increased availability.

図18は、図17を用いて説明したフォーマット構造を有する、ARIB STD-B73ストリームの属性を記述したSDPオブジェクトの一例を示している。 FIG. 18 shows an example of an SDP object describing the attributes of the ARIB STD-B73 stream having the format structure described with reference to FIG.

図18を参照すると、SDPオブジェクト311は、セッションレベルセクション312と、2つのメディアレベルセクション313及び318とを含む。セッションレベルセクション312は、プロトコルバージョンフィールド(“v=…”)、送信元フィールド(“o=…”)及びセッション名フィールド(“s=…”)など、セッションに固有の情報を記述するためのフィールド群を有する。 Referring to FIG. 18, SDP object 311 contains session level section 312 and two media level sections 313 and 318 . The session level section 312 is for describing session specific information such as a protocol version field ("v=..."), a source field ("o=...") and a session name field ("s=..."). It has a group of fields.

メディアレベルセクション313及び318の開始は、それぞれのメディア記述フィールド(“m=…”)により識別される。メディアレベルセクション313及び318は共に、複数のエッセンスタイプにとって共通のセクションである。図18の例では、メディアレベルセクション313にプライマリのエッセンス混在型ストリームの属性が記述されており、メディアレベルセクション318にセカンダリのエッセンス混在型ストリームの属性が記述されている。 The beginnings of media level sections 313 and 318 are identified by their respective media description fields ("m=..."). Both media level sections 313 and 318 are sections common to multiple essence types. In the example of FIG. 18, the media level section 313 describes the attributes of the primary mixed-essence stream, and the media-level section 318 describes the attributes of the secondary mixed-essence stream.

メディアレベルセクション313の冒頭のメディア記述フィールド(“m=…”)には、メディアタイプ(“video”)、送信ポート番号(“50000”)、トランスポートプロトコル(“RTP/AVP”)、及びフォーマット形式番号(“110”)が記述される。メディアレベルセクション313は、上述したように複数のエッセンスタイプにとって共通のセクションであるものの、本開示に係る技術において、各エッセンスのタイミングは映像フレームに紐付けられることから、ここではメディアタイプの文字列として“video”が選択され得る。送信ポート番号は、例えば、プライベートポート番号の範囲から任意に選択されるUDPポート番号であってよい。フォーマット形式番号は、他の値(例えば、“111”)であってもよい。本実施形態において、フォーマット形式番号は、複数のエッセンスタイプに共通的に付与されるフォーマット識別値としての役割を有する。このメディア記述フィールドに加えて、メディアレベルセクション313は、属性フィールド群314を含む。とりわけ、図18の例において、属性フィールド群314は、RTPマップ属性フィールド(“a=rtpmap:…”)315、フォーマット固有パラメータ属性フィールド(“a=fmtp:…”)316及びパケット時間属性フィールド(“a=ptime:…”)317を含む。 The media description field ("m=...") at the beginning of the media level section 313 contains the media type ("video"), transmission port number ("50000"), transport protocol ("RTP/AVP"), and format. A format number (“110”) is described. The media level section 313 is a section common to multiple essence types as described above, but in the technology according to the present disclosure, the timing of each essence is associated with a video frame. "video" can be selected as the The sending port number may be, for example, a UDP port number arbitrarily selected from a range of private port numbers. The format type number may be another value (eg, "111"). In this embodiment, the format type number has a role as a format identification value commonly given to a plurality of essence types. In addition to this media description field, media level section 313 includes attribute fields 314 . Specifically, in the example of FIG. 18, attribute fields 314 include an RTP map attribute field ("a=rtpmap:...") 315, a format specific parameter attribute field ("a=fmtp:...") 316, and a packet time attribute field ( "a=ptime:...") 317.

RTPマップ属性フィールド315は、フォーマット形式番号と同じ値を有するペイロードタイプ番号(“110”)によって、メディアレベルセクション313の冒頭のメディア記述フィールドに関連付けられる。RTPマップ属性フィールド315のサブタイプ名には、例えばプロトコル名称“ARIB_STD-B73”が記述され、この名称から、SDPオブジェクト311を提供するセンダにより送信される放送信号ストリームがARIB STD-B73ストリームであることが特定される。RTPマップ属性フィールド315により示されるメディアクロック周波数は、ここでは27MHzである。 The RTP map attribute field 315 is related to the media description field at the beginning of the media level section 313 by the payload type number (“110”) having the same value as the format type number. The subtype name of the RTP map attribute field 315 describes, for example, the protocol name “ARIB_STD-B73”, which indicates that the broadcast signal stream transmitted by the sender providing the SDP object 311 is an ARIB STD-B73 stream. is specified. The media clock frequency indicated by the RTP map attribute field 315 is now 27 MHz.

フォーマット固有パラメータ属性フィールド316は、フォーマット形式番号(“110”)によって、メディアレベルセクション313の冒頭のメディア記述フィールドに関連付けられる。フォーマット固有パラメータ属性フィールド316は、少なくとも、第1のエッセンスタイプのエッセンスデータに関連する第1の属性情報及び第2のエッセンスタイプのエッセンスデータに関連する第2の属性情報を含む。図18の例においては、フォーマット固有パラメータ属性フィールド316は、以下のように分類される情報を含む:
・映像関連属性-映像エッセンスのエッセンスデータに関連する属性情報
・音声関連属性-音声エッセンスのエッセンスデータに関連する属性情報
・補助データ関連属性-補助データエッセンスのエッセンスデータに関連する属性情報
・FEC関連属性-誤り訂正方式に関連する属性情報
・トラフィックシェーピング関連属性-トラフィックシェーピングに関連する属性情報
The format specific parameter attribute field 316 is related to the media description field at the beginning of the media level section 313 by the format type number (“110”). Format specific parameter attribute field 316 includes at least first attribute information associated with essence data of a first essence type and second attribute information associated with essence data of a second essence type. In the example of FIG. 18, format-specific parameter attribute field 316 contains information categorized as follows:
- Video-related attribute - attribute information related to essence data of video essence - Audio-related attribute - attribute information related to essence data of audio essence - Auxiliary data-related attribute - attribute information related to essence data of auxiliary data essence - FEC-related Attribute - Attribute information related to error correction scheme Traffic shaping related attribute - Attribute information related to traffic shaping

次の表1~表5は、本実施形態においてフォーマット固有パラメータ属性フィールド316に記述され得る映像関連属性、音声関連属性、補助データ関連属性、FEC関連属性及びトラフィックシェーピング関連属性のパラメータの一覧をそれぞれ示している。 The following Tables 1-5 respectively list parameters for video-related attributes, audio-related attributes, auxiliary data-related attributes, FEC-related attributes, and traffic shaping-related attributes that may be described in the format-specific parameter attribute field 316 in this embodiment. showing.

Figure 0007247707000001
Figure 0007247707000001

本実施形態では、映像エッセンスデータが圧縮されるかを示す圧縮関連情報が新たに定義される。この圧縮関連情報を含む映像関連属性は、SDPオブジェクト311のメディアレベルセクション313のフォーマット固有パラメータ属性フィールド316に記述され得る。具体的には、例えば、表1に示したように、圧縮関連情報は、映像エッセンスデータが圧縮されるかを示す圧縮パラメータ“compression”を含む。さらに、映像エッセンスデータが圧縮されることを当該圧縮パラメータが示す場合には、圧縮関連情報は、映像エッセンスデータを圧縮する際に利用されるコーデック(圧縮方式)を示すコーデックパラメータ“codec”を含む。 In this embodiment, compression-related information is newly defined to indicate whether video essence data is compressed. Video-related attributes containing this compression-related information can be described in the format-specific parameter attributes field 316 of the media level section 313 of the SDP object 311 . Specifically, for example, as shown in Table 1, the compression-related information includes a compression parameter "compression" indicating whether video essence data is compressed. Further, when the compression parameter indicates that the video essence data is compressed, the compression-related information includes a codec parameter "codec" indicating the codec (compression method) used when compressing the video essence data. .

Figure 0007247707000002
Figure 0007247707000002

既存のSDPのフォーマットによれば、音声エッセンスデータに関連する音声チャンネル数情報は、図16に例示したように、音声用のメディアレベルセクションのRTPマップ属性フィールド(“a=rtpmap:…”)に記述される。しかし、本実施形態のように、複数のエッセンスタイプにとって共通のメディアレベルセクションのみを設け、メディアタイプの文字列として“video”を選択した場合、RTPマップ属性フィールドに音声チャンネル数情報を記述することはSDPの規格に反する。そこで、本実施形態では、表2に示したように、フォーマット固有の音声関連属性として、音声チャンネル数情報を定義する。この音声チャンネル数情報を含む音声関連属性は、上述した映像関連属性と共に、SDPオブジェクト311のメディアレベルセクション313のフォーマット固有パラメータ属性フィールド316に記述され得る。具体的には、例えば、音声チャンネル数情報は、音声チャンネル数パラメータ“channel-number”を含む。SMPTE ST2110-30では音声チャンネル数は1からレベルに依存して異なる上限値までの範囲内の任意の整数であり得るが、ARIB STD-B73では音声チャンネル数は4、8、12又は16のいずれかに制約される。 According to the existing SDP format, audio channel number information related to audio essence data is stored in the RTP map attribute field ("a=rtpmap:...") of the media level section for audio, as illustrated in FIG. Described. However, as in this embodiment, when only a common media level section is provided for multiple essence types and "video" is selected as the media type character string, the number of audio channels cannot be described in the RTP map attribute field. is against the SDP standard. Therefore, in this embodiment, as shown in Table 2, audio channel number information is defined as format-specific audio-related attributes. Audio-related attributes, including this audio channel number information, can be described in the format-specific parameter attributes field 316 of the media level section 313 of the SDP object 311, along with the video-related attributes described above. Specifically, for example, the audio channel number information includes an audio channel number parameter “channel-number”. Whereas in SMPTE ST2110-30 the number of audio channels can be any integer ranging from 1 to different upper limits depending on the level, in ARIB STD-B73 the number of audio channels can be 4, 8, 12 or 16. constrained by

Figure 0007247707000003
Figure 0007247707000003

本実施形態では、補助データ関連属性は、映像関連属性(及び音声関連属性)と共に、SDPオブジェクト311のメディアレベルセクション313のフォーマット固有パラメータ属性フィールド316に記述され得る。具体的には、例えば、表3に示したように、補助データ関連属性は、データID及びセカンダリデータID“DID_SDID”並びに映像ペイロードIDコード“VPID_Code”を含む。 In this embodiment, auxiliary data-related attributes may be described in format-specific parameter attribute field 316 of media level section 313 of SDP object 311, along with video-related attributes (and audio-related attributes). Specifically, for example, as shown in Table 3, the auxiliary data-related attributes include data ID and secondary data ID "DID_SDID" and video payload ID code "VPID_Code".

Figure 0007247707000004
Figure 0007247707000004

本実施形態では、エッセンスデータへ適用される誤り訂正方式を示す誤り訂正情報が新たに定義される。この誤り訂正情報は、上述した他の属性と共に、SDPオブジェクト311のメディアレベルセクション313のフォーマット固有パラメータ属性フィールド316に記述され得る。具体的には、例えば、表4に示したように、誤り訂正情報は、エッセンスデータへ適用される誤り訂正方式を示すタイプパラメータ“FECtype”と、当該タイプパラメータにより示される誤り訂正方式の設定値を示す設定パラメータと、を含む。タイプパラメータがXOR符号化(“XOR”)を示す場合には、設定パラメータは、誤り訂正ブロックサイズを示すサイズパラメータ“XORsize”を含む。一方、タイプパラメータがリードソロモン符号化(“RS”)を示す場合には、設定パラメータは、リードソロモン符号化の処理単位に相当するデータグラム数を示すデータグラム数パラメータ“RSnum”を含む。 In this embodiment, error correction information indicating an error correction method applied to essence data is newly defined. This error correction information can be described in the format specific parameter attribute field 316 of the media level section 313 of the SDP object 311 along with the other attributes described above. Specifically, for example, as shown in Table 4, the error correction information includes a type parameter "FECtype" indicating the error correction method applied to the essence data, and the set value of the error correction method indicated by the type parameter. and a configuration parameter indicating If the type parameter indicates XOR encoding (“XOR”), the configuration parameters include a size parameter “XORsize” indicating the error correction block size. On the other hand, when the type parameter indicates Reed-Solomon encoding (“RS”), the setting parameter includes a datagram number parameter “RSnum” indicating the number of datagrams corresponding to the processing unit of Reed-Solomon encoding.

Figure 0007247707000005
Figure 0007247707000005

本実施形態では、トラフィックシェーピング関連属性は、上述した他の属性と共に、SDPオブジェクト311のメディアレベルセクション313のフォーマット固有パラメータ属性フィールド316に記述され得る。具体的には、例えば、表5に示したように、トラフィックシェーピング関連属性は、センダのバッファのタイプを示すバッファタイプパラメータ“TP”を含む。 In this embodiment, the traffic shaping related attributes may be described in the format specific parameter attributes field 316 of the media level section 313 of the SDP object 311 along with the other attributes described above. Specifically, for example, as shown in Table 5, the traffic shaping related attributes include a buffer type parameter "TP" that indicates the type of the sender's buffer.

本実施形態では、パケット時間属性フィールド317は、フォーマット固有パラメータ属性フィールド316と同一のメディアレベルセクション313内に含まれる。これは、図16の例においてパケット時間属性フィールド(“a=ptime:…”)が映像用のメディアレベルセクション303とは異なる音声用のメディアレベルセクション305内に含まれていたこととは対照的である。パケット時間属性フィールド317は、パケット内のメディアの時間長をミリ秒単位で示す。このフィールドにより示される時間長は、機器のバッファサイズを左右する。本実施形態では、パケット時間属性フィールド317により示される時間長は、音声エッセンスのみに適用され得る。 In this embodiment, packet time attribute field 317 is contained within the same media level section 313 as format specific parameter attribute field 316 . This is in contrast to the example of Figure 16 where the packet time attribute field ("a=ptime:...") was included in a different media level section 305 for audio than media level section 303 for video. is. Packet time attribute field 317 indicates the length of time of media in the packet in milliseconds. The length of time indicated by this field governs the buffer size of the device. In this embodiment, the length of time indicated by packet time attribute field 317 may apply only to audio essences.

なお、表1~表5に列挙したフォーマット固有パラメータは、一例に過ぎない。複数のエッセンスタイプにとって共通のメディアレベルセクションは、他の追加的なパラメータを含んでもよく、又は表に示したパラメータのうちの1つ以上が省略されてもよい。 Note that the format-specific parameters listed in Tables 1-5 are only examples. Media level sections common to multiple essence types may include other additional parameters, or may omit one or more of the parameters shown in the table.

メディアレベルセクション318の内容は、マップID属性フィールドなど一部を除いて、メディアレベルセクション313と同様であってよい。冗長RTPストリーム方式が適用されない場合には、メディアレベルセクション318はSDPオブジェクト311に含まれない。 The contents of the media level section 318 may be similar to the media level section 313 except for some parts such as the map ID attribute field. The media level section 318 is not included in the SDP object 311 if the redundant RTP stream scheme is not applied.

本項で説明したSDPオブジェクトのフォーマット構造を用いることで、ARIB STD-B73ストリームのようなエッセンス混在型ストリームの属性を、ストリームの構造に即して適切に記述することが可能となる。さらに、映像エッセンスの圧縮をサポートし、かつ誤り訂正符号化/復号も可能なARIB STD-B73ストリームを、当該ストリームの属性に関する情報をSDPオブジェクトの提供を通じて不足なく交換することによりセットアップすることが可能となる。 By using the format structure of the SDP object described in this section, it is possible to appropriately describe the attributes of a mixed-essence stream such as the ARIB STD-B73 stream in line with the structure of the stream. Furthermore, it is possible to set up an ARIB STD-B73 stream that supports compression of video essence and is also capable of error correction encoding/decoding by exchanging information on the attributes of the stream without shortage through the provision of SDP objects. becomes.

<5-3.放送局システムの構成例>
図19は、第3の実施形態に係る放送局システム3の概略的な構成の一例を示すブロック図である。図19を参照すると、放送局システム3は、1つ以上の送信ノード300a~300nと、制御ノード400と、1つ以上の受信ノード450a~450nとを含む。
<5-3. Configuration example of broadcasting station system>
FIG. 19 is a block diagram showing an example of a schematic configuration of a broadcasting station system 3 according to the third embodiment. Referring to FIG. 19, broadcasting station system 3 includes one or more transmitting nodes 300a-300n, a control node 400, and one or more receiving nodes 450a-450n.

送信ノード300a~300nの各々(以下、送信ノード300という)は、放送局システム3において放送信号ストリームを送信可能な放送信号処理ノードである。各送信ノード300は、少なくとも1つのセンダ60を有する。送信ノード300は、自らが送信可能なストリームの属性を記述したSDPオブジェクトを制御ノード400へ提供する。送信ノード300により提供されるSDPオブジェクトは、図17及び図18を用いて説明した、エッセンス混在型ストリームのための新たなフォーマットに従って記述され得る。 Each of transmission nodes 300a to 300n (hereinafter referred to as transmission node 300) is a broadcast signal processing node capable of transmitting broadcast signal streams in broadcasting station system 3. FIG. Each sending node 300 has at least one sender 60 . The sending node 300 provides the control node 400 with an SDP object describing the attributes of the streams that it can send. The SDP object provided by the sending node 300 can be described according to the new format for the mixed-essence stream described with reference to FIGS. 17 and 18. FIG.

制御ノード400は、放送局のIPネットワークにおける、放送信号ストリームの送信ノードから受信ノードへの送信を制御するノードである。放送局システム3において送信される放送信号ストリームは、異なるタイプのエッセンスデータを単一のポート番号で伝送するエッセンス混在型ストリームを含む。制御ノード400は、例えば、図1に例示したAPS40又は制御端末50のような外部装置からのリクエストの受信に応じて、指定されるノード間のストリームの伝送をセットアップし、送信ノード300へ伝送開始を指示する。エッセンス混在型ストリームの伝送のセットアップは、送信元の送信ノード300から提供される上述したSDPオブジェクトの記述に従って行われ得る。 The control node 400 is a node that controls transmission of a broadcast signal stream from a transmission node to a reception node in the IP network of the broadcast station. Broadcast signal streams transmitted in the broadcasting station system 3 include mixed essence streams that transmit different types of essence data with a single port number. Control node 400 sets up transmission of a stream between designated nodes in response to receiving a request from an external device such as APS 40 or control terminal 50 illustrated in FIG. to direct. Transmission setup of the mixed-essence stream can be performed according to the above-described SDP object description provided by the transmission node 300 of the transmission source.

受信ノード450a~450nの各々(以下、受信ノード450という)は、放送局システム3において放送信号ストリームを受信可能な放送信号処理ノードである。各受信ノード450は、少なくとも1つのレシーバ65を有する。受信ノード450は、制御ノード400による制御の下で、放送信号ストリームを受信するための受信処理をSDPオブジェクトの記述に従って構成し、放送信号ストリームを送信ノード300から受信する。受信対象の放送信号ストリームがエッセンス混在型ストリームである場合には、受信ノード450は、異なるタイプのエッセンスデータを単一のポート番号で(即ち、単一のストリーム内で)受信する。受信ノード450の構成は、第1の実施形態において説明した放送信号処理ノード100、又は第2の実施形態において説明した放送信号処理ノード200の構成と同様であってよい。 Each of the receiving nodes 450 a to 450 n (hereinafter referred to as receiving node 450 ) is a broadcast signal processing node capable of receiving broadcast signal streams in the broadcasting station system 3 . Each receiving node 450 has at least one receiver 65 . The receiving node 450 , under the control of the control node 400 , configures reception processing for receiving the broadcast signal stream according to the description of the SDP object and receives the broadcast signal stream from the transmitting node 300 . If the broadcast signal stream to be received is a mixed-essence stream, the receiving node 450 receives different types of essence data on a single port number (ie, within a single stream). The configuration of the receiving node 450 may be the same as the configuration of the broadcast signal processing node 100 described in the first embodiment or the configuration of the broadcast signal processing node 200 described in the second embodiment.

<5-4.送信ノードの構成例>
図20は、本実施形態に係る送信ノード300の構成の一例を示すブロック図である。図20を参照すると、送信ノード300は、デバイス内部クロック110、メディアクロック112、RTPクロック114、PTP処理部116、通信部320、送信ストリーム処理部130、受信ストリーム処理部140、データ処理部180、制御部390及び記憶部395を備える。
<5-4. Configuration example of transmission node>
FIG. 20 is a block diagram showing an example of the configuration of the transmission node 300 according to this embodiment. Referring to FIG. 20, the transmission node 300 includes a device internal clock 110, a media clock 112, an RTP clock 114, a PTP processing unit 116, a communication unit 320, a transmission stream processing unit 130, a reception stream processing unit 140, a data processing unit 180, A control unit 390 and a storage unit 395 are provided.

(1)通信部
通信部320は、送信ノード300による他のノードとの通信を仲介するインタフェースである。通信部320は、有線通信のための接続端子及び接続回路を含んでもよく、又は無線通信のためのアンテナ、RF回路及びベースバンド回路を含んでもよい。本実施形態において、通信部320は、送信部322及び受信部324を含む。
(1) Communication Unit The communication unit 320 is an interface that mediates communication between the transmission node 300 and other nodes. The communication unit 320 may include connection terminals and connection circuitry for wired communication, or may include an antenna, RF circuitry, and baseband circuitry for wireless communication. In this embodiment, the communication unit 320 includes a transmitter 322 and a receiver 324 .

送信部322は、センダ60としての役割を有し、エッセンス混在型ストリームを放送局システム3のIPネットワークへ送信する。当該放送信号ストリームは、例えば、ARIB STD-B73ストリームであってよい。具体的には、送信ストリーム処理部130により生成される、放送信号ストリームのための一連のRTPパケットが送信部322へ入力される。各RTPパケットは、第1の実施形態及び第2の実施形態と同様の時刻情報(RTPタイムスタンプ及び/又はフレームカウント情報)を含む。送信部322は、入力される各RTPパケットにネットワークヘッダを追加して、各パケットを他のノードへ送信する。 The transmission unit 322 has a role as the sender 60 and transmits the essence-mixed stream to the IP network of the broadcasting station system 3 . The broadcast signal stream may be, for example, an ARIB STD-B73 stream. Specifically, a series of RTP packets for a broadcast signal stream generated by transmission stream processing section 130 are input to transmission section 322 . Each RTP packet includes time information (RTP timestamp and/or frame count information) similar to the first and second embodiments. The transmitting unit 322 adds a network header to each input RTP packet and transmits each packet to another node.

送信部322及び受信部324は、ストリームの伝送に関連する制御通信にも関与する。具体的には、例えば、受信部324は、制御ノード400(又は受信ノード450などの他のノード)からストリームの伝送に関連する様々な制御メッセージを受信する。送信部322は、制御ノード400(又は受信ノード450などの他のノード)へ制御メッセージに対する応答メッセージを送信する。 Transmitter 322 and receiver 324 are also responsible for control communications associated with the transmission of streams. Specifically, for example, receiver 324 receives various control messages related to transmission of the stream from control node 400 (or other nodes such as receiver node 450). The transmitter 322 transmits a response message to the control message to the control node 400 (or another node such as the receiving node 450).

本実施形態において、受信部324は、レシーバ65としての役割を有していてもいなくてもよい。 In this embodiment, the receiver 324 may or may not function as the receiver 65 .

(2)制御部
制御部390は、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)又はマイクロコントローラといった1つ以上のプロセッサを含む。制御部390は、記憶部395により記憶されるコンピュータプログラムを実行することにより、送信ノード300の動作の全般を制御する。
(2) Controller The controller 390 includes, for example, one or more processors such as a CPU (Central Processing Unit), MPU (Micro Processing Unit), or microcontroller. Control unit 390 controls overall operations of transmission node 300 by executing computer programs stored in storage unit 395 .

例えば、制御部390は、送信ノード300が放送局システム3のIPネットワークへ接続されると、mDNS(multicast Domain Name System)クエリの発行とその応答の受信を通じて、制御ノード400を発見する。さらに、制御部390は、例えば、受信部324を介して、制御ノード400からSDPオブジェクトの提供を求める制御メッセージを受信する。当該制御メッセージの受信に応じて、制御部390は、エッセンス混在型ストリームのための上述した新たなフォーマットに従って放送信号ストリームの属性を記述したSDPオブジェクトを、記憶部395から取得する。そして、制御部390は、取得したSDPオブジェクトを送信部322を介して制御ノード400へ送信する。 For example, when the transmission node 300 is connected to the IP network of the broadcasting station system 3, the control unit 390 discovers the control node 400 by issuing an mDNS (multicast Domain Name System) query and receiving the response. Further, the control unit 390 receives a control message requesting provision of an SDP object from the control node 400 via the receiving unit 324, for example. In response to receiving the control message, the control unit 390 acquires from the storage unit 395 an SDP object describing attributes of the broadcast signal stream according to the above-described new format for the mixed-essence stream. The control unit 390 then transmits the acquired SDP object to the control node 400 via the transmission unit 322 .

送信ノード300により提供されるSDPオブジェクトに基づいてストリームの伝送がセットアップされた後、制御部390は、制御ノード400から、ストリームの送信の開始を指示する制御メッセージを受信部324を介して受信する。当該制御メッセージの受信に応じて、制御部390は、送信部322からの放送信号ストリームの送信を開始する。 After the transmission of the stream is set up based on the SDP object provided by the transmitting node 300, the control unit 390 receives a control message from the control node 400 via the receiving unit 324 instructing the start of transmission of the stream. . In response to receiving the control message, controller 390 initiates transmission of the broadcast signal stream from transmitter 322 .

例えば、送信ノード300は、ストリームの伝送を管理し及び制御するための制御インタフェース規格の集合であるNMOSをサポートしてもよい。この場合、上述した制御メッセージの交換は、例えば、NMOS IS-04及びNMOS IS-05において予め定義されるHTTP(Hypertext Transfer Protocol)ベースの制御APIを介して行われ得る。 For example, the sending node 300 may support NMOS, a set of control interface standards for managing and controlling the transmission of streams. In this case, the above-mentioned exchange of control messages may be performed via an HTTP (Hypertext Transfer Protocol)-based control API, which is predefined in NMOS IS-04 and NMOS IS-05, for example.

(3)記憶部
記憶部395は、一時的な及び非一時的なコンピュータ読取可能なメモリを含む。一時的なメモリは、例えばRAM(Random Access Memory)を含み得る。非一時的なメモリは、例えばROM(Read Only Memory)、HDD(Hard Disk Drive)又はSSD(Solid State Drive)のうちの1つ以上を含み得る。記憶部395は、送信ノード300の機能性を実現するためのコンピュータプログラムを記憶する。さらに、本実施形態において、記憶部395は、送信ノード300により送信可能な放送信号ストリームの属性を記述したSDPオブジェクトを記憶する。
(3) Storage Unit Storage unit 395 includes temporary and non-transitory computer readable memory. Temporary memory may include, for example, RAM (Random Access Memory). The non-transitory memory may include, for example, one or more of ROM (Read Only Memory), HDD (Hard Disk Drive), or SSD (Solid State Drive). The storage unit 395 stores computer programs for implementing the functionality of the sending node 300 . Furthermore, in this embodiment, the storage unit 395 stores SDP objects describing attributes of broadcast signal streams that can be transmitted by the transmission node 300 .

ある観点において、上記SDPオブジェクトは、複数のエッセンスタイプにとって共通のメディア記述フィールドに関連付けられる属性フィールド内に、第1のエッセンスタイプのエッセンスデータに関連する第1の属性情報及び第2のエッセンスタイプのエッセンスデータに関連する第2の属性情報を含む。一例として、第1のエッセンスタイプは、映像エッセンスであってよく、第2のエッセンスタイプは、音声エッセンスであってよい。この場合、SDPオブジェクトは、複数のエッセンスタイプに共通的な属性フィールド内に、表1に例示したような映像関連属性を第1の属性情報として、表2に例示したような音声関連属性を第2の属性情報として含み得る。他の例として、第1のエッセンスタイプは、映像エッセンスであってよく、第2のエッセンスタイプは、補助データエッセンスであってよい。この場合、SDPオブジェクトは、複数のエッセンスタイプに共通的な属性フィールド内に、表1に例示したような映像関連属性を第1の属性情報として、表3に例示したような補助データ関連属性を第2の属性情報として含み得る。なお、これらの例に限定されず、送信ノード300により提供されるSDPオブジェクトは、表1~表5に例示した情報のいかなる組合せを含んでもよい。 In one aspect, the SDP object includes, in an attribute field associated with a media description field common to multiple essence types, first attribute information associated with essence data of a first essence type and of a second essence type. It includes second attribute information associated with the essence data. As an example, the first essence type may be a video essence and the second essence type may be an audio essence. In this case, the SDP object contains video-related attributes as exemplified in Table 1 as first attribute information and audio-related attributes as exemplified in Table 2 as second attribute information in an attribute field common to a plurality of essence types. 2 attribute information. As another example, the first essence type may be a video essence and the second essence type may be an auxiliary data essence. In this case, the SDP object has video-related attributes as shown in Table 1 as first attribute information and auxiliary data-related attributes as shown in Table 3 in the attribute field common to multiple essence types. It can be included as second attribute information. However, without being limited to these examples, the SDP object provided by the sending node 300 may include any combination of the information exemplified in Tables 1-5.

他の観点において、上記SDPオブジェクトは、映像エッセンスデータが圧縮されるかを示す圧縮関連情報、音声エッセンスデータに関連する音声チャンネル数情報、及びエッセンスデータへ適用される誤り訂正方式を示す誤り訂正情報、のうちの1つ以上を、放送信号ストリームのフォーマット固有のパラメータを記述する属性フィールド内に含む。表1を用いて説明したように、上記圧縮関連情報は、映像エッセンスデータが圧縮されるかを示す圧縮パラメータと、映像エッセンスデータが圧縮されることを当該圧縮パラメータが示す場合に、映像エッセンスデータを圧縮する際に利用されるコーデックを示すコーデックパラメータと、を含み得る。また、表4を用いて説明したように、上記誤り訂正情報は、エッセンスデータへ適用される誤り訂正方式を示すタイプパラメータと、当該タイプパラメータにより示される誤り訂正方式の設定値を示す設定パラメータとを含み得る。上記設定パラメータは、例えば、XOR符号化のための誤り訂正ブロックサイズを示すサイズパラメータ、又は、リードソロモン符号化のための処理単位に相当するデータグラム数を示すデータグラム数パラメータであり得る。 In another aspect, the SDP object includes compression-related information indicating whether the video essence data is compressed, audio channel number information associated with the audio essence data, and error correction information indicating the error correction scheme applied to the essence data. , in the attribute field that describes the format-specific parameters of the broadcast signal stream. As described using Table 1, the compression-related information includes a compression parameter indicating whether the video essence data is to be compressed, and if the compression parameter indicates that the video essence data is to be compressed, the video essence data is compressed. and a codec parameter indicating the codec to be used in compressing the . Further, as described using Table 4, the error correction information includes a type parameter indicating the error correction method applied to the essence data, and a setting parameter indicating the setting value of the error correction method indicated by the type parameter. can include The setting parameter may be, for example, a size parameter indicating an error correction block size for XOR encoding, or a datagram number parameter indicating the number of datagrams corresponding to a processing unit for Reed-Solomon encoding.

(4)送信制御処理の流れ-第1の例
図21は、送信ノード300により実行され得る送信制御処理の流れの第1の例を示すフローチャートである。
(4) Flow of Transmission Control Processing--First Example FIG.

まず、制御部390は、送信ノード300のIPネットワークへの接続に応じて、制御ノード400を発見する(ステップS301)。 First, the control unit 390 discovers the control node 400 according to the connection of the transmission node 300 to the IP network (step S301).

次いで、制御部390は、送信ノード300により送信可能な放送信号ストリームの属性を記述したSDPオブジェクトを記憶部395から取得し、取得したSDPオブジェクトを制御ノード400へ提供する(ステップS303)。ここで提供されるSDPオブジェクトは、複数のエッセンスタイプにとって共通のメディア記述フィールドに関連付けられる属性フィールド内に、第1及び第2のエッセンスタイプのエッセンスデータに関連する属性情報を含む。 Next, the control unit 390 acquires from the storage unit 395 an SDP object describing attributes of broadcast signal streams that can be transmitted by the transmission node 300, and provides the acquired SDP object to the control node 400 (step S303). The SDP object provided herein contains attribute information related to essence data of first and second essence types in attribute fields associated with media description fields common to multiple essence types.

その後、送信ノード300は、ストリームの送信の開始の指示を待ち受ける(ステップS305)。そして、制御ノード400(又は他のノード)からストリームの送信の開始を指示する制御メッセージが受信されると、送信部322は、制御部390による制御の下で、上記SDPオブジェクトにより示される属性を有する放送信号ストリームの送信を開始する(ステップS307)。 After that, the transmitting node 300 waits for an instruction to start transmitting the stream (step S305). Then, when a control message instructing the start of stream transmission is received from the control node 400 (or another node), the transmission unit 322, under the control of the control unit 390, converts the attributes indicated by the SDP object to start transmitting the broadcast signal stream it has (step S307).

(5)送信制御処理の流れ-第2の例
図22は、送信ノード300により実行され得る送信制御処理の流れの第2の例を示すフローチャートである。
(5) Flow of Transmission Control Processing--Second Example FIG.

まず、制御部390は、送信ノード300のIPネットワークへの接続に応じて、制御ノード400を発見する(ステップS301)。 First, the control unit 390 discovers the control node 400 according to the connection of the transmission node 300 to the IP network (step S301).

次いで、制御部390は、送信ノード300により送信可能な放送信号ストリームの属性を記述したSDPオブジェクトを記憶部395から取得し、取得したSDPオブジェクトを制御ノード400へ提供する(ステップS304)。ここで提供されるSDPオブジェクトは、圧縮関連情報、音声チャンネル数情報、及び誤り訂正情報のうちの1つ以上を、放送信号ストリームのフォーマット固有のパラメータを記述する属性フィールド内に含む。 Next, the control unit 390 acquires from the storage unit 395 an SDP object describing attributes of broadcast signal streams that can be transmitted by the transmission node 300, and provides the acquired SDP object to the control node 400 (step S304). The SDP objects provided herein contain one or more of compression-related information, audio channel number information, and error correction information in attribute fields that describe format-specific parameters of the broadcast signal stream.

その後、送信ノード300は、ストリームの送信の開始の指示を待ち受ける(ステップS305)。そして、制御ノード400(又は他のノード)からストリームの送信の開始を指示する制御メッセージが受信されると、送信部322は、制御部390による制御の下で、上記SDPオブジェクトにより示される属性を有する放送信号ストリームの送信を開始する(ステップS307)。 After that, the transmitting node 300 waits for an instruction to start transmitting the stream (step S305). Then, when a control message instructing the start of stream transmission is received from the control node 400 (or another node), the transmission unit 322, under the control of the control unit 390, converts the attributes indicated by the SDP object to start transmitting the broadcast signal stream it has (step S307).

<5-5.制御ノードの構成例>
図23は、本実施形態に係る制御ノード400の構成の一例を示すブロック図である。図23を参照すると、制御ノード400は、通信部410、制御部420及び記憶部430を備える。
<5-5. Configuration example of control node>
FIG. 23 is a block diagram showing an example of the configuration of the control node 400 according to this embodiment. Referring to FIG. 23, the control node 400 includes a communication unit 410, a control unit 420 and a storage unit 430.

(1)通信部
通信部410は、制御ノード400による他のノードとの通信を仲介するインタフェースである。通信部410は、有線通信のための接続端子及び接続回路を含んでもよく、又は無線通信のためのアンテナ、RF回路及びベースバンド回路を含んでもよい。本実施形態において、通信部410は、送信部412及び受信部414を含む。
(1) Communication Unit The communication unit 410 is an interface that mediates communication between the control node 400 and other nodes. The communication unit 410 may include connection terminals and connection circuitry for wired communication, or may include an antenna, RF circuitry, and baseband circuitry for wireless communication. In this embodiment, the communication unit 410 includes a transmitter 412 and a receiver 414 .

送信部412及び受信部414は、放送局システム3内のIPネットワーク上でのストリームの伝送に関連する制御通信に関与する。具体的には、例えば、送信部412は、送信ノード300へ、ストリームの伝送のセットアップ、送信の開始又は終了のための制御メッセージを送信し得る。同様に、送信部412は、受信ノード450へ、ストリームの伝送のセットアップ、受信の開始又は終了のための制御メッセージを送信し得る。受信部414は、送信ノード300及び受信ノード450から、制御メッセージに対する応答メッセージを受信し得る。 The transmitter 412 and receiver 414 are involved in control communications related to the transmission of streams over the IP network within the broadcast station system 3 . Specifically, for example, the transmitting unit 412 may transmit control messages to the transmitting node 300 for setting up transmission of a stream, starting or ending transmission. Similarly, transmitter 412 may send control messages to receiver node 450 to set up transmission of the stream, start or end reception. The receiving unit 414 can receive response messages to control messages from the transmitting node 300 and the receiving node 450 .

(2)制御部
制御部420は、例えば、CPU、MPU又はマイクロコントローラといった1つ以上のプロセッサを含む。制御部420は、記憶部430により記憶されるコンピュータプログラムを実行することにより、制御ノード400の動作の全般を制御する。本実施形態において、制御部420は、情報管理部422及びストリーム制御部424を含む。
(2) Controller The controller 420 includes one or more processors such as a CPU, MPU, or microcontroller. The control unit 420 controls overall operations of the control node 400 by executing computer programs stored in the storage unit 430 . In this embodiment, the controller 420 includes an information manager 422 and a stream controller 424 .

情報管理部422は、放送局システム3内の放送信号処理ノードに関する情報のデータベースへの登録及び管理を行う。例えば、情報管理部422は、IPネットワークへ接続した送信ノード300を発見すると、発見した送信ノード300へ、SDPオブジェクトの提供を求める制御メッセージを送信部412を介して送信する。そして、情報管理部422は、送信ノード300からSDPオブジェクトを受信部414を介して受信する。送信ノード300から受信されるSDPオブジェクトは、送信ノード300により送信可能な放送信号ストリームの属性を記述している。情報管理部422は、受信されるSDPオブジェクトに記述されている情報を記憶部430のデータベースへ登録する。情報管理部422は、受信ノード450からも同様にSDPオブジェクトを取得し、受信ノード450により受信可能なストリームの属性などの情報を記憶部430のデータベースへ登録し得る。 The information management unit 422 registers and manages information about broadcast signal processing nodes in the broadcasting station system 3 in the database. For example, when the information management unit 422 discovers the transmission node 300 connected to the IP network, the information management unit 422 transmits a control message requesting provision of the SDP object to the discovered transmission node 300 via the transmission unit 412 . The information management unit 422 then receives the SDP object from the transmission node 300 via the reception unit 414 . SDP objects received from transmitting node 300 describe attributes of broadcast signal streams that can be transmitted by transmitting node 300 . The information management unit 422 registers information described in the received SDP object in the database of the storage unit 430 . The information management unit 422 can similarly acquire an SDP object from the receiving node 450 and register information such as attributes of streams receivable by the receiving node 450 in the database of the storage unit 430 .

ストリーム制御部424は、放送局システム3内の送信ノード300から受信ノード450へのストリームの伝送を制御する。例えば、ストリーム制御部424は、ストリームの伝送を求めるリクエストがAPS40又は制御端末50から受信された場合に、指定された送信ノード300からの放送信号ストリームの受信をセットアップするように受信ノード450に指示する。ストリーム制御部424は、例えば、記憶部430のデータベースに登録されているストリームの属性を参照することにより、受信処理がどのようにセットアップされるべきかを決定し得る。例えば、次のうちの1つ以上が、ストリームの属性に依存して決定され得る:
・受信される映像エッセンスデータについて逆圧縮を実行すべきか
・逆圧縮を実行する際に利用すべきコーデック
・いくつの音声チャンネルが音声エッセンスデータに含まれるか
・誤り訂正方式としてどの方式を使用すべきか(XOR又はRS)
・XOR復号により誤り訂正を実行する際のFECブロックサイズ
・RS復号により誤り訂正を実行する際の処理単位となるデータグラム数
The stream control unit 424 controls transmission of streams from the transmission node 300 in the broadcasting station system 3 to the reception node 450 . For example, stream controller 424 instructs receiving node 450 to set up reception of a broadcast signal stream from designated transmitting node 300 when a request for transmission of the stream is received from APS 40 or control terminal 50. do. The stream control unit 424 can determine how the reception process should be set up, for example, by referring to the stream attributes registered in the database of the storage unit 430 . For example, one or more of the following may be determined depending on attributes of the stream:
・Should decompression be performed on the received video essence data? ・Codecs to be used when performing decompression ・How many audio channels are included in the audio essence data ・Which method should be used as an error correction method? (XOR or RS)
・FEC block size when executing error correction by XOR decoding ・Number of datagrams used as a processing unit when executing error correction by RS decoding

受信ノード450は、ストリーム制御部424から受信される上記指示に従って、受信処理を構成し及び対応するマルチキャストグループへ加入することにより、放送信号ストリームの受信をセットアップする。そして、ストリーム制御部424は、送信ノード300へ放送信号ストリームの送信の開始を指示する。それに応じて、送信ノード300は、放送信号ストリームの送信を開始する。 The receiving node 450 sets up reception of the broadcast signal stream by configuring the reception process and joining the corresponding multicast group according to the above instructions received from the stream controller 424 . The stream control unit 424 then instructs the transmission node 300 to start transmitting the broadcast signal stream. In response, transmitting node 300 begins transmitting the broadcast signal stream.

(3)記憶部
記憶部430は、一時的な及び非一時的なコンピュータ読取可能なメモリを含む。一時的なメモリは、例えばRAMを含み得る。非一時的なメモリは、例えばROM、HDD又はSSDのうちの1つ以上を含み得る。記憶部430は、制御ノード400の機能性を実現するためのコンピュータプログラムを記憶する。さらに、本実施形態において、記憶部430は、情報管理部422により放送局システム3内のノードからそれぞれ収集されるSDPオブジェクトに記述されている情報をデータベース内に記憶する。
(3) Storage Unit Storage unit 430 includes temporary and non-transitory computer-readable memory. Temporary memory may include, for example, RAM. Non-transitory memory may include, for example, one or more of ROM, HDD or SSD. The storage unit 430 stores computer programs for implementing the functionality of the control node 400 . Furthermore, in this embodiment, the storage unit 430 stores information described in the SDP objects collected from each node in the broadcasting station system 3 by the information management unit 422 in the database.

(4)送信制御処理の流れ-第1の例
図24は、制御ノード400により実行され得る送信制御処理の流れの第1の例を示すフローチャートである。
(4) Flow of Transmission Control Processing--First Example FIG.

まず、情報管理部422は、IPネットワークへ接続した送信ノード300を発見する(ステップS401)。 First, the information management unit 422 discovers the transmission node 300 connected to the IP network (step S401).

次いで、情報管理部422は、発見した送信ノード300により送信可能な放送信号ストリームの属性を記述したSDPオブジェクトを、当該送信ノード300から受信することにより取得する(ステップS403)。ここで取得されるSDPオブジェクトは、複数のエッセンスタイプにとって共通のメディア記述フィールドに関連付けられる属性フィールド内に、第1及び第2のエッセンスタイプのエッセンスデータに関連する属性情報を含む。 Next, the information management unit 422 acquires an SDP object describing attributes of broadcast signal streams that can be transmitted by the found transmission node 300 by receiving it from the transmission node 300 (step S403). The SDP object obtained here contains attribute information associated with the essence data of the first and second essence types in attribute fields associated with media description fields common to multiple essence types.

ストリーム制御部424は、ストリームの伝送のセットアップを求めるリクエストを待ち受ける(ステップS405)。ストリームの伝送のセットアップを求めるリクエストは、例えば、APS40又は制御端末50といった外部装置から受信され得る。 The stream control unit 424 waits for a request for setting up transmission of the stream (step S405). A request to set up the transmission of a stream may be received from an external device, eg APS 40 or control terminal 50 .

ストリーム制御部424は、上記リクエストが受信されると、指定された受信ノード450に、上記SDPオブジェクトにより示される属性に従って受信処理を構成し及び対応するマルチキャストグループに加入するように指示する(ステップS407)。そして、ストリーム制御部424は、指定された送信ノード300に、放送信号ストリームの送信を開始するように指示する(ステップS409)。 When the request is received, the stream control unit 424 instructs the specified receiving node 450 to configure the receiving process according to the attributes indicated by the SDP object and join the corresponding multicast group (step S407). ). The stream control unit 424 then instructs the designated transmission node 300 to start transmitting the broadcast signal stream (step S409).

(5)送信制御処理の流れ-第2の例
図25は、制御ノード400により実行され得る送信制御処理の流れの第2の例を示すフローチャートである。
(5) Flow of Transmission Control Processing—Second Example FIG. 25 is a flow chart showing a second example of the flow of transmission control processing that can be executed by the control node 400. FIG.

まず、情報管理部422は、IPネットワークへ接続した送信ノード300を発見する(ステップS401)。 First, the information management unit 422 discovers the transmission node 300 connected to the IP network (step S401).

次いで、情報管理部422は、発見した送信ノード300により送信可能な放送信号ストリームの属性を記述したSDPオブジェクトを、当該送信ノード300から受信することにより取得する(ステップS404)。ここで取得されるSDPオブジェクトは、圧縮関連情報、音声チャンネル数情報、及び誤り訂正情報のうちの1つ以上を、放送信号ストリームのフォーマット固有のパラメータを記述する属性フィールド内に含む。 Next, the information management unit 422 obtains an SDP object describing attributes of broadcast signal streams that can be transmitted by the found transmission node 300 by receiving it from the transmission node 300 (step S404). The SDP object obtained here contains one or more of compression-related information, audio channel number information, and error correction information in attribute fields that describe format-specific parameters of the broadcast signal stream.

ストリーム制御部424は、ストリームの伝送のセットアップを求めるリクエストを待ち受ける(ステップS405)。ストリームの伝送のセットアップを求めるリクエストは、例えば、APS40又は制御端末50といった外部装置から受信され得る。 The stream control unit 424 waits for a request for setting up transmission of the stream (step S405). A request to set up the transmission of a stream may be received from an external device, eg APS 40 or control terminal 50 .

ストリーム制御部424は、上記リクエストが受信されると、指定された受信ノード450に、上記SDPオブジェクトにより示される属性に従って受信処理を構成し及び対応するマルチキャストグループに加入するように指示する(ステップS407)。そして、ストリーム制御部424は、指定された送信ノード300に、放送信号ストリームの送信を開始するように指示する(ステップS409)。 When the request is received, the stream control unit 424 instructs the specified receiving node 450 to configure the receiving process according to the attributes indicated by the SDP object and join the corresponding multicast group (step S407). ). The stream control unit 424 then instructs the designated transmission node 300 to start transmitting the broadcast signal stream (step S409).

<<6.第4の実施形態>>
次いで、図26及び図27を用いて、第4の実施形態について説明する。上述した第3の実施形態は具体的な実施形態であり、一方で第4の実施形態はより一般化された実施形態である。
<<6. Fourth Embodiment>>
Next, a fourth embodiment will be described with reference to FIGS. 26 and 27. FIG. The third embodiment described above is a specific embodiment, while the fourth embodiment is a more generalized embodiment.

<6-1.送信ノードの構成例>
図26は、第4の実施形態に係る送信ノード500の構成の一例を示すブロック図である。図26を参照すると、送信ノード500は、送信部510及び制御部520を備える。
<6-1. Configuration example of transmission node>
FIG. 26 is a block diagram showing an example configuration of a transmission node 500 according to the fourth embodiment. Referring to FIG. 26, transmission node 500 includes transmission section 510 and control section 520 .

送信部510は、異なるタイプのエッセンスデータを単一のポート番号で伝送する放送信号ストリームを、放送局のIPネットワークへ送信する。 The transmitter 510 transmits a broadcast signal stream carrying different types of essence data on a single port number to the broadcaster's IP network.

制御部520は、放送信号ストリームの属性を記述するSDPオブジェクトを他のノードへ提供する。 Controller 520 provides SDP objects describing attributes of the broadcast signal stream to other nodes.

ある観点において、上記SDPオブジェクトは、複数のエッセンスタイプにとって共通のメディア記述フィールドに関連付けられる属性フィールド内に、第1のエッセンスタイプのエッセンスデータに関連する第1の属性情報及び第2のエッセンスタイプのエッセンスデータに関連する第2の属性情報を含む。 In one aspect, the SDP object includes, in an attribute field associated with a media description field common to multiple essence types, first attribute information associated with essence data of a first essence type and of a second essence type. It includes second attribute information associated with the essence data.

他の観点において、上記SDPオブジェクトは、映像エッセンスデータが圧縮されるかを示す圧縮関連情報、音声エッセンスデータに関連する音声チャンネル数情報、及びエッセンスデータへ適用される誤り訂正方式を示す誤り訂正情報、のうちの1つ以上を、上記放送信号ストリームのフォーマット固有のパラメータを記述する属性フィールド内に含む。 In another aspect, the SDP object includes compression-related information indicating whether the video essence data is compressed, audio channel number information associated with the audio essence data, and error correction information indicating the error correction scheme applied to the essence data. , in an attribute field describing format-specific parameters of said broadcast signal stream.

ストリームの伝送のセットアップのために実行される送信制御処理が、送信ノード500の上記動作ステップを含んでもよい。また、それら動作ステップをプロセッサに実行させるコンピュータプログラムが提供されてもよい。また、それら動作ステップをプロセッサに実行させるコンピュータプログラムを記憶した非一時的なコンピュータ読取可能な記憶媒体が提供されてもよい。加えて、第3の実施形態において説明した送信ノード300の任意の機能又は処理が本実施形態に適用されてよい。 A transmission control process performed to set up transmission of a stream may include the above operational steps of the transmitting node 500 . A computer program may also be provided that causes a processor to perform those operational steps. A non-transitory computer-readable storage medium storing a computer program that causes a processor to perform those operational steps may also be provided. Additionally, any function or process of the sending node 300 described in the third embodiment may be applied to this embodiment.

<6-2.制御ノードの構成例>
図27は、第4の実施形態に係る制御ノード600の構成の一例を示すブロック図である。図27を参照すると、制御ノード600は、制御部610を備える。
<6-2. Configuration example of control node>
FIG. 27 is a block diagram showing an example of the configuration of the control node 600 according to the fourth embodiment. Referring to FIG. 27 , the control node 600 has a control section 610 .

制御ノード600は、放送局のIPネットワークにおける、異なるタイプのエッセンスデータを単一のポート番号で伝送する放送信号ストリームの送信ノードから受信ノードへの送信を制御するノードである。制御部610は、上記放送信号ストリームの属性を記述するSDPオブジェクトを上記送信ノードから取得する。そして、制御部610は、取得したSDPオブジェクトに従って、上記放送信号ストリームの伝送をセットアップする。 The control node 600 is a node that controls the transmission of broadcast signal streams carrying different types of essence data on a single port number from a transmitting node to a receiving node in the broadcaster's IP network. The control unit 610 obtains an SDP object describing attributes of the broadcast signal stream from the transmitting node. The control unit 610 then sets up transmission of the broadcast signal stream according to the obtained SDP object.

ある観点において、上記SDPオブジェクトは、複数のエッセンスタイプにとって共通のメディア記述フィールドに関連付けられる属性フィールド内に、第1のエッセンスタイプのエッセンスデータに関連する第1の属性情報及び第2のエッセンスタイプのエッセンスデータに関連する第2の属性情報を含む。 In one aspect, the SDP object includes, in an attribute field associated with a media description field common to multiple essence types, first attribute information associated with essence data of a first essence type and of a second essence type. It includes second attribute information associated with the essence data.

他の観点において、上記SDPオブジェクトは、映像エッセンスデータが圧縮されるかを示す圧縮関連情報、音声エッセンスデータに関連する音声チャンネル数情報、及びエッセンスデータへ適用される誤り訂正方式を示す誤り訂正情報、のうちの1つ以上を、上記放送信号ストリームのフォーマット固有のパラメータを記述する属性フィールド内に含む。 In another aspect, the SDP object includes compression-related information indicating whether the video essence data is compressed, audio channel number information associated with the audio essence data, and error correction information indicating the error correction scheme applied to the essence data. , in an attribute field describing format-specific parameters of said broadcast signal stream.

ストリームの伝送のセットアップのために実行される送信制御処理が、制御ノード600の上記動作ステップを含んでもよい。また、それら動作ステップをプロセッサに実行させるコンピュータプログラムが提供されてもよい。また、それら動作ステップをプロセッサに実行させるコンピュータプログラムを記憶した非一時的なコンピュータ読取可能な記憶媒体が提供されてもよい。加えて、第3の実施形態において説明した制御ノード400の任意の機能又は処理が本実施形態に適用されてよい。 A transmission control process performed to set up transmission of a stream may include the above operational steps of the control node 600 . A computer program may also be provided that causes a processor to perform those operational steps. A non-transitory computer-readable storage medium storing a computer program that causes a processor to perform those operational steps may also be provided. Additionally, any function or process of the control node 400 described in the third embodiment may be applied to this embodiment.

<<7.第3の実施形態及び第4の実施形態のまとめ>>
ここまで、本開示の第3の実施形態及び第4の実施形態について詳細に説明した。これら実施形態では、異なるタイプのエッセンスデータを単一のポート番号で伝送するいわゆるエッセンス混在型ストリームの属性を記述するSDPオブジェクトが、複数のエッセンスタイプにとって共通のメディア記述フィールドに関連付けられる属性フィールド内に、第1のエッセンスタイプのエッセンスデータに関連する第1の属性情報及び第2のエッセンスタイプのエッセンスデータに関連する第2の属性情報を含む。したがって、例えばARIB STD-B73ストリームのようなエッセンス混在型ストリームの属性を、ストリームの構造に即してSDPオブジェクト内に適切に記述することができる。その結果、SDPベースの管理用APIを活用してSDPオブジェクトを交換することにより、エッセンス混在型ストリームの伝送を簡易な手続でセットアップすることが可能となる。
<<7. Summary of Third Embodiment and Fourth Embodiment>>
So far, the third embodiment and the fourth embodiment of the present disclosure have been described in detail. In these embodiments, an SDP object describing the attributes of a so-called mixed-essence stream that carries different types of essence data on a single port number is placed in an attribute field associated with a media description field common to multiple essence types. , first attribute information associated with essence data of a first essence type and second attribute information associated with essence data of a second essence type. Therefore, attributes of a mixed-essence stream such as an ARIB STD-B73 stream can be appropriately described in the SDP object according to the structure of the stream. As a result, by exchanging SDP objects using the SDP-based management API, it becomes possible to set up the transmission of mixed-essence streams with a simple procedure.

例えば、図15を用いて説明したように、SMPTE ST2110ストリームのために通常利用される既存のSDPオブジェクトのフォーマットは、映像関連属性が記述されるメディアレベルセクションとは別に、音声関連属性が記述されるメディアレベルセクション及び補助データ関連属性が記述されるメディアレベルセクションを有する。対照的に、第3の実施形態及び第4の実施形態のように、2つ以上のエッセンスタイプにとって共通のメディアレベルセクションにそれらエッセンスタイプのエッセンスデータに関連する属性を記述することで、1つのメディア(ストリーム)に対し1つのメディアレベルセクションというSDPの解釈の一貫性を保つことができる。 For example, as described with FIG. 15, the existing SDP object format typically used for SMPTEST ST2110 streams describes audio-related attributes separately from the media-level section, which describes video-related attributes. It has a media level section in which attributes related to auxiliary data are described. In contrast, as in the third and fourth embodiments, describing the attributes associated with the essence data of two or more essence types in a media level section common to those essence types allows one The SDP interpretation of one media level section per media (stream) can be kept consistent.

追加的に又は代替的に、エッセンス混在型ストリームの属性を記述する上記SDPオブジェクトが、映像エッセンスデータが圧縮されるかを示す圧縮関連情報、音声エッセンスデータに関連する音声チャンネル数情報、及びエッセンスデータへ適用される誤り訂正方式を示す誤り訂正情報、のうちの1つ以上をフォーマット固有のパラメータを記述する属性フィールド内に含む。したがって、例えばARIB STD-B73ストリームのような独自の仕様を有する放送信号ストリームの属性を、SDPオブジェクトに不足なく記述することができる。その結果、SDPベースの管理用APIを活用してSDPオブジェクトを交換することにより、ARIB STD-B73ストリームの伝送を簡易な手続でセットアップすることが可能となる。 Additionally or alternatively, the SDP object describing attributes of the mixed-essence stream includes compression-related information indicating whether video essence data is compressed, audio channel number information associated with audio essence data, and essence data. error correction information indicating the error correction scheme to be applied to the format-specific parameters. Therefore, the attributes of broadcast signal streams having unique specifications, such as ARIB STD-B73 streams, can be fully described in SDP objects. As a result, it becomes possible to set up the transmission of ARIB STD-B73 streams with a simple procedure by exchanging SDP objects by utilizing the SDP-based management API.

例えば、図16を用いて説明したように、SMPTE ST2110ストリームのために通常利用される既存のSDPオブジェクトのフォーマットは、フォーマット固有パラメータ属性フィールド内に、圧縮関連情報、音声チャンネル数情報及び誤り訂正情報のいずれも有しない。対照的に、第3の実施形態及び第4の実施形態のように、フォーマット固有パラメータ属性フィールド内に、圧縮関連情報、音声チャンネル数情報及び/又は誤り訂正情報を含めることで、ARIB STD-B73ストリームの受信側で、SDPオブジェクトの記述に従って受信処理を適切に構成することができる。 For example, as described with FIG. 16, the existing SDP object format typically used for SMPTEST ST2110 streams contains compression-related information, audio channel number information and error correction information in format-specific parameter attribute fields. does not have either In contrast, by including compression-related information, audio channel number information and/or error correction information in the format-specific parameter attribute field as in the third and fourth embodiments, ARIB STD-B73 At the receiving end of the stream, the receiving process can be configured appropriately according to the SDP object description.

なお、本開示に係る技術は、上述した実施形態に限定されるものではない。これらの実施形態は例示にすぎないということ、並びに、本開示のスコープ及び精神から逸脱することなく様々な変形が可能であるということが、当業者に理解されるであろう。 Note that the technology according to the present disclosure is not limited to the above-described embodiments. Those skilled in the art will appreciate that these embodiments are illustrative only and that various modifications are possible without departing from the scope and spirit of the disclosure.

例えば、フローチャートに示した処理ステップは、必ずしも図示した順序通りに実行されなくてもよい。例えば、処理ステップは図示した順序とは異なる順序で実行されてもよく、2つ以上の処理ステップが並列的に実行されてもよい。また、一部の処理ステップが削除されてもよく、さらなる処理ステップが追加されてもよい。 For example, the process steps shown in the flowcharts do not necessarily have to be performed in the order shown. For example, the processing steps may be performed in a different order than shown, and two or more processing steps may be performed in parallel. Also, some processing steps may be deleted and further processing steps may be added.

また、本明細書において説明したノードの機能は、ソフトウェア、ハードウェア、及びソフトウェアとハードウェアとの組み合わせのいずれで実現されてもよい。ソフトウェアを構成するコンピュータプログラムのプログラム命令は、例えば、ノードの内部又は外部の非一時的なコンピュータ読取可能な記憶媒体において記憶され、実行時にメモリへ読み込まれてプロセッサにより実行される。 Also, the node functions described herein may be implemented in software, hardware, or a combination of software and hardware. Program instructions of a computer program that constitutes software are stored, for example, in a non-transitory computer-readable storage medium inside or outside the node, read into memory at run time, and executed by a processor.

また、本明細書において単一の装置又は単一のノードにより実現されるものとして説明した技術が、複数の装置又は複数のノードが相互に連携することによりシステムとして実現されてもよい。 Also, the technology described herein as implemented by a single device or a single node may be implemented as a system by multiple devices or multiple nodes cooperating with each other.

上記実施形態の一部又は全部は、以下の付記のようにも記載され得るが、以下には限られない。 Some or all of the above embodiments may also be described in the following additional remarks, but are not limited to the following.

(付記1)
異なるタイプのエッセンスデータを単一のポート番号で伝送する放送信号ストリームを、放送局のIPネットワークへ送信する送信部と、
前記放送信号ストリームの属性を記述するSDP(Session Description Protocol)オブジェクトを他のノードへ提供する制御部と、
を備え、
前記SDPオブジェクトは、映像エッセンスデータが圧縮されるかを示す圧縮関連情報、音声エッセンスデータに関連する音声チャンネル数情報、及びエッセンスデータへ適用される誤り訂正方式を示す誤り訂正情報、のうちの1つ以上を、前記放送信号ストリームのフォーマット固有のパラメータを記述する属性フィールド内に含む、
送信ノード。
(Appendix 1)
a transmitter for transmitting a broadcast signal stream carrying different types of essence data on a single port number to an IP network of a broadcaster;
a control unit that provides an SDP (Session Description Protocol) object describing attributes of the broadcast signal stream to other nodes;
with
The SDP object is one of compression-related information indicating whether video essence data is compressed, audio channel number information associated with audio essence data, and error correction information indicating an error correction method applied to essence data. one or more within an attribute field describing format-specific parameters of said broadcast signal stream;
sending node.

(付記2)
前記圧縮関連情報は、
前記映像エッセンスデータが圧縮されるかを示す圧縮パラメータを含み、
前記映像エッセンスデータが圧縮されることを前記圧縮パラメータが示す場合に、前記映像エッセンスデータを圧縮する際に利用されるコーデックを示すコーデックパラメータをさらに含む、
付記1に記載の送信ノード。
(Appendix 2)
The compression-related information is
including a compression parameter indicating whether the video essence data is compressed;
further comprising a codec parameter indicating a codec to be used in compressing the video essence data when the compression parameter indicates that the video essence data is to be compressed;
The sending node of claim 1.

(付記3)
前記誤り訂正情報は、
前記エッセンスデータへ適用される前記誤り訂正方式を示すタイプパラメータと、
前記タイプパラメータにより示される前記誤り訂正方式の設定値を示す設定パラメータと、
を含む、付記1又は付記2に記載の送信ノード。
(Appendix 3)
The error correction information is
a type parameter indicating the error correction scheme applied to the essence data;
a setting parameter indicating a setting value of the error correction scheme indicated by the type parameter;
A transmitting node according to clause 1 or clause 2, comprising:

(付記4)
前記タイプパラメータがXOR符号化を示す場合に、前記設定パラメータは、誤り訂正ブロックサイズを示すサイズパラメータを含む、付記3に記載の送信ノード。
(Appendix 4)
4. The transmitting node of clause 3, wherein if the type parameter indicates XOR encoding, the configuration parameters include a size parameter indicating an error correction block size.

(付記5)
前記タイプパラメータがリードソロモン符号化を示す場合に、前記設定パラメータは、リードソロモン符号化の処理単位に相当するデータグラム数を示すデータグラム数パラメータを含む、付記3又は付記4に記載の送信ノード。
(Appendix 5)
The transmitting node according to appendix 3 or appendix 4, wherein when the type parameter indicates Reed-Solomon encoding, the setting parameter includes a datagram number parameter indicating the number of datagrams corresponding to a processing unit of Reed-Solomon encoding. .

(付記6)
前記制御部は、予め定義される管理用のアプリケーションプロトコルインタフェースを介して、前記SDPオブジェクトを前記他のノードへ提供する、付記1~5のいずれか1項に記載の送信ノード。
(Appendix 6)
6. The transmitting node according to any one of appendices 1 to 5, wherein the control unit provides the SDP object to the other node via a predefined management application protocol interface.

(付記7)
前記放送信号ストリームは、ARIB STD-B73ストリームである、付記1~6のいずれか1項に記載の送信ノード。
(Appendix 7)
7. The transmitting node according to any one of the clauses 1-6, wherein the broadcast signal stream is an ARIB STD-B73 stream.

(付記8)
付記1~7のいずれか1項に記載の送信ノードと、
前記SDPオブジェクトの記述に従ってセットアップされる前記放送信号ストリームを受信する受信ノードと、
を含む放送局システム。
(Appendix 8)
a transmission node according to any one of Appendices 1 to 7;
a receiving node that receives the broadcast signal stream set up according to the SDP object description;
Broadcasting station system including.

(付記9)
放送局のIPネットワークにおける、異なるタイプのエッセンスデータを単一のポート番号で伝送する放送信号ストリームの送信ノードから受信ノードへの送信を制御する制御ノードであって、
前記放送信号ストリームの属性を記述するSDP(Session Description Protocol)オブジェクトを前記送信ノードから取得する制御部、を備え、
前記SDPオブジェクトは、映像エッセンスデータが圧縮されるかを示す圧縮関連情報、音声エッセンスデータに関連する音声チャンネル数情報、及びエッセンスデータへ適用される誤り訂正方式を示す誤り訂正情報、のうちの1つ以上を、前記放送信号ストリームのフォーマット固有のパラメータを記述する属性フィールド内に含む、
制御ノード。
(Appendix 9)
A control node for controlling transmission from a transmitting node to a receiving node of a broadcast signal stream carrying different types of essence data on a single port number in a broadcast station IP network,
a control unit that acquires an SDP (Session Description Protocol) object describing attributes of the broadcast signal stream from the transmission node;
The SDP object is one of compression-related information indicating whether video essence data is compressed, audio channel number information associated with audio essence data, and error correction information indicating an error correction method applied to essence data. one or more within an attribute field describing format-specific parameters of said broadcast signal stream;
control node.

(付記10)
異なるタイプのエッセンスデータを単一のポート番号で伝送する放送信号ストリームの属性を記述するSDP(Session Description Protocol)オブジェクトを他のノードへ提供することと、
前記放送信号ストリームを、放送局のIPネットワークへ送信することと、
を含み、
前記SDPオブジェクトは、映像エッセンスデータが圧縮されるかを示す圧縮関連情報、音声エッセンスデータに関連する音声チャンネル数情報、及びエッセンスデータへ適用される誤り訂正方式を示す誤り訂正情報、のうちの1つ以上を、前記放送信号ストリームのフォーマット固有のパラメータを記述する属性フィールド内に含む、
送信制御方法。
(Appendix 10)
providing other nodes with an SDP (Session Description Protocol) object that describes attributes of a broadcast signal stream that carries different types of essence data on a single port number;
transmitting the broadcast signal stream to a broadcast station's IP network;
including
The SDP object is one of compression-related information indicating whether video essence data is compressed, audio channel number information associated with audio essence data, and error correction information indicating an error correction method applied to essence data. one or more within an attribute field describing format-specific parameters of said broadcast signal stream;
Transmission control method.

(付記11)
異なるタイプのエッセンスデータを単一のポート番号で伝送する放送信号ストリームを、放送局のIPネットワークへ送信する送信ノードのプロセッサに、
前記放送信号ストリームの属性を記述するSDP(Session Description Protocol)オブジェクトを他のノードへ提供すること、
を実行させ、
前記SDPオブジェクトは、映像エッセンスデータが圧縮されるかを示す圧縮関連情報、音声エッセンスデータに関連する音声チャンネル数情報、及びエッセンスデータへ適用される誤り訂正方式を示す誤り訂正情報、のうちの1つ以上を、前記放送信号ストリームのフォーマット固有のパラメータを記述する属性フィールド内に含む、
コンピュータプログラム。
(Appendix 11)
to a processor at a transmitting node that transmits a broadcast signal stream carrying different types of essence data on a single port number to the IP network of the broadcaster;
providing an SDP (Session Description Protocol) object describing attributes of the broadcast signal stream to other nodes;
and
The SDP object is one of compression-related information indicating whether video essence data is compressed, audio channel number information associated with audio essence data, and error correction information indicating an error correction method applied to essence data. one or more within an attribute field describing format-specific parameters of said broadcast signal stream;
computer program.

(付記12)
異なるタイプのエッセンスデータを単一のポート番号で伝送する放送信号ストリームを、放送局のIPネットワークへ送信する送信ノードのプロセッサに、
前記放送信号ストリームの属性を記述するSDP(Session Description Protocol)オブジェクトを他のノードへ提供すること、
を実行させ、
前記SDPオブジェクトは、映像エッセンスデータが圧縮されるかを示す圧縮関連情報、音声エッセンスデータに関連する音声チャンネル数情報、及びエッセンスデータへ適用される誤り訂正方式を示す誤り訂正情報、のうちの1つ以上を、前記放送信号ストリームのフォーマット固有のパラメータを記述する属性フィールド内に含む、
コンピュータプログラム、を記憶した非一時的なコンピュータ読取可能な記憶媒体。
(Appendix 12)
to a processor at a transmitting node that transmits a broadcast signal stream carrying different types of essence data on a single port number to the IP network of the broadcaster;
providing an SDP (Session Description Protocol) object describing attributes of the broadcast signal stream to other nodes;
and
The SDP object is one of compression-related information indicating whether video essence data is compressed, audio channel number information associated with audio essence data, and error correction information indicating an error correction method applied to essence data. one or more within an attribute field describing format-specific parameters of said broadcast signal stream;
A non-transitory computer-readable storage medium storing a computer program.

(付記13)
放送局のIPネットワークにおける、異なるタイプのエッセンスデータを単一のポート番号で伝送する放送信号ストリームの送信ノードから受信ノードへの送信を制御するための送信制御方法であって、
前記放送信号ストリームの属性を記述するSDP(Session Description Protocol)オブジェクトを前記送信ノードから取得すること、
を含み、
前記SDPオブジェクトは、映像エッセンスデータが圧縮されるかを示す圧縮関連情報、音声エッセンスデータに関連する音声チャンネル数情報、及びエッセンスデータへ適用される誤り訂正方式を示す誤り訂正情報、のうちの1つ以上を、前記放送信号ストリームのフォーマット固有のパラメータを記述する属性フィールド内に含む、
送信制御方法。
(Appendix 13)
A transmission control method for controlling transmission from a transmission node to a reception node of a broadcast signal stream that transmits different types of essence data with a single port number in an IP network of a broadcast station, comprising:
obtaining an SDP (Session Description Protocol) object describing attributes of the broadcast signal stream from the transmitting node;
including
The SDP object is one of compression-related information indicating whether video essence data is compressed, audio channel number information associated with audio essence data, and error correction information indicating an error correction method applied to essence data. one or more within an attribute field describing format-specific parameters of said broadcast signal stream;
Transmission control method.

(付記14)
放送局のIPネットワークにおける、異なるタイプのエッセンスデータを単一のポート番号で伝送する放送信号ストリームの送信ノードから受信ノードへの送信を制御する制御ノードのプロセッサに、
前記放送信号ストリームの属性を記述するSDP(Session Description Protocol)オブジェクトを前記送信ノードから取得すること、
を実行させ、
前記SDPオブジェクトは、映像エッセンスデータが圧縮されるかを示す圧縮関連情報、音声エッセンスデータに関連する音声チャンネル数情報、及びエッセンスデータへ適用される誤り訂正方式を示す誤り訂正情報、のうちの1つ以上を、前記放送信号ストリームのフォーマット固有のパラメータを記述する属性フィールド内に含む、
コンピュータプログラム。
(Appendix 14)
to a processor in a control node that controls transmission from a transmitting node to a receiving node of a broadcast signal stream carrying different types of essence data on a single port number in a broadcaster's IP network;
obtaining an SDP (Session Description Protocol) object describing attributes of the broadcast signal stream from the transmitting node;
and
The SDP object is one of compression-related information indicating whether video essence data is compressed, audio channel number information associated with audio essence data, and error correction information indicating an error correction method applied to essence data. one or more within an attribute field describing format-specific parameters of said broadcast signal stream;
computer program.

(付記15)
放送局のIPネットワークにおける、異なるタイプのエッセンスデータを単一のポート番号で伝送する放送信号ストリームの送信ノードから受信ノードへの送信を制御する制御ノードのプロセッサに、
前記放送信号ストリームの属性を記述するSDP(Session Description Protocol)オブジェクトを前記送信ノードから取得すること、
を実行させ、
前記SDPオブジェクトは、映像エッセンスデータが圧縮されるかを示す圧縮関連情報、音声エッセンスデータに関連する音声チャンネル数情報、及びエッセンスデータへ適用される誤り訂正方式を示す誤り訂正情報、のうちの1つ以上を、前記放送信号ストリームのフォーマット固有のパラメータを記述する属性フィールド内に含む、
コンピュータプログラム、を記憶した非一時的なコンピュータ読取可能な記憶媒体。
(Appendix 15)
to a processor in a control node that controls transmission from a transmitting node to a receiving node of a broadcast signal stream carrying different types of essence data on a single port number in a broadcaster's IP network;
obtaining an SDP (Session Description Protocol) object describing attributes of the broadcast signal stream from the transmitting node;
and
The SDP object is one of compression-related information indicating whether video essence data is compressed, audio channel number information associated with audio essence data, and error correction information indicating an error correction method applied to essence data. one or more within an attribute field describing format-specific parameters of said broadcast signal stream;
A non-transitory computer-readable storage medium storing a computer program.

本開示に係る技術は、限定ではないものの、放送信号を処理するシステムにおいて利用可能である。 Techniques of the present disclosure can be used, without limitation, in systems that process broadcast signals.

1,3 放送局システム
10 IPドメイン
20(20a~d) 放送信号処理ノード
60(60a~d) センダ
65(65a~c) レシーバ
70 共通基準クロック
72a デバイス内部クロック
73a,76a メディアクロック
74a,77a RTPクロック
81,82 エッセンス分離型ストリーム
83 エッセンス混在型ストリーム
100,200 放送信号処理ノード
110 デバイス内部クロック
112 メディアクロック
114 RTPクロック
116 PTP処理部
120,210,215 通信部(第1通信部)
122 送信部
124 受信部
130 送信ストリーム処理部
140 受信ストリーム処理部
142 トランスポート処理部
144 トランスポートヘッダ除去部
150 エッセンスデータグラム処理部
152 エッセンスヘッダ除去部
154 映像エッセンス処理部
156 音声エッセンス処理部
158 補助データエッセンス処理部
160,220 アラインメント部
161a~d,166a~d RTPパケット
162a~d,167a~d RTPヘッダ
163a~d,168a~b エッセンスヘッダ
170 FECデータグラム処理部
180 データ処理部
190 制御部
230 再生部
240 変換部
250 第2通信部
300,500 送信ノード
311 SDPオブジェクト
312 セッションレベルセクション
313,318 メディアレベルセクション
315 RTPマップ属性フィールド
316 フォーマット固有パラメータ属性フィールド
317 パケット時間属性フィールド
320 通信部
322,510 送信部
324 受信部
390,520 制御部
395 記憶部
400,600 制御ノード
410 通信部
412 送信部
414 受信部
420,610 制御部
422 情報管理部
424 ストリーム制御部
430 記憶部
450 受信ノード
1, 3 Broadcast station system 10 IP domain 20 (20a-d) Broadcast signal processing node 60 (60a-d) Sender 65 (65a-c) Receiver 70 Common reference clock 72a Device internal clock 73a, 76a Media clock 74a, 77a RTP Clocks 81, 82 Essence-separated stream 83 Essence-mixed stream 100, 200 Broadcast signal processing node 110 Device internal clock 112 Media clock 114 RTP clock 116 PTP processing unit 120, 210, 215 Communication unit (first communication unit)
122 transmitting unit 124 receiving unit 130 transmission stream processing unit 140 reception stream processing unit 142 transport processing unit 144 transport header removal unit 150 essence datagram processing unit 152 essence header removal unit 154 video essence processing unit 156 audio essence processing unit 158 auxiliary data essence processing unit 160, 220 alignment unit 161a-d, 166a-d RTP packet 162a-d, 167a-d RTP header 163a-d, 168a-b essence header 170 FEC datagram processing unit 180 data processing unit 190 control unit 230 Reproduction unit 240 Conversion unit 250 Second communication unit 300,500 Transmission node 311 SDP object 312 Session level section 313,318 Media level section 315 RTP map attribute field 316 Format specific parameter attribute field 317 Packet time attribute field 320 Communication unit 322,510 Transmission section 324 Reception section 390, 520 Control section 395 Storage section 400, 600 Control node 410 Communication section 412 Transmission section 414 Reception section 420, 610 Control section 422 Information management section 424 Stream control section 430 Storage section 450 Reception node

Claims (10)

異なるタイプのエッセンスデータを単一のポート番号で伝送する放送信号ストリームを、放送局のIPネットワークへ送信する送信部と、
前記放送信号ストリームの属性を記述するSDP(Session Description Protocol)オブジェクトを他のノードへ提供する制御部と、
を備え、
前記SDPオブジェクトは、映像エッセンスデータが圧縮されるかを示す圧縮関連情報、音声エッセンスデータに関連する音声チャンネル数情報、及びエッセンスデータへ適用される誤り訂正方式を示す誤り訂正情報、のうちの1つ以上を、前記放送信号ストリームのフォーマット固有のパラメータを記述する属性フィールド内に含む、
送信ノード。
a transmitter for transmitting a broadcast signal stream carrying different types of essence data on a single port number to an IP network of a broadcaster;
a control unit that provides an SDP (Session Description Protocol) object describing attributes of the broadcast signal stream to other nodes;
with
The SDP object is one of compression-related information indicating whether video essence data is compressed, audio channel number information associated with audio essence data, and error correction information indicating an error correction method applied to essence data. one or more within an attribute field describing format-specific parameters of said broadcast signal stream;
sending node.
前記圧縮関連情報は、
前記映像エッセンスデータが圧縮されるかを示す圧縮パラメータを含み、
前記映像エッセンスデータが圧縮されることを前記圧縮パラメータが示す場合に、前記映像エッセンスデータを圧縮する際に利用されるコーデックを示すコーデックパラメータをさらに含む、
請求項1に記載の送信ノード。
The compression-related information is
including a compression parameter indicating whether the video essence data is compressed;
further comprising a codec parameter indicating a codec to be used in compressing the video essence data when the compression parameter indicates that the video essence data is to be compressed;
A transmitting node according to claim 1.
前記誤り訂正情報は、
前記エッセンスデータへ適用される前記誤り訂正方式を示すタイプパラメータと、
前記タイプパラメータにより示される前記誤り訂正方式の設定値を示す設定パラメータと、
を含む、請求項1又は請求項2に記載の送信ノード。
The error correction information is
a type parameter indicating the error correction scheme applied to the essence data;
a setting parameter indicating a setting value of the error correction scheme indicated by the type parameter;
A transmitting node according to claim 1 or claim 2, comprising:
前記タイプパラメータがXOR符号化を示す場合に、前記設定パラメータは、誤り訂正ブロックサイズを示すサイズパラメータを含む、請求項3に記載の送信ノード。 4. The transmitting node of claim 3, wherein if the type parameter indicates XOR encoding, the configuration parameters include a size parameter indicating an error correction block size. 前記タイプパラメータがリードソロモン符号化を示す場合に、前記設定パラメータは、リードソロモン符号化の処理単位に相当するデータグラム数を示すデータグラム数パラメータを含む、請求項3又は請求項4に記載の送信ノード。 5. The setting parameter according to claim 3, wherein when the type parameter indicates Reed-Solomon encoding, the setting parameter includes a datagram number parameter indicating the number of datagrams corresponding to a processing unit of Reed-Solomon encoding. sending node. 前記制御部は、予め定義される管理用のアプリケーションプロトコルインタフェースを介して、前記SDPオブジェクトを前記他のノードへ提供する、請求項1~5のいずれか1項に記載の送信ノード。 The sending node according to any one of claims 1 to 5, wherein said control unit provides said SDP object to said other node via a predefined management application protocol interface. 前記放送信号ストリームは、ARIB STD-B73ストリームである、請求項1~6のいずれか1項に記載の送信ノード。 A transmitting node according to any preceding claim, wherein said broadcast signal stream is an ARIB STD-B73 stream. 請求項1~7のいずれか1項に記載の送信ノードと、
前記SDPオブジェクトの記述に従ってセットアップされる前記放送信号ストリームを受信する受信ノードと、
を含む放送局システム。
A transmitting node according to any one of claims 1 to 7;
a receiving node that receives the broadcast signal stream set up according to the SDP object description;
Broadcasting station system including.
放送局のIPネットワークにおける、異なるタイプのエッセンスデータを単一のポート番号で伝送する放送信号ストリームの送信ノードから受信ノードへの送信を制御する制御ノードであって、
前記放送信号ストリームの属性を記述するSDP(Session Description Protocol)オブジェクトを前記送信ノードから取得する制御部、を備え、
前記SDPオブジェクトは、映像エッセンスデータが圧縮されるかを示す圧縮関連情報、音声エッセンスデータに関連する音声チャンネル数情報、及びエッセンスデータへ適用される誤り訂正方式を示す誤り訂正情報、のうちの1つ以上を、前記放送信号ストリームのフォーマット固有のパラメータを記述する属性フィールド内に含む、
制御ノード。
A control node for controlling transmission from a transmitting node to a receiving node of a broadcast signal stream carrying different types of essence data on a single port number in a broadcast station IP network,
a control unit that acquires an SDP (Session Description Protocol) object describing attributes of the broadcast signal stream from the transmission node;
The SDP object is one of compression-related information indicating whether video essence data is compressed, audio channel number information associated with audio essence data, and error correction information indicating an error correction method applied to essence data. one or more within an attribute field describing format-specific parameters of said broadcast signal stream;
control node.
異なるタイプのエッセンスデータを単一のポート番号で伝送する放送信号ストリームの属性を記述するSDP(Session Description Protocol)オブジェクトを他のノードへ提供することと、
前記放送信号ストリームを、放送局のIPネットワークへ送信することと、
を含み、
前記SDPオブジェクトは、映像エッセンスデータが圧縮されるかを示す圧縮関連情報、音声エッセンスデータに関連する音声チャンネル数情報、及びエッセンスデータへ適用される誤り訂正方式を示す誤り訂正情報、のうちの1つ以上を、前記放送信号ストリームのフォーマット固有のパラメータを記述する属性フィールド内に含む、
送信制御方法。
providing other nodes with an SDP (Session Description Protocol) object that describes attributes of a broadcast signal stream that carries different types of essence data on a single port number;
transmitting the broadcast signal stream to a broadcast station's IP network;
including
The SDP object is one of compression-related information indicating whether video essence data is compressed, audio channel number information associated with audio essence data, and error correction information indicating an error correction method applied to essence data. one or more within an attribute field describing format-specific parameters of said broadcast signal stream;
Transmission control method.
JP2019062658A 2019-03-28 2019-03-28 Transmission node, broadcasting station system, control node and transmission control method Active JP7247707B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019062658A JP7247707B2 (en) 2019-03-28 2019-03-28 Transmission node, broadcasting station system, control node and transmission control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019062658A JP7247707B2 (en) 2019-03-28 2019-03-28 Transmission node, broadcasting station system, control node and transmission control method

Publications (2)

Publication Number Publication Date
JP2020162090A JP2020162090A (en) 2020-10-01
JP7247707B2 true JP7247707B2 (en) 2023-03-29

Family

ID=72640089

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019062658A Active JP7247707B2 (en) 2019-03-28 2019-03-28 Transmission node, broadcasting station system, control node and transmission control method

Country Status (1)

Country Link
JP (1) JP7247707B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116194285A (en) 2020-09-28 2023-05-30 三菱化学株式会社 Light guide plate for image display
CN113542688B (en) * 2021-07-14 2023-03-28 杭州海康威视数字技术股份有限公司 Audio and video monitoring method, device, equipment, storage medium and system
CN115242712B (en) * 2022-09-26 2023-01-24 中央广播电视总台 4K8KIP production and broadcast scheduling control method, device and system

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005318535A (en) 2004-03-19 2005-11-10 Marconi Intellectual Property (Ringfence) Inc Method an apparatus for holding conference by controlling bandwidth
JP2007531368A (en) 2004-03-22 2007-11-01 ノキア コーポレイション Transmission of parameters for broadcast / multicast sessions via communication protocols
WO2015045917A1 (en) 2013-09-27 2015-04-02 ソニー株式会社 Content supply device, content supply method, program, terminal device, and content supply system
JP2015073197A (en) 2013-10-02 2015-04-16 ソニー株式会社 Transmitter and transmitting method, receiver and receiving method and computer program
JP2015073245A (en) 2013-10-04 2015-04-16 ソニー株式会社 Receiver, receiving method, transmitter and transmitting method

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005318535A (en) 2004-03-19 2005-11-10 Marconi Intellectual Property (Ringfence) Inc Method an apparatus for holding conference by controlling bandwidth
JP2007531368A (en) 2004-03-22 2007-11-01 ノキア コーポレイション Transmission of parameters for broadcast / multicast sessions via communication protocols
WO2015045917A1 (en) 2013-09-27 2015-04-02 ソニー株式会社 Content supply device, content supply method, program, terminal device, and content supply system
JP2015073197A (en) 2013-10-02 2015-04-16 ソニー株式会社 Transmitter and transmitting method, receiver and receiving method and computer program
JP2015073245A (en) 2013-10-04 2015-04-16 ソニー株式会社 Receiver, receiving method, transmitter and transmitting method
US20160212479A1 (en) 2013-10-04 2016-07-21 Sony Corporation Receiving device, receiving method, transmitting device, and transmitting method

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Professional Media Over Managed IP Networks: System Timing and Definitions,SMPTE ST 2110-10:2017,2017年09月18日,p.1, 11-12, 15-16
制作用IPインターフェースにおけるエッセンス独立単一ストリームのRTPデータグラムのデータ構造,ARIB STD-B73,1.0版,日本,一般社団法人 電波産業会,2018年07月26日,p.5, 17, 20, 23-25, 32
映像・音声・データ個別ストリーム形式番組制作用IPインタフェースにおけるARIB STD-B73で規定されるデータ構造を持つRTPストリームの運用,ARIB STD-B74,第1.0版,日本,一般社団法人 電波産業会,2019年04月12日,p.1, 9-11, 13-14, 27-35

Also Published As

Publication number Publication date
JP2020162090A (en) 2020-10-01

Similar Documents

Publication Publication Date Title
US11316912B2 (en) System and method for synchronizing transmission of media content using timestamps
JP7247707B2 (en) Transmission node, broadcasting station system, control node and transmission control method
JP6302274B2 (en) Transmitting apparatus and receiving apparatus
KR101261123B1 (en) Improved method, system and apparatus for synchronizing signals
US8776144B2 (en) Mobile TV system and method for synchronizing the rendering of streaming services thereof
US11677999B2 (en) Data processing apparatus and data processing method
KR20210032988A (en) Use of broadcast physical layer for one-way time transmission in Coordinated Universal Time to receivers
JP2010171697A (en) Video delivering system, video delivering device, and synchronization correcting processing device
KR20180015119A (en) Transmitting apparatus, transmitting method, receiving apparatus, and receiving method
KR102675843B1 (en) Transmitting devices, receiving devices and data processing methods
JP7208530B2 (en) Synchronization control device, synchronization control method and synchronization control program
CN100473171C (en) Clock synchronizing method in broadcast network
JP7247706B2 (en) Transmission node, broadcasting station system, control node and transmission control method
JP7334442B2 (en) Broadcast signal processing system and broadcast signal processing method
CN103828383A (en) Method of saving content to a file on a server and corresponding device
JP7464259B2 (en) IP gateway device, management node device, IP broadcasting system, and registration method
JP7401097B2 (en) IP broadcast system, IP gateway device, management node device, client device and method
CN112564837B (en) Multi-path data flow synchronization method and multi-path data flow synchronization step-by-step transmission system
CN112671696B (en) Message transmission method, device, computer equipment and computer storage medium
JP2020170914A (en) Switching method, ip retransmission system, ip retransmission device, and control device
JP2017046236A (en) Content transmission system, transmitter, receiver, transmission method, reception method and program

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20201130

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220209

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230214

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230227

R151 Written notification of patent or utility model registration

Ref document number: 7247707

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151