JPWO2018216424A1 - Information processing apparatus, information recording medium, information processing method, and program - Google Patents

Information processing apparatus, information recording medium, information processing method, and program Download PDF

Info

Publication number
JPWO2018216424A1
JPWO2018216424A1 JP2019519529A JP2019519529A JPWO2018216424A1 JP WO2018216424 A1 JPWO2018216424 A1 JP WO2018216424A1 JP 2019519529 A JP2019519529 A JP 2019519529A JP 2019519529 A JP2019519529 A JP 2019519529A JP WO2018216424 A1 JPWO2018216424 A1 JP WO2018216424A1
Authority
JP
Japan
Prior art keywords
data
information
format
audio data
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019519529A
Other languages
Japanese (ja)
Other versions
JP7070564B2 (en
Inventor
幸一 内村
幸一 内村
徹 知念
徹 知念
光行 畠中
光行 畠中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JPWO2018216424A1 publication Critical patent/JPWO2018216424A1/en
Application granted granted Critical
Publication of JP7070564B2 publication Critical patent/JP7070564B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/12Formatting, e.g. arrangement of data block or words on the record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N5/926Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback by pulse code modulation

Abstract

メディア記録MMTフォーマット音声データが、MPEG4 AAC LC音声データか、MPEG4 ALS音声データかを迅速に確認可能とした構成を実現する。メディアに記録するMMTフォーマット音声データが、MPEG4 AAC LC音声データであるか、MPEG4 ALS音声データであるかを示す音声識別情報を記録したクリップ情報ファイルを生成してメディアに記録する。再生装置は、クリップ情報ファイルに記録された音声識別情報に基づいて、再生対象とする音声データが、MPEG4 AAC LC音声データであるか、MPEG4 ALS音声データであるかを識別し、迅速な復号、再生を行うことができる。It is possible to realize a configuration in which it is possible to quickly confirm whether the media recording MMT format audio data is MPEG4 AAC LC audio data or MPEG4 ALS audio data. A clip information file that records audio identification information indicating whether the MMT format audio data to be recorded on the medium is MPEG4 AAC LC audio data or MPEG4 ALS audio data is generated and recorded on the medium. The playback device identifies, based on the audio identification information recorded in the clip information file, whether the audio data to be reproduced is MPEG4 AAC LC audio data or MPEG4 ALS audio data, and quickly decodes the audio data. Playback can be performed.

Description

本開示は、情報処理装置、情報記録媒体、および情報処理方法、並びにプログラムに関する。さらに詳細には、放送波等における今後のデータ伝送規格として規格化が進められているMMT(MPEG Media Transport)フォーマットデータを入力して、メディアに記録し、再生可能とする情報処理装置、情報記録媒体、および情報処理方法、並びにプログラムに関する。   The present disclosure relates to an information processing device, an information recording medium, an information processing method, and a program. More specifically, an information processing apparatus capable of inputting MMT (MPEG Media Transport) format data, which is being standardized as a future data transmission standard for broadcast waves and the like, recording the same on a medium, and reproducing the information, an information recording apparatus The present invention relates to a medium, an information processing method, and a program.

現在、4K画像や8K画像等の放送等、高画質画像のデータ伝送を実現するための規格化が進められており、その一つとして、MMT(MPEG Media Transport)フォーマットを利用したデータ配信方式についての検討が進められている。   Currently, standardization for realizing data transmission of high-quality images, such as broadcasting of 4K images and 8K images, is being promoted. One of them is a data distribution method using an MMT (MPEG Media Transport) format. Examination is underway.

MMTフォーマットは、画像(Video)、音声(Audio)、字幕(Subtitle)等、コンテンツを構成する符号化データや、制御情報や属性情報等の様々な管理情報からなる制御情報(SI:Signaling Information(シグナリング情報))等のデータを、放送波やネットワークを介して伝送するデータ転送方式(トランスポートフォーマット)を規定したものである。   The MMT format includes control information (SI: Signaling Information (SI) including various management information such as control information and attribute information, such as coded data constituting content, such as an image (Video), audio (Audio), and subtitle (Subtitle). Signaling information)) defines a data transfer method (transport format) for transmitting data such as broadcast waves and networks.

MMTフォーマットは、例えば4K画像、高ダイナミックレンジ(HDR:High Dynamic Range)画像等の次世代コンテンツの放送等に利用される予定となっている。   The MMT format is scheduled to be used for broadcasting next-generation content such as 4K images and high dynamic range (HDR) images.

なお、現行の画像(Video)、音声(Audio)、字幕(Subtitle)等の伝送フォーマット、あるいは、メディアに対するデータ記録フォーマットとしては、MPEG−2TSフォーマットが多く利用されている。
また、このMPEG−2TSフォーマット対応の記録再生アプリケーション規格(フォーマット)としてBDMVやBDAV規格(フォーマット)が広く利用されている。
The MPEG-2TS format is often used as a current transmission format for images (Video), audio (Audio), subtitles, and the like, or as a data recording format for media.
Further, BDMV and BDAV standards (formats) are widely used as recording / reproduction application standards (formats) corresponding to the MPEG-2TS format.

なお、BDMVやBDAVは、主にBD(Blu−ray(登録商標) Disc)を利用したデータ記録再生のアプリケーション規格であるが、これらの規格はBDに限らず、フラッシュメモリやHDなど、その他のBD以外のメディアを利用したデータ記録再生にも適用可能である。
BDを利用したデータ記録再生処理構成については、例えば特許文献1(特開2011−023071号公報)等に記載がある。
It should be noted that BDMV and BDAV are application standards for data recording and reproduction mainly using BD (Blu-ray (registered trademark) Disc), but these standards are not limited to BD, and other standards such as flash memory and HD The present invention is also applicable to data recording and reproduction using media other than BD.
A data recording / reproducing processing configuration using a BD is described in, for example, Japanese Patent Application Laid-Open No. 2011-023071.

BDMVは、例えば映画コンテンツなどを予め記録したBD−ROM向けに開発されたアプリケーション規格であり、主に、パッケージコンテンツ等の書き換え不能なBD−ROMで広く使われている。
一方、BDAVは、主に書き換え可能なBD−RE型ディスクや、一回のみ記録可能なBD−R型ディスク等を利用したデータ記録再生処理に適用することを目的として開発された規格である。BDAVは、例えばユーザがビデオカメラなどで撮影した映像の記録再生やテレビ放送を記録し再生するために利用される。
BDMV is an application standard developed for, for example, a BD-ROM in which movie contents and the like are recorded in advance, and is widely used mainly in non-rewritable BD-ROMs such as package contents.
On the other hand, BDAV is a standard developed for the purpose of being mainly applied to data recording / reproducing processing using a rewritable BD-RE type disc, a once-recordable BD-R type disc, and the like. The BDAV is used, for example, for recording and reproducing a video taken by a user with a video camera or the like and for recording and reproducing a television broadcast.

上述のMMTフォーマットに従った配信コンテンツを、情報記録媒体(メディア)に記録し、メディアからのコンテンツ再生処理をBDAVフォーマット対応の再生アプリケーションを利用して行なうためには、このBDAVフォーマットに従ってデータ記録を行うことが必要である。   In order to record the distribution content according to the above-mentioned MMT format on an information recording medium (media) and to perform a process of reproducing the content from the medium using a BDAV format-compatible reproduction application, data is recorded according to the BDAV format. It is necessary to do.

現在、BDAVフォーマットを拡張し、MMTフォーマットデータを記録、再生可能とするための構成について議論が進められている。
例えば、放送局等が送信するMMTフォーマットに従った配信データをテレビ等の情報処理装置が受信し、受信データをBDやフラッシュメモリ、あるいはHDD(ハードディスク)等の記録メディアに記録する場合、画像、音声、字幕データや、制御情報(SI)等のデータを、MMTフォーマットに従ったデータを格納したパケットのパケット列としてメディアに記録する方向で議論が進んでいる。
Currently, discussions are underway on a configuration for extending the BDAV format and enabling recording and reproduction of MMT format data.
For example, when an information processing device such as a television receives distribution data according to the MMT format transmitted by a broadcast station or the like and records the received data on a recording medium such as a BD, a flash memory, or an HDD (hard disk), an image, Discussions are underway in the direction of recording data such as audio, caption data, and control information (SI) on a medium as a packet sequence of packets storing data in accordance with the MMT format.

具体的には、MMTP(MMT Protocol)パケット、あるいはMMTPパケットの上位パケットであるTLV(Type Length Value)パケットのパケット列をメディアに記録する方向で議論が進んでいる。   Specifically, discussions are proceeding in the direction of recording a packet sequence of an MMTP (MMT Protocol) packet or a TLV (Type Length Value) packet, which is an upper packet of the MMTP packet, on a medium.

MMTPパケットやTLVパケットには、再生データである画像、音声、字幕、さらに、様々な管理情報からなる制御情報(SI:Signaling Information)等が格納されている。   The MMTP packet and the TLV packet store reproduction data such as images, audio, subtitles, and control information (SI: Signaling Information) including various management information.

例えばBD(Blu−ray(登録商標) Disc)やフラッシュメモリやHDD(ハードディスク)等の記録メディアに、画像、音声、字幕等のコンテンツを格納したMMTPパケットやTLVパケットを記録し、メディアからのコンテンツ再生を上述のBDAVフォーマット対応の再生アプリケーションを利用して行なうためには、このBDAVフォーマットに従ってデータ記録を行うことが必要である。   For example, MMTP packets or TLV packets storing contents such as images, sounds, and subtitles are recorded on a recording medium such as a BD (Blu-ray (registered trademark) Disc), a flash memory or an HDD (hard disk), and the contents from the medium are recorded. In order to perform reproduction using the above-described BDAV format-compatible reproduction application, it is necessary to perform data recording in accordance with the BDAV format.

BDAVフォーマットは、再生制御情報ファイルとして、プレイリストファイルやクリップ情報ファイル等のデータベースファイルを規定しており、BDAV対応再生アプリケーションはこれらの再生制御情報ファイル(データベースファイル)を参照してデータ再生処理を実行する。
従って、MMTフォーマットデータについても、これらのプレイリストファイルやクリップ情報ファイルに記録された再生制御情報を利用して再生処理を行うことが必要となる。
The BDAV format defines a database file such as a playlist file or a clip information file as a playback control information file, and a BDAV-compatible playback application performs data playback processing with reference to these playback control information files (database files). Execute.
Therefore, it is necessary to perform reproduction processing on the MMT format data using the reproduction control information recorded in the playlist file and the clip information file.

しかし、MMTフォーマットに従って配信されるデータには、このBDAVフォーマットで規定するプレイリストファイルやクリップ情報ファイルが含まれていない。
従って、このMMTフォーマットデータをメディアに記録して、BDAVフォーマット対応アプリを利用してコンテンツ再生を行うためには、BDAVフォーマットの規定するプレイリストファイルやクリップ情報ファイルを生成してメディアに記録する処理が必要となる。
しかし、この処理については、現時点で具体化されていないというのが現状である。
However, data distributed according to the MMT format does not include a playlist file or a clip information file defined by the BDAV format.
Therefore, in order to record the MMT format data on the medium and play back the content using the BDAV format compatible application, a process of generating a playlist file or a clip information file defined by the BDAV format and recording the generated file on the medium. Is required.
However, at present, this processing is not specified at present.

特開2011−023071号公報JP 2011-023071 A

本開示は、例えば、上記の問題点に鑑みてなされたものであり、MMTフォーマットに従った配信データを入力して、BDAVフォーマットに規定されたデータベースファイルを生成してメディアに記録して、これらのデータベースファイルを利用してメディア記録コンテンツを再生可能とする情報処理装置、情報記録媒体、および情報処理方法、並びにプログラムを提供することを目的とする。   The present disclosure has been made, for example, in view of the above-described problems. The present disclosure is configured to input distribution data in accordance with the MMT format, generate a database file defined in the BDAV format, record the database file in a medium, and It is an object of the present invention to provide an information processing apparatus, an information recording medium, an information processing method, and a program which enable media recorded content to be reproduced using the database file of the present invention.

本開示の第1の側面は、
MMTフォーマットデータを入力し、情報記録媒体に対するデータ記録フォーマットであるBDAVフォーマット、またはSPAVフォーマットに従った記録データを生成するデータ処理部を有し、
前記データ処理部は、
情報記録媒体に記録する音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報をBDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルに記録する処理を実行する情報処理装置にある。
A first aspect of the present disclosure is:
A data processing unit for inputting MMT format data and generating recording data according to a BDAV format or a SPAV format which is a data recording format for an information recording medium,
The data processing unit includes:
The audio data to be recorded on the information recording medium is
(A) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(B) MPEG4 ALS (LATM / LOAS) encoded audio data,
An information processing apparatus for executing a process of recording audio identification information that makes it possible to identify which of the above (a) and (b) the audio data is in a database file stipulated in the BDAV format or the SPAV format.

さらに、本開示の第2の側面は、
情報記録媒体の記録データの再生処理を実行するデータ処理部を有し、
前記情報記録媒体は、MMTフォーマットデータを、BDAVフォーマット、またはSPAVフォーマットに従って記録したデータを格納した情報記録媒体であり、
前記データ処理部は、
BDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルであるプレイリストファイルとクリップ情報ファイルの記録情報を利用して、前記情報記録媒体に記録されたMMTフォーマットデータの再生処理を実行する構成であり、
前記データ処理部は、
再生対象の音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれのデータであるかを示す音声識別情報を、前記データベースファイルから取得し、取得情報に従って音声データの復号処理を実行する情報処理装置にある。
Further, a second aspect of the present disclosure includes:
A data processing unit that executes a reproduction process of the recording data of the information recording medium,
The information recording medium is an information recording medium storing data recorded in accordance with BDMT format or SPAV format in MMT format data,
The data processing unit includes:
A configuration for executing reproduction processing of MMT format data recorded on the information recording medium by using recording information of a playlist file and a clip information file, which are database files defined in the BDAV format or the SPAV format,
The data processing unit includes:
The audio data to be played is
(A) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(B) MPEG4 ALS (LATM / LOAS) encoded audio data,
The information processing apparatus acquires voice identification information indicating which of the above (a) and (b) the data is from the database file and executes a decoding process of the voice data according to the obtained information.

さらに、本開示の第3の側面は、
BDAVフォーマット、またはSPAVフォーマットに従った記録データを記録した情報記録媒体であり、
情報記録媒体に記録された音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報をBDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルに記録した構成を有し、
再生装置が、前記データベースファイルに記録された音声識別情報に従って、再生対象とした音声データの種類を識別可能とした情報記録媒体にある。
Further, a third aspect of the present disclosure includes:
An information recording medium on which recording data in accordance with a BDAV format or a SPAV format is recorded;
The audio data recorded on the information recording medium is
(A) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(B) MPEG4 ALS (LATM / LOAS) encoded audio data,
(A) or (b) a configuration in which audio identification information enabling identification of the audio data is recorded in a database file of BDAV format or SPAV format.
According to another aspect of the present invention, there is provided an information recording medium in which a reproducing apparatus is capable of identifying a type of audio data to be reproduced according to audio identification information recorded in the database file.

さらに、本開示の第4の側面は、
BDAVフォーマット、またはSPAVフォーマットに従った記録データが記録される情報記録媒体であり、
情報記録媒体に記録される音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報を含むBDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルを有し、
再生装置が、前記データベースファイルの音声識別情報に従って、再生対象とした音声データの種類を識別可能とした情報記録媒体にある。
Further, a fourth aspect of the present disclosure includes:
An information recording medium on which recording data according to a BDAV format or a SPAV format is recorded;
The audio data recorded on the information recording medium is
(A) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(B) MPEG4 ALS (LATM / LOAS) encoded audio data,
A database file of a BDAV format or a SPAV format definition including audio identification information that makes it possible to identify which of the above (a) and (b) audio data,
A playback device is provided on an information recording medium that is capable of identifying the type of audio data to be played according to the audio identification information of the database file.

さらに、本開示の第5の側面は、
情報処理装置において実行する情報処理方法であり、
前記情報処理装置は、
MMTフォーマットデータを入力し、情報記録媒体に対するデータ記録フォーマットであるBDAVフォーマット、またはSPAVフォーマットに従った記録データを生成するデータ処理部を有し、
前記データ処理部が、
情報記録媒体に記録する音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報をBDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルに記録する処理を実行する情報処理方法にある。
Further, a fifth aspect of the present disclosure includes:
An information processing method executed in the information processing apparatus,
The information processing device,
A data processing unit for inputting MMT format data and generating recording data according to a BDAV format or a SPAV format which is a data recording format for an information recording medium,
The data processing unit includes:
The audio data to be recorded on the information recording medium is
(A) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(B) MPEG4 ALS (LATM / LOAS) encoded audio data,
The present invention is directed to an information processing method for executing a process of recording the audio identification information that makes it possible to identify which of the above (a) and (b) the audio data is in a database file stipulated in the BDAV format or the SPAV format.

さらに、本開示の第6の側面は、
情報処理装置において実行する情報処理方法であり、
前記情報処理装置は、
情報記録媒体の記録データの再生処理を実行するデータ処理部を有し、
前記情報記録媒体は、MMTフォーマットデータを、BDAVフォーマット、またはSPAVフォーマットに従って記録したデータを格納した情報記録媒体であり、
前記データ処理部が、
BDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルであるプレイリストファイルとクリップ情報ファイルの記録情報を利用して、前記情報記録媒体に記録されたMMTフォーマットデータの再生処理を実行し、
前記再生処理に際して、再生対象の音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれのデータであるかを示す音声識別情報を、前記データベースファイルから取得し、取得情報に従って音声データの復号処理を実行する情報処理方法にある。
Further, a sixth aspect of the present disclosure includes:
An information processing method executed in the information processing apparatus,
The information processing device,
A data processing unit that executes a reproduction process of the recording data of the information recording medium,
The information recording medium is an information recording medium storing data recorded in accordance with BDMT format or SPAV format in MMT format data,
The data processing unit includes:
Using the recording information of the playlist file and the clip information file, which are the database files of the BDAV format or the SPAV format, execute the reproduction process of the MMT format data recorded on the information recording medium,
At the time of the reproduction process, audio data to be reproduced is
(A) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(B) MPEG4 ALS (LATM / LOAS) encoded audio data,
An information processing method for acquiring audio identification information indicating which of the above (a) and (b) the data is from the database file and executing a decoding process of the audio data according to the acquired information.

さらに、本開示の第7の側面は、
情報処理装置において実行する情報処理を実行させるプログラムであり、
前記情報処理装置は、
MMTフォーマットデータを入力し、情報記録媒体に対するデータ記録フォーマットであるBDAVフォーマット、またはSPAVフォーマットに従った記録データを生成するデータ処理部を有し、
前記プログラムは、前記データ処理部に、
情報記録媒体に記録する音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報をBDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルに記録する処理を実行させるプログラムにある。
Further, a seventh aspect of the present disclosure includes:
A program for executing information processing executed in the information processing apparatus,
The information processing device,
A data processing unit for inputting MMT format data and generating recording data according to a BDAV format or a SPAV format which is a data recording format for an information recording medium,
The program, the data processing unit,
The audio data to be recorded on the information recording medium is
(A) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(B) MPEG4 ALS (LATM / LOAS) encoded audio data,
The program is for executing a process of recording the audio identification information which makes it possible to identify which of the above (a) and (b) the audio data is in a database file of BDAV format or SPAV format.

さらに、本開示の第8の側面は、
情報処理装置において実行する情報処理を実行させるプログラムであり、
前記情報処理装置は、
情報記録媒体の記録データの再生処理を実行するデータ処理部を有し、
前記情報記録媒体は、MMTフォーマットデータを、BDAVフォーマット、またはSPAVフォーマットに従って記録したデータを格納した情報記録媒体であり、
前記プログラムは、前記データ処理部に、
BDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルであるプレイリストファイルとクリップ情報ファイルの記録情報を利用して、前記情報記録媒体に記録されたMMTフォーマットデータの再生処理を実行させ、
前記再生処理に際して、再生対象の音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれのデータであるかを示す音声識別情報を、前記データベースファイルから取得させ、取得情報に従って音声データの復号処理を行わせるプログラムにある。
Further, an eighth aspect of the present disclosure includes:
A program for executing information processing executed in the information processing apparatus,
The information processing device,
A data processing unit that executes a reproduction process of the recording data of the information recording medium,
The information recording medium is an information recording medium storing data recorded in accordance with BDMT format or SPAV format in MMT format data,
The program, the data processing unit,
Using the recording information of the playlist file and the clip information file, which are the database files of the BDAV format or the SPAV format, the reproducing process of the MMT format data recorded on the information recording medium is executed,
At the time of the reproduction process, audio data to be reproduced is
(A) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(B) MPEG4 ALS (LATM / LOAS) encoded audio data,
The program is to acquire from the database file audio identification information indicating which of the above (a) and (b) data, and to perform audio data decoding processing according to the acquired information.

なお、本開示のプログラムは、例えば、様々なプログラム・コードを実行可能な情報処理装置やコンピュータ・システムに対して、コンピュータ可読な形式で提供する記憶媒体、通信媒体によって提供可能なプログラムである。このようなプログラムをコンピュータ可読な形式で提供することにより、情報処理装置やコンピュータ・システム上でプログラムに応じた処理が実現される。   The program of the present disclosure is, for example, a program that can be provided to an information processing device or a computer system that can execute various program codes by a storage medium or a communication medium provided in a computer-readable format. By providing such a program in a computer-readable format, processing according to the program is realized on an information processing device or a computer system.

本開示のさらに他の目的、特徴や利点は、後述する本開示の実施例や添付する図面に基づくより詳細な説明によって明らかになるであろう。なお、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。   Further objects, features, and advantages of the present disclosure will become apparent from the following detailed description based on the embodiments of the present disclosure and the accompanying drawings. In this specification, a system is a logical set configuration of a plurality of devices, and is not limited to a configuration in which devices of each configuration are in the same housing.

本開示の一実施例の構成によれば、メディア記録MMTフォーマット音声データが、MPEG4 AAC LC音声データか、MPEG4 ALS音声データかを迅速に確認可能とした構成が実現される。
具体的には、例えば、メディアに記録するMMTフォーマット音声データが、MPEG4 AAC LC音声データであるか、MPEG4 ALS音声データであるかを示す音声識別情報を記録したクリップ情報ファイルを生成してメディアに記録する。再生装置は、クリップ情報ファイルに記録された音声識別情報に基づいて、再生対象とする音声データが、MPEG4 AAC LC音声データであるか、MPEG4 ALS音声データであるかを識別し、迅速な復号、再生を行うことができる。
本構成により、メディア記録MMTフォーマット音声データが、MPEG4 AAC LC音声データか、MPEG4 ALS音声データかを迅速に確認可能とした構成が実現される。
なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、また付加的な効果があってもよい。
According to the configuration of the embodiment of the present disclosure, a configuration is realized in which it is possible to quickly confirm whether the media recording MMT format audio data is MPEG4 AAC LC audio data or MPEG4 ALS audio data.
More specifically, for example, a clip information file that records audio identification information indicating whether the MMT format audio data to be recorded on the medium is MPEG4 AAC LC audio data or MPEG4 ALS audio data is generated, and the clip information file is generated on the medium. Record. The playback device identifies whether the audio data to be played back is MPEG4 AAC LC audio data or MPEG4 ALS audio data based on the audio identification information recorded in the clip information file, and quickly decodes the audio data. Playback can be performed.
With this configuration, a configuration is realized in which it is possible to quickly confirm whether the media-recorded MMT format audio data is MPEG4 AAC LC audio data or MPEG4 ALS audio data.
It should be noted that the effects described in the present specification are merely examples and are not limited, and may have additional effects.

本開示の処理を実行する情報処理装置の利用構成例について説明する図である。FIG. 11 is a diagram for describing a usage configuration example of an information processing device that executes a process of the present disclosure. MMTフォーマットについて説明する図である。FIG. 3 is a diagram illustrating an MMT format. MMTフォーマットに従った画像データ格納構成例について説明する図である。FIG. 3 is a diagram for describing an example of an image data storage configuration according to an MMT format. BDAVフォーマットについて説明する図である。It is a figure explaining a BDAV format. BDAVフォーマットに従ったデータ再生処理例について説明する図である。FIG. 9 is a diagram for describing an example of a data reproduction process according to the BDAV format. MPEG−2TSフォーマットについて説明する図である。FIG. 3 is a diagram illustrating an MPEG-2TS format. MMTフォーマットについて説明する図である。FIG. 3 is a diagram illustrating an MMT format. SPAVフォーマットについて説明する図である。It is a figure explaining a SPAV format. 放送局等からの受信データをMMTフォーマットデータであるMMTPパケット列として、情報記録媒体(メディア)に記録する処理例について説明する図である。FIG. 9 is a diagram illustrating a processing example of recording data received from a broadcast station or the like as an MMTP packet sequence that is MMT format data on an information recording medium (media). 放送局等からの受信データをMMTフォーマットデータであるMMTPパケットを格納したTLVパケット列として、情報記録媒体(メディア)に記録する処理例について説明する図である。FIG. 11 is a diagram illustrating a process example of recording data received from a broadcast station or the like as an TLV packet sequence storing MMTP packets that are MMT format data on an information recording medium (media). MMTフォーマットデータを、BDAVフォーマットデータとして記録する場合の処理例について説明する図である。FIG. 7 is a diagram for describing a processing example when MMT format data is recorded as BDAV format data. クリップ情報ファイルのデータ構成(シンタクス)を示す図である。It is a figure showing the data composition (syntax) of a clip information file. クリップ情報ファイルのプログラム情報[ProgramInfo()]のデータ構成(シンタクス)を示す図である。It is a figure which shows the data structure (syntax) of the program information [ProgramInfo ()] of a clip information file. クリップ情報ファイルのコーディング情報のデータ構成例について説明する図である。FIG. 4 is a diagram illustrating an example of a data configuration of coding information of a clip information file. クリップ情報ファイルの音声情報のデータ記録例について説明する図である。FIG. 8 is a diagram for describing an example of data recording of audio information of a clip information file. MMTフォーマットの音声データの識別情報を記録したクリップ情報ファイルのコーディング情報のデータ構成例について説明する図である。FIG. 4 is a diagram illustrating a data configuration example of coding information of a clip information file in which identification information of audio data in the MMT format is recorded. クリップ情報ファイルに記録するMMTフォーマットの音声識別情報の例について説明する図である。FIG. 5 is a diagram for describing an example of MMT format audio identification information recorded in a clip information file. 音声データ格納パケットの構成例について説明する図である。FIG. 4 is a diagram illustrating a configuration example of a voice data storage packet. MMTフォーマットの音声データの識別情報を記録したクリップ情報ファイルのコーディング情報のデータ構成例について説明する図である。FIG. 4 is a diagram illustrating a data configuration example of coding information of a clip information file in which identification information of audio data in the MMT format is recorded. クリップ情報ファイルに記録するMMTフォーマットの音声識別情報の例について説明する図である。FIG. 5 is a diagram for describing an example of MMT format audio identification information recorded in a clip information file. MMTパッケージテーブル(MPT)のデータ構成(シンタクス)を示す図である。FIG. 3 is a diagram illustrating a data configuration (syntax) of an MMT package table (MPT). MMTパッケージテーブル(MPT)に記録されるアセットタイプ(asset_type)の具体例について説明する図である。FIG. 11 is a diagram for describing a specific example of an asset type (asset_type) recorded in an MMT package table (MPT). MMTパッケージテーブル(MPT)に記録される音声属性情報を示す図である。FIG. 3 is a diagram illustrating audio attribute information recorded in an MMT package table (MPT). MMTパッケージテーブル(MPT)に記録される(M1)ストリームコンテンツ情報の具体例を示す図である。It is a figure showing the example of (M1) stream contents information recorded on an MMT package table (MPT). MMTパッケージテーブル(MPT)に記録される(M2)コンポーネントタイプの具体例を示す図である。It is a figure which shows the specific example of (M2) component type recorded on MMT package table (MPT). MMTパッケージテーブル(MPT)に記録される(M3)サンプリング周波数の具体例を示す図である。It is a figure showing the example of (M3) sampling frequency recorded on a MMT package table (MPT). 情報記録媒体(メディア)に対するデータ記録処理を実行する情報処理装置の構成例について説明する図である。FIG. 3 is a diagram illustrating a configuration example of an information processing device that executes a data recording process on an information recording medium (media). 情報記録媒体(メディア)に対するデータ記録処理の処理シーケンスを説明するフローチャートを示す図である。FIG. 4 is a flowchart illustrating a processing sequence of a data recording process on an information recording medium (media). 情報記録媒体(メディア)に対するデータ記録処理の処理シーケンスを説明するフローチャートを示す図である。FIG. 4 is a flowchart illustrating a processing sequence of a data recording process on an information recording medium (media). 情報記録媒体(メディア)に対するデータ記録処理の処理シーケンスを説明するフローチャートを示す図である。FIG. 4 is a flowchart illustrating a processing sequence of a data recording process on an information recording medium (media). 情報記録媒体(メディア)からのデータ再生処理を実行する情報処理装置の構成例について説明する図である。FIG. 3 is a diagram illustrating a configuration example of an information processing device that executes a process of reproducing data from an information recording medium (media). 情報記録媒体(メディア)からのデータ再生処理の処理シーケンスを説明するフローチャートを示す図である。It is a figure showing the flow chart explaining the processing sequence of the data reproduction processing from the information recording medium (media). 情報記録媒体(メディア)からのデータ再生処理の処理シーケンスを説明するフローチャートを示す図である。It is a figure showing the flow chart explaining the processing sequence of the data reproduction processing from the information recording medium (media). 本開示の処理に適用される情報処理装置のハードウェア構成例について説明する図である。FIG. 3 is a diagram for describing a hardware configuration example of an information processing device applied to the processing of the present disclosure.

以下、図面を参照しながら本開示の情報処理装置、情報記録媒体、および情報処理方法、並びにプログラムの詳細について説明する。なお、説明は以下の項目に従って行なう。
1.通信システムの構成例について
2.MMT(MPEG Media Transport)フォーマットについて
3.BDAVフォーマットとSPAVフォーマットについて
4.MMTフォーマットデータをBDAVフォーマットに従って記録する場合の処理について
5.MMTフォーマットに従った音声データについて
6.クリップ情報ファイルに対する音声識別情報の記録例について
6−1.(実施例1)音声データ格納パケットに記録された音声識別情報を取得してクリップ情報ファイルに記録する実施例
6−2.(実施例2)MMTパッケージテーブル(MPT)に記録された音声識別情報を取得してクリップ情報ファイルに記録する実施例
7.情報記録媒体に対するデータ記録処理を実行する情報処理装置の構成と処理について
8.情報記録媒体からのデータ再生処理を実行する情報処理装置の構成と処理について
9.情報処理装置の構成例について
10.本開示の構成のまとめ
Hereinafter, details of an information processing device, an information recording medium, an information processing method, and a program of the present disclosure will be described with reference to the drawings. The description will be made according to the following items.
1. 1. Configuration example of communication system 2. About MMT (MPEG Media Transport) format 3. About BDAV format and SPAV format 4. Processing when MMT format data is recorded in accordance with BDAV format 5. About audio data according to MMT format Recording example of audio identification information in clip information file 6-1. (Embodiment 1) Embodiment in which audio identification information recorded in an audio data storage packet is acquired and recorded in a clip information file 6-2. (Embodiment 2) Embodiment in which audio identification information recorded in an MMT package table (MPT) is acquired and recorded in a clip information file. 7. Configuration and processing of information processing device that executes data recording processing on information recording medium 8. Configuration and processing of information processing device that executes data reproduction processing from information recording medium 9. Configuration example of information processing apparatus Summary of configuration of the present disclosure

[1.通信システムの構成例について]
まず、図1を参照して本開示の処理を実行する情報処理装置の一つの利用構成例である通信システムの例について説明する。
図1に示す情報処理装置30は、BD(Blu−ray(登録商標) Disc)や、フラッシュメモリ、ハードディスク(HDD)などのメディアを装着し、これらの装着メディアに対するデータ記録処理や、装着メディアからのデータ再生処理、さらに、他メディアに対するデータコピー処理等を実行する。
[1. Configuration Example of Communication System]
First, an example of a communication system, which is an example of a usage configuration of an information processing device that executes the processing of the present disclosure, will be described with reference to FIG.
The information processing apparatus 30 illustrated in FIG. 1 mounts a medium such as a BD (Blu-ray (registered trademark) Disc), a flash memory, and a hard disk (HDD), performs a data recording process on the mounted medium, and performs processing from the mounted medium. And data copy processing for other media.

情報処理装置30がメディアに記録するデータは、例えば放送局(放送サーバ)21や、データ配信サーバ22等の送信装置20の提供する送信コンテンツである。具体的には、テレビ局の提供する放送番組等である。
これらの送信コンテンツは、放送波、あるいはインターネット等のネットワークを介して送信装置20から情報処理装置30に送信される。
The data recorded on the medium by the information processing device 30 is, for example, transmission content provided by the transmission device 20 such as a broadcast station (broadcast server) 21 or a data distribution server 22. Specifically, it is a broadcast program or the like provided by a television station.
These transmission contents are transmitted from the transmission device 20 to the information processing device 30 via a broadcast wave or a network such as the Internet.

情報処理装置30は、例えば記録再生装置31、テレビ32、PC33、携帯端末34等である、これらの情報処理装置は、例えば、BD(Blu−ray(登録商標) Disc)41、HDD(ハードディスク)42、フラッシュメモリ43等の様々なメディアを装着し、これらのメディアに対するデータ記録処理や、メディア記録データの編集処理、メディアからのデータ再生処理、さらに、メディア間のデータコピー処理等を実行する。   The information processing device 30 is, for example, a recording / reproducing device 31, a television 32, a PC 33, a portable terminal 34, and the like. These information processing devices are, for example, a BD (Blu-ray (registered trademark) Disc) 41, an HDD (hard disk). Various media such as the flash memory 42 and the flash memory 43 are mounted, and a data recording process for these media, a process of editing media recorded data, a process of reproducing data from media, and a process of copying data between media are performed.

送信装置20から情報処理装置30に対するデータ送信は、MMT(MPEG Media Transport)フォーマットに従って実行される。
MMTフォーマットは、画像(Video)、音声(Audio)、字幕(Subtitle)等、コンテンツ構成データである符号化データを放送波やネットワークを介して伝送する際のデータ転送方式(トランンスポートフォーマット)を規定したものである。
Data transmission from the transmission device 20 to the information processing device 30 is performed according to an MMT (MPEG Media Transport) format.
The MMT format is a data transfer method (transport format) for transmitting encoded data, which is content configuration data, such as an image (Video), audio (Audio), and subtitles (Subtitle), via a broadcast wave or a network. It is specified.

送信装置20は、コンテンツデータを符号化し、符号化データおよび符号化データのメタデータを含むデータファイルを生成し、生成した符号化データをMMTにおいて規定されるMMTP(MMT Protocol)パケットに格納して放送波、またはネットワークを介して送信する。   The transmission device 20 encodes the content data, generates a data file including the encoded data and the metadata of the encoded data, and stores the generated encoded data in an MMTP (MMT Protocol) packet specified in the MMT. Transmit via broadcast waves or network.

送信装置20が情報処理装置30に提供するデータは、画像、音声、字幕等の再生対象データの他、番組ガイド等の案内情報や通知情報、制御メッセージ等の様々な管理情報によって構成される制御情報(SI:Signaling Information(シグナリング情報))によって構成される。   The data provided by the transmitting device 20 to the information processing device 30 includes, in addition to reproduction target data such as images, sounds, subtitles, and the like, control information configured by various management information such as guide information such as a program guide, notification information, and control messages. Information (SI: Signaling Information (signaling information)).

[2.MMT(MPEG Media Transport)フォーマットについて]
上述したように、送信装置20から情報処理装置30に対するデータ送信は、MMT(MPEG Media Transport)フォーマットに従って実行される。
図2以下を参照して、MMT(MPEG Media Transport)フォーマットについて説明する。
[2. MMT (MPEG Media Transport) Format]
As described above, data transmission from the transmission device 20 to the information processing device 30 is performed in accordance with the MMT (MPEG Media Transport) format.
The MMT (MPEG Media Transport) format will be described with reference to FIG.

図2は、MMTフォーマットのスタック・モデルを示す図である。
図2に示すMMTスタック・モデルにおいて、最下層には、物理レイヤ(PHY)がある。物理レイヤは、放送系の処理を行なうブロードキャスト(Broadcasting)レイヤと、ネットワーク系の処理を行なうブロードバンド(Broadband)レイヤに分割されている。
MMTは放送系、ネットワーク系の2つの通信網を利用した処理を可能としている。
FIG. 2 is a diagram showing a stack model in the MMT format.
In the MMT stack model shown in FIG. 2, a physical layer (PHY) is at the lowest layer. The physical layer is divided into a broadcast (Broadcasting) layer for performing a broadcast-based process and a broadband (Broadband) layer for performing a network-based process.
MMT enables processing using two communication networks, a broadcasting system and a network system.

物理レイヤ(PHY)の上位レイヤとして、TLV(Type Length Value)レイヤがある。TLVはIPパケットの多重化方式を規定したフォーマット規定レイヤである。複数のIPパケットが多重化されてTLVパケットとして送信される。TLV−SIは、TLVフォーマットに従った制御メッセージ等の制御情報(SI)の伝送レイヤである。   As a higher layer of the physical layer (PHY), there is a TLV (Type Length Value) layer. TLV is a format definition layer that defines a multiplexing method for IP packets. A plurality of IP packets are multiplexed and transmitted as TLV packets. The TLV-SI is a transmission layer of control information (SI) such as a control message according to the TLV format.

制御情報(SI)は、情報処理装置30側においてコンテンツ(番組)を受信、再生するために必要となる設定情報や、番組ガイド等の案内情報や通知情報、制御情報、管理情報によって構成される。
TLVレイヤで処理が生成されるTLVパケットに格納される制御情報(SI)がTLV−SIであり、主に受信処理に関する制御情報によって構成されている。
MMTプロトコル(MMTP)に従って生成されるパケットであるMMTPパケットに格納される制御情報(SI)は最上位レイヤに示すMMT−SIであり、主に再生制御に関する制御情報によって構成されている。
The control information (SI) includes setting information necessary for receiving and reproducing the content (program) on the information processing device 30 side, guide information such as a program guide, notification information, control information, and management information. .
The control information (SI) stored in the TLV packet for which the processing is generated in the TLV layer is the TLV-SI, which is mainly configured by the control information regarding the reception processing.
The control information (SI) stored in the MMTP packet, which is a packet generated according to the MMT protocol (MMTP), is the MMT-SI shown in the uppermost layer, and is mainly configured by control information relating to reproduction control.

TLVレイヤ上には、UDP/IPレイヤが設定される。
UDP/IPレイヤは、詳細にはIPレイヤとUDPレイヤに分割可能であるが、IPパケットのペイロードにUDPパケットを格納する伝送を規定するレイヤである。
UDP/IPレイヤ上にMMTレイヤ、およびFile delivery methodレイヤ が設定される。
MMTPパケットをIPパケットに格納して送信する場合と、MMTPパケットを用いないデータ伝送方式であるFile delivery methodを利用してIPパケットとしてデータ送信する方式が併用可能な設定となっている。
A UDP / IP layer is set on the TLV layer.
The UDP / IP layer, which can be divided into an IP layer and a UDP layer in detail, is a layer that defines transmission for storing a UDP packet in a payload of the IP packet.
An MMT layer and a File delivery method layer are set on the UDP / IP layer.
The setting is such that the case where the MMTP packet is stored in the IP packet and transmitted, and the system where the data is transmitted as the IP packet using the File delivery method which is the data transmission method without using the MMTP packet, can be used together.

MMTレイヤ上には、以下のレイヤが設定される。
画像符号化規格であるHEVC(High Efficiency Video Coding)に従った符号化画像データである画像(Video)データのレイヤ。
The following layers are set on the MMT layer.
A layer of image (Video) data, which is encoded image data according to HEVC (High Efficiency Video Coding), which is an image coding standard.

音声符号化規格である、
(1)MPEG4 AAC LC(Advanced Audio Coding Low Complexity)に従った符号化音声データ、または、
(2)MPEG4 ALS(Audio Losless Coding)に従った符号化音声データ、
これらの音声符号化規格に従って符号化された音声(Audio)データのレイヤ。
A speech coding standard,
(1) Encoded audio data according to MPEG4 AAC LC (Advanced Audio Coding Low Complexity), or
(2) encoded audio data according to MPEG4 ALS (Audio Loss Coding);
A layer of audio (Audio) data encoded according to these audio encoding standards.

さらに、
字幕符号化規格であるTTML(Timed Text Markup Language)に従った符号化字幕データである字幕(Subtitle)データ、
MMTPパケットを利用して送信される制御情報(MMT−SI)、
HTML5(Hyper Text Markup Language 5)に従って記述された様々なアプリケーション、
これらの各データがMMTPパケットに格納されて送信される。
further,
Caption (Subtitle) data, which is coded caption data according to TTML (Timed Text Markup Language), which is a caption coding standard;
Control information (MMT-SI) transmitted using an MMTP packet,
Various applications written according to HTML5 (HyperText Markup Language 5),
Each of these data is stored in an MMTP packet and transmitted.

制御情報(MMT−SI)は、MMTPパケットで送信される制御情報(シグナリング情報)であり、情報処理装置30側においてコンテンツ(番組)を再生するために必要となる設定情報や、番組ガイド等の案内情報や通知情報、制御情報等の様々な管理情報によって構成される。   The control information (MMT-SI) is control information (signaling information) transmitted in an MMTP packet, and includes setting information necessary for reproducing the content (program) on the information processing device 30 side, and a program guide and the like. It is composed of various management information such as guidance information, notification information, control information and the like.

なお、時刻情報(NTP:Network Time Protocol)は絶対時刻情報であり、UDPパケットに直接格納され送信される。
その他のデータ配信を行うデータサービス(Data service)、コンテンツダウンロード等(Contentdownload,etc.)がMMTと異なるファイル配信メソッド(File delivery method)を利用して配信可能な構成を有している。
The time information (NTP: Network Time Protocol) is absolute time information and is directly stored and transmitted in a UDP packet.
Other data delivery services (Data service), content download, etc. (Content download, etc.) can be delivered using a file delivery method different from MMT.

図2に示すように、画像、音声、字幕、さらに、様々な通知情報や制御情報等の様々な管理情報からなる制御情報(MMT−SI)やアプリケーションは、MMTPパケットによって送信される。   As shown in FIG. 2, control information (MMT-SI) including various management information such as images, audio, subtitles, various notification information and control information, and applications are transmitted by MMTP packets.

図3を参照してMMTPパケットの具体的構成例について説明する。
図3には以下の4種類のデータ構成例を示している。
(a)MPU(Media Presentation Unit)
(b)MMTPペイロート
(c)MMTPパケット
(d)TLVパケット
A specific configuration example of the MMTP packet will be described with reference to FIG.
FIG. 3 shows the following four types of data configuration examples.
(A) MPU (Media Presentation Unit)
(B) MMTP Payload (c) MMTP Packet (d) TLV Packet

(d)TLVパケットが放送波やネットワークを介して送信されるパケットであり、TLVパケットには、UDPヘッダ、IPヘッダ、TLVヘッダの各ヘッダ情報が設定される。TLVパケットは、データ種類ごとに個別のパケットとして設定される。   (D) A TLV packet is a packet transmitted via a broadcast wave or a network, and header information of a UDP header, an IP header, and a TLV header is set in the TLV packet. The TLV packet is set as an individual packet for each data type.

すなわち、1つのTLVパケットのTLVペイロードには、1つの種類のデータが格納される。具体的には、例えば、画像(V)、音声(A)、字幕(S)、あるいは、様々な管理情報からなる制御情報(SI)が個別に格納される。
なお、制御情報(SI)については、MMTPパケットに格納する制御情報(MMT−SI)と、TLVパケットで送信される制御情報(TLV−SI)があり、それぞれ異なる個別のTLVパケットに格納される。
That is, one type of data is stored in the TLV payload of one TLV packet. Specifically, for example, an image (V), a sound (A), a caption (S), or control information (SI) including various management information is individually stored.
The control information (SI) includes control information (MMT-SI) stored in an MMTP packet and control information (TLV-SI) transmitted in a TLV packet, which are stored in different individual TLV packets. .

TLVパケットのペイロードであるTLVペイロートの一例が、図3(c)に示すMMTPパケットである。
図3(c)に示すMMTPパケットは、MMTPヘッダと、MMTPペイロードによって構成される。
An example of the TLV payload, which is the payload of the TLV packet, is the MMTP packet shown in FIG.
The MMTP packet shown in FIG. 3C is composed of an MMTP header and an MMTP payload.

1つのMMTPパケットのMMTPペイロードには、1つの種類のデータが格納される。具体的には、例えば、画像(V)、音声(A)、字幕(S)、さらにMMTPパケットに格納する制御情報(MMT−SI)、これらのいずれか一種類のデータが、個別のMMTPパケットに格納される。   One type of data is stored in the MMTP payload of one MMTP packet. Specifically, for example, the image (V), the audio (A), the caption (S), and the control information (MMT-SI) stored in the MMTP packet, any one of these data is an individual MMTP packet. Is stored in

図3(a),(b)は、図3(c)に示すMMTPパケットのMMTPペイロードに格納される画像データの詳細構成を示している。
図3(b)は、図3(c)に示すMMTPパケット中、MMTPペイロードが画像データ(V)であるもののみを選択して示している。
図3(b)に示すMMTPペイロードは、ヘッダとデータユニットによって構成される。
FIGS. 3A and 3B show a detailed configuration of image data stored in the MMTP payload of the MMTP packet shown in FIG. 3C.
FIG. 3B shows only the MMTP packets shown in FIG. 3C in which the MMTP payload is the image data (V).
The MMTP payload shown in FIG. 3B includes a header and a data unit.

データユニットには、図3(a)に示すように、画像データおよび、以下の各種のパラメータが格納される。
AU Delimiter(Access Unit Delimiter)
SPS(Sequence Parameter Set)
PPS(Picture Parameter Set)
SEIs(Supplemental Enhancement Information)
これらのパラメータは、画像表示に利用されるパラメータである。
As shown in FIG. 3A, the data unit stores image data and the following various parameters.
AU Delimiter (Access Unit Delimiter)
SPS (Sequence Parameter Set)
PPS (Picture Parameter Set)
SEIs (Supplemental Enhancement Information)
These parameters are parameters used for image display.

図3(a)に示すMPU(Media Presentation Unit)は、MMTフォーマットにおける画像、音声、字幕等の再生対象データの1つのデータ処理単位である。図3(a)に示す例は、画像データのMPUの例であり、いわゆる符号化、復号処理単位としてのGOP(Group of Pictures)と同じ単位である。   An MPU (Media Presentation Unit) shown in FIG. 3A is one data processing unit of reproduction target data such as an image, a sound, and a caption in the MMT format. The example shown in FIG. 3A is an example of an MPU of image data, and is the same unit as a GOP (Group of Pictures) as a so-called encoding and decoding processing unit.

このように、例えば画像データは、図3(a)に示すように、MMTフォーマットにおいて規定されたパラメータと画像構成データに分割され、図3(b)に示すMMTPペイロードに格納され、図3(c)に示すMMTPパケットとして構成される。
さらに、MMTPパケットは、図3(d)に示すTLVパケットのペイロードとして設定されて、TLVパケットが放送波やネットワークを介して送信される。
In this way, for example, as shown in FIG. 3A, the image data is divided into parameters defined in the MMT format and image configuration data, stored in the MMTP payload shown in FIG. It is configured as an MMTP packet shown in c).
Further, the MMTP packet is set as a payload of the TLV packet shown in FIG. 3D, and the TLV packet is transmitted via a broadcast wave or a network.

なお、音声、字幕等の各データ、MMT−SIの各データについても、それぞれデータ種類単位のMMTPパケット、TLVパケットが設定されて送信される。
TLV−SIは、MMTPパケットに格納されることなくTLVパケットに格納されて送信される。
It should be noted that MMTP packets and TLV packets are set and transmitted for each data type such as audio data, subtitle data, and MMT-SI data.
The TLV-SI is stored in the TLV packet without being stored in the MMTP packet and transmitted.

[3.BDAVフォーマットとSPAVフォーマットについて]
次に、上述のMMTフォーマットに従った配信コンテンツを例えばBD(Blu−ray(登録商標) Disc)やフラッシュメモリ、あるいはHDD(ハードディスク)等のメディアに記録して再生する場合の記録データフォーマットであるBDAVフォーマットとSPAVフォーマットについて図4以下を参照して説明する。
[3. About BDAV format and SPAV format]
Next, this is a recording data format for recording and reproducing distribution content according to the above-described MMT format on a medium such as a BD (Blu-ray (registered trademark) Disc), a flash memory, or an HDD (hard disk). The BDAV format and the SPAV format will be described with reference to FIG.

例えばBD(Blu−ray(登録商標) Disc)やフラッシュメモリやHDD等のメディアから、画像、音声、字幕等のコンテンツを再生する場合には、これらのコンテンツの再生処理を行なうための再生制御情報やインデックス情報が必要となる。再生制御情報やインデックス情報は一般的にデータベースファイルと呼ばれる。
これらの再生制御情報やインデックス情報は、メディアの記録データの再生処理を実行する再生アプリケーションに応じて異なるものとなる。
For example, when reproducing content such as images, audio, subtitles, and the like from a medium such as a BD (Blu-ray (registered trademark) Disc), a flash memory, or an HDD, reproduction control information for performing reproduction processing of these contents. Or index information is required. The reproduction control information and the index information are generally called a database file.
The playback control information and the index information differ depending on the playback application that executes the playback process of the recording data on the medium.

前述したように、現行の記録再生アプリケーション規格(=データ記録フォーマット)としてBDMVやBDAV規格(データ記録フォーマット)がある。これらのアプリケーション規格は、主にBD(Blu−ray(登録商標) Disc)を利用したデータ記録再生アプリケーション規格として策定されたものである。   As described above, there are BDMV and BDAV standards (data recording formats) as current recording / reproducing application standards (= data recording formats). These application standards are mainly formulated as data recording / reproducing application standards using BD (Blu-ray (registered trademark) Disc).

なお、BDMVやBDAVは、主にBDを利用したデータ記録再生のアプリケーション規格であり、データ記録フォーマット(規格)であるが、これらの規格はBDに限らず、フラッシュメモリなど、その他のBD以外のメディアを利用したデータ記録再生にも適用可能である。
BDMVは、例えば映画コンテンツなどを予め記録したBD−ROM向けに開発されたアプリケーション規格であり、主に、パッケージコンテンツ等の書き換え不能なBD−ROMで広く使われている。
一方、BDAVは、主に書き換え可能なBD−RE型ディスクや、一回のみ記録可能なBD−R型ディスク等を利用したデータ記録再生処理に適用することを目的として開発された規格である。BDAVは、例えばユーザがビデオカメラなどで撮影した映像の記録再生やテレビ放送を記録し再生するために利用される。
It should be noted that BDMV and BDAV are application standards for data recording and reproduction mainly using BDs, and are data recording formats (standards). These standards are not limited to BDs, and other standards other than BDs, such as flash memories, may be used. The present invention is also applicable to data recording and reproduction using media.
BDMV is an application standard developed for, for example, a BD-ROM in which movie contents and the like are recorded in advance, and is widely used mainly in non-rewritable BD-ROMs such as package contents.
On the other hand, BDAV is a standard developed for the purpose of being mainly applied to data recording / reproducing processing using a rewritable BD-RE type disc, a once-recordable BD-R type disc, and the like. The BDAV is used, for example, for recording and reproducing a video taken by a user with a video camera or the like and for recording and reproducing a television broadcast.

上述のMMTフォーマットに従った配信コンテンツを記録したメディアからのコンテンツ再生処理を、BDAVフォーマット対応の再生アプリケーションを利用して行なうためには、このBDAVフォーマットに従ってデータ記録を行うことが必要である。
前述のように、BDAVフォーマットは、再生制御情報の記録ファイルとして、プレイリストファイルやクリップ情報ファイル等を規定しており、BDAV対応再生アプリケーションはこれらの再生制御情報ファイル(データベースファイル)の記録情報を利用してデータ再生処理を実行する。
In order to perform a content reproduction process from a medium on which a distribution content according to the above-described MMT format is recorded by using a BDAV format-compatible reproduction application, it is necessary to perform data recording in accordance with the BDAV format.
As described above, the BDAV format defines a playlist file, a clip information file, and the like as a recording file of the playback control information, and the BDAV-compatible playback application stores the recording information of the playback control information file (database file). The data reproduction process is executed using the data.

図4は、情報記録媒体(メディア)40にBDAVフォーマットに従って記録されたデータのディレクトリ構成例を示す図である。
ディレクトリには、図4に示すように様々な管理情報、再生制御情報、再生対象データの格納ファイルが設定される。
FIG. 4 is a diagram showing an example of a directory structure of data recorded on the information recording medium (media) 40 in accordance with the BDAV format.
As shown in FIG. 4, various management information, reproduction control information, and files for storing reproduction target data are set in the directory.

管理情報ファイルは、例えば、図4に示すインフォファイル(info)、メニューファイル(menu)、マークファイル(mark)等によって構成される。これらは、主にユーザに見せるタイトルの管理情報等を格納する。
また、再生制御情報ファイルとして、
プレイリストファイル(playlist)、
クリップ情報ファイル(clipinf)
例えば、これらのファイルが記録される。
さらに、再生データ格納ファイルとして、クリップAVストリームファイル(stream)が記録される。
The management information file includes, for example, an info file (info), a menu file (menu), a mark file (mark), and the like shown in FIG. These mainly store title management information to be shown to the user.
Also, as the playback control information file,
Playlist file (playlist),
Clip information file (clipinf)
For example, these files are recorded.
Further, a clip AV stream file (stream) is recorded as a reproduction data storage file.

プレイリストファイルは、タイトルによって指定される再生プログラムのプログラム情報に従ってコンテンツの再生順等を規定したファイルであり、例えば、再生位置情報等を記録したクリップ情報ファイルの指定情報等を有する。
クリップ情報ファイルは、プレイリストファイルによって指定されるファイルであり、クリップAVストリームファイルの再生位置情報等を有する。
The playlist file is a file in which the order of content reproduction is specified in accordance with the program information of the reproduction program specified by the title, and has, for example, the specification information of a clip information file that records reproduction position information and the like.
The clip information file is a file specified by the playlist file, and has playback position information of the clip AV stream file and the like.

クリップAVストリームファイルは、再生対象となるAVストリームデータや管理情報を格納したファイルである。クリップAVストリームファイルは、再生対象となる画像、音声、字幕等の各データや、管理情報を格納したパケットによって構成される。
なお、MPEG−2TSフォーマットにおいて規定され、クリップAVストリームファイルに記録される管理情報として、例えば、PSI/SI(Program Specific Information/Service Information)がある。
The clip AV stream file is a file storing AV stream data to be played back and management information. A clip AV stream file is composed of data to be reproduced, such as images, sounds, subtitles, and the like, and packets storing management information.
The management information specified in the MPEG-2TS format and recorded in the clip AV stream file includes, for example, PSI / SI (Program Specific Information / Service Information).

なお、従来の放送データや、ネットワーク配信データは、TS(Transport Stream)パケットによって構成されたMPEG−2TSフォーマットデータであるが、今後の4K,8K画像等の高精細画像等を含むデータは前述したMMTPパケットによって構成されるMMTフォーマットデータとなることが予想される。   Conventional broadcast data and network distribution data are MPEG-2TS format data composed of TS (Transport Stream) packets, but future data including high-definition images such as 4K and 8K images will be described above. It is expected to be MMT format data composed of MMTP packets.

図4にはクリップAVストリームファイル(stream)として、
TSパケットによって構成されたMPEG−2TSフォーマットデータからなるストリームファイル(nnnnn.m2ts)、
MMTPパケットによって構成されるMMTフォーマットデータ(nnnnn.mmtv)、
これらの2種類のストリームファイルを示している。
FIG. 4 shows a clip AV stream file as a stream.
A stream file (nnnnn.m2ts) composed of MPEG-2 TS format data composed of TS packets,
MMT format data (nnnnnn.mmtv) composed of MMTP packets,
These two types of stream files are shown.

図4に示すディレクトリ例は、情報処理装置30が受信したデータがMPEG−2TSフォーマットデータである場合は、そのまま、MPEG−2TSフォーマットデータとしてメディアに記録し、受信データがMMTフォーマットデータである場合は、MMTフォーマットデータとしてメディアに記録する設定の場合のディレクトリ例である。   In the directory example shown in FIG. 4, if the data received by the information processing device 30 is MPEG-2TS format data, it is recorded as it is on the medium as MPEG-2TS format data, and if the received data is MMT format data, , Is an example of a directory in a case of setting to record on a medium as MMT format data.

なお、MMTフォーマットデータをメディアに記録する場合のクリップAVストリームファイルは、
(1)MMTフォーマットをMPEG−2TSフォーマットに変換してクリップAVストリームファイルを生成する、あるいは、
(2)MMTフォーマットに従ったデータを格納したパケットのパケット列からなるクリップAVストリームファイルを生成する、
これらの2種類の処理が想定される。
Note that a clip AV stream file for recording MMT format data on a medium is:
(1) Convert the MMT format to the MPEG-2TS format to generate a clip AV stream file, or
(2) generating a clip AV stream file composed of a packet sequence of packets storing data according to the MMT format;
These two types of processing are assumed.

現在、上記(2)の処理、すなわち、MMTフォーマットに従ったデータを格納したパケットのパケット列からなるクリップAVストリームファイルを生成してメディアに記録する方向で議論が進んでいる。
具体的には、MMTP(MMT Protocol)パケット、あるいはMMTPパケットの上位パケットであるTLV(Type Length Value)パケットのパケット列として記録する方向で議論が進んでいる。
この具体例については後段で詳細に説明する。
At present, discussions are proceeding in the direction of the above-described process (2), that is, generating a clip AV stream file composed of a packet sequence of packets storing data according to the MMT format and recording the clip AV stream file on a medium.
More specifically, discussions are proceeding in the direction of recording as a packet sequence of an MMTP (MMT Protocol) packet or a TLV (Type Length Value) packet which is an upper packet of the MMTP packet.
This specific example will be described in detail later.

管理情報ファイル、プレイリストファイル、クリップ情報ファイル、これらのデータファイルは、クリップAVストリームファイルに格納された再生データである画像、音声、字幕等の再生処理に適用する管理情報の格納ファイルである。これらは、再生制御情報や、再生データの属性情報等を格納したファイルであり、データベースファイルと呼ばれる。   The management information file, the playlist file, the clip information file, and these data files are storage files of management information applied to playback processing of images, sounds, subtitles, and the like, which are playback data stored in the clip AV stream file. These are files storing reproduction control information, attribute information of reproduction data, and the like, and are called database files.

情報記録媒体に記録されたコンテンツを再生するシーケンスは以下の通りである。
(a)まず、再生アプリケーションによって管理情報ファイルから特定のプレイリストを指定する。
(b)選択されたプレイリストに規定されたクリップ情報ファイルを選択し、クリップ情報ファイルの記録データに従って、クリップAVストリームファイルから、画像、音声等の再生データであるAVストリームあるいはコマンドを読み出して、AVストリームの再生や、コマンドの実行処理を開始する。
The sequence for reproducing the content recorded on the information recording medium is as follows.
(A) First, a specific playlist is specified from the management information file by the reproduction application.
(B) A clip information file specified in the selected playlist is selected, and an AV stream or a command, which is playback data such as an image and a sound, is read from the clip AV stream file according to the recording data of the clip information file, The reproduction of the AV stream and the execution of the command are started.

図5は、情報記録媒体(メディア)40に記録される以下のデータ、すなわち、
プレイリストファイル、
クリップ情報ファイル、
クリップAVストリームファイル、
これらのデータの対応関係を説明する図である。
FIG. 5 shows the following data recorded on the information recording medium (media) 40:
Playlist file,
Clip information file,
Clip AV stream file,
It is a figure explaining the correspondence of these data.

実際の再生対象データである画像、音声、字幕等の再生対象データからなるAVストリームはクリップAVストリーム(Clip AV Stream)ファイルとして記録され、さらに、これらのAVストリームの管理情報、再生制御情報ファイルとして、プレイリスト(PlayList)ファイルと、クリップ情報(Clip Information)ファイルが規定される。   An AV stream composed of data to be reproduced, such as images, sounds, and subtitles, which are actual data to be reproduced, is recorded as a clip AV stream (Clip AV Stream) file, and further, as management information and a reproduction control information file for these AV streams. , A playlist (PlayList) file and a clip information (Clip Information) file are defined.

これら複数のカテゴリのファイルは、図5に示すように、
プレイリスト(PlayList)ファイルを含むプレイリストレイヤ、
クリップAVストリーム(Clip AV Stream)ファイルと、クリップ情報(Clip Information)ファイルからなるクリップレイヤ、
これらの2つのレイヤに区分できる。
These multiple categories of files, as shown in FIG.
A playlist layer including a playlist (PlayList) file;
A clip layer including a clip AV stream (Clip AV Stream) file and a clip information (Clip Information) file;
It can be divided into these two layers.

なお、一つのクリップAVストリーム(Clip AV Stream)ファイルには一つのクリップ情報(Clip Information)ファイルが対応付けられ、これらのペアを一つのオブジェクトと考え、これらをまとめてクリップ(Clip)、あるいはクリップファイルと呼ぶ。
クリップAVストリームファイルに含まれるデータの詳細情報、例えばMPEGデータのIピクチャ位置情報などを記録したEPマップなどの管理情報がクリップ情報ファイルに記録される。
One clip AV stream (Clip AV Stream) file is associated with one clip information (Clip Information) file. These pairs are considered as one object, and these are put together into a clip (Clip) or clip. Call it a file.
Detailed information of data included in the clip AV stream file, for example, management information such as an EP map in which I picture position information of MPEG data is recorded is recorded in the clip information file.

なお、クリップAVストリーム(Clip AV Stream)ファイルは、MPEG−2TSフォーマットデータである場合はTSパケットによって構成される。
また、MMTフォーマットデータである場合はMMTPパケットによって構成される。
Note that a clip AV stream (Clip AV Stream) file is composed of TS packets when the data is MPEG-2 TS format data.
If the data is MMT format data, the data is composed of MMTP packets.

クリップ情報(Clip Information)ファイルは、例えば、クリップAVストリームファイルのバイト列データのデータ位置と、時間軸上に展開した場合の再生開始ポイントであるエントリポイント(EP)等の再生時間位置等の対応データ等、クリップAVストリームファイルの格納データの再生開始位置などを取得するための管理情報を格納している。   The clip information (Clip Information) file corresponds to, for example, the data position of the byte sequence data of the clip AV stream file and the reproduction time position of an entry point (EP) which is a reproduction start point when expanded on the time axis. It stores management information for acquiring a reproduction start position of data stored in the clip AV stream file, such as data.

プレイリストは、クリップ(Clip)の再生開始位置や再生終了位置に対応するアクセスポイントを時間軸上の情報であるタイムスタンプで指し示す情報を有する。
例えば、コンテンツの開始点からの再生時間経過位置を示すタイムスタンプに基づいてクリップ情報ファイルを参照して、クリップAVストリームファイルのデータ読み出し位置、すなわち再生開始点としてのアドレスを取得することが可能となる。
クリップ情報ファイル(Clip Information file)は、このタイムスタンプから、クリップAVストリームファイル中のストリームのデコードを開始すべきアドレス情報を見つけるために利用される。
The playlist has information indicating an access point corresponding to a reproduction start position or a reproduction end position of a clip (Clip) by a time stamp which is information on a time axis.
For example, it is possible to obtain the data read position of the clip AV stream file, that is, the address as the reproduction start point, by referring to the clip information file based on the time stamp indicating the position where the reproduction time has elapsed from the start point of the content. Become.
The clip information file is used to find, from the time stamp, address information at which decoding of a stream in the clip AV stream file should be started.

このように、プレイリスト(PlayList)ファイルは、クリップ(=クリップ情報ファイル+クリップAVストリームファイル)レイヤに含まれる再生可能データに対する再生区間の指定情報を有する。
プレイリスト(PlayList)ファイルには、1つ以上のプレイアイテム(PlayItem)が設定され、プレイアイテムの各々が、クリップ(=クリップ情報ファイル+クリップAVストリームファイル)レイヤに含まれる再生可能データに対する再生区間の指定情報を有する。
As described above, the playlist (PlayList) file has the reproduction section designation information for the reproducible data included in the clip (= clip information file + clip AV stream file) layer.
One or more play items (PlayItem) are set in the play list (PlayList) file, and each of the play items is a playback section for playable data included in a clip (= clip information file + clip AV stream file) layer. With the specified information.

なお、再生対象データを格納したクリップAVストリーム(Clip AV Stream)ファイルは、前述したように、従来型のMPEG−2TSフォーマットデータである場合はTSパケットによって構成される。
また、今後、利用が拡大されると予想される4K,8K画像等の高精細画像データの場合は、MMTフォーマットデータである場合はMMTPパケットによって構成される。
図6、図7を参照して、MMTフォーマットと、MPEG−2TSフォーマットについて説明する。
As described above, a clip AV stream (Clip AV Stream) file in which data to be reproduced is stored is constituted by TS packets in the case of conventional MPEG-2 TS format data.
Further, in the case of high-definition image data such as 4K and 8K images whose use is expected to be expanded in the future, if the data is MMT format data, it is constituted by MMTP packets.
The MMT format and the MPEG-2TS format will be described with reference to FIGS.

まず、図6を参照して、MPEG−2TSフォーマットについて説明する。
MPEG−2TSフォーマットは画像(Video)、音声(Audio)、字幕(Subtitle)等、コンテンツ構成データである符号化データや管理情報(PSI/SI)を記録媒体(メディア)に格納、または放送波やネットワークを介して伝送する際の符号化データ等のデータ格納形式(コンテナフォーマット)を規定したフォーマットである。
First, the MPEG-2TS format will be described with reference to FIG.
In the MPEG-2TS format, encoded data and management information (PSI / SI), which are content configuration data, such as images (Video), audio (Audio), and subtitles (Subtitles), are stored in a recording medium (media). This is a format that defines a data storage format (container format) for encoded data and the like when transmitted via a network.

MPEG−2TSフォーマットは、ISO13818−1において標準化されたフォーマットであり、例えばBD(Blu−ray(登録商標) Disc)に対するデータ記録や、デジタル放送等に用いられている。   The MPEG-2TS format is a format standardized in ISO13818-1, and is used, for example, for data recording on a BD (Blu-ray (registered trademark) Disc), digital broadcasting, and the like.

図6(a)〜(c)はMPEG−2TSフォーマットデータの構成を示す図である。
最下段に示す図6(a)は、MPEG−2TSのフォーマットデータの全体構成を示す図である。
図6(a)に示すように、MPEG−2TSフォーマットデータは、複数のエレメンタリストリーム(Elementary stream)によって構成される。
エレメンタリストリーム(Elementary stream)は、例えば画像、音声、字幕等の1つの単位として設定されるユニットである。
FIGS. 6A to 6C are diagrams showing the structure of MPEG-2TS format data.
FIG. 6A shown at the bottom shows the entire configuration of the format data of MPEG-2TS.
As shown in FIG. 6A, the MPEG-2TS format data is composed of a plurality of elementary streams.
An elementary stream is a unit set as one unit of, for example, an image, a sound, a caption, and the like.

1つのエレメンタリストリーム(Elementary stream)は、図2(b)に示すように、1つまたは複数のPES(Packetized Elementary stream)パケットによって構成される。
具体的には、1つのエレメンタリストリーム(Elementary stream)は、ペイロードタイプ(Payload_type)=0x0で、かつ同じパケット識別子(Packet_id)を持つPESパケットの1つ、または複数から構成される。
As shown in FIG. 2B, one elementary stream (Elementary stream) is composed of one or a plurality of PES (Packetized Elementary stream) packets.
Specifically, one elementary stream (Elementary stream) is composed of one or more PES packets having a payload type (Payload_type) = 0x0 and having the same packet identifier (Packet_id).

1つのPESパケットは、図6(c)に示すように、1つまたは複数のTSパケットによって構成される。
具体的には、1つのPESパケットは、ペイロードタイプ(Payload_type)=0x0で、かつ同じパケット識別子(Packet_id)を持つTSパケットの1つ、または複数から構成される。
TSパケットは、前述のMMTPパケットと異なり、固定長であり、1つのTSパケットのパケットサイズは、188バイトに固定されている。
One PES packet is configured by one or a plurality of TS packets as shown in FIG.
Specifically, one PES packet includes one or a plurality of TS packets having a payload type (Payload_type) = 0x0 and the same packet identifier (Packet_id).
The TS packet has a fixed length unlike the MMTP packet described above, and the packet size of one TS packet is fixed at 188 bytes.

次に、図7を参照してMMT(MPEG Media Transport)フォーマットについて説明する。
MMTフォーマットについては、先に図3を参照しているが、図7に示すMMTフォーマットの説明図は、図6を参照して説明したMPEG−2TSフォーマットとの対応関係を分かり易く説明した図である。
Next, an MMT (MPEG Media Transport) format will be described with reference to FIG.
Regarding the MMT format, reference is first made to FIG. 3, but the explanatory diagram of the MMT format shown in FIG. 7 is a diagram for easily understanding the correspondence relationship with the MPEG-2TS format described with reference to FIG. 6. is there.

先に説明したように、MMTフォーマットは、画像(Video)、音声(Audio)、字幕(Subtitle)等、コンテンツ構成データである符号化データを放送波やネットワークを介して伝送する際のデータ転送方式(トランスポートフォーマット)を規定したものである。
図7は、ISO/IEC 23008−1に規定されるファイルフォーマットであるMMTフォーマットについて説明する図である。
As described above, the MMT format is a data transfer method for transmitting encoded data, such as images (Video), audio (Audio), and subtitles, which are content configuration data, via broadcast waves or networks. (Transport format).
FIG. 7 is a diagram illustrating an MMT format which is a file format defined in ISO / IEC 23008-1.

図7(a)〜(c)にはMMTフォーマットデータの構成を示している。
最下段に示す図7(a)は、MMTフォーマットデータの全体構成を示す図である。
図7(a)に示すように、MMTフォーマットデータは、複数のメディアプレゼンテーションユニット(MPU:Media presentation unit)によって構成される。
MPUは、例えば画像、音声、字幕等の1つの単位として設定されるユニットである。例えば、画像の場合、1MPUが1つのMPEG圧縮画像単位である1GOP(Group of picture)に相当する。
FIGS. 7A to 7C show the structure of MMT format data.
FIG. 7A shown at the bottom shows the overall structure of MMT format data.
As shown in FIG. 7A, the MMT format data is composed of a plurality of media presentation units (MPUs).
The MPU is a unit that is set as one unit such as an image, a sound, and a caption. For example, in the case of an image, 1 MPU corresponds to 1 GOP (Group of picture) which is one MPEG compressed image unit.

1つのMPUは、図7(b)に示すように、1つまたは複数のメディアフラグメントユニット(MFU:Media Fragment unit)によって構成される。
具体的には、1つのMPUは、ペイロードタイプ(Payload_type)=0x0(MPU)で、かつ同じパケット識別子(Packet_id)を持つMFUの1つ、または複数から構成される。
One MPU is configured by one or a plurality of media fragment units (MFU) as shown in FIG. 7B.
Specifically, one MPU includes one or more MFUs having a payload type (Payload_type) = 0x0 (MPU) and the same packet identifier (Packet_id).

1つのMFUは、図7(c)に示すように、1つまたは複数のMMTPパケットによって構成される。
具体的には、1つのMFUは、ペイロードタイプ(Payload_type)=0x0(MPU)で、かつ同じパケット識別子(Packet_id)を持つMMTPパケットの1つ、または複数から構成される。
MMTPパケットは可変長であり、様々なパケットサイズに設定可能である。
MMTPパケットの各々は、属性情報等を格納するヘッダ(MMTPヘッダ)と、符号化画像の実データ等を格納するペイロード(MMTPペイロード)により、構成される。
One MFU is composed of one or a plurality of MMTP packets as shown in FIG.
Specifically, one MFU includes one or more MMTP packets having a payload type (Payload_type) = 0x0 (MPU) and the same packet identifier (Packet_id).
MMTP packets are of variable length and can be set to various packet sizes.
Each MMTP packet is composed of a header (MMTP header) storing attribute information and the like, and a payload (MMTP payload) storing actual data of the encoded image and the like.

なお、BDAVフォーマットに類似するフォーマットとしてSPAVフォーマットがある。前述したように、BDMVやBDAVは、主にBDを利用したデータ記録再生のアプリケーション規格である。これに対して、SPAVフォーマットは、主にハードディスクに対するデータ記録再生のアプリケーション規格である。
ただし、BDAVフォーマット、SPAVフォーマットのいずれも、BD,フラッシュメモリ、HDD等、様々なメディアを利用した記録再生に利用可能なフォーマットである。
Note that there is a SPAV format as a format similar to the BDAV format. As described above, BDMV and BDAV are application standards for data recording / reproduction mainly using BD. On the other hand, the SPAV format is an application standard for recording and reproducing data mainly on a hard disk.
However, both the BDAV format and the SPAV format are formats that can be used for recording and reproduction using various media such as BDs, flash memories, and HDDs.

SPAVフォーマットデータは、BDAVフォーマットにおけるデータ記録再生処理と同様の処理でデータ記録再生を実行することが可能である。ただし、SPAVフォーマットは、ファイル名設定が、BDAVフォーマットと一部、異なっている。
図8にSPAVフォーマットのディレクトリ構成例を示す。
For SPAV format data, data recording and reproduction can be performed by the same processing as data recording and reproduction processing in the BDAV format. However, the SPAV format is partially different from the BDAV format in the file name setting.
FIG. 8 shows an example of a directory structure in the SPAV format.

図8に示すSPAVフォーマットのディレクトリには、先に図4を参照して説明したBDAVフォーマットと同様、様々な管理情報、再生制御情報、再生対象データの格納ファイルが設定される。   In the directory of the SPAV format shown in FIG. 8, various management information, playback control information, and storage files of playback target data are set as in the BDAV format described above with reference to FIG.

管理情報ファイルは、例えば、図8に示すインフォファイル(INFO)、メニューファイル(MENU)、マークファイル(MARK)等によって構成される。これらは、主にユーザに見せるタイトルの管理情報等を格納する。
また、再生制御情報ファイルとして、
プレイリストファイル(PLAYLIST)、
クリップ情報ファイル(CLIPINF)
例えば、これらのファイルが記録される。
さらに、再生データ格納ファイルとして、クリップAVストリームファイル(STREAM)が記録される。
The management information file includes, for example, an info file (INFO), a menu file (MENU), a mark file (MARK), and the like shown in FIG. These mainly store title management information to be shown to the user.
Also, as the playback control information file,
Playlist file (PLAYLIST),
Clip information file (CLIPINF)
For example, these files are recorded.
Further, a clip AV stream file (STREAM) is recorded as a reproduction data storage file.

図8に示すようにSPAVフォーマットのディレクトリ名や各ファイルの拡張子の設定が、図4を参照して説明したBDAVフォーマットと異なっている。
ただし、各ファイルに格納されるデータや、各ファイルの役割は、BDAVフォーマットと同様である。
As shown in FIG. 8, the setting of the directory name and the extension of each file in the SPAV format is different from the BDAV format described with reference to FIG.
However, the data stored in each file and the role of each file are the same as in the BDAV format.

以下の実施例の説明では、MMTフォーマットデータをBDAVフォーマットデータとして記録し、再生する処理例について説明するが、以下に説明する実施例は、MMTフォーマットデータをSPAVフォーマットデータとして記録し、再生する処理にも適用可能である。   In the following description of the embodiment, an example of processing for recording and reproducing MMT format data as BDAV format data will be described. However, in the embodiment described below, processing for recording and reproducing MMT format data as SPAV format data will be described. Is also applicable.

[4.MMTフォーマットデータをBDAVフォーマットに従って記録する場合の処理について]
次に、MMTフォーマットデータをBDAVフォーマットに従って記録する場合の処理について説明する。
[4. Processing for Recording MMT Format Data According to BDAV Format]
Next, a process for recording MMT format data according to the BDAV format will be described.

先に説明したように、MMTフォーマットは、今後、放送局等によって配信が予定される4K画像等に利用されるデータ配信フォーマットであり、図3を参照して説明したプロトコルスタックに従ったフォーマットである。
一方、BDAVフォーマットはメディアに対するデータ記録フォーマットであり、図4を参照して説明したようにプレイリストファイルやクリップ情報ファイル等の再生制御情報ファイルを含むデータベースファイルが規定されている。
なお、BDAVフォーマットはデータ記録フォーマットであるとともにデータ記録再生アプリケーション規格にも対応しており、BDAVフォーマットに従ってメディアに記録されたデータ再生は、BDAVフォーマット対応の再生アプリケーションを利用して再生処理が実行される。
As described above, the MMT format is a data distribution format used for 4K images and the like scheduled to be distributed by broadcast stations and the like in the future, and is a format according to the protocol stack described with reference to FIG. is there.
On the other hand, the BDAV format is a data recording format for media, and as described with reference to FIG. 4, a database file including a playback control information file such as a playlist file and a clip information file is defined.
The BDAV format is a data recording format and also supports a data recording / reproducing application standard. For reproducing data recorded on a medium according to the BDAV format, a reproducing process is executed using a BDAV format-compatible reproducing application. You.

従って、MMTフォーマットに従った配信コンテンツをメディアに記録し、記録したメディアからのコンテンツ再生処理をBDAVフォーマット対応の再生アプリケーションを利用して行なうためには、BDAVフォーマットに従ったデータ記録を行うことが必要である。   Therefore, in order to record the distribution content according to the MMT format on a medium and perform the content reproduction process from the recorded medium using a reproduction application compatible with the BDAV format, it is necessary to perform data recording according to the BDAV format. is necessary.

前述したように、現在、BDAVフォーマットを拡張し、MMTフォーマットデータを記録、再生可能とするための規定について議論が進められている。   As described above, at present, discussions are underway on rules for extending the BDAV format and enabling recording and reproduction of MMT format data.

なお、前述したように、MMTフォーマットデータをメディアに記録する場合のクリップAVストリームファイルは、
(1)MMTフォーマットをMPEG−2TSフォーマットに変換してクリップAVストリームファイルを生成する、あるいは、
(2)MMTフォーマットに従ったデータを格納したパケットのパケット列からなるクリップAVストリームファイルを生成する、
これらの2種類の処理が可能である。
As described above, a clip AV stream file when recording MMT format data on a medium is:
(1) Convert the MMT format to the MPEG-2TS format to generate a clip AV stream file, or
(2) generating a clip AV stream file composed of a packet sequence of packets storing data according to the MMT format;
These two types of processing are possible.

現在、上記(2)の処理、すなわち、MMTフォーマットに従ったデータを格納したパケットのパケット列からなるクリップAVストリームファイルを生成してメディアに記録する方向で議論が進んでいる。
具体的には、MMTP(MMT Protocol)パケット、あるいはMMTPパケットの上位パケットであるTLV(Type Length Value)パケットのパケット列として記録する方向で議論が進んでいる。
At present, discussions are proceeding in the direction of the above-described process (2), that is, generating a clip AV stream file composed of a packet sequence of packets storing data according to the MMT format and recording the clip AV stream file on a medium.
More specifically, discussions are proceeding in the direction of recording as a packet sequence of an MMTP (MMT Protocol) packet or a TLV (Type Length Value) packet which is an upper packet of the MMTP packet.

例えば、放送局等が送信するMMTフォーマットに従った配信データを録画機等の情報処理装置が受信し、受信データをBDやフラッシュメモリ、あるいはHDD(ハードディスク)等のメディアに記録する処理を行う場合、画像、音声、字幕データや管理情報(SI)等のデータについては、MMTフォーマットに従ったデータを格納したパケットのパケット列としてそのまま記録する。   For example, a case where an information processing device such as a recorder receives distribution data in accordance with the MMT format transmitted from a broadcast station or the like, and performs a process of recording the received data on a medium such as a BD, a flash memory, or an HDD (hard disk). , Images, audio, caption data, management information (SI), and the like, are recorded as they are as a packet sequence of packets storing data in accordance with the MMT format.

すなわち、図4に示すBDAVフォーマット、あるいは図8に示すSPAVフォーマットに設定されるクリップAVストリームファイル[02001.mmtv等]に、MMTフォーマットに従ったデータを格納したパケットのパケット列を記録する。
なお、MMTフォーマットデータを格納したクリップAVストリームファイル[02001.mmtv等]に対応する再生制御情報ファイルであるプレイリストファイルやクリップ情報ファイルについては、MMTフォーマットデータ対応の制御情報を設定したプレイリストファイルやクリップ情報ファイルを記録装置が生成してメディアに記録することになる。
That is, the clip AV stream file [02001.0] set in the BDAV format shown in FIG. 4 or the SPAV format shown in FIG. mmtv etc.], a packet sequence of packets storing data in accordance with the MMT format is recorded.
Note that a clip AV stream file [02001. mmtv etc.], the recording apparatus generates a playlist file and a clip information file in which control information corresponding to MMT format data is set, and records the playlist file and the clip information file as playback control information files corresponding to MMT format data. Will be.

なお、MMTフォーマットデータを格納したクリップAVストリームファイルは、具体的には、MMTP(MMT Protocol)パケット、あるいはMMTPパケットの上位パケットであるTLV(Type Length Value)パケット、これら2種類のパケットのいずれかのパケット列として記録することが可能である。   The clip AV stream file storing the MMT format data is, specifically, an MMTP (MMT Protocol) packet, a TLV (Type Length Value) packet which is an upper packet of the MMTP packet, or any of these two types of packets. Can be recorded as a packet sequence.

MMTフォーマットデータを格納したクリップAVストリームファイルの具体的な記録構成例について図9、図10を参照して説明する。
図9は、BDやフラッシュメモリ、あるいはHDD(ハードディスク)等の記録メディアに、MMTフォーマットに従ったMMTP(MMT Protocol)パケット列を記録する処理例を説明する図である。
A specific recording configuration example of the clip AV stream file storing the MMT format data will be described with reference to FIGS.
FIG. 9 is a diagram illustrating an example of processing for recording an MMTP (MMT Protocol) packet sequence according to the MMT format on a recording medium such as a BD, a flash memory, or an HDD (hard disk).

図9には、以下の3つのデータを示している。
(A)放送配信データであるTLVパケット列
(B)受信再生データとして処理される1つのTLVパケット
(C)メディア記録用データの構成として提案されているMMTPパケット列
FIG. 9 shows the following three data.
(A) TLV packet sequence as broadcast distribution data (B) One TLV packet processed as received and reproduced data (C) MMTP packet sequence proposed as a configuration of media recording data

(A)放送配信データであるTLVパケット列は、先に図2を参照して説明したMMT(MPEG Media Transport)フォーマットを有するTLVパケットの列(シーケンス)である。
このTLVパケット列が、放送局等の送信装置20から送信される。
(A) The TLV packet sequence as broadcast distribution data is a sequence (sequence) of TLV packets having the MMT (MPEG Media Transport) format described above with reference to FIG.
This TLV packet sequence is transmitted from the transmitting device 20 such as a broadcasting station.

(B)受信再生データとして処理される1つのTLVパケットは、テレビや録画機等の情報処理装置30が受信し、再生処理を行う1つのTLVパケットである。(A)に示すTLVパケット列を構成する1つのTLVパケットの詳細構成を示している。
先に図2を参照して説明したMMT(MPEG Media Transport)フォーマットを有するTLVパケットである。
(B) One TLV packet processed as received reproduction data is one TLV packet received by the information processing device 30 such as a television or a recorder and subjected to reproduction processing. 4A shows a detailed configuration of one TLV packet forming the TLV packet sequence shown in FIG.
This is a TLV packet having the MMT (MPEG Media Transport) format described above with reference to FIG.

(C)メディア記録用データの構成として示すMMTPパケット列は、現在、メディアに対する記録データとして提案されているMMTPパケット列である。
メディアに記録されるMMTPパケットは、図9(B)との対応関係を示す点線から理解されるように、TLVパケットの一部の構成データであるMMTPパケットであり、以下の要素から構成される。
(a)MMTPパケットヘッダ(MMTP_packet_header)
(b)MMTPパケットデータ(MMTP_packet_data)(=ペイロード)
(C) The MMTP packet sequence shown as the configuration of the media recording data is the MMTP packet sequence currently proposed as the recording data for the medium.
The MMTP packet recorded on the medium is an MMTP packet which is part of the TLV packet, as can be understood from the dotted line indicating the correspondence with FIG. 9B, and includes the following elements. .
(A) MMTP packet header (MMTP_packet_header)
(B) MMTP packet data (MMTP_packet_data) (= payload)

なお、MMTPパケットデータ(MMTP_packet_data)(=ペイロード)は以下の要素によって構成される。
(b1)MMTPペイロードヘッダ(MMTP_payload_header)
(b2)MMTPペイロードデータ(MMTP_payload_data)
The MMTP packet data (MMTP_packet_data) (= payload) is composed of the following elements.
(B1) MMTP payload header (MMTP_payload_header)
(B2) MMTP payload data (MMTP_payload_data)

現在、情報記録媒体(メディア)に対する記録データとして提案されている一つの構成が、この図9(C)に示すような、TLVパケットの構成要素であるMMTPパケットのみを取り出して、一列に並べて記録する構成である。   At present, one configuration proposed as recording data for an information recording medium (media) is to extract only MMTP packets, which are components of a TLV packet, as shown in FIG. It is a configuration to do.

図10は、BDやフラッシュメモリ、あるいはHDD(ハードディスク)等の記録メディアに、MMTP(MMT Protocol)パケットではなく、MMTPパケットを格納した上位のTLVパケットのパケット列を記録する処理例を説明する図である。   FIG. 10 is a view for explaining an example of processing for recording not a MMTP (MMT Protocol) packet but a packet sequence of a higher-order TLV packet storing an MMTP packet on a recording medium such as a BD, a flash memory, or an HDD (hard disk). It is.

図10には、図9と同様、以下の3つのデータを示している。
(A)放送配信データであるTLVパケット列
(B)受信再生データとして処理される1つのTLVパケット
(C)メディア記録用データの構成として提案されているTLVパケット列
FIG. 10 shows the following three data as in FIG.
(A) TLV packet sequence as broadcast distribution data (B) One TLV packet processed as received and reproduced data (C) TLV packet sequence proposed as a configuration of media recording data

(A),(B)は、図9を参照して説明したと同様のデータである。
(C)メディア記録用データの構成として示すTLVパケット列は、現在、メディアに対する記録データとして提案されているもう1つの例であるTLVパケット列である。
メディアに記録されるTLVパケットは、図10(B)との対応関係を示す点線から理解されるように、MMTPパケットを含むTLVパケットであり、以下の要素から構成される。
(a)TLVパケットヘッダ(TLV_header)
(b)TLVパケットデータ(TLV_data)(=ペイロード)
(A) and (B) are the same data as described with reference to FIG.
(C) The TLV packet sequence shown as the configuration of media recording data is another example of a TLV packet sequence that is currently proposed as recording data for media.
The TLV packet recorded on the medium is a TLV packet including an MMTP packet, as can be understood from the dotted line indicating the correspondence with FIG. 10B, and includes the following elements.
(A) TLV packet header (TLV_header)
(B) TLV packet data (TLV_data) (= payload)

このように、BD等のメディアに対するMMTフォーマットデータの記録態様として、
図9を参照して説明したMMTP(MMT Protocol)パケットのパケット列、あるいは、
図10を参照して説明したTLV(Type Length Value)パケットのパケット列、
これらいずれかのパケット列として記録することが想定される。
Thus, as a recording mode of the MMT format data on a medium such as a BD,
The packet sequence of the MMTP (MMT Protocol) packet described with reference to FIG.
A packet sequence of a TLV (Type Length Value) packet described with reference to FIG.
It is assumed that the packet is recorded as one of these packet sequences.

図9、または図10に示すような設定でMMTフォーマットデータをメディアに記録して、MMTフォーマットデータの再生処理をBDAVフォーマット対応の再生アプリケーションを利用して行う場合、BDAVフォーマット対応の再生制御情報ファイル、すなわち、プレイリストファイルやクリップ情報ファイルを利用して再生を行うことになる。
なお、BDAVフォーマットはデータ記録フォーマットであるとともにデータ記録再生アプリケーション規格にも対応しており、BDAVフォーマットに従ってメディアに記録されたデータの再生は、BDAVフォーマット対応の再生アプリケーションを利用して実行される。
When the MMT format data is recorded on the medium with the settings shown in FIG. 9 or FIG. 10 and the reproduction process of the MMT format data is performed using a BDAV format compatible playback application, a BDAV format compatible playback control information file That is, the reproduction is performed using the playlist file and the clip information file.
The BDAV format is a data recording format and also complies with a data recording / reproducing application standard. Reproduction of data recorded on a medium according to the BDAV format is executed using a BDAV format-compatible reproducing application.

BDAVフォーマットは、再生制御情報ファイルであるプレイリストファイルやクリップ情報ファイル等のBDAVフォーマット固有のデータベースファイルを規定しており、BDAV対応再生アプリケーションはこれらの再生制御情報ファイル(データベースファイル)の記録情報を利用してデータ再生処理を実行する。   The BDAV format defines a database file specific to the BDAV format, such as a playlist file and a clip information file, which are playback control information files, and a BDAV-compatible playback application stores recording information of these playback control information files (database files). The data reproduction process is executed using the data.

前述したように、BDAVフォーマット規定のプレイリストファイルやクリップ情報ファイル等のデータベースファイルは、もともと、MPEG−2TSフォーマットの配信データに基づいて生成可能なファイルとして規定されたものである。
従って、MPEG−2TSフォーマットとはフォーマットの異なるMMTフォーマットに従った配信データは、現行のBDAVフォーマット規定のプレイリストファイルやクリップ情報ファイルにそのまま記録しても、現行のBDAV対応再生アプリケーションが利用できないデータとなる場合がある。
As described above, the database files such as the playlist file and the clip information file in the BDAV format are originally defined as files that can be generated based on the distribution data in the MPEG-2TS format.
Therefore, even if the distribution data according to the MMT format different from the MPEG-2TS format is recorded as it is in a playlist file or a clip information file specified by the current BDAV format, the data cannot be used by the current BDAV compatible playback application. It may be.

MMTフォーマットデータをメディアに記録し、BDAVフォーマット対応アプリを利用してコンテンツ再生を行うことを可能とするためには、メディアに対するMMTフォーマットデータの記録処理に際して、MMTフォーマットデータ対応のプレイリストファイルやクリップ情報ファイルを生成してメディアに記録することが必要となる。
また、メディアに記録されたMMTフォーマットデータの再生時には、MMTフォーマットデータ対応のプレイリストファイルやクリップ情報ファイルを利用して再生を行うことが必要となる。
In order to record MMT format data on a medium and enable content playback using a BDAV format compatible application, a playlist file or clip compatible with the MMT format data must be recorded when the MMT format data is recorded on the medium. It is necessary to generate an information file and record it on a medium.
When reproducing MMT format data recorded on a medium, it is necessary to perform reproduction using a playlist file and a clip information file compatible with the MMT format data.

具体的には、図11に示すように、MMTフォーマットデータ格納クリップAVストリームファイル51対応のクリップ情報ファイル(nnnnn.clpi)52と、プレイリストファイル(nnnnn.rpls)53を生成して、メディア(BD,フラッシュメモリ,HDD等)に記録して再生に利用する処理が必要となる。   Specifically, as shown in FIG. 11, a clip information file (nnnnnn.clpi) 52 corresponding to the clip AV stream file 51 storing the MMT format data and a playlist file (nnnnnn.rpls) 53 are generated, and the media ( (BD, flash memory, HDD, etc.) and use it for reproduction.

メディアに記録されたMMTフォーマットデータ格納クリップAVストリームファイル51を再生する場合には、このMMTフォーマットデータ格納クリップAVストリームファイル51対応のクリップ情報ファイル(nnnnn.clpi)52と、プレイリストファイル(nnnnn.rpls)53を利用して再生処理を行うことができる。   When reproducing the clip AV stream file 51 storing the MMT format data recorded on the medium, the clip information file (nnnnnn.clpi) 52 corresponding to the clip AV stream file 51 storing the MMT format data and the playlist file (nnnn. rpls) 53 to perform the reproduction process.

しかし、前述したように、放送局の配信データであるMMTフォーマットに従って配信されるデータは、BDAVフォーマットで規定するプレイリストファイルやクリップ情報ファイルの記録用データを全て含むようには構成されていない。
また、MMTフォーマットデータ格納クリップAVストリームファイル51は、MPEG−2TSフォーマットデータとは異なるデータ形式となり、MPEG−2TSフォーマットデータ対応のプレイリストファイルやクリップ情報ファイルと同一形式のデータを持つプレイリストファイルやクリップ情報ファイルを利用しても、正しい再生処理は実行できないという問題がある。
However, as described above, data distributed according to the MMT format, which is distribution data of a broadcasting station, is not configured to include all recording data of a playlist file and a clip information file defined in the BDAV format.
Further, the clip AV stream file 51 storing the MMT format data has a data format different from that of the MPEG-2TS format data, and a playlist file having the same format as the playlist file and the clip information file corresponding to the MPEG-2TS format data. Even if a clip information file is used, there is a problem that correct reproduction processing cannot be executed.

従って、このMMTフォーマットデータをメディアに記録して、BDAVフォーマット対応アプリを利用してコンテンツ再生を行うためには、MMTフォーマットデータ格納クリップAVストリームファイル51の再生制御を行うことができるMMTフォーマットデータ固有のデータ形式を持つプレイリストファイルやクリップ情報ファイルを生成してメディアに記録することが必要となる。   Therefore, in order to record the MMT format data on a medium and play back the content by using the BDAV format compatible application, it is necessary to control the playback of the clip AV stream file 51 storing the MMT format data. It is necessary to generate a playlist file or a clip information file having the data format described above and record it on a medium.

[5.MMTフォーマットに従った音声データについて]
先に図9、図10を参照して説明したように、放送局から配信されるMMTフォーマットデータを、BDAVフォーマット、またはSPAVフォーマットデータとしてBD等のメディアに記録する場合、画像、音声、字幕等の再生データや、制御情報(SI)等のデータは、例えばMMTPパケット列またはTLVパケット列として記録される。
これらのパケット列は、BDAVフォーマットやSPAVフォーマットに規定されるクリップAVストリームファイルとして記録される。
[5. Audio data according to MMT format]
As described above with reference to FIGS. 9 and 10, when recording MMT format data distributed from a broadcasting station as BDAV format or SPAV format data on a medium such as a BD, images, audio, subtitles, etc. , And data such as control information (SI) are recorded as, for example, an MMTP packet sequence or a TLV packet sequence.
These packet sequences are recorded as clip AV stream files defined in the BDAV format or SPAV format.

また、図11を参照して説明したように、メディアに記録されたMMTフォーマットデータを格納したMMTPパケット列またはTLVパケット列からなるクリップAVストリームファイル51内の再生データを再生する場合には、このMMTフォーマットデータ格納クリップAVストリームファイル51対応のクリップ情報ファイル(nnnnn.clpi)52と、プレイリストファイル(nnnnn.rpls)53を利用して再生処理を行うことが必要となる。   Also, as described with reference to FIG. 11, when reproducing the reproduction data in the clip AV stream file 51 composed of the MMTP packet sequence or the TLV packet sequence storing the MMT format data recorded on the medium, It is necessary to perform a playback process using a clip information file (nnnn.clpi) 52 corresponding to the clip AV stream file 51 storing the MMT format data and a playlist file (nnnn.rpls) 53.

しかし、現行のBDAVフォーマットやSPAVフォーマットにおいて規定されているクリップ情報ファイルや、プレイリストファイルは、本来、MEG−2TSフォーマットデータに対応する再生制御情報として規定されたものであり、MMTフォーマットデータに対する再生制御情報として、そのまま利用することはできない。
従って、MMTフォーマットデータをメディアに記録して、BDAVフォーマット対応アプリを利用してコンテンツ再生を行うためには、BDAVフォーマットの規定するプレイリストファイルやクリップ情報ファイルを生成してメディアに記録する処理が必要となる。
However, the clip information file and the playlist file defined in the current BDAV format and SPAV format are originally defined as playback control information corresponding to the MEG-2TS format data. It cannot be used as it is as control information.
Therefore, in order to record the MMT format data on the medium and play back the content using the application compatible with the BDAV format, a process of generating a playlist file or a clip information file defined by the BDAV format and recording the generated file on the medium is required. Required.

先に図2を参照して説明したように、例えば放送局から配信されるMMTフォーマット音声データには、例えば、以下の2つの異なる音声符号化規格に従ったデータが含まれる。
(1)MPEG4 AAC LC(Advanced Audio Coding Low Complexity)に従った符号化音声データ、
(2)MPEG4 ALS(Audio Losless Coding)に従った符号化音声データ、
放送局から配信される音声データは、上記の2つの異なる音声符号化規格に従ったデータの少なくともいずれかである。
As described above with reference to FIG. 2, for example, the MMT format audio data distributed from a broadcast station includes, for example, data according to the following two different audio coding standards.
(1) encoded audio data according to MPEG4 AAC LC (Advanced Audio Coding Low Complexity);
(2) encoded audio data according to MPEG4 ALS (Audio Loss Coding);
The audio data distributed from the broadcasting station is at least one of the data according to the two different audio coding standards.

MPEG4 AAC LCは、MPEG2 AACをベースとした改良された符号化フォーマットであり、符号化遅延低減、低ビットレート符号化、ビットレート拡張性などを実現した音声符号化フォーマットである。
一方、MPEG4 ALSは、データロスを発生させることのないロスレス圧縮方式(可逆圧縮)を適用した音声符号化フォーマットであり、高音質な音声データの再生を可能としている。
MPEG4 AAC LC is an improved encoding format based on MPEG2 AAC, and is an audio encoding format that achieves encoding delay reduction, low bit rate encoding, bit rate expandability, and the like.
On the other hand, MPEG4 ALS is an audio encoding format to which a lossless compression method (lossless compression) that does not cause data loss is applied, and enables reproduction of high-quality audio data.

なお、MMTフォーマットにおいて配信される上記の2種類の符号化音声データは、
(LATM/LOAS)ストリーム形式で配信される。
LATM(Low Overhead Audio Transport Multoplex)は多重化処理の規定(ISO/IEC14496−3)であり、
LOAS(Low Overhead Audio Stream)は、転送方式の規定(ISO/IEC14496−3)である。
The above two types of encoded audio data distributed in the MMT format are:
(LATM / LOAS) is distributed in a stream format.
LATM (Low Overhead Audio Transport Multiplex) is a specification of multiplexing processing (ISO / IEC14496-3),
LOAS (Low Overhead Audio Stream) is a specification (ISO / IEC14496-3) of a transfer method.

すなわち、MMTフォーマットにおいて配信される音声符号化データストリームは、
(1)MPEG4 AAC LC(LATM/LOAS)
(2)MPEG4 ALS(LATM/LOAS)
上記2つのストリームのいずれかである。
That is, the audio encoded data stream delivered in the MMT format is
(1) MPEG4 AAC LC (LATM / LOAS)
(2) MPEG4 ALS (LATM / LOAS)
One of the above two streams.

なお、1つの番組について、いずれか一方の音声データのみを配信する設定、すなわち、
MPEG4 AAC LC、またはMPEG4 ALSのいずれかを配信する設定と、
MPEG4 AAC LCと、MPEG4 ALS、これら2つの音声データを配信し、受信側において選択可能とした設定が可能である。
In addition, for one program, a setting for distributing only one of the audio data, that is,
A setting to deliver either MPEG4 AAC LC or MPEG4 ALS,
MPEG4 AAC LC, MPEG4 ALS, and these two types of audio data are distributed, and a setting that can be selected on the receiving side is possible.

例えば放送局等の送信装置は、先に図3を参照して説明したようにMMTPパケットおよびTLVパケットに音声データを格納して配信する。
パケットに格納された音声データが、上記のAAC LC符号化音声データであるか、ALS符号化音声データであるかについては、例えば、音声データを格納したパケット内の属性データ記録領域や、MMTフォーマット対応の制御情報(SI)であるMMTパッケージテーブル(MPT)等に記録されている。
For example, a transmission device such as a broadcasting station stores and distributes audio data in MMTP packets and TLV packets as described above with reference to FIG.
Whether the audio data stored in the packet is the AAC LC encoded audio data or the ALS encoded audio data is determined by, for example, an attribute data recording area in the packet storing the audio data, an MMT format, or the like. The corresponding control information (SI) is recorded in an MMT package table (MPT) or the like.

放送波を受信して再生を行うテレビ等の受信装置は、これらのパケット内記録データや、MMTパッケージテーブル(MPT)を参照して、再生対象データが、AAC LC符号化音声データであるか、ALS符号化音声データであるかを判別して、判別結果に応じた復号処理を行うことができる。   A receiving device such as a television that receives and reproduces a broadcast wave, such as a television, refers to the recorded data in the packet and the MMT package table (MPT) to determine whether the data to be reproduced is AAC LC encoded audio data, It is possible to determine whether the data is ALS-encoded audio data, and perform a decoding process according to the determination result.

放送局等から配信されるMMTフォーマットデータを、BDAVフォーマット、またはSPAVフォーマットデータとしてBD等のメディアに記録する場合、画像、音声、字幕等の再生データや、制御情報(SI)等のデータは、MMTPパケット列またはTLVパケット列として記録される。
これらのパケット列は、BDAVフォーマットやSPAVフォーマットに規定されるクリップAVストリームファイルとして記録される。
When MMT format data distributed from a broadcast station or the like is recorded on a medium such as a BD as BDAV format or SPAV format data, reproduction data such as images, sounds, subtitles, and data such as control information (SI) include: It is recorded as an MMTP packet sequence or a TLV packet sequence.
These packet sequences are recorded as clip AV stream files defined in the BDAV format or SPAV format.

メディアから記録データの再生を行う情報処理装置(再生装置)のデータ再生手順は、先に図4、図5を参照して説明したように、以下の手順に従ったものとなる。
(a)まず、再生アプリケーションによって管理情報ファイルから特定のプレイリストを指定する。
(b)選択されたプレイリストに規定されたクリップ情報ファイルを選択し、クリップ情報ファイルの記録データに従って、クリップAVストリームファイルから、画像、音声等の再生データであるAVストリームあるいはコマンドを読み出して、AVストリームの再生や、コマンドの実行処理を開始する。
The data reproducing procedure of the information processing apparatus (reproducing apparatus) for reproducing recorded data from the medium follows the following procedure as described above with reference to FIGS.
(A) First, a specific playlist is specified from the management information file by the reproduction application.
(B) A clip information file specified in the selected playlist is selected, and an AV stream or a command, which is playback data such as an image and a sound, is read from the clip AV stream file according to the recording data of the clip information file, The reproduction of the AV stream and the execution of the command are started.

しかし、現行のBDAVフォーマットやSPAVフォーマット規定のプレイリストファイルや、クリップ情報ファイルには、上述したMMTフォーマット対応の2つの異なる音声符号化データ(MPEG4 AAC LCと、MPEG4 ALS)を識別する情報が記録されていない。   However, information for identifying the two different audio encoded data (MPEG4 AAC LC and MPEG4 ALS) corresponding to the above-mentioned MMT format is recorded in the playlist file or clip information file of the current BDAV format or SPAV format. It has not been.

従って、再生装置は、クリップAVストリームファイルから音声データ格納パケットを取得して、取得したパケットのパケット内記録データを参照するか、あるいは、クリップAVストリームファイル中に記録された制御情報(SI)としてのMMTパッケージテーブル(MPT)を参照しなければ、パケット内の音声データが、
(1)MPEG4 AAC LC符号化音声データであるか、
(2)MPEG4 ALS符号化音声データであるか、
上記のいずれの音声データであるかを確認することができない。
Therefore, the playback device acquires the audio data storage packet from the clip AV stream file and refers to the recording data in the acquired packet, or as the control information (SI) recorded in the clip AV stream file. If the audio data in the packet is not referred to the MMT package table (MPT) of
(1) Whether the data is MPEG4 AAC LC encoded audio data,
(2) Whether the data is MPEG4 ALS encoded audio data,
It is not possible to confirm which of the above audio data is.

これら2つの異なる音声符号化データの復号処理は、異なる処理として実行することが必要である。すなわち各音声符号化対応のコーデックを適用した復号を行うことが必要となる。
従って、メディアに記録された音声データの再生を行う場合、音声データ格納パケットのパケット内記録データ、あるいは、MMTパッケージテーブル(MPT)を参照しなければ、どのコーデックを適用すべきかを決定できなくなり、再生処理開始までの遅延が大きくなるという問題がある。
The decoding processing of these two different audio encoded data needs to be executed as different processing. That is, it is necessary to perform decoding using a codec corresponding to each audio encoding.
Therefore, when reproducing the audio data recorded on the medium, it is not possible to determine which codec to apply without referring to the recording data in the packet of the audio data storage packet or the MMT package table (MPT), There is a problem that the delay until the start of the reproduction process increases.

また、前述したように、1つの番組コンテンツに対する音声データとして、MPEG4 AAC LCと、MPEG4 ALS、これら2つの音声データが配信されることがある。
これら2種類の音声データをメディアに記録した場合、メディアからのコンテンツ再生開始前に、ユーザ(視聴者)に再生対象とする音声を選択させるといった処理を行うことが想定される。
Further, as described above, MPEG2 AAC LC and MPEG4 ALS may be distributed as audio data for one program content.
When these two types of audio data are recorded on a medium, it is assumed that a process of allowing the user (viewer) to select the audio to be reproduced before starting the reproduction of the content from the medium.

しかし、このような処理を行う場合にも、クリップAVストリームファイルから音声データ格納パケットを取得して、取得した音声データ格納パケットのパケット内記録データを参照するか、あるいは、クリップAVストリームファイル中に記録された制御情報(SI)であるMMTパッケージテーブル(MPT)を参照しなければ、2種類の音声データが記録されていることを確認することができない。
このような処理には多大な処理時間が必要となるという問題が発生する。
However, even when such processing is performed, the audio data storage packet is acquired from the clip AV stream file and the recording data in the packet of the acquired audio data storage packet is referred to, or the audio data storage packet is included in the clip AV stream file. Unless the MMT package table (MPT) which is the recorded control information (SI) is referred to, it cannot be confirmed that two types of audio data are recorded.
There is a problem that such processing requires a great deal of processing time.

[6.クリップ情報ファイルに対する音声識別情報の記録例について]
以下、上述した問題点を解決する一構成例として、クリップ情報ファイルに音声識別情報を記録した例についてに説明する。
[6. Recording example of audio identification information for clip information file]
Hereinafter, an example in which audio identification information is recorded in a clip information file will be described as one configuration example that solves the above-described problem.

以下において説明する構成は、
BD等のメディアに記録したクリップAVストリームファイルがMMTフォーマットである場合、そのクリップAVストリームファイルの再生制御情報ファイルであるクリップ情報ファイルに、このクリップ情報ファイルを適用した再生対象音声データが、
(1)MPEG4 AAC LC符号化音声データであるか、
(2)MPEG4 ALS符号化音声データであるか、
上記のいずれの音声データであるかを識別可能とした音声識別情報を記録した構成である。
The configuration described below is
When a clip AV stream file recorded on a medium such as a BD is in the MMT format, audio data to be reproduced to which the clip information file is applied is added to a clip information file that is a reproduction control information file of the clip AV stream file.
(1) Whether the data is MPEG4 AAC LC encoded audio data,
(2) Whether the data is MPEG4 ALS encoded audio data,
This is a configuration in which audio identification information that enables identification of any of the above audio data is recorded.

まず、図12を参照してクリップ情報ファイルのデータ構成(シンタクス)について説明する。
先に説明したように、クリップ情報ファイルには、そのクリップ情報ファイルを適用して再生するデータに関する情報が記録される。具体的には、例えば、クリップAVストリームファイルの再生位置情報等を有する。
First, the data configuration (syntax) of the clip information file will be described with reference to FIG.
As described above, information on data to be reproduced by applying the clip information file is recorded in the clip information file. Specifically, for example, it has playback position information of a clip AV stream file.

図12は、1つのクリップ情報ファイルのデータ構成(シンタクス)を示す図である。
クリップ情報ファイルには、クリップ情報に対応付けられた再生データに関する情報が記録される。図12に示すように、例えば、以下の各情報が記録される。
クリップ情報[ClipInfo()]101、
シーケンス情報[SequenceInfo()]102、
プログラム情報[ProgramInfo()]103、
FIG. 12 is a diagram showing the data configuration (syntax) of one clip information file.
In the clip information file, information on reproduction data associated with the clip information is recorded. As shown in FIG. 12, for example, the following information is recorded.
Clip information [ClipInfo ()] 101,
Sequence information [SequenceInfo ()] 102,
Program information [ProgramInfo ()] 103,

クリップ情報[ClipInfo()]101には、クリップ情報ファイルに対応するAVストリームファイルの属性情報を記録する。
シーケンス情報[SequenceInfo()]102には、このクリップ情報ファイルに対応するAVストリームファイルに格納された再生対象データの再生シーケンスに関する情報を記録する。
In the clip information [ClipInfo ()] 101, attribute information of the AV stream file corresponding to the clip information file is recorded.
In the sequence information [SequenceInfo ()] 102, information on the reproduction sequence of the reproduction target data stored in the AV stream file corresponding to this clip information file is recorded.

プログラム情報[ProgramInfo()]103には、クリップ情報ファイルによって再生されるクリップAVストリームの再生区間や時間区間の定義情報等を含むプログラム(program_sequence)に関する情報を記録する。
プログラム情報[ProgramInfo()]103の記録情報の詳細について、図13以下を参照して説明する。
The program information [ProgramInfo ()] 103 records information on a program (program_sequence) including definition information of a playback section and a time section of a clip AV stream played by the clip information file.
Details of the recording information of the program information [ProgramInfo ()] 103 will be described with reference to FIG.

図13は、プログラム情報[ProgramInfo()]のデータ構成(シンタクス)を示す図である。
プログラム情報[ProgramInfo()]に記録される主なデータについて説明する。
FIG. 13 is a diagram illustrating a data configuration (syntax) of the program information [ProgramInfo ()].
Main data recorded in the program information [ProgramInfo ()] will be described.

(a)プログラムシーケンス数[num_of_program_sequences]111には、クリップ情報ファイルに含まれるプログラムシーケンス(program_sequence)の数が記録される。
(b)SPNプログラムシーケンス開始アドレス[SPN_program_sequence_start[i]]112には、AVストリームファイル上でプログラムシーケンスが開始する場所の相対アドレスが記録される。
(c)プログラムマップPID[program_map_PID[i]]113には、プログラムシーケンス(program_sequence)のマップが格納されているパケットの識別子(PID)が記録される。
(A) The number of program sequences [num_of_program_sequences] 111 records the number of program sequences (program_sequence) included in the clip information file.
(B) SPN program sequence start address [SPN_program_sequence_start [i]] 112 records the relative address of the place where the program sequence starts on the AV stream file.
(C) The program map PID [program_map_PID [i]] 113 records an identifier (PID) of a packet in which a map of the program sequence (program_sequence) is stored.

(d)ストリームPID[stream_PID]114には、このクリップ情報ファイルのプログラムシーケンスに従って再生されるストリームが格納されているパケットの識別子(PID)が記録される。
(e)ストリームコーディング情報[StreamCodingInfo]115には、再生対象ストリームのコーディング(符号化)情報が記録される。
(D) In the stream PID [stream_PID] 114, an identifier (PID) of a packet storing a stream reproduced according to the program sequence of the clip information file is recorded.
(E) Stream coding information [StreamCodingInfo] 115 records coding (encoding) information of the stream to be reproduced.

このように、クリップ情報ファイルには、再生対象として関連付けられたクリップAVストリームファイル格納データの再生に必要な様々な情報が記録される。   As described above, in the clip information file, various information necessary for reproducing the data stored in the clip AV stream file associated with the reproduction target is recorded.

図14は、クリップ情報ファイルのプログラム情報[ProgramInfo()]記録領域内に設定されるストリームコーディング情報[StreamCodingInfo]のデータ構成(シンタクス)を示す図である。
ストリームコーディング情報[StreamCodingInfo]には、以下のデータが記録される。
(1)画像ストリームコーディング情報121、
(2)音声ストリームコーディング情報122、
FIG. 14 is a diagram showing the data configuration (syntax) of stream coding information [StreamCodingInfo] set in the program information [ProgramInfo ()] recording area of the clip information file.
The following data is recorded in the stream coding information [StreamCodingInfo].
(1) Image stream coding information 121,
(2) audio stream coding information 122;

なお、情報記録媒体(メディア)に記録される画像ストリームや、音声ストリームの符号化態様(コーディングタイプ(stream_coding_type))は、様々なタイプが許容されており、画像、音声とも各コーディングタイプに応じた識別子が予め規定されている。
画像は、コーディングタイプ(符号化タイプ)に応じて、例えば、タイプ識別子=0x01,0x02、0x1B等が対応付けられている。
音声は、コーディングタイプ(符号化タイプ)に応じてタイプ識別子=0x03、0x04、0x0F、0x80,0x81等が対応付けられている。
Note that various types of encoding modes (coding types (stream_coding_type)) of an image stream and an audio stream recorded on an information recording medium (media) are allowed, and both the image and the audio correspond to each coding type. An identifier is defined in advance.
The images are associated with, for example, type identifiers 0x01, 0x02, 0x1B, etc., according to the coding type (encoding type).
The audio is associated with type identifiers 0x03, 0x04, 0x0F, 0x80, 0x81, etc. according to the coding type (encoding type).

例えば、
コーディングタイプ0x01はMPEG−1画像ストリーム、
0x02はMPEG−2画像ストリーム、
0x03はMPEG−1音声ストリーム、
これらの設定である。
For example,
Coding type 0x01 is an MPEG-1 image stream,
0x02 is an MPEG-2 image stream,
0x03 is an MPEG-1 audio stream,
These are the settings.

なお、MMTフォーマットでは、現行のBDAVフォーマットでは規定されていない画像符号化タイプであるHEVC符号化が用いられる。
この新たな符号化タイプについても新たに符号化タイプ識別子を割り振ることになる。
In the MMT format, HEVC encoding, which is an image encoding type not defined in the current BDAV format, is used.
A new coding type identifier is also assigned to this new coding type.

同様に、音声データについても、MMTフォーマットでは、現行のBDAVフォーマットでは規定されていない音声符号化データが用いられる。
すなわち、
(1)MPEG4 AAC LC符号化音声データ、
(2)MPEG4 ALS符号化音声データ、
これらの符号化音声データが利用される。
Similarly, for audio data, in the MMT format, audio encoded data that is not specified in the current BDAV format is used.
That is,
(1) MPEG4 AAC LC encoded audio data,
(2) MPEG4 ALS encoded audio data,
These encoded audio data are used.

しかし、これら2種類の符号化音声データに対するコーディングタイプ識別子(stream_coding_type)は、MPEG2規格であるISO13818−1では同じ、すなわち、いずれも同じ識別子の設定となっている。
具体的には、ISO13818−1では、ISO/IEC14496−3に規定する多重化処理として、前述のLATM(Low Overhead Audio Transport Multoplex)を適用している符号化音声データについて、すべて、コーディングタイプ=0x11を設定している。
However, the coding type identifier (stream_coding_type) for these two types of coded audio data is the same in ISO13818-1, which is the MPEG2 standard, that is, both have the same identifier setting.
Specifically, according to ISO13818-1, coding type = 0x11 is applied to all coded audio data to which the above-described LATM (Low Overhead Audio Transport Multiplex) is applied as multiplexing processing specified in ISO / IEC14496-3. Is set.

MMTフォーマットにおいて配信される音声符号化データである、
(1)MPEG4 AAC LC(LATM/LOAS)
(2)MPEG4 ALS(LATM/LOAS)
上記2つの音声符号化データは、いずれも多重化処理として、LATM(Low Overhead Audio Transport Multoplex)を適用している符号化音声データであり、同じ識別子[0x11]が設定される。
Speech encoded data delivered in the MMT format.
(1) MPEG4 AAC LC (LATM / LOAS)
(2) MPEG4 ALS (LATM / LOAS)
Both of the two encoded audio data are encoded audio data to which LATM (Low Overhead Audio Transport Multiplex) is applied as a multiplexing process, and the same identifier [0x11] is set.

従って、BDAVフォーマットデータを再生する再生装置は、メディアに記録されたクリップ情報ファイルに記録されたコーディングタイプ(stream_coding_type)として、
[0x11]が設定されていた場合、この音声データが、
(1)MPEG4 AAC LC符号化音声データ、
(2)MPEG4 ALS符号化音声データ、
これら2種類のどちらかであるとの判断はできるが、
これら2種類のどちらの符号化音声データであるかについては識別することができない。
Therefore, a playback apparatus that plays back BDAV format data uses a coding type (stream_coding_type) recorded in a clip information file recorded on a medium as a coding type (stream_coding_type).
If [0x11] is set, this audio data
(1) MPEG4 AAC LC encoded audio data,
(2) MPEG4 ALS encoded audio data,
You can judge that it is one of these two types,
It is not possible to identify which of these two types of encoded audio data is the encoded audio data.

図14に示すように、現行のクリップ情報ファイルのプログラム情報[ProgramInfo()]記録領域内に設定される音声ストリームコーディング情報122には、以下の各情報が記録される。
(2a)音声タイプ(audio_presentation_type)131
(2b)サンプリング周波数(sampling_frequency)132
As shown in FIG. 14, the following information is recorded in the audio stream coding information 122 set in the program information [ProgramInfo ()] recording area of the current clip information file.
(2a) Audio type (audio_presentation_type) 131
(2b) Sampling frequency (sampling_frequency) 132

これらの各データの記録例について、図15を参照して説明する。
図15(a)音声タイプ記録データは、ビット値0〜15に対して、モノチャネル、ステレオ、サラウンド等の様々な音声タイプ情報を識別可能なデータ設定となっている。
図15(b)サンプリング周波数は、ビット値0〜15に対して、48〜192kHzの各サンプリング周波数を識別可能なデータ設定となっている。
これらの音声データ形式については、MMTフォーマットに従った配信データも現行のBDAVフォーマットにおける定義データの範囲内であり、特に変更を要しない。
A recording example of each of these data will be described with reference to FIG.
In FIG. 15A, the audio type recording data is set so that various audio type information such as mono channel, stereo, and surround can be identified for bit values 0 to 15.
FIG. 15B is a data setting in which the sampling frequency of 48 to 192 kHz can be identified for the bit values 0 to 15.
With respect to these audio data formats, the distribution data according to the MMT format is also within the range of the definition data in the current BDAV format, and does not require any particular change.

しかし、これらの各データのみでは、コーディングタイプ(stream_coding_type)として、[0x11]が設定されている音声データが、
(1)MPEG4 AAC LC符号化音声データ、
(2)MPEG4 ALS符号化音声データ、
これら2種類のどちらの符号化音声データであるかについては識別することができない。
However, with only each of these data, audio data for which [0x11] is set as the coding type (stream_coding_type) is:
(1) MPEG4 AAC LC encoded audio data,
(2) MPEG4 ALS encoded audio data,
It is not possible to identify which of these two types of encoded audio data is the encoded audio data.

以下、上記問題を解決する新たなクリップ情報ファイルの構成例について説明する。
以下に示す2つの実施例について、順次、説明する。
(実施例1)音声データ格納パケットから音声識別情報を取得する実施例
(実施例2)MMTパッケージテーブル(MPT)から音声識別情報を取得する実施例
Hereinafter, a configuration example of a new clip information file that solves the above problem will be described.
The following two embodiments will be sequentially described.
(Embodiment 1) Embodiment in which voice identification information is obtained from a voice data storage packet (Example 2) Embodiment in which voice identification information is obtained from an MMT package table (MPT)

[6−1.(実施例1)音声データ格納パケットに記録された音声識別情報を取得してクリップ情報ファイルに記録する実施例]
まず、実施例1として、音声データ格納パケットに記録された音声識別情報を取得してクリップ情報ファイルに記録する実施例について説明する。
[6-1. (Example 1) Example in which audio identification information recorded in an audio data storage packet is acquired and recorded in a clip information file]
First, as Embodiment 1, an embodiment in which audio identification information recorded in an audio data storage packet is acquired and recorded in a clip information file will be described.

すなわち、音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これら2種類の音声データのいずれであるかを示す識別情報を音声データ格納パケットから取得してクリップ情報ファイルに記録する実施例について説明する。
That is, the audio data is
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(2) MPEG4 ALS (LATM / LOAS) encoded audio data,
An embodiment in which identification information indicating which of these two types of audio data is obtained from the audio data storage packet and recorded in the clip information file will be described.

図16は、実施例1に従ったクリップ情報ファイルのプログラム情報[ProgramInfo()]のストリームコーディング情報[StreamCodingInfo]のデータ構成(シンタクス)を示す図である。   FIG. 16 is a diagram illustrating a data configuration (syntax) of stream coding information [StreamCodingInfo] of program information [ProgramInfo ()] of a clip information file according to the first embodiment.

図16に示すストリームコーディング情報[StreamCodingInfo]は、このクリップ情報ファイルの制御対象となる音声データが、
(1)MPEG4 AAC LC符号化音声データ、
(2)MPEG4 ALS符号化音声データ、
これら2種類のどちらの符号化音声データであるかについて識別可能とした構成を有する。
The stream coding information [StreamCodingInfo] shown in FIG. 16 includes audio data to be controlled by the clip information file.
(1) MPEG4 AAC LC encoded audio data,
(2) MPEG4 ALS encoded audio data,
It has a configuration in which one of these two types of encoded audio data can be identified.

図16に示すストリームコーディング情報[StreamCodingInfo]は、先に図14を参照して説明したと同様、以下のデータが記録される。
(1)画像ストリームコーディング情報121、
(2)音声ストリームコーディング情報122、
In the stream coding information [StreamCodingInfo] shown in FIG. 16, the following data is recorded in the same manner as described above with reference to FIG.
(1) Image stream coding information 121,
(2) audio stream coding information 122;

図16に示すストリームコーディング情報[StreamCodingInfo]には、
コーディングタイプ(stream_coding_type)=[0x11]
上記コーディングタイプ[0x11]の音声データ属性情報記録領域130が設定されている。
The stream coding information [StreamCodingInfo] shown in FIG.
Coding type (stream_coding_type) = [0x11]
The audio data attribute information recording area 130 of the coding type [0x11] is set.

なお、前述したように、コーディングタイプ=[0x11]は、
(1)MPEG4 AAC LC符号化音声データ、
(2)MPEG4 ALS符号化音声データ、
これら2種類の符号化音声データの双方に対応付けられるタイプ識別子であり、このタイプ識別子[0x11]のみでは、上記(1),(2)どちらの符号化音声データであるかについては識別することができない。
As described above, coding type = [0x11]
(1) MPEG4 AAC LC encoded audio data,
(2) MPEG4 ALS encoded audio data,
This type identifier is associated with both of these two types of encoded audio data. With only this type identifier [0x11], it is possible to identify which of the above (1) and (2) the encoded audio data is. Can not.

図16に示すストリームコーディング情報[StreamCodingInfo]のコーディングタイプ[0x11]の音声データ属性情報記録領域130には、以下の各情報が記録される。
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
(c)音声オブジェクトタイプ(audioObjectType)133
The following information is recorded in the audio data attribute information recording area 130 of the coding type [0x11] of the stream coding information [StreamCodingInfo] shown in FIG.
(A) Audio type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
(C) Audio Object Type (audioObjectType) 133

これらのデータ中、以下のデータ(a),(b)、すなわち、
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
これらのデータは、先に、図15を参照して説明したデータと同様のデータである。
Among these data, the following data (a) and (b):
(A) Audio type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
These data are the same as the data described above with reference to FIG.

なお、放送局等の送信装置から受信するMMTフォーマットデータの場合、これらの情報は、例えばMMTフォーマット対応の制御情報(SI)であるMMTパッケージテーブル(MPT)に記録されている。
BD等のメディアにMMTフォーマットデータを記録する記録装置は、MMTフォーマット対応の制御情報(SI)であるMMTパッケージテーブル(MPT)から、上記(a),(b)の各データを読み取り、クリップ情報ファイルに記録する。
なお、具体的なMMTパッケージテーブル(MPT)の記録データの例については後段で説明する。
In the case of MMT format data received from a transmitting device such as a broadcasting station, such information is recorded in, for example, an MMT package table (MPT) which is control information (SI) corresponding to the MMT format.
A recording device that records MMT format data on a medium such as a BD reads the data (a) and (b) from the MMT package table (MPT), which is control information (SI) corresponding to the MMT format, and outputs clip information. Record to file.
A specific example of recording data of the MMT package table (MPT) will be described later.

これら(a),(b)の音声属性情報、すなわち、
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
これらの音声属性情報は、図14、図15を参照して説明したように、コーディングタイプ[0x11]以外の音声データ、すなわちコーディングタイプ[0x03]〜[0x84]等の音声データに対しても設定されている情報である。
These audio attribute information (a) and (b), that is,
(A) Audio type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
As described with reference to FIGS. 14 and 15, these pieces of audio attribute information are set for audio data other than the coding type [0x11], that is, audio data of the coding types [0x03] to [0x84]. The information that is being done.

図16に示すように、コーディングタイプ[0x11]の音声データについては、さらに、
(c)音声オブジェクトタイプ(audioObjectType)133
上記の音声属性情報を記録する。
As shown in FIG. 16, for audio data of coding type [0x11],
(C) Audio Object Type (audioObjectType) 133
The above audio attribute information is recorded.

この音声オブジェクトタイプ(audioObjectType)133が、
コーディングタイプ=[0x11]に含まれる以下の2種類のデータ、すなわち、
(1)MPEG4 AAC LC符号化音声データ、
(2)MPEG4 ALS符号化音声データ、
これら2種類の符号化音声データの識別子、すなわち音声識別情報として利用される。
This audio object type (audioObjectType) 133 is
The following two types of data included in the coding type = [0x11]:
(1) MPEG4 AAC LC encoded audio data,
(2) MPEG4 ALS encoded audio data,
These two types of encoded audio data are used as identifiers, that is, audio identification information.

音声オブジェクトタイプ(audioObjectType)133の具体的な記録データ例を図17に示す。
音声オブジェクトタイプ(audioObjectType)=2の場合、
このコーディングタイプ=[0x11]の符号化音声データが、
MPEG4 AAC LC(LATM/LOAS)符号化音声データであることを意味する。
FIG. 17 shows a specific example of recorded data of the audio object type (audioObjectType) 133.
If the audio object type (audioObjectType) = 2,
The encoded audio data of this coding type = [0x11]
It means that the audio data is MPEG4 AAC LC (LATM / LOAS) encoded audio data.

一方、
音声オブジェクトタイプ(audioObjectType)=36の場合、
このコーディングタイプ=[0x11]の符号化音声データが、
MPEG4 ALS(LATM/LOAS)符号化音声データであることを意味する。
on the other hand,
If the audio object type (audioObjectType) = 36,
The encoded audio data of this coding type = [0x11]
It means that the data is MPEG4 ALS (LATM / LOAS) encoded audio data.

BD等のメディアに記録されたデータの再生を行う再生装置は、この音声オブジェクトタイプ(audioObjectType)の記録データを参照することで、このクリップ情報ファイルの再生制御対象となる音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれの音声データであるかを識別することが可能となる。
A playback device that plays back data recorded on a medium such as a BD refers to the recorded data of the audio object type (audioObjectType), so that the audio data to be controlled for reproduction of the clip information file is
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(2) MPEG4 ALS (LATM / LOAS) encoded audio data,
It is possible to identify any of these audio data.

なお、放送局等の送信装置から受信するMMTフォーマットデータの場合、この音声オブジェクトタイプ(audioObjectType)情報は、音声データ格納パケット(MMTPパケット/TLVパケット)内に記録されている。
BD等のメディアにMMTフォーマットデータを記録する記録装置は、放送局等の送信装置から受信する音声データ格納パケットから、「音声オブジェクトタイプ(audioObjectType)」を読み取り、クリップ情報ファイルに記録する。
In the case of MMT format data received from a transmitting device such as a broadcasting station, the audio object type (audioObjectType) information is recorded in an audio data storage packet (MMTP packet / TLV packet).
A recording device that records MMT format data on a medium such as a BD reads “audio object type (audioObjectType)” from an audio data storage packet received from a transmission device such as a broadcast station and records the read audio object type in a clip information file.

図18を参照して、放送局等の送信装置が送信するMMTフォーマットに従った音声データ格納パケットのパケット構成例について説明する。
図18には、MMTフォーマットに従った音声データ格納パケット140を示している。
図18に示すように、音声データ格納パケット140のパケット格納データ141は、符号化音声データストリームと、ストリームデータの属性情報によって構成される。
With reference to FIG. 18, a description will be given of an example of a packet configuration of an audio data storage packet conforming to the MMT format transmitted by a transmission device such as a broadcasting station.
FIG. 18 shows an audio data storage packet 140 according to the MMT format.
As shown in FIG. 18, the packet storage data 141 of the audio data storage packet 140 includes an encoded audio data stream and attribute information of the stream data.

なお、音声データ格納パケット140に格納されている符号化音声データストリームは、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれかの音声データである。
Note that the encoded audio data stream stored in the audio data storage packet 140 is
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(2) MPEG4 ALS (LATM / LOAS) encoded audio data,
Any of these audio data.

音声データ格納パケット140には、さらに、パケットに格納された音声データの属性情報が記録される。
図18に示すように、音声データ属性情報の一部として、
音声オブジェクトタイプ(audioObjectType)142が記録される。
The audio data storage packet 140 further records attribute information of the audio data stored in the packet.
As shown in FIG. 18, as a part of the audio data attribute information,
An audio object type (audioObjectType) 142 is recorded.

この音声オブジェクトタイプ(audioObjectType)142の設定値は、以下の設定である。
パケットに格納されたデータが、
MPEG4 AAC LC(LATM/LOAS)符号化音声データである場合、
音声オブジェクトタイプ(audioObjectType)=2に設定される。
一方、パケットに格納されたデータが、
MPEG4 ALS(LATM/LOAS)符号化音声データである場合、
音声オブジェクトタイプ(audioObjectType)=36に設定される。
すなわち、先に図17を参照して説明した設定値である。
The setting values of the audio object type (audioObjectType) 142 are as follows.
The data stored in the packet is
In the case of MPEG4 AAC LC (LATM / LOAS) encoded audio data,
Audio object type (audioObjectType) is set to 2.
On the other hand, the data stored in the packet is
In the case of MPEG4 ALS (LATM / LOAS) encoded audio data,
Audio object type (audioObjectType) is set to 36.
That is, the set value described above with reference to FIG.

放送局等の送信装置から送信されるMMTフォーマットデータを受信して、BD等のメディアにMMTフォーマットデータを記録する記録装置は、放送局等の送信装置から受信する音声データ格納パケットから、「音声オブジェクトタイプ(audioObjectType)」の設定値(2、または36)を読み取り、この設定値を、図16に示すクリップ情報ファイルの、
音声オブジェクトタイプ133記録領域に記録する。
A recording device that receives MMT format data transmitted from a transmission device such as a broadcast station and records the MMT format data on a medium such as a BD transmits a voice data storage packet received from the transmission device such as a broadcast station to “audio data”. The setting value (2 or 36) of the “object type (audioObjectType)” is read, and the setting value is read from the clip information file shown in FIG.
The sound object type 133 is recorded in the recording area.

BD等のメディアに記録されたデータの再生を行う再生装置は、この音声オブジェクトタイプ(audioObjectType)の記録データが「2」か、「36」かを確認することで、このクリップ情報ファイルの再生制御対象となる音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれの音声データであるかを識別することが可能となる。
A playback device that plays back data recorded on a medium such as a BD checks whether the recorded data of the audio object type (audioObjectType) is “2” or “36”, thereby controlling the playback of the clip information file. The target audio data is
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(2) MPEG4 ALS (LATM / LOAS) encoded audio data,
It is possible to identify any of these audio data.

すなわち、クリップ情報ファイルのプログラム情報[ProgramInfo()]記録領域内に設定されるストリームコーディング情報[StreamCodingInfo]におけるコーディングタイプ=[0x11]の音声属性情報記録領域から、音声オブジェクトタイプ(audioObjectType)の設定値を読み取る。   That is, from the audio attribute information recording area of coding type = [0x11] in the stream coding information [StreamCodingInfo] set in the program information [ProgramInfo ()] recording area of the clip information file, the setting value of the audio object type (audioObjectType) Read.

音声オブジェクトタイプ(audioObjectType)=2であれば、
このコーディングタイプ=[0x11]の音声データは、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
であると判定する。
一方、音声オブジェクトタイプ(audioObjectType)=36であれば、
このコーディングタイプ=[0x11]の音声データは、
(1)MPEG4 ALS(LATM/LOAS)符号化音声データ、
であると判定する。
再生装置は、この判定情報に基づいて、各符号化音声データの復号準備、例えばコーデック設定を開始することができる。
If the audio object type (audioObjectType) = 2,
The audio data of this coding type = [0x11]
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
Is determined.
On the other hand, if the audio object type (audioObjectType) = 36,
The audio data of this coding type = [0x11]
(1) MPEG4 ALS (LATM / LOAS) encoded audio data,
Is determined.
The playback device can start preparations for decoding each coded audio data, for example, codec setting, based on the determination information.

なお、1つの番組等のコンテンツに対応して、
(1)MPEG4 AAC LC符号化音声データ、
(2)MPEG4 ALS符号化音声データ、
これら2種類の音声データ(音声ストリーム)が配信される場合がある。
例えば、ユーザ(視聴者)が、これら2種類の音声データから再生データを選択可能とした設定である。
In addition, corresponding to contents such as one program,
(1) MPEG4 AAC LC encoded audio data,
(2) MPEG4 ALS encoded audio data,
These two types of audio data (audio stream) may be distributed.
For example, the setting is such that a user (viewer) can select reproduction data from these two types of audio data.

このように複数の音声データ(音声ストリーム)を放送局等の送信装置から受信して、BD等のメディアに記録する記録装置は、図16に示すストリームコーディング情報[StreamCodingInfo]を、各音声データ(音声ストリーム)各々について個別に生成して、1つのクリップ情報ファイル内に格納する。   A recording device that receives a plurality of audio data (audio streams) from a transmission device such as a broadcast station and records the same on a medium such as a BD as described above converts stream coding information [StreamCodingInfo] shown in FIG. Audio streams) and individually generated and stored in one clip information file.

この場合、BD等のメディアに記録されたデータの再生を行う再生装置は、
音声オブジェクトタイプ(audioObjectType)=2、および、
音声オブジェクトタイプ(audioObjectType)=36、
これらの2種類の音声データ、すなわち、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これら2種類の音声データが、このクリップ情報ファイルを適用して選択再生可能であると判断することができる。
In this case, a playback device that plays back data recorded on a medium such as a BD,
Audio object type (audioObjectType) = 2, and
Audio object type (audioObjectType) = 36,
These two types of audio data, namely,
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(2) MPEG4 ALS (LATM / LOAS) encoded audio data,
It can be determined that these two types of audio data can be selectively reproduced by applying this clip information file.

この場合、再生装置は、例えばユーザ(視聴者)に対して、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これら2種類の音声データが再生可能であることを示す案内情報を表示部に表示する。さらに、ユーザに再生希望音声の選択情報を入力させて、入力された選択情報、すなわち再生希望音声を再生データとして選択して再生する処理を行うことができる。
In this case, the playback device, for example,
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(2) MPEG4 ALS (LATM / LOAS) encoded audio data,
Guidance information indicating that these two types of audio data can be reproduced is displayed on the display unit. Further, it is possible to perform a process of allowing the user to input selection information of desired reproduction sound, and selecting and reproducing the input selection information, that is, the desired reproduction sound as reproduction data.

[6−2.(実施例2)MMTパッケージテーブル(MPT)に記録された音声識別情報を取得してクリップ情報ファイルに記録する実施例]
次に、実施例2として、MMTフォーマット対応の制御情報(SI)であるMMTパッケージテーブル(MPT)に記録された音声識別情報を取得してクリップ情報ファイルに記録する実施例について説明する。
[6-2. (Example 2) Example in which audio identification information recorded in an MMT package table (MPT) is acquired and recorded in a clip information file]
Next, as a second embodiment, an embodiment will be described in which audio identification information recorded in an MMT package table (MPT), which is control information (SI) corresponding to the MMT format, is acquired and recorded in a clip information file.

すなわち、音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これら2種類の音声データのいずれであるかを示す識別情報をMMTパッケージテーブル(MPT)から取得してクリップ情報ファイルに記録する実施例について説明する。
That is, the audio data is
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(2) MPEG4 ALS (LATM / LOAS) encoded audio data,
An embodiment will be described in which identification information indicating which of these two types of audio data is obtained from the MMT package table (MPT) and is recorded in the clip information file.

図19は、実施例2に従ったクリップ情報ファイルのプログラム情報[ProgramInfo()]のストリームコーディング情報[StreamCodingInfo]のデータ構成(シンタクス)を示す図である。   FIG. 19 is a diagram illustrating a data configuration (syntax) of stream coding information [StreamCodingInfo] of program information [ProgramInfo ()] of a clip information file according to the second embodiment.

図19に示す新たなストリームコーディング情報[StreamCodingInfo]は、このクリップ情報ファイルの制御対象となる音声データが、
(1)MPEG4 AAC LC符号化音声データ、
(2)MPEG4 ALS符号化音声データ、
これら2種類のどちらの符号化音声データであるかについて識別可能とした構成を有する。
The new stream coding information [StreamCodingInfo] shown in FIG. 19 includes audio data to be controlled by the clip information file.
(1) MPEG4 AAC LC encoded audio data,
(2) MPEG4 ALS encoded audio data,
It has a configuration in which one of these two types of encoded audio data can be identified.

図16に示すストリームコーディング情報[StreamCodingInfo]は、先に図14を参照して説明したと同様、以下のデータが記録される。
(1)画像ストリームコーディング情報121、
(2)音声ストリームコーディング情報122、
In the stream coding information [StreamCodingInfo] shown in FIG. 16, the following data is recorded in the same manner as described above with reference to FIG.
(1) Image stream coding information 121,
(2) audio stream coding information 122;

図19に示すストリームコーディング情報[StreamCodingInfo]には、先に実施例1として説明した図16に示すデータ構成と同様、
コーディングタイプ(stream_coding_type)=[0x11]
上記コーディングタイプ[0x11]の音声データ属性情報記録領域130が設定されている。
The stream coding information [StreamCodingInfo] shown in FIG. 19 has the same data configuration as that shown in FIG.
Coding type (stream_coding_type) = [0x11]
The audio data attribute information recording area 130 of the coding type [0x11] is set.

なお、前述したように、コーディングタイプ=[0x11]は、
(1)MPEG4 AAC LC符号化音声データ、
(2)MPEG4 ALS符号化音声データ、
これら2種類の符号化音声データの双方に対応付けられるタイプ識別子であり、このタイプ識別子[0x11]のみでは、上記(1),(2)どちらの符号化音声データであるかについては識別することができない。
As described above, coding type = [0x11]
(1) MPEG4 AAC LC encoded audio data,
(2) MPEG4 ALS encoded audio data,
This type identifier is associated with both of these two types of encoded audio data. With only this type identifier [0x11], it is possible to identify which of the above (1) and (2) the encoded audio data is. Can not.

図19に示すストリームコーディング情報[StreamCodingInfo]のコーディングタイプ[0x11]の音声データ属性情報記録領域130には、以下の各情報が記録される。
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
(c)ストリームコンテンツ(stream_content)135
The following information is recorded in the audio data attribute information recording area 130 of the coding type [0x11] of the stream coding information [StreamCodingInfo] shown in FIG.
(A) Audio type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
(C) Stream content (stream_content) 135

これらのデータ中、以下のデータ(a),(b)、すなわち、
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
これらのデータは、先に、図15を参照して説明したデータと同様のデータである。
Among these data, the following data (a) and (b):
(A) Audio type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
These data are the same as the data described above with reference to FIG.

なお、前述したように、放送局等の送信装置から受信するMMTフォーマットデータの場合、これらの情報は、例えばMMTフォーマット対応の制御情報(SI)であるMMTパッケージテーブル(MPT)に記録されている。
BD等のメディアにMMTフォーマットデータを記録する記録装置は、MMTフォーマット対応の制御情報(SI)であるMMTパッケージテーブル(MPT)から、上記(a),(b)の各データを読み取り、クリップ情報ファイルに記録する。
なお、具体的なMMTパッケージテーブル(MPT)の記録データの例については後段で説明する。
As described above, in the case of MMT format data received from a transmitting device such as a broadcasting station, these pieces of information are recorded in, for example, an MMT package table (MPT) which is control information (SI) corresponding to the MMT format. .
A recording device that records MMT format data on a medium such as a BD reads the data (a) and (b) from the MMT package table (MPT), which is control information (SI) corresponding to the MMT format, and outputs clip information. Record to file.
A specific example of recording data of the MMT package table (MPT) will be described later.

図19に示すように、コーディングタイプ[0x11]の音声データについては、さらに、
(c)ストリームコンテンツ(stream_content)135
上記の音声属性情報を記録する。
As shown in FIG. 19, for audio data of coding type [0x11],
(C) Stream content (stream_content) 135
The above audio attribute information is recorded.

本実施例2では、このストリームコンテンツ(stream_content)135が、
コーディングタイプ=[0x11]に含まれる以下の2種類のデータ、すなわち、
(1)MPEG4 AAC LC符号化音声データ、
(2)MPEG4 ALS符号化音声データ、
これら2種類の符号化音声データの識別子、すなわち音声識別情報として利用される。
In the second embodiment, the stream content (stream_content) 135 is
The following two types of data included in the coding type = [0x11]:
(1) MPEG4 AAC LC encoded audio data,
(2) MPEG4 ALS encoded audio data,
These two types of encoded audio data are used as identifiers, that is, audio identification information.

ストリームコンテンツ(stream_content)135の具体的な記録データ例を図20に示す。
ストリームコンテンツ(stream_content)=0x3の場合、
このコーディングタイプ=[0x11]の符号化音声データが、
MPEG4 AAC LC(LATM/LOAS)符号化音声データであることを意味する。
FIG. 20 shows a specific example of recording data of the stream content (stream_content) 135.
If the stream content (stream_content) = 0x3,
The encoded audio data of this coding type = [0x11]
It means that the audio data is MPEG4 AAC LC (LATM / LOAS) encoded audio data.

一方、
ストリームコンテンツ(stream_content)=0x4の場合、
このコーディングタイプ=[0x11]の符号化音声データが、
MPEG4 ALS(LATM/LOAS)符号化音声データであることを意味する。
on the other hand,
If the stream content (stream_content) = 0x4,
The encoded audio data of this coding type = [0x11]
It means that the data is MPEG4 ALS (LATM / LOAS) encoded audio data.

BD等のメディアに記録されたデータの再生を行う再生装置は、このストリームコンテンツ(stream_content)の記録データを参照することで、このクリップ情報ファイルの再生制御対象となる音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれの音声データであるかを識別することが可能となる。
A playback device that plays back data recorded on a medium such as a BD refers to the recorded data of the stream content (stream_content), so that the audio data to be controlled for playback of the clip information file is
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(2) MPEG4 ALS (LATM / LOAS) encoded audio data,
It is possible to identify any of these audio data.

なお、放送局等の送信装置から受信するMMTフォーマットデータの場合、このストリームコンテンツ(stream_content)情報は、MMTフォーマット対応の制御情報(SI)であるMMTパッケージテーブル(MPT)に記録されている。
BD等のメディアにMMTフォーマットデータを記録する記録装置は、放送局等の送信装置から受信するMMTフォーマット対応の制御情報(SI)であるMMTパッケージテーブル(MPT)から、「ストリームコンテンツ(stream_content)」を読み取り、クリップ情報ファイルに記録する。
In the case of MMT format data received from a transmission device such as a broadcasting station, the stream content (stream_content) information is recorded in an MMT package table (MPT) which is control information (SI) corresponding to the MMT format.
A recording device that records MMT format data on a medium such as a BD uses a “stream content (stream_content)” from an MMT package table (MPT), which is control information (SI) corresponding to the MMT format, received from a transmission device such as a broadcasting station. Is read and recorded in the clip information file.

図21は、MMTパッケージテーブル(MPT)のデータ構成(シンタクス)を示す図である。
MMTフォーマットにおいて規定されたMMTパッケージテーブル(MPT:MMT Package Table)は、例えば画像、音声、字幕等のデータ種類(アセットタイプ)毎に、データの属性情報(アセット記述子)を詳細に記録したテーブルである。
FIG. 21 is a diagram illustrating a data configuration (syntax) of the MMT package table (MPT).
An MMT package table (MPT: MMT Package Table) specified in the MMT format is a table in which data attribute information (asset descriptor) is recorded in detail for each data type (asset type) such as image, audio, subtitle, and the like. It is.

MMTパッケージテーブル(MPT:MMT Package Table)280は、パケットID=0x0000のMMTPパケットに格納されており、情報処理装置は、パケットIDに基づいてMMTパッケージテーブル(MPT)の格納パケットを判別することができる。   An MMT package table (MPT: MMT Package Table) 280 is stored in an MMTP packet with a packet ID of 0x0000, and the information processing apparatus may determine a packet stored in the MMT package table (MPT) based on the packet ID. it can.

MMTパッケージテーブル(MPT)には、図21に示すように、
アセットタイプ(asset_type)151、
アセット記述子(asset_descriptors_byte)152、
これらのデータ記録領域が含まれる。
In the MMT package table (MPT), as shown in FIG.
Asset type (asset_type) 151,
Asset descriptors (asset_descriptors_byte) 152,
These data recording areas are included.

アセットタイプ(asset_type)151は、画像、音声、字幕等のデータ種類別の識別子を記録する領域である。アセットとは、共通属性を持つデータ処理の単位であり、画像、音声、字幕等は、各々、異なるアセットとして設定される。
MMTパッケージテーブル(MPT)に記録されるアセットタイプ(asset_type)の具体例を図22に示す。
The asset type (asset_type) 151 is an area for recording an identifier for each data type such as an image, a sound, and a caption. An asset is a unit of data processing having a common attribute, and images, audio, subtitles, and the like are set as different assets.
FIG. 22 shows a specific example of the asset type (asset_type) recorded in the MMT package table (MPT).

図22に示すように、MPTに記録されるアセットタイプ(asset_type)には、例えば以下の種類がある。
hvc1:HEVC画像
mp4a:音声
stpp:字幕等
aapp:アプリケーション
図21に示すMPTのアセットタイプ(asset_type)151記録フィールドには、例えば上記のいずれかのタイプ情報が記録される。
As shown in FIG. 22, the asset type (asset_type) recorded in the MPT includes, for example, the following types.
hvc1: HEVC image mp4a: audio stpp: subtitles, etc. aapp: application In the MPT asset type (asset_type) 151 recording field shown in FIG. 21, for example, any of the above type information is recorded.

図21のMPTの下段に示す、
アセット記述子(asset_descriptors_byte)152、
このフィールドには、各アセットタイプ(例えば画像、音声、字幕)、これらのデータ種類に応じた様々な属性情報、例えば画像であれば解像度情報等が記録される。
As shown in the lower part of the MPT of FIG.
Asset descriptors (asset_descriptors_byte) 152,
In this field, each asset type (for example, image, audio, subtitle) and various attribute information corresponding to these data types, such as resolution information for an image, are recorded.

図23は、図21を参照して説明したMMTパッケージテーブル(MPT)に記録される音声属性情報を示す図である。
すなわち、図23は、図21に示すMPT中のアセットタイプ(asset_type)151が音声対応のタイプ識別子(mp4a)である場合に、
アセット記述子(asset_descriptors_byte)152として記録されるデータの一例であり、図23に示すデータは、音声コンポーネント記述子(MH−Audio_Component_Descriptor)のデータ構成(シンタクス)を示す図である。
FIG. 23 is a diagram showing audio attribute information recorded in the MMT package table (MPT) described with reference to FIG.
That is, FIG. 23 illustrates a case where the asset type (asset_type) 151 in the MPT shown in FIG. 21 is a type identifier (mp4a) corresponding to audio.
This is an example of data recorded as an asset descriptor (asset_descriptors_byte) 152, and the data illustrated in FIG. 23 is a diagram illustrating a data configuration (syntax) of an audio component descriptor (MH-Audio_Component_Descriptor).

図23に示すように、音声コンポーネント記述子(MH−Audio_Component_Descriptor)には、以下の音声属性情報が記録される。
(M1)ストリームコンテンツ情報
(M2)コンポーネントタイプ
(M3)サンプリング周波数
As shown in FIG. 23, the following audio attribute information is recorded in the audio component descriptor (MH-Audio_Component_Descriptor).
(M1) Stream content information (M2) Component type (M3) Sampling frequency

情報記録媒体(メディア)に対するデータ記録処理を実行する情報処理装置は、MMTパッケージテーブル(MPT)から、これらの音声属性情報を読み取り、情報記録媒体(メディア)に記録するクリップ情報ファイルに対する記録データとして利用する。   An information processing apparatus that executes a data recording process on an information recording medium (media) reads the audio attribute information from the MMT package table (MPT), and records the audio attribute information as recording data for a clip information file to be recorded on the information recording medium (media). Use.

すなわち、先に図19を参照して説明したストリームコーディング情報[StreamCodingInfo]のコーディングタイプ[0x11]の音声データ属性情報記録領域130に対する以下の記録データ、
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
(c)ストリームコンテンツ(stream_content)135
これらの記録データとする。
That is, the following recording data for the audio data attribute information recording area 130 of the coding type [0x11] of the stream coding information [StreamCodingInfo] described with reference to FIG.
(A) Audio type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
(C) Stream content (stream_content) 135
These are recorded data.

先に実施例1として説明した図16に示すストリームコーディング情報[StreamCodingInfo]のコーディングタイプ[0x11]の音声データ属性情報記録領域130に対する以下の記録データ、
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
これらの記録データも、図23に示すMMTパッケージテーブル(MPT)の音声コンポーネント記述子(MH−Audio_Component_Descriptor)の記録データである、
(M2)コンポーネントタイプ
(M3)サンプリング周波数
これらの記録データを利用して記録すねことが可能である。
The following recording data for the audio data attribute information recording area 130 of the coding type [0x11] of the stream coding information [StreamCodingInfo] shown in FIG.
(A) Audio type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
These recording data are also recording data of the audio component descriptor (MH-Audio_Component_Descriptor) of the MMT package table (MPT) shown in FIG.
(M2) Component type (M3) Sampling frequency Recording can be performed using these recording data.

図23に示す、MMTパッケージテーブル(MPT)の以下の記録データ、すなわち、
(M1)ストリームコンテンツ情報161、
(M2)コンポーネントタイプ162、
(M3)サンプリング周波数163、
これらのデータの具体例について図24以下を参照して説明する。
The following recording data of the MMT package table (MPT) shown in FIG.
(M1) stream content information 161,
(M2) component type 162,
(M3) sampling frequency 163,
Specific examples of these data will be described with reference to FIG.

図24は、MMTパッケージテーブル(MPT)に記録される、
(M1)ストリームコンテンツ情報161
の具体例を示す図である。
MMTパッケージテーブル(MPT)には、ストリームコンテンツ情報として、
0x0〜0xFのいずれかのビット値が格納される。各ビット値に応じた符号化態様情報が記録される。
FIG. 24 shows the information recorded in the MMT package table (MPT).
(M1) Stream content information 161
It is a figure which shows the specific example of.
In the MMT package table (MPT), as stream content information,
Any bit value of 0x0 to 0xF is stored. Encoding mode information corresponding to each bit value is recorded.

具体的には、以下の設定である。
(1)ストリームコンテンツ(stream_content)=0x2は、
このアセット対応の音声ストリームが、符号化方式を特定しない音声ストリームであることを意味する。
(2)ストリームコンテンツ(stream_content)=0x3は、
このアセット対応の音声ストリームが、MPEG4 AAC(MPEG4 AAC LC(LATM/LOAS))の音声ストリームであることを意味する。
(3)ストリームコンテンツ(stream_content)=0x4は、
このアセット対応の音声ストリームが、MPEG4 ALC(MPEG4 ALS(LATM/LOAS))の音声ストリームであることを意味する。
Specifically, the settings are as follows.
(1) The stream content (stream_content) = 0x2 is
This means that the audio stream corresponding to the asset is an audio stream whose encoding method is not specified.
(2) The stream content (stream_content) = 0x3 is
This means that the audio stream corresponding to the asset is an audio stream of MPEG4 AAC (MPEG4 AAC LC (LATM / LOAS)).
(3) The stream content (stream_content) = 0x4 is
This means that the audio stream corresponding to the asset is an audio stream of MPEG4 ALC (MPEG4 ALS (LATM / LOAS)).

例えば、BD等のメディアにMMTフォーマットデータを記録する記録装置は、放送局等の送信装置から受信するMMTフォーマット対応の制御情報(SI)であるMMTパッケージテーブル(MPT)から、この「ストリームコンテンツ(stream_content)」を読み取り、クリップ情報ファイルに記録する。
なお、MMTフォーマットにおけるアセットは、MPEGフォーマットにおけるストリームに対応する。
For example, a recording device that records MMT format data on a medium such as a BD reads this “stream content (MPT)” from an MMT package table (MPT) which is control information (SI) corresponding to the MMT format received from a transmission device such as a broadcasting station. stream_content) ”and records it in the clip information file.
An asset in the MMT format corresponds to a stream in the MPEG format.

例えば、MMTフォーマットのある1つのアセットについて、MMTパッケージテーブル(MPT)に記録されたストリームコンテンツ(stream_content)の値が、0x3である場合、
このアセット対応の音声ストリームの属性情報の記録領域である図19に示すストリームコーディング情報[StreamCodingInfo]のコーディングタイプ[0x11]の音声データ属性情報記録領域130の
(c)ストリームコンテンツ(stream_content)135
この記録領域に0x3を記録する。
For example, when the value of the stream content (stream_content) recorded in the MMT package table (MPT) for one asset having the MMT format is 0x3,
(C) Stream content (stream_content) 135 in the audio data attribute information recording area 130 of the coding type [0x11] of the stream coding information [StreamCodingInfo] shown in FIG. 19, which is the recording area of the attribute information of the audio stream corresponding to the asset.
0x3 is recorded in this recording area.

一方、MMTフォーマットのある1つのアセットについて、MMTパッケージテーブル(MPT)に記録されたストリームコンテンツ(stream_content)の値が、0x4である場合、
このアセット対応の音声ストリームの属性情報の記録領域である図19に示すストリームコーディング情報[StreamCodingInfo]のコーディングタイプ[0x11]の音声データ属性情報記録領域130の
(c)ストリームコンテンツ(stream_content)135
この記録領域に0x4を記録する。
On the other hand, when the value of the stream content (stream_content) recorded in the MMT package table (MPT) for one asset having the MMT format is 0x4,
(C) Stream content (stream_content) 135 in the audio data attribute information recording area 130 of the coding type [0x11] of the stream coding information [StreamCodingInfo] shown in FIG. 19, which is the recording area of the attribute information of the audio stream corresponding to the asset.
0x4 is recorded in this recording area.

このように、BD等のメディアにMMTフォーマットデータを記録する記録装置は、アセット(ストリーム)単位のストリームコンテンツ(stream_content)情報をクリップ情報ファイルに格納してメディアに記録する。   As described above, the recording apparatus that records MMT format data on a medium such as a BD stores stream content (stream_content) information in asset (stream) units in a clip information file and records the clip information file on the medium.

BD等のメディアに記録されたデータの再生を行う再生装置は、このストリームコンテンツ(stream_content)の記録データを参照することで、このクリップ情報ファイルの再生制御対象となる音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれの音声データであるかを識別することが可能となる。
A playback device that plays back data recorded on a medium such as a BD refers to the recorded data of the stream content (stream_content), so that the audio data to be controlled for playback of the clip information file is
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(2) MPEG4 ALS (LATM / LOAS) encoded audio data,
It is possible to identify any of these audio data.

すなわち、再生装置は、クリップ情報ファイルのプログラム情報[ProgramInfo()]記録領域内に設定されるストリームコーディング情報[StreamCodingInfo]におけるコーディングタイプ=[0x11]の音声属性情報記録領域から、ストリームコンテンツ(stream_content)の設定値を読み取る。   That is, the playback device reads the stream content (stream_content) from the audio attribute information recording area of coding type = [0x11] in the stream coding information [StreamCodingInfo] set in the program information [ProgramInfo ()] recording area of the clip information file. Read the set value of.

ストリームコンテンツ(stream_content)=0x3であれば、
このコーディングタイプ=[0x11]の音声データは、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
であると判定する。
一方、ストリームコンテンツ(stream_content)=0x4であれば、
このコーディングタイプ=[0x11]の音声データは、
(1)MPEG4 ALS(LATM/LOAS)符号化音声データ、
であると判定する。
再生装置は、この判定情報に基づいて、各符号化音声データの復号準備、例えばコーデック設定を迅速に開始することができる。
If the stream content (stream_content) = 0x3,
The audio data of this coding type = [0x11]
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
Is determined.
On the other hand, if the stream content (stream_content) = 0x4,
The audio data of this coding type = [0x11]
(1) MPEG4 ALS (LATM / LOAS) encoded audio data,
Is determined.
The playback device can promptly start preparations for decoding each coded audio data, for example, codec settings, based on the determination information.

なお、1つの番組等のコンテンツに対応して、
(1)MPEG4 AAC LC符号化音声データ、
(2)MPEG4 ALS符号化音声データ、
これら2種類の音声データ(音声ストリーム)が配信される場合がある。
例えば、ユーザ(視聴者)が、これら2種類の音声データから再生データを選択可能とした設定である。
In addition, corresponding to contents such as one program,
(1) MPEG4 AAC LC encoded audio data,
(2) MPEG4 ALS encoded audio data,
These two types of audio data (audio stream) may be distributed.
For example, the setting is such that a user (viewer) can select reproduction data from these two types of audio data.

このように複数の音声データ(音声ストリーム)を放送局等の送信装置から受信して、BD等のメディアに記録する記録装置は、図19に示すストリームコーディング情報[StreamCodingInfo]を各音声データ(音声ストリーム)各々に対して個別に生成して、1つのクリップ情報ファイル内に格納する。   As described above, the recording device that receives a plurality of audio data (audio streams) from a transmission device such as a broadcast station and records it on a medium such as a BD transmits stream coding information [StreamCodingInfo] shown in FIG. Stream) are generated individually and stored in one clip information file.

この場合、BD等のメディアに記録されたデータの再生を行う再生装置は、
ストリームコンテンツ(stream_content)=0x3、および、
ストリームコンテンツ(stream_content)=0x4、
これらの2種類の音声データ、すなわち、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これら2種類の音声データが、このクリップ情報ファイルを適用して選択再生可能であると判断することができる。
In this case, a playback device that plays back data recorded on a medium such as a BD,
Stream content (stream_content) = 0x3, and
Stream content (stream_content) = 0x4,
These two types of audio data, namely,
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(2) MPEG4 ALS (LATM / LOAS) encoded audio data,
It can be determined that these two types of audio data can be selectively reproduced by applying this clip information file.

この場合、再生装置は、例えばユーザ(視聴者)に対して、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これら2種類の音声データが再生可能であることを示す案内情報を表示部に表示する。さらに、ユーザに再生希望音声の選択情報を入力させて、入力された選択情報、すなわち再生希望音声を再生データとして選択して再生する処理を行うことができる。
In this case, the playback device, for example,
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(2) MPEG4 ALS (LATM / LOAS) encoded audio data,
Guidance information indicating that these two types of audio data can be reproduced is displayed on the display unit. Further, it is possible to perform a process of allowing the user to input selection information of desired reproduction sound, and selecting and reproducing the input selection information, that is, the desired reproduction sound as reproduction data.

次に、図25、図26を参照して、MMTパッケージテーブル(MPT)に記録される、図23に示す以下の2つの情報の具体例について説明する。
(M2)コンポーネントタイプ162、
(M3)サンプリング周波数163、
Next, specific examples of the following two pieces of information shown in FIG. 23 and recorded in the MMT package table (MPT) will be described with reference to FIGS.
(M2) component type 162,
(M3) sampling frequency 163,

図25は、MMTパッケージテーブル(MPT)に記録される、
(M12)コンポーネントタイプ162
の具体例を示す図である。
MMTパッケージテーブル(MPT)には、コンポーネントタイプ情報162として、
00000〜11111のいずれかのビット値が格納され、各ビット値に応じてモノラル、ステレオ等、様々な音声の出力タイプ(コンポーネントタイプ)が対応付けられている。
FIG. 25 shows the information recorded in the MMT package table (MPT).
(M12) Component type 162
It is a figure which shows the specific example of.
In the MMT package table (MPT), as component type information 162,
One of bit values 0000 to 11111 is stored, and various audio output types (component types) such as monaural and stereo are associated with each bit value.

図26は、MMTパッケージテーブル(MPT)に記録される、
(M3)サンプリング周波数163
の具体例を示す図である。
MMTパッケージテーブル(MPT)には、サンプリング周波数情報163として、
000〜111のいずれかのビット値が格納され、各ビット値に応じて、16〜48kHzのサンプリング周波数が対応付けられている。
FIG. 26 shows the information recorded in the MMT package table (MPT).
(M3) Sampling frequency 163
It is a figure which shows the specific example of.
In the MMT package table (MPT), as sampling frequency information 163,
One of the bit values 000 to 111 is stored, and a sampling frequency of 16 to 48 kHz is associated with each bit value.

このように、MMTフォーマットデータ中の制御情報(シグナリング情報(MMT−SI))に含まれるMMTパッケージテーブル(MPT)には、
(M1)ストリームコンテンツ情報
(M2)コンポーネントタイプ
(M3)サンプリング周波数
これらの具体的な情報が記録されている。
As described above, the MMT package table (MPT) included in the control information (signaling information (MMT-SI)) in the MMT format data includes:
(M1) Stream content information (M2) Component type (M3) Sampling frequency These specific information are recorded.

情報記録媒体(メディア)に対するデータ記録処理を実行する情報処理装置は、MMTパッケージテーブル(MPT)から、これらの音声属性情報を読み取り、情報記録媒体(メディア)に記録するクリップ情報ファイルに対する記録データとして利用する。   An information processing apparatus that executes a data recording process on an information recording medium (media) reads the audio attribute information from the MMT package table (MPT), and records the audio attribute information as recording data for a clip information file to be recorded on the information recording medium (media). Use.

具体的には、図19に示すストリームコーディング情報[StreamCodingInfo]のコーディングタイプ[0x11]の音声データ属性情報記録領域130の以下の各情報を記録する。
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
(c)ストリームコンテンツ(stream_content)135
Specifically, the following information in the audio data attribute information recording area 130 of the coding type [0x11] of the stream coding information [StreamCodingInfo] shown in FIG. 19 is recorded.
(A) Audio type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
(C) Stream content (stream_content) 135

なお、先に図16を参照して説明した(実施例1)のストリームコーディング情報[StreamCodingInfo]のコーディングタイプ[0x11]の音声データ属性情報記録領域130の以下の各情報、
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
これらの情報も、MMTパッケージテーブル(MPT)の記録データを情報記録媒体(メディア)に記録するクリップ情報ファイルに対する記録データとして利用される。
The following information of the audio data attribute information recording area 130 of the coding type [0x11] of the stream coding information [StreamCodingInfo] described with reference to FIG.
(A) Audio type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
These pieces of information are also used as recording data for a clip information file for recording the recording data of the MMT package table (MPT) on an information recording medium (media).

上記、実施例1、実施例2において説明したように、MMTフォーマットデータを入力し、入力データをBDAVフォーマットデータとして情報記録媒体(メディア)に記録する情報処理装置は、音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらいずれの音声データであるかを示す音声識別情報を、ストリーム単位(アセット単位)の情報として、音声データ格納パケット、またはMMTパッケージテーブル(MPT)から取得してクリップ情報ファイルに記録する。
As described in the first and second embodiments, the information processing apparatus that inputs MMT format data and records the input data as BDAV format data on an information recording medium (media) has the following features.
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(2) MPEG4 ALS (LATM / LOAS) encoded audio data,
The audio identification information indicating which of the audio data is obtained is obtained from an audio data storage packet or an MMT package table (MPT) as stream-based (asset-based) information and recorded in a clip information file.

なお、上記の音声識別情報とは、
実施例1において説明した音声データ格納パケットに記録された音声オブジェクトタイプ(audioObjectType)、または、
実施例2において説明したMMTパッケージテーブル(MPT)に記録されたストリームコンテンツ(stream_content)、
これらのいずれかの情報である。
In addition, the above voice identification information is
The audio object type (audioObjectType) recorded in the audio data storage packet described in the first embodiment, or
Stream content (stream_content) recorded in the MMT package table (MPT) described in the second embodiment,
Any of these information.

なお、上記実施例では、実施例1において説明した音声データ格納パケットに記録された音声オブジェクトタイプ(audioObjectType)の設定値(2、または36)や、MMTパッケージテーブル(MPT)に記録されたストリームコンテンツ(stream_content)の設定値(0x3、または0x4)をそのままクリップ情報ファイルに記録する実施例として説明したが、これらの値は、2つの音声データが区別可能な異なる値であればよく、様々な設定が可能である。   In the above embodiment, the set value (2 or 36) of the audio object type (audioObjectType) recorded in the audio data storage packet described in the first embodiment, and the stream content recorded in the MMT package table (MPT) The embodiment has been described in which the setting value (0x3 or 0x4) of (stream_content) is recorded in the clip information file as it is. However, these values may be different values that can distinguish two pieces of audio data. Is possible.

また、上述した実施例1,2においては、図16に示すクリップ情報ファイルの記録データとして、MMTフォーマットの定義データ「音声オブジェクトタイプ(audioObjectType)」をそのまま記録する設定とし、同様に図19に示すクリップ情報ファイルの記録データとして、MMTフォーマットの定義データ「ストリームコンテンツ(stream_content)」をそのまま記録する設定としている。
これらのデータについても、上記表現と異なる表現、例えば、「AAC_AC_ALS_coding_type」といった新たな定義のフィールドを設定して、このフィールドに2つの音声データ(AAC LCと、ALS)を区別可能とした値を設定する構成としてもよい。
Further, in the above-described first and second embodiments, the setting data for recording the MMT format definition data “audio object type (audioObjectType)” as it is as the recording data of the clip information file shown in FIG. As the recording data of the clip information file, the definition data “stream content (stream_content)” of the MMT format is set to be recorded as it is.
Also for these data, an expression different from the above expression, for example, a field of a new definition such as “AAC_AC_ALS_coding_type” is set, and a value that makes it possible to distinguish two audio data (AAC LC and ALS) is set in this field. It is good also as a structure which performs.

[7.情報記録媒体に対するデータ記録処理を実行する情報処理装置の構成と処理について]
次に、図27以下を参照して情報記録媒体に対するデータ記録処理を実行する情報処理装置の構成と処理について説明する。
[7. Configuration and Processing of Information Processing Apparatus for Performing Data Recording Processing on Information Recording Medium]
Next, the configuration and processing of an information processing apparatus that executes data recording processing on an information recording medium will be described with reference to FIG.

先に説明したように、本開示の情報処理装置は、MMTフォーマットに従った入力データを、BDAVフォーマットデータ、またはSPAVフォーマットデータとして、BDやフラッシュメモリ等の情報記録媒体に記録する。
情報処理装置300は、情報記録媒体(記録メディア)320に、クリップAVストリームファイル、さらに、プレイリストやクリップ情報ファイル等のデータベースファイルを記録する。
プレイリストやクリップ情報ファイル等のデータベースファイルには、メディア記録コンテンツ対応の画像属性情報、音声属性情報、再生制御情報等を記録する。
As described above, the information processing apparatus of the present disclosure records input data according to the MMT format as BDAV format data or SPAV format data on an information recording medium such as a BD or a flash memory.
The information processing device 300 records a clip AV stream file and a database file such as a playlist and a clip information file on an information recording medium (recording medium) 320.
In a database file such as a playlist or a clip information file, image attribute information, audio attribute information, playback control information, and the like corresponding to the media recorded content are recorded.

プレイリストやクリップ情報ファイル等のデータベースファイルに記録する情報は、MMTフォーマットに従った入力データに含まれる画像や音声等の再生ストリームデータ格納パケットの他、MMTフォーマットにおいて規定される制御情報(SI)であるTLV−SIや、MMT−SIを構成する様々な情報記録テーブル等から取得する。   Information to be recorded in a database file such as a playlist or a clip information file includes packets for storing reproduction stream data such as images and sounds included in input data according to the MMT format, as well as control information (SI) defined in the MMT format. From the TLV-SI and various information recording tables constituting the MMT-SI.

具体的には、例えば、MMT−SIに含まれるMMTパッケージテーブル(MPT)から様々な情報を取得して、BDAVフォーマットにおいて規定されるプレイリストやクリップ情報ファイル等のデータベースファイルに、メディア記録コンテンツ対応の情報を記録する。   Specifically, for example, various kinds of information are acquired from an MMT package table (MPT) included in the MMT-SI, and media recording content compatible with a database file such as a playlist or a clip information file defined in the BDAV format is obtained. Record the information.

以下、このようなプレイリストやクリップ情報ファイルを記録した情報記録媒体の生成処理、具体的には、BD等の情報記録媒体に対するデータ記録処理を実行する情報処理装置の構成と、処理シーケンスについて説明する。   Hereinafter, a description will be given of a configuration of an information processing apparatus that executes a process of generating an information recording medium on which such a playlist or a clip information file is recorded, specifically, a data recording process on an information recording medium such as a BD, and a processing sequence. I do.

図27は、BD等の情報記録媒体に対するデータ記録処理を実行する情報処理装置300の構成を示す図である。
情報処理装置300は、情報記録媒体(記録メディア)320に、BDAVフォーマットデータ、またはSPAVフォーマットデータの記録データを記録する。すなわち、画像、音声データからなるクリップAVストリームファイルや、再生制御情報ファイルであるプレイリストファイルやクリップ情報ファイル等のデータベースファイルを記録する。
FIG. 27 is a diagram illustrating a configuration of an information processing apparatus 300 that executes a data recording process on an information recording medium such as a BD.
The information processing apparatus 300 records BDAV format data or SPAV format data recording data on an information recording medium (recording medium) 320. That is, a clip AV stream file including image and audio data, and a database file such as a play list file and a clip information file as playback control information files are recorded.

データ入力部301は、情報記録媒体320に対するMMTフォーマットデータ331、すなわち画像データ、音声データ、字幕データ等を含むMMTフォーマットデータ331を入力する。
データ入力部301は、MMTフォーマットデータ331を送信する例えば放送局やコンテンツサーバ等からの送信データを受信する受信部、あるいは、MMTフォーマットデータ331を記録したメディアからのデータ読み取りを実行するメディア読み取り部等によって構成される。
The data input unit 301 inputs MMT format data 331 for the information recording medium 320, that is, MMT format data 331 including image data, audio data, subtitle data, and the like.
The data input unit 301 is a receiving unit that transmits the MMT format data 331, for example, receives transmission data from a broadcast station, a content server, or the like, or a media reading unit that reads data from a medium on which the MMT format data 331 is recorded. Etc.

データ入力部301から入力するMMTフォーマットデータ331は、先に図2を参照して説明したデータフォーマットに従ったデータであり、例えばHEVC画像等の高精細画像データや、MPEG4 AAC LC(LATM/LOAS)音声符号化データ、MPEG4 ALS(LATM/LOAS)音声符号化データ等が含まれている。   The MMT format data 331 input from the data input unit 301 is data in accordance with the data format described above with reference to FIG. 2, for example, high-definition image data such as an HEVC image, or MPEG4 AAC LC (LATM / LOAS). ) Speech encoded data, MPEG4 ALS (LATM / LOAS) speech encoded data, and the like are included.

MMTフォーマットデータ331は、制御部303の制御によって、記憶部304に格納される。
ユーザ入力部302は、例えば情報記録媒体320に対するデータ記録の開始要求等を入力する。
The MMT format data 331 is stored in the storage unit 304 under the control of the control unit 303.
The user input unit 302 inputs, for example, a request to start recording data on the information recording medium 320.

ユーザ入力部302から、データ記録開始要求を入力すると、この入力をトリガとして、記憶部304に格納されたMMTフォーマットデータ331が、デマルチプレクサ(DeMUX)305に入力される。
デマルチプレクサ(DeMUX)305は、MMTフォーマットデータ331から、画像、音声、字幕等の各データを格納したパケットや、通知情報や制御情報等を格納したシグナリング情報(TLV−SI,MMT−SI)等の補助情報を取得し、データ種別のパケットに分類し、各パケットを、データ種類に応じて、記録データ生成部306の字幕データ生成部311、画像データ生成部312、音声データ生成部313、補助情報生成部314に入力する。
When a data recording start request is input from the user input unit 302, the MMT format data 331 stored in the storage unit 304 is input to the demultiplexer (DeMUX) 305 using this input as a trigger.
The demultiplexer (DeMUX) 305 converts the MMT format data 331 into packets storing data such as images, audio, subtitles, etc., and signaling information (TLV-SI, MMT-SI) storing notification information, control information, and the like. Of the recording data generation unit 306, the image data generation unit 312, the audio data generation unit 313, and the auxiliary data of the recording data generation unit 306. The information is input to the information generation unit 314.

字幕データ生成部311は、データ入力部301が入力し、記憶部304に格納されたMMTフォーマットデータ331から、字幕データを取得し、BDAVフォーマットにおいて規定されるストリームファイル格納用データを生成する。
画像データ生成部312は、データ入力部301が入力し、記憶部304に格納されたMMTフォーマットデータ331から、画像データを取得し、BDAVフォーマットにおいて規定されるストリームファイル格納用データを生成する。
音声データ生成部313は、データ入力部301が入力し、記憶部304に格納されたMMTフォーマットデータ331から、音声データを取得し、BDAVフォーマットにおいて規定されるストリームファイル格納用データを生成する。
The subtitle data generation unit 311 obtains subtitle data from the MMT format data 331 input by the data input unit 301 and stored in the storage unit 304, and generates stream file storage data defined in the BDAV format.
The image data generation unit 312 obtains image data from the MMT format data 331 input by the data input unit 301 and stored in the storage unit 304, and generates stream file storage data defined in the BDAV format.
The audio data generation unit 313 acquires audio data from the MMT format data 331 input by the data input unit 301 and stored in the storage unit 304, and generates stream file storage data defined in the BDAV format.

補助情報生成部314は、データ入力部301が入力し、記憶部304に格納されたMMTフォーマットデータ331から、再生データ対応の属性情報や再生制御情報を取得してBDAVフォーマットにおいて規定されるデータベースファイルとしてのプレイリストファイルやクリップ情報ファイルに格納すべきデータを生成する。   The auxiliary information generation unit 314 obtains attribute information and playback control information corresponding to playback data from the MMT format data 331 input by the data input unit 301 and stored in the storage unit 304, and obtains a database file defined in the BDAV format. To generate data to be stored in a playlist file or a clip information file.

具体的には、例えば、MMTフォーマットに従った画像や音声等の再生ストリームデータ格納パケットや、MMTパッケージテーブル(MPT)等から、プレイリストファイルやクリップ情報ファイルに格納すべきデータを取得して、プレイリストファイルやクリップ情報ファイルを生成する。   Specifically, for example, data to be stored in a playlist file or a clip information file is obtained from a reproduction stream data storage packet such as an image and a sound according to the MMT format, an MMT package table (MPT), and the like. Generate playlist files and clip information files.

マルチプレクサ(MUX)315は、字幕データ生成部311、画像データ生成部312、音声データ生成部313が変換した字幕、画像、音声各データを入力し、これらのデータを格納したストリームファイルを生成する。   The multiplexer (MUX) 315 receives the subtitle, image, and audio data converted by the subtitle data generation unit 311, the image data generation unit 312, and the audio data generation unit 313, and generates a stream file that stores these data.

なお、前述したように、MMTフォーマットデータをメディアに記録する場合のクリップAVストリームファイルは、
(1)MMTフォーマットをMPEG−2TSフォーマットに変換してクリップAVストリームファイルを生成する、あるいは、
(2)MMTフォーマットに従ったデータを格納したパケットのパケット列(MMTPパケット列、またはTLVパケットシ列)からなるクリップAVストリームファイルを生成する、
これらの2種類の処理が想定される。
記録データ生成部306は、上記(1),(2)のいずれかの処理態様に従ってクリップAVストリームファイルを生成する。
As described above, a clip AV stream file when recording MMT format data on a medium is:
(1) Convert the MMT format to the MPEG-2TS format to generate a clip AV stream file, or
(2) generating a clip AV stream file composed of a packet sequence (MMTP packet sequence or TLV packet sequence) of a packet storing data according to the MMT format;
These two types of processing are assumed.
The recording data generation unit 306 generates a clip AV stream file according to one of the processing modes (1) and (2).

データベースファイル生成部316は、補助情報生成部314がMMTフォーマットデータ331のシグナリング情報(TLV−SI,MMT−SI)から取得した様々な情報を記録したプレイリストファイルやクリップ情報ファイル等のデータベースファイルを生成する。   The database file generation unit 316 stores a database file such as a playlist file or a clip information file in which the auxiliary information generation unit 314 records various information obtained from the signaling information (TLV-SI, MMT-SI) of the MMT format data 331. Generate.

なお、先に説明したように、クリップ情報ファイルには、音声データ対応の属性情報として、
(1)MPEG4 AAC LC(LATM/LOAS)
(2)MPEG4 ALS(LATM/LOAS)
上記2つの音声符号化データを識別可能とした音声識別情報を記録する。
具体的には、図16、または図19に示す記録データを持つクリップ情報ファイルを生成する。
As described above, the clip information file includes, as attribute information corresponding to audio data,
(1) MPEG4 AAC LC (LATM / LOAS)
(2) MPEG4 ALS (LATM / LOAS)
Speech identification information which makes the two encoded speech data identifiable is recorded.
Specifically, a clip information file having the recording data shown in FIG. 16 or FIG. 19 is generated.

記録データ生成部306の生成したストリームファイルデータと、プレイリストファイル、クリップ情報ファイル等のデータベースファイルを含む記録データ332は、制御部303の制御の下、記録部306によって、ドライブ307を介して情報記録媒体320に出力され、記録される。   The stream file data generated by the recording data generation unit 306 and the recording data 332 including the database files such as the playlist file and the clip information file are transmitted from the recording unit 306 via the drive 307 under the control of the control unit 303. The data is output to the recording medium 320 and recorded.

次に、図27に示す情報処理装置300が実行する情報記録媒体320に対するデータ記録処理のシーケンスについて、図28に示すフローチャートを参照して説明する。   Next, a sequence of a data recording process on the information recording medium 320 executed by the information processing apparatus 300 shown in FIG. 27 will be described with reference to a flowchart shown in FIG.

図28に示すフローに従った処理は、例えば情報処理装置の記憶部に格納されたプログラムに従って、プログラム実行機能を有するCPUを備えたデータ処理部(制御部)の制御の下で実行することができる。
以下、図28のフローに示す各ステップの処理について、順次、説明する。
The processing according to the flow illustrated in FIG. 28 may be executed under the control of a data processing unit (control unit) including a CPU having a program execution function, for example, according to a program stored in a storage unit of the information processing device. it can.
Hereinafter, the processing of each step shown in the flow of FIG. 28 will be sequentially described.

(ステップS101)
まず、情報処理装置300は、ステップS101において、データ入力部301を介して記録用データであるMMTフォーマットデータを入力する。
なお、この記録用データには画像データ、音声データ、字幕データ、さらに、通知情報や制御情報等を格納したシグナリング情報(TLV−SI,MMT−SI)等が含まれる。
(Step S101)
First, in step S101, the information processing apparatus 300 inputs MMT format data that is recording data via the data input unit 301.
The recording data includes image data, audio data, caption data, and signaling information (TLV-SI, MMT-SI) storing notification information, control information, and the like.

(ステップS102)
次に、ステップS102において、情報処理装置300は、入力したMMTフォーマットデータから、画像、音声等の再生対象データを取得し、BDAVフォーマットに従ったAVストリームファイルを生成する。
(Step S102)
Next, in step S102, the information processing device 300 acquires reproduction target data such as an image and a sound from the input MMT format data, and generates an AV stream file according to the BDAV format.

(ステップS103)
次に、ステップS103において、情報処理装置300は、入力したMMTフォーマットデータの構成データを利用して、クリップ情報ファイルを生成する。
具体的には、先の実施例1,2において説明したように、MMTフォーマットに従った画像や音声等の再生ストリームデータ格納パケットや、MMTパッケージテーブル(MPT)等からデータを取得して、クリップ情報ファイルを生成する。
なお、このステップS103のクリップ情報ファイル生成処理の詳細については、図29、図30を参照して、後段で説明する。
(Step S103)
Next, in step S103, the information processing device 300 generates a clip information file using the input configuration data of the MMT format data.
More specifically, as described in the first and second embodiments, data is obtained from a reproduction stream data storage packet such as an image and a sound according to the MMT format, data from an MMT package table (MPT), and the like. Generate an information file.
The details of the clip information file generation process in step S103 will be described later with reference to FIGS. 29 and 30.

(ステップS104)
次に、ステップS104において、情報処理装置300は、入力したMMTフォーマットデータの構成データを利用して、プレイリストファイルを生成する。
(Step S104)
Next, in step S104, the information processing device 300 generates a playlist file using the input configuration data of the MMT format data.

(ステップS105)
次に、ステップS105において、情報処理装置300は、入力したMMTフォーマットデータを利用してその他のデータベースファイルを生成する。
(Step S105)
Next, in step S105, the information processing device 300 generates another database file using the input MMT format data.

(ステップS106)
次に、ステップS106において、情報処理装置300は、生成したAVストリームファイルとデータベースファイルを利用してBDAVフォーマットデータを生成する。
(Step S106)
Next, in step S106, the information processing device 300 generates BDAV format data using the generated AV stream file and database file.

(ステップS107)
次に、ステップS107において、情報処理装置300は、ステップS106で生成したBDAVフォーマットデータを情報記録媒体(メディア)に記録する。
(Step S107)
Next, in step S107, the information processing device 300 records the BDAV format data generated in step S106 on an information recording medium (media).

次に、ステップS103において実行するクリップ情報ファイル生成処理の詳細シーケンスについて、図29、図30に示すフローチャートを参照して説明する。   Next, the detailed sequence of the clip information file generation process executed in step S103 will be described with reference to the flowcharts shown in FIGS.

図29は、先に説明した(実施例1)、すなわち、音声データ格納パケットから音声識別情報を取得する実施例に従ったクリップ情報ファイル生成処理の詳細シーケンスである。
図30は、先に説明した(実施例2)、すなわち、MMTパッケージテーブル(MPT)から音声識別情報を取得する実施例に従ったクリップ情報ファイル生成処理の詳細シーケンスである。
FIG. 29 is a detailed sequence of the clip information file generation process according to the embodiment described above (the first embodiment), that is, the embodiment in which the audio identification information is acquired from the audio data storage packet.
FIG. 30 is a detailed sequence of the clip information file generation process according to the embodiment described above (the second embodiment), that is, the embodiment in which the audio identification information is acquired from the MMT package table (MPT).

まず、図29を参照して、先に説明した(実施例1)、すなわち、音声データ格納パケットから音声識別情報を取得する実施例に従ったクリップ情報ファイル生成処理の詳細シーケンスについて説明する。
図29に示すフローの各ステップの処理について、順次、説明する。
First, with reference to FIG. 29, a detailed sequence of the clip information file generation process according to the above-described embodiment (first embodiment), that is, the embodiment for acquiring the audio identification information from the audio data storage packet will be described.
The processing of each step of the flow shown in FIG. 29 will be sequentially described.

(ステップS121)
まず、ステップS121において、情報処理装置300は、クリップAVストリームファイルに記録する音声データ格納パケットを取得する。
この音声データ格納パケットは、先に図18を参照して説明した音声データ格納パケット140に相当する。
図18に示すように、音声データ格納パケット140のパケット格納データ141は、符号化音声データストリームと、このストリームデータの属性情報によって構成される。
(Step S121)
First, in step S121, the information processing device 300 acquires an audio data storage packet to be recorded in a clip AV stream file.
This audio data storage packet corresponds to the audio data storage packet 140 described above with reference to FIG.
As shown in FIG. 18, the packet storage data 141 of the audio data storage packet 140 includes an encoded audio data stream and attribute information of the stream data.

音声データ格納パケット140に格納されている符号化音声データストリームは、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれかの音声データである。
The encoded audio data stream stored in the audio data storage packet 140 is:
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(2) MPEG4 ALS (LATM / LOAS) encoded audio data,
Any of these audio data.

さらに、音声データ格納パケット140には、パケットに格納された音声データの属性情報が記録される。
図18に示すように、音声データ属性情報の一部として、
音声オブジェクトタイプ(audioObjectType)142が記録されている。
Further, in the audio data storage packet 140, attribute information of the audio data stored in the packet is recorded.
As shown in FIG. 18, as a part of the audio data attribute information,
An audio object type (audioObjectType) 142 is recorded.

(ステップS122)
次に、ステップS122において、情報処理装置300は、取得した音声データ格納パケットから音声オブジェクトタイプ(audioObjectType)の設定値を取得する。
図18に示すように、音声データ属性情報の一部として、
音声オブジェクトタイプ(audioObjectType)142が記録されている。
(Step S122)
Next, in step S122, the information processing device 300 acquires a setting value of the audio object type (audioObjectType) from the acquired audio data storage packet.
As shown in FIG. 18, as a part of the audio data attribute information,
An audio object type (audioObjectType) 142 is recorded.

図18に示す音声オブジェクトタイプ(audioObjectType)142の設定値は、以下の設定である。
パケットに格納されたデータが、MPEG4 AAC LC(LATM/LOAS)符号化音声データである場合、音声オブジェクトタイプ(audioObjectType)=2である。
一方、パケットに格納されたデータが、MPEG4 ALS(LATM/LOAS)符号化音声データである場合、音声オブジェクトタイプ(audioObjectType)=36である。
The setting values of the audio object type (audioObjectType) 142 shown in FIG. 18 are as follows.
If the data stored in the packet is MPEG4 AAC LC (LATM / LOAS) encoded audio data, the audio object type (audioObjectType) = 2.
On the other hand, if the data stored in the packet is MPEG4 ALS (LATM / LOAS) encoded audio data, the audio object type (audioObjectType) = 36.

(ステップS123)
次に、ステップS123において、情報処理装置300は、制御情報(SI)格納パケットから、MMTパッケージテーブル(MPT)を取得する。
(Step S123)
Next, in step S123, the information processing device 300 acquires an MMT package table (MPT) from the control information (SI) storage packet.

MMTパッケージテーブル(MPT)は、先に図21〜図26を参照して説明した様々なデータを格納したテーブルである。
例えば、音声データについては、アセット(ストリーム)単位の属性情報として、図23〜図26を参照して説明した
(M1)ストリームコンテンツ情報161、
(M2)コンポーネントタイプ162、
(M3)サンプリング周波数163、
これらの各データが記録されている。
The MMT package table (MPT) is a table that stores various data described above with reference to FIGS.
For example, as for audio data, (M1) stream content information 161, which has been described with reference to FIGS.
(M2) component type 162,
(M3) sampling frequency 163,
Each of these data is recorded.

(ステップS124)
次に、ステップS124において、情報処理装置300は、MPT(MMTパッケージテーブル)から、アセットタイプが音声であるアセット記述子を選択する。
(Step S124)
Next, in step S124, the information processing device 300 selects an asset descriptor whose asset type is audio from the MPT (MMT package table).

(ステップS125)
次に、ステップS125において、情報処理装置300は、MPTのアセットタイプ=音声のアセット記述子(asset_descriptor)から、以下の音声属性情報を取得する。
(M2)コンポーネントタイプ162、
(M3)サンプリング周波数163。
(Step S125)
Next, in step S125, the information processing device 300 acquires the following audio attribute information from the MPT asset type = audio asset descriptor (asset_descriptor).
(M2) component type 162,
(M3) Sampling frequency 163.

(ステップS126)
次に、ステップS126において、情報処理装置300は、音声データ格納パケットから取得した音声属性情報、すなわち、図18に示す、
音声オブジェクトタイプ(audioObjectType)142、
さらに、MPTから取得した音声属性情報、すなわち、図23〜図26を参照して説明した、
(M2)コンポーネントタイプ162、
(M3)サンプリング周波数163、
これらの各情報を、クリップ情報ファイルに設定したストリームコーディングタイプ=0x11以下の記録フィールドに記録する。
(Step S126)
Next, in step S126, the information processing device 300 acquires the audio attribute information acquired from the audio data storage packet,
Audio object type (audioObjectType) 142,
Further, the voice attribute information obtained from the MPT, that is, described with reference to FIGS.
(M2) component type 162,
(M3) sampling frequency 163,
These pieces of information are recorded in a recording field of stream coding type = 0x11 or less set in the clip information file.

すなわち、先に図16を参照して説明した以下の各データ
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
(c)音声オブジェクトタイプ(audioObjectType)133
これらの各情報を、クリップ情報ファイルに設定したストリームコーディングタイプ=0x11以下の記録フィールドに記録する。
That is, the following data described above with reference to FIG. 16 (a) Audio type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
(C) Audio Object Type (audioObjectType) 133
These pieces of information are recorded in a recording field of stream coding type = 0x11 or less set in the clip information file.

これらの処理により、所定の音声属性情報が記録されたクリップ情報ファイルが生成される。
BD等のメディアに記録されたデータの再生を行う再生装置は、クリップ情報ファイルに記録された音声オブジェクトタイプ(audioObjectType)を参照することで、このクリップ情報ファイルの再生制御対象となる音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれの音声データであるかを識別することが可能となる。
Through these processes, a clip information file in which predetermined audio attribute information is recorded is generated.
A playback device that plays back data recorded on a medium such as a BD refers to an audio object type (audioObjectType) recorded in a clip information file, so that audio data to be controlled for reproduction of the clip information file is
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(2) MPEG4 ALS (LATM / LOAS) encoded audio data,
It is possible to identify any of these audio data.

次に、図30を参照して、先に説明した(実施例2)、すなわち、MMTパッケージテーブル(MPT)から音声識別情報を取得する実施例に従ったクリップ情報ファイル生成処理の詳細シーケンスについて説明する。
図30に示すフローの各ステップの処理について、順次、説明する。
Next, a detailed sequence of the clip information file generation process according to the embodiment described above (the second embodiment), that is, the embodiment in which the audio identification information is acquired from the MMT package table (MPT) will be described with reference to FIG. I do.
The processing of each step of the flow shown in FIG. 30 will be sequentially described.

(ステップS131)
まず、ステップS131において、情報処理装置300は、制御情報(SI)格納パケットから、MMTパッケージテーブル(MPT)を取得する。
(Step S131)
First, in step S131, the information processing device 300 acquires an MMT package table (MPT) from a control information (SI) storage packet.

MMTパッケージテーブル(MPT)は、先に図21〜図26を参照して説明した様々なデータを格納したテーブルである。
例えば、音声データについては、アセット(ストリーム)単位の属性情報として、図23〜図26を参照して説明した
(M1)ストリームコンテンツ情報161、
(M2)コンポーネントタイプ162、
(M3)サンプリング周波数163、
これらの各データが記録されている。
The MMT package table (MPT) is a table that stores various data described above with reference to FIGS.
For example, as for audio data, (M1) stream content information 161, which has been described with reference to FIGS.
(M2) component type 162,
(M3) sampling frequency 163,
Each of these data is recorded.

(ステップS132)
次に、ステップS132において、情報処理装置300は、MPT(MMTパッケージテーブル)から、アセットタイプが音声であるデータを選択する。
(Step S132)
Next, in step S132, the information processing device 300 selects data whose asset type is audio from the MPT (MMT package table).

(ステップS133)
次に、ステップS133において、情報処理装置300は、MPTのアセットタイプ=音声のアセット記述子(asset_descriptor)から、以下の音声属性情報を取得する。
(M1)ストリームコンテンツ情報161、
(M2)コンポーネントタイプ162、
(M3)サンプリング周波数163。
(Step S133)
Next, in step S133, the information processing apparatus 300 acquires the following audio attribute information from the MPT asset type = audio asset descriptor (asset_descriptor).
(M1) stream content information 161,
(M2) component type 162,
(M3) Sampling frequency 163.

(ステップS134)
次に、ステップS134において、情報処理装置300は、MPTから取得した音声属性情報、すなわち、図23〜図26を参照して説明した、
(M1)ストリームコンテンツ情報161、
(M2)コンポーネントタイプ162、
(M3)サンプリング周波数163、
これらの各情報を、クリップ情報ファイルに設定したストリームコーディングタイプ=0x11以下の記録フィールドに記録する。
(Step S134)
Next, in step S134, the information processing device 300 acquires the voice attribute information acquired from the MPT, that is, the description has been given with reference to FIGS.
(M1) stream content information 161,
(M2) component type 162,
(M3) sampling frequency 163,
These pieces of information are recorded in a recording field of stream coding type = 0x11 or less set in the clip information file.

すなわち、先に図19を参照して説明した以下の各データ
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
(c)ストリームコンテンツ(stream_content)135
これらの各情報を、クリップ情報ファイルに設定したストリームコーディングタイプ=0x11以下の記録フィールドに記録する。
That is, the following data described above with reference to FIG. 19 (a) audio type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
(C) Stream content (stream_content) 135
These pieces of information are recorded in a recording field of stream coding type = 0x11 or less set in the clip information file.

これらの処理により、所定の音声属性情報が記録されたクリップ情報ファイルが生成される。
具体的には、BD等のメディアに記録されたデータの再生を行う再生装置は、クリップ情報ファイルに記録されたストリームコンテンツ(stream_content)を参照することで、このクリップ情報ファイルの再生制御対象となる音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれの音声データであるかを識別することが可能となる。
Through these processes, a clip information file in which predetermined audio attribute information is recorded is generated.
Specifically, a playback device that plays back data recorded on a medium such as a BD becomes a playback control target of the clip information file by referring to the stream content (stream_content) recorded in the clip information file. The audio data is
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(2) MPEG4 ALS (LATM / LOAS) encoded audio data,
It is possible to identify any of these audio data.

[8.情報記録媒体からのデータ再生処理を実行する情報処理装置の構成と処理について]
次に、図31以下を参照して情報記録媒体からのデータ再生処理を実行する情報処理装置の構成と処理について説明する。
[8. Configuration and Processing of Information Processing Apparatus that Executes Data Reproduction Processing from Information Recording Medium]
Next, the configuration and processing of an information processing apparatus that executes data reproduction processing from an information recording medium will be described with reference to FIG.

再生処理を実行する情報処理装置は、装置に装着した情報記録媒体に記録されたデータの読み取り、再生処理を実行する。   An information processing device that executes a reproduction process reads data recorded on an information recording medium mounted on the device and executes a reproduction process.

図31は、BD等の情報記録媒体510に記録されたデータの再生処理を実行する情報処理装置400の構成を示す図である。
情報処理装置400は、図31に示す情報記録媒体(記録メディア)510に記録されたデータを読み取り、出力装置(表示部+スピーカ)520に出力する。なお、出力装置520は、例えばテレビ等であり、ディスプレイ、スピーカ等を備えた表示装置である。
なお、情報処理装置400は先に図27を参照して説明したデータ記録を行う情報処理装置300と同一の装置である場合もある。すなわち、データ記録再生の両機能を有する情報処理装置である。
FIG. 31 is a diagram illustrating a configuration of an information processing apparatus 400 that executes a reproduction process of data recorded on an information recording medium 510 such as a BD.
The information processing apparatus 400 reads data recorded on an information recording medium (recording medium) 510 shown in FIG. 31 and outputs the data to an output device (display unit + speaker) 520. Note that the output device 520 is, for example, a television or the like, and is a display device including a display, a speaker, and the like.
The information processing device 400 may be the same device as the information processing device 300 that performs the data recording described above with reference to FIG. That is, the information processing apparatus has both functions of data recording and reproduction.

情報記録媒体(記録メディア)510は、図28〜図30を参照して説明した処理によって生成されたクリップAVストリームファイルと、プレイリスト、クリップ情報ファイル等のデータベースが記録された記録媒体である。   The information recording medium (recording medium) 510 is a recording medium in which a clip AV stream file generated by the processing described with reference to FIGS. 28 to 30 and a database such as a playlist and a clip information file are recorded.

なお、MMTフォーマット対応のクリップAVストリームファイルの再生に利用するクリップ情報ファイルには、音声データに関する各ストリーム(アセット)単位の音声属性情報として、各音声ストリームが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれの音声データであるかを識別することが可能とした音声識別情報が記録されている。
The clip information file used for reproducing the clip AV stream file compatible with the MMT format includes audio streams as audio attribute information for each stream (asset) relating to audio data.
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(2) MPEG4 ALS (LATM / LOAS) encoded audio data,
Audio identification information that enables identification of any of these audio data is recorded.

すなわち、先に図16を参照して説明した以下の各データ、
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
(c)音声オブジェクトタイプ(audioObjectType)133
これらのデータが記録されている。
That is, the following data described with reference to FIG.
(A) Audio type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
(C) Audio Object Type (audioObjectType) 133
These data are recorded.

または、先に図19を参照して説明した以下の各データ、
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
(c)ストリームコンテンツ(stream_content)135
これらのデータが記録されている。
Alternatively, the following data described with reference to FIG.
(A) Audio type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
(C) Stream content (stream_content) 135
These data are recorded.

図16に示す例では、音声オブジェクトタイプ(audioObjectType)133、
図19に示す例では、ストリームコンテンツ(stream_content)135、
これらのデータが、音声ストリームが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれの音声データであるかを示す音声識別情報である。
In the example shown in FIG. 16, the audio object type (audioObjectType) 133,
In the example shown in FIG. 19, the stream content (stream_content) 135,
These data, the audio stream,
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(2) MPEG4 ALS (LATM / LOAS) encoded audio data,
The audio identification information indicates which of these audio data is used.

制御部401は、例えば、ユーザ入力部402からの再生指示情報の入力に基づいて、情報記録媒体510の記録データを、記録再生部404、ドライブ403を介して読み取り、データバッファとしての記憶部405に格納し、その格納データを再生処理部406に出力する。   The control unit 401 reads the recording data of the information recording medium 510 via the recording / reproducing unit 404 and the drive 403 based on the input of the reproduction instruction information from the user input unit 402, for example, and the storage unit 405 as a data buffer And outputs the stored data to the reproduction processing unit 406.

また、制御部401は、ユーザ入力部402からの録画コンテンツリスト表示指示情報の入力に基づいて、情報記録媒体510の記録データに基づいて、先に図9を参照して説明した録画コンテンツリストを生成して、出力装置(表示部)520に出力する。   Further, the control unit 401, based on the input of the recorded content list display instruction information from the user input unit 402, and based on the recording data of the information recording medium 510, stores the recorded content list described earlier with reference to FIG. Generated and output to the output device (display unit) 520.

再生処理部406は、制御部401の制御の下、情報記録媒体510から読み出された再生データ、すなわち、画像、音声、字幕等の各データを格納したクリップAVストリームファイルから各データを取得して再生データを生成する。   Under the control of the control unit 401, the reproduction processing unit 406 acquires each piece of data from the clip AV stream file that stores the reproduction data read from the information recording medium 510, that is, each data such as an image, a sound, and a caption. To generate playback data.

デマルチプレクサ(DeMUX)411は、画像、音声、字幕、さらに、プレイリストファイル、クリップ情報ファイル等の各データを格納したデータ格納パケットを取得し、データ種別のパケットに分類し、各パケットを、データ種類に応じて、字幕データ生成部412、画像データ生成部413、音声データ生成部414、補助情報生成部415に出力する。   The demultiplexer (DeMUX) 411 acquires a data storage packet storing data such as an image, a sound, a caption, and a playlist file, a clip information file, and the like, classifies the packet into a data type packet, and classifies each packet into a data type. Output to the caption data generation unit 412, image data generation unit 413, audio data generation unit 414, and auxiliary information generation unit 415 according to the type.

字幕データ生成部412、画像データ生成部413、音声データ生成部414は、パケットに格納されたデータの復号処理等を実行し、復号データを出力データ生成部416に出力する。
出力データ生成部416は、字幕、画像、音声の各データを、入出力インタフェース407を介して出力装置(表示部+スピーカ)520に出力する。
The caption data generation unit 412, the image data generation unit 413, and the audio data generation unit 414 execute decoding processing of data stored in the packet and output decoded data to the output data generation unit 416.
The output data generation unit 416 outputs subtitle, image, and audio data to an output device (display unit + speaker) 520 via the input / output interface 407.

なお、情報記録媒体510は、再生対象データを格納したストリームファイルとして、
MPEG−2TSフォーマットデータを格納したストリームファイルと、
MMTフォーマットデータを格納したストリームファイルを有する場合がある。
情報処理装置400は、各フォーマット対応のプレイリストファイルとクリップ情報ファイルを選択適用して、MPEG−2TSフォーマットデータを格納したストリームファイル、および、MMTフォーマットデータを格納したストリームファイルの再生処理を実行することになる。
Note that the information recording medium 510 is a stream file that stores the data to be reproduced.
A stream file storing MPEG-2TS format data,
There may be a stream file storing MMT format data.
The information processing apparatus 400 selects and applies a playlist file and a clip information file corresponding to each format, and executes a reproduction process of a stream file storing MPEG-2TS format data and a stream file storing MMT format data. Will be.

補助情報生成部415は、例えば、プレイリストファイル、クリップ情報ファイルに格納されたデータを取得して録画コンテンツリストを生成し、生成リストが出力装置(表示部+スピーカ)520に出力される。   The auxiliary information generation unit 415 obtains data stored in, for example, a playlist file and a clip information file, generates a recorded content list, and outputs the generated list to the output device (display unit + speaker) 520.

出力装置(表示部+スピーカ)520は、情報処理装置400から入力する字幕、画像、音声等の各データ、さらに録画コンテンツリストを、出力装置(表示部+スピーカ)520を介して出力する。   The output device (display unit + speaker) 520 outputs, via the output device (display unit + speaker) 520, data such as captions, images, and audio input from the information processing device 400, and a recorded content list.

次に、図31に示す情報処理装置400が実行する情報記録媒体510からのMMTフォーマットデータの再生処理に際して、再生対象となる音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれの音声データであるかを識別する音声識別処理シーケンスについて、図32に示すフローチャートを参照して説明する。
Next, in the process of reproducing the MMT format data from the information recording medium 510 executed by the information processing apparatus 400 shown in FIG.
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(2) MPEG4 ALS (LATM / LOAS) encoded audio data,
An audio identification processing sequence for identifying any of these audio data will be described with reference to the flowchart shown in FIG.

図32に示すフローに従った処理は、例えば情報処理装置400の記憶部に格納されたプログラムに従って、プログラム実行機能を有するCPUを備えたデータ処理部(制御部)の制御の下で実行することができる。   The processing according to the flow illustrated in FIG. 32 is executed under control of a data processing unit (control unit) including a CPU having a program execution function according to a program stored in a storage unit of the information processing device 400, for example. Can be.

なお、図32に示すフローに従った処理を実行する情報処理装置は、図31に示す情報処理装置400であり、情報記録媒体(記録メディア)510を装着し、装着した情報記録媒体510に記録されたデータを読み取り、出力装置(表示部+スピーカ)520に出力する。なお、出力装置520は、例えばテレビ等であり、ディスプレイ、スピーカ等を備えた表示装置である。   The information processing apparatus that executes the processing according to the flow shown in FIG. 32 is the information processing apparatus 400 shown in FIG. 31, in which the information recording medium (recording medium) 510 is mounted, and the information is recorded on the mounted information recording medium 510. The read data is read and output to an output device (display unit + speaker) 520. Note that the output device 520 is, for example, a television or the like, and is a display device including a display, a speaker, and the like.

情報記録媒体(記録メディア)510は、図28〜図31を参照して説明した処理によって生成されたクリップAVストリームと、プレイリスト、クリップ情報ファイル等のデータベースが記録された記録媒体である。
以下、図32のフローに示す各ステップの処理について、順次、説明する。
The information recording medium (recording medium) 510 is a recording medium in which a clip AV stream generated by the processing described with reference to FIGS. 28 to 31 and a database such as a playlist and a clip information file are recorded.
Hereinafter, the processing of each step shown in the flow of FIG. 32 will be sequentially described.

(ステップS201)
まず、情報処理装置400の制御部401は、ステップS201において、クリップ情報ファイルを取得する。
なお、ここで選択するクリップAVストリームファイルは、MMTフォーマットデータを格納したクリップAVストリームファイルの再生に利用するクリップAVストリームファイルであるものとする。
(Step S201)
First, in step S201, the control unit 401 of the information processing device 400 acquires a clip information file.
It is assumed that the clip AV stream file selected here is a clip AV stream file used for reproducing the clip AV stream file storing the MMT format data.

(ステップS202)
次に、情報処理装置400の制御部401は、ステップS202において、クリップ情報ファイルに記録されたストリームコーディングタイプ=0x11の以下の記録フィールドから、再生対象音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記いずれの符号化音声データであるかを示す音声識別情報を取得する。
(Step S202)
Next, in step S202, the control unit 401 of the information processing apparatus 400 converts reproduction target audio data from the following recording fields of stream coding type = 0x11 recorded in the clip information file,
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(2) MPEG4 ALS (LATM / LOAS) encoded audio data,
The audio identification information indicating which of the above encoded audio data is obtained.

これは、具体的には、図16、または図19に示すクリップ情報ファイルのプログラム情報[ProgramInfo()]のストリームコーディング情報[StreamCodingInfo]の記録データに含まれる以下の情報を取得する処理である。   This is a process of acquiring the following information included in the recording data of the stream coding information [StreamCodingInfo] of the program information [ProgramInfo ()] of the clip information file shown in FIG. 16 or FIG.

クリップ情報ファイルの記録データが、図16に示すデータ構成を有する場合は、
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
(c)音声オブジェクトタイプ(audioObjectType)133
これらのデータを取得する。
When the recording data of the clip information file has the data configuration shown in FIG.
(A) Audio type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
(C) Audio Object Type (audioObjectType) 133
Get these data.

一方、クリップ情報ファイルの記録データが、図19に示すデータ構成を有する場合は、
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
(c)ストリームコンテンツ(stream_content)135
これらのデータを取得する。
On the other hand, when the recording data of the clip information file has the data configuration shown in FIG.
(A) Audio type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
(C) Stream content (stream_content) 135
Get these data.

図16に示す例では、音声オブジェクトタイプ(audioObjectType)133、
図19に示す例では、ストリームコンテンツ(stream_content)135、
これらのデータが、音声ストリームが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれの音声データであるかを示す音声識別情報である。
In the example shown in FIG. 16, the audio object type (audioObjectType) 133,
In the example shown in FIG. 19, the stream content (stream_content) 135,
These data, the audio stream,
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(2) MPEG4 ALS (LATM / LOAS) encoded audio data,
The audio identification information indicates which of these audio data is used.

(ステップS203)
次に、情報処理装置400の制御部401は、ステップS203において、ステップS202でクリップ情報ファイルから読み取った音声識別情報に基づいて、再生対象となる音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれの音声データであるかを判定する。
(Step S203)
Next, in step S203, the control unit 401 of the information processing device 400 generates audio data to be reproduced based on the audio identification information read from the clip information file in step S202.
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(2) MPEG4 ALS (LATM / LOAS) encoded audio data,
It is determined which of these audio data is.

再生対象音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
である場合は、ステップS204に進む。
一方、再生対象音声データが、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
である場合は、ステップS205に進む。
The audio data to be played is
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
If it is, the process proceeds to step S204.
On the other hand, if the audio data to be played is
(2) MPEG4 ALS (LATM / LOAS) encoded audio data,
If it is, the process proceeds to step S205.

(ステップS204)
再生対象音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
である場合は、情報処理装置400の制御部401は、ステップS204において、MPEG4 AAC LC(LATM/LOAS)符号化音声データ対応のコーデックを適用した復号、再生処理を実行する。
(Step S204)
The audio data to be played is
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
In step S204, the control unit 401 of the information processing apparatus 400 executes decoding and reproduction processing using a codec compatible with MPEG4 AAC LC (LATM / LOAS) encoded audio data.

(ステップS205)
一方、再生対象音声データが、
(1)MPEG4 ALS(LATM/LOAS)符号化音声データ、
である場合は、情報処理装置400の制御部401は、ステップS205において、MPEG4 ALS(LATM/LOAS)符号化音声データ対応のコーデックを適用した復号、再生処理を実行する。
(Step S205)
On the other hand, if the audio data to be played is
(1) MPEG4 ALS (LATM / LOAS) encoded audio data,
In step S205, the control unit 401 of the information processing apparatus 400 performs decoding and reproduction processing using a codec compatible with MPEG4 ALS (LATM / LOAS) encoded audio data.

このように、クリップ情報ファイルには、再生対象となる音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれの音声データであるかを示す音声識別情報が記録されており、この情報を参照することで、正しい復号処理、再生処理を迅速に実行することが可能となる。
As described above, the clip information file contains the audio data to be reproduced.
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(2) MPEG4 ALS (LATM / LOAS) encoded audio data,
Audio identification information indicating which of these audio data is recorded is recorded, and by referring to this information, it is possible to quickly execute a correct decoding process and a reproducing process.

次に、1つの番組等のコンテンツに対して、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これら2種類の音声データが設定され、ユーザ(視聴者)による選択再生を可能としたコンテンツの再生シーケンス例について図33に示すフローチャートを参照して説明する。
Next, for content such as one program,
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(2) MPEG4 ALS (LATM / LOAS) encoded audio data,
An example of a content reproduction sequence in which these two types of audio data are set and which can be selectively reproduced by a user (viewer) will be described with reference to the flowchart shown in FIG.

図33に示すフローに従った処理は、例えば情報処理装置400の記憶部に格納されたプログラムに従って、プログラム実行機能を有するCPUを備えたデータ処理部(制御部)の制御の下で実行することができる。
以下、図33のフローに示す各ステップの処理について、順次、説明する。
The processing according to the flow illustrated in FIG. 33 is executed under the control of a data processing unit (control unit) including a CPU having a program execution function, for example, according to a program stored in a storage unit of the information processing device 400. Can be.
Hereinafter, the processing of each step shown in the flow of FIG. 33 will be sequentially described.

(ステップS301)
まず、情報処理装置400の制御部401は、ステップS301において、クリップ情報ファイルを取得する。
なお、ここで選択するクリップAVストリームファイルは、MMTフォーマットデータを格納したクリップAVストリームファイルの再生に利用するクリップAVストリームファイルであるものとする。
(Step S301)
First, in step S301, the control unit 401 of the information processing apparatus 400 acquires a clip information file.
It is assumed that the clip AV stream file selected here is a clip AV stream file used for reproducing the clip AV stream file storing the MMT format data.

(ステップS302〜S303)
次に、情報処理装置400の制御部401は、ステップS302〜S303において、クリップ情報ファイルに記録されたストリームコーディングタイプ=0x11の以下の記録フィールドの記録情報に基づいて、再生対象音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記の2種類の符号化音声データを選択再生可能であるか否かを確認する。
(Steps S302 to S303)
Next, in steps S302 to S303, the control unit 401 of the information processing apparatus 400 converts the audio data to be played back based on the recording information of the following recording field of stream coding type = 0x11 recorded in the clip information file.
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(2) MPEG4 ALS (LATM / LOAS) encoded audio data,
It is confirmed whether or not the above two types of encoded audio data can be selectively reproduced.

これは、具体的には、図16、または図19に示すクリップ情報ファイルのプログラム情報[ProgramInfo()]のストリームコーディング情報[StreamCodingInfo]の記録データに含まれる以下の情報を取得する処理である。   Specifically, this is a process of acquiring the following information included in the recording data of the stream coding information [StreamCodingInfo] of the program information [ProgramInfo ()] of the clip information file shown in FIG. 16 or FIG.

クリップ情報ファイルの記録データが、図16に示すデータ構成を有する場合は、
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
(c)音声オブジェクトタイプ(audioObjectType)133
これらのデータを取得する。
When the recording data of the clip information file has the data configuration shown in FIG.
(A) Audio type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
(C) Audio Object Type (audioObjectType) 133
Get these data.

一方、クリップ情報ファイルの記録データが、図19に示すデータ構成を有する場合は、
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
(c)ストリームコンテンツ(stream_content)135
これらのデータを取得する。
On the other hand, when the recording data of the clip information file has the data configuration shown in FIG.
(A) Audio type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
(C) Stream content (stream_content) 135
Get these data.

図16に示す例では、音声オブジェクトタイプ(audioObjectType)133、
図19に示す例では、ストリームコンテンツ(stream_content)135、
これらのデータは、音声ストリーム単位で記録されており、1つの番組等のコンテンツに複数の音声ストリームが設定されている場合、各音声ストリーム単位で、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれの音声データであるかを示す音声識別情報が記録されている。
In the example shown in FIG. 16, the audio object type (audioObjectType) 133,
In the example shown in FIG. 19, the stream content (stream_content) 135,
These data are recorded in units of audio streams, and when a plurality of audio streams are set in content such as one program, each audio stream is
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(2) MPEG4 ALS (LATM / LOAS) encoded audio data,
Audio identification information indicating which of these audio data is recorded.

ステップS302〜S303では、クリップ情報ファイルの記録データを参照して、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記の2種類の符号化音声データを選択再生可能であるか否かを確認する。
In steps S302 to S303, referring to the recording data of the clip information file,
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(2) MPEG4 ALS (LATM / LOAS) encoded audio data,
It is confirmed whether or not the above two types of encoded audio data can be selectively reproduced.

2種類の符号化音声データを選択再生可能であることが確認された場合は、ステップS304に進む。
2種類の符号化音声データを選択再生可能でなく、いずれか一方のみ再生可能であることが確認された場合は、ステップS305に進む。
If it is confirmed that two types of encoded audio data can be selectively reproduced, the process proceeds to step S304.
If it is confirmed that the two types of encoded audio data cannot be selectively reproduced and only one of them can be reproduced, the process proceeds to step S305.

(ステップS304)
2種類の符号化音声データを選択再生可能であることが確認された場合は、ステップS304において、情報処理装置400の制御部401は、MPEG4 AAC LC符号化音声データと、MPEG4 ALS符号化音声データの2つの音声データを、ユーザ(視聴者)に選択させるための表示情報を提示して、ユーザによる選択情報を入力する。
(Step S304)
If it is confirmed that the two types of encoded audio data can be selectively reproduced, in step S304, the control unit 401 of the information processing apparatus 400 determines whether the MPEG4 AAC LC encoded audio data and the MPEG4 ALS encoded audio data The display information for allowing the user (viewer) to select the two pieces of audio data is presented, and the information selected by the user is input.

(ステップS305)
ステップS304において、ユーザからの選択情報を入力した場合、または、
ステップS303で、2種類の符号化音声データを選択再生可能でなく、いずれか一方のみ再生可能であることが確認された場合は、ステップS305に進む。
(Step S305)
In step S304, when selection information is input from the user, or
If it is determined in step S303 that the two types of encoded audio data cannot be selectively reproduced and only one of them can be reproduced, the process proceeds to step S305.

情報処理装置400の制御部401は、ステップS305において、再生可能な1つの音声データ、またはユーザによって選択された音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれの音声データであるかを判定する。
In step S305, the control unit 401 of the information processing device 400 determines that one piece of reproducible audio data or the audio data selected by the user is
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(2) MPEG4 ALS (LATM / LOAS) encoded audio data,
It is determined which of these audio data is.

再生可能な1つの音声データ、またはユーザによって選択された音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
である場合は、ステップS306に進む。
一方、再生可能な1つの音声データ、またはユーザによって選択された音声データが、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
である場合は、ステップS307に進む。
One audio data that can be reproduced or audio data selected by the user is
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
If it is, the process proceeds to step S306.
On the other hand, one audio data that can be reproduced or audio data selected by the user is
(2) MPEG4 ALS (LATM / LOAS) encoded audio data,
If it is, the process proceeds to step S307.

(ステップS306)
再生可能な1つの音声データ、またはユーザによって選択された音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
である場合は、情報処理装置400の制御部401は、ステップS306において、MPEG4 AAC LC(LATM/LOAS)符号化音声データ対応のコーデックを適用した復号、再生処理を実行する。
(Step S306)
One audio data that can be reproduced or audio data selected by the user is
(1) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
In step S306, the control unit 401 of the information processing apparatus 400 performs decoding and reproduction processing using a codec that supports MPEG4 AAC LC (LATM / LOAS) encoded audio data.

(ステップS307)
一方、再生可能な1つの音声データ、またはユーザによって選択された音声データが、
(1)MPEG4 ALS(LATM/LOAS)符号化音声データ、
である場合は、情報処理装置400の制御部401は、ステップS307において、MPEG4 ALS(LATM/LOAS)符号化音声データ対応のコーデックを適用した復号、再生処理を実行する。
(Step S307)
On the other hand, one audio data that can be reproduced or audio data selected by the user is
(1) MPEG4 ALS (LATM / LOAS) encoded audio data,
In step S307, the control unit 401 of the information processing apparatus 400 performs decoding and reproduction processing using a codec that supports MPEG4 ALS (LATM / LOAS) encoded audio data.

[9.情報処理装置の構成例について]
次に、情報記録媒体に対するデータ記録、情報記録媒体からのデータ再生を実行する情報処理装置として適用可能な情報処理装置のハードウェア構成例について、図34を参照して説明する。
[9. Configuration Example of Information Processing Device]
Next, an example of a hardware configuration of an information processing apparatus applicable as an information processing apparatus that executes data recording on an information recording medium and data reproduction from the information recording medium will be described with reference to FIG.

CPU(Central Processing Unit)601は、ROM(Read Only Memory)602、または記憶部608に記憶されているプログラムに従って各種の処理を実行するデータ処理部として機能する。例えば、上述した実施例において説明したシーケンスに従った処理を実行する。RAM(Random Access Memory)603には、CPU601が実行するプログラムやデータなどが記憶される。これらのCPU601、ROM602、およびRAM603は、バス604により相互に接続されている。   A CPU (Central Processing Unit) 601 functions as a data processing unit that executes various processes according to a program stored in a ROM (Read Only Memory) 602 or a storage unit 608. For example, the processing according to the sequence described in the above embodiment is executed. A RAM (Random Access Memory) 603 stores programs executed by the CPU 601 and data. The CPU 601, the ROM 602, and the RAM 603 are interconnected by a bus 604.

CPU601はバス604を介して入出力インタフェース605に接続され、入出力インタフェース605には、各種スイッチ、キーボード、マウス、マイクロホンなどよりなる入力部606、ディスプレイ、スピーカなどよりなる出力部607が接続されている。CPU601は、入力部606から入力される指令に対応して各種の処理を実行し、処理結果を例えば出力部607に出力する。   The CPU 601 is connected to an input / output interface 605 via a bus 604, and an input unit 606 including various switches, a keyboard, a mouse, a microphone, and the like, and an output unit 607 including a display, a speaker, and the like are connected to the input / output interface 605. I have. The CPU 601 executes various processes in response to a command input from the input unit 606, and outputs a processing result to, for example, the output unit 607.

入出力インタフェース605に接続されている記憶部608は、例えばハードディスク等からなり、CPU601が実行するプログラムや各種のデータを記憶する。通信部609は、インターネットやローカルエリアネットワークなどのネットワークを介したデータ通信の送受信部、さらに放送波の送受信部として機能し、外部の装置と通信する。   The storage unit 608 connected to the input / output interface 605 includes, for example, a hard disk and stores programs executed by the CPU 601 and various data. The communication unit 609 functions as a transmission / reception unit for data communication via a network such as the Internet or a local area network, and also as a transmission / reception unit for broadcast waves, and communicates with an external device.

入出力インタフェース605に接続されているドライブ610は、磁気ディスク、光ディスク、光磁気ディスク、あるいはメモリカード等の半導体メモリなどのリムーバブルメディア611を駆動し、データの記録あるいは読み取りを実行する。   A drive 610 connected to the input / output interface 605 drives a removable medium 611 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory such as a memory card to record or read data.

[10.本開示の構成のまとめ]
以上、特定の実施例を参照しながら、本開示の実施例について詳解してきた。しかしながら、本開示の要旨を逸脱しない範囲で当業者が実施例の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、限定的に解釈されるべきではない。本開示の要旨を判断するためには、特許請求の範囲の欄を参酌すべきである。
[10. Summary of Configuration of the Present Disclosure]
The embodiment of the present disclosure has been described in detail with reference to the specific embodiment. However, it is obvious that those skilled in the art can modify or substitute the embodiments without departing from the gist of the present disclosure. That is, the present invention has been disclosed by way of example, and should not be construed as limiting. In order to determine the gist of the present disclosure, the claims should be considered.

なお、本明細書において開示した技術は、以下のような構成をとることができる。
(1) MMTフォーマットデータを入力し、情報記録媒体に対するデータ記録フォーマットであるBDAVフォーマット、またはSPAVフォーマットに従った記録データを生成するデータ処理部を有し、
前記データ処理部は、
情報記録媒体に記録する音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報をBDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルに記録する処理を実行する情報処理装置。
The technology disclosed in the present specification can have the following configurations.
(1) a data processing unit which receives MMT format data and generates recording data in accordance with a BDAV format or a SPAV format which is a data recording format for an information recording medium,
The data processing unit includes:
The audio data to be recorded on the information recording medium is
(A) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(B) MPEG4 ALS (LATM / LOAS) encoded audio data,
An information processing apparatus for executing a process of recording the audio identification information which makes it possible to identify which of the above (a) and (b) the audio data is in a database file of BDAV format or SPAV format.

(2) 前記データ処理部は、
前記音声識別情報をクリップ情報ファイルに記録する(1)に記載の情報処理装置。
(2) The data processing unit includes:
The information processing apparatus according to (1), wherein the audio identification information is recorded in a clip information file.

(3) 前記データ処理部は、
音声データ格納パケットから前記音声識別情報を抽出して、前記データベースファイルに記録する(1)または(2)に記載の情報処理装置。
(3) The data processing unit includes:
The information processing apparatus according to (1) or (2), wherein the voice identification information is extracted from a voice data storage packet and recorded in the database file.

(4) 前記データ処理部は、
音声データ格納パケット内に記録された音声オブジェクトタイプ(audioObjectType)を抽出して、前記音声識別情報として前記データベースファイルに記録する(1)または(2)に記載の情報処理装置。
(4) The data processing unit includes:
The information processing apparatus according to (1) or (2), wherein an audio object type (audioObjectType) recorded in the audio data storage packet is extracted and recorded in the database file as the audio identification information.

(5) 前記データ処理部は、
MMTパッケージテーブル(MPT)から前記音声識別情報を抽出して、前記データベースファイルに記録する(1)または(2)に記載の情報処理装置。
(5) The data processing unit includes:
The information processing apparatus according to (1) or (2), wherein the voice identification information is extracted from an MMT package table (MPT) and recorded in the database file.

(6) 前記データ処理部は、
MMTパッケージテーブル(MPT)に記録されたストリームコンテンツ(stream_content)を抽出して、前記音声識別情報として前記データベースファイルに記録する(1)または(2)に記載の情報処理装置。
(6) The data processing unit includes:
The information processing apparatus according to (1) or (2), wherein stream information (stream_content) recorded in an MMT package table (MPT) is extracted and recorded in the database file as the audio identification information.

(7) 前記データ処理部は、
前記音声識別情報をクリップ情報ファイルのストリームコーディング情報[StreamCodingInfo]記録領域の同じコーディングタイプ(stream_coding_type)の属性情報記録領域に、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報を記録する(1)〜(6)いずれかに記載の情報処理装置。
(7) The data processing unit includes:
The audio identification information is stored in the attribute information recording area of the same coding type (stream_coding_type) in the stream coding information [Stream Coding Info] recording area of the clip information file.
(A) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(B) MPEG4 ALS (LATM / LOAS) encoded audio data,
(1) The information processing apparatus according to any one of (1) to (6), which records audio identification information that makes it possible to identify which of the audio data is (a) and (b).

(8) 前記同じコーディングタイプ(stream_coding_type)は、0x11である(7)に記載の情報処理装置。   (8) The information processing device according to (7), wherein the same coding type (stream_coding_type) is 0x11.

(9) 情報記録媒体の記録データの再生処理を実行するデータ処理部を有し、
前記情報記録媒体は、MMTフォーマットデータを、BDAVフォーマット、またはSPAVフォーマットに従って記録したデータを格納した情報記録媒体であり、
前記データ処理部は、
BDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルであるプレイリストファイルとクリップ情報ファイルの記録情報を利用して、前記情報記録媒体に記録されたMMTフォーマットデータの再生処理を実行する構成であり、
前記データ処理部は、
再生対象の音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれのデータであるかを示す音声識別情報を、前記データベースファイルから取得し、取得情報に従って音声データの復号処理を実行する情報処理装置。
(9) a data processing unit for executing a process of reproducing recorded data on the information recording medium,
The information recording medium is an information recording medium storing data recorded in accordance with BDMT format or SPAV format in MMT format data,
The data processing unit includes:
A configuration for executing reproduction processing of MMT format data recorded on the information recording medium by using recording information of a playlist file and a clip information file, which are database files defined in the BDAV format or the SPAV format,
The data processing unit includes:
The audio data to be played is
(A) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(B) MPEG4 ALS (LATM / LOAS) encoded audio data,
An information processing apparatus that acquires voice identification information indicating which of the data (a) and (b) is from the database file, and executes a decoding process of the voice data according to the acquired information.

(10) 前記データ処理部は、
前記音声識別情報をクリップ情報ファイルから取得する(9)に記載の情報処理装置。
(10) The data processing unit includes:
The information processing device according to (9), wherein the audio identification information is obtained from a clip information file.

(11) 前記データ処理部は、
前記音声識別情報をクリップ情報ファイルのストリームコーディング情報[StreamCodingInfo]記録領域の同じコーディングタイプ(stream_coding_type)の属性情報記録領域から取得する(9)または(10)に記載の情報処理装置。
(11) The data processing unit includes:
The information processing apparatus according to (9) or (10), wherein the audio identification information is obtained from an attribute information recording area of the same coding type (stream_coding_type) in a stream coding information [StreamCodingInfo] recording area of a clip information file.

(12) 前記同じコーディングタイプ(stream_coding_type)は、0x11である(11)に記載の情報処理装置。   (12) The information processing device according to (11), wherein the same coding type (stream_coding_type) is 0x11.

(13) 前記データ処理部は、
前記データベースファイルから取得した音声識別情報に基づいて、
再生可能な音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)の2種類のデータであると判定した場合、
再生対象とする音声データをユーザに選択させる表示情報を出力する(9)〜(12)いずれかに記載の情報処理装置。
(13) The data processing unit includes:
Based on the voice identification information obtained from the database file,
Playable audio data
(A) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(B) MPEG4 ALS (LATM / LOAS) encoded audio data,
If it is determined that the data is the two types of data (a) and (b),
The information processing apparatus according to any one of (9) to (12), which outputs display information for allowing a user to select audio data to be reproduced.

(14) 前記データ処理部は、
前記表示情報に対するユーザ選択情報を入力し、入力した選択情報に従って、再生対象とする音声データを選択する(13)に記載の情報処理装置。
(14) The data processing unit includes:
The information processing apparatus according to (13), wherein user selection information for the display information is input, and audio data to be reproduced is selected according to the input selection information.

(15) BDAVフォーマット、またはSPAVフォーマットに従った記録データを記録した情報記録媒体であり、
情報記録媒体に記録された音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報をBDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルに記録した構成を有し、
再生装置が、前記データベースファイルに記録された音声識別情報に従って、再生対象とした音声データの種類を識別可能とした情報記録媒体。
(15) An information recording medium on which recording data according to the BDAV format or the SPAV format is recorded,
The audio data recorded on the information recording medium is
(A) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(B) MPEG4 ALS (LATM / LOAS) encoded audio data,
(A) or (b) a configuration in which audio identification information enabling identification of the audio data is recorded in a database file of BDAV format or SPAV format.
An information recording medium in which a reproducing device can identify a type of audio data to be reproduced according to audio identification information recorded in the database file.

(16) BDAVフォーマット、またはSPAVフォーマットに従った記録データが記録される情報記録媒体であり、
情報記録媒体に記録される音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報を含むBDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルを有し、
再生装置が、前記データベースファイルの音声識別情報に従って、再生対象とした音声データの種類を識別可能とした情報記録媒体。
(16) An information recording medium on which recording data according to the BDAV format or the SPAV format is recorded,
The audio data recorded on the information recording medium is
(A) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(B) MPEG4 ALS (LATM / LOAS) encoded audio data,
A database file of a BDAV format or a SPAV format definition including audio identification information that makes it possible to identify which of the above (a) and (b) audio data,
An information recording medium in which a reproducing device can identify a type of audio data to be reproduced according to the audio identification information of the database file.

(17) 情報処理装置において実行する情報処理方法であり、
前記情報処理装置は、
MMTフォーマットデータを入力し、情報記録媒体に対するデータ記録フォーマットであるBDAVフォーマット、またはSPAVフォーマットに従った記録データを生成するデータ処理部を有し、
前記データ処理部が、
情報記録媒体に記録する音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報をBDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルに記録する処理を実行する情報処理方法。
(17) An information processing method executed by the information processing apparatus,
The information processing device,
A data processing unit for inputting MMT format data and generating recording data according to a BDAV format or a SPAV format which is a data recording format for an information recording medium,
The data processing unit includes:
The audio data to be recorded on the information recording medium is
(A) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(B) MPEG4 ALS (LATM / LOAS) encoded audio data,
An information processing method for executing a process of recording the audio identification information that makes it possible to identify which of the above (a) and (b) the audio data is in a database file defined in the BDAV format or the SPAV format.

(18) 情報処理装置において実行する情報処理方法であり、
前記情報処理装置は、
情報記録媒体の記録データの再生処理を実行するデータ処理部を有し、
前記情報記録媒体は、MMTフォーマットデータを、BDAVフォーマット、またはSPAVフォーマットに従って記録したデータを格納した情報記録媒体であり、
前記データ処理部が、
BDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルであるプレイリストファイルとクリップ情報ファイルの記録情報を利用して、前記情報記録媒体に記録されたMMTフォーマットデータの再生処理を実行し、
前記再生処理に際して、再生対象の音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれのデータであるかを示す音声識別情報を、前記データベースファイルから取得し、取得情報に従って音声データの復号処理を実行する情報処理方法。
(18) An information processing method executed by the information processing apparatus,
The information processing device,
A data processing unit that executes a reproduction process of the recording data of the information recording medium,
The information recording medium is an information recording medium storing data recorded in accordance with BDMT format or SPAV format in MMT format data,
The data processing unit includes:
Using the recording information of the playlist file and the clip information file, which are the database files of the BDAV format or the SPAV format, execute the reproduction process of the MMT format data recorded on the information recording medium,
At the time of the reproduction process, audio data to be reproduced is
(A) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(B) MPEG4 ALS (LATM / LOAS) encoded audio data,
An information processing method for acquiring audio identification information indicating which of the above (a) and (b) the data is from the database file, and executing a decoding process of the audio data according to the acquired information.

(19) 情報処理装置において実行する情報処理を実行させるプログラムであり、
前記情報処理装置は、
MMTフォーマットデータを入力し、情報記録媒体に対するデータ記録フォーマットであるBDAVフォーマット、またはSPAVフォーマットに従った記録データを生成するデータ処理部を有し、
前記プログラムは、前記データ処理部に、
情報記録媒体に記録する音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報をBDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルに記録する処理を実行させるプログラム。
(19) A program for executing information processing executed in the information processing apparatus,
The information processing device,
A data processing unit for inputting MMT format data and generating recording data according to a BDAV format or a SPAV format which is a data recording format for an information recording medium,
The program, the data processing unit,
The audio data to be recorded on the information recording medium is
(A) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(B) MPEG4 ALS (LATM / LOAS) encoded audio data,
A program for executing a process of recording the audio identification information that makes it possible to identify which of the above (a) and (b) the audio data is in a database file defined in the BDAV format or the SPAV format.

(20) 情報処理装置において実行する情報処理を実行させるプログラムであり、
前記情報処理装置は、
情報記録媒体の記録データの再生処理を実行するデータ処理部を有し、
前記情報記録媒体は、MMTフォーマットデータを、BDAVフォーマット、またはSPAVフォーマットに従って記録したデータを格納した情報記録媒体であり、
前記プログラムは、前記データ処理部に、
BDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルであるプレイリストファイルとクリップ情報ファイルの記録情報を利用して、前記情報記録媒体に記録されたMMTフォーマットデータの再生処理を実行させ、
前記再生処理に際して、再生対象の音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれのデータであるかを示す音声識別情報を、前記データベースファイルから取得させ、取得情報に従って音声データの復号処理を行わせるプログラム。
(20) A program for executing information processing executed in the information processing apparatus,
The information processing device,
A data processing unit that executes a reproduction process of the recording data of the information recording medium,
The information recording medium is an information recording medium storing data recorded in accordance with BDMT format or SPAV format in MMT format data,
The program, the data processing unit,
Using the recording information of the playlist file and the clip information file, which are the database files of the BDAV format or the SPAV format, the reproducing process of the MMT format data recorded on the information recording medium is executed,
At the time of the reproduction process, audio data to be reproduced is
(A) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(B) MPEG4 ALS (LATM / LOAS) encoded audio data,
A program for acquiring, from the database file, audio identification information indicating which of the above (a) and (b) the data is, and performing a decoding process on the audio data according to the acquired information.

また、明細書中において説明した一連の処理はハードウェア、またはソフトウェア、あるいは両者の複合構成によって実行することが可能である。ソフトウェアによる処理を実行する場合は、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれたコンピュータ内のメモリにインストールして実行させるか、あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。例えば、プログラムは記録媒体に予め記録しておくことができる。記録媒体からコンピュータにインストールする他、LAN(Local Area Network)、インターネットといったネットワークを介してプログラムを受信し、内蔵するハードディスク等の記録媒体にインストールすることができる。   Further, the series of processes described in the specification can be executed by hardware, software, or a combination of both. When processing by software is performed, the program recording the processing sequence is installed in a memory in a computer built in dedicated hardware and executed, or the program is stored in a general-purpose computer capable of executing various processing. It can be installed and run. For example, the program can be recorded in a recording medium in advance. In addition to installing the program from the recording medium to the computer, the program can be received via a network such as a LAN (Local Area Network) or the Internet, and installed on a recording medium such as a built-in hard disk.

なお、明細書に記載された各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。また、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。   The various processes described in the specification may be executed not only in chronological order according to the description, but also in parallel or individually according to the processing capacity of the device that executes the processes or as necessary. Further, in this specification, a system is a logical set configuration of a plurality of devices, and the devices of each configuration are not limited to those in the same housing.

以上、説明したように、本開示の一実施例の構成によれば、メディア記録MMTフォーマット音声データが、MPEG4 AAC LC音声データか、MPEG4 ALS音声データかを迅速に確認可能とした構成が実現される。
具体的には、例えば、メディアに記録するMMTフォーマット音声データが、MPEG4 AAC LC音声データであるか、MPEG4 ALS音声データであるかを示す音声識別情報を記録したクリップ情報ファイルを生成してメディアに記録する。再生装置は、クリップ情報ファイルに記録された音声識別情報に基づいて、再生対象とする音声データが、MPEG4 AAC LC音声データであるか、MPEG4 ALS音声データであるかを識別し、迅速な復号、再生を行うことができる。
本構成により、メディア記録MMTフォーマット音声データが、MPEG4 AAC LC音声データか、MPEG4 ALS音声データかを迅速に確認可能とした構成が実現される。
As described above, according to the configuration of the embodiment of the present disclosure, a configuration is realized in which it is possible to quickly confirm whether the media recording MMT format audio data is MPEG4 AAC LC audio data or MPEG4 ALS audio data. You.
More specifically, for example, a clip information file that records audio identification information indicating whether the MMT format audio data to be recorded on the medium is MPEG4 AAC LC audio data or MPEG4 ALS audio data is generated, and the clip information file is generated on the medium. Record. The playback device identifies whether the audio data to be played back is MPEG4 AAC LC audio data or MPEG4 ALS audio data based on the audio identification information recorded in the clip information file, and quickly decodes the audio data. Playback can be performed.
With this configuration, a configuration is realized in which it is possible to quickly confirm whether the media-recorded MMT format audio data is MPEG4 AAC LC audio data or MPEG4 ALS audio data.

20 送信装置
21 放送サーバ
22 データ配信サーバ
30 情報処理装置
31 記録再生装置
32 TV
33 PC
34 携帯端末
40 情報記録媒体(メディア)
41 BD
42 HDD
43 フラッシュメモリ
300 情報処理装置
301 データ入力部
302 ユーザ入力部
303 制御部
304 記憶部
305 デマルチプレクサ
306 記録データ生成部
307 記録部
308 ドライブ
311 字幕データ生成部
312 画像データ生成部
313 音声データ生成部
314 補助情報生成部
315 マルチプレクサ
316 データベースファイル生成部
320 情報記録媒体
400 情報処理装置
401 制御部
402 ユーザ入力部
403 ドライブ
404 記録再生部
405 記憶部
406 再生処理部
407 入出力I/F
411 デマルチプレクサ
412 字幕データ生成部
413 画像データ生成部
414 音声データ生成部
415 補助情報生成部
416 出力データ生成部
510 情報記録媒体
520 出力装置(表示部+スピーカ)
601 CPU
602 ROM
603 RAM
604 バス
605 入出力インタフェース
606 入力部
607 出力部
608 記憶部
609 通信部
610 ドライブ
611 リムーバブルメディア
Reference Signs List 20 transmission device 21 broadcast server 22 data distribution server 30 information processing device 31 recording / reproducing device 32 TV
33 PC
34 Mobile terminal 40 Information recording medium (media)
41 BD
42 HDD
43 Flash memory 300 Information processing device 301 Data input unit 302 User input unit 303 Control unit 304 Storage unit 305 Demultiplexer 306 Recording data generation unit 307 Recording unit 308 Drive 311 Caption data generation unit 312 Image data generation unit 313 Audio data generation unit 314 Auxiliary information generation unit 315 Multiplexer 316 Database file generation unit 320 Information recording medium 400 Information processing device 401 Control unit 402 User input unit 403 Drive 404 Recording / playback unit 405 Storage unit 406 Playback processing unit 407 Input / output I / F
411 Demultiplexer 412 Caption data generator 413 Image data generator 414 Audio data generator 415 Auxiliary information generator 416 Output data generator 510 Information recording medium 520 Output device (display unit + speaker)
601 CPU
602 ROM
603 RAM
604 Bus 605 Input / output interface 606 Input unit 607 Output unit 608 Storage unit 609 Communication unit 610 Drive 611 Removable media

Claims (20)

MMTフォーマットデータを入力し、情報記録媒体に対するデータ記録フォーマットであるBDAVフォーマット、またはSPAVフォーマットに従った記録データを生成するデータ処理部を有し、
前記データ処理部は、
情報記録媒体に記録する音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報をBDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルに記録する処理を実行する情報処理装置。
A data processing unit for inputting MMT format data and generating recording data according to a BDAV format or a SPAV format which is a data recording format for an information recording medium,
The data processing unit includes:
The audio data to be recorded on the information recording medium is
(A) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(B) MPEG4 ALS (LATM / LOAS) encoded audio data,
An information processing apparatus for executing a process of recording the audio identification information which makes it possible to identify which of the above (a) and (b) the audio data is in a database file of BDAV format or SPAV format.
前記データ処理部は、
前記音声識別情報をクリップ情報ファイルに記録する請求項1に記載の情報処理装置。
The data processing unit includes:
2. The information processing apparatus according to claim 1, wherein the audio identification information is recorded in a clip information file.
前記データ処理部は、
音声データ格納パケットから前記音声識別情報を抽出して、前記データベースファイルに記録する請求項1に記載の情報処理装置。
The data processing unit includes:
The information processing apparatus according to claim 1, wherein the voice identification information is extracted from the voice data storage packet and recorded in the database file.
前記データ処理部は、
音声データ格納パケット内に記録された音声オブジェクトタイプ(audioObjectType)を抽出して、前記音声識別情報として前記データベースファイルに記録する請求項1に記載の情報処理装置。
The data processing unit includes:
The information processing apparatus according to claim 1, wherein an audio object type (audioObjectType) recorded in the audio data storage packet is extracted and recorded in the database file as the audio identification information.
前記データ処理部は、
MMTパッケージテーブル(MPT)から前記音声識別情報を抽出して、前記データベースファイルに記録する請求項1に記載の情報処理装置。
The data processing unit includes:
The information processing apparatus according to claim 1, wherein the voice identification information is extracted from an MMT package table (MPT) and recorded in the database file.
前記データ処理部は、
MMTパッケージテーブル(MPT)に記録されたストリームコンテンツ(stream_content)を抽出して、前記音声識別情報として前記データベースファイルに記録する請求項1に記載の情報処理装置。
The data processing unit includes:
The information processing apparatus according to claim 1, wherein the stream content (stream_content) recorded in an MMT package table (MPT) is extracted and recorded in the database file as the audio identification information.
前記データ処理部は、
前記音声識別情報をクリップ情報ファイルのストリームコーディング情報[StreamCodingInfo]記録領域の同じコーディングタイプ(stream_coding_type)の属性情報記録領域に、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報を記録する請求項1に記載の情報処理装置。
The data processing unit includes:
The audio identification information is stored in the attribute information recording area of the same coding type (stream_coding_type) in the stream coding information [Stream Coding Info] recording area of the clip information file.
(A) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(B) MPEG4 ALS (LATM / LOAS) encoded audio data,
2. The information processing apparatus according to claim 1, wherein the voice identification information is recorded so that the voice data can be identified as either (a) or (b).
前記同じコーディングタイプ(stream_coding_type)は、0x11である請求項7に記載の情報処理装置。   The information processing apparatus according to claim 7, wherein the same coding type (stream_coding_type) is 0x11. 情報記録媒体の記録データの再生処理を実行するデータ処理部を有し、
前記情報記録媒体は、MMTフォーマットデータを、BDAVフォーマット、またはSPAVフォーマットに従って記録したデータを格納した情報記録媒体であり、
前記データ処理部は、
BDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルであるプレイリストファイルとクリップ情報ファイルの記録情報を利用して、前記情報記録媒体に記録されたMMTフォーマットデータの再生処理を実行する構成であり、
前記データ処理部は、
再生対象の音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれのデータであるかを示す音声識別情報を、前記データベースファイルから取得し、取得情報に従って音声データの復号処理を実行する情報処理装置。
A data processing unit that executes a reproduction process of the recording data of the information recording medium,
The information recording medium is an information recording medium storing data recorded in accordance with BDMT format or SPAV format in MMT format data,
The data processing unit includes:
A configuration for executing reproduction processing of MMT format data recorded on the information recording medium by using recording information of a playlist file and a clip information file, which are database files defined in the BDAV format or the SPAV format,
The data processing unit includes:
The audio data to be played is
(A) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(B) MPEG4 ALS (LATM / LOAS) encoded audio data,
An information processing apparatus that acquires voice identification information indicating which of the data (a) and (b) is from the database file, and executes a decoding process of the voice data according to the acquired information.
前記データ処理部は、
前記音声識別情報をクリップ情報ファイルから取得する請求項9に記載の情報処理装置。
The data processing unit includes:
The information processing apparatus according to claim 9, wherein the audio identification information is obtained from a clip information file.
前記データ処理部は、
前記音声識別情報をクリップ情報ファイルのストリームコーディング情報[StreamCodingInfo]記録領域の同じコーディングタイプ(stream_coding_type)の属性情報記録領域から取得する請求項9に記載の情報処理装置。
The data processing unit includes:
The information processing apparatus according to claim 9, wherein the audio identification information is obtained from an attribute information recording area of the same coding type (stream_coding_type) in a stream coding information [StreamCodingInfo] recording area of a clip information file.
前記同じコーディングタイプ(stream_coding_type)は、0x11である請求項11に記載の情報処理装置。   The information processing apparatus according to claim 11, wherein the same coding type (stream_coding_type) is 0x11. 前記データ処理部は、
前記データベースファイルから取得した音声識別情報に基づいて、
再生可能な音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)の2種類のデータであると判定した場合、
再生対象とする音声データをユーザに選択させる表示情報を出力する請求項9に記載の情報処理装置。
The data processing unit includes:
Based on the voice identification information obtained from the database file,
Playable audio data
(A) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(B) MPEG4 ALS (LATM / LOAS) encoded audio data,
If it is determined that the data is the two types of data (a) and (b),
The information processing apparatus according to claim 9, wherein display information for allowing a user to select audio data to be reproduced is output.
前記データ処理部は、
前記表示情報に対するユーザ選択情報を入力し、入力した選択情報に従って、再生対象とする音声データを選択する請求項13に記載の情報処理装置。
The data processing unit includes:
14. The information processing apparatus according to claim 13, wherein user selection information for the display information is input, and audio data to be reproduced is selected according to the input selection information.
BDAVフォーマット、またはSPAVフォーマットに従った記録データを記録した情報記録媒体であり、
情報記録媒体に記録された音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報をBDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルに記録した構成を有し、
再生装置が、前記データベースファイルに記録された音声識別情報に従って、再生対象とした音声データの種類を識別可能とした情報記録媒体。
An information recording medium on which recording data in accordance with a BDAV format or a SPAV format is recorded;
The audio data recorded on the information recording medium is
(A) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(B) MPEG4 ALS (LATM / LOAS) encoded audio data,
(A) or (b) a configuration in which audio identification information enabling identification of the audio data is recorded in a database file of BDAV format or SPAV format.
An information recording medium in which a reproducing device can identify a type of audio data to be reproduced according to audio identification information recorded in the database file.
BDAVフォーマット、またはSPAVフォーマットに従った記録データが記録される情報記録媒体であり、
情報記録媒体に記録される音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報を含むBDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルを有し、
再生装置が、前記データベースファイルの音声識別情報に従って、再生対象とした音声データの種類を識別可能とした情報記録媒体。
An information recording medium on which recording data according to a BDAV format or a SPAV format is recorded;
The audio data recorded on the information recording medium is
(A) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(B) MPEG4 ALS (LATM / LOAS) encoded audio data,
A database file of a BDAV format or a SPAV format definition including audio identification information that makes it possible to identify which of the above (a) and (b) audio data,
An information recording medium in which a reproducing device can identify a type of audio data to be reproduced according to the audio identification information of the database file.
情報処理装置において実行する情報処理方法であり、
前記情報処理装置は、
MMTフォーマットデータを入力し、情報記録媒体に対するデータ記録フォーマットであるBDAVフォーマット、またはSPAVフォーマットに従った記録データを生成するデータ処理部を有し、
前記データ処理部が、
情報記録媒体に記録する音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報をBDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルに記録する処理を実行する情報処理方法。
An information processing method executed in the information processing apparatus,
The information processing device,
A data processing unit for inputting MMT format data and generating recording data according to a BDAV format or a SPAV format which is a data recording format for an information recording medium,
The data processing unit includes:
The audio data to be recorded on the information recording medium is
(A) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(B) MPEG4 ALS (LATM / LOAS) encoded audio data,
An information processing method for executing a process of recording the audio identification information that makes it possible to identify which of the above (a) and (b) the audio data is in a database file defined in the BDAV format or the SPAV format.
情報処理装置において実行する情報処理方法であり、
前記情報処理装置は、
情報記録媒体の記録データの再生処理を実行するデータ処理部を有し、
前記情報記録媒体は、MMTフォーマットデータを、BDAVフォーマット、またはSPAVフォーマットに従って記録したデータを格納した情報記録媒体であり、
前記データ処理部が、
BDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルであるプレイリストファイルとクリップ情報ファイルの記録情報を利用して、前記情報記録媒体に記録されたMMTフォーマットデータの再生処理を実行し、
前記再生処理に際して、再生対象の音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれのデータであるかを示す音声識別情報を、前記データベースファイルから取得し、取得情報に従って音声データの復号処理を実行する情報処理方法。
An information processing method executed in the information processing apparatus,
The information processing device,
A data processing unit that executes a reproduction process of the recording data of the information recording medium,
The information recording medium is an information recording medium storing data recorded in accordance with BDMT format or SPAV format in MMT format data,
The data processing unit includes:
Using the recording information of the playlist file and the clip information file, which are the database files of the BDAV format or the SPAV format, execute the reproduction process of the MMT format data recorded on the information recording medium,
At the time of the reproduction process, audio data to be reproduced is
(A) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(B) MPEG4 ALS (LATM / LOAS) encoded audio data,
An information processing method for acquiring audio identification information indicating which of the above (a) and (b) the data is from the database file, and executing a decoding process of the audio data according to the acquired information.
情報処理装置において実行する情報処理を実行させるプログラムであり、
前記情報処理装置は、
MMTフォーマットデータを入力し、情報記録媒体に対するデータ記録フォーマットであるBDAVフォーマット、またはSPAVフォーマットに従った記録データを生成するデータ処理部を有し、
前記プログラムは、前記データ処理部に、
情報記録媒体に記録する音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報をBDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルに記録する処理を実行させるプログラム。
A program for executing information processing executed in the information processing apparatus,
The information processing device,
A data processing unit for inputting MMT format data and generating recording data according to a BDAV format or a SPAV format which is a data recording format for an information recording medium,
The program, the data processing unit,
The audio data to be recorded on the information recording medium is
(A) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(B) MPEG4 ALS (LATM / LOAS) encoded audio data,
A program for executing a process of recording the audio identification information that makes it possible to identify which of the above (a) and (b) the audio data is in a database file defined in the BDAV format or the SPAV format.
情報処理装置において実行する情報処理を実行させるプログラムであり、
前記情報処理装置は、
情報記録媒体の記録データの再生処理を実行するデータ処理部を有し、
前記情報記録媒体は、MMTフォーマットデータを、BDAVフォーマット、またはSPAVフォーマットに従って記録したデータを格納した情報記録媒体であり、
前記プログラムは、前記データ処理部に、
BDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルであるプレイリストファイルとクリップ情報ファイルの記録情報を利用して、前記情報記録媒体に記録されたMMTフォーマットデータの再生処理を実行させ、
前記再生処理に際して、再生対象の音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれのデータであるかを示す音声識別情報を、前記データベースファイルから取得させ、取得情報に従って音声データの復号処理を行わせるプログラム。
A program for executing information processing executed in the information processing apparatus,
The information processing device,
A data processing unit that executes a reproduction process of the recording data of the information recording medium,
The information recording medium is an information recording medium storing data recorded in accordance with BDMT format or SPAV format in MMT format data,
The program, the data processing unit,
Using the recording information of the playlist file and the clip information file, which are the database files of the BDAV format or the SPAV format, the reproducing process of the MMT format data recorded on the information recording medium is executed,
At the time of the reproduction process, audio data to be reproduced is
(A) MPEG4 AAC LC (LATM / LOAS) encoded audio data,
(B) MPEG4 ALS (LATM / LOAS) encoded audio data,
A program for acquiring, from the database file, audio identification information indicating which of the above (a) and (b) the data is, and performing a decoding process on the audio data according to the acquired information.
JP2019519529A 2017-05-24 2018-04-25 Information processing equipment, information recording media, information processing methods, and programs Active JP7070564B2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2017102256 2017-05-24
JP2017102256 2017-05-24
PCT/JP2018/016828 WO2018216424A1 (en) 2017-05-24 2018-04-25 Information processing device, information recording medium, information processing method, and program

Publications (2)

Publication Number Publication Date
JPWO2018216424A1 true JPWO2018216424A1 (en) 2020-03-26
JP7070564B2 JP7070564B2 (en) 2022-05-18

Family

ID=64395649

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019519529A Active JP7070564B2 (en) 2017-05-24 2018-04-25 Information processing equipment, information recording media, information processing methods, and programs

Country Status (2)

Country Link
JP (1) JP7070564B2 (en)
WO (1) WO2018216424A1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013114716A1 (en) * 2012-02-03 2013-08-08 ソニー株式会社 Information processing device, information recording medium and information processing method, and program
WO2017043378A1 (en) * 2015-09-07 2017-03-16 ソニー株式会社 Transmission device, transmission method, reception device, and reception method
WO2018016294A1 (en) * 2016-07-20 2018-01-25 ソニー株式会社 Information processing device, information processing method, and program
WO2018135258A1 (en) * 2017-01-17 2018-07-26 ソニー株式会社 Information processing device, information recording medium, information processing method, and program
JP2018133124A (en) * 2017-02-15 2018-08-23 パナソニックIpマネジメント株式会社 Recording device, recording method and recording medium

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005198143A (en) * 2004-01-09 2005-07-21 Matsushita Electric Ind Co Ltd Device and method for recording and reproducing information

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013114716A1 (en) * 2012-02-03 2013-08-08 ソニー株式会社 Information processing device, information recording medium and information processing method, and program
WO2017043378A1 (en) * 2015-09-07 2017-03-16 ソニー株式会社 Transmission device, transmission method, reception device, and reception method
WO2018016294A1 (en) * 2016-07-20 2018-01-25 ソニー株式会社 Information processing device, information processing method, and program
WO2018135258A1 (en) * 2017-01-17 2018-07-26 ソニー株式会社 Information processing device, information recording medium, information processing method, and program
JP2018133124A (en) * 2017-02-15 2018-08-23 パナソニックIpマネジメント株式会社 Recording device, recording method and recording medium

Also Published As

Publication number Publication date
WO2018216424A1 (en) 2018-11-29
JP7070564B2 (en) 2022-05-18

Similar Documents

Publication Publication Date Title
JP7033537B2 (en) Information processing equipment, information processing methods, and programs
JP7031589B2 (en) Information processing equipment, information processing methods, and programs
JP7074068B2 (en) Information processing equipment, information recording media, information processing methods, and programs
JP6863271B2 (en) Information processing equipment, information recording media, information processing methods, and programs
JP7147755B2 (en) Information processing device, information recording medium, information processing method, and program
JP7070432B2 (en) Information processing equipment, information recording media, information processing methods, and programs
JP7056566B2 (en) Information processing equipment, information processing methods, and programs
JP7215415B2 (en) Information processing device, information recording medium, information processing method, and program
JP7014157B2 (en) Information processing equipment, information recording media, information processing methods, and programs
JPWO2018190122A1 (en) Information processing apparatus, information processing method, and program
JP7070564B2 (en) Information processing equipment, information recording media, information processing methods, and programs
WO2018173780A1 (en) Information processing device, information recording medium, information processing method, and program
JP7070433B2 (en) Information processing equipment, information recording media, information processing methods, and programs

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210315

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220323

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220405

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220418

R151 Written notification of patent or utility model registration

Ref document number: 7070564

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151