JP7070564B2 - Information processing equipment, information recording media, information processing methods, and programs - Google Patents

Information processing equipment, information recording media, information processing methods, and programs Download PDF

Info

Publication number
JP7070564B2
JP7070564B2 JP2019519529A JP2019519529A JP7070564B2 JP 7070564 B2 JP7070564 B2 JP 7070564B2 JP 2019519529 A JP2019519529 A JP 2019519529A JP 2019519529 A JP2019519529 A JP 2019519529A JP 7070564 B2 JP7070564 B2 JP 7070564B2
Authority
JP
Japan
Prior art keywords
data
information
format
recorded
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019519529A
Other languages
Japanese (ja)
Other versions
JPWO2018216424A1 (en
Inventor
幸一 内村
徹 知念
光行 畠中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Sony Group Corp
Original Assignee
Sony Corp
Sony Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp, Sony Group Corp filed Critical Sony Corp
Publication of JPWO2018216424A1 publication Critical patent/JPWO2018216424A1/en
Application granted granted Critical
Publication of JP7070564B2 publication Critical patent/JP7070564B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/12Formatting, e.g. arrangement of data block or words on the record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N5/926Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback by pulse code modulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Television Signal Processing For Recording (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)

Description

本開示は、情報処理装置、情報記録媒体、および情報処理方法、並びにプログラムに関する。さらに詳細には、放送波等における今後のデータ伝送規格として規格化が進められているMMT(MPEG Media Transport)フォーマットデータを入力して、メディアに記録し、再生可能とする情報処理装置、情報記録媒体、および情報処理方法、並びにプログラムに関する。 The present disclosure relates to information processing devices, information recording media, information processing methods, and programs. More specifically, an information processing device and information recording that input MMT (MPEG Media Transport) format data, which is being standardized as a future data transmission standard for broadcast waves, etc., and record it on media so that it can be played back. Media, information processing methods, and programs.

現在、4K画像や8K画像等の放送等、高画質画像のデータ伝送を実現するための規格化が進められており、その一つとして、MMT(MPEG Media Transport)フォーマットを利用したデータ配信方式についての検討が進められている。 Currently, standardization is underway to realize data transmission of high-quality images such as broadcasting of 4K images and 8K images, and one of them is a data distribution method using the MMT (MPEG Media Transport) format. Is under consideration.

MMTフォーマットは、画像(Video)、音声(Audio)、字幕(Subtitle)等、コンテンツを構成する符号化データや、制御情報や属性情報等の様々な管理情報からなる制御情報(SI:Signaling Information(シグナリング情報))等のデータを、放送波やネットワークを介して伝送するデータ転送方式(トランスポートフォーマット)を規定したものである。 The MMT format is a control information (SI: Signaling Information) consisting of coded data constituting the content such as an image (Video), audio (Audio), subtitle (Subtile), and various management information such as control information and attribute information. It defines a data transfer method (transport format) for transmitting data such as signaling information)) via broadcast waves or networks.

MMTフォーマットは、例えば4K画像、高ダイナミックレンジ(HDR:High Dynamic Range)画像等の次世代コンテンツの放送等に利用される予定となっている。 The MMT format is scheduled to be used for broadcasting next-generation contents such as 4K images and high dynamic range (HDR) images.

なお、現行の画像(Video)、音声(Audio)、字幕(Subtitle)等の伝送フォーマット、あるいは、メディアに対するデータ記録フォーマットとしては、MPEG-2TSフォーマットが多く利用されている。
また、このMPEG-2TSフォーマット対応の記録再生アプリケーション規格(フォーマット)としてBDMVやBDAV規格(フォーマット)が広く利用されている。
The MPEG-2 TS format is often used as a transmission format for current images (Video), audio (Audio), subtitles (Subtitles), etc., or as a data recording format for media.
Further, BDMV and BDAV standards (formats) are widely used as recording / playback application standards (formats) compatible with this MPEG-2 TS format.

なお、BDMVやBDAVは、主にBD(Blu-ray(登録商標) Disc)を利用したデータ記録再生のアプリケーション規格であるが、これらの規格はBDに限らず、フラッシュメモリやHDなど、その他のBD以外のメディアを利用したデータ記録再生にも適用可能である。
BDを利用したデータ記録再生処理構成については、例えば特許文献1(特開2011-023071号公報)等に記載がある。
BDMV and BDAV are application standards for data recording and playback mainly using BD (Blu-ray (registered trademark) Disc), but these standards are not limited to BD, but other standards such as flash memory and HD. It can also be applied to data recording / playback using media other than BD.
A data recording / reproduction processing configuration using a BD is described in, for example, Patent Document 1 (Japanese Unexamined Patent Publication No. 2011-023071).

BDMVは、例えば映画コンテンツなどを予め記録したBD-ROM向けに開発されたアプリケーション規格であり、主に、パッケージコンテンツ等の書き換え不能なBD-ROMで広く使われている。
一方、BDAVは、主に書き換え可能なBD-RE型ディスクや、一回のみ記録可能なBD-R型ディスク等を利用したデータ記録再生処理に適用することを目的として開発された規格である。BDAVは、例えばユーザがビデオカメラなどで撮影した映像の記録再生やテレビ放送を記録し再生するために利用される。
BDMV is an application standard developed for BD-ROMs in which movie contents are recorded in advance, and is mainly widely used in non-rewritable BD-ROMs such as package contents.
On the other hand, BDAV is a standard developed mainly for the purpose of applying to data recording / playback processing using a rewritable BD-RE type disc, a BD-R type disc that can be recorded only once, and the like. BDAV is used, for example, for recording / reproducing a video taken by a user with a video camera or the like, or for recording / reproducing a television broadcast.

上述のMMTフォーマットに従った配信コンテンツを、情報記録媒体(メディア)に記録し、メディアからのコンテンツ再生処理をBDAVフォーマット対応の再生アプリケーションを利用して行なうためには、このBDAVフォーマットに従ってデータ記録を行うことが必要である。 In order to record the distributed content according to the above-mentioned MMT format on an information recording medium (media) and perform the content reproduction processing from the media using a reproduction application compatible with the BDAV format, the data recording is performed according to this BDAV format. It is necessary to do.

現在、BDAVフォーマットを拡張し、MMTフォーマットデータを記録、再生可能とするための構成について議論が進められている。
例えば、放送局等が送信するMMTフォーマットに従った配信データをテレビ等の情報処理装置が受信し、受信データをBDやフラッシュメモリ、あるいはHDD(ハードディスク)等の記録メディアに記録する場合、画像、音声、字幕データや、制御情報(SI)等のデータを、MMTフォーマットに従ったデータを格納したパケットのパケット列としてメディアに記録する方向で議論が進んでいる。
Currently, discussions are underway on a configuration for expanding the BDAV format to record and play back MMT format data.
For example, when an information processing device such as a television receives distribution data according to the MMT format transmitted by a broadcasting station or the like and records the received data on a recording medium such as a BD, a flash memory, or an HDD (hard disk), an image, Discussions are progressing in the direction of recording data such as voice, subtitle data, and control information (SI) on a medium as a packet string of a packet containing data according to the MMT format.

具体的には、MMTP(MMT Protocol)パケット、あるいはMMTPパケットの上位パケットであるTLV(Type Length Value)パケットのパケット列をメディアに記録する方向で議論が進んでいる。 Specifically, discussions are proceeding in the direction of recording a packet sequence of an MMTP (MMT Protocol) packet or a TLV (Type Length Value) packet, which is a higher-level packet of an MMTP packet, on a medium.

MMTPパケットやTLVパケットには、再生データである画像、音声、字幕、さらに、様々な管理情報からなる制御情報(SI:Signaling Information)等が格納されている。 In the MMTP packet and the TLV packet, images, sounds, subtitles, which are reproduction data, and control information (SI: Signaling Information) including various management information are stored.

例えばBD(Blu-ray(登録商標) Disc)やフラッシュメモリやHDD(ハードディスク)等の記録メディアに、画像、音声、字幕等のコンテンツを格納したMMTPパケットやTLVパケットを記録し、メディアからのコンテンツ再生を上述のBDAVフォーマット対応の再生アプリケーションを利用して行なうためには、このBDAVフォーマットに従ってデータ記録を行うことが必要である。 For example, MMTP packets and TLV packets containing contents such as images, sounds, and subtitles are recorded on recording media such as BD (Blu-ray (registered trademark) Disc), flash memory, and HDD (hard disk), and the contents from the media are recorded. In order to perform reproduction using the reproduction application corresponding to the above-mentioned BDAV format, it is necessary to record data according to this BDAV format.

BDAVフォーマットは、再生制御情報ファイルとして、プレイリストファイルやクリップ情報ファイル等のデータベースファイルを規定しており、BDAV対応再生アプリケーションはこれらの再生制御情報ファイル(データベースファイル)を参照してデータ再生処理を実行する。
従って、MMTフォーマットデータについても、これらのプレイリストファイルやクリップ情報ファイルに記録された再生制御情報を利用して再生処理を行うことが必要となる。
The BDAV format defines database files such as playlist files and clip information files as playback control information files, and BDAV-compatible playback applications refer to these playback control information files (database files) for data playback processing. Run.
Therefore, it is necessary to perform the reproduction processing of the MMT format data by using the reproduction control information recorded in these playlist files and clip information files.

しかし、MMTフォーマットに従って配信されるデータには、このBDAVフォーマットで規定するプレイリストファイルやクリップ情報ファイルが含まれていない。
従って、このMMTフォーマットデータをメディアに記録して、BDAVフォーマット対応アプリを利用してコンテンツ再生を行うためには、BDAVフォーマットの規定するプレイリストファイルやクリップ情報ファイルを生成してメディアに記録する処理が必要となる。
しかし、この処理については、現時点で具体化されていないというのが現状である。
However, the data distributed according to the MMT format does not include the playlist file and the clip information file specified in this BDAV format.
Therefore, in order to record this MMT format data on the media and play the content using the BDAV format compatible application, a process of generating a playlist file or a clip information file specified by the BDAV format and recording it on the media. Is required.
However, the current situation is that this process has not been materialized at this time.

特開2011-023071号公報Japanese Unexamined Patent Publication No. 2011-023071

本開示は、例えば、上記の問題点に鑑みてなされたものであり、MMTフォーマットに従った配信データを入力して、BDAVフォーマットに規定されたデータベースファイルを生成してメディアに記録して、これらのデータベースファイルを利用してメディア記録コンテンツを再生可能とする情報処理装置、情報記録媒体、および情報処理方法、並びにプログラムを提供することを目的とする。 The present disclosure has been made in view of the above problems, for example, by inputting distribution data according to the MMT format, generating a database file specified in the BDAV format, and recording the data on the media. It is an object of the present invention to provide an information processing device, an information recording medium, an information processing method, and a program that enable reproduction of media recorded contents by using the database file of the above.

本開示の第1の側面は、
MMTフォーマットデータを入力し、情報記録媒体に対するデータ記録フォーマットであるBDAVフォーマット、またはSPAVフォーマットに従った記録データを生成するデータ処理部を有し、
前記データ処理部は、
情報記録媒体に記録する音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報をBDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルに記録する処理を実行する情報処理装置にある。
The first aspect of this disclosure is
It has a data processing unit that inputs MMT format data and generates recorded data according to the BDAV format or SPAV format, which is a data recording format for an information recording medium.
The data processing unit
The audio data recorded on the information recording medium is
(A) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(B) MPEG4 ALS (LATM / LOAS) coded audio data,
It is in the information processing apparatus that executes the process of recording the voice identification information that can identify which of the voice data (a) and (b) is in the database file specified in the BDAV format or the SPAV format.

さらに、本開示の第2の側面は、
情報記録媒体の記録データの再生処理を実行するデータ処理部を有し、
前記情報記録媒体は、MMTフォーマットデータを、BDAVフォーマット、またはSPAVフォーマットに従って記録したデータを格納した情報記録媒体であり、
前記データ処理部は、
BDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルであるプレイリストファイルとクリップ情報ファイルの記録情報を利用して、前記情報記録媒体に記録されたMMTフォーマットデータの再生処理を実行する構成であり、
前記データ処理部は、
再生対象の音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれのデータであるかを示す音声識別情報を、前記データベースファイルから取得し、取得情報に従って音声データの復号処理を実行する情報処理装置にある。
Further, the second aspect of the present disclosure is
It has a data processing unit that executes the reproduction processing of the recorded data of the information recording medium.
The information recording medium is an information recording medium that stores data in which MMT format data is recorded according to the BDAV format or the SPAV format.
The data processing unit
It is configured to execute the reproduction process of the MMT format data recorded on the information recording medium by using the recorded information of the playlist file and the clip information file which are the database files specified in the BDAV format or the SPAV format.
The data processing unit
The audio data to be played is
(A) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(B) MPEG4 ALS (LATM / LOAS) coded audio data,
It is in an information processing apparatus that acquires voice identification information indicating which data (a) or (b) is from the database file and executes voice data decoding processing according to the acquired information.

さらに、本開示の第3の側面は、
BDAVフォーマット、またはSPAVフォーマットに従った記録データを記録した情報記録媒体であり、
情報記録媒体に記録された音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報をBDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルに記録した構成を有し、
再生装置が、前記データベースファイルに記録された音声識別情報に従って、再生対象とした音声データの種類を識別可能とした情報記録媒体にある。
Further, the third aspect of the present disclosure is
It is an information recording medium that records recorded data according to the BDAV format or SPAV format.
The audio data recorded on the information recording medium is
(A) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(B) MPEG4 ALS (LATM / LOAS) coded audio data,
It has a configuration in which the voice identification information that enables identification of which of the voice data (a) and (b) is recorded is recorded in a database file specified in BDAV format or SPAV format.
The reproduction device is in an information recording medium capable of identifying the type of audio data to be reproduced according to the audio identification information recorded in the database file.

さらに、本開示の第4の側面は、
BDAVフォーマット、またはSPAVフォーマットに従った記録データが記録される情報記録媒体であり、
情報記録媒体に記録される音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報を含むBDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルを有し、
再生装置が、前記データベースファイルの音声識別情報に従って、再生対象とした音声データの種類を識別可能とした情報記録媒体にある。
Further, the fourth aspect of the present disclosure is
It is an information recording medium on which recorded data according to the BDAV format or SPAV format is recorded.
The audio data recorded on the information recording medium is
(A) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(B) MPEG4 ALS (LATM / LOAS) coded audio data,
It has a database file specified in BDAV format or SPAV format that contains voice identification information that makes it possible to identify which of the voice data (a) and (b) is.
The reproduction device is in an information recording medium capable of identifying the type of audio data to be reproduced according to the audio identification information of the database file.

さらに、本開示の第5の側面は、
情報処理装置において実行する情報処理方法であり、
前記情報処理装置は、
MMTフォーマットデータを入力し、情報記録媒体に対するデータ記録フォーマットであるBDAVフォーマット、またはSPAVフォーマットに従った記録データを生成するデータ処理部を有し、
前記データ処理部が、
情報記録媒体に記録する音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報をBDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルに記録する処理を実行する情報処理方法にある。
Further, the fifth aspect of the present disclosure is
It is an information processing method executed in an information processing device.
The information processing device is
It has a data processing unit that inputs MMT format data and generates recorded data according to the BDAV format or SPAV format, which is a data recording format for an information recording medium.
The data processing unit
The audio data recorded on the information recording medium is
(A) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(B) MPEG4 ALS (LATM / LOAS) coded audio data,
It is an information processing method for executing a process of recording voice identification information that can identify which of the voice data (a) and (b) is in a database file specified in BDAV format or SPAV format.

さらに、本開示の第6の側面は、
情報処理装置において実行する情報処理方法であり、
前記情報処理装置は、
情報記録媒体の記録データの再生処理を実行するデータ処理部を有し、
前記情報記録媒体は、MMTフォーマットデータを、BDAVフォーマット、またはSPAVフォーマットに従って記録したデータを格納した情報記録媒体であり、
前記データ処理部が、
BDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルであるプレイリストファイルとクリップ情報ファイルの記録情報を利用して、前記情報記録媒体に記録されたMMTフォーマットデータの再生処理を実行し、
前記再生処理に際して、再生対象の音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれのデータであるかを示す音声識別情報を、前記データベースファイルから取得し、取得情報に従って音声データの復号処理を実行する情報処理方法にある。
Further, the sixth aspect of the present disclosure is
It is an information processing method executed in an information processing device.
The information processing device is
It has a data processing unit that executes the reproduction processing of the recorded data of the information recording medium.
The information recording medium is an information recording medium that stores data in which MMT format data is recorded according to the BDAV format or the SPAV format.
The data processing unit
Using the recorded information of the playlist file and the clip information file, which are database files specified in the BDAV format or the SPAV format, the MMT format data recorded in the information recording medium is reproduced.
In the reproduction process, the audio data to be reproduced is
(A) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(B) MPEG4 ALS (LATM / LOAS) coded audio data,
It is an information processing method that acquires voice identification information indicating which data (a) or (b) is from the database file and executes a voice data decoding process according to the acquired information.

さらに、本開示の第7の側面は、
情報処理装置において実行する情報処理を実行させるプログラムであり、
前記情報処理装置は、
MMTフォーマットデータを入力し、情報記録媒体に対するデータ記録フォーマットであるBDAVフォーマット、またはSPAVフォーマットに従った記録データを生成するデータ処理部を有し、
前記プログラムは、前記データ処理部に、
情報記録媒体に記録する音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報をBDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルに記録する処理を実行させるプログラムにある。
Further, the seventh aspect of the present disclosure is
It is a program that executes information processing to be executed in an information processing device.
The information processing device is
It has a data processing unit that inputs MMT format data and generates recorded data according to the BDAV format or SPAV format, which is a data recording format for an information recording medium.
The program is installed in the data processing unit.
The audio data recorded on the information recording medium is
(A) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(B) MPEG4 ALS (LATM / LOAS) coded audio data,
There is a program that executes a process of recording voice identification information that can identify which of the voice data (a) and (b) is in a database file specified in BDAV format or SPAV format.

さらに、本開示の第8の側面は、
情報処理装置において実行する情報処理を実行させるプログラムであり、
前記情報処理装置は、
情報記録媒体の記録データの再生処理を実行するデータ処理部を有し、
前記情報記録媒体は、MMTフォーマットデータを、BDAVフォーマット、またはSPAVフォーマットに従って記録したデータを格納した情報記録媒体であり、
前記プログラムは、前記データ処理部に、
BDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルであるプレイリストファイルとクリップ情報ファイルの記録情報を利用して、前記情報記録媒体に記録されたMMTフォーマットデータの再生処理を実行させ、
前記再生処理に際して、再生対象の音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれのデータであるかを示す音声識別情報を、前記データベースファイルから取得させ、取得情報に従って音声データの復号処理を行わせるプログラムにある。
Further, the eighth aspect of the present disclosure is
It is a program that executes information processing to be executed in an information processing device.
The information processing device is
It has a data processing unit that executes the reproduction processing of the recorded data of the information recording medium.
The information recording medium is an information recording medium that stores data in which MMT format data is recorded according to the BDAV format or the SPAV format.
The program is installed in the data processing unit.
Using the recorded information of the playlist file and the clip information file, which are database files specified in the BDAV format or the SPAV format, the reproduction process of the MMT format data recorded on the information recording medium is executed.
In the reproduction process, the audio data to be reproduced is
(A) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(B) MPEG4 ALS (LATM / LOAS) coded audio data,
The program has voice identification information indicating which of the data (a) and (b) is acquired from the database file, and decodes the voice data according to the acquired information.

なお、本開示のプログラムは、例えば、様々なプログラム・コードを実行可能な情報処理装置やコンピュータ・システムに対して、コンピュータ可読な形式で提供する記憶媒体、通信媒体によって提供可能なプログラムである。このようなプログラムをコンピュータ可読な形式で提供することにより、情報処理装置やコンピュータ・システム上でプログラムに応じた処理が実現される。 The program of the present disclosure is, for example, a program that can be provided by a storage medium or a communication medium provided in a computer-readable format to an information processing apparatus or a computer system capable of executing various program codes. By providing such a program in a computer-readable format, processing according to the program can be realized on an information processing apparatus or a computer system.

本開示のさらに他の目的、特徴や利点は、後述する本開示の実施例や添付する図面に基づくより詳細な説明によって明らかになるであろう。なお、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。 Still other objectives, features and advantages of the present disclosure will be clarified by more detailed description based on the examples of the present disclosure and the accompanying drawings described below. In the present specification, the system is a logical set configuration of a plurality of devices, and the devices of each configuration are not limited to those in the same housing.

本開示の一実施例の構成によれば、メディア記録MMTフォーマット音声データが、MPEG4 AAC LC音声データか、MPEG4 ALS音声データかを迅速に確認可能とした構成が実現される。
具体的には、例えば、メディアに記録するMMTフォーマット音声データが、MPEG4 AAC LC音声データであるか、MPEG4 ALS音声データであるかを示す音声識別情報を記録したクリップ情報ファイルを生成してメディアに記録する。再生装置は、クリップ情報ファイルに記録された音声識別情報に基づいて、再生対象とする音声データが、MPEG4 AAC LC音声データであるか、MPEG4 ALS音声データであるかを識別し、迅速な復号、再生を行うことができる。
本構成により、メディア記録MMTフォーマット音声データが、MPEG4 AAC LC音声データか、MPEG4 ALS音声データかを迅速に確認可能とした構成が実現される。
なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、また付加的な効果があってもよい。
According to the configuration of one embodiment of the present disclosure, a configuration is realized in which it is possible to quickly confirm whether the media recorded MMT format audio data is MPEG4 AAC LC audio data or MPEG4 ALS audio data.
Specifically, for example, a clip information file recording audio identification information indicating whether the MMT format audio data to be recorded on the media is MPEG4 AAC LC audio data or MPEG4 ALS audio data is generated and stored on the media. Record. The playback device identifies whether the audio data to be reproduced is MPEG4 AAC LC audio data or MPEG4 ALS audio data based on the audio identification information recorded in the clip information file, and rapidly decodes the audio data. Playback can be performed.
With this configuration, it is possible to quickly confirm whether the media recording MMT format audio data is MPEG4 AAC LC audio data or MPEG4 ALS audio data.
It should be noted that the effects described in the present specification are merely exemplary and not limited, and may have additional effects.

本開示の処理を実行する情報処理装置の利用構成例について説明する図である。It is a figure explaining the use configuration example of the information processing apparatus which executes the process of this disclosure. MMTフォーマットについて説明する図である。It is a figure explaining the MMT format. MMTフォーマットに従った画像データ格納構成例について説明する図である。It is a figure explaining the image data storage configuration example according to the MMT format. BDAVフォーマットについて説明する図である。It is a figure explaining the BDAV format. BDAVフォーマットに従ったデータ再生処理例について説明する図である。It is a figure explaining the example of the data reproduction processing according to the BDAV format. MPEG-2TSフォーマットについて説明する図である。It is a figure explaining the MPEG-2TS format. MMTフォーマットについて説明する図である。It is a figure explaining the MMT format. SPAVフォーマットについて説明する図である。It is a figure explaining the SPAV format. 放送局等からの受信データをMMTフォーマットデータであるMMTPパケット列として、情報記録媒体(メディア)に記録する処理例について説明する図である。It is a figure explaining the processing example which records the received data from a broadcasting station or the like as an MMTP packet string which is MMT format data on an information recording medium (media). 放送局等からの受信データをMMTフォーマットデータであるMMTPパケットを格納したTLVパケット列として、情報記録媒体(メディア)に記録する処理例について説明する図である。It is a figure explaining the processing example which records the received data from a broadcasting station or the like as a TLV packet string storing MMTP packet which is MMT format data on an information recording medium (media). MMTフォーマットデータを、BDAVフォーマットデータとして記録する場合の処理例について説明する図である。It is a figure explaining the processing example in the case of recording MMT format data as BDAV format data. クリップ情報ファイルのデータ構成(シンタクス)を示す図である。It is a figure which shows the data structure (syntax) of a clip information file. クリップ情報ファイルのプログラム情報[ProgramInfo()]のデータ構成(シンタクス)を示す図である。It is a figure which shows the data structure (syntax) of the program information [ProgramInfo ()] of a clip information file. クリップ情報ファイルのコーディング情報のデータ構成例について説明する図である。It is a figure explaining the data structure example of the coding information of a clip information file. クリップ情報ファイルの音声情報のデータ記録例について説明する図である。It is a figure explaining the data recording example of the audio information of a clip information file. MMTフォーマットの音声データの識別情報を記録したクリップ情報ファイルのコーディング情報のデータ構成例について説明する図である。It is a figure explaining the data structure example of the coding information of the clip information file which recorded the identification information of the audio data of MMT format. クリップ情報ファイルに記録するMMTフォーマットの音声識別情報の例について説明する図である。It is a figure explaining the example of the voice identification information of the MMT format recorded in the clip information file. 音声データ格納パケットの構成例について説明する図である。It is a figure explaining the configuration example of the voice data storage packet. MMTフォーマットの音声データの識別情報を記録したクリップ情報ファイルのコーディング情報のデータ構成例について説明する図である。It is a figure explaining the data structure example of the coding information of the clip information file which recorded the identification information of the audio data of MMT format. クリップ情報ファイルに記録するMMTフォーマットの音声識別情報の例について説明する図である。It is a figure explaining the example of the voice identification information of the MMT format recorded in the clip information file. MMTパッケージテーブル(MPT)のデータ構成(シンタクス)を示す図である。It is a figure which shows the data structure (syntax) of the MMT package table (MPT). MMTパッケージテーブル(MPT)に記録されるアセットタイプ(asset_type)の具体例について説明する図である。It is a figure explaining the specific example of the asset type (asset_type) recorded in the MMT package table (MPT). MMTパッケージテーブル(MPT)に記録される音声属性情報を示す図である。It is a figure which shows the audio attribute information recorded in the MMT package table (MPT). MMTパッケージテーブル(MPT)に記録される(M1)ストリームコンテンツ情報の具体例を示す図である。It is a figure which shows the specific example of the (M1) stream content information recorded in the MMT package table (MPT). MMTパッケージテーブル(MPT)に記録される(M2)コンポーネントタイプの具体例を示す図である。It is a figure which shows the specific example of the (M2) component type recorded in the MMT package table (MPT). MMTパッケージテーブル(MPT)に記録される(M3)サンプリング周波数の具体例を示す図である。It is a figure which shows the specific example of the (M3) sampling frequency recorded in the MMT package table (MPT). 情報記録媒体(メディア)に対するデータ記録処理を実行する情報処理装置の構成例について説明する図である。It is a figure explaining the configuration example of the information processing apparatus which executes the data recording process with respect to the information recording medium (media). 情報記録媒体(メディア)に対するデータ記録処理の処理シーケンスを説明するフローチャートを示す図である。It is a figure which shows the flowchart explaining the processing sequence of the data recording processing with respect to the information recording medium (media). 情報記録媒体(メディア)に対するデータ記録処理の処理シーケンスを説明するフローチャートを示す図である。It is a figure which shows the flowchart explaining the processing sequence of the data recording processing with respect to the information recording medium (media). 情報記録媒体(メディア)に対するデータ記録処理の処理シーケンスを説明するフローチャートを示す図である。It is a figure which shows the flowchart explaining the processing sequence of the data recording processing with respect to the information recording medium (media). 情報記録媒体(メディア)からのデータ再生処理を実行する情報処理装置の構成例について説明する図である。It is a figure explaining the configuration example of the information processing apparatus which executes the data reproduction processing from an information recording medium (media). 情報記録媒体(メディア)からのデータ再生処理の処理シーケンスを説明するフローチャートを示す図である。It is a figure which shows the flowchart explaining the processing sequence of the data reproduction processing from an information recording medium (media). 情報記録媒体(メディア)からのデータ再生処理の処理シーケンスを説明するフローチャートを示す図である。It is a figure which shows the flowchart explaining the processing sequence of the data reproduction processing from an information recording medium (media). 本開示の処理に適用される情報処理装置のハードウェア構成例について説明する図である。It is a figure explaining the hardware configuration example of the information processing apparatus applied to the process of this disclosure.

以下、図面を参照しながら本開示の情報処理装置、情報記録媒体、および情報処理方法、並びにプログラムの詳細について説明する。なお、説明は以下の項目に従って行なう。
1.通信システムの構成例について
2.MMT(MPEG Media Transport)フォーマットについて
3.BDAVフォーマットとSPAVフォーマットについて
4.MMTフォーマットデータをBDAVフォーマットに従って記録する場合の処理について
5.MMTフォーマットに従った音声データについて
6.クリップ情報ファイルに対する音声識別情報の記録例について
6-1.(実施例1)音声データ格納パケットに記録された音声識別情報を取得してクリップ情報ファイルに記録する実施例
6-2.(実施例2)MMTパッケージテーブル(MPT)に記録された音声識別情報を取得してクリップ情報ファイルに記録する実施例
7.情報記録媒体に対するデータ記録処理を実行する情報処理装置の構成と処理について
8.情報記録媒体からのデータ再生処理を実行する情報処理装置の構成と処理について
9.情報処理装置の構成例について
10.本開示の構成のまとめ
Hereinafter, the details of the information processing apparatus, the information recording medium, the information processing method, and the program of the present disclosure will be described with reference to the drawings. The explanation will be given according to the following items.
1. 1. Configuration example of communication system 2. About MMT (MPEG Media Transport) format 3. BDAV format and SPAV format 4. 4. Processing when recording MMT format data according to BDAV format. Voice data according to MMT format 6. Recording example of voice identification information for clip information file 6-1. (Example 1) Example 6-2. Example of acquiring voice identification information recorded in a voice data storage packet and recording it in a clip information file. (Embodiment 2) Example 2 to acquire the voice identification information recorded in the MMT package table (MPT) and record it in the clip information file. 8. Configuration and processing of information processing equipment that executes data recording processing for information recording media. 9. Configuration and processing of an information processing device that executes data reproduction processing from an information recording medium. About the configuration example of the information processing device 10. Summary of the structure of this disclosure

[1.通信システムの構成例について]
まず、図1を参照して本開示の処理を実行する情報処理装置の一つの利用構成例である通信システムの例について説明する。
図1に示す情報処理装置30は、BD(Blu-ray(登録商標) Disc)や、フラッシュメモリ、ハードディスク(HDD)などのメディアを装着し、これらの装着メディアに対するデータ記録処理や、装着メディアからのデータ再生処理、さらに、他メディアに対するデータコピー処理等を実行する。
[1. Communication system configuration example]
First, an example of a communication system, which is an example of a usage configuration of an information processing apparatus that executes the process of the present disclosure, will be described with reference to FIG.
The information processing device 30 shown in FIG. 1 is equipped with media such as a BD (Blu-ray (registered trademark) Disc), a flash memory, and a hard disk (HDD), and performs data recording processing on these mounted media and from the mounted media. Data reproduction processing, data copy processing for other media, etc. are executed.

情報処理装置30がメディアに記録するデータは、例えば放送局(放送サーバ)21や、データ配信サーバ22等の送信装置20の提供する送信コンテンツである。具体的には、テレビ局の提供する放送番組等である。
これらの送信コンテンツは、放送波、あるいはインターネット等のネットワークを介して送信装置20から情報処理装置30に送信される。
The data recorded on the media by the information processing device 30 is, for example, transmission content provided by a transmission device 20 such as a broadcasting station (broadcast server) 21 or a data distribution server 22. Specifically, it is a broadcast program or the like provided by a television station.
These transmitted contents are transmitted from the transmitting device 20 to the information processing device 30 via a broadcast wave or a network such as the Internet.

情報処理装置30は、例えば記録再生装置31、テレビ32、PC33、携帯端末34等である、これらの情報処理装置は、例えば、BD(Blu-ray(登録商標) Disc)41、HDD(ハードディスク)42、フラッシュメモリ43等の様々なメディアを装着し、これらのメディアに対するデータ記録処理や、メディア記録データの編集処理、メディアからのデータ再生処理、さらに、メディア間のデータコピー処理等を実行する。 The information processing device 30 is, for example, a recording / reproducing device 31, a television 32, a PC 33, a portable terminal 34, etc. These information processing devices are, for example, BD (Blu-ray (registered trademark) Disc) 41, HDD (hard disk). 42, various media such as a flash memory 43 are attached, and data recording processing for these media, editing processing of media recording data, data reproduction processing from media, data copy processing between media, and the like are executed.

送信装置20から情報処理装置30に対するデータ送信は、MMT(MPEG Media Transport)フォーマットに従って実行される。
MMTフォーマットは、画像(Video)、音声(Audio)、字幕(Subtitle)等、コンテンツ構成データである符号化データを放送波やネットワークを介して伝送する際のデータ転送方式(トランンスポートフォーマット)を規定したものである。
Data transmission from the transmission device 20 to the information processing device 30 is executed according to the MMT (MPEG Media Transport) format.
The MMT format is a data transfer method (transition port format) for transmitting coded data, which is content composition data, such as image (Video), audio (Audio), and subtitle (Subtitle), via a broadcast wave or a network. It is specified.

送信装置20は、コンテンツデータを符号化し、符号化データおよび符号化データのメタデータを含むデータファイルを生成し、生成した符号化データをMMTにおいて規定されるMMTP(MMT Protocol)パケットに格納して放送波、またはネットワークを介して送信する。 The transmission device 20 encodes the content data, generates a data file containing the coded data and the metadata of the coded data, and stores the generated coded data in an MMTP (MMT Protocol) packet defined in the MMT. Transmit via broadcast wave or network.

送信装置20が情報処理装置30に提供するデータは、画像、音声、字幕等の再生対象データの他、番組ガイド等の案内情報や通知情報、制御メッセージ等の様々な管理情報によって構成される制御情報(SI:Signaling Information(シグナリング情報))によって構成される。 The data provided by the transmission device 20 to the information processing device 30 is a control composed of reproduction target data such as images, sounds, and subtitles, as well as guidance information such as a program guide, notification information, and various management information such as control messages. It is composed of information (SI: Signaling Information).

[2.MMT(MPEG Media Transport)フォーマットについて]
上述したように、送信装置20から情報処理装置30に対するデータ送信は、MMT(MPEG Media Transport)フォーマットに従って実行される。
図2以下を参照して、MMT(MPEG Media Transport)フォーマットについて説明する。
[2. About MMT (MPEG Media Transport) format]
As described above, the data transmission from the transmission device 20 to the information processing device 30 is executed according to the MMT (MPEG Media Transport) format.
The MMT (MPEG Media Transport) format will be described with reference to FIG. 2 and the following.

図2は、MMTフォーマットのスタック・モデルを示す図である。
図2に示すMMTスタック・モデルにおいて、最下層には、物理レイヤ(PHY)がある。物理レイヤは、放送系の処理を行なうブロードキャスト(Broadcasting)レイヤと、ネットワーク系の処理を行なうブロードバンド(Broadband)レイヤに分割されている。
MMTは放送系、ネットワーク系の2つの通信網を利用した処理を可能としている。
FIG. 2 is a diagram showing a stack model in MMT format.
In the MMT stack model shown in FIG. 2, the bottom layer has a physical layer (PHY). The physical layer is divided into a broadcast (Broadcasting) layer that performs broadcasting-related processing and a broadband (Broadband) layer that performs network-based processing.
MMT enables processing using two communication networks, a broadcasting system and a network system.

物理レイヤ(PHY)の上位レイヤとして、TLV(Type Length Value)レイヤがある。TLVはIPパケットの多重化方式を規定したフォーマット規定レイヤである。複数のIPパケットが多重化されてTLVパケットとして送信される。TLV-SIは、TLVフォーマットに従った制御メッセージ等の制御情報(SI)の伝送レイヤである。 As an upper layer of the physical layer (PHY), there is a TLV (Type Length Value) layer. The TLV is a format specification layer that defines a multiplexing method for IP packets. A plurality of IP packets are multiplexed and transmitted as TLV packets. The TLV-SI is a transmission layer of control information (SI) such as a control message according to the TLV format.

制御情報(SI)は、情報処理装置30側においてコンテンツ(番組)を受信、再生するために必要となる設定情報や、番組ガイド等の案内情報や通知情報、制御情報、管理情報によって構成される。
TLVレイヤで処理が生成されるTLVパケットに格納される制御情報(SI)がTLV-SIであり、主に受信処理に関する制御情報によって構成されている。
MMTプロトコル(MMTP)に従って生成されるパケットであるMMTPパケットに格納される制御情報(SI)は最上位レイヤに示すMMT-SIであり、主に再生制御に関する制御情報によって構成されている。
The control information (SI) is composed of setting information required for receiving and playing content (program) on the information processing apparatus 30 side, guidance information such as a program guide, notification information, control information, and management information. ..
The control information (SI) stored in the TLV packet for which processing is generated in the TLV layer is TLV-SI, and is mainly composed of control information related to reception processing.
The control information (SI) stored in the MMTP packet, which is a packet generated according to the MMT protocol (MMTP), is MMT-SI shown in the uppermost layer, and is mainly composed of control information related to reproduction control.

TLVレイヤ上には、UDP/IPレイヤが設定される。
UDP/IPレイヤは、詳細にはIPレイヤとUDPレイヤに分割可能であるが、IPパケットのペイロードにUDPパケットを格納する伝送を規定するレイヤである。
UDP/IPレイヤ上にMMTレイヤ、およびFile delivery methodレイヤ が設定される。
MMTPパケットをIPパケットに格納して送信する場合と、MMTPパケットを用いないデータ伝送方式であるFile delivery methodを利用してIPパケットとしてデータ送信する方式が併用可能な設定となっている。
A UDP / IP layer is set on the TLV layer.
The UDP / IP layer can be divided into an IP layer and a UDP layer in detail, but is a layer that regulates transmission in which a UDP packet is stored in the payload of the IP packet.
An MMT layer and a File delivery method layer are set on the UDP / IP layer.
The setting is such that the case where the MMTP packet is stored in the IP packet and transmitted and the method where the data is transmitted as the IP packet by using the File delivery method, which is a data transmission method that does not use the MMTP packet, can be used together.

MMTレイヤ上には、以下のレイヤが設定される。
画像符号化規格であるHEVC(High Efficiency Video Coding)に従った符号化画像データである画像(Video)データのレイヤ。
The following layers are set on the MMT layer.
A layer of image (Video) data which is coded image data according to HEVC (High Efficiency Video Coding) which is an image coding standard.

音声符号化規格である、
(1)MPEG4 AAC LC(Advanced Audio Coding Low Complexity)に従った符号化音声データ、または、
(2)MPEG4 ALS(Audio Losless Coding)に従った符号化音声データ、
これらの音声符号化規格に従って符号化された音声(Audio)データのレイヤ。
A voice coding standard,
(1) Coded audio data according to MPEG4 AAC LC (Advanced Audio Coding Low Complexity), or
(2) Coded audio data according to MPEG4 ALS (Audio Lossless Coding),
A layer of audio (Audio) data encoded according to these audio coding standards.

さらに、
字幕符号化規格であるTTML(Timed Text Markup Language)に従った符号化字幕データである字幕(Subtitle)データ、
MMTPパケットを利用して送信される制御情報(MMT-SI)、
HTML5(Hyper Text Markup Language 5)に従って記述された様々なアプリケーション、
これらの各データがMMTPパケットに格納されて送信される。
moreover,
Subtitle data, which is coded subtitle data according to TTML (Timed Text Markup Language), which is a subtitle coding standard.
Control information (MMT-SI) transmitted using MMTP packets,
Various applications described according to HTML5 (HyperText Markup Language 5),
Each of these data is stored in an MMTP packet and transmitted.

制御情報(MMT-SI)は、MMTPパケットで送信される制御情報(シグナリング情報)であり、情報処理装置30側においてコンテンツ(番組)を再生するために必要となる設定情報や、番組ガイド等の案内情報や通知情報、制御情報等の様々な管理情報によって構成される。 The control information (MMT-SI) is control information (signaling information) transmitted in an MMTP packet, such as setting information required for playing content (program) on the information processing apparatus 30 side, a program guide, and the like. It is composed of various management information such as guidance information, notification information, and control information.

なお、時刻情報(NTP:Network Time Protocol)は絶対時刻情報であり、UDPパケットに直接格納され送信される。
その他のデータ配信を行うデータサービス(Data service)、コンテンツダウンロード等(Contentdownload,etc.)がMMTと異なるファイル配信メソッド(File delivery method)を利用して配信可能な構成を有している。
The time information (NTP: Network Time Protocol) is absolute time information, which is directly stored in a UDP packet and transmitted.
Other data services (Data service) that distribute data, content download (Contentdownload, etc.) have a configuration that can be distributed by using a file distribution method (File delivery method) different from MMT.

図2に示すように、画像、音声、字幕、さらに、様々な通知情報や制御情報等の様々な管理情報からなる制御情報(MMT-SI)やアプリケーションは、MMTPパケットによって送信される。 As shown in FIG. 2, a control information (MMT-SI) or an application composed of images, sounds, subtitles, and various management information such as various notification information and control information is transmitted by an MMTP packet.

図3を参照してMMTPパケットの具体的構成例について説明する。
図3には以下の4種類のデータ構成例を示している。
(a)MPU(Media Presentation Unit)
(b)MMTPペイロート
(c)MMTPパケット
(d)TLVパケット
A specific configuration example of the MMTP packet will be described with reference to FIG.
FIG. 3 shows the following four types of data configuration examples.
(A) MPU (Media Presentation Unit)
(B) MMTP payrot (c) MMTP packet (d) TLV packet

(d)TLVパケットが放送波やネットワークを介して送信されるパケットであり、TLVパケットには、UDPヘッダ、IPヘッダ、TLVヘッダの各ヘッダ情報が設定される。TLVパケットは、データ種類ごとに個別のパケットとして設定される。 (D) The TLV packet is a packet transmitted via a broadcast wave or a network, and each header information of a UDP header, an IP header, and a TLV header is set in the TLV packet. The TLV packet is set as an individual packet for each data type.

すなわち、1つのTLVパケットのTLVペイロードには、1つの種類のデータが格納される。具体的には、例えば、画像(V)、音声(A)、字幕(S)、あるいは、様々な管理情報からなる制御情報(SI)が個別に格納される。
なお、制御情報(SI)については、MMTPパケットに格納する制御情報(MMT-SI)と、TLVパケットで送信される制御情報(TLV-SI)があり、それぞれ異なる個別のTLVパケットに格納される。
That is, one type of data is stored in the TLV payload of one TLV packet. Specifically, for example, an image (V), an audio (A), a subtitle (S), or a control information (SI) composed of various management information is individually stored.
Regarding the control information (SI), there are control information (MMT-SI) stored in the MMTP packet and control information (TLV-SI) transmitted in the TLV packet, which are stored in different individual TLV packets. ..

TLVパケットのペイロードであるTLVペイロートの一例が、図3(c)に示すMMTPパケットである。
図3(c)に示すMMTPパケットは、MMTPヘッダと、MMTPペイロードによって構成される。
An example of the TLV payrot, which is the payload of the TLV packet, is the MMTP packet shown in FIG. 3 (c).
The MMTP packet shown in FIG. 3C is composed of an MMTP header and an MMTP payload.

1つのMMTPパケットのMMTPペイロードには、1つの種類のデータが格納される。具体的には、例えば、画像(V)、音声(A)、字幕(S)、さらにMMTPパケットに格納する制御情報(MMT-SI)、これらのいずれか一種類のデータが、個別のMMTPパケットに格納される。 One type of data is stored in the MMTP payload of one MMTP packet. Specifically, for example, an image (V), an audio (A), a subtitle (S), a control information (MMT-SI) stored in an MMTP packet, and any one of these types of data are individual MMTP packets. Stored in.

図3(a),(b)は、図3(c)に示すMMTPパケットのMMTPペイロードに格納される画像データの詳細構成を示している。
図3(b)は、図3(c)に示すMMTPパケット中、MMTPペイロードが画像データ(V)であるもののみを選択して示している。
図3(b)に示すMMTPペイロードは、ヘッダとデータユニットによって構成される。
3 (a) and 3 (b) show the detailed structure of the image data stored in the MMTP payload of the MMTP packet shown in FIG. 3 (c).
FIG. 3B selects and shows only the MMTP packet whose MMTP payload is image data (V) among the MMTP packets shown in FIG. 3C.
The MMTP payload shown in FIG. 3B is composed of a header and a data unit.

データユニットには、図3(a)に示すように、画像データおよび、以下の各種のパラメータが格納される。
AU Delimiter(Access Unit Delimiter)
SPS(Sequence Parameter Set)
PPS(Picture Parameter Set)
SEIs(Supplemental Enhancement Information)
これらのパラメータは、画像表示に利用されるパラメータである。
As shown in FIG. 3A, the data unit stores image data and various parameters as described below.
AU Delimiter (Access Unit Delimiter)
SPS (Sequence Parameter Set)
PPS (Picture Parameter Set)
SEIs (Supplemental Enhanment Information)
These parameters are parameters used for image display.

図3(a)に示すMPU(Media Presentation Unit)は、MMTフォーマットにおける画像、音声、字幕等の再生対象データの1つのデータ処理単位である。図3(a)に示す例は、画像データのMPUの例であり、いわゆる符号化、復号処理単位としてのGOP(Group of Pictures)と同じ単位である。 The MPU (Media Presentation Unit) shown in FIG. 3A is one data processing unit of reproduction target data such as images, sounds, and subtitles in the MMT format. The example shown in FIG. 3A is an example of an MPU of image data, which is the same unit as GOP (Group of Pictures) as a so-called coding / decoding processing unit.

このように、例えば画像データは、図3(a)に示すように、MMTフォーマットにおいて規定されたパラメータと画像構成データに分割され、図3(b)に示すMMTPペイロードに格納され、図3(c)に示すMMTPパケットとして構成される。
さらに、MMTPパケットは、図3(d)に示すTLVパケットのペイロードとして設定されて、TLVパケットが放送波やネットワークを介して送信される。
In this way, for example, the image data is divided into the parameters defined in the MMT format and the image configuration data as shown in FIG. 3A, stored in the MMTP payload shown in FIG. 3B, and shown in FIG. 3 (b). It is configured as the MMTP packet shown in c).
Further, the MMTP packet is set as the payload of the TLV packet shown in FIG. 3D, and the TLV packet is transmitted via a broadcast wave or a network.

なお、音声、字幕等の各データ、MMT-SIの各データについても、それぞれデータ種類単位のMMTPパケット、TLVパケットが設定されて送信される。
TLV-SIは、MMTPパケットに格納されることなくTLVパケットに格納されて送信される。
For each data such as voice and subtitles and each data of MMT-SI, MMTP packets and TLV packets for each data type are set and transmitted.
The TLV-SI is stored in the TLV packet and transmitted without being stored in the MMTP packet.

[3.BDAVフォーマットとSPAVフォーマットについて]
次に、上述のMMTフォーマットに従った配信コンテンツを例えばBD(Blu-ray(登録商標) Disc)やフラッシュメモリ、あるいはHDD(ハードディスク)等のメディアに記録して再生する場合の記録データフォーマットであるBDAVフォーマットとSPAVフォーマットについて図4以下を参照して説明する。
[3. About BDAV format and SPAV format]
Next, it is a recording data format in which the distribution content according to the above-mentioned MMT format is recorded and reproduced on a medium such as BD (Blu-ray (registered trademark) Disc), flash memory, or HDD (hard disk). The BDAV format and the SPAV format will be described with reference to FIG. 4 and below.

例えばBD(Blu-ray(登録商標) Disc)やフラッシュメモリやHDD等のメディアから、画像、音声、字幕等のコンテンツを再生する場合には、これらのコンテンツの再生処理を行なうための再生制御情報やインデックス情報が必要となる。再生制御情報やインデックス情報は一般的にデータベースファイルと呼ばれる。
これらの再生制御情報やインデックス情報は、メディアの記録データの再生処理を実行する再生アプリケーションに応じて異なるものとなる。
For example, when playing content such as images, sounds, and subtitles from media such as BD (Blu-ray (registered trademark) Disc), flash memory, and HDD, playback control information for performing playback processing of these contents. And index information is required. Playback control information and index information are generally called database files.
These reproduction control information and index information differ depending on the reproduction application that executes the reproduction processing of the recorded data of the media.

前述したように、現行の記録再生アプリケーション規格(=データ記録フォーマット)としてBDMVやBDAV規格(データ記録フォーマット)がある。これらのアプリケーション規格は、主にBD(Blu-ray(登録商標) Disc)を利用したデータ記録再生アプリケーション規格として策定されたものである。 As described above, there are BDMV and BDAV standards (data recording formats) as current recording / playback application standards (= data recording formats). These application standards have been established mainly as data recording / playback application standards using BD (Blu-ray (registered trademark) Disc).

なお、BDMVやBDAVは、主にBDを利用したデータ記録再生のアプリケーション規格であり、データ記録フォーマット(規格)であるが、これらの規格はBDに限らず、フラッシュメモリなど、その他のBD以外のメディアを利用したデータ記録再生にも適用可能である。
BDMVは、例えば映画コンテンツなどを予め記録したBD-ROM向けに開発されたアプリケーション規格であり、主に、パッケージコンテンツ等の書き換え不能なBD-ROMで広く使われている。
一方、BDAVは、主に書き換え可能なBD-RE型ディスクや、一回のみ記録可能なBD-R型ディスク等を利用したデータ記録再生処理に適用することを目的として開発された規格である。BDAVは、例えばユーザがビデオカメラなどで撮影した映像の記録再生やテレビ放送を記録し再生するために利用される。
BDMV and BDAV are application standards for data recording and playback mainly using BD, and are data recording formats (standards), but these standards are not limited to BD, and other than BD such as flash memory. It can also be applied to data recording and playback using media.
BDMV is an application standard developed for BD-ROMs in which movie contents are recorded in advance, and is mainly widely used in non-rewritable BD-ROMs such as package contents.
On the other hand, BDAV is a standard developed mainly for the purpose of applying to data recording / playback processing using a rewritable BD-RE type disc, a BD-R type disc that can be recorded only once, and the like. BDAV is used, for example, for recording / reproducing a video taken by a user with a video camera or the like, or for recording / reproducing a television broadcast.

上述のMMTフォーマットに従った配信コンテンツを記録したメディアからのコンテンツ再生処理を、BDAVフォーマット対応の再生アプリケーションを利用して行なうためには、このBDAVフォーマットに従ってデータ記録を行うことが必要である。
前述のように、BDAVフォーマットは、再生制御情報の記録ファイルとして、プレイリストファイルやクリップ情報ファイル等を規定しており、BDAV対応再生アプリケーションはこれらの再生制御情報ファイル(データベースファイル)の記録情報を利用してデータ再生処理を実行する。
In order to perform the content reproduction process from the medium in which the distribution content according to the above-mentioned MMT format is recorded by using the reproduction application corresponding to the BDAV format, it is necessary to perform the data recording according to this BDAV format.
As described above, the BDAV format defines playlist files, clip information files, etc. as playback control information recording files, and BDAV-compatible playback applications record the recording information of these playback control information files (database files). Use it to execute data playback processing.

図4は、情報記録媒体(メディア)40にBDAVフォーマットに従って記録されたデータのディレクトリ構成例を示す図である。
ディレクトリには、図4に示すように様々な管理情報、再生制御情報、再生対象データの格納ファイルが設定される。
FIG. 4 is a diagram showing an example of a directory structure of data recorded on the information recording medium (media) 40 according to the BDAV format.
As shown in FIG. 4, various management information, reproduction control information, and storage files for reproduction target data are set in the directory.

管理情報ファイルは、例えば、図4に示すインフォファイル(info)、メニューファイル(menu)、マークファイル(mark)等によって構成される。これらは、主にユーザに見せるタイトルの管理情報等を格納する。
また、再生制御情報ファイルとして、
プレイリストファイル(playlist)、
クリップ情報ファイル(clipinf)
例えば、これらのファイルが記録される。
さらに、再生データ格納ファイルとして、クリップAVストリームファイル(stream)が記録される。
The management information file is composed of, for example, an info file (info), a menu file (menu), a mark file (mark), and the like shown in FIG. These mainly store title management information and the like to be shown to the user.
Also, as a playback control information file,
Playlist file (playlist),
Clip information file (clipinf)
For example, these files are recorded.
Further, a clip AV stream file (stream) is recorded as a reproduction data storage file.

プレイリストファイルは、タイトルによって指定される再生プログラムのプログラム情報に従ってコンテンツの再生順等を規定したファイルであり、例えば、再生位置情報等を記録したクリップ情報ファイルの指定情報等を有する。
クリップ情報ファイルは、プレイリストファイルによって指定されるファイルであり、クリップAVストリームファイルの再生位置情報等を有する。
The playlist file is a file that defines the playback order and the like of the contents according to the program information of the playback program designated by the title, and has, for example, the designated information of the clip information file in which the playback position information and the like are recorded.
The clip information file is a file specified by the playlist file, and has playback position information of the clip AV stream file and the like.

クリップAVストリームファイルは、再生対象となるAVストリームデータや管理情報を格納したファイルである。クリップAVストリームファイルは、再生対象となる画像、音声、字幕等の各データや、管理情報を格納したパケットによって構成される。
なお、MPEG-2TSフォーマットにおいて規定され、クリップAVストリームファイルに記録される管理情報として、例えば、PSI/SI(Program Specific Information/Service Information)がある。
The clip AV stream file is a file that stores AV stream data to be played back and management information. The clip AV stream file is composed of packets for storing management information and data such as images, sounds, and subtitles to be played back.
The management information defined in the MPEG-2 TS format and recorded in the clip AV stream file includes, for example, PSI / SI (Program Special Information / Service Information).

なお、従来の放送データや、ネットワーク配信データは、TS(Transport Stream)パケットによって構成されたMPEG-2TSフォーマットデータであるが、今後の4K,8K画像等の高精細画像等を含むデータは前述したMMTPパケットによって構成されるMMTフォーマットデータとなることが予想される。 The conventional broadcast data and network distribution data are MPEG-2 TS format data composed of TS (Transport Stream) packets, but the data including high-definition images such as 4K and 8K images in the future are described above. It is expected to be MMT format data composed of MMTP packets.

図4にはクリップAVストリームファイル(stream)として、
TSパケットによって構成されたMPEG-2TSフォーマットデータからなるストリームファイル(nnnnn.m2ts)、
MMTPパケットによって構成されるMMTフォーマットデータ(nnnnn.mmtv)、
これらの2種類のストリームファイルを示している。
In FIG. 4, as a clip AV stream file (stream),
A stream file (nnnnnn.m2ts) composed of MPEG-2 TS format data composed of TS packets,
MMT format data (nnnnnn.mmtv) composed of MMTP packets,
These two types of stream files are shown.

図4に示すディレクトリ例は、情報処理装置30が受信したデータがMPEG-2TSフォーマットデータである場合は、そのまま、MPEG-2TSフォーマットデータとしてメディアに記録し、受信データがMMTフォーマットデータである場合は、MMTフォーマットデータとしてメディアに記録する設定の場合のディレクトリ例である。 In the directory example shown in FIG. 4, when the data received by the information processing apparatus 30 is MPEG-2 TS format data, it is recorded as it is on the media as MPEG-2 TS format data, and when the received data is MMT format data, it is recorded as it is. , This is an example of a directory in the case of setting to record on media as MMT format data.

なお、MMTフォーマットデータをメディアに記録する場合のクリップAVストリームファイルは、
(1)MMTフォーマットをMPEG-2TSフォーマットに変換してクリップAVストリームファイルを生成する、あるいは、
(2)MMTフォーマットに従ったデータを格納したパケットのパケット列からなるクリップAVストリームファイルを生成する、
これらの2種類の処理が想定される。
The clip AV stream file for recording MMT format data on media is
(1) Convert the MMT format to the MPEG-2 TS format to generate a clip AV stream file, or
(2) Generate a clip AV stream file consisting of a packet string of packets storing data according to the MMT format.
These two types of processing are assumed.

現在、上記(2)の処理、すなわち、MMTフォーマットに従ったデータを格納したパケットのパケット列からなるクリップAVストリームファイルを生成してメディアに記録する方向で議論が進んでいる。
具体的には、MMTP(MMT Protocol)パケット、あるいはMMTPパケットの上位パケットであるTLV(Type Length Value)パケットのパケット列として記録する方向で議論が進んでいる。
この具体例については後段で詳細に説明する。
Currently, discussions are underway in the process of (2) above, that is, to generate a clip AV stream file consisting of a packet sequence of packets storing data according to the MMT format and record it on a medium.
Specifically, discussions are proceeding in the direction of recording as a packet sequence of an MMTP (MMT Protocol) packet or a TLV (Type Length Value) packet which is a higher-level packet of the MMTP packet.
This specific example will be described in detail later.

管理情報ファイル、プレイリストファイル、クリップ情報ファイル、これらのデータファイルは、クリップAVストリームファイルに格納された再生データである画像、音声、字幕等の再生処理に適用する管理情報の格納ファイルである。これらは、再生制御情報や、再生データの属性情報等を格納したファイルであり、データベースファイルと呼ばれる。 The management information file, playlist file, clip information file, and these data files are storage files for management information applied to the reproduction processing of images, sounds, subtitles, etc., which are reproduction data stored in the clip AV stream file. These are files that store playback control information, attribute information of playback data, and the like, and are called database files.

情報記録媒体に記録されたコンテンツを再生するシーケンスは以下の通りである。
(a)まず、再生アプリケーションによって管理情報ファイルから特定のプレイリストを指定する。
(b)選択されたプレイリストに規定されたクリップ情報ファイルを選択し、クリップ情報ファイルの記録データに従って、クリップAVストリームファイルから、画像、音声等の再生データであるAVストリームあるいはコマンドを読み出して、AVストリームの再生や、コマンドの実行処理を開始する。
The sequence for reproducing the content recorded on the information recording medium is as follows.
(A) First, a specific playlist is specified from the management information file by the playback application.
(B) Select the clip information file specified in the selected playlist, read the AV stream or command that is the playback data such as images and sounds from the clip AV stream file according to the recorded data of the clip information file. Starts playback of the AV stream and command execution processing.

図5は、情報記録媒体(メディア)40に記録される以下のデータ、すなわち、
プレイリストファイル、
クリップ情報ファイル、
クリップAVストリームファイル、
これらのデータの対応関係を説明する図である。
FIG. 5 shows the following data recorded on the information recording medium (media) 40, that is,
Playlist file,
Clip information file,
Clip AV stream file,
It is a figure explaining the correspondence relation of these data.

実際の再生対象データである画像、音声、字幕等の再生対象データからなるAVストリームはクリップAVストリーム(Clip AV Stream)ファイルとして記録され、さらに、これらのAVストリームの管理情報、再生制御情報ファイルとして、プレイリスト(PlayList)ファイルと、クリップ情報(Clip Information)ファイルが規定される。 An AV stream consisting of playback target data such as images, sounds, and subtitles, which are actual playback target data, is recorded as a clip AV stream (Clip AV Stream) file, and further, as management information and playback control information files of these AV streams. , A playlist (PlayList) file and a clip information (Clip Information) file are specified.

これら複数のカテゴリのファイルは、図5に示すように、
プレイリスト(PlayList)ファイルを含むプレイリストレイヤ、
クリップAVストリーム(Clip AV Stream)ファイルと、クリップ情報(Clip Information)ファイルからなるクリップレイヤ、
これらの2つのレイヤに区分できる。
These multiple categories of files are as shown in FIG.
Playlist layer containing playlist (PlayList) files,
A clip layer consisting of a clip AV stream file and a clip information file,
It can be divided into these two layers.

なお、一つのクリップAVストリーム(Clip AV Stream)ファイルには一つのクリップ情報(Clip Information)ファイルが対応付けられ、これらのペアを一つのオブジェクトと考え、これらをまとめてクリップ(Clip)、あるいはクリップファイルと呼ぶ。
クリップAVストリームファイルに含まれるデータの詳細情報、例えばMPEGデータのIピクチャ位置情報などを記録したEPマップなどの管理情報がクリップ情報ファイルに記録される。
One clip AV stream (Clip AV Stream) file is associated with one clip information (Clip Information) file, and these pairs are considered as one object, and these are collectively clipped or clipped. Call it a file.
Detailed information of the data included in the clip AV stream file, for example, management information such as an EP map recording I-picture position information of MPEG data is recorded in the clip information file.

なお、クリップAVストリーム(Clip AV Stream)ファイルは、MPEG-2TSフォーマットデータである場合はTSパケットによって構成される。
また、MMTフォーマットデータである場合はMMTPパケットによって構成される。
The Clip AV Stream file is composed of TS packets when it is MPEG-2 TS format data.
Further, in the case of MMT format data, it is composed of MMTP packets.

クリップ情報(Clip Information)ファイルは、例えば、クリップAVストリームファイルのバイト列データのデータ位置と、時間軸上に展開した場合の再生開始ポイントであるエントリポイント(EP)等の再生時間位置等の対応データ等、クリップAVストリームファイルの格納データの再生開始位置などを取得するための管理情報を格納している。 The clip information (Clip Information) file corresponds to, for example, the data position of the byte string data of the clip AV stream file and the reproduction time position such as the entry point (EP) which is the reproduction start point when expanded on the time axis. Storage of clip AV stream files such as data Management information for acquiring the playback start position of data is stored.

プレイリストは、クリップ(Clip)の再生開始位置や再生終了位置に対応するアクセスポイントを時間軸上の情報であるタイムスタンプで指し示す情報を有する。
例えば、コンテンツの開始点からの再生時間経過位置を示すタイムスタンプに基づいてクリップ情報ファイルを参照して、クリップAVストリームファイルのデータ読み出し位置、すなわち再生開始点としてのアドレスを取得することが可能となる。
クリップ情報ファイル(Clip Information file)は、このタイムスタンプから、クリップAVストリームファイル中のストリームのデコードを開始すべきアドレス情報を見つけるために利用される。
The playlist has information indicating the access point corresponding to the reproduction start position and the reproduction end position of the clip (Clip) by a time stamp which is information on the time axis.
For example, it is possible to refer to the clip information file based on the time stamp indicating the playback time elapsed position from the start point of the content, and acquire the data read position of the clip AV stream file, that is, the address as the playback start point. Become.
The clip information file (Clip Information file) is used to find the address information from which the decoding of the stream in the clip AV stream file should be started from this time stamp.

このように、プレイリスト(PlayList)ファイルは、クリップ(=クリップ情報ファイル+クリップAVストリームファイル)レイヤに含まれる再生可能データに対する再生区間の指定情報を有する。
プレイリスト(PlayList)ファイルには、1つ以上のプレイアイテム(PlayItem)が設定され、プレイアイテムの各々が、クリップ(=クリップ情報ファイル+クリップAVストリームファイル)レイヤに含まれる再生可能データに対する再生区間の指定情報を有する。
As described above, the playlist (PlayList) file has the designated information of the reproduction section for the reproducible data included in the clip (= clip information file + clip AV stream file) layer.
One or more play items (PlayItem) are set in the playlist (PlayList) file, and each play item is a playback section for playable data included in the clip (= clip information file + clip AV stream file) layer. Has the designated information of.

なお、再生対象データを格納したクリップAVストリーム(Clip AV Stream)ファイルは、前述したように、従来型のMPEG-2TSフォーマットデータである場合はTSパケットによって構成される。
また、今後、利用が拡大されると予想される4K,8K画像等の高精細画像データの場合は、MMTフォーマットデータである場合はMMTPパケットによって構成される。
図6、図7を参照して、MMTフォーマットと、MPEG-2TSフォーマットについて説明する。
As described above, the clip AV stream (Clip AV Stream) file storing the data to be reproduced is composed of TS packets in the case of the conventional MPEG-2 TS format data.
Further, in the case of high-definition image data such as 4K and 8K images whose use is expected to be expanded in the future, in the case of MMT format data, it is composed of MMTP packets.
The MMT format and the MPEG-2 TS format will be described with reference to FIGS. 6 and 7.

まず、図6を参照して、MPEG-2TSフォーマットについて説明する。
MPEG-2TSフォーマットは画像(Video)、音声(Audio)、字幕(Subtitle)等、コンテンツ構成データである符号化データや管理情報(PSI/SI)を記録媒体(メディア)に格納、または放送波やネットワークを介して伝送する際の符号化データ等のデータ格納形式(コンテナフォーマット)を規定したフォーマットである。
First, the MPEG-2 TS format will be described with reference to FIG.
The MPEG-2 TS format stores coded data and management information (PSI / SI), which are content composition data such as images (Video), audio (Audio), and subtitles (Subtile), in a recording medium (media), or broadcast waves. It is a format that defines a data storage format (container format) such as coded data when transmitting via a network.

MPEG-2TSフォーマットは、ISO13818-1において標準化されたフォーマットであり、例えばBD(Blu-ray(登録商標) Disc)に対するデータ記録や、デジタル放送等に用いられている。 The MPEG-2 TS format is a format standardized in ISO13818-1, and is used for, for example, data recording for BD (Blu-ray (registered trademark) Disc), digital broadcasting, and the like.

図6(a)~(c)はMPEG-2TSフォーマットデータの構成を示す図である。
最下段に示す図6(a)は、MPEG-2TSのフォーマットデータの全体構成を示す図である。
図6(a)に示すように、MPEG-2TSフォーマットデータは、複数のエレメンタリストリーム(Elementary stream)によって構成される。
エレメンタリストリーム(Elementary stream)は、例えば画像、音声、字幕等の1つの単位として設定されるユニットである。
6 (a) to 6 (c) are diagrams showing the structure of MPEG-2 TS format data.
FIG. 6A shown at the bottom is a diagram showing the overall configuration of the MPEG-2 TS format data.
As shown in FIG. 6A, the MPEG-2 TS format data is composed of a plurality of elementary streams.
The elementary stream is a unit set as one unit of, for example, an image, an audio, a subtitle, and the like.

1つのエレメンタリストリーム(Elementary stream)は、図2(b)に示すように、1つまたは複数のPES(Packetized Elementary stream)パケットによって構成される。
具体的には、1つのエレメンタリストリーム(Elementary stream)は、ペイロードタイプ(Payload_type)=0x0で、かつ同じパケット識別子(Packet_id)を持つPESパケットの1つ、または複数から構成される。
As shown in FIG. 2 (b), one elementary stream (Elementary stream) is composed of one or more PES (Packetized Elementary stream) packets.
Specifically, one elementary stream is composed of one or a plurality of PES packets having a payload type (Payload_type) = 0x0 and having the same packet identifier (Packet_id).

1つのPESパケットは、図6(c)に示すように、1つまたは複数のTSパケットによって構成される。
具体的には、1つのPESパケットは、ペイロードタイプ(Payload_type)=0x0で、かつ同じパケット識別子(Packet_id)を持つTSパケットの1つ、または複数から構成される。
TSパケットは、前述のMMTPパケットと異なり、固定長であり、1つのTSパケットのパケットサイズは、188バイトに固定されている。
One PES packet is composed of one or more TS packets as shown in FIG. 6 (c).
Specifically, one PES packet is composed of one or a plurality of TS packets having a payload type (Payload_type) = 0x0 and having the same packet identifier (Packet_id).
Unlike the above-mentioned MMTP packet, the TS packet has a fixed length, and the packet size of one TS packet is fixed at 188 bytes.

次に、図7を参照してMMT(MPEG Media Transport)フォーマットについて説明する。
MMTフォーマットについては、先に図3を参照しているが、図7に示すMMTフォーマットの説明図は、図6を参照して説明したMPEG-2TSフォーマットとの対応関係を分かり易く説明した図である。
Next, the MMT (MPEG Media Transport) format will be described with reference to FIG. 7.
Regarding the MMT format, FIG. 3 is referred to earlier, but the explanatory diagram of the MMT format shown in FIG. 7 is a diagram that clearly explains the correspondence with the MPEG-2 TS format described with reference to FIG. be.

先に説明したように、MMTフォーマットは、画像(Video)、音声(Audio)、字幕(Subtitle)等、コンテンツ構成データである符号化データを放送波やネットワークを介して伝送する際のデータ転送方式(トランスポートフォーマット)を規定したものである。
図7は、ISO/IEC 23008-1に規定されるファイルフォーマットであるMMTフォーマットについて説明する図である。
As described above, the MMT format is a data transfer method for transmitting coded data, which is content composition data, such as an image (Video), audio (Audio), and subtitle (Subtitle), via a broadcast wave or a network. (Transport format) is specified.
FIG. 7 is a diagram illustrating an MMT format, which is a file format defined in ISO / IEC 23008.1.

図7(a)~(c)にはMMTフォーマットデータの構成を示している。
最下段に示す図7(a)は、MMTフォーマットデータの全体構成を示す図である。
図7(a)に示すように、MMTフォーマットデータは、複数のメディアプレゼンテーションユニット(MPU:Media presentation unit)によって構成される。
MPUは、例えば画像、音声、字幕等の1つの単位として設定されるユニットである。例えば、画像の場合、1MPUが1つのMPEG圧縮画像単位である1GOP(Group of picture)に相当する。
7 (a) to 7 (c) show the structure of MMT format data.
FIG. 7A shown at the bottom is a diagram showing the overall configuration of MMT format data.
As shown in FIG. 7A, the MMT format data is composed of a plurality of media presentation units (MPU: Media presentation unit).
The MPU is a unit set as one unit of, for example, an image, sound, subtitles, and the like. For example, in the case of an image, 1MPU corresponds to 1GOP (Group of picture) which is one MPEG compressed image unit.

1つのMPUは、図7(b)に示すように、1つまたは複数のメディアフラグメントユニット(MFU:Media Fragment unit)によって構成される。
具体的には、1つのMPUは、ペイロードタイプ(Payload_type)=0x0(MPU)で、かつ同じパケット識別子(Packet_id)を持つMFUの1つ、または複数から構成される。
As shown in FIG. 7 (b), one MPU is composed of one or more media fragment units (MFU: Media Fragment unit).
Specifically, one MPU is composed of one or a plurality of MFUs having a payload type (Payload_type) = 0x0 (MPU) and having the same packet identifier (Packet_id).

1つのMFUは、図7(c)に示すように、1つまたは複数のMMTPパケットによって構成される。
具体的には、1つのMFUは、ペイロードタイプ(Payload_type)=0x0(MPU)で、かつ同じパケット識別子(Packet_id)を持つMMTPパケットの1つ、または複数から構成される。
MMTPパケットは可変長であり、様々なパケットサイズに設定可能である。
MMTPパケットの各々は、属性情報等を格納するヘッダ(MMTPヘッダ)と、符号化画像の実データ等を格納するペイロード(MMTPペイロード)により、構成される。
One MFU is composed of one or more MMTP packets as shown in FIG. 7 (c).
Specifically, one MFU is composed of one or a plurality of MMTP packets having a payload type (Payload_type) = 0x0 (MPU) and having the same packet identifier (Packet_id).
The MMTP packet has a variable length and can be set to various packet sizes.
Each MMTP packet is composed of a header (MMTP header) for storing attribute information and the like and a payload (MMTP payload) for storing actual data and the like of a coded image.

なお、BDAVフォーマットに類似するフォーマットとしてSPAVフォーマットがある。前述したように、BDMVやBDAVは、主にBDを利用したデータ記録再生のアプリケーション規格である。これに対して、SPAVフォーマットは、主にハードディスクに対するデータ記録再生のアプリケーション規格である。
ただし、BDAVフォーマット、SPAVフォーマットのいずれも、BD,フラッシュメモリ、HDD等、様々なメディアを利用した記録再生に利用可能なフォーマットである。
There is a SPAV format as a format similar to the BDAV format. As described above, BDMV and BDAV are application standards for data recording / reproduction mainly using BD. On the other hand, the SPAV format is an application standard for data recording and reproduction mainly for hard disks.
However, both the BDAV format and the SPAV format are formats that can be used for recording and playback using various media such as BD, flash memory, and HDD.

SPAVフォーマットデータは、BDAVフォーマットにおけるデータ記録再生処理と同様の処理でデータ記録再生を実行することが可能である。ただし、SPAVフォーマットは、ファイル名設定が、BDAVフォーマットと一部、異なっている。
図8にSPAVフォーマットのディレクトリ構成例を示す。
The SPAV format data can be recorded and reproduced by the same processing as the data recording / reproduction processing in the BDAV format. However, the file name setting of the SPAV format is partially different from that of the BDAV format.
FIG. 8 shows an example of a directory structure in the SPAV format.

図8に示すSPAVフォーマットのディレクトリには、先に図4を参照して説明したBDAVフォーマットと同様、様々な管理情報、再生制御情報、再生対象データの格納ファイルが設定される。 In the directory of the SPAV format shown in FIG. 8, various management information, reproduction control information, and storage files of reproduction target data are set as in the BDAV format described above with reference to FIG.

管理情報ファイルは、例えば、図8に示すインフォファイル(INFO)、メニューファイル(MENU)、マークファイル(MARK)等によって構成される。これらは、主にユーザに見せるタイトルの管理情報等を格納する。
また、再生制御情報ファイルとして、
プレイリストファイル(PLAYLIST)、
クリップ情報ファイル(CLIPINF)
例えば、これらのファイルが記録される。
さらに、再生データ格納ファイルとして、クリップAVストリームファイル(STREAM)が記録される。
The management information file is composed of, for example, an info file (INFO), a menu file (MENU), a mark file (MARK), and the like shown in FIG. These mainly store title management information and the like to be shown to the user.
Also, as a playback control information file,
Playlist file (PLAYLIST),
Clip information file (CLIPINF)
For example, these files are recorded.
Further, a clip AV stream file (STREAM) is recorded as a reproduction data storage file.

図8に示すようにSPAVフォーマットのディレクトリ名や各ファイルの拡張子の設定が、図4を参照して説明したBDAVフォーマットと異なっている。
ただし、各ファイルに格納されるデータや、各ファイルの役割は、BDAVフォーマットと同様である。
As shown in FIG. 8, the setting of the directory name of the SPAV format and the extension of each file is different from the BDAV format described with reference to FIG.
However, the data stored in each file and the role of each file are the same as in the BDAV format.

以下の実施例の説明では、MMTフォーマットデータをBDAVフォーマットデータとして記録し、再生する処理例について説明するが、以下に説明する実施例は、MMTフォーマットデータをSPAVフォーマットデータとして記録し、再生する処理にも適用可能である。 In the following description of the embodiment, an example of processing for recording and reproducing MMT format data as BDAV format data will be described, but in the following embodiment, processing for recording and reproducing MMT format data as SPAV format data will be described. It is also applicable to.

[4.MMTフォーマットデータをBDAVフォーマットに従って記録する場合の処理について]
次に、MMTフォーマットデータをBDAVフォーマットに従って記録する場合の処理について説明する。
[4. Processing when recording MMT format data according to BDAV format]
Next, a process for recording MMT format data according to the BDAV format will be described.

先に説明したように、MMTフォーマットは、今後、放送局等によって配信が予定される4K画像等に利用されるデータ配信フォーマットであり、図3を参照して説明したプロトコルスタックに従ったフォーマットである。
一方、BDAVフォーマットはメディアに対するデータ記録フォーマットであり、図4を参照して説明したようにプレイリストファイルやクリップ情報ファイル等の再生制御情報ファイルを含むデータベースファイルが規定されている。
なお、BDAVフォーマットはデータ記録フォーマットであるとともにデータ記録再生アプリケーション規格にも対応しており、BDAVフォーマットに従ってメディアに記録されたデータ再生は、BDAVフォーマット対応の再生アプリケーションを利用して再生処理が実行される。
As described above, the MMT format is a data distribution format used for 4K images and the like scheduled to be distributed by broadcasting stations and the like in the future, and is a format according to the protocol stack described with reference to FIG. be.
On the other hand, the BDAV format is a data recording format for media, and as described with reference to FIG. 4, a database file including a playback control information file such as a playlist file or a clip information file is defined.
The BDAV format is a data recording format and is compatible with the data recording / playback application standard. Data playback recorded on the media according to the BDAV format is performed by using a playback application compatible with the BDAV format. To.

従って、MMTフォーマットに従った配信コンテンツをメディアに記録し、記録したメディアからのコンテンツ再生処理をBDAVフォーマット対応の再生アプリケーションを利用して行なうためには、BDAVフォーマットに従ったデータ記録を行うことが必要である。 Therefore, in order to record the distributed content according to the MMT format on the media and perform the content reproduction processing from the recorded media by using the reproduction application corresponding to the BDAV format, it is necessary to record the data according to the BDAV format. is necessary.

前述したように、現在、BDAVフォーマットを拡張し、MMTフォーマットデータを記録、再生可能とするための規定について議論が進められている。 As mentioned above, discussions are currently underway on provisions for extending the BDAV format to make MMT format data recordable and playable.

なお、前述したように、MMTフォーマットデータをメディアに記録する場合のクリップAVストリームファイルは、
(1)MMTフォーマットをMPEG-2TSフォーマットに変換してクリップAVストリームファイルを生成する、あるいは、
(2)MMTフォーマットに従ったデータを格納したパケットのパケット列からなるクリップAVストリームファイルを生成する、
これらの2種類の処理が可能である。
As described above, the clip AV stream file for recording MMT format data on the media is
(1) Convert the MMT format to the MPEG-2 TS format to generate a clip AV stream file, or
(2) Generate a clip AV stream file consisting of a packet string of packets storing data according to the MMT format.
These two types of processing are possible.

現在、上記(2)の処理、すなわち、MMTフォーマットに従ったデータを格納したパケットのパケット列からなるクリップAVストリームファイルを生成してメディアに記録する方向で議論が進んでいる。
具体的には、MMTP(MMT Protocol)パケット、あるいはMMTPパケットの上位パケットであるTLV(Type Length Value)パケットのパケット列として記録する方向で議論が進んでいる。
Currently, discussions are underway in the process of (2) above, that is, to generate a clip AV stream file consisting of a packet sequence of packets storing data according to the MMT format and record it on a medium.
Specifically, discussions are proceeding in the direction of recording as a packet sequence of an MMTP (MMT Protocol) packet or a TLV (Type Length Value) packet which is a higher-level packet of the MMTP packet.

例えば、放送局等が送信するMMTフォーマットに従った配信データを録画機等の情報処理装置が受信し、受信データをBDやフラッシュメモリ、あるいはHDD(ハードディスク)等のメディアに記録する処理を行う場合、画像、音声、字幕データや管理情報(SI)等のデータについては、MMTフォーマットに従ったデータを格納したパケットのパケット列としてそのまま記録する。 For example, when an information processing device such as a recorder receives distribution data according to the MMT format transmitted by a broadcasting station or the like, and records the received data on a medium such as a BD, a flash memory, or an HDD (hard disk). , Image, audio, subtitle data, management information (SI), and other data are recorded as they are as a packet string of a packet that stores data according to the MMT format.

すなわち、図4に示すBDAVフォーマット、あるいは図8に示すSPAVフォーマットに設定されるクリップAVストリームファイル[02001.mmtv等]に、MMTフォーマットに従ったデータを格納したパケットのパケット列を記録する。
なお、MMTフォーマットデータを格納したクリップAVストリームファイル[02001.mmtv等]に対応する再生制御情報ファイルであるプレイリストファイルやクリップ情報ファイルについては、MMTフォーマットデータ対応の制御情報を設定したプレイリストファイルやクリップ情報ファイルを記録装置が生成してメディアに記録することになる。
That is, the clip AV stream file set in the BDAV format shown in FIG. 4 or the SPAV format shown in FIG. 8 [02001. In mmtv, etc.], the packet sequence of the packet storing the data according to the MMT format is recorded.
A clip AV stream file containing MMT format data [012001. Regarding the playlist file and clip information file that are playback control information files corresponding to [mmtv, etc.], the recording device generates a playlist file and clip information file in which control information corresponding to MMT format data is set and records them on the media. It will be.

なお、MMTフォーマットデータを格納したクリップAVストリームファイルは、具体的には、MMTP(MMT Protocol)パケット、あるいはMMTPパケットの上位パケットであるTLV(Type Length Value)パケット、これら2種類のパケットのいずれかのパケット列として記録することが可能である。 The clip AV stream file storing the MMT format data is specifically one of MMTP (MMT Protocol) packets, TLV (Type Length Value) packets which are higher-level packets of MMTP packets, and these two types of packets. It is possible to record as a packet string of.

MMTフォーマットデータを格納したクリップAVストリームファイルの具体的な記録構成例について図9、図10を参照して説明する。
図9は、BDやフラッシュメモリ、あるいはHDD(ハードディスク)等の記録メディアに、MMTフォーマットに従ったMMTP(MMT Protocol)パケット列を記録する処理例を説明する図である。
A specific recording configuration example of the clip AV stream file storing the MMT format data will be described with reference to FIGS. 9 and 10.
FIG. 9 is a diagram illustrating a processing example of recording an MMTP (MMT Protocol) packet string according to the MMT format on a recording medium such as a BD, a flash memory, or an HDD (hard disk).

図9には、以下の3つのデータを示している。
(A)放送配信データであるTLVパケット列
(B)受信再生データとして処理される1つのTLVパケット
(C)メディア記録用データの構成として提案されているMMTPパケット列
FIG. 9 shows the following three data.
(A) TLV packet string which is broadcast distribution data (B) One TLV packet processed as received / reproduced data (C) MMTP packet string proposed as a configuration of media recording data

(A)放送配信データであるTLVパケット列は、先に図2を参照して説明したMMT(MPEG Media Transport)フォーマットを有するTLVパケットの列(シーケンス)である。
このTLVパケット列が、放送局等の送信装置20から送信される。
(A) The TLV packet sequence, which is broadcast distribution data, is a sequence of TLV packets having the MMT (MPEG Media Transport) format described above with reference to FIG. 2.
This TLV packet sequence is transmitted from a transmission device 20 such as a broadcasting station.

(B)受信再生データとして処理される1つのTLVパケットは、テレビや録画機等の情報処理装置30が受信し、再生処理を行う1つのTLVパケットである。(A)に示すTLVパケット列を構成する1つのTLVパケットの詳細構成を示している。
先に図2を参照して説明したMMT(MPEG Media Transport)フォーマットを有するTLVパケットである。
(B) One TLV packet processed as received / reproduced data is one TLV packet received by an information processing apparatus 30 such as a television or a recorder and subjected to reproduction processing. The detailed configuration of one TLV packet constituting the TLV packet sequence shown in (A) is shown.
It is a TLV packet having an MMT (MPEG Media Transport) format described above with reference to FIG.

(C)メディア記録用データの構成として示すMMTPパケット列は、現在、メディアに対する記録データとして提案されているMMTPパケット列である。
メディアに記録されるMMTPパケットは、図9(B)との対応関係を示す点線から理解されるように、TLVパケットの一部の構成データであるMMTPパケットであり、以下の要素から構成される。
(a)MMTPパケットヘッダ(MMTP_packet_header)
(b)MMTPパケットデータ(MMTP_packet_data)(=ペイロード)
(C) The MMTP packet sequence shown as the structure of the media recording data is an MMTP packet sequence currently proposed as recording data for the media.
The MMTP packet recorded on the media is an MMTP packet which is a part of the configuration data of the TLV packet, as can be understood from the dotted line showing the correspondence with FIG. 9B, and is composed of the following elements. ..
(A) MMTP packet header (MMTP_packet_header)
(B) MMTP packet data (MMTP_packet_data) (= payload)

なお、MMTPパケットデータ(MMTP_packet_data)(=ペイロード)は以下の要素によって構成される。
(b1)MMTPペイロードヘッダ(MMTP_payload_header)
(b2)MMTPペイロードデータ(MMTP_payload_data)
The MMTP packet data (MMTP_packet_data) (= payload) is composed of the following elements.
(B1) MMTP payload header (MMTP_payload_header)
(B2) MMTP payload data (MMTP_payload_data)

現在、情報記録媒体(メディア)に対する記録データとして提案されている一つの構成が、この図9(C)に示すような、TLVパケットの構成要素であるMMTPパケットのみを取り出して、一列に並べて記録する構成である。 Currently, one configuration proposed as recording data for an information recording medium (media) is to take out only the MMTP packet, which is a component of the TLV packet, as shown in FIG. 9C, and record them side by side in a row. It is a configuration to do.

図10は、BDやフラッシュメモリ、あるいはHDD(ハードディスク)等の記録メディアに、MMTP(MMT Protocol)パケットではなく、MMTPパケットを格納した上位のTLVパケットのパケット列を記録する処理例を説明する図である。 FIG. 10 is a diagram illustrating a processing example of recording a packet sequence of a higher-level TLV packet storing an MMTP packet instead of an MMTP (MMT Protocol) packet on a recording medium such as a BD, a flash memory, or an HDD (hard disk). Is.

図10には、図9と同様、以下の3つのデータを示している。
(A)放送配信データであるTLVパケット列
(B)受信再生データとして処理される1つのTLVパケット
(C)メディア記録用データの構成として提案されているTLVパケット列
Similar to FIG. 9, FIG. 10 shows the following three data.
(A) TLV packet string which is broadcast distribution data (B) One TLV packet processed as received / reproduced data (C) TLV packet string proposed as a configuration of media recording data

(A),(B)は、図9を参照して説明したと同様のデータである。
(C)メディア記録用データの構成として示すTLVパケット列は、現在、メディアに対する記録データとして提案されているもう1つの例であるTLVパケット列である。
メディアに記録されるTLVパケットは、図10(B)との対応関係を示す点線から理解されるように、MMTPパケットを含むTLVパケットであり、以下の要素から構成される。
(a)TLVパケットヘッダ(TLV_header)
(b)TLVパケットデータ(TLV_data)(=ペイロード)
(A) and (B) are the same data as described with reference to FIG.
(C) The TLV packet sequence shown as the structure of the data for media recording is another example of the TLV packet sequence currently proposed as recording data for the media.
The TLV packet recorded on the media is a TLV packet including an MMTP packet, as can be understood from the dotted line showing the correspondence with FIG. 10B, and is composed of the following elements.
(A) TLV packet header (TLV_header)
(B) TLV packet data (TLV_data) (= payload)

このように、BD等のメディアに対するMMTフォーマットデータの記録態様として、
図9を参照して説明したMMTP(MMT Protocol)パケットのパケット列、あるいは、
図10を参照して説明したTLV(Type Length Value)パケットのパケット列、
これらいずれかのパケット列として記録することが想定される。
As described above, as a recording mode of MMT format data for media such as BD,
The packet sequence of the MMTP (MMT Protocol) packet described with reference to FIG. 9, or
Packet sequence of TLV (Type Length Value) packets described with reference to FIG.
It is expected to be recorded as one of these packet strings.

図9、または図10に示すような設定でMMTフォーマットデータをメディアに記録して、MMTフォーマットデータの再生処理をBDAVフォーマット対応の再生アプリケーションを利用して行う場合、BDAVフォーマット対応の再生制御情報ファイル、すなわち、プレイリストファイルやクリップ情報ファイルを利用して再生を行うことになる。
なお、BDAVフォーマットはデータ記録フォーマットであるとともにデータ記録再生アプリケーション規格にも対応しており、BDAVフォーマットに従ってメディアに記録されたデータの再生は、BDAVフォーマット対応の再生アプリケーションを利用して実行される。
When the MMT format data is recorded on the media with the settings shown in FIG. 9 or 10 and the reproduction process of the MMT format data is performed by using the reproduction application corresponding to the BDAV format, the reproduction control information file corresponding to the BDAV format is used. That is, the playback is performed using the playlist file and the clip information file.
The BDAV format is a data recording format and also supports a data recording / playback application standard, and playback of data recorded on a medium according to the BDAV format is executed using a playback application compatible with the BDAV format.

BDAVフォーマットは、再生制御情報ファイルであるプレイリストファイルやクリップ情報ファイル等のBDAVフォーマット固有のデータベースファイルを規定しており、BDAV対応再生アプリケーションはこれらの再生制御情報ファイル(データベースファイル)の記録情報を利用してデータ再生処理を実行する。 The BDAV format defines database files specific to the BDAV format, such as playlist files and clip information files, which are playback control information files, and BDAV-compatible playback applications record information from these playback control information files (database files). Use it to execute data playback processing.

前述したように、BDAVフォーマット規定のプレイリストファイルやクリップ情報ファイル等のデータベースファイルは、もともと、MPEG-2TSフォーマットの配信データに基づいて生成可能なファイルとして規定されたものである。
従って、MPEG-2TSフォーマットとはフォーマットの異なるMMTフォーマットに従った配信データは、現行のBDAVフォーマット規定のプレイリストファイルやクリップ情報ファイルにそのまま記録しても、現行のBDAV対応再生アプリケーションが利用できないデータとなる場合がある。
As described above, the database files such as the playlist file and the clip information file specified in the BDAV format are originally defined as files that can be generated based on the distribution data in the MPEG-2 TS format.
Therefore, even if the distribution data according to the MMT format, which is different from the MPEG-2 TS format, is recorded as it is in the playlist file or clip information file specified in the current BDAV format, the current BDAV compatible playback application cannot be used. May be.

MMTフォーマットデータをメディアに記録し、BDAVフォーマット対応アプリを利用してコンテンツ再生を行うことを可能とするためには、メディアに対するMMTフォーマットデータの記録処理に際して、MMTフォーマットデータ対応のプレイリストファイルやクリップ情報ファイルを生成してメディアに記録することが必要となる。
また、メディアに記録されたMMTフォーマットデータの再生時には、MMTフォーマットデータ対応のプレイリストファイルやクリップ情報ファイルを利用して再生を行うことが必要となる。
In order to record MMT format data on media and play back content using BDAV format compatible apps, playlist files and clips compatible with MMT format data are recorded when recording MMT format data on the media. It is necessary to generate an information file and record it on the media.
Further, when reproducing the MMT format data recorded on the media, it is necessary to reproduce using a playlist file or a clip information file corresponding to the MMT format data.

具体的には、図11に示すように、MMTフォーマットデータ格納クリップAVストリームファイル51対応のクリップ情報ファイル(nnnnn.clpi)52と、プレイリストファイル(nnnnn.rpls)53を生成して、メディア(BD,フラッシュメモリ,HDD等)に記録して再生に利用する処理が必要となる。 Specifically, as shown in FIG. 11, a clip information file (nnnnnn.clpi) 52 corresponding to the MMT format data storage clip AV stream file 51 and a playlist file (nnnnnn.rpls) 53 are generated to generate media (nnnnn.rpls). BD, flash memory, HDD, etc.) must be recorded and used for playback.

メディアに記録されたMMTフォーマットデータ格納クリップAVストリームファイル51を再生する場合には、このMMTフォーマットデータ格納クリップAVストリームファイル51対応のクリップ情報ファイル(nnnnn.clpi)52と、プレイリストファイル(nnnnn.rpls)53を利用して再生処理を行うことができる。 When playing back the MMT format data storage clip AV stream file 51 recorded on the media, the clip information file (nnnnnn.clpi) 52 corresponding to the MMT format data storage clip AV stream file 51 and the playlist file (nnnnnn. The reproduction process can be performed using rpls) 53.

しかし、前述したように、放送局の配信データであるMMTフォーマットに従って配信されるデータは、BDAVフォーマットで規定するプレイリストファイルやクリップ情報ファイルの記録用データを全て含むようには構成されていない。
また、MMTフォーマットデータ格納クリップAVストリームファイル51は、MPEG-2TSフォーマットデータとは異なるデータ形式となり、MPEG-2TSフォーマットデータ対応のプレイリストファイルやクリップ情報ファイルと同一形式のデータを持つプレイリストファイルやクリップ情報ファイルを利用しても、正しい再生処理は実行できないという問題がある。
However, as described above, the data distributed according to the MMT format, which is the distribution data of the broadcasting station, is not configured to include all the recording data of the playlist file and the clip information file specified in the BDAV format.
Further, the MMT format data storage clip AV stream file 51 has a data format different from that of the MPEG-2 TS format data, and is a playlist file having the same format as the MPEG-2 TS format data compatible playlist file or clip information file. Even if the clip information file is used, there is a problem that the correct playback process cannot be executed.

従って、このMMTフォーマットデータをメディアに記録して、BDAVフォーマット対応アプリを利用してコンテンツ再生を行うためには、MMTフォーマットデータ格納クリップAVストリームファイル51の再生制御を行うことができるMMTフォーマットデータ固有のデータ形式を持つプレイリストファイルやクリップ情報ファイルを生成してメディアに記録することが必要となる。 Therefore, in order to record this MMT format data on a medium and play back the content using the BDAV format compatible application, the playback control of the MMT format data storage clip AV stream file 51 can be controlled uniquely to the MMT format data. It is necessary to generate a playlist file or clip information file with the data format of and record it on the media.

[5.MMTフォーマットに従った音声データについて]
先に図9、図10を参照して説明したように、放送局から配信されるMMTフォーマットデータを、BDAVフォーマット、またはSPAVフォーマットデータとしてBD等のメディアに記録する場合、画像、音声、字幕等の再生データや、制御情報(SI)等のデータは、例えばMMTPパケット列またはTLVパケット列として記録される。
これらのパケット列は、BDAVフォーマットやSPAVフォーマットに規定されるクリップAVストリームファイルとして記録される。
[5. About audio data according to MMT format]
As described above with reference to FIGS. 9 and 10, when recording MMT format data distributed from a broadcasting station on a medium such as BD as BDAV format or SPAV format data, images, sounds, subtitles, etc. The reproduction data and data such as control information (SI) are recorded as, for example, an MMTP packet string or a TLV packet string.
These packet strings are recorded as a clip AV stream file specified in the BDAV format or the SPAV format.

また、図11を参照して説明したように、メディアに記録されたMMTフォーマットデータを格納したMMTPパケット列またはTLVパケット列からなるクリップAVストリームファイル51内の再生データを再生する場合には、このMMTフォーマットデータ格納クリップAVストリームファイル51対応のクリップ情報ファイル(nnnnn.clpi)52と、プレイリストファイル(nnnnn.rpls)53を利用して再生処理を行うことが必要となる。 Further, as described with reference to FIG. 11, when the reproduction data in the clip AV stream file 51 composed of the MMTP packet string or the TLV packet string storing the MMT format data recorded on the media is reproduced, the reproduction data is reproduced. It is necessary to perform the reproduction process using the clip information file (nnnnnn.clpi) 52 corresponding to the MMT format data storage clip AV stream file 51 and the playlist file (nnnnnn.rpls) 53.

しかし、現行のBDAVフォーマットやSPAVフォーマットにおいて規定されているクリップ情報ファイルや、プレイリストファイルは、本来、MEG-2TSフォーマットデータに対応する再生制御情報として規定されたものであり、MMTフォーマットデータに対する再生制御情報として、そのまま利用することはできない。
従って、MMTフォーマットデータをメディアに記録して、BDAVフォーマット対応アプリを利用してコンテンツ再生を行うためには、BDAVフォーマットの規定するプレイリストファイルやクリップ情報ファイルを生成してメディアに記録する処理が必要となる。
However, the clip information file and the playlist file specified in the current BDAV format and SPAV format are originally specified as playback control information corresponding to the MEG-2TS format data, and are reproduced for the MMT format data. It cannot be used as it is as control information.
Therefore, in order to record MMT format data on media and play back content using a BDAV format compatible application, a process of generating a playlist file or clip information file specified by the BDAV format and recording it on the media is required. You will need it.

先に図2を参照して説明したように、例えば放送局から配信されるMMTフォーマット音声データには、例えば、以下の2つの異なる音声符号化規格に従ったデータが含まれる。
(1)MPEG4 AAC LC(Advanced Audio Coding Low Complexity)に従った符号化音声データ、
(2)MPEG4 ALS(Audio Losless Coding)に従った符号化音声データ、
放送局から配信される音声データは、上記の2つの異なる音声符号化規格に従ったデータの少なくともいずれかである。
As described above with reference to FIG. 2, for example, the MMT format audio data distributed from a broadcasting station includes, for example, data according to the following two different audio coding standards.
(1) Coded audio data according to MPEG4 AAC LC (Advanced Audio Coding Low Complexity),
(2) Coded audio data according to MPEG4 ALS (Audio Lossless Coding),
The audio data delivered from the broadcasting station is at least one of the data according to the above two different audio coding standards.

MPEG4 AAC LCは、MPEG2 AACをベースとした改良された符号化フォーマットであり、符号化遅延低減、低ビットレート符号化、ビットレート拡張性などを実現した音声符号化フォーマットである。
一方、MPEG4 ALSは、データロスを発生させることのないロスレス圧縮方式(可逆圧縮)を適用した音声符号化フォーマットであり、高音質な音声データの再生を可能としている。
MPEG4 AAC LC is an improved coding format based on MPEG2 AAC, and is an audio coding format that realizes reduction of coding delay, low bit rate coding, bit rate expandability, and the like.
On the other hand, MPEG4 ALS is an audio coding format to which a lossless compression method (lossless compression) that does not cause data loss is applied, and enables reproduction of high-quality audio data.

なお、MMTフォーマットにおいて配信される上記の2種類の符号化音声データは、
(LATM/LOAS)ストリーム形式で配信される。
LATM(Low Overhead Audio Transport Multoplex)は多重化処理の規定(ISO/IEC14496-3)であり、
LOAS(Low Overhead Audio Stream)は、転送方式の規定(ISO/IEC14496-3)である。
The above two types of coded voice data distributed in the MMT format are
(LATM / LOAS) Delivered in stream format.
LATM (Low Overhead Audio Transport Multiplex) is a regulation of multiplexing processing (ISO / IEC14496-3).
LOAS (Low Overhead Audio Stream) is a regulation of the transfer method (ISO / IEC14496-3).

すなわち、MMTフォーマットにおいて配信される音声符号化データストリームは、
(1)MPEG4 AAC LC(LATM/LOAS)
(2)MPEG4 ALS(LATM/LOAS)
上記2つのストリームのいずれかである。
That is, the voice-coded data stream delivered in the MMT format is
(1) MPEG4 AAC LC (LATM / LOAS)
(2) MPEG4 ALS (LATM / LOAS)
It is one of the above two streams.

なお、1つの番組について、いずれか一方の音声データのみを配信する設定、すなわち、
MPEG4 AAC LC、またはMPEG4 ALSのいずれかを配信する設定と、
MPEG4 AAC LCと、MPEG4 ALS、これら2つの音声データを配信し、受信側において選択可能とした設定が可能である。
It should be noted that the setting for delivering only one of the audio data for one program, that is,
With settings to deliver either MPEG4 AAC LC or MPEG4 ALS,
MPEG4 AAC LC and MPEG4 ALS, these two audio data can be distributed and set to be selectable on the receiving side.

例えば放送局等の送信装置は、先に図3を参照して説明したようにMMTPパケットおよびTLVパケットに音声データを格納して配信する。
パケットに格納された音声データが、上記のAAC LC符号化音声データであるか、ALS符号化音声データであるかについては、例えば、音声データを格納したパケット内の属性データ記録領域や、MMTフォーマット対応の制御情報(SI)であるMMTパッケージテーブル(MPT)等に記録されている。
For example, a transmitting device such as a broadcasting station stores and distributes audio data in MMTP packets and TLV packets as described above with reference to FIG.
Whether the voice data stored in the packet is the above-mentioned AAC LC coded voice data or ALS-coded voice data is determined by, for example, the attribute data recording area in the packet storing the voice data or the MMT format. It is recorded in the MMT package table (MPT) or the like, which is the corresponding control information (SI).

放送波を受信して再生を行うテレビ等の受信装置は、これらのパケット内記録データや、MMTパッケージテーブル(MPT)を参照して、再生対象データが、AAC LC符号化音声データであるか、ALS符号化音声データであるかを判別して、判別結果に応じた復号処理を行うことができる。 A receiving device such as a television that receives and reproduces broadcast waves refers to these in-packet recorded data and the MMT package table (MPT) to determine whether the data to be reproduced is AAC LC coded audio data. It is possible to determine whether the data is ALS-encoded voice data and perform decoding processing according to the determination result.

放送局等から配信されるMMTフォーマットデータを、BDAVフォーマット、またはSPAVフォーマットデータとしてBD等のメディアに記録する場合、画像、音声、字幕等の再生データや、制御情報(SI)等のデータは、MMTPパケット列またはTLVパケット列として記録される。
これらのパケット列は、BDAVフォーマットやSPAVフォーマットに規定されるクリップAVストリームファイルとして記録される。
When recording MMT format data distributed from a broadcasting station or the like on a medium such as BD as BDAV format or SPAV format data, playback data such as images, sounds, and subtitles, and data such as control information (SI) are used. Recorded as an MMTP packet sequence or a TLV packet sequence.
These packet strings are recorded as a clip AV stream file specified in the BDAV format or the SPAV format.

メディアから記録データの再生を行う情報処理装置(再生装置)のデータ再生手順は、先に図4、図5を参照して説明したように、以下の手順に従ったものとなる。
(a)まず、再生アプリケーションによって管理情報ファイルから特定のプレイリストを指定する。
(b)選択されたプレイリストに規定されたクリップ情報ファイルを選択し、クリップ情報ファイルの記録データに従って、クリップAVストリームファイルから、画像、音声等の再生データであるAVストリームあるいはコマンドを読み出して、AVストリームの再生や、コマンドの実行処理を開始する。
The data reproduction procedure of the information processing apparatus (reproduction apparatus) for reproducing the recorded data from the media follows the following procedure as described above with reference to FIGS. 4 and 5.
(A) First, a specific playlist is specified from the management information file by the playback application.
(B) Select the clip information file specified in the selected playlist, read the AV stream or command that is the playback data such as images and sounds from the clip AV stream file according to the recorded data of the clip information file. Starts playback of the AV stream and command execution processing.

しかし、現行のBDAVフォーマットやSPAVフォーマット規定のプレイリストファイルや、クリップ情報ファイルには、上述したMMTフォーマット対応の2つの異なる音声符号化データ(MPEG4 AAC LCと、MPEG4 ALS)を識別する情報が記録されていない。 However, in the playlist file and clip information file specified in the current BDAV format and SPAV format, information for identifying two different audio-coded data (MPEG4 AAC LC and MPEG4 ALS) compatible with the above-mentioned MMT format is recorded. It has not been.

従って、再生装置は、クリップAVストリームファイルから音声データ格納パケットを取得して、取得したパケットのパケット内記録データを参照するか、あるいは、クリップAVストリームファイル中に記録された制御情報(SI)としてのMMTパッケージテーブル(MPT)を参照しなければ、パケット内の音声データが、
(1)MPEG4 AAC LC符号化音声データであるか、
(2)MPEG4 ALS符号化音声データであるか、
上記のいずれの音声データであるかを確認することができない。
Therefore, the playback device acquires the voice data storage packet from the clip AV stream file and refers to the in-packet recorded data of the acquired packet, or as control information (SI) recorded in the clip AV stream file. If you do not refer to the MMT package table (MPT) of, the voice data in the packet will be
(1) Is it MPEG4 AAC LC coded audio data?
(2) Is it MPEG4 ALS coded audio data?
It is not possible to confirm which of the above voice data is used.

これら2つの異なる音声符号化データの復号処理は、異なる処理として実行することが必要である。すなわち各音声符号化対応のコーデックを適用した復号を行うことが必要となる。
従って、メディアに記録された音声データの再生を行う場合、音声データ格納パケットのパケット内記録データ、あるいは、MMTパッケージテーブル(MPT)を参照しなければ、どのコーデックを適用すべきかを決定できなくなり、再生処理開始までの遅延が大きくなるという問題がある。
The decoding processes of these two different voice-coded data need to be executed as different processes. That is, it is necessary to perform decoding by applying a codec corresponding to each voice coding.
Therefore, when playing back the audio data recorded on the media, it becomes impossible to determine which codec code should be applied without referring to the in-packet recorded data of the audio data storage packet or the MMT package table (MPT). There is a problem that the delay until the start of the reproduction process becomes large.

また、前述したように、1つの番組コンテンツに対する音声データとして、MPEG4 AAC LCと、MPEG4 ALS、これら2つの音声データが配信されることがある。
これら2種類の音声データをメディアに記録した場合、メディアからのコンテンツ再生開始前に、ユーザ(視聴者)に再生対象とする音声を選択させるといった処理を行うことが想定される。
Further, as described above, MPEG4 AAC LC, MPEG4 ALS, and these two audio data may be distributed as audio data for one program content.
When these two types of audio data are recorded on the media, it is assumed that the user (viewer) is made to select the audio to be reproduced before the content reproduction from the media is started.

しかし、このような処理を行う場合にも、クリップAVストリームファイルから音声データ格納パケットを取得して、取得した音声データ格納パケットのパケット内記録データを参照するか、あるいは、クリップAVストリームファイル中に記録された制御情報(SI)であるMMTパッケージテーブル(MPT)を参照しなければ、2種類の音声データが記録されていることを確認することができない。
このような処理には多大な処理時間が必要となるという問題が発生する。
However, even when such processing is performed, the voice data storage packet is acquired from the clip AV stream file and the recorded data in the packet of the acquired voice data storage packet is referred to, or the clip AV stream file is included. It is not possible to confirm that two types of audio data are recorded without referring to the MMT package table (MPT) which is the recorded control information (SI).
There arises a problem that such processing requires a large amount of processing time.

[6.クリップ情報ファイルに対する音声識別情報の記録例について]
以下、上述した問題点を解決する一構成例として、クリップ情報ファイルに音声識別情報を記録した例についてに説明する。
[6. About recording example of voice identification information for clip information file]
Hereinafter, as an example of configuration for solving the above-mentioned problems, an example in which voice identification information is recorded in a clip information file will be described.

以下において説明する構成は、
BD等のメディアに記録したクリップAVストリームファイルがMMTフォーマットである場合、そのクリップAVストリームファイルの再生制御情報ファイルであるクリップ情報ファイルに、このクリップ情報ファイルを適用した再生対象音声データが、
(1)MPEG4 AAC LC符号化音声データであるか、
(2)MPEG4 ALS符号化音声データであるか、
上記のいずれの音声データであるかを識別可能とした音声識別情報を記録した構成である。
The configuration described below is
When the clip AV stream file recorded on a medium such as BD is in the MMT format, the playback target audio data to which this clip information file is applied is added to the clip information file which is the playback control information file of the clip AV stream file.
(1) Is it MPEG4 AAC LC coded audio data?
(2) Is it MPEG4 ALS coded audio data?
It is a configuration in which voice identification information that enables identification of which of the above voice data is recorded is recorded.

まず、図12を参照してクリップ情報ファイルのデータ構成(シンタクス)について説明する。
先に説明したように、クリップ情報ファイルには、そのクリップ情報ファイルを適用して再生するデータに関する情報が記録される。具体的には、例えば、クリップAVストリームファイルの再生位置情報等を有する。
First, the data structure (syntax) of the clip information file will be described with reference to FIG.
As described above, the clip information file records information about the data to be played by applying the clip information file. Specifically, it has, for example, playback position information of a clip AV stream file.

図12は、1つのクリップ情報ファイルのデータ構成(シンタクス)を示す図である。
クリップ情報ファイルには、クリップ情報に対応付けられた再生データに関する情報が記録される。図12に示すように、例えば、以下の各情報が記録される。
クリップ情報[ClipInfo()]101、
シーケンス情報[SequenceInfo()]102、
プログラム情報[ProgramInfo()]103、
FIG. 12 is a diagram showing a data structure (syntax) of one clip information file.
Information about the reproduction data associated with the clip information is recorded in the clip information file. As shown in FIG. 12, for example, the following information is recorded.
Clip information [ClipInfo ()] 101,
Sequence information [SequenceInfo ()] 102,
Program information [ProgramInfo ()] 103,

クリップ情報[ClipInfo()]101には、クリップ情報ファイルに対応するAVストリームファイルの属性情報を記録する。
シーケンス情報[SequenceInfo()]102には、このクリップ情報ファイルに対応するAVストリームファイルに格納された再生対象データの再生シーケンスに関する情報を記録する。
In the clip information [ClipInfo ()] 101, the attribute information of the AV stream file corresponding to the clip information file is recorded.
In the sequence information [SequenceInfo ()] 102, information regarding the reproduction sequence of the reproduction target data stored in the AV stream file corresponding to this clip information file is recorded.

プログラム情報[ProgramInfo()]103には、クリップ情報ファイルによって再生されるクリップAVストリームの再生区間や時間区間の定義情報等を含むプログラム(program_sequence)に関する情報を記録する。
プログラム情報[ProgramInfo()]103の記録情報の詳細について、図13以下を参照して説明する。
In the program information [ProgramInfo ()] 103, information about a program (program_sequence) including definition information of a reproduction section and a time interval of a clip AV stream reproduced by a clip information file is recorded.
The details of the recorded information of the program information [ProgramInfo ()] 103 will be described with reference to FIGS. 13 and below.

図13は、プログラム情報[ProgramInfo()]のデータ構成(シンタクス)を示す図である。
プログラム情報[ProgramInfo()]に記録される主なデータについて説明する。
FIG. 13 is a diagram showing a data structure (syntax) of the program information [ProgramInfo ()].
The main data recorded in the program information [ProgramInfo ()] will be described.

(a)プログラムシーケンス数[num_of_program_sequences]111には、クリップ情報ファイルに含まれるプログラムシーケンス(program_sequence)の数が記録される。
(b)SPNプログラムシーケンス開始アドレス[SPN_program_sequence_start[i]]112には、AVストリームファイル上でプログラムシーケンスが開始する場所の相対アドレスが記録される。
(c)プログラムマップPID[program_map_PID[i]]113には、プログラムシーケンス(program_sequence)のマップが格納されているパケットの識別子(PID)が記録される。
(A) Number of program sequences [num_of_program_sequences] 111 records the number of program sequences (program_sequence) included in the clip information file.
(B) The SPN program sequence start address [SPN_program_sequence_start [i]] 112 records the relative address of the place where the program sequence starts on the AV stream file.
(C) In the program map PID [program_map_PID [i]] 113, the identifier (PID) of the packet in which the map of the program sequence (program_sequence) is stored is recorded.

(d)ストリームPID[stream_PID]114には、このクリップ情報ファイルのプログラムシーケンスに従って再生されるストリームが格納されているパケットの識別子(PID)が記録される。
(e)ストリームコーディング情報[StreamCodingInfo]115には、再生対象ストリームのコーディング(符号化)情報が記録される。
(D) In the stream PID [stream_PID] 114, an identifier (PID) of a packet containing a stream to be reproduced according to the program sequence of this clip information file is recorded.
(E) Stream coding information [StreamCodingInfo] 115 records coding (encoding) information of a stream to be reproduced.

このように、クリップ情報ファイルには、再生対象として関連付けられたクリップAVストリームファイル格納データの再生に必要な様々な情報が記録される。 In this way, various information necessary for reproducing the clip AV stream file storage data associated as the reproduction target is recorded in the clip information file.

図14は、クリップ情報ファイルのプログラム情報[ProgramInfo()]記録領域内に設定されるストリームコーディング情報[StreamCodingInfo]のデータ構成(シンタクス)を示す図である。
ストリームコーディング情報[StreamCodingInfo]には、以下のデータが記録される。
(1)画像ストリームコーディング情報121、
(2)音声ストリームコーディング情報122、
FIG. 14 is a diagram showing a data structure (syntax) of stream coding information [Stream Coding Info] set in the program information [Program Info ()] recording area of the clip information file.
The following data is recorded in the stream coding information [StreamCodingInfo].
(1) Image stream coding information 121,
(2) Audio stream coding information 122,

なお、情報記録媒体(メディア)に記録される画像ストリームや、音声ストリームの符号化態様(コーディングタイプ(stream_coding_type))は、様々なタイプが許容されており、画像、音声とも各コーディングタイプに応じた識別子が予め規定されている。
画像は、コーディングタイプ(符号化タイプ)に応じて、例えば、タイプ識別子=0x01,0x02、0x1B等が対応付けられている。
音声は、コーディングタイプ(符号化タイプ)に応じてタイプ識別子=0x03、0x04、0x0F、0x80,0x81等が対応付けられている。
Various types of coding modes (coding type (stream_coding_type)) of the image stream and the audio stream recorded on the information recording medium (media) are allowed, and both the image and the audio correspond to each coding type. The identifier is specified in advance.
The image is associated with, for example, type identifiers = 0x01, 0x02, 0x1B, etc., depending on the coding type (encoding type).
The voice is associated with type identifiers = 0x03, 0x04, 0x0F, 0x80, 0x81 and the like according to the coding type (encoding type).

例えば、
コーディングタイプ0x01はMPEG-1画像ストリーム、
0x02はMPEG-2画像ストリーム、
0x03はMPEG-1音声ストリーム、
これらの設定である。
for example,
Coding type 0x01 is an MPEG-1 image stream,
0x02 is the MPEG-2 image stream,
0x03 is the MPEG-1 audio stream,
These settings.

なお、MMTフォーマットでは、現行のBDAVフォーマットでは規定されていない画像符号化タイプであるHEVC符号化が用いられる。
この新たな符号化タイプについても新たに符号化タイプ識別子を割り振ることになる。
In the MMT format, HEVC coding, which is an image coding type not specified in the current BDAV format, is used.
A new coding type identifier will be assigned to this new coding type as well.

同様に、音声データについても、MMTフォーマットでは、現行のBDAVフォーマットでは規定されていない音声符号化データが用いられる。
すなわち、
(1)MPEG4 AAC LC符号化音声データ、
(2)MPEG4 ALS符号化音声データ、
これらの符号化音声データが利用される。
Similarly, for voice data, the MMT format uses voice-encoded data that is not specified in the current BDAV format.
That is,
(1) MPEG4 AAC LC coded audio data,
(2) MPEG4 ALS coded audio data,
These coded voice data are used.

しかし、これら2種類の符号化音声データに対するコーディングタイプ識別子(stream_coding_type)は、MPEG2規格であるISO13818-1では同じ、すなわち、いずれも同じ識別子の設定となっている。
具体的には、ISO13818-1では、ISO/IEC14496-3に規定する多重化処理として、前述のLATM(Low Overhead Audio Transport Multoplex)を適用している符号化音声データについて、すべて、コーディングタイプ=0x11を設定している。
However, the coding type identifier (stream_coding_type) for these two types of coded voice data is the same in the MPEG2 standard ISO13818-1, that is, the same identifier is set for both.
Specifically, in ISO13818-1, the coding type = 0x11 for all the coded speech data to which the above-mentioned LATM (Low Overhead Audio Trusport Multiplex) is applied as the multiplexing process specified in ISO / IEC14496-3. Is set.

MMTフォーマットにおいて配信される音声符号化データである、
(1)MPEG4 AAC LC(LATM/LOAS)
(2)MPEG4 ALS(LATM/LOAS)
上記2つの音声符号化データは、いずれも多重化処理として、LATM(Low Overhead Audio Transport Multoplex)を適用している符号化音声データであり、同じ識別子[0x11]が設定される。
Speech-coded data delivered in MMT format,
(1) MPEG4 AAC LC (LATM / LOAS)
(2) MPEG4 ALS (LATM / LOAS)
Both of the above two voice-coded data are coded voice data to which LATM (Low Overhead Audio Transport Multiplex) is applied as the multiplexing process, and the same identifier [0x11] is set.

従って、BDAVフォーマットデータを再生する再生装置は、メディアに記録されたクリップ情報ファイルに記録されたコーディングタイプ(stream_coding_type)として、
[0x11]が設定されていた場合、この音声データが、
(1)MPEG4 AAC LC符号化音声データ、
(2)MPEG4 ALS符号化音声データ、
これら2種類のどちらかであるとの判断はできるが、
これら2種類のどちらの符号化音声データであるかについては識別することができない。
Therefore, the playback device that reproduces the BDAV format data has the coding type (stream_coding_type) recorded in the clip information file recorded on the media.
If [0x11] is set, this audio data will be
(1) MPEG4 AAC LC coded audio data,
(2) MPEG4 ALS coded audio data,
It can be judged that it is either of these two types,
It is not possible to identify which of these two types of coded voice data is used.

図14に示すように、現行のクリップ情報ファイルのプログラム情報[ProgramInfo()]記録領域内に設定される音声ストリームコーディング情報122には、以下の各情報が記録される。
(2a)音声タイプ(audio_presentation_type)131
(2b)サンプリング周波数(sampling_frequency)132
As shown in FIG. 14, the following information is recorded in the audio stream coding information 122 set in the program information [ProgramInfo ()] recording area of the current clip information file.
(2a) Voice type (audio_presentation_type) 131
(2b) Sampling frequency (sampling_frequency) 132

これらの各データの記録例について、図15を参照して説明する。
図15(a)音声タイプ記録データは、ビット値0~15に対して、モノチャネル、ステレオ、サラウンド等の様々な音声タイプ情報を識別可能なデータ設定となっている。
図15(b)サンプリング周波数は、ビット値0~15に対して、48~192kHzの各サンプリング周波数を識別可能なデータ設定となっている。
これらの音声データ形式については、MMTフォーマットに従った配信データも現行のBDAVフォーマットにおける定義データの範囲内であり、特に変更を要しない。
An example of recording each of these data will be described with reference to FIG.
FIG. 15 (a) The voice type recording data has data settings capable of identifying various voice type information such as monochannel, stereo, and surround with respect to bit values 0 to 15.
FIG. 15B is a data setting in which each sampling frequency of 48 to 192 kHz can be identified with respect to bit values 0 to 15.
Regarding these audio data formats, the distribution data according to the MMT format is also within the range of the definition data in the current BDAV format, and no particular change is required.

しかし、これらの各データのみでは、コーディングタイプ(stream_coding_type)として、[0x11]が設定されている音声データが、
(1)MPEG4 AAC LC符号化音声データ、
(2)MPEG4 ALS符号化音声データ、
これら2種類のどちらの符号化音声データであるかについては識別することができない。
However, in each of these data alone, the audio data in which [0x11] is set as the coding type (stream_coding_type) is
(1) MPEG4 AAC LC coded audio data,
(2) MPEG4 ALS coded audio data,
It is not possible to identify which of these two types of coded voice data is used.

以下、上記問題を解決する新たなクリップ情報ファイルの構成例について説明する。
以下に示す2つの実施例について、順次、説明する。
(実施例1)音声データ格納パケットから音声識別情報を取得する実施例
(実施例2)MMTパッケージテーブル(MPT)から音声識別情報を取得する実施例
Hereinafter, a configuration example of a new clip information file that solves the above problem will be described.
The following two examples will be described in sequence.
(Example 1) Example of acquiring voice identification information from a voice data storage packet (Example 2) Example of acquiring voice identification information from an MMT package table (MPT)

[6-1.(実施例1)音声データ格納パケットに記録された音声識別情報を取得してクリップ情報ファイルに記録する実施例]
まず、実施例1として、音声データ格納パケットに記録された音声識別情報を取得してクリップ情報ファイルに記録する実施例について説明する。
[6-1. (Example 1) Example of acquiring voice identification information recorded in a voice data storage packet and recording it in a clip information file]
First, as the first embodiment, an embodiment in which the voice identification information recorded in the voice data storage packet is acquired and recorded in the clip information file will be described.

すなわち、音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これら2種類の音声データのいずれであるかを示す識別情報を音声データ格納パケットから取得してクリップ情報ファイルに記録する実施例について説明する。
That is, the voice data is
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(2) MPEG4 ALS (LATM / LOAS) coded audio data,
An embodiment in which identification information indicating which of these two types of voice data is used is acquired from a voice data storage packet and recorded in a clip information file will be described.

図16は、実施例1に従ったクリップ情報ファイルのプログラム情報[ProgramInfo()]のストリームコーディング情報[StreamCodingInfo]のデータ構成(シンタクス)を示す図である。 FIG. 16 is a diagram showing a data structure (syntax) of the stream coding information [Stream Coding Info] of the program information [Program Info ()] of the clip information file according to the first embodiment.

図16に示すストリームコーディング情報[StreamCodingInfo]は、このクリップ情報ファイルの制御対象となる音声データが、
(1)MPEG4 AAC LC符号化音声データ、
(2)MPEG4 ALS符号化音声データ、
これら2種類のどちらの符号化音声データであるかについて識別可能とした構成を有する。
In the stream coding information [StreamCodingInfo] shown in FIG. 16, the audio data to be controlled by this clip information file is the audio data.
(1) MPEG4 AAC LC coded audio data,
(2) MPEG4 ALS coded audio data,
It has a configuration that makes it possible to identify which of these two types of coded voice data is.

図16に示すストリームコーディング情報[StreamCodingInfo]は、先に図14を参照して説明したと同様、以下のデータが記録される。
(1)画像ストリームコーディング情報121、
(2)音声ストリームコーディング情報122、
As the stream coding information [StreamCodingInfo] shown in FIG. 16, the following data is recorded in the same manner as described above with reference to FIG.
(1) Image stream coding information 121,
(2) Audio stream coding information 122,

図16に示すストリームコーディング情報[StreamCodingInfo]には、
コーディングタイプ(stream_coding_type)=[0x11]
上記コーディングタイプ[0x11]の音声データ属性情報記録領域130が設定されている。
The stream coding information [Stream Coding Info] shown in FIG. 16 includes
Coding type (stream_coding_type) = [0x11]
The audio data attribute information recording area 130 of the above coding type [0x11] is set.

なお、前述したように、コーディングタイプ=[0x11]は、
(1)MPEG4 AAC LC符号化音声データ、
(2)MPEG4 ALS符号化音声データ、
これら2種類の符号化音声データの双方に対応付けられるタイプ識別子であり、このタイプ識別子[0x11]のみでは、上記(1),(2)どちらの符号化音声データであるかについては識別することができない。
As described above, the coding type = [0x11] is
(1) MPEG4 AAC LC coded audio data,
(2) MPEG4 ALS coded audio data,
It is a type identifier associated with both of these two types of coded voice data, and it is possible to identify which of the above (1) and (2) is the coded voice data only by this type identifier [0x11]. I can't.

図16に示すストリームコーディング情報[StreamCodingInfo]のコーディングタイプ[0x11]の音声データ属性情報記録領域130には、以下の各情報が記録される。
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
(c)音声オブジェクトタイプ(audioObjectType)133
The following information is recorded in the audio data attribute information recording area 130 of the coding type [0x11] of the stream coding information [StreamCodingInfo] shown in FIG.
(A) Voice type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
(C) Audio Object Type 133

これらのデータ中、以下のデータ(a),(b)、すなわち、
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
これらのデータは、先に、図15を参照して説明したデータと同様のデータである。
Among these data, the following data (a) and (b), that is,
(A) Voice type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
These data are the same data as the data described above with reference to FIG.

なお、放送局等の送信装置から受信するMMTフォーマットデータの場合、これらの情報は、例えばMMTフォーマット対応の制御情報(SI)であるMMTパッケージテーブル(MPT)に記録されている。
BD等のメディアにMMTフォーマットデータを記録する記録装置は、MMTフォーマット対応の制御情報(SI)であるMMTパッケージテーブル(MPT)から、上記(a),(b)の各データを読み取り、クリップ情報ファイルに記録する。
なお、具体的なMMTパッケージテーブル(MPT)の記録データの例については後段で説明する。
In the case of MMT format data received from a transmitting device such as a broadcasting station, these information are recorded in, for example, the MMT package table (MPT) which is control information (SI) corresponding to the MMT format.
The recording device that records the MMT format data on a medium such as a BD reads each of the above data (a) and (b) from the MMT package table (MPT) that is the control information (SI) corresponding to the MMT format, and the clip information. Record in a file.
A specific example of the recorded data of the MMT package table (MPT) will be described later.

これら(a),(b)の音声属性情報、すなわち、
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
これらの音声属性情報は、図14、図15を参照して説明したように、コーディングタイプ[0x11]以外の音声データ、すなわちコーディングタイプ[0x03]~[0x84]等の音声データに対しても設定されている情報である。
The audio attribute information of these (a) and (b), that is,
(A) Voice type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
As described with reference to FIGS. 14 and 15, these voice attribute information is also set for voice data other than the coding type [0x11], that is, voice data such as coding types [0x03] to [0x84]. It is the information that has been done.

図16に示すように、コーディングタイプ[0x11]の音声データについては、さらに、
(c)音声オブジェクトタイプ(audioObjectType)133
上記の音声属性情報を記録する。
As shown in FIG. 16, for the audio data of the coding type [0x11], further
(C) Audio Object Type 133
Record the above audio attribute information.

この音声オブジェクトタイプ(audioObjectType)133が、
コーディングタイプ=[0x11]に含まれる以下の2種類のデータ、すなわち、
(1)MPEG4 AAC LC符号化音声データ、
(2)MPEG4 ALS符号化音声データ、
これら2種類の符号化音声データの識別子、すなわち音声識別情報として利用される。
This audio object type (audioObjectType) 133 is
The following two types of data included in the coding type = [0x11], that is,
(1) MPEG4 AAC LC coded audio data,
(2) MPEG4 ALS coded audio data,
These two types of coded voice data are used as identifiers, that is, voice identification information.

音声オブジェクトタイプ(audioObjectType)133の具体的な記録データ例を図17に示す。
音声オブジェクトタイプ(audioObjectType)=2の場合、
このコーディングタイプ=[0x11]の符号化音声データが、
MPEG4 AAC LC(LATM/LOAS)符号化音声データであることを意味する。
FIG. 17 shows a specific example of recorded data of the voice object type (audioObjectType) 133.
When the audio object type (audioObjectType) = 2,
The coded voice data of this coding type = [0x11] is
It means that it is MPEG4 AAC LC (LATM / LOAS) coded audio data.

一方、
音声オブジェクトタイプ(audioObjectType)=36の場合、
このコーディングタイプ=[0x11]の符号化音声データが、
MPEG4 ALS(LATM/LOAS)符号化音声データであることを意味する。
on the other hand,
When the audio object type (audioObjectType) = 36,
The coded voice data of this coding type = [0x11] is
It means that it is MPEG4 ALS (LATM / LOAS) coded audio data.

BD等のメディアに記録されたデータの再生を行う再生装置は、この音声オブジェクトタイプ(audioObjectType)の記録データを参照することで、このクリップ情報ファイルの再生制御対象となる音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれの音声データであるかを識別することが可能となる。
The playback device that reproduces the data recorded on the media such as BD refers to the recorded data of this audio object type (audioObjectType), so that the audio data that is the reproduction control target of this clip information file can be set.
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(2) MPEG4 ALS (LATM / LOAS) coded audio data,
It is possible to identify which of these voice data is used.

なお、放送局等の送信装置から受信するMMTフォーマットデータの場合、この音声オブジェクトタイプ(audioObjectType)情報は、音声データ格納パケット(MMTPパケット/TLVパケット)内に記録されている。
BD等のメディアにMMTフォーマットデータを記録する記録装置は、放送局等の送信装置から受信する音声データ格納パケットから、「音声オブジェクトタイプ(audioObjectType)」を読み取り、クリップ情報ファイルに記録する。
In the case of MMT format data received from a transmission device such as a broadcasting station, this audio object type (audioObjectType) information is recorded in an audio data storage packet (MMTP packet / TLV packet).
A recording device that records MMT format data on a medium such as a BD reads an "audio object type (audioObjectType)" from an audio data storage packet received from a transmission device such as a broadcasting station, and records it in a clip information file.

図18を参照して、放送局等の送信装置が送信するMMTフォーマットに従った音声データ格納パケットのパケット構成例について説明する。
図18には、MMTフォーマットに従った音声データ格納パケット140を示している。
図18に示すように、音声データ格納パケット140のパケット格納データ141は、符号化音声データストリームと、ストリームデータの属性情報によって構成される。
An example of a packet configuration of an audio data storage packet according to the MMT format transmitted by a transmission device such as a broadcasting station will be described with reference to FIG.
FIG. 18 shows a voice data storage packet 140 according to the MMT format.
As shown in FIG. 18, the packet storage data 141 of the voice data storage packet 140 is composed of a coded voice data stream and attribute information of the stream data.

なお、音声データ格納パケット140に格納されている符号化音声データストリームは、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれかの音声データである。
The encoded voice data stream stored in the voice data storage packet 140 is
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(2) MPEG4 ALS (LATM / LOAS) coded audio data,
It is the voice data of any of these.

音声データ格納パケット140には、さらに、パケットに格納された音声データの属性情報が記録される。
図18に示すように、音声データ属性情報の一部として、
音声オブジェクトタイプ(audioObjectType)142が記録される。
In the voice data storage packet 140, the attribute information of the voice data stored in the packet is further recorded.
As shown in FIG. 18, as a part of the audio data attribute information,
The audio object type (audioObjectType) 142 is recorded.

この音声オブジェクトタイプ(audioObjectType)142の設定値は、以下の設定である。
パケットに格納されたデータが、
MPEG4 AAC LC(LATM/LOAS)符号化音声データである場合、
音声オブジェクトタイプ(audioObjectType)=2に設定される。
一方、パケットに格納されたデータが、
MPEG4 ALS(LATM/LOAS)符号化音声データである場合、
音声オブジェクトタイプ(audioObjectType)=36に設定される。
すなわち、先に図17を参照して説明した設定値である。
The setting value of this audio object type (audioObjectType) 142 is the following setting.
The data stored in the packet is
When it is MPEG4 AAC LC (LATM / LOAS) coded audio data,
The audio object type (audioObjectType) = 2 is set.
On the other hand, the data stored in the packet is
When it is MPEG4 ALS (LATM / LOAS) coded audio data,
The audio object type (audioObjectType) = 36 is set.
That is, it is a set value described above with reference to FIG.

放送局等の送信装置から送信されるMMTフォーマットデータを受信して、BD等のメディアにMMTフォーマットデータを記録する記録装置は、放送局等の送信装置から受信する音声データ格納パケットから、「音声オブジェクトタイプ(audioObjectType)」の設定値(2、または36)を読み取り、この設定値を、図16に示すクリップ情報ファイルの、
音声オブジェクトタイプ133記録領域に記録する。
A recording device that receives MMT format data transmitted from a transmitting device such as a broadcasting station and records the MMT format data on a medium such as BD is a recording device that receives "voice" from a voice data storage packet received from a transmitting device such as a broadcasting station. The setting value (2 or 36) of "object type (audioObjectType)" is read, and this setting value is used in the clip information file shown in FIG.
Audio object type 133 Record in the recording area.

BD等のメディアに記録されたデータの再生を行う再生装置は、この音声オブジェクトタイプ(audioObjectType)の記録データが「2」か、「36」かを確認することで、このクリップ情報ファイルの再生制御対象となる音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれの音声データであるかを識別することが可能となる。
The playback device that reproduces the data recorded on the media such as BD confirms whether the recorded data of this audio object type (audioObjectType) is "2" or "36" to control the reproduction of this clip information file. The target voice data is
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(2) MPEG4 ALS (LATM / LOAS) coded audio data,
It is possible to identify which of these voice data is used.

すなわち、クリップ情報ファイルのプログラム情報[ProgramInfo()]記録領域内に設定されるストリームコーディング情報[StreamCodingInfo]におけるコーディングタイプ=[0x11]の音声属性情報記録領域から、音声オブジェクトタイプ(audioObjectType)の設定値を読み取る。 That is, the setting value of the audio object type (audioObjectType) from the audio attribute information recording area of the coding type = [0x11] in the stream coding information [StreamCodingInfo] set in the program information [ProgramInfo ()] recording area of the clip information file. To read.

音声オブジェクトタイプ(audioObjectType)=2であれば、
このコーディングタイプ=[0x11]の音声データは、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
であると判定する。
一方、音声オブジェクトタイプ(audioObjectType)=36であれば、
このコーディングタイプ=[0x11]の音声データは、
(1)MPEG4 ALS(LATM/LOAS)符号化音声データ、
であると判定する。
再生装置は、この判定情報に基づいて、各符号化音声データの復号準備、例えばコーデック設定を開始することができる。
If the audio object type (audioObjectType) = 2,
The audio data of this coding type = [0x11] is
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
Is determined to be.
On the other hand, if the audio object type (audioObjectType) = 36,
The audio data of this coding type = [0x11] is
(1) MPEG4 ALS (LATM / LOAS) coded audio data,
Is determined to be.
Based on this determination information, the reproduction device can start the preparation for decoding each coded voice data, for example, the codec setting.

なお、1つの番組等のコンテンツに対応して、
(1)MPEG4 AAC LC符号化音声データ、
(2)MPEG4 ALS符号化音声データ、
これら2種類の音声データ(音声ストリーム)が配信される場合がある。
例えば、ユーザ(視聴者)が、これら2種類の音声データから再生データを選択可能とした設定である。
In addition, corresponding to the contents such as one program,
(1) MPEG4 AAC LC coded audio data,
(2) MPEG4 ALS coded audio data,
These two types of audio data (audio stream) may be delivered.
For example, it is a setting that allows the user (viewer) to select playback data from these two types of audio data.

このように複数の音声データ(音声ストリーム)を放送局等の送信装置から受信して、BD等のメディアに記録する記録装置は、図16に示すストリームコーディング情報[StreamCodingInfo]を、各音声データ(音声ストリーム)各々について個別に生成して、1つのクリップ情報ファイル内に格納する。 In this way, the recording device that receives a plurality of audio data (audio streams) from a transmission device such as a broadcasting station and records them on a medium such as a BD can use the stream coding information [Stream Coding Info] shown in FIG. 16 for each audio data ( Audio stream) Generated individually for each and stored in one clip information file.

この場合、BD等のメディアに記録されたデータの再生を行う再生装置は、
音声オブジェクトタイプ(audioObjectType)=2、および、
音声オブジェクトタイプ(audioObjectType)=36、
これらの2種類の音声データ、すなわち、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これら2種類の音声データが、このクリップ情報ファイルを適用して選択再生可能であると判断することができる。
In this case, the playback device that reproduces the data recorded on the media such as BD is
Audio object type (audioObjectType) = 2, and
Audio object type (audioObjectType) = 36,
These two types of audio data, that is,
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(2) MPEG4 ALS (LATM / LOAS) coded audio data,
It can be determined that these two types of audio data can be selectively played back by applying this clip information file.

この場合、再生装置は、例えばユーザ(視聴者)に対して、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これら2種類の音声データが再生可能であることを示す案内情報を表示部に表示する。さらに、ユーザに再生希望音声の選択情報を入力させて、入力された選択情報、すなわち再生希望音声を再生データとして選択して再生する処理を行うことができる。
In this case, the playback device, for example, with respect to the user (viewer).
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(2) MPEG4 ALS (LATM / LOAS) coded audio data,
Guidance information indicating that these two types of voice data can be reproduced is displayed on the display unit. Further, it is possible to have the user input the selection information of the desired reproduction sound, and perform the process of selecting and reproducing the input selection information, that is, the desired reproduction sound as the reproduction data.

[6-2.(実施例2)MMTパッケージテーブル(MPT)に記録された音声識別情報を取得してクリップ情報ファイルに記録する実施例]
次に、実施例2として、MMTフォーマット対応の制御情報(SI)であるMMTパッケージテーブル(MPT)に記録された音声識別情報を取得してクリップ情報ファイルに記録する実施例について説明する。
[6-2. (Example 2) Example of acquiring the voice identification information recorded in the MMT package table (MPT) and recording it in the clip information file]
Next, as the second embodiment, an embodiment in which the voice identification information recorded in the MMT package table (MPT), which is the control information (SI) corresponding to the MMT format, is acquired and recorded in the clip information file will be described.

すなわち、音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これら2種類の音声データのいずれであるかを示す識別情報をMMTパッケージテーブル(MPT)から取得してクリップ情報ファイルに記録する実施例について説明する。
That is, the voice data is
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(2) MPEG4 ALS (LATM / LOAS) coded audio data,
An embodiment in which identification information indicating which of these two types of voice data is used is acquired from the MMT package table (MPT) and recorded in a clip information file will be described.

図19は、実施例2に従ったクリップ情報ファイルのプログラム情報[ProgramInfo()]のストリームコーディング情報[StreamCodingInfo]のデータ構成(シンタクス)を示す図である。 FIG. 19 is a diagram showing a data structure (syntax) of the stream coding information [Stream Coding Info] of the program information [Program Info ()] of the clip information file according to the second embodiment.

図19に示す新たなストリームコーディング情報[StreamCodingInfo]は、このクリップ情報ファイルの制御対象となる音声データが、
(1)MPEG4 AAC LC符号化音声データ、
(2)MPEG4 ALS符号化音声データ、
これら2種類のどちらの符号化音声データであるかについて識別可能とした構成を有する。
In the new stream coding information [StreamCodingInfo] shown in FIG. 19, the audio data to be controlled by this clip information file is
(1) MPEG4 AAC LC coded audio data,
(2) MPEG4 ALS coded audio data,
It has a configuration that makes it possible to identify which of these two types of coded voice data is.

図16に示すストリームコーディング情報[StreamCodingInfo]は、先に図14を参照して説明したと同様、以下のデータが記録される。
(1)画像ストリームコーディング情報121、
(2)音声ストリームコーディング情報122、
As the stream coding information [StreamCodingInfo] shown in FIG. 16, the following data is recorded in the same manner as described above with reference to FIG.
(1) Image stream coding information 121,
(2) Audio stream coding information 122,

図19に示すストリームコーディング情報[StreamCodingInfo]には、先に実施例1として説明した図16に示すデータ構成と同様、
コーディングタイプ(stream_coding_type)=[0x11]
上記コーディングタイプ[0x11]の音声データ属性情報記録領域130が設定されている。
The stream coding information [StreamCodingInfo] shown in FIG. 19 has the same data structure as that shown in FIG. 16 described above as the first embodiment.
Coding type (stream_coding_type) = [0x11]
The audio data attribute information recording area 130 of the above coding type [0x11] is set.

なお、前述したように、コーディングタイプ=[0x11]は、
(1)MPEG4 AAC LC符号化音声データ、
(2)MPEG4 ALS符号化音声データ、
これら2種類の符号化音声データの双方に対応付けられるタイプ識別子であり、このタイプ識別子[0x11]のみでは、上記(1),(2)どちらの符号化音声データであるかについては識別することができない。
As described above, the coding type = [0x11] is
(1) MPEG4 AAC LC coded audio data,
(2) MPEG4 ALS coded audio data,
It is a type identifier associated with both of these two types of coded voice data, and it is possible to identify which of the above (1) and (2) is the coded voice data only by this type identifier [0x11]. I can't.

図19に示すストリームコーディング情報[StreamCodingInfo]のコーディングタイプ[0x11]の音声データ属性情報記録領域130には、以下の各情報が記録される。
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
(c)ストリームコンテンツ(stream_content)135
The following information is recorded in the audio data attribute information recording area 130 of the coding type [0x11] of the stream coding information [StreamCodingInfo] shown in FIG.
(A) Voice type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
(C) Stream content (stream_content) 135

これらのデータ中、以下のデータ(a),(b)、すなわち、
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
これらのデータは、先に、図15を参照して説明したデータと同様のデータである。
Among these data, the following data (a) and (b), that is,
(A) Voice type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
These data are the same data as the data described above with reference to FIG.

なお、前述したように、放送局等の送信装置から受信するMMTフォーマットデータの場合、これらの情報は、例えばMMTフォーマット対応の制御情報(SI)であるMMTパッケージテーブル(MPT)に記録されている。
BD等のメディアにMMTフォーマットデータを記録する記録装置は、MMTフォーマット対応の制御情報(SI)であるMMTパッケージテーブル(MPT)から、上記(a),(b)の各データを読み取り、クリップ情報ファイルに記録する。
なお、具体的なMMTパッケージテーブル(MPT)の記録データの例については後段で説明する。
As described above, in the case of MMT format data received from a transmitting device such as a broadcasting station, these information are recorded in, for example, the MMT package table (MPT) which is control information (SI) corresponding to the MMT format. ..
The recording device that records the MMT format data on a medium such as a BD reads each of the above data (a) and (b) from the MMT package table (MPT) that is the control information (SI) corresponding to the MMT format, and the clip information. Record in a file.
A specific example of the recorded data of the MMT package table (MPT) will be described later.

図19に示すように、コーディングタイプ[0x11]の音声データについては、さらに、
(c)ストリームコンテンツ(stream_content)135
上記の音声属性情報を記録する。
As shown in FIG. 19, for the audio data of the coding type [0x11], further
(C) Stream content (stream_content) 135
Record the above audio attribute information.

本実施例2では、このストリームコンテンツ(stream_content)135が、
コーディングタイプ=[0x11]に含まれる以下の2種類のデータ、すなわち、
(1)MPEG4 AAC LC符号化音声データ、
(2)MPEG4 ALS符号化音声データ、
これら2種類の符号化音声データの識別子、すなわち音声識別情報として利用される。
In the second embodiment, this stream content (stream_content) 135 is
The following two types of data included in the coding type = [0x11], that is,
(1) MPEG4 AAC LC coded audio data,
(2) MPEG4 ALS coded audio data,
These two types of coded voice data are used as identifiers, that is, voice identification information.

ストリームコンテンツ(stream_content)135の具体的な記録データ例を図20に示す。
ストリームコンテンツ(stream_content)=0x3の場合、
このコーディングタイプ=[0x11]の符号化音声データが、
MPEG4 AAC LC(LATM/LOAS)符号化音声データであることを意味する。
FIG. 20 shows a specific example of recorded data of the stream content (stream_content) 135.
When stream content (stream_content) = 0x3,
The coded voice data of this coding type = [0x11] is
It means that it is MPEG4 AAC LC (LATM / LOAS) coded audio data.

一方、
ストリームコンテンツ(stream_content)=0x4の場合、
このコーディングタイプ=[0x11]の符号化音声データが、
MPEG4 ALS(LATM/LOAS)符号化音声データであることを意味する。
on the other hand,
When stream content (stream_content) = 0x4,
The coded voice data of this coding type = [0x11] is
It means that it is MPEG4 ALS (LATM / LOAS) coded audio data.

BD等のメディアに記録されたデータの再生を行う再生装置は、このストリームコンテンツ(stream_content)の記録データを参照することで、このクリップ情報ファイルの再生制御対象となる音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれの音声データであるかを識別することが可能となる。
The playback device that plays back the data recorded on the media such as BD refers to the recorded data of this stream content (stream_content), and the audio data that is the playback control target of this clip information file can be set.
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(2) MPEG4 ALS (LATM / LOAS) coded audio data,
It is possible to identify which of these voice data is used.

なお、放送局等の送信装置から受信するMMTフォーマットデータの場合、このストリームコンテンツ(stream_content)情報は、MMTフォーマット対応の制御情報(SI)であるMMTパッケージテーブル(MPT)に記録されている。
BD等のメディアにMMTフォーマットデータを記録する記録装置は、放送局等の送信装置から受信するMMTフォーマット対応の制御情報(SI)であるMMTパッケージテーブル(MPT)から、「ストリームコンテンツ(stream_content)」を読み取り、クリップ情報ファイルに記録する。
In the case of MMT format data received from a transmitting device such as a broadcasting station, this stream content (stream_content) information is recorded in the MMT package table (MPT) which is control information (SI) corresponding to the MMT format.
A recording device that records MMT format data on a medium such as a BD is a "stream content (stream_content)" from the MMT package table (MPT) that is control information (SI) corresponding to the MMT format received from a transmission device such as a broadcasting station. And record it in the clip information file.

図21は、MMTパッケージテーブル(MPT)のデータ構成(シンタクス)を示す図である。
MMTフォーマットにおいて規定されたMMTパッケージテーブル(MPT:MMT Package Table)は、例えば画像、音声、字幕等のデータ種類(アセットタイプ)毎に、データの属性情報(アセット記述子)を詳細に記録したテーブルである。
FIG. 21 is a diagram showing a data structure (syntax) of the MMT package table (MPT).
The MMT package table (MPT: MMT Package Table) specified in the MMT format is a table in which data attribute information (asset descriptor) is recorded in detail for each data type (asset type) such as images, sounds, and subtitles. Is.

MMTパッケージテーブル(MPT:MMT Package Table)280は、パケットID=0x0000のMMTPパケットに格納されており、情報処理装置は、パケットIDに基づいてMMTパッケージテーブル(MPT)の格納パケットを判別することができる。 The MMT package table (MPT: MMT Package Table) 280 is stored in an MMTP packet having a packet ID = 0x0000, and the information processing apparatus can determine the stored packet in the MMT package table (MPT) based on the packet ID. can.

MMTパッケージテーブル(MPT)には、図21に示すように、
アセットタイプ(asset_type)151、
アセット記述子(asset_descriptors_byte)152、
これらのデータ記録領域が含まれる。
The MMT package table (MPT) contains, as shown in FIG.
Asset type (asset_type) 151,
Asset descriptor (asset_descriptors_byte) 152,
These data recording areas are included.

アセットタイプ(asset_type)151は、画像、音声、字幕等のデータ種類別の識別子を記録する領域である。アセットとは、共通属性を持つデータ処理の単位であり、画像、音声、字幕等は、各々、異なるアセットとして設定される。
MMTパッケージテーブル(MPT)に記録されるアセットタイプ(asset_type)の具体例を図22に示す。
The asset type (asset_type) 151 is an area for recording identifiers for each data type such as images, sounds, and subtitles. An asset is a unit of data processing having a common attribute, and images, sounds, subtitles, etc. are set as different assets.
FIG. 22 shows a specific example of the asset type (asset_type) recorded in the MMT package table (MPT).

図22に示すように、MPTに記録されるアセットタイプ(asset_type)には、例えば以下の種類がある。
hvc1:HEVC画像
mp4a:音声
stpp:字幕等
aapp:アプリケーション
図21に示すMPTのアセットタイプ(asset_type)151記録フィールドには、例えば上記のいずれかのタイプ情報が記録される。
As shown in FIG. 22, the asset type (asset_type) recorded in the MPT includes, for example, the following types.
hvc1: HEVC image mp4a: Audio stpp: Subtitles, etc. app: Application In the MPT asset type (asset_type) 151 recording field shown in FIG. 21, for example, any of the above type information is recorded.

図21のMPTの下段に示す、
アセット記述子(asset_descriptors_byte)152、
このフィールドには、各アセットタイプ(例えば画像、音声、字幕)、これらのデータ種類に応じた様々な属性情報、例えば画像であれば解像度情報等が記録される。
Shown in the lower part of the MPT in FIG. 21
Asset descriptor (asset_descriptors_byte) 152,
In this field, each asset type (for example, image, sound, subtitle), various attribute information according to these data types, for example, resolution information in the case of an image, etc. are recorded.

図23は、図21を参照して説明したMMTパッケージテーブル(MPT)に記録される音声属性情報を示す図である。
すなわち、図23は、図21に示すMPT中のアセットタイプ(asset_type)151が音声対応のタイプ識別子(mp4a)である場合に、
アセット記述子(asset_descriptors_byte)152として記録されるデータの一例であり、図23に示すデータは、音声コンポーネント記述子(MH-Audio_Component_Descriptor)のデータ構成(シンタクス)を示す図である。
FIG. 23 is a diagram showing audio attribute information recorded in the MMT package table (MPT) described with reference to FIG. 21.
That is, FIG. 23 shows the case where the asset type (asset_type) 151 in the MPT shown in FIG. 21 is a voice-compatible type identifier (mp4a).
It is an example of the data recorded as the asset descriptor (asset_descriptors_byte) 152, and the data shown in FIG. 23 is a diagram showing the data structure (syntax) of the voice component descriptor (MH-Audio_Component_Descriptor).

図23に示すように、音声コンポーネント記述子(MH-Audio_Component_Descriptor)には、以下の音声属性情報が記録される。
(M1)ストリームコンテンツ情報
(M2)コンポーネントタイプ
(M3)サンプリング周波数
As shown in FIG. 23, the following voice attribute information is recorded in the voice component descriptor (MH-Audio_Component_Describer).
(M1) Stream content information (M2) Component type (M3) Sampling frequency

情報記録媒体(メディア)に対するデータ記録処理を実行する情報処理装置は、MMTパッケージテーブル(MPT)から、これらの音声属性情報を読み取り、情報記録媒体(メディア)に記録するクリップ情報ファイルに対する記録データとして利用する。 The information processing apparatus that executes data recording processing on the information recording medium (media) reads these audio attribute information from the MMT package table (MPT) and records it as recording data for the clip information file to be recorded on the information recording medium (media). Use.

すなわち、先に図19を参照して説明したストリームコーディング情報[StreamCodingInfo]のコーディングタイプ[0x11]の音声データ属性情報記録領域130に対する以下の記録データ、
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
(c)ストリームコンテンツ(stream_content)135
これらの記録データとする。
That is, the following recorded data for the audio data attribute information recording area 130 of the coding type [0x11] of the stream coding information [StreamCodingInfo] described above with reference to FIG.
(A) Voice type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
(C) Stream content (stream_content) 135
These recorded data will be used.

先に実施例1として説明した図16に示すストリームコーディング情報[StreamCodingInfo]のコーディングタイプ[0x11]の音声データ属性情報記録領域130に対する以下の記録データ、
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
これらの記録データも、図23に示すMMTパッケージテーブル(MPT)の音声コンポーネント記述子(MH-Audio_Component_Descriptor)の記録データである、
(M2)コンポーネントタイプ
(M3)サンプリング周波数
これらの記録データを利用して記録すねことが可能である。
The following recorded data for the audio data attribute information recording area 130 of the coding type [0x11] of the stream coding information [StreamCodingInfo] shown in FIG. 16 described above as the first embodiment.
(A) Voice type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
These recorded data are also recorded data of the audio component descriptor (MH-Audio_Component_Describer) of the MMT package table (MPT) shown in FIG. 23.
(M2) Component type (M3) Sampling frequency It is possible to record using these recorded data.

図23に示す、MMTパッケージテーブル(MPT)の以下の記録データ、すなわち、
(M1)ストリームコンテンツ情報161、
(M2)コンポーネントタイプ162、
(M3)サンプリング周波数163、
これらのデータの具体例について図24以下を参照して説明する。
The following recorded data of the MMT package table (MPT) shown in FIG. 23, that is,
(M1) Stream content information 161
(M2) Component type 162,
(M3) Sampling frequency 163,
Specific examples of these data will be described with reference to FIGS. 24 and below.

図24は、MMTパッケージテーブル(MPT)に記録される、
(M1)ストリームコンテンツ情報161
の具体例を示す図である。
MMTパッケージテーブル(MPT)には、ストリームコンテンツ情報として、
0x0~0xFのいずれかのビット値が格納される。各ビット値に応じた符号化態様情報が記録される。
FIG. 24 is recorded in the MMT Package Table (MPT).
(M1) Stream content information 161
It is a figure which shows the specific example of.
In the MMT package table (MPT), as stream content information,
Any bit value from 0x0 to 0xF is stored. Coding mode information corresponding to each bit value is recorded.

具体的には、以下の設定である。
(1)ストリームコンテンツ(stream_content)=0x2は、
このアセット対応の音声ストリームが、符号化方式を特定しない音声ストリームであることを意味する。
(2)ストリームコンテンツ(stream_content)=0x3は、
このアセット対応の音声ストリームが、MPEG4 AAC(MPEG4 AAC LC(LATM/LOAS))の音声ストリームであることを意味する。
(3)ストリームコンテンツ(stream_content)=0x4は、
このアセット対応の音声ストリームが、MPEG4 ALC(MPEG4 ALS(LATM/LOAS))の音声ストリームであることを意味する。
Specifically, the settings are as follows.
(1) Stream content (stream_content) = 0x2 is
This means that the audio stream corresponding to the asset is an audio stream that does not specify the encoding method.
(2) Stream content (stream_content) = 0x3 is
It means that the audio stream corresponding to this asset is an audio stream of MPEG4 AAC (MPEG4 AAC LC (LATM / LOAS)).
(3) Stream content (stream_content) = 0x4 is
It means that the audio stream corresponding to this asset is an audio stream of MPEG4 ALC (MPEG4 ALS (LATM / LOAS)).

例えば、BD等のメディアにMMTフォーマットデータを記録する記録装置は、放送局等の送信装置から受信するMMTフォーマット対応の制御情報(SI)であるMMTパッケージテーブル(MPT)から、この「ストリームコンテンツ(stream_content)」を読み取り、クリップ情報ファイルに記録する。
なお、MMTフォーマットにおけるアセットは、MPEGフォーマットにおけるストリームに対応する。
For example, a recording device that records MMT format data on a medium such as a BD can use this "stream content (MPT) from the MMT package table (MPT) that is control information (SI) corresponding to the MMT format received from a transmission device such as a broadcasting station. Read "stream_content)" and record it in the clip information file.
The asset in the MMT format corresponds to the stream in the MPEG format.

例えば、MMTフォーマットのある1つのアセットについて、MMTパッケージテーブル(MPT)に記録されたストリームコンテンツ(stream_content)の値が、0x3である場合、
このアセット対応の音声ストリームの属性情報の記録領域である図19に示すストリームコーディング情報[StreamCodingInfo]のコーディングタイプ[0x11]の音声データ属性情報記録領域130の
(c)ストリームコンテンツ(stream_content)135
この記録領域に0x3を記録する。
For example, if the value of the stream content (stream_content) recorded in the MMT package table (MPT) is 0x3 for one asset in the MMT format.
(C) Stream content (stream_content) 135 of the audio data attribute information recording area 130 of the coding type [0x11] of the stream coding information [StreamCodingInfo] shown in FIG. 19, which is the recording area of the attribute information of the audio stream corresponding to this asset.
0x3 is recorded in this recording area.

一方、MMTフォーマットのある1つのアセットについて、MMTパッケージテーブル(MPT)に記録されたストリームコンテンツ(stream_content)の値が、0x4である場合、
このアセット対応の音声ストリームの属性情報の記録領域である図19に示すストリームコーディング情報[StreamCodingInfo]のコーディングタイプ[0x11]の音声データ属性情報記録領域130の
(c)ストリームコンテンツ(stream_content)135
この記録領域に0x4を記録する。
On the other hand, when the value of the stream content (stream_content) recorded in the MMT package table (MPT) is 0x4 for one asset having the MMT format,
(C) Stream content (stream_content) 135 of the audio data attribute information recording area 130 of the coding type [0x11] of the stream coding information [StreamCodingInfo] shown in FIG. 19, which is the recording area of the attribute information of the audio stream corresponding to this asset.
0x4 is recorded in this recording area.

このように、BD等のメディアにMMTフォーマットデータを記録する記録装置は、アセット(ストリーム)単位のストリームコンテンツ(stream_content)情報をクリップ情報ファイルに格納してメディアに記録する。 In this way, the recording device that records the MMT format data on a medium such as a BD stores the stream content (stream_content) information for each asset (stream) in the clip information file and records it on the media.

BD等のメディアに記録されたデータの再生を行う再生装置は、このストリームコンテンツ(stream_content)の記録データを参照することで、このクリップ情報ファイルの再生制御対象となる音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれの音声データであるかを識別することが可能となる。
The playback device that plays back the data recorded on the media such as BD refers to the recorded data of this stream content (stream_content), and the audio data that is the playback control target of this clip information file can be set.
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(2) MPEG4 ALS (LATM / LOAS) coded audio data,
It is possible to identify which of these voice data is used.

すなわち、再生装置は、クリップ情報ファイルのプログラム情報[ProgramInfo()]記録領域内に設定されるストリームコーディング情報[StreamCodingInfo]におけるコーディングタイプ=[0x11]の音声属性情報記録領域から、ストリームコンテンツ(stream_content)の設定値を読み取る。 That is, the playback device has stream content (stream_content) from the audio attribute information recording area of the coding type = [0x11] in the stream coding information [StreamCodingInfo] set in the program information [ProgramInfo ()] recording area of the clip information file. Read the setting value of.

ストリームコンテンツ(stream_content)=0x3であれば、
このコーディングタイプ=[0x11]の音声データは、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
であると判定する。
一方、ストリームコンテンツ(stream_content)=0x4であれば、
このコーディングタイプ=[0x11]の音声データは、
(1)MPEG4 ALS(LATM/LOAS)符号化音声データ、
であると判定する。
再生装置は、この判定情報に基づいて、各符号化音声データの復号準備、例えばコーデック設定を迅速に開始することができる。
If stream content (stream_content) = 0x3,
The audio data of this coding type = [0x11] is
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
Is determined to be.
On the other hand, if the stream content (stream_content) = 0x4,
The audio data of this coding type = [0x11] is
(1) MPEG4 ALS (LATM / LOAS) coded audio data,
Is determined to be.
Based on this determination information, the reproduction device can quickly start the preparation for decoding each coded voice data, for example, the codec setting.

なお、1つの番組等のコンテンツに対応して、
(1)MPEG4 AAC LC符号化音声データ、
(2)MPEG4 ALS符号化音声データ、
これら2種類の音声データ(音声ストリーム)が配信される場合がある。
例えば、ユーザ(視聴者)が、これら2種類の音声データから再生データを選択可能とした設定である。
In addition, corresponding to the contents such as one program,
(1) MPEG4 AAC LC coded audio data,
(2) MPEG4 ALS coded audio data,
These two types of audio data (audio stream) may be delivered.
For example, it is a setting that allows the user (viewer) to select playback data from these two types of audio data.

このように複数の音声データ(音声ストリーム)を放送局等の送信装置から受信して、BD等のメディアに記録する記録装置は、図19に示すストリームコーディング情報[StreamCodingInfo]を各音声データ(音声ストリーム)各々に対して個別に生成して、1つのクリップ情報ファイル内に格納する。 In this way, the recording device that receives a plurality of audio data (audio streams) from a transmission device such as a broadcasting station and records them on a medium such as a BD can use the stream coding information [Stream Coding Info] shown in FIG. 19 for each audio data (audio). Stream) Generated individually for each and stored in one clip information file.

この場合、BD等のメディアに記録されたデータの再生を行う再生装置は、
ストリームコンテンツ(stream_content)=0x3、および、
ストリームコンテンツ(stream_content)=0x4、
これらの2種類の音声データ、すなわち、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これら2種類の音声データが、このクリップ情報ファイルを適用して選択再生可能であると判断することができる。
In this case, the playback device that reproduces the data recorded on the media such as BD is
Stream content (stream_content) = 0x3, and
Stream content (stream_content) = 0x4,
These two types of audio data, that is,
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(2) MPEG4 ALS (LATM / LOAS) coded audio data,
It can be determined that these two types of audio data can be selectively played back by applying this clip information file.

この場合、再生装置は、例えばユーザ(視聴者)に対して、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これら2種類の音声データが再生可能であることを示す案内情報を表示部に表示する。さらに、ユーザに再生希望音声の選択情報を入力させて、入力された選択情報、すなわち再生希望音声を再生データとして選択して再生する処理を行うことができる。
In this case, the playback device, for example, with respect to the user (viewer).
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(2) MPEG4 ALS (LATM / LOAS) coded audio data,
Guidance information indicating that these two types of voice data can be reproduced is displayed on the display unit. Further, it is possible to have the user input the selection information of the desired reproduction sound, and perform the process of selecting and reproducing the input selection information, that is, the desired reproduction sound as the reproduction data.

次に、図25、図26を参照して、MMTパッケージテーブル(MPT)に記録される、図23に示す以下の2つの情報の具体例について説明する。
(M2)コンポーネントタイプ162、
(M3)サンプリング周波数163、
Next, with reference to FIGS. 25 and 26, specific examples of the following two pieces of information shown in FIG. 23 recorded in the MMT package table (MPT) will be described.
(M2) Component type 162,
(M3) Sampling frequency 163,

図25は、MMTパッケージテーブル(MPT)に記録される、
(M12)コンポーネントタイプ162
の具体例を示す図である。
MMTパッケージテーブル(MPT)には、コンポーネントタイプ情報162として、
00000~11111のいずれかのビット値が格納され、各ビット値に応じてモノラル、ステレオ等、様々な音声の出力タイプ(コンポーネントタイプ)が対応付けられている。
FIG. 25 is recorded in the MMT Package Table (MPT).
(M12) Component type 162
It is a figure which shows the specific example of.
In the MMT package table (MPT), as component type information 162,
Any bit value from 000000 to 11111 is stored, and various audio output types (component types) such as monaural and stereo are associated with each bit value.

図26は、MMTパッケージテーブル(MPT)に記録される、
(M3)サンプリング周波数163
の具体例を示す図である。
MMTパッケージテーブル(MPT)には、サンプリング周波数情報163として、
000~111のいずれかのビット値が格納され、各ビット値に応じて、16~48kHzのサンプリング周波数が対応付けられている。
FIG. 26 is recorded in the MMT Package Table (MPT).
(M3) Sampling frequency 163
It is a figure which shows the specific example of.
In the MMT package table (MPT), as sampling frequency information 163,
Any bit value of 000 to 111 is stored, and a sampling frequency of 16 to 48 kHz is associated with each bit value.

このように、MMTフォーマットデータ中の制御情報(シグナリング情報(MMT-SI))に含まれるMMTパッケージテーブル(MPT)には、
(M1)ストリームコンテンツ情報
(M2)コンポーネントタイプ
(M3)サンプリング周波数
これらの具体的な情報が記録されている。
As described above, the MMT package table (MPT) included in the control information (signaling information (MMT-SI)) in the MMT format data is included in the MMT package table (MPT).
(M1) Stream content information (M2) Component type (M3) Sampling frequency These specific information is recorded.

情報記録媒体(メディア)に対するデータ記録処理を実行する情報処理装置は、MMTパッケージテーブル(MPT)から、これらの音声属性情報を読み取り、情報記録媒体(メディア)に記録するクリップ情報ファイルに対する記録データとして利用する。 The information processing apparatus that executes data recording processing on the information recording medium (media) reads these audio attribute information from the MMT package table (MPT) and records it as recording data for the clip information file to be recorded on the information recording medium (media). Use.

具体的には、図19に示すストリームコーディング情報[StreamCodingInfo]のコーディングタイプ[0x11]の音声データ属性情報記録領域130の以下の各情報を記録する。
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
(c)ストリームコンテンツ(stream_content)135
Specifically, the following information of the audio data attribute information recording area 130 of the coding type [0x11] of the stream coding information [StreamCodingInfo] shown in FIG. 19 is recorded.
(A) Voice type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
(C) Stream content (stream_content) 135

なお、先に図16を参照して説明した(実施例1)のストリームコーディング情報[StreamCodingInfo]のコーディングタイプ[0x11]の音声データ属性情報記録領域130の以下の各情報、
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
これらの情報も、MMTパッケージテーブル(MPT)の記録データを情報記録媒体(メディア)に記録するクリップ情報ファイルに対する記録データとして利用される。
The following information of the audio data attribute information recording area 130 of the coding type [0x11] of the stream coding information [Stream Coding Info] described above with reference to FIG. 16 (Example 1).
(A) Voice type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
This information is also used as recording data for the clip information file that records the recording data of the MMT package table (MPT) on the information recording medium (media).

上記、実施例1、実施例2において説明したように、MMTフォーマットデータを入力し、入力データをBDAVフォーマットデータとして情報記録媒体(メディア)に記録する情報処理装置は、音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらいずれの音声データであるかを示す音声識別情報を、ストリーム単位(アセット単位)の情報として、音声データ格納パケット、またはMMTパッケージテーブル(MPT)から取得してクリップ情報ファイルに記録する。
As described above in Examples 1 and 2, the information processing apparatus that inputs MMT format data and records the input data as BDAV format data on an information recording medium (media) has audio data.
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(2) MPEG4 ALS (LATM / LOAS) coded audio data,
The voice identification information indicating which of these voice data is used is acquired from the voice data storage packet or the MMT package table (MPT) as stream unit (asset unit) information and recorded in the clip information file.

なお、上記の音声識別情報とは、
実施例1において説明した音声データ格納パケットに記録された音声オブジェクトタイプ(audioObjectType)、または、
実施例2において説明したMMTパッケージテーブル(MPT)に記録されたストリームコンテンツ(stream_content)、
これらのいずれかの情報である。
The above voice identification information is
The voice object type (audioObjectType) recorded in the voice data storage packet described in the first embodiment, or.
The stream content (stream_content) recorded in the MMT package table (MPT) described in the second embodiment.
Information on any of these.

なお、上記実施例では、実施例1において説明した音声データ格納パケットに記録された音声オブジェクトタイプ(audioObjectType)の設定値(2、または36)や、MMTパッケージテーブル(MPT)に記録されたストリームコンテンツ(stream_content)の設定値(0x3、または0x4)をそのままクリップ情報ファイルに記録する実施例として説明したが、これらの値は、2つの音声データが区別可能な異なる値であればよく、様々な設定が可能である。 In the above embodiment, the setting value (2 or 36) of the audio object type (audioObjectType) recorded in the audio data storage packet described in the first embodiment and the stream content recorded in the MMT package table (MPT). Although the setting value (0x3 or 0x4) of (stream_content) is recorded as it is in the clip information file as an example, these values may be different values that can distinguish the two audio data, and various settings are used. Is possible.

また、上述した実施例1,2においては、図16に示すクリップ情報ファイルの記録データとして、MMTフォーマットの定義データ「音声オブジェクトタイプ(audioObjectType)」をそのまま記録する設定とし、同様に図19に示すクリップ情報ファイルの記録データとして、MMTフォーマットの定義データ「ストリームコンテンツ(stream_content)」をそのまま記録する設定としている。
これらのデータについても、上記表現と異なる表現、例えば、「AAC_AC_ALS_coding_type」といった新たな定義のフィールドを設定して、このフィールドに2つの音声データ(AAC LCと、ALS)を区別可能とした値を設定する構成としてもよい。
Further, in Examples 1 and 2 described above, the definition data “audio object type (audioOjectType)” in the MMT format is set to be recorded as it is as the recording data of the clip information file shown in FIG. 16, and is also shown in FIG. As the recording data of the clip information file, the definition data "stream content (stream_content)" in the MMT format is set to be recorded as it is.
Also for these data, an expression different from the above expression, for example, a field with a new definition such as "AAC_AC_ALS_coding_type" is set, and a value that makes it possible to distinguish between the two voice data (AAC LC and ALS) is set in this field. It may be configured to be used.

[7.情報記録媒体に対するデータ記録処理を実行する情報処理装置の構成と処理について]
次に、図27以下を参照して情報記録媒体に対するデータ記録処理を実行する情報処理装置の構成と処理について説明する。
[7. Configuration and processing of information processing equipment that executes data recording processing for information recording media]
Next, the configuration and processing of the information processing apparatus that executes the data recording processing for the information recording medium will be described with reference to FIGS. 27 and 27.

先に説明したように、本開示の情報処理装置は、MMTフォーマットに従った入力データを、BDAVフォーマットデータ、またはSPAVフォーマットデータとして、BDやフラッシュメモリ等の情報記録媒体に記録する。
情報処理装置300は、情報記録媒体(記録メディア)320に、クリップAVストリームファイル、さらに、プレイリストやクリップ情報ファイル等のデータベースファイルを記録する。
プレイリストやクリップ情報ファイル等のデータベースファイルには、メディア記録コンテンツ対応の画像属性情報、音声属性情報、再生制御情報等を記録する。
As described above, the information processing apparatus of the present disclosure records input data according to the MMT format as BDAV format data or SPAV format data on an information recording medium such as a BD or a flash memory.
The information processing apparatus 300 records a clip AV stream file and a database file such as a playlist or a clip information file on the information recording medium (recording medium) 320.
Image attribute information, audio attribute information, playback control information, etc. corresponding to media recording contents are recorded in a database file such as a playlist or a clip information file.

プレイリストやクリップ情報ファイル等のデータベースファイルに記録する情報は、MMTフォーマットに従った入力データに含まれる画像や音声等の再生ストリームデータ格納パケットの他、MMTフォーマットにおいて規定される制御情報(SI)であるTLV-SIや、MMT-SIを構成する様々な情報記録テーブル等から取得する。 The information recorded in the database file such as the playlist or clip information file includes the playback stream data storage packet such as images and sounds included in the input data according to the MMT format, as well as the control information (SI) specified in the MMT format. It is acquired from TLV-SI, various information recording tables constituting MMT-SI, and the like.

具体的には、例えば、MMT-SIに含まれるMMTパッケージテーブル(MPT)から様々な情報を取得して、BDAVフォーマットにおいて規定されるプレイリストやクリップ情報ファイル等のデータベースファイルに、メディア記録コンテンツ対応の情報を記録する。 Specifically, for example, various information is acquired from the MMT package table (MPT) included in the MMT-SI, and media recording contents are supported in database files such as playlists and clip information files specified in the BDAV format. Record the information of.

以下、このようなプレイリストやクリップ情報ファイルを記録した情報記録媒体の生成処理、具体的には、BD等の情報記録媒体に対するデータ記録処理を実行する情報処理装置の構成と、処理シーケンスについて説明する。 Hereinafter, the configuration and processing sequence of the information processing apparatus that executes the generation processing of the information recording medium in which such playlists and clip information files are recorded, specifically, the data recording processing for the information recording medium such as BD, will be described. do.

図27は、BD等の情報記録媒体に対するデータ記録処理を実行する情報処理装置300の構成を示す図である。
情報処理装置300は、情報記録媒体(記録メディア)320に、BDAVフォーマットデータ、またはSPAVフォーマットデータの記録データを記録する。すなわち、画像、音声データからなるクリップAVストリームファイルや、再生制御情報ファイルであるプレイリストファイルやクリップ情報ファイル等のデータベースファイルを記録する。
FIG. 27 is a diagram showing a configuration of an information processing apparatus 300 that executes data recording processing on an information recording medium such as a BD.
The information processing apparatus 300 records the recorded data of the BDAV format data or the SPAV format data on the information recording medium (recording medium) 320. That is, a database file such as a clip AV stream file composed of image and audio data, a playlist file and a clip information file which are playback control information files is recorded.

データ入力部301は、情報記録媒体320に対するMMTフォーマットデータ331、すなわち画像データ、音声データ、字幕データ等を含むMMTフォーマットデータ331を入力する。
データ入力部301は、MMTフォーマットデータ331を送信する例えば放送局やコンテンツサーバ等からの送信データを受信する受信部、あるいは、MMTフォーマットデータ331を記録したメディアからのデータ読み取りを実行するメディア読み取り部等によって構成される。
The data input unit 301 inputs MMT format data 331 for the information recording medium 320, that is, MMT format data 331 including image data, audio data, subtitle data, and the like.
The data input unit 301 is a receiving unit that transmits MMT format data 331, for example, a receiving unit that receives transmission data from a broadcasting station, a content server, or the like, or a media reading unit that reads data from a medium that records MMT format data 331. Etc.

データ入力部301から入力するMMTフォーマットデータ331は、先に図2を参照して説明したデータフォーマットに従ったデータであり、例えばHEVC画像等の高精細画像データや、MPEG4 AAC LC(LATM/LOAS)音声符号化データ、MPEG4 ALS(LATM/LOAS)音声符号化データ等が含まれている。 The MMT format data 331 input from the data input unit 301 is data according to the data format described above with reference to FIG. 2, for example, high-definition image data such as a HEVC image or MPEG4 AAC LC (LATM / LOAS). ) Audio-encoded data, MPEG4 ALS (LATM / LOAS) audio-encoded data and the like are included.

MMTフォーマットデータ331は、制御部303の制御によって、記憶部304に格納される。
ユーザ入力部302は、例えば情報記録媒体320に対するデータ記録の開始要求等を入力する。
The MMT format data 331 is stored in the storage unit 304 under the control of the control unit 303.
The user input unit 302 inputs, for example, a request for starting data recording to the information recording medium 320.

ユーザ入力部302から、データ記録開始要求を入力すると、この入力をトリガとして、記憶部304に格納されたMMTフォーマットデータ331が、デマルチプレクサ(DeMUX)305に入力される。
デマルチプレクサ(DeMUX)305は、MMTフォーマットデータ331から、画像、音声、字幕等の各データを格納したパケットや、通知情報や制御情報等を格納したシグナリング情報(TLV-SI,MMT-SI)等の補助情報を取得し、データ種別のパケットに分類し、各パケットを、データ種類に応じて、記録データ生成部306の字幕データ生成部311、画像データ生成部312、音声データ生成部313、補助情報生成部314に入力する。
When a data recording start request is input from the user input unit 302, the MMT format data 331 stored in the storage unit 304 is input to the demultiplexer (DeMUX) 305 using this input as a trigger.
The demultiplexer (DeMUX) 305 uses MMT format data 331 as a packet containing data such as images, sounds, and subtitles, signaling information (TLV-SI, MMT-SI) containing notification information, control information, and the like. Auxiliary information is acquired, classified into packets of data type, and each packet is classified into subtitle data generation unit 311 of recorded data generation unit 306, image data generation unit 312, audio data generation unit 313, and auxiliary data according to the data type. It is input to the information generation unit 314.

字幕データ生成部311は、データ入力部301が入力し、記憶部304に格納されたMMTフォーマットデータ331から、字幕データを取得し、BDAVフォーマットにおいて規定されるストリームファイル格納用データを生成する。
画像データ生成部312は、データ入力部301が入力し、記憶部304に格納されたMMTフォーマットデータ331から、画像データを取得し、BDAVフォーマットにおいて規定されるストリームファイル格納用データを生成する。
音声データ生成部313は、データ入力部301が入力し、記憶部304に格納されたMMTフォーマットデータ331から、音声データを取得し、BDAVフォーマットにおいて規定されるストリームファイル格納用データを生成する。
The subtitle data generation unit 311 acquires subtitle data from the MMT format data 331 input by the data input unit 301 and stored in the storage unit 304, and generates stream file storage data specified in the BDAV format.
The image data generation unit 312 acquires image data from the MMT format data 331 input by the data input unit 301 and stored in the storage unit 304, and generates stream file storage data specified in the BDAV format.
The audio data generation unit 313 acquires audio data from the MMT format data 331 input by the data input unit 301 and stored in the storage unit 304, and generates stream file storage data specified in the BDAV format.

補助情報生成部314は、データ入力部301が入力し、記憶部304に格納されたMMTフォーマットデータ331から、再生データ対応の属性情報や再生制御情報を取得してBDAVフォーマットにおいて規定されるデータベースファイルとしてのプレイリストファイルやクリップ情報ファイルに格納すべきデータを生成する。 The auxiliary information generation unit 314 is a database file specified in the BDAV format by acquiring attribute information and reproduction control information corresponding to reproduction data from the MMT format data 331 input by the data input unit 301 and stored in the storage unit 304. Generates data to be stored in the playlist file or clip information file as.

具体的には、例えば、MMTフォーマットに従った画像や音声等の再生ストリームデータ格納パケットや、MMTパッケージテーブル(MPT)等から、プレイリストファイルやクリップ情報ファイルに格納すべきデータを取得して、プレイリストファイルやクリップ情報ファイルを生成する。 Specifically, for example, data to be stored in a playlist file or a clip information file is acquired from a playback stream data storage packet such as an image or sound according to the MMT format, an MMT package table (MPT), or the like. Generate a playlist file or clip information file.

マルチプレクサ(MUX)315は、字幕データ生成部311、画像データ生成部312、音声データ生成部313が変換した字幕、画像、音声各データを入力し、これらのデータを格納したストリームファイルを生成する。 The multiplexer (MUX) 315 inputs the subtitles, images, and audio data converted by the subtitle data generation unit 311, the image data generation unit 312, and the audio data generation unit 313, and generates a stream file in which these data are stored.

なお、前述したように、MMTフォーマットデータをメディアに記録する場合のクリップAVストリームファイルは、
(1)MMTフォーマットをMPEG-2TSフォーマットに変換してクリップAVストリームファイルを生成する、あるいは、
(2)MMTフォーマットに従ったデータを格納したパケットのパケット列(MMTPパケット列、またはTLVパケットシ列)からなるクリップAVストリームファイルを生成する、
これらの2種類の処理が想定される。
記録データ生成部306は、上記(1),(2)のいずれかの処理態様に従ってクリップAVストリームファイルを生成する。
As described above, the clip AV stream file for recording MMT format data on the media is
(1) Convert the MMT format to the MPEG-2 TS format to generate a clip AV stream file, or
(2) Generate a clip AV stream file consisting of a packet sequence (MMTP packet sequence or TLV packet sequence) of a packet storing data according to the MMT format.
These two types of processing are assumed.
The recording data generation unit 306 generates a clip AV stream file according to any of the processing modes (1) and (2) above.

データベースファイル生成部316は、補助情報生成部314がMMTフォーマットデータ331のシグナリング情報(TLV-SI,MMT-SI)から取得した様々な情報を記録したプレイリストファイルやクリップ情報ファイル等のデータベースファイルを生成する。 The database file generation unit 316 stores database files such as a playlist file and a clip information file that record various information acquired from the signaling information (TLV-SI, MMT-SI) of the MMT format data 331 by the auxiliary information generation unit 314. Generate.

なお、先に説明したように、クリップ情報ファイルには、音声データ対応の属性情報として、
(1)MPEG4 AAC LC(LATM/LOAS)
(2)MPEG4 ALS(LATM/LOAS)
上記2つの音声符号化データを識別可能とした音声識別情報を記録する。
具体的には、図16、または図19に示す記録データを持つクリップ情報ファイルを生成する。
As explained earlier, the clip information file contains the attribute information corresponding to audio data.
(1) MPEG4 AAC LC (LATM / LOAS)
(2) MPEG4 ALS (LATM / LOAS)
The voice identification information that makes the above two voice-coded data distinguishable is recorded.
Specifically, a clip information file having the recorded data shown in FIG. 16 or FIG. 19 is generated.

記録データ生成部306の生成したストリームファイルデータと、プレイリストファイル、クリップ情報ファイル等のデータベースファイルを含む記録データ332は、制御部303の制御の下、記録部306によって、ドライブ307を介して情報記録媒体320に出力され、記録される。 The stream file data generated by the recording data generation unit 306 and the recording data 332 including the database files such as the playlist file and the clip information file are informationed by the recording unit 306 via the drive 307 under the control of the control unit 303. It is output to the recording medium 320 and recorded.

次に、図27に示す情報処理装置300が実行する情報記録媒体320に対するデータ記録処理のシーケンスについて、図28に示すフローチャートを参照して説明する。 Next, a sequence of data recording processing for the information recording medium 320 executed by the information processing apparatus 300 shown in FIG. 27 will be described with reference to the flowchart shown in FIG. 28.

図28に示すフローに従った処理は、例えば情報処理装置の記憶部に格納されたプログラムに従って、プログラム実行機能を有するCPUを備えたデータ処理部(制御部)の制御の下で実行することができる。
以下、図28のフローに示す各ステップの処理について、順次、説明する。
The processing according to the flow shown in FIG. 28 may be executed under the control of a data processing unit (control unit) having a CPU having a program execution function, for example, according to a program stored in the storage unit of the information processing apparatus. can.
Hereinafter, the processing of each step shown in the flow of FIG. 28 will be sequentially described.

(ステップS101)
まず、情報処理装置300は、ステップS101において、データ入力部301を介して記録用データであるMMTフォーマットデータを入力する。
なお、この記録用データには画像データ、音声データ、字幕データ、さらに、通知情報や制御情報等を格納したシグナリング情報(TLV-SI,MMT-SI)等が含まれる。
(Step S101)
First, in step S101, the information processing apparatus 300 inputs MMT format data, which is recording data, via the data input unit 301.
The recording data includes image data, audio data, subtitle data, signaling information (TLV-SI, MMT-SI) storing notification information, control information, and the like.

(ステップS102)
次に、ステップS102において、情報処理装置300は、入力したMMTフォーマットデータから、画像、音声等の再生対象データを取得し、BDAVフォーマットに従ったAVストリームファイルを生成する。
(Step S102)
Next, in step S102, the information processing apparatus 300 acquires reproduction target data such as images and sounds from the input MMT format data, and generates an AV stream file according to the BDAV format.

(ステップS103)
次に、ステップS103において、情報処理装置300は、入力したMMTフォーマットデータの構成データを利用して、クリップ情報ファイルを生成する。
具体的には、先の実施例1,2において説明したように、MMTフォーマットに従った画像や音声等の再生ストリームデータ格納パケットや、MMTパッケージテーブル(MPT)等からデータを取得して、クリップ情報ファイルを生成する。
なお、このステップS103のクリップ情報ファイル生成処理の詳細については、図29、図30を参照して、後段で説明する。
(Step S103)
Next, in step S103, the information processing apparatus 300 generates a clip information file by using the configuration data of the input MMT format data.
Specifically, as described in Examples 1 and 2 above, data is acquired from a reproduction stream data storage packet such as an image or audio according to the MMT format, an MMT package table (MPT), or the like, and a clip is obtained. Generate an information file.
The details of the clip information file generation process in step S103 will be described later with reference to FIGS. 29 and 30.

(ステップS104)
次に、ステップS104において、情報処理装置300は、入力したMMTフォーマットデータの構成データを利用して、プレイリストファイルを生成する。
(Step S104)
Next, in step S104, the information processing apparatus 300 generates a playlist file by using the configuration data of the input MMT format data.

(ステップS105)
次に、ステップS105において、情報処理装置300は、入力したMMTフォーマットデータを利用してその他のデータベースファイルを生成する。
(Step S105)
Next, in step S105, the information processing apparatus 300 uses the input MMT format data to generate other database files.

(ステップS106)
次に、ステップS106において、情報処理装置300は、生成したAVストリームファイルとデータベースファイルを利用してBDAVフォーマットデータを生成する。
(Step S106)
Next, in step S106, the information processing apparatus 300 generates BDAV format data using the generated AV stream file and database file.

(ステップS107)
次に、ステップS107において、情報処理装置300は、ステップS106で生成したBDAVフォーマットデータを情報記録媒体(メディア)に記録する。
(Step S107)
Next, in step S107, the information processing apparatus 300 records the BDAV format data generated in step S106 on the information recording medium (media).

次に、ステップS103において実行するクリップ情報ファイル生成処理の詳細シーケンスについて、図29、図30に示すフローチャートを参照して説明する。 Next, the detailed sequence of the clip information file generation process executed in step S103 will be described with reference to the flowcharts shown in FIGS. 29 and 30.

図29は、先に説明した(実施例1)、すなわち、音声データ格納パケットから音声識別情報を取得する実施例に従ったクリップ情報ファイル生成処理の詳細シーケンスである。
図30は、先に説明した(実施例2)、すなわち、MMTパッケージテーブル(MPT)から音声識別情報を取得する実施例に従ったクリップ情報ファイル生成処理の詳細シーケンスである。
FIG. 29 is a detailed sequence of the clip information file generation process according to the above-described (Example 1), that is, the embodiment of acquiring the voice identification information from the voice data storage packet.
FIG. 30 is a detailed sequence of clip information file generation processing according to the above-described (Example 2), that is, an embodiment of acquiring voice recognition information from the MMT package table (MPT).

まず、図29を参照して、先に説明した(実施例1)、すなわち、音声データ格納パケットから音声識別情報を取得する実施例に従ったクリップ情報ファイル生成処理の詳細シーケンスについて説明する。
図29に示すフローの各ステップの処理について、順次、説明する。
First, with reference to FIG. 29, a detailed sequence of clip information file generation processing according to the above-described (Example 1), that is, an embodiment of acquiring voice identification information from a voice data storage packet will be described.
The processing of each step of the flow shown in FIG. 29 will be sequentially described.

(ステップS121)
まず、ステップS121において、情報処理装置300は、クリップAVストリームファイルに記録する音声データ格納パケットを取得する。
この音声データ格納パケットは、先に図18を参照して説明した音声データ格納パケット140に相当する。
図18に示すように、音声データ格納パケット140のパケット格納データ141は、符号化音声データストリームと、このストリームデータの属性情報によって構成される。
(Step S121)
First, in step S121, the information processing apparatus 300 acquires an audio data storage packet to be recorded in the clip AV stream file.
This voice data storage packet corresponds to the voice data storage packet 140 described above with reference to FIG.
As shown in FIG. 18, the packet storage data 141 of the voice data storage packet 140 is composed of a coded voice data stream and attribute information of the stream data.

音声データ格納パケット140に格納されている符号化音声データストリームは、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれかの音声データである。
The coded audio data stream stored in the audio data storage packet 140 is
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(2) MPEG4 ALS (LATM / LOAS) coded audio data,
It is the voice data of any of these.

さらに、音声データ格納パケット140には、パケットに格納された音声データの属性情報が記録される。
図18に示すように、音声データ属性情報の一部として、
音声オブジェクトタイプ(audioObjectType)142が記録されている。
Further, the voice data storage packet 140 records the attribute information of the voice data stored in the packet.
As shown in FIG. 18, as a part of the audio data attribute information,
A voice object type (audioObjectType) 142 is recorded.

(ステップS122)
次に、ステップS122において、情報処理装置300は、取得した音声データ格納パケットから音声オブジェクトタイプ(audioObjectType)の設定値を取得する。
図18に示すように、音声データ属性情報の一部として、
音声オブジェクトタイプ(audioObjectType)142が記録されている。
(Step S122)
Next, in step S122, the information processing apparatus 300 acquires the set value of the voice object type (audioObjectType) from the acquired voice data storage packet.
As shown in FIG. 18, as a part of the audio data attribute information,
A voice object type (audioObjectType) 142 is recorded.

図18に示す音声オブジェクトタイプ(audioObjectType)142の設定値は、以下の設定である。
パケットに格納されたデータが、MPEG4 AAC LC(LATM/LOAS)符号化音声データである場合、音声オブジェクトタイプ(audioObjectType)=2である。
一方、パケットに格納されたデータが、MPEG4 ALS(LATM/LOAS)符号化音声データである場合、音声オブジェクトタイプ(audioObjectType)=36である。
The setting value of the audio object type (audioObjectType) 142 shown in FIG. 18 is the following setting.
When the data stored in the packet is MPEG4 AAC LC (LATM / LOAS) coded audio data, the audio object type (audioOjectType) = 2.
On the other hand, when the data stored in the packet is MPEG4 ALS (LATM / LOAS) coded audio data, the audio object type (audioOjectType) = 36.

(ステップS123)
次に、ステップS123において、情報処理装置300は、制御情報(SI)格納パケットから、MMTパッケージテーブル(MPT)を取得する。
(Step S123)
Next, in step S123, the information processing apparatus 300 acquires the MMT package table (MPT) from the control information (SI) storage packet.

MMTパッケージテーブル(MPT)は、先に図21~図26を参照して説明した様々なデータを格納したテーブルである。
例えば、音声データについては、アセット(ストリーム)単位の属性情報として、図23~図26を参照して説明した
(M1)ストリームコンテンツ情報161、
(M2)コンポーネントタイプ162、
(M3)サンプリング周波数163、
これらの各データが記録されている。
The MMT package table (MPT) is a table that stores various data described above with reference to FIGS. 21 to 26.
For example, the audio data is described with reference to FIGS. 23 to 26 as attribute information for each asset (stream) (M1) Stream content information 161.
(M2) Component type 162,
(M3) Sampling frequency 163,
Each of these data is recorded.

(ステップS124)
次に、ステップS124において、情報処理装置300は、MPT(MMTパッケージテーブル)から、アセットタイプが音声であるアセット記述子を選択する。
(Step S124)
Next, in step S124, the information processing apparatus 300 selects an asset descriptor whose asset type is voice from the MPT (MMT package table).

(ステップS125)
次に、ステップS125において、情報処理装置300は、MPTのアセットタイプ=音声のアセット記述子(asset_descriptor)から、以下の音声属性情報を取得する。
(M2)コンポーネントタイプ162、
(M3)サンプリング周波数163。
(Step S125)
Next, in step S125, the information processing apparatus 300 acquires the following voice attribute information from the MPT asset type = voice asset descriptor (asset_descriptor).
(M2) Component type 162,
(M3) Sampling frequency 163.

(ステップS126)
次に、ステップS126において、情報処理装置300は、音声データ格納パケットから取得した音声属性情報、すなわち、図18に示す、
音声オブジェクトタイプ(audioObjectType)142、
さらに、MPTから取得した音声属性情報、すなわち、図23~図26を参照して説明した、
(M2)コンポーネントタイプ162、
(M3)サンプリング周波数163、
これらの各情報を、クリップ情報ファイルに設定したストリームコーディングタイプ=0x11以下の記録フィールドに記録する。
(Step S126)
Next, in step S126, the information processing apparatus 300 has voice attribute information acquired from the voice data storage packet, that is, shown in FIG.
Audio Object Type 142,
Further, the audio attribute information acquired from the MPT, that is, with reference to FIGS. 23 to 26, has been described.
(M2) Component type 162,
(M3) Sampling frequency 163,
Each of these pieces of information is recorded in a recording field of stream coding type = 0x11 or less set in the clip information file.

すなわち、先に図16を参照して説明した以下の各データ
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
(c)音声オブジェクトタイプ(audioObjectType)133
これらの各情報を、クリップ情報ファイルに設定したストリームコーディングタイプ=0x11以下の記録フィールドに記録する。
That is, the following data (a) voice type (audio_presentation_type) 131 described above with reference to FIG. 16 above.
(B) Sampling frequency (sampling_frequency) 132
(C) Audio Object Type 133
Each of these pieces of information is recorded in a recording field of stream coding type = 0x11 or less set in the clip information file.

これらの処理により、所定の音声属性情報が記録されたクリップ情報ファイルが生成される。
BD等のメディアに記録されたデータの再生を行う再生装置は、クリップ情報ファイルに記録された音声オブジェクトタイプ(audioObjectType)を参照することで、このクリップ情報ファイルの再生制御対象となる音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれの音声データであるかを識別することが可能となる。
By these processes, a clip information file in which predetermined audio attribute information is recorded is generated.
The playback device that reproduces the data recorded on the media such as BD refers to the audio object type (audioObjectType) recorded in the clip information file, so that the audio data that is the playback control target of this clip information file can be set.
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(2) MPEG4 ALS (LATM / LOAS) coded audio data,
It is possible to identify which of these voice data is used.

次に、図30を参照して、先に説明した(実施例2)、すなわち、MMTパッケージテーブル(MPT)から音声識別情報を取得する実施例に従ったクリップ情報ファイル生成処理の詳細シーケンスについて説明する。
図30に示すフローの各ステップの処理について、順次、説明する。
Next, with reference to FIG. 30, a detailed sequence of the clip information file generation process according to the above-described (Example 2), that is, the embodiment of acquiring voice recognition information from the MMT package table (MPT) will be described. do.
The processing of each step of the flow shown in FIG. 30 will be sequentially described.

(ステップS131)
まず、ステップS131において、情報処理装置300は、制御情報(SI)格納パケットから、MMTパッケージテーブル(MPT)を取得する。
(Step S131)
First, in step S131, the information processing apparatus 300 acquires the MMT package table (MPT) from the control information (SI) storage packet.

MMTパッケージテーブル(MPT)は、先に図21~図26を参照して説明した様々なデータを格納したテーブルである。
例えば、音声データについては、アセット(ストリーム)単位の属性情報として、図23~図26を参照して説明した
(M1)ストリームコンテンツ情報161、
(M2)コンポーネントタイプ162、
(M3)サンプリング周波数163、
これらの各データが記録されている。
The MMT package table (MPT) is a table that stores various data described above with reference to FIGS. 21 to 26.
For example, the audio data is described with reference to FIGS. 23 to 26 as attribute information for each asset (stream) (M1) Stream content information 161.
(M2) Component type 162,
(M3) Sampling frequency 163,
Each of these data is recorded.

(ステップS132)
次に、ステップS132において、情報処理装置300は、MPT(MMTパッケージテーブル)から、アセットタイプが音声であるデータを選択する。
(Step S132)
Next, in step S132, the information processing apparatus 300 selects data whose asset type is voice from the MPT (MMT package table).

(ステップS133)
次に、ステップS133において、情報処理装置300は、MPTのアセットタイプ=音声のアセット記述子(asset_descriptor)から、以下の音声属性情報を取得する。
(M1)ストリームコンテンツ情報161、
(M2)コンポーネントタイプ162、
(M3)サンプリング周波数163。
(Step S133)
Next, in step S133, the information processing apparatus 300 acquires the following voice attribute information from the MPT asset type = voice asset descriptor (asset_descriptor).
(M1) Stream content information 161
(M2) Component type 162,
(M3) Sampling frequency 163.

(ステップS134)
次に、ステップS134において、情報処理装置300は、MPTから取得した音声属性情報、すなわち、図23~図26を参照して説明した、
(M1)ストリームコンテンツ情報161、
(M2)コンポーネントタイプ162、
(M3)サンプリング周波数163、
これらの各情報を、クリップ情報ファイルに設定したストリームコーディングタイプ=0x11以下の記録フィールドに記録する。
(Step S134)
Next, in step S134, the information processing apparatus 300 has been described with reference to the voice attribute information acquired from the MPT, that is, FIGS. 23 to 26.
(M1) Stream content information 161
(M2) Component type 162,
(M3) Sampling frequency 163,
Each of these pieces of information is recorded in a recording field of stream coding type = 0x11 or less set in the clip information file.

すなわち、先に図19を参照して説明した以下の各データ
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
(c)ストリームコンテンツ(stream_content)135
これらの各情報を、クリップ情報ファイルに設定したストリームコーディングタイプ=0x11以下の記録フィールドに記録する。
That is, the following data (a) voice type (audio_presentation_type) 131 described above with reference to FIG. 19
(B) Sampling frequency (sampling_frequency) 132
(C) Stream content (stream_content) 135
Each of these pieces of information is recorded in a recording field of stream coding type = 0x11 or less set in the clip information file.

これらの処理により、所定の音声属性情報が記録されたクリップ情報ファイルが生成される。
具体的には、BD等のメディアに記録されたデータの再生を行う再生装置は、クリップ情報ファイルに記録されたストリームコンテンツ(stream_content)を参照することで、このクリップ情報ファイルの再生制御対象となる音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれの音声データであるかを識別することが可能となる。
By these processes, a clip information file in which predetermined audio attribute information is recorded is generated.
Specifically, the playback device that reproduces the data recorded on the media such as BD becomes the playback control target of this clip information file by referring to the stream content (stream_content) recorded in the clip information file. The voice data is
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(2) MPEG4 ALS (LATM / LOAS) coded audio data,
It is possible to identify which of these voice data is used.

[8.情報記録媒体からのデータ再生処理を実行する情報処理装置の構成と処理について]
次に、図31以下を参照して情報記録媒体からのデータ再生処理を実行する情報処理装置の構成と処理について説明する。
[8. Configuration and processing of information processing equipment that executes data reproduction processing from information recording media]
Next, the configuration and processing of the information processing apparatus that executes the data reproduction processing from the information recording medium will be described with reference to FIGS. 31 and below.

再生処理を実行する情報処理装置は、装置に装着した情報記録媒体に記録されたデータの読み取り、再生処理を実行する。 The information processing apparatus that executes the reproduction process reads the data recorded on the information recording medium attached to the apparatus and executes the reproduction process.

図31は、BD等の情報記録媒体510に記録されたデータの再生処理を実行する情報処理装置400の構成を示す図である。
情報処理装置400は、図31に示す情報記録媒体(記録メディア)510に記録されたデータを読み取り、出力装置(表示部+スピーカ)520に出力する。なお、出力装置520は、例えばテレビ等であり、ディスプレイ、スピーカ等を備えた表示装置である。
なお、情報処理装置400は先に図27を参照して説明したデータ記録を行う情報処理装置300と同一の装置である場合もある。すなわち、データ記録再生の両機能を有する情報処理装置である。
FIG. 31 is a diagram showing a configuration of an information processing apparatus 400 that executes a reproduction process of data recorded on an information recording medium 510 such as a BD.
The information processing device 400 reads the data recorded on the information recording medium (recording medium) 510 shown in FIG. 31 and outputs the data to the output device (display unit + speaker) 520. The output device 520 is, for example, a television or the like, and is a display device including a display, a speaker, and the like.
The information processing device 400 may be the same device as the information processing device 300 that performs data recording described above with reference to FIG. 27. That is, it is an information processing device having both functions of data recording and reproduction.

情報記録媒体(記録メディア)510は、図28~図30を参照して説明した処理によって生成されたクリップAVストリームファイルと、プレイリスト、クリップ情報ファイル等のデータベースが記録された記録媒体である。 The information recording medium (recording medium) 510 is a recording medium in which a clip AV stream file generated by the processes described with reference to FIGS. 28 to 30 and a database such as a playlist and a clip information file are recorded.

なお、MMTフォーマット対応のクリップAVストリームファイルの再生に利用するクリップ情報ファイルには、音声データに関する各ストリーム(アセット)単位の音声属性情報として、各音声ストリームが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれの音声データであるかを識別することが可能とした音声識別情報が記録されている。
In the clip information file used for playing the clip AV stream file compatible with the MMT format, each audio stream has audio attribute information for each stream (asset) related to audio data.
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(2) MPEG4 ALS (LATM / LOAS) coded audio data,
The voice identification information that makes it possible to identify which of these voice data is recorded is recorded.

すなわち、先に図16を参照して説明した以下の各データ、
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
(c)音声オブジェクトタイプ(audioObjectType)133
これらのデータが記録されている。
That is, the following data described above with reference to FIG. 16
(A) Voice type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
(C) Audio Object Type 133
These data are recorded.

または、先に図19を参照して説明した以下の各データ、
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
(c)ストリームコンテンツ(stream_content)135
これらのデータが記録されている。
Alternatively, the following data, which have been described above with reference to FIG.
(A) Voice type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
(C) Stream content (stream_content) 135
These data are recorded.

図16に示す例では、音声オブジェクトタイプ(audioObjectType)133、
図19に示す例では、ストリームコンテンツ(stream_content)135、
これらのデータが、音声ストリームが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれの音声データであるかを示す音声識別情報である。
In the example shown in FIG. 16, the audio object type (audioObjectType) 133,
In the example shown in FIG. 19, stream content (stream_content) 135,
These data, the audio stream,
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(2) MPEG4 ALS (LATM / LOAS) coded audio data,
This is voice identification information indicating which of these voice data is used.

制御部401は、例えば、ユーザ入力部402からの再生指示情報の入力に基づいて、情報記録媒体510の記録データを、記録再生部404、ドライブ403を介して読み取り、データバッファとしての記憶部405に格納し、その格納データを再生処理部406に出力する。 For example, the control unit 401 reads the recorded data of the information recording medium 510 via the recording / reproducing unit 404 and the drive 403 based on the input of the reproduction instruction information from the user input unit 402, and the storage unit 405 as a data buffer. It is stored in, and the stored data is output to the reproduction processing unit 406.

また、制御部401は、ユーザ入力部402からの録画コンテンツリスト表示指示情報の入力に基づいて、情報記録媒体510の記録データに基づいて、先に図9を参照して説明した録画コンテンツリストを生成して、出力装置(表示部)520に出力する。 Further, the control unit 401 obtains the recorded content list described above with reference to FIG. 9 based on the recorded data of the information recording medium 510 based on the input of the recorded content list display instruction information from the user input unit 402. It is generated and output to the output device (display unit) 520.

再生処理部406は、制御部401の制御の下、情報記録媒体510から読み出された再生データ、すなわち、画像、音声、字幕等の各データを格納したクリップAVストリームファイルから各データを取得して再生データを生成する。 Under the control of the control unit 401, the reproduction processing unit 406 acquires each data from the reproduction data read from the information recording medium 510, that is, a clip AV stream file storing each data such as images, sounds, and subtitles. To generate playback data.

デマルチプレクサ(DeMUX)411は、画像、音声、字幕、さらに、プレイリストファイル、クリップ情報ファイル等の各データを格納したデータ格納パケットを取得し、データ種別のパケットに分類し、各パケットを、データ種類に応じて、字幕データ生成部412、画像データ生成部413、音声データ生成部414、補助情報生成部415に出力する。 The demultiplexer (DeMUX) 411 acquires a data storage packet containing each data such as an image, an audio, a subtitle, a playlist file, a clip information file, etc., classifies them into data type packets, and classifies each packet into data. Depending on the type, the data is output to the subtitle data generation unit 412, the image data generation unit 413, the audio data generation unit 414, and the auxiliary information generation unit 415.

字幕データ生成部412、画像データ生成部413、音声データ生成部414は、パケットに格納されたデータの復号処理等を実行し、復号データを出力データ生成部416に出力する。
出力データ生成部416は、字幕、画像、音声の各データを、入出力インタフェース407を介して出力装置(表示部+スピーカ)520に出力する。
The subtitle data generation unit 412, the image data generation unit 413, and the audio data generation unit 414 execute the decoding process of the data stored in the packet and output the decoded data to the output data generation unit 416.
The output data generation unit 416 outputs each data of subtitles, images, and voices to the output device (display unit + speaker) 520 via the input / output interface 407.

なお、情報記録媒体510は、再生対象データを格納したストリームファイルとして、
MPEG-2TSフォーマットデータを格納したストリームファイルと、
MMTフォーマットデータを格納したストリームファイルを有する場合がある。
情報処理装置400は、各フォーマット対応のプレイリストファイルとクリップ情報ファイルを選択適用して、MPEG-2TSフォーマットデータを格納したストリームファイル、および、MMTフォーマットデータを格納したストリームファイルの再生処理を実行することになる。
The information recording medium 510 is used as a stream file in which data to be reproduced is stored.
A stream file containing MPEG-2 TS format data and
It may have a stream file containing MMT format data.
The information processing apparatus 400 selectively applies a playlist file and a clip information file corresponding to each format, and executes a playback process of a stream file storing MPEG-2 TS format data and a stream file storing MMT format data. It will be.

補助情報生成部415は、例えば、プレイリストファイル、クリップ情報ファイルに格納されたデータを取得して録画コンテンツリストを生成し、生成リストが出力装置(表示部+スピーカ)520に出力される。 The auxiliary information generation unit 415 acquires, for example, the data stored in the playlist file and the clip information file to generate a recorded content list, and the generation list is output to the output device (display unit + speaker) 520.

出力装置(表示部+スピーカ)520は、情報処理装置400から入力する字幕、画像、音声等の各データ、さらに録画コンテンツリストを、出力装置(表示部+スピーカ)520を介して出力する。 The output device (display unit + speaker) 520 outputs each data such as subtitles, images, and sounds input from the information processing device 400, and a recorded content list via the output device (display unit + speaker) 520.

次に、図31に示す情報処理装置400が実行する情報記録媒体510からのMMTフォーマットデータの再生処理に際して、再生対象となる音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれの音声データであるかを識別する音声識別処理シーケンスについて、図32に示すフローチャートを参照して説明する。
Next, in the reproduction processing of the MMT format data from the information recording medium 510 executed by the information processing apparatus 400 shown in FIG. 31, the audio data to be reproduced is the audio data to be reproduced.
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(2) MPEG4 ALS (LATM / LOAS) coded audio data,
A voice recognition processing sequence for identifying which of these voice data is used will be described with reference to the flowchart shown in FIG. 32.

図32に示すフローに従った処理は、例えば情報処理装置400の記憶部に格納されたプログラムに従って、プログラム実行機能を有するCPUを備えたデータ処理部(制御部)の制御の下で実行することができる。 The processing according to the flow shown in FIG. 32 is executed under the control of a data processing unit (control unit) having a CPU having a program execution function, for example, according to a program stored in the storage unit of the information processing apparatus 400. Can be done.

なお、図32に示すフローに従った処理を実行する情報処理装置は、図31に示す情報処理装置400であり、情報記録媒体(記録メディア)510を装着し、装着した情報記録媒体510に記録されたデータを読み取り、出力装置(表示部+スピーカ)520に出力する。なお、出力装置520は、例えばテレビ等であり、ディスプレイ、スピーカ等を備えた表示装置である。 The information processing device that executes the processing according to the flow shown in FIG. 32 is the information processing device 400 shown in FIG. 31, in which an information recording medium (recording medium) 510 is attached and recorded on the attached information recording medium 510. The output data is read and output to the output device (display unit + speaker) 520. The output device 520 is, for example, a television or the like, and is a display device including a display, a speaker, and the like.

情報記録媒体(記録メディア)510は、図28~図31を参照して説明した処理によって生成されたクリップAVストリームと、プレイリスト、クリップ情報ファイル等のデータベースが記録された記録媒体である。
以下、図32のフローに示す各ステップの処理について、順次、説明する。
The information recording medium (recording medium) 510 is a recording medium in which a clip AV stream generated by the processes described with reference to FIGS. 28 to 31 and a database such as a playlist and a clip information file are recorded.
Hereinafter, the processing of each step shown in the flow of FIG. 32 will be sequentially described.

(ステップS201)
まず、情報処理装置400の制御部401は、ステップS201において、クリップ情報ファイルを取得する。
なお、ここで選択するクリップAVストリームファイルは、MMTフォーマットデータを格納したクリップAVストリームファイルの再生に利用するクリップAVストリームファイルであるものとする。
(Step S201)
First, the control unit 401 of the information processing apparatus 400 acquires the clip information file in step S201.
The clip AV stream file selected here is assumed to be a clip AV stream file used for playing back the clip AV stream file storing the MMT format data.

(ステップS202)
次に、情報処理装置400の制御部401は、ステップS202において、クリップ情報ファイルに記録されたストリームコーディングタイプ=0x11の以下の記録フィールドから、再生対象音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記いずれの符号化音声データであるかを示す音声識別情報を取得する。
(Step S202)
Next, in step S202, the control unit 401 of the information processing apparatus 400 displays the audio data to be reproduced from the following recording field of stream coding type = 0x11 recorded in the clip information file.
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(2) MPEG4 ALS (LATM / LOAS) coded audio data,
Acquires voice identification information indicating which of the above coded voice data is used.

これは、具体的には、図16、または図19に示すクリップ情報ファイルのプログラム情報[ProgramInfo()]のストリームコーディング情報[StreamCodingInfo]の記録データに含まれる以下の情報を取得する処理である。 Specifically, this is a process of acquiring the following information included in the recorded data of the stream coding information [Stream Coding Info] of the program information [Program Info ()] of the clip information file shown in FIG. 16 or FIG.

クリップ情報ファイルの記録データが、図16に示すデータ構成を有する場合は、
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
(c)音声オブジェクトタイプ(audioObjectType)133
これらのデータを取得する。
When the recorded data of the clip information file has the data structure shown in FIG.
(A) Voice type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
(C) Audio Object Type 133
Get these data.

一方、クリップ情報ファイルの記録データが、図19に示すデータ構成を有する場合は、
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
(c)ストリームコンテンツ(stream_content)135
これらのデータを取得する。
On the other hand, when the recorded data of the clip information file has the data structure shown in FIG.
(A) Voice type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
(C) Stream content (stream_content) 135
Get these data.

図16に示す例では、音声オブジェクトタイプ(audioObjectType)133、
図19に示す例では、ストリームコンテンツ(stream_content)135、
これらのデータが、音声ストリームが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれの音声データであるかを示す音声識別情報である。
In the example shown in FIG. 16, the audio object type (audioObjectType) 133,
In the example shown in FIG. 19, stream content (stream_content) 135,
These data, the audio stream,
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(2) MPEG4 ALS (LATM / LOAS) coded audio data,
This is voice identification information indicating which of these voice data is used.

(ステップS203)
次に、情報処理装置400の制御部401は、ステップS203において、ステップS202でクリップ情報ファイルから読み取った音声識別情報に基づいて、再生対象となる音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれの音声データであるかを判定する。
(Step S203)
Next, in step S203, the control unit 401 of the information processing apparatus 400 displays the voice data to be reproduced based on the voice identification information read from the clip information file in step S202.
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(2) MPEG4 ALS (LATM / LOAS) coded audio data,
It is determined which of these voice data is used.

再生対象音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
である場合は、ステップS204に進む。
一方、再生対象音声データが、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
である場合は、ステップS205に進む。
The audio data to be played is
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
If is, the process proceeds to step S204.
On the other hand, the audio data to be played is
(2) MPEG4 ALS (LATM / LOAS) coded audio data,
If is, the process proceeds to step S205.

(ステップS204)
再生対象音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
である場合は、情報処理装置400の制御部401は、ステップS204において、MPEG4 AAC LC(LATM/LOAS)符号化音声データ対応のコーデックを適用した復号、再生処理を実行する。
(Step S204)
The audio data to be played is
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
In the case of, the control unit 401 of the information processing apparatus 400 executes the decoding / reproduction process in step S204 by applying the codec corresponding to the MPEG4 AAC LC (LATM / LOAS) coded audio data.

(ステップS205)
一方、再生対象音声データが、
(1)MPEG4 ALS(LATM/LOAS)符号化音声データ、
である場合は、情報処理装置400の制御部401は、ステップS205において、MPEG4 ALS(LATM/LOAS)符号化音声データ対応のコーデックを適用した復号、再生処理を実行する。
(Step S205)
On the other hand, the audio data to be played is
(1) MPEG4 ALS (LATM / LOAS) coded audio data,
In the case of, the control unit 401 of the information processing apparatus 400 executes the decoding / reproduction process in step S205 by applying the codec corresponding to the MPEG4 ALS (LATM / LOAS) coded audio data.

このように、クリップ情報ファイルには、再生対象となる音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれの音声データであるかを示す音声識別情報が記録されており、この情報を参照することで、正しい復号処理、再生処理を迅速に実行することが可能となる。
In this way, the clip information file contains audio data to be played back.
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(2) MPEG4 ALS (LATM / LOAS) coded audio data,
Voice identification information indicating which of these voice data is recorded is recorded, and by referring to this information, it is possible to quickly execute correct decoding processing and reproduction processing.

次に、1つの番組等のコンテンツに対して、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これら2種類の音声データが設定され、ユーザ(視聴者)による選択再生を可能としたコンテンツの再生シーケンス例について図33に示すフローチャートを参照して説明する。
Next, for the content such as one program,
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(2) MPEG4 ALS (LATM / LOAS) coded audio data,
An example of a reproduction sequence of content in which these two types of audio data are set and can be selectively reproduced by a user (viewer) will be described with reference to the flowchart shown in FIG. 33.

図33に示すフローに従った処理は、例えば情報処理装置400の記憶部に格納されたプログラムに従って、プログラム実行機能を有するCPUを備えたデータ処理部(制御部)の制御の下で実行することができる。
以下、図33のフローに示す各ステップの処理について、順次、説明する。
The processing according to the flow shown in FIG. 33 is executed under the control of a data processing unit (control unit) having a CPU having a program execution function, for example, according to a program stored in the storage unit of the information processing apparatus 400. Can be done.
Hereinafter, the processing of each step shown in the flow of FIG. 33 will be sequentially described.

(ステップS301)
まず、情報処理装置400の制御部401は、ステップS301において、クリップ情報ファイルを取得する。
なお、ここで選択するクリップAVストリームファイルは、MMTフォーマットデータを格納したクリップAVストリームファイルの再生に利用するクリップAVストリームファイルであるものとする。
(Step S301)
First, the control unit 401 of the information processing apparatus 400 acquires the clip information file in step S301.
The clip AV stream file selected here is assumed to be a clip AV stream file used for playing back the clip AV stream file storing the MMT format data.

(ステップS302~S303)
次に、情報処理装置400の制御部401は、ステップS302~S303において、クリップ情報ファイルに記録されたストリームコーディングタイプ=0x11の以下の記録フィールドの記録情報に基づいて、再生対象音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記の2種類の符号化音声データを選択再生可能であるか否かを確認する。
(Steps S302 to S303)
Next, in steps S302 to S303, the control unit 401 of the information processing apparatus 400 displays the audio data to be reproduced based on the recorded information in the following recording field of the stream coding type = 0x11 recorded in the clip information file.
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(2) MPEG4 ALS (LATM / LOAS) coded audio data,
It is confirmed whether or not the above two types of coded voice data can be selectively played back.

これは、具体的には、図16、または図19に示すクリップ情報ファイルのプログラム情報[ProgramInfo()]のストリームコーディング情報[StreamCodingInfo]の記録データに含まれる以下の情報を取得する処理である。 Specifically, this is a process of acquiring the following information included in the recorded data of the stream coding information [Stream Coding Info] of the program information [Program Info ()] of the clip information file shown in FIG. 16 or FIG.

クリップ情報ファイルの記録データが、図16に示すデータ構成を有する場合は、
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
(c)音声オブジェクトタイプ(audioObjectType)133
これらのデータを取得する。
When the recorded data of the clip information file has the data structure shown in FIG.
(A) Voice type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
(C) Audio Object Type 133
Get these data.

一方、クリップ情報ファイルの記録データが、図19に示すデータ構成を有する場合は、
(a)音声タイプ(audio_presentation_type)131
(b)サンプリング周波数(sampling_frequency)132
(c)ストリームコンテンツ(stream_content)135
これらのデータを取得する。
On the other hand, when the recorded data of the clip information file has the data structure shown in FIG.
(A) Voice type (audio_presentation_type) 131
(B) Sampling frequency (sampling_frequency) 132
(C) Stream content (stream_content) 135
Get these data.

図16に示す例では、音声オブジェクトタイプ(audioObjectType)133、
図19に示す例では、ストリームコンテンツ(stream_content)135、
これらのデータは、音声ストリーム単位で記録されており、1つの番組等のコンテンツに複数の音声ストリームが設定されている場合、各音声ストリーム単位で、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれの音声データであるかを示す音声識別情報が記録されている。
In the example shown in FIG. 16, the audio object type (audioObjectType) 133,
In the example shown in FIG. 19, stream content (stream_content) 135,
These data are recorded in units of audio streams, and when multiple audio streams are set for content such as one program, each audio stream is used.
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(2) MPEG4 ALS (LATM / LOAS) coded audio data,
Voice identification information indicating which of these voice data is used is recorded.

ステップS302~S303では、クリップ情報ファイルの記録データを参照して、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記の2種類の符号化音声データを選択再生可能であるか否かを確認する。
In steps S302 to S303, referring to the recorded data of the clip information file,
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(2) MPEG4 ALS (LATM / LOAS) coded audio data,
It is confirmed whether or not the above two types of coded voice data can be selectively played back.

2種類の符号化音声データを選択再生可能であることが確認された場合は、ステップS304に進む。
2種類の符号化音声データを選択再生可能でなく、いずれか一方のみ再生可能であることが確認された場合は、ステップS305に進む。
If it is confirmed that the two types of coded voice data can be selectively played back, the process proceeds to step S304.
If it is confirmed that the two types of coded audio data cannot be selectively reproduced and only one of them can be reproduced, the process proceeds to step S305.

(ステップS304)
2種類の符号化音声データを選択再生可能であることが確認された場合は、ステップS304において、情報処理装置400の制御部401は、MPEG4 AAC LC符号化音声データと、MPEG4 ALS符号化音声データの2つの音声データを、ユーザ(視聴者)に選択させるための表示情報を提示して、ユーザによる選択情報を入力する。
(Step S304)
When it is confirmed that the two types of coded voice data can be selectively played back, in step S304, the control unit 401 of the information processing apparatus 400 determines the MPEG4 AAC LC coded voice data and the MPEG4 ALS coded voice data. The display information for allowing the user (viewer) to select the two audio data of the above is presented, and the selection information by the user is input.

(ステップS305)
ステップS304において、ユーザからの選択情報を入力した場合、または、
ステップS303で、2種類の符号化音声データを選択再生可能でなく、いずれか一方のみ再生可能であることが確認された場合は、ステップS305に進む。
(Step S305)
When the selection information from the user is input in step S304, or
If it is confirmed in step S303 that the two types of coded audio data cannot be selectively reproduced and only one of them can be reproduced, the process proceeds to step S305.

情報処理装置400の制御部401は、ステップS305において、再生可能な1つの音声データ、またはユーザによって選択された音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
これらのいずれの音声データであるかを判定する。
In step S305, the control unit 401 of the information processing apparatus 400 receives one reproducible voice data or voice data selected by the user.
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(2) MPEG4 ALS (LATM / LOAS) coded audio data,
It is determined which of these voice data is used.

再生可能な1つの音声データ、またはユーザによって選択された音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
である場合は、ステップS306に進む。
一方、再生可能な1つの音声データ、またはユーザによって選択された音声データが、
(2)MPEG4 ALS(LATM/LOAS)符号化音声データ、
である場合は、ステップS307に進む。
One playable audio data, or audio data selected by the user,
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
If is, the process proceeds to step S306.
On the other hand, one reproducible audio data or audio data selected by the user is
(2) MPEG4 ALS (LATM / LOAS) coded audio data,
If is, the process proceeds to step S307.

(ステップS306)
再生可能な1つの音声データ、またはユーザによって選択された音声データが、
(1)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
である場合は、情報処理装置400の制御部401は、ステップS306において、MPEG4 AAC LC(LATM/LOAS)符号化音声データ対応のコーデックを適用した復号、再生処理を実行する。
(Step S306)
One playable audio data, or audio data selected by the user,
(1) MPEG4 AAC LC (LATM / LOAS) coded audio data,
In the case of, the control unit 401 of the information processing apparatus 400 executes the decoding / reproduction process in step S306 by applying the codec corresponding to the MPEG4 AAC LC (LATM / LOAS) coded audio data.

(ステップS307)
一方、再生可能な1つの音声データ、またはユーザによって選択された音声データが、
(1)MPEG4 ALS(LATM/LOAS)符号化音声データ、
である場合は、情報処理装置400の制御部401は、ステップS307において、MPEG4 ALS(LATM/LOAS)符号化音声データ対応のコーデックを適用した復号、再生処理を実行する。
(Step S307)
On the other hand, one reproducible audio data or audio data selected by the user is
(1) MPEG4 ALS (LATM / LOAS) coded audio data,
In the case of, the control unit 401 of the information processing apparatus 400 executes the decoding / reproduction process in step S307 by applying the codec corresponding to the MPEG4 ALS (LATM / LOAS) coded audio data.

[9.情報処理装置の構成例について]
次に、情報記録媒体に対するデータ記録、情報記録媒体からのデータ再生を実行する情報処理装置として適用可能な情報処理装置のハードウェア構成例について、図34を参照して説明する。
[9. About the configuration example of the information processing device]
Next, a hardware configuration example of an information processing device applicable as an information processing device for executing data recording on an information recording medium and data reproduction from the information recording medium will be described with reference to FIG. 34.

CPU(Central Processing Unit)601は、ROM(Read Only Memory)602、または記憶部608に記憶されているプログラムに従って各種の処理を実行するデータ処理部として機能する。例えば、上述した実施例において説明したシーケンスに従った処理を実行する。RAM(Random Access Memory)603には、CPU601が実行するプログラムやデータなどが記憶される。これらのCPU601、ROM602、およびRAM603は、バス604により相互に接続されている。 The CPU (Central Processing Unit) 601 functions as a data processing unit that executes various processes according to a program stored in a ROM (Read Only Memory) 602 or a storage unit 608. For example, the process according to the sequence described in the above-described embodiment is executed. The RAM (Random Access Memory) 603 stores programs and data executed by the CPU 601. These CPU 601, ROM 602, and RAM 603 are connected to each other by a bus 604.

CPU601はバス604を介して入出力インタフェース605に接続され、入出力インタフェース605には、各種スイッチ、キーボード、マウス、マイクロホンなどよりなる入力部606、ディスプレイ、スピーカなどよりなる出力部607が接続されている。CPU601は、入力部606から入力される指令に対応して各種の処理を実行し、処理結果を例えば出力部607に出力する。 The CPU 601 is connected to an input / output interface 605 via a bus 604, and an input unit 606 consisting of various switches, a keyboard, a mouse, a microphone, etc., and an output unit 607 consisting of a display, a speaker, etc. are connected to the input / output interface 605. There is. The CPU 601 executes various processes in response to a command input from the input unit 606, and outputs the process results to, for example, the output unit 607.

入出力インタフェース605に接続されている記憶部608は、例えばハードディスク等からなり、CPU601が実行するプログラムや各種のデータを記憶する。通信部609は、インターネットやローカルエリアネットワークなどのネットワークを介したデータ通信の送受信部、さらに放送波の送受信部として機能し、外部の装置と通信する。 The storage unit 608 connected to the input / output interface 605 is composed of, for example, a hard disk or the like, and stores a program executed by the CPU 601 and various data. The communication unit 609 functions as a transmission / reception unit for data communication via a network such as the Internet or a local area network, and further as a transmission / reception unit for broadcast waves, and communicates with an external device.

入出力インタフェース605に接続されているドライブ610は、磁気ディスク、光ディスク、光磁気ディスク、あるいはメモリカード等の半導体メモリなどのリムーバブルメディア611を駆動し、データの記録あるいは読み取りを実行する。 The drive 610 connected to the input / output interface 605 drives a removable medium 611 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory such as a memory card, and records or reads data.

[10.本開示の構成のまとめ]
以上、特定の実施例を参照しながら、本開示の実施例について詳解してきた。しかしながら、本開示の要旨を逸脱しない範囲で当業者が実施例の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、限定的に解釈されるべきではない。本開示の要旨を判断するためには、特許請求の範囲の欄を参酌すべきである。
[10. Summary of the structure of this disclosure]
As described above, the embodiments of the present disclosure have been described in detail with reference to the specific embodiments. However, it is self-evident that those skilled in the art may modify or substitute the examples without departing from the gist of the present disclosure. That is, the present invention has been disclosed in the form of an example and should not be construed in a limited manner. In order to judge the gist of this disclosure, the column of claims should be taken into consideration.

なお、本明細書において開示した技術は、以下のような構成をとることができる。
(1) MMTフォーマットデータを入力し、情報記録媒体に対するデータ記録フォーマットであるBDAVフォーマット、またはSPAVフォーマットに従った記録データを生成するデータ処理部を有し、
前記データ処理部は、
情報記録媒体に記録する音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報をBDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルに記録する処理を実行する情報処理装置。
The technique disclosed in the present specification can have the following configuration.
(1) It has a data processing unit that inputs MMT format data and generates recorded data according to the BDAV format or the SPAV format, which is a data recording format for an information recording medium.
The data processing unit
The audio data recorded on the information recording medium is
(A) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(B) MPEG4 ALS (LATM / LOAS) coded audio data,
An information processing device that executes a process of recording voice identification information that can identify which of the voice data (a) and (b) is in a database file specified in BDAV format or SPAV format.

(2) 前記データ処理部は、
前記音声識別情報をクリップ情報ファイルに記録する(1)に記載の情報処理装置。
(2) The data processing unit is
The information processing apparatus according to (1), which records the voice identification information in a clip information file.

(3) 前記データ処理部は、
音声データ格納パケットから前記音声識別情報を抽出して、前記データベースファイルに記録する(1)または(2)に記載の情報処理装置。
(3) The data processing unit is
The information processing apparatus according to (1) or (2), wherein the voice identification information is extracted from the voice data storage packet and recorded in the database file.

(4) 前記データ処理部は、
音声データ格納パケット内に記録された音声オブジェクトタイプ(audioObjectType)を抽出して、前記音声識別情報として前記データベースファイルに記録する(1)または(2)に記載の情報処理装置。
(4) The data processing unit is
The information processing apparatus according to (1) or (2), wherein the voice object type (audioObjectType) recorded in the voice data storage packet is extracted and recorded in the database file as the voice identification information.

(5) 前記データ処理部は、
MMTパッケージテーブル(MPT)から前記音声識別情報を抽出して、前記データベースファイルに記録する(1)または(2)に記載の情報処理装置。
(5) The data processing unit is
The information processing apparatus according to (1) or (2), wherein the voice identification information is extracted from the MMT package table (MPT) and recorded in the database file.

(6) 前記データ処理部は、
MMTパッケージテーブル(MPT)に記録されたストリームコンテンツ(stream_content)を抽出して、前記音声識別情報として前記データベースファイルに記録する(1)または(2)に記載の情報処理装置。
(6) The data processing unit is
The information processing apparatus according to (1) or (2), wherein the stream content (stream_content) recorded in the MMT package table (MPT) is extracted and recorded in the database file as the voice identification information.

(7) 前記データ処理部は、
前記音声識別情報をクリップ情報ファイルのストリームコーディング情報[StreamCodingInfo]記録領域の同じコーディングタイプ(stream_coding_type)の属性情報記録領域に、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報を記録する(1)~(6)いずれかに記載の情報処理装置。
(7) The data processing unit is
The voice recognition information is stored in the attribute information recording area of the same coding type (stream_coding_type) in the stream coding information [Stream Coding Info] recording area of the clip information file.
(A) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(B) MPEG4 ALS (LATM / LOAS) coded audio data,
The information processing apparatus according to any one of (1) to (6), which records voice identification information that enables identification of which voice data is (a) or (b).

(8) 前記同じコーディングタイプ(stream_coding_type)は、0x11である(7)に記載の情報処理装置。 (8) The information processing apparatus according to (7), wherein the same coding type (stream_coding_type) is 0x11.

(9) 情報記録媒体の記録データの再生処理を実行するデータ処理部を有し、
前記情報記録媒体は、MMTフォーマットデータを、BDAVフォーマット、またはSPAVフォーマットに従って記録したデータを格納した情報記録媒体であり、
前記データ処理部は、
BDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルであるプレイリストファイルとクリップ情報ファイルの記録情報を利用して、前記情報記録媒体に記録されたMMTフォーマットデータの再生処理を実行する構成であり、
前記データ処理部は、
再生対象の音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれのデータであるかを示す音声識別情報を、前記データベースファイルから取得し、取得情報に従って音声データの復号処理を実行する情報処理装置。
(9) It has a data processing unit that executes reproduction processing of recorded data of an information recording medium.
The information recording medium is an information recording medium that stores data in which MMT format data is recorded according to the BDAV format or the SPAV format.
The data processing unit
It is configured to execute the reproduction process of the MMT format data recorded on the information recording medium by using the recorded information of the playlist file and the clip information file which are the database files specified in the BDAV format or the SPAV format.
The data processing unit
The audio data to be played is
(A) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(B) MPEG4 ALS (LATM / LOAS) coded audio data,
An information processing device that acquires voice identification information indicating which data (a) or (b) is from the database file and executes voice data decoding processing according to the acquired information.

(10) 前記データ処理部は、
前記音声識別情報をクリップ情報ファイルから取得する(9)に記載の情報処理装置。
(10) The data processing unit is
The information processing apparatus according to (9), which acquires the voice identification information from a clip information file.

(11) 前記データ処理部は、
前記音声識別情報をクリップ情報ファイルのストリームコーディング情報[StreamCodingInfo]記録領域の同じコーディングタイプ(stream_coding_type)の属性情報記録領域から取得する(9)または(10)に記載の情報処理装置。
(11) The data processing unit is
The information processing apparatus according to (9) or (10), wherein the voice identification information is acquired from an attribute information recording area of the same coding type (stream_coding_type) in the stream coding information [StreamCodingInfo] recording area of the clip information file.

(12) 前記同じコーディングタイプ(stream_coding_type)は、0x11である(11)に記載の情報処理装置。 (12) The information processing apparatus according to (11), wherein the same coding type (stream_coding_type) is 0x11.

(13) 前記データ処理部は、
前記データベースファイルから取得した音声識別情報に基づいて、
再生可能な音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)の2種類のデータであると判定した場合、
再生対象とする音声データをユーザに選択させる表示情報を出力する(9)~(12)いずれかに記載の情報処理装置。
(13) The data processing unit is
Based on the voice recognition information obtained from the database file,
Playable audio data
(A) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(B) MPEG4 ALS (LATM / LOAS) coded audio data,
When it is determined that the data are the two types of data (a) and (b) above,
The information processing apparatus according to any one of (9) to (12), which outputs display information for allowing the user to select audio data to be reproduced.

(14) 前記データ処理部は、
前記表示情報に対するユーザ選択情報を入力し、入力した選択情報に従って、再生対象とする音声データを選択する(13)に記載の情報処理装置。
(14) The data processing unit is
The information processing apparatus according to (13), wherein user selection information for the display information is input, and audio data to be reproduced is selected according to the input selection information.

(15) BDAVフォーマット、またはSPAVフォーマットに従った記録データを記録した情報記録媒体であり、
情報記録媒体に記録された音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報をBDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルに記録した構成を有し、
再生装置が、前記データベースファイルに記録された音声識別情報に従って、再生対象とした音声データの種類を識別可能とした情報記録媒体。
(15) An information recording medium that records recorded data according to the BDAV format or SPAV format.
The audio data recorded on the information recording medium is
(A) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(B) MPEG4 ALS (LATM / LOAS) coded audio data,
It has a configuration in which the voice identification information that enables identification of which of the voice data (a) and (b) is recorded is recorded in a database file specified in BDAV format or SPAV format.
An information recording medium that allows the playback device to identify the type of voice data to be played back according to the voice identification information recorded in the database file.

(16) BDAVフォーマット、またはSPAVフォーマットに従った記録データが記録される情報記録媒体であり、
情報記録媒体に記録される音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報を含むBDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルを有し、
再生装置が、前記データベースファイルの音声識別情報に従って、再生対象とした音声データの種類を識別可能とした情報記録媒体。
(16) An information recording medium on which recorded data according to the BDAV format or SPAV format is recorded.
The audio data recorded on the information recording medium is
(A) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(B) MPEG4 ALS (LATM / LOAS) coded audio data,
It has a database file specified in BDAV format or SPAV format that contains voice identification information that makes it possible to identify which of the voice data (a) and (b) is.
An information recording medium in which a playback device can identify the type of voice data to be played back according to the voice identification information of the database file.

(17) 情報処理装置において実行する情報処理方法であり、
前記情報処理装置は、
MMTフォーマットデータを入力し、情報記録媒体に対するデータ記録フォーマットであるBDAVフォーマット、またはSPAVフォーマットに従った記録データを生成するデータ処理部を有し、
前記データ処理部が、
情報記録媒体に記録する音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報をBDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルに記録する処理を実行する情報処理方法。
(17) An information processing method executed by an information processing device.
The information processing device is
It has a data processing unit that inputs MMT format data and generates recorded data according to the BDAV format or SPAV format, which is a data recording format for an information recording medium.
The data processing unit
The audio data recorded on the information recording medium is
(A) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(B) MPEG4 ALS (LATM / LOAS) coded audio data,
An information processing method for executing a process of recording voice identification information that can identify which of the voice data (a) and (b) is in a database file specified in BDAV format or SPAV format.

(18) 情報処理装置において実行する情報処理方法であり、
前記情報処理装置は、
情報記録媒体の記録データの再生処理を実行するデータ処理部を有し、
前記情報記録媒体は、MMTフォーマットデータを、BDAVフォーマット、またはSPAVフォーマットに従って記録したデータを格納した情報記録媒体であり、
前記データ処理部が、
BDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルであるプレイリストファイルとクリップ情報ファイルの記録情報を利用して、前記情報記録媒体に記録されたMMTフォーマットデータの再生処理を実行し、
前記再生処理に際して、再生対象の音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれのデータであるかを示す音声識別情報を、前記データベースファイルから取得し、取得情報に従って音声データの復号処理を実行する情報処理方法。
(18) An information processing method executed by an information processing device.
The information processing device is
It has a data processing unit that executes the reproduction processing of the recorded data of the information recording medium.
The information recording medium is an information recording medium that stores data in which MMT format data is recorded according to the BDAV format or the SPAV format.
The data processing unit
Using the recorded information of the playlist file and the clip information file, which are database files specified in the BDAV format or the SPAV format, the MMT format data recorded in the information recording medium is reproduced.
In the reproduction process, the audio data to be reproduced is
(A) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(B) MPEG4 ALS (LATM / LOAS) coded audio data,
An information processing method for acquiring voice identification information indicating which data (a) or (b) is from the database file and executing a voice data decoding process according to the acquired information.

(19) 情報処理装置において実行する情報処理を実行させるプログラムであり、
前記情報処理装置は、
MMTフォーマットデータを入力し、情報記録媒体に対するデータ記録フォーマットであるBDAVフォーマット、またはSPAVフォーマットに従った記録データを生成するデータ処理部を有し、
前記プログラムは、前記データ処理部に、
情報記録媒体に記録する音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報をBDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルに記録する処理を実行させるプログラム。
(19) A program that executes information processing to be executed in an information processing device.
The information processing device is
It has a data processing unit that inputs MMT format data and generates recorded data according to the BDAV format or SPAV format, which is a data recording format for an information recording medium.
The program is installed in the data processing unit.
The audio data recorded on the information recording medium is
(A) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(B) MPEG4 ALS (LATM / LOAS) coded audio data,
A program for executing a process of recording voice identification information that can identify which of the voice data (a) and (b) is in a database file specified in BDAV format or SPAV format.

(20) 情報処理装置において実行する情報処理を実行させるプログラムであり、
前記情報処理装置は、
情報記録媒体の記録データの再生処理を実行するデータ処理部を有し、
前記情報記録媒体は、MMTフォーマットデータを、BDAVフォーマット、またはSPAVフォーマットに従って記録したデータを格納した情報記録媒体であり、
前記プログラムは、前記データ処理部に、
BDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルであるプレイリストファイルとクリップ情報ファイルの記録情報を利用して、前記情報記録媒体に記録されたMMTフォーマットデータの再生処理を実行させ、
前記再生処理に際して、再生対象の音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれのデータであるかを示す音声識別情報を、前記データベースファイルから取得させ、取得情報に従って音声データの復号処理を行わせるプログラム。
(20) A program that executes information processing to be executed in an information processing device.
The information processing device is
It has a data processing unit that executes the reproduction processing of the recorded data of the information recording medium.
The information recording medium is an information recording medium that stores data in which MMT format data is recorded according to the BDAV format or the SPAV format.
The program is installed in the data processing unit.
Using the recorded information of the playlist file and the clip information file, which are database files specified in the BDAV format or the SPAV format, the reproduction process of the MMT format data recorded on the information recording medium is executed.
In the reproduction process, the audio data to be reproduced is
(A) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(B) MPEG4 ALS (LATM / LOAS) coded audio data,
A program that acquires voice identification information indicating which data (a) or (b) is from the database file, and decodes the voice data according to the acquired information.

また、明細書中において説明した一連の処理はハードウェア、またはソフトウェア、あるいは両者の複合構成によって実行することが可能である。ソフトウェアによる処理を実行する場合は、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれたコンピュータ内のメモリにインストールして実行させるか、あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。例えば、プログラムは記録媒体に予め記録しておくことができる。記録媒体からコンピュータにインストールする他、LAN(Local Area Network)、インターネットといったネットワークを介してプログラムを受信し、内蔵するハードディスク等の記録媒体にインストールすることができる。 Further, the series of processes described in the specification can be executed by hardware, software, or a composite configuration of both. When executing processing by software, install the program that records the processing sequence in the memory in the computer built in the dedicated hardware and execute it, or execute the program on a general-purpose computer that can execute various processing. It can be installed and run. For example, the program can be pre-recorded on a recording medium. In addition to installing the program on a computer from a recording medium, the program can be received via a network such as a LAN (Local Area Network) or the Internet and installed on a recording medium such as a built-in hard disk.

なお、明細書に記載された各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。また、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。 It should be noted that the various processes described in the specification are not only executed in chronological order according to the description, but may also be executed in parallel or individually as required by the processing capacity of the device that executes the processes. Further, in the present specification, the system is a logical set configuration of a plurality of devices, and the devices having each configuration are not limited to those in the same housing.

以上、説明したように、本開示の一実施例の構成によれば、メディア記録MMTフォーマット音声データが、MPEG4 AAC LC音声データか、MPEG4 ALS音声データかを迅速に確認可能とした構成が実現される。
具体的には、例えば、メディアに記録するMMTフォーマット音声データが、MPEG4 AAC LC音声データであるか、MPEG4 ALS音声データであるかを示す音声識別情報を記録したクリップ情報ファイルを生成してメディアに記録する。再生装置は、クリップ情報ファイルに記録された音声識別情報に基づいて、再生対象とする音声データが、MPEG4 AAC LC音声データであるか、MPEG4 ALS音声データであるかを識別し、迅速な復号、再生を行うことができる。
本構成により、メディア記録MMTフォーマット音声データが、MPEG4 AAC LC音声データか、MPEG4 ALS音声データかを迅速に確認可能とした構成が実現される。
As described above, according to the configuration of one embodiment of the present disclosure, a configuration is realized in which it is possible to quickly confirm whether the media recording MMT format audio data is MPEG4 AAC LC audio data or MPEG4 ALS audio data. To.
Specifically, for example, a clip information file recording audio identification information indicating whether the MMT format audio data to be recorded on the media is MPEG4 AAC LC audio data or MPEG4 ALS audio data is generated and stored on the media. Record. The playback device identifies whether the audio data to be reproduced is MPEG4 AAC LC audio data or MPEG4 ALS audio data based on the audio identification information recorded in the clip information file, and rapidly decodes the audio data. Playback can be performed.
With this configuration, it is possible to quickly confirm whether the media recording MMT format audio data is MPEG4 AAC LC audio data or MPEG4 ALS audio data.

20 送信装置
21 放送サーバ
22 データ配信サーバ
30 情報処理装置
31 記録再生装置
32 TV
33 PC
34 携帯端末
40 情報記録媒体(メディア)
41 BD
42 HDD
43 フラッシュメモリ
300 情報処理装置
301 データ入力部
302 ユーザ入力部
303 制御部
304 記憶部
305 デマルチプレクサ
306 記録データ生成部
307 記録部
308 ドライブ
311 字幕データ生成部
312 画像データ生成部
313 音声データ生成部
314 補助情報生成部
315 マルチプレクサ
316 データベースファイル生成部
320 情報記録媒体
400 情報処理装置
401 制御部
402 ユーザ入力部
403 ドライブ
404 記録再生部
405 記憶部
406 再生処理部
407 入出力I/F
411 デマルチプレクサ
412 字幕データ生成部
413 画像データ生成部
414 音声データ生成部
415 補助情報生成部
416 出力データ生成部
510 情報記録媒体
520 出力装置(表示部+スピーカ)
601 CPU
602 ROM
603 RAM
604 バス
605 入出力インタフェース
606 入力部
607 出力部
608 記憶部
609 通信部
610 ドライブ
611 リムーバブルメディア
20 Transmitter 21 Broadcast server 22 Data distribution server 30 Information processing device 31 Recording / playback device 32 TV
33 PC
34 Mobile terminal 40 Information recording medium (media)
41 BD
42 HDD
43 Flash memory 300 Information processing device 301 Data input unit 302 User input unit 303 Control unit 304 Storage unit 305 Demultiplexer 306 Recording data generation unit 307 Recording unit 308 Drive 311 Subtitle data generation unit 312 Image data generation unit 313 Audio data generation unit 314 Auxiliary information generation unit 315 multiplexer 316 database file generation unit 320 information recording medium 400 information processing device 401 control unit 402 user input unit 403 drive 404 recording / playback unit 405 storage unit 406 playback processing unit 407 input / output I / F
411 Demultiplexer 412 Subtitle data generation unit 413 Image data generation unit 414 Audio data generation unit 415 Auxiliary information generation unit 416 Output data generation unit 510 Information recording medium 520 Output device (display unit + speaker)
601 CPU
602 ROM
603 RAM
604 Bus 605 I / O interface 606 Input section 607 Output section 608 Storage section 609 Communication section 610 Drive 611 Removable media

Claims (18)

MMTフォーマットデータを入力し、情報記録媒体に対するデータ記録フォーマットであるBDAVフォーマット、またはSPAVフォーマットに従った記録データを生成するデータ処理部を有し、
前記データ処理部は、
情報記録媒体に記録する音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報をBDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルに記録する処理を実行する情報処理装置。
It has a data processing unit that inputs MMT format data and generates recorded data according to the BDAV format or SPAV format, which is a data recording format for an information recording medium.
The data processing unit
The audio data recorded on the information recording medium is
(A) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(B) MPEG4 ALS (LATM / LOAS) coded audio data,
An information processing device that executes a process of recording voice identification information that can identify which of the voice data (a) and (b) is in a database file specified in BDAV format or SPAV format.
前記データ処理部は、
前記音声識別情報をクリップ情報ファイルに記録する請求項1に記載の情報処理装置。
The data processing unit
The information processing apparatus according to claim 1, wherein the voice identification information is recorded in a clip information file.
前記データ処理部は、
音声データ格納パケットから前記音声識別情報を抽出して、前記データベースファイルに記録する請求項1に記載の情報処理装置。
The data processing unit
The information processing apparatus according to claim 1, wherein the voice identification information is extracted from the voice data storage packet and recorded in the database file.
前記データ処理部は、
音声データ格納パケット内に記録された音声オブジェクトタイプ(audioObjectType)を抽出して、前記音声識別情報として前記データベースファイルに記録する請求項1に記載の情報処理装置。
The data processing unit
The information processing apparatus according to claim 1, wherein the voice object type (audioObjectType) recorded in the voice data storage packet is extracted and recorded in the database file as the voice identification information.
前記データ処理部は、
MMTパッケージテーブル(MPT)から前記音声識別情報を抽出して、前記データベースファイルに記録する請求項1に記載の情報処理装置。
The data processing unit
The information processing apparatus according to claim 1, wherein the voice identification information is extracted from the MMT package table (MPT) and recorded in the database file.
前記データ処理部は、
MMTパッケージテーブル(MPT)に記録されたストリームコンテンツ(stream_content)を抽出して、前記音声識別情報として前記データベースファイルに記録する請求項1に記載の情報処理装置。
The data processing unit
The information processing apparatus according to claim 1, wherein the stream content (stream_content) recorded in the MMT package table (MPT) is extracted and recorded in the database file as the voice identification information.
前記データ処理部は、
前記音声識別情報をクリップ情報ファイルのストリームコーディング情報[StreamCodingInfo]記録領域の同じコーディングタイプ(stream_coding_type)の属性情報記録領域に、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報を記録する請求項1に記載の情報処理装置。
The data processing unit
The voice recognition information is stored in the attribute information recording area of the same coding type (stream_coding_type) in the stream coding information [Stream Coding Info] recording area of the clip information file.
(A) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(B) MPEG4 ALS (LATM / LOAS) coded audio data,
The information processing apparatus according to claim 1, wherein the voice identification information that makes it possible to identify which of the voice data (a) and (b) is.
前記同じコーディングタイプ(stream_coding_type)は、0x11である請求項7に記載の情報処理装置。 The information processing apparatus according to claim 7, wherein the same coding type (stream_coding_type) is 0x11. 情報記録媒体の記録データの再生処理を実行するデータ処理部を有し、
前記情報記録媒体は、MMTフォーマットデータを、BDAVフォーマット、またはSPAVフォーマットに従って記録したデータを格納した情報記録媒体であり、
前記データ処理部は、
BDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルであるプレイリストファイルとクリップ情報ファイルの記録情報を利用して、前記情報記録媒体に記録されたMMTフォーマットデータの再生処理を実行する構成であり、
前記データ処理部は、
再生対象の音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれのデータであるかを示す音声識別情報を、前記データベースファイルから取得し、取得情報に従って音声データの復号処理を実行する情報処理装置。
It has a data processing unit that executes the reproduction processing of the recorded data of the information recording medium.
The information recording medium is an information recording medium that stores data in which MMT format data is recorded according to the BDAV format or the SPAV format.
The data processing unit
It is configured to execute the reproduction process of the MMT format data recorded on the information recording medium by using the recorded information of the playlist file and the clip information file which are the database files specified in the BDAV format or the SPAV format.
The data processing unit
The audio data to be played is
(A) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(B) MPEG4 ALS (LATM / LOAS) coded audio data,
An information processing device that acquires voice identification information indicating which data (a) or (b) is from the database file and executes voice data decoding processing according to the acquired information.
前記データ処理部は、
前記音声識別情報をクリップ情報ファイルから取得する請求項9に記載の情報処理装置。
The data processing unit
The information processing apparatus according to claim 9, wherein the voice identification information is acquired from the clip information file.
前記データ処理部は、
前記音声識別情報をクリップ情報ファイルのストリームコーディング情報[StreamCodingInfo]記録領域の同じコーディングタイプ(stream_coding_type)の属性情報記録領域から取得する請求項9に記載の情報処理装置。
The data processing unit
The information processing apparatus according to claim 9, wherein the voice identification information is acquired from an attribute information recording area of the same coding type (stream_coding_type) in the stream coding information [StreamCodingInfo] recording area of the clip information file.
前記同じコーディングタイプ(stream_coding_type)は、0x11である請求項11に記載の情報処理装置。 The information processing apparatus according to claim 11, wherein the same coding type (stream_coding_type) is 0x11. 前記データ処理部は、
前記データベースファイルから取得した音声識別情報に基づいて、
再生可能な音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)の2種類のデータであると判定した場合、
再生対象とする音声データをユーザに選択させる表示情報を出力する請求項9に記載の情報処理装置。
The data processing unit
Based on the voice recognition information obtained from the database file,
Playable audio data
(A) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(B) MPEG4 ALS (LATM / LOAS) coded audio data,
When it is determined that the data are the two types of data (a) and (b) above,
The information processing device according to claim 9, which outputs display information that causes the user to select audio data to be reproduced.
前記データ処理部は、
前記表示情報に対するユーザ選択情報を入力し、入力した選択情報に従って、再生対象とする音声データを選択する請求項13に記載の情報処理装置。
The data processing unit
The information processing apparatus according to claim 13, wherein user selection information for the display information is input, and audio data to be reproduced is selected according to the input selection information.
情報処理装置において実行する情報処理方法であり、
前記情報処理装置は、
MMTフォーマットデータを入力し、情報記録媒体に対するデータ記録フォーマットであるBDAVフォーマット、またはSPAVフォーマットに従った記録データを生成するデータ処理部を有し、
前記データ処理部が、
情報記録媒体に記録する音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報をBDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルに記録する処理を実行する情報処理方法。
It is an information processing method executed in an information processing device.
The information processing device is
It has a data processing unit that inputs MMT format data and generates recorded data according to the BDAV format or SPAV format, which is a data recording format for an information recording medium.
The data processing unit
The audio data recorded on the information recording medium is
(A) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(B) MPEG4 ALS (LATM / LOAS) coded audio data,
An information processing method for executing a process of recording voice identification information that can identify which of the voice data (a) and (b) is in a database file specified in BDAV format or SPAV format.
情報処理装置において実行する情報処理方法であり、
前記情報処理装置は、
情報記録媒体の記録データの再生処理を実行するデータ処理部を有し、
前記情報記録媒体は、MMTフォーマットデータを、BDAVフォーマット、またはSPAVフォーマットに従って記録したデータを格納した情報記録媒体であり、
前記データ処理部が、
BDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルであるプレイリストファイルとクリップ情報ファイルの記録情報を利用して、前記情報記録媒体に記録されたMMTフォーマットデータの再生処理を実行し、
前記再生処理に際して、再生対象の音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれのデータであるかを示す音声識別情報を、前記データベースファイルから取得し、取得情報に従って音声データの復号処理を実行する情報処理方法。
It is an information processing method executed in an information processing device.
The information processing device is
It has a data processing unit that executes the reproduction processing of the recorded data of the information recording medium.
The information recording medium is an information recording medium that stores data in which MMT format data is recorded according to the BDAV format or the SPAV format.
The data processing unit
Using the recorded information of the playlist file and the clip information file, which are database files specified in the BDAV format or the SPAV format, the MMT format data recorded in the information recording medium is reproduced.
In the reproduction process, the audio data to be reproduced is
(A) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(B) MPEG4 ALS (LATM / LOAS) coded audio data,
An information processing method for acquiring voice identification information indicating which data (a) or (b) is from the database file and executing a voice data decoding process according to the acquired information.
情報処理装置において実行する情報処理を実行させるプログラムであり、
前記情報処理装置は、
MMTフォーマットデータを入力し、情報記録媒体に対するデータ記録フォーマットであるBDAVフォーマット、またはSPAVフォーマットに従った記録データを生成するデータ処理部を有し、
前記プログラムは、前記データ処理部に、
情報記録媒体に記録する音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれの音声データであるかを識別可能とした音声識別情報をBDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルに記録する処理を実行させるプログラム。
It is a program that executes information processing to be executed in an information processing device.
The information processing device is
It has a data processing unit that inputs MMT format data and generates recorded data according to the BDAV format or SPAV format, which is a data recording format for an information recording medium.
The program is installed in the data processing unit.
The audio data recorded on the information recording medium is
(A) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(B) MPEG4 ALS (LATM / LOAS) coded audio data,
A program for executing a process of recording voice identification information that can identify which of the voice data (a) and (b) is in a database file specified in BDAV format or SPAV format.
情報処理装置において実行する情報処理を実行させるプログラムであり、
前記情報処理装置は、
情報記録媒体の記録データの再生処理を実行するデータ処理部を有し、
前記情報記録媒体は、MMTフォーマットデータを、BDAVフォーマット、またはSPAVフォーマットに従って記録したデータを格納した情報記録媒体であり、
前記プログラムは、前記データ処理部に、
BDAVフォーマット、またはSPAVフォーマット規定のデータベースファイルであるプレイリストファイルとクリップ情報ファイルの記録情報を利用して、前記情報記録媒体に記録されたMMTフォーマットデータの再生処理を実行させ、
前記再生処理に際して、再生対象の音声データが、
(a)MPEG4 AAC LC(LATM/LOAS)符号化音声データ、
(b)MPEG4 ALS(LATM/LOAS)符号化音声データ、
上記(a),(b)いずれのデータであるかを示す音声識別情報を、前記データベースファイルから取得させ、取得情報に従って音声データの復号処理を行わせるプログラム。
It is a program that executes information processing to be executed in an information processing device.
The information processing device is
It has a data processing unit that executes the reproduction processing of the recorded data of the information recording medium.
The information recording medium is an information recording medium that stores data in which MMT format data is recorded according to the BDAV format or the SPAV format.
The program is installed in the data processing unit.
Using the recorded information of the playlist file and the clip information file, which are database files specified in the BDAV format or the SPAV format, the reproduction process of the MMT format data recorded on the information recording medium is executed.
In the reproduction process, the audio data to be reproduced is
(A) MPEG4 AAC LC (LATM / LOAS) coded audio data,
(B) MPEG4 ALS (LATM / LOAS) coded audio data,
A program that acquires voice identification information indicating which data (a) or (b) is from the database file, and decodes the voice data according to the acquired information.
JP2019519529A 2017-05-24 2018-04-25 Information processing equipment, information recording media, information processing methods, and programs Active JP7070564B2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2017102256 2017-05-24
JP2017102256 2017-05-24
PCT/JP2018/016828 WO2018216424A1 (en) 2017-05-24 2018-04-25 Information processing device, information recording medium, information processing method, and program

Publications (2)

Publication Number Publication Date
JPWO2018216424A1 JPWO2018216424A1 (en) 2020-03-26
JP7070564B2 true JP7070564B2 (en) 2022-05-18

Family

ID=64395649

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019519529A Active JP7070564B2 (en) 2017-05-24 2018-04-25 Information processing equipment, information recording media, information processing methods, and programs

Country Status (2)

Country Link
JP (1) JP7070564B2 (en)
WO (1) WO2018216424A1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013114716A1 (en) 2012-02-03 2013-08-08 ソニー株式会社 Information processing device, information recording medium and information processing method, and program
WO2017043378A1 (en) 2015-09-07 2017-03-16 ソニー株式会社 Transmission device, transmission method, reception device, and reception method
WO2018016294A1 (en) 2016-07-20 2018-01-25 ソニー株式会社 Information processing device, information processing method, and program
WO2018135258A1 (en) 2017-01-17 2018-07-26 ソニー株式会社 Information processing device, information recording medium, information processing method, and program
JP2018133124A (en) 2017-02-15 2018-08-23 パナソニックIpマネジメント株式会社 Recording device, recording method and recording medium

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005198143A (en) * 2004-01-09 2005-07-21 Matsushita Electric Ind Co Ltd Device and method for recording and reproducing information

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013114716A1 (en) 2012-02-03 2013-08-08 ソニー株式会社 Information processing device, information recording medium and information processing method, and program
WO2017043378A1 (en) 2015-09-07 2017-03-16 ソニー株式会社 Transmission device, transmission method, reception device, and reception method
WO2018016294A1 (en) 2016-07-20 2018-01-25 ソニー株式会社 Information processing device, information processing method, and program
WO2018135258A1 (en) 2017-01-17 2018-07-26 ソニー株式会社 Information processing device, information recording medium, information processing method, and program
JP2018133124A (en) 2017-02-15 2018-08-23 パナソニックIpマネジメント株式会社 Recording device, recording method and recording medium

Also Published As

Publication number Publication date
JPWO2018216424A1 (en) 2020-03-26
WO2018216424A1 (en) 2018-11-29

Similar Documents

Publication Publication Date Title
JP7031589B2 (en) Information processing equipment, information processing methods, and programs
JP7033537B2 (en) Information processing equipment, information processing methods, and programs
JP7074068B2 (en) Information processing equipment, information recording media, information processing methods, and programs
JP6863271B2 (en) Information processing equipment, information recording media, information processing methods, and programs
JP7070432B2 (en) Information processing equipment, information recording media, information processing methods, and programs
JP7147755B2 (en) Information processing device, information recording medium, information processing method, and program
JP7056566B2 (en) Information processing equipment, information processing methods, and programs
JP7215415B2 (en) Information processing device, information recording medium, information processing method, and program
JP7014157B2 (en) Information processing equipment, information recording media, information processing methods, and programs
JP7024787B2 (en) Information processing equipment, information processing methods, and programs
JP7070564B2 (en) Information processing equipment, information recording media, information processing methods, and programs
JP7070433B2 (en) Information processing equipment, information recording media, information processing methods, and programs
WO2018173780A1 (en) Information processing device, information recording medium, information processing method, and program
WO2016167082A1 (en) Information processing device, information recording medium, information processing method, and program
KR101110902B1 (en) Information recording medium, multiplexer, and decoder

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210315

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220323

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220405

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220418

R151 Written notification of patent or utility model registration

Ref document number: 7070564

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151