WO2016079925A1 - 記録媒体、再生方法、および再生装置 - Google Patents

記録媒体、再生方法、および再生装置 Download PDF

Info

Publication number
WO2016079925A1
WO2016079925A1 PCT/JP2015/005327 JP2015005327W WO2016079925A1 WO 2016079925 A1 WO2016079925 A1 WO 2016079925A1 JP 2015005327 W JP2015005327 W JP 2015005327W WO 2016079925 A1 WO2016079925 A1 WO 2016079925A1
Authority
WO
WIPO (PCT)
Prior art keywords
stream
video
information
luminance
playback
Prior art date
Application number
PCT/JP2015/005327
Other languages
English (en)
French (fr)
Inventor
洋 矢羽田
和寛 持永
Original Assignee
パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2015175197A external-priority patent/JP2016100039A/ja
Application filed by パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ filed Critical パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ
Priority to CN201580030305.XA priority Critical patent/CN106463150B/zh
Priority to EP15860717.6A priority patent/EP3223280B1/en
Publication of WO2016079925A1 publication Critical patent/WO2016079925A1/ja
Priority to US15/589,021 priority patent/US10102879B2/en
Priority to US15/698,799 priority patent/US9997202B2/en
Priority to US16/127,507 priority patent/US10236030B2/en
Priority to US16/255,933 priority patent/US10553253B2/en
Priority to US16/714,132 priority patent/US10770115B2/en
Priority to US16/986,980 priority patent/US11138999B2/en
Priority to US16/987,036 priority patent/US11133034B2/en

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/32Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier
    • G11B27/327Table of contents
    • G11B27/329Table of contents on a disc [VTOC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/93Regeneration of the television signal or of selected parts thereof

Definitions

  • the present disclosure relates to a recording medium on which an encoded video stream is recorded, a reproducing method for reproducing the video stream, and a reproducing apparatus.
  • Patent Document 1 Conventionally, a technique related to DVD has been disclosed (see, for example, Patent Document 1).
  • a recording medium includes a first luminance image expressed by luminance of a first dynamic range, and a second luminance range expressed by luminance of a second dynamic range wider than the first dynamic range.
  • a stream file including two luminance images and a playlist file for controlling the reproduction of the stream file are recorded, and the playlist file includes a combination of elementary streams that can be simultaneously reproduced in the same reproduction section.
  • First and second combination information are described, and the first combination information lists elementary streams that can be played back simultaneously with the first luminance video in the playback section, and the second combination information is listed.
  • the information includes the second luminance video in the playback section.
  • Elementary streams that can be produced are listed, and in the same playback section, the number of elementary streams of a predetermined type listed in the first combination information and the predetermined list listed in the second combination information, respectively. Is equal to the number of elementary streams of the type.
  • FIG. 1 is a diagram showing the structure of an SD-DVD.
  • FIG. 2 is a schematic diagram illustrating navigation information embedded in an MPEG stream that is AV data.
  • FIG. 3 is a schematic diagram showing the configuration of a VOB in a DVD.
  • FIG. 4 is a diagram showing a data hierarchy of the BD-ROM.
  • FIG. 5 is a diagram showing the structure of logical data recorded on the BD-ROM.
  • FIG. 6 is a diagram showing an outline of a basic configuration of a BD-ROM player that reproduces a BD-ROM.
  • FIG. 7 is a detailed block diagram of the configuration of the player shown in FIG.
  • FIG. 8 is a diagram showing an application space of the BD-ROM.
  • FIG. 9 is a diagram showing the structure of an MPEG stream (VOB).
  • VOB MPEG stream
  • FIG. 10 is a diagram showing the structure of a pack in the MPEG stream.
  • FIG. 11 is a diagram for explaining a relationship between AV data and a player configuration.
  • FIG. 12 is a diagram for explaining a VOB data continuous supply model using a track buffer.
  • FIG. 13 shows the internal structure of the VOB management information file.
  • FIG. 14 is a diagram for explaining the details of the VOBU information.
  • FIG. 15 is a diagram for explaining an address information acquisition method using a time map.
  • FIG. 16 is a diagram showing the configuration of a playlist.
  • FIG. 17 is a diagram showing the configuration of the event handler table.
  • FIG. 18 is a diagram showing BD. It is a figure which shows the structure of INFO.
  • FIG. 19 is a diagram showing the configuration of the global event handler table.
  • FIG. 20 is a diagram illustrating an example of a time event.
  • FIG. 21 is a diagram illustrating an example of a user event by a user's menu operation.
  • FIG. 22 is a diagram illustrating an example of a global event.
  • FIG. 23 is a diagram for explaining a functional configuration of the program processor.
  • FIG. 24 is a diagram showing a list of system parameters (SPRM).
  • FIG. 25 is a diagram showing an example of a program in an event handler related to control of a menu screen having two selection buttons.
  • FIG. 26 is a diagram illustrating an example of a program in an event handler relating to a menu selection user event.
  • FIG. 27 is a flowchart showing a flow of basic processing of AV data reproduction in the BD-ROM player.
  • FIG. 27 is a flowchart showing a flow of basic processing of AV data reproduction in the BD-ROM player.
  • FIG. 28 is a flowchart showing the flow of processing from the start of playlist playback to the end of VOB playback in the BD-ROM player.
  • FIG. 29A is a flowchart showing a process flow related to a time event in the BD-ROM player
  • FIG. 29B is a flowchart showing a process flow related to a user event in the BD-ROM player. is there.
  • FIG. 30 is a flowchart showing the processing flow of caption data in the BD-ROM player.
  • FIG. 31 is a diagram for explaining the arrangement of NAL units.
  • FIG. 32 is a diagram for explaining an example of MPEG-2 TS multiplexing of an HDR video stream.
  • FIG. 33 is a diagram for explaining an example of MPEG-2 TS multiplexing of an HDR video stream.
  • FIG. 34 is a diagram for explaining an example of MPEG-2 TS multiplexing of an HDR video stream.
  • FIG. 35 is a diagram for explaining an example of MPEG-2 TS multiplexing of an HDR video stream.
  • FIG. 36 is a diagram for explaining an example of MPEG-2 TS multiplexing of an HDR video stream.
  • FIG. 37 is a diagram for explaining an example of MPEG-2 TS multiplexing of an HDR video stream.
  • FIG. 38 is a diagram illustrating an example of MPEG-2 TS multiplexing of an HDR video stream.
  • FIG. 39 is a diagram illustrating the structure of a caption stream.
  • FIG. 40 is a diagram illustrating the relationship of parameters used for subtitle display control.
  • FIG. 41 is a diagram for explaining management information and its contents.
  • FIG. 42 shows the data structure of the database file.
  • FIG. 43 is a diagram for explaining synchronized playback of an HDR video stream and its extended video stream.
  • FIG. 44 is a diagram for explaining synchronized playback of an HDR video stream and its extended video stream.
  • FIG. 45 is a diagram for explaining a decoder model of an HDR video stream.
  • FIG. 46 is a diagram showing a method for registering each stream in the database file.
  • FIG. 47 is a flowchart of player playback processing.
  • FIG. 48 is a diagram for explaining a problem when a disc is played back in a different playback environment.
  • FIG. 49 is a diagram showing details of the data structure of Combi ().
  • FIG. 50 is a diagram illustrating details of the data structure of CombiExt ().
  • FIG. 51 is a diagram showing YYY.NET including both HDR video and SDR video stream sets. It is a figure which shows VOBI.
  • a typical information recording medium on which video data is recorded is a DVD (hereinafter also referred to as “Standard Definition (SD) -DVD”).
  • SD Standard Definition
  • a conventional DVD will be described below.
  • FIG. 1 is a diagram showing the structure of an SD-DVD. As shown in the lower part of FIG. 1, a logical address space is provided on the DVD disk from lead-in to lead-out. In the logical address space, volume information of the file system is recorded from the head, and subsequently application data such as video and audio is recorded.
  • the file system is a mechanism for managing data defined by standards such as ISO9660 and Universal Disc Format (UDF), and is a mechanism for expressing data on a disk in units called directories or files.
  • standards such as ISO9660 and Universal Disc Format (UDF)
  • UDF Universal Disc Format
  • UDF and ISO9660 file systems are used. Together, they are also called “UDF bridges”.
  • the recorded data can be read out by either UDF or ISO9660 file system driver.
  • the DVD handled here is a ROM disk for package media and cannot be physically written.
  • the data recorded on the DVD can be viewed as a directory or file as shown in the upper left of FIG. 1 through the UDF bridge.
  • a directory called “VIDEO_TS” is placed directly under the root directory (“ROOT” in FIG. 1), and DVD application data is recorded therein.
  • Application data is recorded as a plurality of files, and there are the following types of files as main files.
  • VIDEO_TS IFO disc playback control information file VTS_01_0.
  • IFO is an extension indicating that the reproduction control information is recorded
  • VOB is an extension indicating that the MPEG stream that is AV data is recorded.
  • the playback control information is information for realizing interactivity (technique for dynamically changing playback according to a user operation) adopted by DVD, information attached to AV data such as metadata, and the like. That's it.
  • reproduction control information is sometimes referred to as navigation information.
  • the playback control information file includes “VIDEO_TS.IFO” for managing the entire disc and “VTS — 01 — 0.IFO” which is playback control information for each video title set.
  • a DVD can record a plurality of titles, in other words, a plurality of different movies and music pieces on a single disc.
  • “01” in the file name body indicates the number of the video title set. For example, in the case of the video title set # 2, “VTS — 02 — 0.IFO”.
  • the upper right part of FIG. 1 is a DVD navigation space in the DVD application layer, which is a logical structure space in which the playback control information described above is expanded.
  • Information in “VIDEO_TS.IFO” is stored in the DVD navigation space as VIDEO Manager Information (VMGI), and “VTS — 01 — 0.IFO”, or playback control information existing for each other video title set is stored in the Video Title Set Information (VTSI). Be expanded.
  • VIDEO_TS.IFO VIDEO Manager Information
  • VTSI Video Title Set Information
  • Program Chain Information which is information of a playback sequence called Program Chain (PGC) is described.
  • the PGCI is composed of a set of cells and a kind of programming information called a command.
  • the cell itself is information for designating a part or all of a VOB (which is an abbreviation of Video Object, indicating an MPEG stream), and the reproduction of the cell means that the section designated by the cell of the VOB is reproduced. I mean.
  • the command is processed by a DVD virtual machine, and is similar to, for example, Java (registered trademark) Script executed on a browser that displays a web page.
  • Java (registered trademark) Script controls windows and browsers (for example, opens a new browser window) in addition to logical operations
  • DVD commands play AV titles in addition to logical operations. It differs in that it only performs control, for example, specifying the chapter to be played back.
  • the Cell has VOB start and end addresses (logical addresses) recorded on the disc as its internal information, and the player reads data using the VOB start and end address information described in the Cell. Execute playback.
  • FIG. 2 is a schematic diagram illustrating navigation information embedded in an MPEG stream that is AV data.
  • buttons appear on the menu screen, and each button defines a process when the button is selected and executed.
  • buttons on the menu screen are selected on the menu screen (the translucent color is overlaid on the selection button so that the button is highlighted to indicate to the user that the button is selected), and the user
  • the up / down / left / right keys on the remote control can be used to move the selected button to any of the up / down / left / right buttons.
  • NV_PCK includes highlight color information and individual button information.
  • highlight color information color palette information is described, and a semi-transparent color of the highlight displayed on the overlay is designated.
  • the button information includes rectangular area information that is position information of each button, movement information from the button to another button (designation of a destination button corresponding to each of the user's up / down / left / right key operations), and button command information. (Command executed when the button is determined).
  • the highlight on the menu screen is created as an overlay image as shown in the upper right part of FIG.
  • the overlay image is obtained by adding the color palette information color to the rectangular area information of the button information. This overlay image is combined with the background image shown in the right part of FIG. 2 and displayed on the screen.
  • the DVD has a menu screen.
  • the reason why part of the navigation data is embedded in the stream using NV_PCK is as follows.
  • the menu information is dynamically updated in synchronization with the stream, for example, the menu screen is displayed only during the course of 5 to 10 minutes during movie playback, and processing that is likely to cause synchronization timing can be realized without any problem. It is for doing so.
  • NV_PCK stores information for supporting special playback, and smoothly decodes and plays back AV data during non-normal playback such as fast-forward and rewind during DVD playback. This is to improve user operability.
  • FIG. 3 is a schematic diagram showing the configuration of a VOB in a DVD.
  • data such as video, audio, captions ((1) in FIG. 3) is packetized and packed based on the MPEG system (ISO / IEC13818-1) standard ((2) in FIG. 3). These are multiplexed into one MPEG program stream ((3) in FIG. 3).
  • MPEG system ISO / IEC13818-1
  • NV_PCK including a button command for realizing interactive is also multiplexed together.
  • individual data to be multiplexed is a bit string based on the decoding order, but between the multiplexed data, that is, between video, audio, and subtitles, it is not necessarily the playback order.
  • the bit string is not formed based on the decoding order.
  • the MPEG system stream decoder model (Fig. 3 (4), generally called System Target Decoder or STD) has a decoder buffer corresponding to each elementary stream after demultiplexing, and by the decoding timing It comes from temporarily accumulating data.
  • the decoder buffer has a different size for each elementary stream, and has 232 kB for video, 4 kB for audio, and 52 kB for subtitles.
  • subtitle data multiplexed side by side with video data is not necessarily decoded at the same timing.
  • Blu-ray (registered trademark) Disc Blu-ray (registered trademark) Disc
  • Blu-ray (registered trademark) Disc is also referred to as BD or BD-ROM.
  • video information such as 4K (video information having a resolution of 3840 ⁇ 2160 pixels) or HDR (high luminance video information generally called High Dynamic Range) can be stored in the BD.
  • video information such as 4K (video information having a resolution of 3840 ⁇ 2160 pixels) or HDR (high luminance video information generally called High Dynamic Range)
  • HDR high luminance video information generally called High Dynamic Range
  • SDR Standard Dynamic Range
  • a BD in which both HDR and SDR are recorded in order to play back content on both a HDR-compatible TV and a non-HDR compatible TV (compatible with SDR only).
  • a BD when subtitles or graphics with standard luminance are superimposed on high-luminance video, the luminance of the subtitles or graphics is insufficient, so that stream reproduction control is performed according to each of SDR and HDR. Is called.
  • control for playing back HDR video is performed, and in a playback environment that does not support HDR, control for playing back SDR video is performed.
  • the dynamic range of the brightness of each of the video, subtitles, and menus differs between the HDR-compatible playback environment and the HDR-non-compatible playback environment.
  • subtitles are played back in an HDR-compatible playback environment.
  • the subtitles are not played back in a non-HDR compatible playback environment, a different viewing experience is provided to the user in addition to viewing with respect to luminance.
  • the language of the subtitles is different, for example, Japanese and English, a different viewing experience is provided to the user.
  • the present inventor examined the following improvement measures in order to solve the above problems.
  • a recording medium includes a first luminance image expressed by luminance of a first dynamic range, and a second luminance range expressed by luminance of a second dynamic range wider than the first dynamic range.
  • a stream file including two luminance images and a playlist file for controlling the reproduction of the stream file are recorded, and the playlist file includes a combination of elementary streams that can be simultaneously reproduced in the same reproduction section.
  • First and second combination information are described, and the first combination information lists elementary streams that can be played back simultaneously with the first luminance video in the playback section, and the second combination information is listed.
  • the information includes the second luminance video in the playback section.
  • Elementary streams that can be produced are listed, and in the same playback section, the number of elementary streams of a predetermined type listed in the first combination information and the predetermined list listed in the second combination information, respectively. Is equal to the number of elementary streams of the type.
  • the first luminance image is, for example, SDR video
  • the second luminance image is, for example, HDR video.
  • the stream file is, for example, a VOB stream file.
  • the first and second combination information is, for example, CombiExt_for_Cell () and Combi (), respectively.
  • the number of elementary streams of the same type is equal. Therefore, for example, when the first luminance video is reproduced, an elementary stream of the same type as the elementary stream reproduced at the same time as the second luminance video can be reproduced at the same time as the first luminance video. That is, the same type of elementary stream can be played back in a playback environment corresponding to the second luminance video (HDR video) or in a playback environment not compatible with the second luminance video (HDR video). As a result, the same viewing experience can be provided to the user regardless of the reproduction environment other than viewing with respect to luminance, and confusion given to the user can be suppressed.
  • the M elementary streams (M is an integer equal to or greater than 1) enumerated in the first combination information and the second combination information are enumerated in the predetermined combination information.
  • the attributes of the same N (N is an arbitrary integer equal to or greater than 1 and equal to or less than M) th elementary streams of the M predetermined types of elementary streams may be the same.
  • the predetermined type of elementary stream is a subtitle stream
  • the attribute is a subtitle language.
  • the program can display a caption in a desired language (for example, Japanese) on the display without understanding which of the first and second combination information is being reproduced. That is, regardless of whether the first or second combination information is being played, the program can display, for example, Japanese subtitles by designating the Nth subtitle stream.
  • a desired language for example, Japanese
  • the predetermined type of elementary stream may be a menu stream
  • the attribute may be a menu language
  • the program can display a menu in a desired language (for example, Japanese) on the display without understanding which of the first and second combination information is being reproduced. That is, regardless of whether the first or second combination information is being reproduced, the program can display, for example, a Japanese menu if the Nth menu stream is designated.
  • a desired language for example, Japanese
  • the predetermined type of elementary stream may be an audio stream
  • the attributes may be an audio encoding method, an audio channel number, an audio sampling frequency, and an audio language.
  • the program can reproduce the sound such as a desired encoding method and the number of channels without understanding which one of the first and second combination information is being reproduced. That is, regardless of whether the first and second combination information is being reproduced, if the program designates the Nth audio stream, the program can reproduce audio such as a desired encoding method and the number of channels. it can.
  • a playback device is a playback device that reads and plays a stream from a recording medium, and the recording medium includes a first luminance image expressed by luminance of a first dynamic range.
  • a stream file including a second luminance image expressed by a luminance of a second dynamic range wider than the first dynamic range, and a playlist file for controlling reproduction of the stream file In the playlist file, first and second combination information indicating a combination of elementary streams that can be simultaneously reproduced in the same reproduction section is described, and the first combination information includes the first combination information in the reproduction section.
  • Elementary streams that can be played simultaneously with the first luminance video are listed.
  • the second combination information elementary streams that can be reproduced at the same time as the second luminance video are listed in the reproduction section, and are listed in the first combination information in the same reproduction section.
  • the number of the predetermined types of elementary streams is equal to the number of the predetermined types of elementary streams listed in the second combination information, and the playback device displays the first luminance video.
  • any elementary stream listed in the first combination information of the playlist file is read and reproduced simultaneously with the first luminance image, and the second luminance image is reproduced.
  • any elementist listed in the second combination information of the playlist file It reads over arm, at the same time to play and the second luminance image.
  • the reproducing device when reproducing the first luminance video, reproduces the same type of elementary stream as the elementary stream reproduced simultaneously with the second luminance image simultaneously with the first luminance image. be able to.
  • the reproducing device when reproducing the first luminance video, reproduces the same type of elementary stream as the elementary stream reproduced simultaneously with the second luminance image simultaneously with the first luminance image.
  • the M elementary streams (M is an integer equal to or greater than 1) enumerated in the first combination information and the second combination in the playback section.
  • the attributes of the same N (N is an arbitrary integer not less than 1 and not more than M) elementary streams of the M predetermined types of elementary streams listed in the information are the same, and the playback device By specifying the Nth, an element of the same type and the same attribute is used both when the first luminance image is reproduced and when the second luminance image is reproduced. You may play a mental stream.
  • a recording medium such as an apparatus, a method, a system, an integrated circuit, a computer program, or a computer-readable CD-ROM, and the system, method, integrated circuit
  • the present invention may be realized by any combination of computer programs or recording media.
  • the embodiment closest to the invention according to claim 1 of the present application is the embodiment 2.
  • the basic configuration of the information recording medium and the like in the embodiment 2 will be described.
  • the first embodiment will be described first.
  • FIG. 4 is a diagram showing a data hierarchy of the BD-ROM.
  • BD-ROM 104 which is a disk medium
  • AV data 103 there is AV data 103
  • BD management information 102 such as management information and AV playback sequence related to AV data
  • BD playback program 101 that realizes interactive processing. It is recorded.
  • the BD-ROM will be described focusing on the AV application for reproducing AV contents such as movies.
  • the BD-ROM is recorded for computer use like a CD-ROM or DVD-ROM. Of course, it can also be used as a medium.
  • FIG. 5 is a diagram showing the structure of logical data recorded in the BD-ROM 104 described above.
  • the BD-ROM 104 has a recording area that spirals from the inner periphery to the outer periphery like other optical discs such as DVDs and CDs, and records logical data between the inner lead-in and outer lead-out. It has a logical address space that can be created.
  • BCA Burst Cutting Area
  • file system information (volume).
  • a file system is a mechanism for managing data defined by standards such as UDF and ISO 9660 as described in the prior art.
  • Logical data recorded in the same way as a normal PC is stored in a directory and file structure. It is possible to read by using.
  • the directory and file structure on the BD-ROM 104 is a BDVIDEO directory placed directly under the root directory (ROOT).
  • This directory is a directory in which data such as AV data and management information handled by the BD-ROM (BD playback program 101, BD management information 102, AV data 103 shown in FIG. 4) is recorded.
  • BD. INFO fixed file name This is one of “BD management information” and is a file in which information related to the entire BD-ROM is recorded. The BD-ROM player first reads this file.
  • BD. PROG fixed file name It is one of “BD playback programs” and is a file in which programs related to the entire BD-ROM are recorded.
  • XXX. PL (XXX” is variable, extension “PL” is fixed) It is one of “BD management information”, and is a file in which play list information for recording a scenario is recorded. I have one file per playlist.
  • XXX. PROG (“XXX” is variable, extension “PROG” is fixed) It is one of “BD playback programs” and is a file in which a program for each playlist described above is recorded. Correspondence with a playlist is identified by a file body name (“XXX” matches).
  • VOB YYY.
  • VOB VOB
  • YYY. VOBI (“YYY” is variable, extension “VOBI” is fixed) This is one of “BD management information” and is a file in which management information related to VOB as AV data is recorded. The correspondence with the VOB is identified by the file body name (“YYY” matches).
  • PNG ZZZ.
  • W3C World Wide Web Consortium
  • FIG. 6 is a diagram showing an outline of a basic configuration of a BD-ROM player that reproduces the BD-ROM 104.
  • the data on the BD-ROM 104 is read through the optical pickup 202.
  • the read data is recorded in a dedicated memory according to the type of each data.
  • the BD playback program (“BD.PROG” or “XXX.PROG” file) is stored in the program recording memory 203, and the BD management information (“BD.INFO”, “XXX.PL” or “YYY.VOBI” file) is managed information.
  • AV data (“YYY.VOB” or “ZZZ.PNG” file) is recorded in the recording memory 204 in the AV recording memory 205, respectively.
  • the BD playback program recorded in the program recording memory 203 is processed by the program processing unit 206.
  • the BD management information recorded in the management information recording memory 204 is processed by the management information processing unit 207.
  • the AV data recorded in the AV recording memory 205 is processed by the presentation processing unit 208.
  • the program processing unit 206 receives event information such as information on playlists to be reproduced and program execution timing from the management information processing unit 207, and processes the program. In addition, it is possible to dynamically change the play list to be played back by the program, and in this case, it is realized by sending a play list play command after change to the management information processing unit 207.
  • the program processing unit 206 further receives an event from the user, for example, a request from a remote controller operated by the user, and executes an execution process when there is a program corresponding to the user event.
  • the management information processing unit 207 receives an instruction from the program processing unit 206 and analyzes the playlist corresponding to the instruction and VOB management information corresponding to the playlist. Furthermore, the presentation processing unit 208 is instructed to reproduce the AV data to be reproduced.
  • the management information processing unit 207 receives the reference time information from the presentation processing unit 208, and instructs the presentation processing unit 208 to stop AV data reproduction based on the time information. Furthermore, an event indicating the program execution timing is generated for the program processing unit 206.
  • the presentation processing unit 208 has a decoder corresponding to video, audio, and subtitle data, and decodes and outputs AV data in accordance with an instruction from the management information processing unit 207. Video data and subtitle data are drawn on each dedicated plane after decoding.
  • video data is drawn on the video plane 210
  • image data such as caption data is drawn on the image plane 209.
  • the composition processing of the video drawn on the two planes is performed by the composition processing unit 211 and output to a display device such as a TV.
  • the BD-ROM player has a configuration based on the data structure recorded in the BD-ROM 104 shown in FIG.
  • FIG. 7 is a detailed block diagram of the configuration of the player shown in FIG.
  • Correspondence between each component shown in FIG. 6 and each component shown in FIG. 7 is as follows.
  • the AV recording memory 205 corresponds to the image memory 308 and the track buffer 309.
  • the program processing unit 206 corresponds to a program processor 302 and a UO (User Operation) manager 303.
  • the management information processing unit 207 corresponds to the scenario processor 305 and the presentation controller 306.
  • the presentation processing unit 208 corresponds to the clock 307, the demultiplexer 310, the image processor 311, the video processor 312, and the sound processor 313.
  • the VOB data (MPEG stream) read from the BD-ROM 104 is recorded in the track buffer 309, and the image data (PNG) is recorded in the image memory 308.
  • the demultiplexer 310 extracts the VOB data recorded in the track buffer 309 based on the time obtained from the clock 307. Further, the video data included in the VOB data is sent to the video processor 312 and the audio data is sent to the sound processor 313.
  • the video processor 312 and the sound processor 313 are each composed of a decoder buffer and a decoder as defined by the MPEG system standard. That is, the video and audio data sent from the demultiplexer 310 are temporarily recorded in the respective decoder buffers and decoded by the individual decoders according to the clock 307.
  • the PNG data recorded in the image memory 308 has the following two processing methods.
  • the presentation controller 306 instructs the decoding timing.
  • the scenario processor 305 In order for the scenario processor 305 to receive the time information from the clock 307 once and to display appropriate subtitles, when the subtitle display time (start and end) is reached, the presentation controller 306 is instructed to display / hide subtitles. .
  • the image processor 311 Upon receiving the decode / display instruction from the presentation controller 306, the image processor 311 extracts the corresponding PNG data from the image memory 308, decodes it, and draws it on the image plane 209.
  • the program processor 302 instructs the decoding timing.
  • the time when the program processor 302 instructs to decode the image depends on the BD program being processed by the program processor 302 and is not generally determined.
  • the image data and the video data are each decoded, drawn on the image plane 209 and the video plane 210, and synthesized and output by the synthesis processing unit 211.
  • Management information (scenario, AV management information) read from the BD-ROM 104 is recorded in the management information recording memory 204, but scenario information (“BD.INFO” and “XXX.PL”) is stored by the scenario processor 305. Read and process. AV management information (“YYY.VOBI”) is read and processed by the presentation controller 306.
  • the scenario processor 305 analyzes the information of the playlist, and instructs the presentation controller 306 about the VOB referenced by the playlist and its playback position.
  • the presentation controller 306 manages the management information of the target VOB (“YYY.VOBI”). ) And the drive controller 317 is instructed to read out the target VOB.
  • the drive controller 317 moves the optical pickup 202 in accordance with an instruction from the presentation controller 306, and reads the target AV data.
  • the read AV data is recorded in the image memory 308 or the track buffer 309 as described above.
  • the scenario processor 305 monitors the time of the clock 307 and throws an event to the program processor 302 at the timing set in the management information.
  • the BD program (“BD.PROG” or “XXX.PROG”) recorded in the program recording memory 203 is executed by the program processor 302.
  • the program processor 302 processes the BD program when an event is sent from the scenario processor 305 or when an event is sent from the UO manager 303.
  • the UO manager 303 generates an event corresponding to the request and sends it to the program processor 302 when a request is sent from the user by a remote control key.
  • BD-ROM is played back by such operation of each component.
  • FIG. 8 is a diagram showing an application space of the BD-ROM.
  • a play list (PlayList) is one playback unit.
  • the playlist has a static scenario composed of a cell playback sequence and a dynamic scenario described by the program.
  • the playlist only reproduces the individual cells in order, and the reproduction of the playlist ends when the reproduction of all the cells is completed.
  • the program can dynamically change the playback target according to the playback description beyond the playlist, the user's selection or the player's state.
  • a typical example is dynamic change of a reproduction target via a menu screen.
  • the menu is one of components of a function for dynamically selecting a scenario to be played back by a user's selection, that is, a playlist.
  • the program here is an event handler that is executed by a time event or a user event.
  • a time event is an event generated based on time information embedded in a playlist.
  • the event sent from the scenario processor 305 to the program processor 302 described in FIG. 7 corresponds to this.
  • the program processor 302 executes an event handler associated with the ID.
  • the program to be executed can instruct playback of another playlist.
  • playback of the currently played playlist is stopped and playback of the specified playlist is started. And transition.
  • a user event is an event generated by a user's remote control key operation. User events are roughly divided into two types. The first is a menu selection event generated by operating a cursor key ("Up”, “Down”, “Left”, “Right” key) or "Determination" key provided on the remote control.
  • the event handler corresponding to the menu selection event is valid only for a limited period in the playlist. That is, the validity period of each event handler is set as the playlist information.
  • the program processor 302 searches for a valid event handler when the “up”, “down”, “left”, “right” key or “decision” key of the remote control is pressed, and if there is a valid event handler, the event handler Is executed. In other cases, menu selection events will be ignored.
  • the second user event is a menu screen call event generated by operating the “Menu” key.
  • a menu screen call event is generated, a global event handler is called.
  • Global event handlers are always valid event handlers, independent of playlists. By using this function, DVD menu calls can be implemented. By implementing the menu call, it is possible to call the audio, subtitle menu, etc. during the title reproduction, and execute the title reproduction from the point where the audio or subtitle was interrupted after the change.
  • a cell which is a unit constituting a static scenario in a playlist, refers to all or part of a playback section of a VOB (MPEG stream).
  • the cell has a playback section in the VOB as start and end time information.
  • the VOB management information (VOBI) paired with each VOB has a time map (Time Map or TM) inside, and the playback and end times of the VOB described above are stored in the VOB ( That is, it is possible to derive the read start address and end address in the target file “YYY.VOB”). Details of the time map will be described later with reference to FIG.
  • FIG. 9 is a diagram showing the structure of an MPEG stream (VOB) used in the present embodiment.
  • the VOB is composed of a plurality of Video Object Units (VOBU).
  • the VOBU is a unit based on Group Of Pictures (GOP) in the MPEG video stream, and is one reproduction unit as a multiplexed stream including audio data.
  • GIP Group Of Pictures
  • VOBU has a playback time of 0.4 to 1.0 seconds, and normally has a playback time of 0.5 seconds. This is derived from the fact that the MPEG GOP structure is usually 15 frames / second (in the case of NTSC).
  • the VOBU has a video pack (V_PCK) which is video data and an audio pack (A_PCK) which is audio data.
  • V_PCK video pack
  • A_PCK audio pack
  • Each pack is composed of one sector, and in the present embodiment, it is composed of 2 kB units.
  • FIG. 10 is a diagram showing a pack structure in the MPEG stream.
  • elementary data such as video data and audio data are sequentially entered from the head into a data storage area of a packet called a payload.
  • a packet header is attached to the payload to form one packet.
  • DTS Decode Time Stamp
  • PTS Presentation Time Stamp
  • DTS and PTS are not necessarily recorded in all packet headers, but rules for recording in MPEG are defined. Details of the rules are described in the MPEG system (ISO / IEC13818-1) standard, and therefore will be omitted.
  • the packet is further added with a header (pack header) to form a pack.
  • a header (pack header) to form a pack.
  • SCR system clock reference
  • VOB interleaved recording The interleaved recording of the VOB file will be described with reference to FIGS.
  • FIG. 11 is a diagram for explaining the relationship between the AV data and the configuration of the BD-ROM player.
  • the data on the BD-ROM is input to the track buffer 309 if it is a VOB or MPEG stream through the optical pickup 202, and is input to the image memory 308 if it is PNG or image data.
  • the track buffer 309 is First-In First-Out (FIFO), and the input VOB data is sent to the demultiplexer 310 in the order of input. At this time, each pack is extracted from the track buffer 309 according to the SCR described above, and data is sent to the video processor 312 or the sound processor 313 via the demultiplexer 310.
  • FIFO First-In First-Out
  • image data which image is to be drawn is instructed by the presentation controller 306 (see FIG. 7). Further, the image data used for drawing is deleted from the image memory 308 at the same time in the case of subtitle image data, but in the case of menu image data, it remains in the image memory 308 as it is.
  • the lower diagram in FIG. 11 is a diagram showing interleaved recording of the VOB file and the PNG file on the BD-ROM.
  • AV data that is a series of continuous playback units is continuously recorded.
  • the drive only needs to read out data sequentially and send it to the player side.
  • a VOB file can be recorded in a continuous area.
  • data that is reproduced in synchronization with video data recorded in the VOB such as subtitle data.
  • a VOB file is divided into several blocks, and a method for interleave recording the VOB file and image data is used.
  • the lower part of FIG. 11 is a diagram for explaining the interleave recording.
  • FIG. 12 is a diagram for explaining a VOB data continuous supply model using the track buffer 309 that solves the problem in the interleave recording.
  • VOB data is temporarily stored in the track buffer 309. If the data input rate to the track buffer 309 is set higher than the data output rate from the track buffer 309, the data storage amount of the track buffer 309 will increase as long as data is continuously read from the BD-ROM. .
  • the input rate to the track buffer 309 is Va and the output rate from the track buffer 309 is Vb.
  • a continuous recording area of VOB continues from “a1” to “a2” of logical addresses.
  • the interval between “a2” and “a3” is a section in which image data is recorded and VOB data cannot be read.
  • Time “t1” indicates the time when reading of “a1”, which is the starting point of one continuous recording area of the VOB, is started.
  • the time “t2” is the time when the data “a2”, which is the end point of one continuous recording area, is read.
  • the amount of data in the track buffer 309 increases at the rate Va-Vb from time “t1” to “t2”, and the data storage amount B (t2) at time “t2” is expressed by the following (formula 1). Can be sought.
  • the structure of the navigation data (BD management information) recorded on the BD-ROM will be described with reference to FIGS.
  • FIG. 13 shows the internal structure of the VOB management information file (“YYY.VOBI”).
  • the VOB management information includes stream attribute information (Attribute) and time map (TMAP) of the VOB.
  • the stream attribute information is configured to have a video attribute (Video) and an audio attribute (Audio # 0 to Audio # m).
  • Video video attribute
  • Audio # 0 to Audio # m audio attribute
  • the number of audio attribute data fields is specified by the number of audio streams (Number).
  • Compression method AC3 MPEG1 MPEG2 LPCM Number of channels (Ch): 1-8 Language attribute: JPN, ENG, ...
  • the time map (TMAP) is a table having information for each VOBU, and has the number of VOBUs (Number) possessed by the VOB and each VOBU information (VOBU # 1 to VOBU # n).
  • Each VOBU information has a playback time length (Duration) of VOBU and a data size (Size) of VOBU.
  • FIG. 14 is a diagram for explaining the details of the VOBU information.
  • an MPEG stream has two physical quantity aspects, a temporal aspect and a data size aspect.
  • a temporal aspect For example, since Audio Code number 3 (AC3), which is a voice compression standard, performs compression at a fixed bit rate, the relationship between time and address can be obtained by a linear expression.
  • AC3 Audio Code number 3
  • each frame has a fixed display time, for example, in the case of NTSC, one frame has a display time of 1 / 29.97 seconds, but the compressed data size of each frame is a characteristic of the picture. Depending on the picture type used for compression or so-called I / P / B picture, the data size varies greatly.
  • time map links the relationship between time and address in the VOB.
  • TMAP time map
  • TMAP time map
  • FIG. 15 is a diagram for explaining an address information acquisition method using a time map.
  • time information (Time) is given as shown in FIG. 15, first, the VOBU to which the time belongs is searched. Specifically, the number of frames for each VOBU in the time map is added, and a VOBU whose sum of frames exceeds or matches the value obtained by converting the time into the number of frames becomes the VOBU corresponding to the time.
  • the size of each VOBU in the time map is added to the VOBU immediately before the VOBU, and the value becomes the leading address (Address) of the pack to be read in order to reproduce the frame including the given time.
  • FIG. 16 is a diagram showing the configuration of a playlist.
  • the playlist is composed of a cell list (CellList) and an event list (EventList).
  • the cell list (CellList) is information indicating a reproduction cell sequence in the playlist, and the cells are reproduced in the description order of the list.
  • CellList The contents of the cell list (CellList) are the number of cells (Number) and cell information (Cell # 1 to Cell # n).
  • Each cell information (Cell # to Cell # n) has a VOB file name (VOBName), a valid section start time (In) and a valid section end time (Out) in the VOB, and a caption table (SubtitleTable). Yes.
  • VOBName VOB file name
  • In valid section start time
  • Out valid section end time
  • SubtitleTable caption table
  • the valid section start time (In) and valid section end time (Out) are each expressed by a frame number in the VOB, and the address of VOB data necessary for reproduction is obtained by using the time map (TMAP) described above. I can do things.
  • the subtitle table is a table having subtitle information that is reproduced in synchronization with the VOB.
  • Subtitles can have a plurality of languages like audio, and a subtitle table (SubtitleTable) is composed of the number of languages (Number) followed by tables for each language (Language # 1 to Language # k).
  • Each language table (Language # 1 to Language # k) includes language information (Language), the number of subtitle information to be displayed (Number), and subtitle information to be displayed (Speech # 1 to Speech # j).
  • the subtitle information (Speech # 1-Speech # j) includes the corresponding image data file name (Name), subtitle display start time (In), subtitle display end time (Out), and subtitle display position. (Position).
  • the event list is a table that defines events that occur in the playlist.
  • the event list is composed of the number of events (Number) followed by individual events (Event # 1 to Event # m), and each event (Event # 1 to Event # m) includes an event type (Type) and an event ID (ID), event generation time (Time), and validity period (Duration).
  • FIG. 17 is a diagram showing a configuration of an event handler table (“XXX.PROG”) having event handlers (time events and user events for menu selection) for each playlist.
  • XXX.PROG event handler table
  • the event handler table has a defined number of event handlers / programs (Number) and individual event handlers / programs (Program # 1 to Program # n).
  • each event handler / program (Program # 1 to Program # n) has the event handler start definition ( ⁇ event_handler> tag) and the event handler ID (event_handler id) paired with the event ID described above. Then, the program is described between parentheses “ ⁇ ” and “ ⁇ ” following “function”.
  • BD. INFO information related to the entire BD-ROM
  • FIG. 18 shows the BD. It is a figure which shows the structure of INFO.
  • the BD-ROM overall information is composed of a title list (TitleList) and an event list for global events (EventList).
  • the title list (TitleList) is composed of the number of titles (Number) in the disc and the following pieces of title information (Title # 1 to Title # n).
  • Each title information (Title # 1 to Title # n) includes a playlist table (PLTable) included in the title and a chapter list (ChapterList) in the title.
  • the playlist table (PLTable) has the number of playlists in the title (Number) and the playlist name (Name), that is, the playlist file name.
  • the chapter list (ChapterList) is composed of the number of chapters (Number) included in the title and each chapter information (Chapter # 1 to Chapter # n), and each chapter information (Chapter # 1 to Chapter # n) is related to the chapter.
  • the cell table (CellTable) includes a cell number (Number) and entry information (CellEntry # 1 to CellEntry # k) of each cell.
  • the cell entry information (CellEntry # 1 to CellEntry # k) is described by a playlist name including the cell and a cell number in the playlist.
  • the event list includes the number of global events (Number) and information on each global event (Event # 1 to Event # m). It should be noted here that the first defined global event is called a first event (FirstEvent), and is the event that is executed first when the BD-ROM is inserted into the player.
  • Each global event information (Event # 1 to Event # m) has only an event type (Type) and an event ID (ID).
  • FIG. 19 shows the structure of the global event handler table (“BD.PROG”). This table has the same contents as the event handler table described in FIG. 17, and a description thereof will be omitted.
  • BD.PROG global event handler table
  • Event generation mechanism The event generation mechanism will be described with reference to FIGS.
  • FIG. 20 is a diagram illustrating an example of a time event.
  • the time event is defined by the event list (EventList) of the play list (“XXX.PL”).
  • the program processor 302 searches for an event handler having the event ID “Ex1” and executes the target event handler. For example, in the case of this embodiment, it is possible to draw two button images.
  • FIG. 21 is a diagram showing an example of a user event by a user menu operation.
  • EventList EventList of the play list (“XXX.PL”).
  • the event defined as the user event ie, the event type (Type) is “UserEvent”
  • the user event becomes ready when the event generation time (“t1”) is reached. At this time, the event itself has not yet been generated.
  • the event is in the ready state for the period (“T1”) described in the valid standard information (Duration).
  • the UO event is first sent by the UO manager 303. It is generated and output to the program processor 302.
  • the program processor 302 sends a UO event to the scenario processor 305, and the scenario processor 305 searches for a valid user event at the time when the UO event is received.
  • the scenario processor 305 When there is a target user event as a result of the search, the scenario processor 305 generates a user event and outputs it to the program processor 302.
  • the program processor 302 searches for an event handler having an event ID, for example, “Ev1” in the case of the example shown in FIG. 21, and executes the target event handler. In this example, playback of playlist # 2 is started.
  • the generated user event does not include information on which remote control key is pressed by the user.
  • Information on the selected remote control key is transmitted to the program processor 302 by a UO event, and is recorded and held in a register of the virtual player.
  • the event handler program can check the value of this register and execute branch processing.
  • FIG. 22 is a diagram showing an example of a global event.
  • EventList the event list of the entire BD-ROM information (“BD.INFO”).
  • An event defined as a global event that is, an event whose event type (Type) is “GlobalEvent” is generated only when a user performs a remote control key operation.
  • a UO event is first generated by the UO manager 303 and output to the program processor 302.
  • the program processor 302 sends a UO event to the scenario processor 305.
  • the scenario processor 305 generates a corresponding global event and sends it to the program processor 302.
  • the program processor 302 searches for an event handler having the event ID “menu” and executes the target event handler. For example, in the case of the example shown in FIG. 22, playback of the playlist # 3 is started.
  • menu key it is simply called a menu key, but there may be a plurality of menu keys like a remote control in a player that plays a DVD.
  • ID corresponding to each menu key appropriate processing corresponding to each menu key can be performed.
  • FIG. 23 is a diagram for explaining a functional configuration of the program processor 302.
  • the program processor 302 is a processing module having a virtual player machine inside.
  • the virtual player machine is a functional model defined as a BD-ROM and does not depend on the implementation of each BD-ROM player. That is, it is guaranteed that the same function can be executed in any BD-ROM player.
  • the virtual player machine has two major functions. Programming functions and player variables. Player variables are stored and held in registers.
  • the programming function is based on Java (registered trademark) Script, and the following three functions are defined as BD-ROM specific functions.
  • Link function Stops the current playback and starts playback from the specified playlist, cell, and time.
  • Link (PL #, Cell #, time) PL #: Playlist name
  • PNG drawing function draws specified PNG data on the image plane 209
  • Draw (File, X, Y) File: PNG file name
  • Image plane clear function Clear specified area of image plane 209 Clear (X, Y, W, H)
  • the player variable includes a system parameter (SPRM) indicating a setting value of the player and a general parameter (GPRM) that can be used for general purposes.
  • SPRM system parameter
  • GPRM general parameter
  • FIG. 24 is a diagram showing a list of system parameters (SPRM).
  • the programming function of the virtual player is based on Java (registered trademark) Script.
  • Java registered trademark
  • Script Java (registered trademark) Script
  • UNIX registered trademark
  • Other programming functions such as Perl Script may be used.
  • the programming language in the present disclosure is not limited to Java (registered trademark) Script.
  • Program example 25 and 26 are diagrams showing examples of programs in the event handler.
  • FIG. 25 is a diagram showing an example of a program in an event handler related to control of a menu screen having two selection buttons.
  • the program on the left side of FIG. 25 is executed using the time event at the head of the cell (PlayList # 1.Cell # 1).
  • “1” is initially set to GPRM (0), one of the general parameters.
  • GPRM (0) is used to identify the selected button in the program.
  • the initial value is a state in which the button [1] arranged on the left side is selected.
  • PNG drawing is performed for each of the button [1] and the button [2] using a drawing function “Draw”.
  • the button [1] draws the PNG image “1black.png” with the coordinates (10, 200) as the starting point (upper left corner).
  • the button [2] draws the PNG image “2white.png” with the coordinates (330, 200) as the starting point (upper left corner).
  • the program on the right side of FIG. 25 is executed using a time event.
  • FIG. 26 is a diagram showing an example of a program in an event handler related to a user event of menu selection.
  • This event handler performs branch processing as follows using the value of GPRM (0) identifying the selection button and SPRM (8) identifying the selected remote control key.
  • the program shown in FIG. 26 is interpreted and executed as described above.
  • FIG. 27 is a flowchart showing a flow of basic processing of AV data reproduction in the BD-ROM player.
  • the BD-ROM player When the BD-ROM is inserted (S101), the BD-ROM player reads and analyzes "BD.INFO” (S102) and reads "BD.PROG” (S103). Both “BD.INFO” and “BD.PROG” are temporarily stored in the management information recording memory 204 and analyzed by the scenario processor 305.
  • the scenario processor 305 generates the first event according to the first event (FirstEvent) information in the “BD.INFO” file (S104).
  • the generated first event is received by the program processor 302, and an event handler corresponding to the event is executed (S105).
  • the event handler corresponding to the first event is expected to record information specifying the playlist to be played first. If play list reproduction is not instructed, the player does not reproduce anything and simply waits for a user event to be accepted (No in S201).
  • the UO manager 303 When receiving a remote control operation from the user (Yes in S201), the UO manager 303 generates a UO event for the program processor 302 (S202).
  • the program processor 302 determines whether the UO event is a menu key (S203). If it is a menu key (Yes in S203), the UO event is sent to the scenario processor 305, and the scenario processor 305 generates a user event. (S204). The program processor 302 executes an event handler corresponding to the generated user event (S205).
  • FIG. 28 is a flowchart showing the flow of processing from the start of playlist playback to the end of VOB playback in the BD-ROM player.
  • play list reproduction is started by the first event handler or the global event handler (S301).
  • the scenario processor 305 reads and analyzes the playlist “XXX.PL” and reads program information “XXX.PROG” corresponding to the playlist as information necessary for playback of the playlist to be played back. (S303).
  • the scenario processor 305 starts cell reproduction based on the cell information registered in the playlist (S304).
  • Cell playback means that a request is sent from the scenario processor to the presentation controller 306, and the presentation controller 306 starts AV data playback (S305).
  • the presentation controller 306 When reproduction of AV data is started, the presentation controller 306 reads and analyzes the VOB information file “XXX.VOBI” corresponding to the cell to be reproduced (S402). The presentation controller 306 uses the time map to specify the VOBU to start playback and its address, and instructs the drive controller 317 to read out the address. The drive controller 317 reads the target VOB data “YYY.VOB” (S403).
  • the read VOB data is sent to the decoder and reproduction is started (S404).
  • the VOB playback is continued until the playback section of the VOB ends (S405).
  • the process proceeds to cell playback (S304). If there is no next cell (No in S406), the process related to reproduction ends.
  • FIG. 29 is a flowchart showing a flow of event processing after the start of AV data reproduction.
  • FIG. 29A is a flowchart showing a flow of processing relating to a time event in the BD-ROM player.
  • the BD-ROM player is an event-driven player model.
  • the event processing processes of the time event system, the user event system, and the caption display system are started, and the event processing is executed in parallel.
  • the scenario processor 305 When the time event occurrence time is reached (Yes in S503), the scenario processor 305 generates a time event (S504).
  • the program processor 302 receives the time event and executes the event handler (S505).
  • FIG. 29B is a flowchart showing the flow of processing relating to a user event in the BD-ROM player.
  • the UO manager 303 When UO is received (Yes in S603), the UO manager 303 generates a UO event (S604).
  • the program processor 302 receives the UO event and checks whether the UO event is a menu call.
  • the program processor 302 causes the scenario processor 305 to generate an event (S607), and the program processor 302 executes the event handler (S608).
  • the scenario processor 305 determines whether the current time is within the user event valid period, and if it is within the valid period (Yes in S606), the scenario processor 305 generates a user event (S607) The processor 302 executes the target event handler (S608).
  • FIG. 30 is a flowchart showing the flow of subtitle data processing in the BD-ROM player.
  • the scenario processor 305 confirms whether the subtitle display start time has come.
  • the scenario processor 305 instructs the presentation controller 306 to draw subtitles
  • the presentation controller 306 instructs the image processor 311 to draw subtitles.
  • the image processor 311 draws the caption on the image plane 209 according to the instruction (S704).
  • the presentation controller 306 instructs the image processor 311 to erase the caption.
  • the image processor 311 deletes the subtitles drawn in accordance with the instruction from the image plane 209 (S706).
  • the BD-ROM player performs basic processing related to reproduction of the BD-ROM based on a user instruction or BD management information recorded in the BD-ROM.
  • Embodiment 2 relates to the recording or reproduction of high luminance (HDR) video information on a BD. Since the second embodiment is basically based on the first embodiment, the following description will be focused on the part that is expanded or different from the second embodiment.
  • HDR high luminance
  • FIG. 31 is a diagram for explaining a method of sending high brightness metadata using a video encoding method such as MPEG-4 AVC (aka H.264) or HEVC (aka H.265).
  • a unit consisting of a picture reference structure equivalent to GOP (Group Of Pictures) used to improve random accessibility in MPEG-2 Video is defined as a GOP in MPEG-4 AVC or HEVC.
  • Pictures are grouped and encoded.
  • FIG. 31 shows the encoding order of a plurality of NAL units in the GOP head picture (first access unit).
  • the GOP head picture one AU delimiter, one SPS, one or more PPSs, zero or more SEI messages, each NAL unit of one or more Slices that make up the picture, and then necessary
  • the NAL units of Filler data, End of sequence, and End of stream are followed accordingly.
  • SEI message SEI (s)
  • SEI (s) SEI message
  • SEI (s) User data unregistered SEI message
  • GOP User data unregistered SEI message
  • CC User data unregistered SEI message with Closed Captioning information of this picture
  • This video User data unregistered SEI message HDRb
  • basic and static brightness enhancement metadata indicating the brightness range such as maximum brightness or minimum brightness among all pictures in the sequence
  • VOB Video User data unregistered SEI message
  • HDRe More detailed and dynamic brightness than SEI message
  • the above SEI message (HDRb) or SEI message (HDRe) is transmitted together with video information. This is because the luminance value (Y) for each pixel obtained after transmitting the information about the luminance used in the mastering and decoding the video information is actually the brightness (cd / m ⁇ 2). This is for giving information such as
  • a pixel having a luminance value (Y) of 1000 has a mastering luminance of 5000 cd / m ⁇ 2, and correlation information between the luminance of the pixel and the mastering luminance is obtained.
  • HDRb SEI message
  • HDRe SEI message
  • the maximum luminance (cd / m ⁇ 2) that can be expressed by the TV connected to the player is acquired, information for changing the dynamic range in the luminance direction of the entire picture is obtained by using the above-described SEI message (HDRb) or SEI.
  • a message (HDRe) may be included.
  • the SEI message (HDRb) is an SEI message that is transmitted in units of pictures or GOPs to indicate that it is an HDR video sequence, and transmits information on the static luminance of the entire video sequence (VOB).
  • the HDR video sequence referred to here is a video sequence in which SEI message (HDRb) is recorded.
  • the SEI message (HDRe) for transmitting more detailed and dynamic luminance information does not need to be recorded in the HDR video sequence, and there may not be one in the HDR video sequence.
  • the SEI message (HDRe) is an SEI message that is always encoded immediately after the SEI message (HDRb), if present, and transmits information on luminance in units of pictures or GOPs.
  • FIG. 31 shows the encoding order of a plurality of NAL units in a picture (non-first access unit) that is not the first picture of the GOP.
  • a picture that is not the head of a GOP one AU delimiter, 0 or 1 PPS, 0 or multiple SEI messages, and each NAL unit of one or more slices that constitute the picture follow. Further, NAL units of Filler data, End of sequence, and End of stream follow as necessary.
  • the SEI message (HDRb) or SEI message (HDRe) stores the above information, respectively, and is assigned to each picture in the method shown in FIG.
  • both SEI message (HDRb) and SEI message (HDRe) are assigned only to the GOP head picture, and not to pictures that are not GOP head.
  • FIG. 32 is a diagram for explaining a method of multiplexing an HDR video stream including up to SEI message (HDRe) using MPEG-2 TS.
  • the sequence may be synonymous with the stream or may be a part of the stream.
  • One picture one frame or one video access unit
  • HDMI registered trademark
  • the SEI message (HDRe) information is transmitted as shown in FIG. 32, the SEI message (HDRe) is searched from the entire video sequence. The processing for doing so may be heavy.
  • HDRe SEI message
  • HDMI registered trademark
  • FIG. 34 is a diagram for explaining another method of multiplexing an HDR video stream including MPEG-2 TS including SEI message (HDRe).
  • One picture one frame or one video access unit
  • the video stream is converted to PES.
  • FIG. 35 is a diagram for explaining another method of multiplexing an HDR video stream including MPEG-2 TS including SEI message (HDRe). The difference from the method shown in FIG. 34 is that in the method shown in FIG. 35, transport_priority of the TS packet storing the PES packet including the SEI message (HDRe) is zero.
  • the HDR video is output by HDMI (registered trademark)
  • HDMI registered trademark
  • HDRe is analyzed. Therefore, the processing amount for searching for the SEI message (HDRe) is almost the same as the method shown in FIG. 33, and the method shown in FIG. 35 can be realized.
  • the PID demultiplexer of the TS decoder separates the stream based also on the value of transport_priority.
  • a decoder that does not support SEI message (HDRe) and that uses the information up to SEI message (HDRb) to increase the brightness easily allows TS packets including SEI message (HDRe) to be transmitted using the PID demultiplexer described above. It is possible to destroy it.
  • FIG. 36 is a diagram for explaining another method of multiplexing an HDR video stream including MPEG-2 TS including SEI message (HDRe).
  • HDRe SEI message
  • two types of PID are used as in the method shown in FIG. 33, and the PES packet is configured as in the method shown in FIG.
  • the method shown in FIG. 36 has the same advantages and disadvantages as the method shown in FIG.
  • FIG. 37 is a diagram for explaining another method of multiplexing an HDR video stream including up to SEI message (HDRe) using MPEG-2 TS.
  • the multiplexing position of the SEI message (HDRe) is immediately after the picture data. Therefore, in the method shown in FIG. 37, the HDR video sequence up to SEI message (HDRb) is stored in one PES packet. Except for this point, the method shown in FIG. 37 has the same advantages and disadvantages as the method shown in FIG.
  • FIG. 38 is a diagram for explaining a method of multiplexing an extended video sequence, which is a video sequence different from the HDR video sequence, using MPEG-2 TS instead of the SEI message (HDRe).
  • an extended video sequence (Enhancement layer video sequence) is transmitted as an HDR video sequence (Base layer video sequence sequence user ID message (HDRb)) as extended video information.
  • an enhancement frame PES # n extended picture included in the extended video sequence is added to a Base frame PES # n basic picture included in the HDR video sequence.
  • the basic video sequence and the extended video sequence described above are multiplexed into MPEG-2 TS with two different PES packets with different PIDs as two different video sequences.
  • the pair in order to correctly specify the pair of the basic video sequence and the extended video sequence, the pair may be expressed using descriptor ().
  • descriptor For example, in the method shown in FIG. 38, HDR_pairing_descriptor () is described in the PMT packet.
  • HDR_pairing_descriptor () includes the number of pairs in this MPEG-2 TS (number_of_HDR_pairs) and PID values used by the basic video sequence and the extended video sequence for each pair.
  • the PID value used by the basic video sequence is indicated by base_layer_video_sequence_PID
  • enhancement_layer_video_sequence_PID By describing such HDR_pairing_descriptor (), a correct pair combination can be indicated.
  • FIG. 39 shows the structure of a caption video stream that constitutes one display unit.
  • a subtitle video stream of one display unit is called a Presentation Set and has a structure that starts with PM data and ends with END. The individual data segments will be described below.
  • PM Presentation Manager
  • PM is a data segment that is always placed at the beginning of each Presentation Set of a caption video stream, and includes the following data fields.
  • Presen_set_state indicates whether this Presentation Set is a type that includes all data necessary for subtitle display as one subtitle display unit, or a type that stores only partial update data that changes only the display color.
  • Bitmap_id_ref indicates the identification information (bitmap_id) of the bitmap of the caption video displayed by this Presentation Set.
  • Window_id_ref indicates identification information (window_id) of the display area used by this Presentation Set.
  • Bitmap_pos_x and bitmap_pos_y indicate the position of the upper left coordinate of the bitmap specified by bitmap_id_ref.
  • “Palette_id_ref” indicates identification information (palette_id) of the display color index color table used by this Presentation Set.
  • “Palette_update_judge” indicates whether or not this Presentation Set is a type of Presentation Set that updates only the display color index color table.
  • palette_update_judge 1
  • the display area and the bitmap itself are the same as the previous Presentation Set, but only the display color index color table is changed. Thereby, for example, it is possible to realize the display control of a pattern in which the color gradually changes like karaoke without resending a bitmap having a large data size.
  • WIN is a data segment arranged immediately after PM, and a plurality of data segments may be arranged.
  • WIN is a data segment that specifies a display area used by the Presentation Set, and includes the following data fields.
  • Seg_type 0x02 indicates that this data segment is WIN.
  • Window_id is information for identifying the display area specified by this WIN.
  • Window_pos_x and window_pos indicate the upper left coordinate value of this display area.
  • _Window_size_x and window_size_y indicate the size of the display area in the horizontal direction (x) and the vertical direction (y) with pixel accuracy.
  • the reason why the display area is divided in this way is that the display update interval can be shortened by narrowing the display area even under the condition of a limited decoder transmission band.
  • PAL is a data segment arranged immediately after WIN, and a plurality of data segments may be arranged.
  • PAL is a data segment storing a display color (index color) used by Presentation Set, and includes the following data fields.
  • Seg_type 0x03 indicates that this data segment is PAL.
  • Palette_id is information for identifying the display color index color table.
  • Color_index indicates a color index number (for example, 0 to 255).
  • Y, Cr, Cb, and alpha indicate color information that the corresponding color index number (color_index) actually means.
  • the color information is stored as Y (luminance information), Cr / Cb (color difference information), and alpha (transmittance information).
  • Y luminance information
  • Cr / Cb color difference information
  • alpha transmittance information
  • a plurality of BMPs may be arranged in a data segment arranged immediately after PAL. For example, when a plurality of subtitle videos are displayed simultaneously, a plurality of WIN, PAL, and BMP are arranged. BMP stores bitmap information of caption video stored in the Presentation Set.
  • Seg_type 0x04 indicates that this data segment is BMP.
  • Bitmap_id is identification information of the bitmap video information.
  • Bitmap_version indicates the version (presence / absence of update) of this bitmap.
  • Bitmap_size_x and bitmap_size_y describe the sizes in the x and y directions when the bitmap is expanded with pixel accuracy.
  • Bitmap_image_data stores data obtained by compression-coding this bitmap video.
  • the Presentation Set that is one subtitle display unit is an elementary stream for transferring information necessary for one subtitle display or subtitle update as a data segment.
  • the subtitle stream is for updating subtitles by arranging a plurality of Presentation Sets.
  • FIG. 40 is a diagram showing the positional relationship during caption display described in FIG.
  • the plane for displaying subtitles has the x and y coordinate axes to the right and down, respectively, with the top left as the origin.
  • a display area (WIN) is arranged in this plane, and a bitmap image (BMP) is arranged inside the display area.
  • FIG. 41 is a diagram for explaining the management information (management information file) described in FIG. 5 and the contents thereof.
  • Extension As shown in (a) of FIG. In the INFO file, DiscInfo () describing representative attribute information of the entire disc, BD. Extension () that is an extended data area of INFO is included. Extension () includes Disc_Type () and HDR_meta ().
  • Disc_Type is extended information indicating the physical characteristics of the disc on which it is recorded. Based on the 3-bit information indicated in the disc_type field in Disc_Type (), the disc type can be identified as follows.
  • disc_type 3 bits (bslbf) 010b: A disc having a recording density of 25 GB / layer and requiring reading at 72 Mbps 011b: A disc having a recording density of 25 GB / layer and requiring reading at 92 Mbps 100b: A recording density of 33 GB / layer and reading at 92 Mbps 101b: A disk with a recording density of 33 GB / layer and a disk that needs to be read at 122 Mbps 110b: A disk with a recording density of 33 GB / layer and a disk that needs to be read at 144 Mbps
  • HDR_meta () in the INFO file HDR-related metadata for this disc is described.
  • the PL file includes SubPLList () in which playback control information of an extended video stream (Enhancement layer video stream) is described in CellList.
  • HDR_meta () and CombiExt () can be recorded in Extension () that is an extended data area of the PL file.
  • HDR_meta () in the PL file describes HDR-related metadata for this playlist.
  • CombiExt () is stored in Extension () of the playlist file.
  • CombiExt () is information indicating a combination of elementary streams that have the same data structure and semantics as Combi () described in FIG.
  • CombiExt () includes a standard luminance range video stream (hereinafter also referred to as an SDR video stream) and a standard luminance range subtitle stream that can be reproduced together with the SDR video stream (hereinafter also referred to as an SDR subtitle stream). And audio streams are registered.
  • the VOBI file includes information indicating the usage of the VOB (VOB_type), information indicating the maximum bit rate of the system stream (SysRate), video stream attribute information (Video # 0 (), etc.), audio stream attribute information ( Audio # 0 () etc.) and subtitle stream attribute information (Subtitle # 0 () etc.) can be recorded.
  • VOB_type information indicating the usage of the VOB
  • SysRate information indicating the maximum bit rate of the system stream
  • Video # 0 (), etc. video stream attribute information
  • Audio # 0 () etc. audio stream attribute information
  • subtitle stream attribute information Subtitle # 0 () etc.
  • HDR_meta () in the VOBI file describes HDR-related metadata for this VOB stream.
  • TMAPExt () has the same data structure and the same semantics as TMAP (), which is table information for random access as shown in FIG. 13, FIG. 14 and FIG. TMAPExt () stores random access point information for a standard luminance (SDR) video stream.
  • SDR standard luminance
  • VOB_type has the following meaning.
  • VOB_type 0x01 (Main TS for movie application)
  • VOB_type 0x01 (Main TS for movie application)
  • VOB_type 0x10 (Sub TS for Enhancement layer video stream)
  • VOB VOB in which this is described is a VOB (MPEG-2 TS stream) that can be used only in SubPL, in which an extended video stream is multiplexed. To do.
  • FIG. 42 is a diagram showing the data structure of the database file described in FIG.
  • Cell # n () is information on the nth Cell.
  • Cell # n () includes identification information (VOBName) of the VOB stream file referred to in the Cell # n (), information on the Closed Captioning (CC), reproduction start time information (In) of the Cell # n (), This includes cell #n () playback end time information (Out), Combi () information indicating combinations of elementary streams that can be played back simultaneously in the cell #n (), and the like.
  • Combi various encoding attribute information is described for each elementary stream permitted as a combination that can be reproduced at the same time in Cell # n () including the Combi.
  • Combi includes specific information (VideoPID) such as the PID of the video stream, resolution, aspect, and the like.
  • VideoPID specific information
  • Encoding attribute information VideoFormat
  • Combi includes specific information (EnhVideoPID) such as the PID of the extended video sequence, bit depth information (EnhVideoBitDepth), And maximum luminance information (EnhVideoMaxLum) and the like are described.
  • EnhVideoPID specific information
  • bit depth information EnhVideoBitDepth
  • maximum luminance information EnhVideoMaxLum
  • Combi includes specific information (AudioPID) such as the PID of the audio stream, a coding method (Coding), and the number of channels (Ch.). Described.
  • the permitted elementary stream is a subtitle stream
  • specific information such as PID of the subtitle stream (SubtitlePID), subtitle language information (Language), and the like are described.
  • SubPL # n () is information for designating the nth additional sub-reproduction path.
  • SubPL # n () is information specifying an extended video stream to be played back in combination with an HDR video stream, for example.
  • SubPL_type information included in SubPL # n () is information indicating the type of reproduction method of the HDR video stream and the extended video stream. It is used to specify the number of system streams (1 or 2) used for reproduction, such as synchronous / asynchronous or reproduction.
  • SubPL_type 0x0A (Synchronous Enhancement Layer Layer SubPL in Sub TS) reads the HDR video stream from one of the two system streams (MPEG-2 TS), reads the extended video stream from the other, and synchronizes the read streams Type of playback method to be played. Note that “synchronization” here means that a picture with an HDR video stream has a fixed relationship that only a picture with an extended video stream is always played back at the same time.
  • SubPL_type 0x0B (Synchronous Enhancement Layer SubPL in Main TS) is a type of playback method for synchronizing and playing back an HDR video stream in one MPEG-2 TS and an extended video stream.
  • the SubCellList information is information in which SubCell information is bundled.
  • the SubCell information includes the file name (VOBName) of the VOB file referred to by one continuous section (SubCell) including the extended video stream, SubCell start time information (In), SubCell end time information (Out), and a Cell that is played back simultaneously. Identification information (CellNum).
  • Such SubPL # n () can instruct the player which playback model and which file is used to play back the HDR video stream and the extended video stream.
  • Cell # 0. In and SubCell # 0. In and the same as Cell # 0. Out and SubCell # 0. Out is the same.
  • Cell # 0. In, Cell # 0. Out, SubCell # 0. In and SubCell # 0. Out is a time represented on the PTS time axis.
  • SubPL_type 0x0B
  • an HDR video stream (HDRb) and its extended video stream are multiplexed in one system stream file (MPEG-2 TS), and these streams are played back simultaneously.
  • MPEG-2 TS system stream file
  • the basic video stream and the extended video stream are multiplexed on the same transport stream.
  • the basic video stream and the extended video stream can be clearly associated, and video information with a wide dynamic range can be appropriately reproduced.
  • the PlayList that is the management information file
  • the first section included in the playback path of the basic video stream and the second section included in the playback path of the extended video stream are described in association with each other.
  • the reproduction time of the 1st area and the 2nd area is the same.
  • the PlayList describes the playback start time of the first section and the playback start time of the second section, which are the same time, and the first time is the same time.
  • the playback end time of the second section and the playback end time of the second section are described.
  • FIG. 45 is a diagram for explaining a decoder model of an HDR video stream in the present embodiment.
  • the playback apparatus in this embodiment includes a decoder system 400.
  • the decoder system 400 is a video playback unit that reads a video stream such as a basic video stream or an extended video stream and graphics data indicating subtitles from the BD and plays back based on each management information file described above.
  • the decoder system 400 includes a basic decoder (Base Dec) 401, an extended decoder (Enh. Dec) 402, a basic plane (Base plane (HDRb)) 403, an extended plane (Enh. Plane) 404, an extended plane (HDRe plane) 405, Base + Enh. Plane 406, subtitle decoder (Sub. Dec) 407, subtitle plane (Subtitle Plane (8 bit) 408, graphics processor (GP) 409, high luminance subtitle plane (Subtitle Plane (HDRb / e)) 410, and high luminance subtitle A plane (Subtitle Plane (Base + Enh.)) 411 is provided.
  • the HDR video stream including the SEI message (HDRb) is decoded by a basic decoder (Base Dec) 401. Then, the high-luminance video information generated by decoding the HDR video stream is developed in a basic plane (Base plane (HDRb)) 403.
  • the basic luminance information (maximum / minimum luminance value of the entire content) included in the SEI message (HDRb) is transmitted together with the high-luminance video information, and externally such as HDMI (registered trademark). It is output to the video output I / F.
  • the decoder system 400 which is a playback device that supports SEI message (HDRe), expands by adding brightness extension information of SEI message (HDRe) to high brightness video information of the base plane (HDRb) 403. Expanded high-luminance video information is developed on the plane 405.
  • the extended high-luminance video information including the SEI message (HDRe) is added to the HDMI (registered trademark) together with the additional luminance information (maximum / minimum luminance value in each scene) included in the SEI message (HDRe). To an external video output I / F.
  • the extended video stream is decoded by the extended decoder (Enh. Dec) 402. Then, the extended video information generated by the decoding is expanded on an expansion plane (Enh. Plane) 404.
  • the decoder system 400 synthesizes this extended video information with high brightness video information of the base plane (Base plane (HDRb)) 403 and videos having the same PTS.
  • the extended high-luminance video information obtained by this synthesis is Base + Enh.
  • the plane 406 is developed.
  • the decoder system 400 uses the HDMI (registered trademark) together with the basic luminance information transmitted by the SEI message (HDRb) or the luminance extension information stored in the extension video stream. ) And other external video output I / F.
  • graphics data to be superimposed on the video is decoded by a subtitle decoder (Sub. Dec) 407 and expressed in 8-bit index color (255 colors).
  • a subtitle that is a decoded subtitle stream is developed into a subtitle plane (Subtitle Plane (8 bits)) 408.
  • the graphics processor (GP) 409 converts the 8-bit tone YCrCb representing the caption into a 10-bit tone YCrCb, and adjusts the brightness of the caption from the standard brightness (according to high brightness video information or extended high brightness video information). B) Convert to high brightness.
  • a high-luminance subtitle which is a subtitle converted into high-luminance, is developed on a high-luminance subtitle plane (Subtitle Plane (HDRb / e)) 410.
  • the high-luminance subtitles developed on the high-luminance subtitle plane 410 are combined with a picture of the base plane (Base plane (HDRb)) 403 or an expansion plane (HDRe plane) 405 having the same display time and output. Is done.
  • a high-luminance subtitle that is a subtitle converted to a higher luminance is developed in a high-luminance subtitle plane (Subtitle Plane (Base + Enh.)) 411. And the high-intensity subtitles developed on the high-intensity subtitle plane 411 have Base + Enh. It is combined with the picture of the plane 406 and output.
  • the graphics processor (GP) 409 acquires an index color table (CLUT) for subtitles developed on a subtitle plane (Subtitle Plane (8 bits)) 408 from the subtitle decoder (Sub. Dec) 407.
  • CLUT index color table
  • only one of the CLUT for SDR and the CLUT for HDR depends on whether the video information to be combined with the caption is an SDR video stream or an HDR video stream. Are multiplexed. Further, although there are a plurality of HDR types of video information, only one type of subtitle stream CLUT is provided for HDR.
  • FIG. 46 is a diagram showing a method of registering each stream in the database file.
  • FIG. 46 shows video for five data blocks of Combi (), CombiExt (), and SubPL () stored in the playlist file and TMAP () and TMAPExt () stored in the VOBI file. It is a table
  • the HDR in FIG. 46 indicates HDRb or HDRe.
  • the SDR video stream When only the SDR video stream is registered in the playlist file, the SDR video stream, the SDR subtitle stream superimposed on it (subtitle stream having only the SDR PAL), the audio stream, Is registered.
  • the random access information of the SDR video stream is registered in TMAP ().
  • the HDR video stream when only the HDR video stream is registered in the playlist, the HDR video stream, the HDR subtitle stream superimposed thereon (subtitle stream having only the PAL for HDR), audio, A stream is registered.
  • the random access information of the HDR video stream is registered in TMAP ().
  • Combi stores the first playback control information that is specified to be played back in combination with the HDR video stream and the HDR subtitle stream.
  • RMAP stores random access information (hereinafter also referred to as first random access information) indicating the position of an independently decodable picture included in the HDR video stream.
  • CombiExt stores second reproduction control information that is designated to be reproduced by combining the SDR video stream and the SDR subtitle stream.
  • TMAPExt random access information of the SDR video stream is registered. That is, TMAPExt () stores random access information (hereinafter also referred to as second random access information) indicating the position of independently decodable pictures included in the SDR video stream.
  • second random access information random access information
  • TMAP the random access information of the HDR video stream and the random access information of the extended video stream are registered. That is, in this case, the TMAP () stores the first random access information and random access information (hereinafter also referred to as third random access information) indicating the playback time of a picture included in the extended video stream. .
  • SubPL playback control information of the extended video stream is registered in SubPL (). That is, the third playback control information in which the extended video stream for extending the luminance range of the HDR video stream is specified is stored in SubPL (). This is the pattern described with reference to FIGS.
  • playback control information of the extended video stream is registered in SubPL ().
  • an SDR video stream, an SDR subtitle stream superimposed on the SDR video stream, and an audio stream are registered in CombiExt ().
  • RMAP video random access information is registered in TMAPExt ().
  • the stream that is set with the HDR video stream is registered with Combi (), and the stream that is set with the SDR video stream is , CombiExt (). That is, the set of streams related to the HDR video stream and the set of streams related to the SDR video stream are managed separately as completely different sets.
  • the player when it is determined which of the HDR video stream and the SDR video stream is to be played, the player (playback apparatus) can process only one of Combi () and CombiExt (). That's fine. Since Combi () and CombiExt () have the same data structure and the same semantics, it is possible to share part of the processing to Combi () and part of the processing to CombiExt () to simplify the processing. it can. In addition, there are advantages that system authoring is easy and player implementation / operation verification is easy (development costs can be reduced).
  • CombiExt () is extension data for Cell # n ()
  • Combi () corresponds to a part of CombiExt ().
  • Combi () and CombiExt () have the same data structure and the same semantics”
  • a part of the second playback control information stored in CombiExt () is stored in Combi (). This means that it has substantially the same data structure and semantics as part of the first reproduction control information.
  • a part of the second reproduction control information stored in CombiExt () has a data structure and semantics common to a part of the first reproduction control information stored in Combi ().
  • Combi () and CombiExt () have in common that they have specific information (VideoPID) such as the PID of the video stream.
  • VideoPID VideoPID
  • the BD in which each stream is registered in the database file is selectively used according to the reproduction environment, and has a wider luminance range than the SDR video stream and the SDR video stream.
  • a video stream is recorded.
  • the SDR video stream is a video stream in a standard luminance range
  • the HDR video stream is a video stream in a high luminance range.
  • a BD is an example of a recording medium.
  • an SDR subtitle stream and an HDR subtitle stream that are selectively used according to the reproduction environment, and a playlist file (XXX.PL in FIG. 46) storing the reproduction control information of the content are recorded on the BD. Is done.
  • the playlist file includes Combi () and CombiExt (). Combi () is an example of a management area in which reproduction control information regarding the main stream is stored, and CombiExt () is an example of an extension area.
  • Combi stores first playback control information that is specified to be played back in combination with the HDR video stream and the HDR subtitle stream. Is done.
  • CombiExt stores second reproduction control information that is designated to be reproduced by combining the SDR video stream and the SDR subtitle stream.
  • the player When a player playing a BD having such a configuration selects and plays back an HDR video stream, the player may read the first playback control information in Combi () as usual. On the other hand, when the player selects and reproduces the SDR video stream, the player may read the second reproduction control information in CombiExt ().
  • the BD playback control such as selection of a video stream is simplified. According to the BD, a video stream selection process and a reproduction process can be facilitated by a player who reproduces the BD.
  • a part of the second reproduction control information has a data structure common to the first reproduction control information.
  • a VOBI file indicating attributes relating to the entire BD is further recorded on the BD.
  • the VOBI file includes TMAP () and TMAPExt ().
  • Each of TMAP () and TMAPExt () stores random access information indicating the position in the video stream of independently decodable pictures included in the video stream.
  • the VOBI file is an example of a management information file
  • TMAP () is an example of a map area
  • TMAPExt () is an example of an extended map area.
  • TMAP () stores first random access information indicating the position in the HDR video stream of independently decodable pictures included in the HDR video stream.
  • TMAPExt () stores second random access information indicating the position in the SDR video stream of independently decodable pictures included in the SDR video stream.
  • the first random access information is an example of first map information
  • the second random access information is an example of second map information.
  • the player may read the first random access information in TMAP (), select the SDR video stream, When random access reproduction or the like is performed, the second random access information in TMAPExt () may be read. That is, according to such a BD, a video stream selection process and a playback process of a player that plays back the BD can be facilitated even when random access playback or the like is performed.
  • the BD further stores a sub playlist file (SubPL () in FIG. 46) in which playback control information related to the sub stream played back simultaneously with the main stream file is recorded. Is done.
  • the sub-playlist file stores third reproduction control information related to the extended video stream for extending the luminance range of the HDR video stream.
  • TMAP () stores first random access information and third random access information indicating the position in the extended stream of independently decodable pictures included in the extended video stream.
  • the third random access information is an example of third map information.
  • the player that reproduces the BD having such a configuration simultaneously reproduces the HDR video stream and the extension stream by reading the first reproduction control information in Combi () and the third reproduction control information in SubPL (). be able to. That is, according to such a BD, it is possible to facilitate the extension process of the HDR video stream by the player who plays the BD.
  • the player when performing random access playback or the like, the player only needs to read only the information in TMAP (). That is, according to such a BD, when an HDR video stream is expanded and random access playback or the like is performed, playback processing of a player that plays back the BD can be facilitated.
  • FIG. 47 shows three pieces of playback control information: first playback control information including an HDR video stream in one playlist, second playback control information including an SDR video stream, and third playback control information including an extended video stream.
  • first playback control information including an HDR video stream in one playlist
  • second playback control information including an SDR video stream
  • third playback control information including an extended video stream.
  • FIG. 47 after the start of the execution of the playlist file, the player can convert the content recorded on the BD, whether or not the HDR video stream of the player can be decoded, and the HDR video stream of the television connected to the player.
  • the content playback mode is determined based on the presence or absence of correspondence (S801).
  • the player If the player performs HDR playback of the content as a result of the determination, the player reads and plays the stream set registered in Combi () (S802).
  • the video playback unit included in the player when playing back content as HDR content, based on the first playback control information stored in Combi (), the HDR video stream and the HDR subtitle stream Is read and played.
  • the video playback unit when performing random access playback or the like using the content as HDR content, the video playback unit reads and plays back the HDR video stream and the HDR subtitle stream based on the first playback control information and the first random access information. .
  • the player when the player performs the extended HDR reproduction of the content as a result of the determination, the player reads and reproduces the stream set registered in Combi () and SubPL () (S803).
  • the video playback unit provided in the player reads and plays back the HDR video stream and the HDR subtitle stream based on the first playback control information, when playing back the content as HDR content in the extended luminance range.
  • the extended video stream is read and played based on the third playback control information.
  • the video playback unit when performing random access playback or the like as content with more extended brightness range, the video playback unit generates an HDR video stream and an HDR subtitle stream based on the first playback control information and the first random access information. Read and play, and read and play the extended video stream based on the third playback control information and the third random access information.
  • the player reads and plays the stream set registered in CombiExt () (S804).
  • the video reproduction unit included in the player reads and reproduces the SDR video stream and the SDR subtitle stream based on the second reproduction control information.
  • the video playback unit when performing random access playback or the like using content as SDR content, the video playback unit reads and plays back the SDR video stream and the SDR subtitle stream based on the second playback control information and the second random access information. .
  • the BD it is possible to facilitate the video stream selection process and the reproduction process of the player who reproduces the BD.
  • FIG. 48 is a diagram for explaining a problem when playing a disc in different playback environments according to one playlist in which HDR video and SDR video are registered.
  • a situation where a disc on which such a playlist is registered is reproduced in an AV environment where, for example, a living room HDR video can be reproduced, and a situation where the reproduction is performed in an AV environment where a bedroom HDR video cannot be reproduced. And comparing.
  • FIG. 49 is a diagram showing details of the data structure of Combi ().
  • Combi for each type such as video and audio, the number of streams of that type is registered first, and specific attribute information is described for each stream.
  • FIG. 50 is a diagram showing details of the data structure of CombiExt (). Combi () is described for each Cell, but CombiExt () is described in XXX. Since it is described only once in PL (), the data structure is such that Combi () equivalent data (CombiExt_for_Cell) is described collectively.
  • the player selects and reproduces either Combi () or CombiExt_for_Cell () depending on the situation. Applying the following restrictions to Combi () and CombiExt_for_Cell () is the most efficient and simple solution to the above problem.
  • the elementary streams registered in each of Combi () and CombiExt_for_Cell () for a predetermined cell are restricted.
  • Video # n () The video stream registered in each of Combi () and CombiExt_for_Cell () for each Cell should be a video stream obtained by encoding the same video content. Thereby, the video itself becomes the same regardless of the reproduction environment.
  • VideoPID PID of a video stream
  • the video streams registered in Combi () and CombiExt_for_Cell () for each Cell should have the same attribute (value).
  • the attributes (values) are VideoFormat (resolution), FrameRate (frame rate), AspectRatio (aspect ratio), CC (existence of closed captioning), and ISRC (content copyright information). As described with reference to FIG. 48, this is necessary to provide the same viewing experience regardless of the AV playback environment.
  • Subtitle # n () The subtitle stream registered in each of Combi () and CombiExt_for_Cell () for each Cell should be a subtitle stream obtained by encoding the same subtitle content. Thereby, the subtitles themselves are the same regardless of the reproduction environment. Similar to video, there are HDR subtitles and SDR subtitles. Since these subtitles are configured as completely separate streams, the SubtitlePID (PID of the subtitle stream) of each of the HDR subtitle and the SDR subtitle is different in the same manner as the video stream. Subtitle streams registered in Combi () and CombiExt_for_Cell () should have the same attribute (value).
  • the attributes (values) are Language (subtitle language) and ISRC (content copyright information).
  • the number of subtitle streams registered in each of Combi () and CombiExt_for_Cell () should be the same. Further, in the same Cell, M subtitle streams listed in Combi () (M is an integer equal to or greater than 1) and M subtitle streams listed in CombiExt_for_Cell () have the same N ( N is an arbitrary integer from 1 to M, and the attributes of the subtitle stream should be the same. That is, subtitle streams having the same attribute should be registered in the same order in both Combi () and CombiExt_for_Cell ().
  • the number of the subtitle stream that is currently selected for reproduction is represented by player variable # 2 (Subtitle stream number) shown in FIG.
  • the numbers here are the registration order of the subtitle streams in each of Combi () and CombiExt_for_Cell (), and are used as subtitle stream identification numbers. Therefore, when the program designates the Nth subtitle stream and issues a playback instruction, the Nth subtitle stream registered in Combi () or CombiExt_for_Cell () is selected. Therefore, if the Language (subtitle language) of the Nth registered subtitle stream differs between Combi () and CombiExt_for_Cell (), the program searches for subtitle streams in an order other than the Nth. There are things you have to do.
  • the program must understand which of Combi () and CombiExt_for_Cell () is being played. Further, when the program understands that CombiExt_for_Cell () is being reproduced, it must search for and select a subtitle stream in an order other than the Nth subtitle stream, not the Nth subtitle stream. Thus, it is necessary to prepare a program for selecting a subtitle stream on the disc.
  • a reproduction control program can be written in the same manner when either Combi () or CombiExt_for_Cell () is reproduced. For this reason, in this embodiment, the number of subtitle streams of Combi () and CombiExt_for_Cell () for each Cell, the registration order, and various subtitle attributes (Language, ISRC) for each registration order should be the same. It is.
  • the menu stream registered in Combi () and CombiExt () for each Cell should be a menu stream in which the same menu content is encoded. Thereby, the menu itself becomes the same regardless of the reproduction environment.
  • the menu includes an HDR menu and an SDR menu as in the case of video. Since these menus are configured as completely separate streams, the Menu PID of the HDR menu and the SDR menu (the PID of the menu stream) is different from the video stream.
  • the menu stream is a set of commands for individual buttons in addition to the data structure of the caption stream.
  • the menu streams registered in Combi () and CombiExt_for_Cell () for each Cell should have the same attribute (value).
  • the attributes (values) are Language (menu language) and ISRC (content copyright information).
  • the number of menu streams registered in Combi () and CombiExt_for_Cell () should be the same.
  • each of the M menu streams enumerated in Combi () (M is an integer of 1 or more) and the M menu streams enumerated in CombiExt_for_Cell () are the same N ( N is an arbitrary integer between 1 and M, and the attributes of the (th) menu stream should be the same.
  • menu streams with the same attributes should be registered in the same order in both Combi () and CombiExt_for_Cell () for each Cell. This is also necessary because menus of the same language are provided in the same way even under different playback environments as shown in FIG.
  • Audio PID PID of the audio stream
  • Coding encoding system
  • Ch. Number of channels
  • SamplingFreq. Sampling frequency
  • Language Speech language
  • ISRC content copyright
  • FIG. 51 shows YYY. It is a figure which shows the example of an extension in case VOBI contains both the HDR video and the stream set of SDR video.
  • VOBI contains both the HDR video and the stream set of SDR video.
  • the system stream indicated by VOBI includes HDR video, HDR subtitle, HDR menu, SDR video, SDR subtitle, SDR menu, audio, and the like.
  • Elementary stream HDR video, HDR subtitle, HDR menu, and audio
  • the description content of Attribute () may be the same as the description content of Combi () shown in FIG.
  • AttributeExt elementary streams (SDR video, SDR subtitles, SDR menu, and audio) that are reproduced together with the SDR video are registered in AttributeExt ().
  • the description content of AttributeExt () has the same format as Attribute ().
  • Each elementary stream registered in Attribute () and AttributeExt () is stored in one system stream corresponding to the elementary stream. Note that only the menu stream may be separately converted into a system stream.
  • the disc in the present embodiment is an SDR video expressed by the luminance of the first dynamic range, and an HDR video expressed by the luminance of the second dynamic range wider than the first dynamic range.
  • a playlist file (xxx.PL ()) for controlling the playback of the VOB stream file.
  • Combi () and CombiExt_for_Cell () indicating combinations of elementary streams that can be simultaneously reproduced in the same Cell are described.
  • CombiExt_for_Cell () lists elementary streams that can be played back simultaneously with the SDR video in the Cell
  • Combi () lists elementary streams that can be played back simultaneously with the HDR video in the Cell.
  • the number of elementary streams of the same type is the same in Combi () and CombiExt_for_Cell (). Therefore, for example, when playing back an SDR video, an elementary stream of the same type as an elementary stream played back simultaneously with the HDR video can be played back simultaneously with the SDR video. That is, the same type of elementary stream can be played back in both a playback environment that supports HDR and a playback environment that does not support HDR. As a result, it is possible to provide the user with the same viewing experience regardless of the reproduction environment other than viewing with respect to luminance.
  • the predetermined type of elementary stream is a subtitle stream.
  • the attribute is the language of the caption.
  • the language of the Nth subtitle stream of CombiExt_for_Cell () and the language of the Nth subtitle stream of Combi () are the same (for example, Japanese) in the same Cell.
  • the program can display a caption in a desired language (for example, Japanese) on the display without understanding which of Combi () and CombiExt_for_Cell () is being reproduced. That is, regardless of whether Combi () or CombiExt_for_Cell () is being played, the program can display, for example, Japanese subtitles by designating the Nth subtitle stream.
  • a desired language for example, Japanese
  • the predetermined type of elementary stream is a menu stream.
  • the attribute mentioned above is the language of the menu.
  • the language of the Nth menu stream of CombiExt_for_Cell () and the language of the Nth menu stream of Combi () are the same (for example, Japanese) in the same Cell.
  • the program can display a menu in a desired language (for example, Japanese) on the display without understanding which of Combi () and CombiExt_for_Cell () is being played. That is, regardless of whether Combi () or CombiExt_for_Cell () is played, the program can display a Japanese menu, for example, by specifying the Nth menu stream.
  • a desired language for example, Japanese
  • the predetermined type of elementary stream is an audio stream.
  • the above-described attributes are the audio encoding method, the number of audio channels, the audio sampling frequency, and the audio language. That is, in the same Cell, the encoding method and the number of channels of the Nth audio stream of CombiExt_for_Cell () and the encoding method and the number of channels of the Nth audio stream of Combi () are the same. .
  • the program can reproduce the sound such as a desired encoding method and the number of channels without understanding which of Combi () and CombiExt_for_Cell () is being reproduced. That is, regardless of whether Combi () or CombiExt_for_Cell () is being played back, the program can play back audio such as a desired encoding scheme and the number of channels by specifying the Nth audio stream. .
  • the playback device in the present embodiment reads and plays a stream from the above-described disc.
  • the playback device when playing back the SDR video, the playback device reads out any elementary stream listed in CombiExt_for_Cell () of the playlist file and plays it simultaneously with the SDR video.
  • the playback device when playing back HDR video, the playback device reads out any elementary stream listed in Combi () of the playlist file and plays it back simultaneously with the HDR video.
  • the playback device when playing back an SDR video, can play back the same type of elementary stream that is played back simultaneously with the HDR video at the same time as the SDR video.
  • the same viewing experience as when HDR video is played can be provided to the user, and confusion given to the user can be suppressed.
  • the playback device in the present embodiment is an element of a predetermined type and having the same attribute, regardless of whether SDR video or HDR video is played. Play a mental stream. Thereby, both when the SDR video is played back and when the HDR video is played back, the same viewing experience can be provided to the user in addition to the viewing with respect to the luminance.
  • each component may be configured by dedicated hardware or may be realized by executing a software program suitable for each component.
  • Each component may be realized by a program execution unit such as a CPU or a processor reading and executing a software program recorded on a recording medium such as a hard disk or a semiconductor memory.
  • the present disclosure is not limited to this embodiment. Unless it deviates from the gist of the present disclosure, various modifications that are conceivable by those skilled in the art and forms constructed by combining components in different embodiments are also included in the scope of the present disclosure. Also good.
  • the present disclosure may be realized as a recording medium manufacturing method (data recording method) or a recording medium manufacturing apparatus (data recording apparatus) as described above.
  • the present disclosure is an optical disc on which both a video stream in a standard luminance range and a video stream in a high luminance range are recorded, and can be used for an optical disc in which playback control of the video stream is easy.
  • the present disclosure can also be used as a playback device that reads and plays a video stream from such an optical disc.
  • BD playback program 102 BD management information 103 AV data 104 BD-ROM 202 Optical Pickup 203 Program Recording Memory 204 Management Information Recording Memory 205 AV Recording Memory 206 Program Processing Unit 207 Management Information Processing Unit 208 Presentation Processing Unit 209 Image Plane 210 Video Plane 211 Composite Processing Unit 302 Program Processor 303 UO Manager 305 Scenario Processor 306 Presentation Controller 307 Clock 308 Image memory 309 Track buffer 310 Demultiplexer 311 Image processor 312 Video processor 313 Sound processor 317 Drive controller 400 Decoder system 401 Basic decoder 402 Extended decoder 404 Extended plane (Enh.plane) 405 Expansion plane (HDRe plane) 406 Base + Enh. Plane 407 subtitle decoder 408 subtitle plane 409 graphics processor 410 high luminance subtitle plane 411 high luminance subtitle plane

Abstract

記録媒体には、VOBストリームファイルの再生を制御するためのプレイリストファイルが記録され、プレイリストファイルには、それぞれ同一のCellにおいて同時に再生できるエレメンタリストリームの組み合わせを示すCombiExt_for_Cell()およびCombi()が記述され、CombiExt_for_Cell()には、SDRビデオと同時に再生できるエレメンタリストリームが列挙され、Combi()には、HDRビデオと同時に再生できるエレメンタリストリームが列挙され、それぞれ同一のCellにおいて、CombiExt_for_Cell()に列挙される所定の種類のエレメンタリストリームの本数と、Combi()に列挙されるその所定の種類のエレメンタリストリームの本数とは等しい。

Description

記録媒体、再生方法、および再生装置
 本開示は、符号化されたビデオストリームが記録された記録媒体、そのビデオストリームを再生する再生方法、および再生装置に関するものである。
 従来、DVDに関する技術が開示されている(例えば、特許文献1参照)。
特開平9-282848号公報
 本開示の一態様に係る記録媒体は、第1のダイナミックレンジの輝度によって表現される第1の輝度映像と、前記第1のダイナミックレンジよりも広い第2のダイナミックレンジの輝度によって表現される第2の輝度映像とを含むストリームファイルと、前記ストリームファイルの再生を制御するためのプレイリストファイルとが記録され、前記プレイリストファイルには、それぞれ同一の再生区間において同時に再生できるエレメンタリストリームの組み合わせを示す第1および第2の組み合わせ情報が記述され、前記第1の組み合わせ情報には、当該再生区間において、前記第1の輝度映像と同時に再生できるエレメンタリストリームが列挙され、前記第2の組み合わせ情報には、当該再生区間において、前記第2の輝度映像と同時に再生できるエレメンタリストリームが列挙され、それぞれ前記同一の再生区間において、前記第1の組み合わせ情報に列挙される所定の種類のエレメンタリストリームの本数と、前記第2の組み合わせ情報に列挙される前記所定の種類のエレメンタリストリームの本数とは等しい。
 上記態様によれば、更なる改善を実現することができる。
図1は、SD-DVDの構造を示す図である。 図2は、AVデータであるMPEGストリーム中に埋め込まれているナビゲーション情報を説明する概要図である。 図3は、DVDにおけるVOBの構成を示す概要図である。 図4は、BD-ROMのデータ階層を示す図である。 図5は、BD-ROMに記録されている論理データの構造を示す図である。 図6は、BD-ROMを再生するBD-ROMプレーヤの基本的な構成の概要を示す図である。 図7は、図6に示すプレーヤの構成を詳細化したブロック図である。 図8は、BD-ROMのアプリケーション空間を示す図である。 図9は、MPEGストリーム(VOB)の構成を示す図である。 図10は、MPEGストリームにおけるパックの構成を示す図である。 図11は、AVデータとプレーヤ構成との関係を説明するための図である。 図12は、トラックバッファを使ったVOBデータ連続供給モデルを説明するための図である。 図13は、VOB管理情報ファイルの内部構造を示す図である。 図14は、VOBU情報の詳細を説明するための図である。 図15は、タイムマップを使ったアドレス情報取得方法を説明するための図である。 図16は、プレイリストの構成を示す図である。 図17は、イベントハンドラテーブルの構成を示す図である。 図18は、BD-ROM全体情報であるBD.INFOの構成を示す図である。 図19は、グローバルイベントハンドラテーブルの構成を示す図である。 図20は、タイムイベントの例を示す図である。 図21は、ユーザのメニュー操作によるユーザイベントの例を示す図である。 図22は、グローバルイベントの例を示す図である。 図23は、プログラムプロセッサの機能的な構成を説明するための図である。 図24は、システムパラメータ(SPRM)の一覧を示す図である。 図25は、2つの選択ボタンを持つメニュー画面の制御に係るイベントハンドラにおけるプログラムの例を示す図である。 図26は、メニュー選択のユーザイベントに係るイベントハンドラにおけるプログラムの例を示す図である。 図27は、BD-ROMプレーヤにおけるAVデータ再生の基本処理の流れを示すフローチャートである。 図28は、BD-ROMプレーヤにおけるプレイリスト再生開始からVOB再生終了までの処理の流れを示すフローチャートである。 図29の(A)は、BD-ROMプレーヤにおけるタイムイベントに係る処理の流れを示すフローチャートであり、図29の(B)は、BD-ROMプレーヤにおけるユーザイベントに係る処理の流れを示すフローチャートである。 図30は、BD-ROMプレーヤにおける字幕データの処理の流れを示すフローチャートである。 図31は、NALユニットの並びを説明する図である。 図32は、HDRビデオストリームのMPEG-2 TS多重化例を説明する図である。 図33は、HDRビデオストリームのMPEG-2 TS多重化例を説明する図である。 図34は、HDRビデオストリームのMPEG-2 TS多重化例を説明する図である。 図35は、HDRビデオストリームのMPEG-2 TS多重化例を説明する図である。 図36は、HDRビデオストリームのMPEG-2 TS多重化例を説明する図である。 図37は、HDRビデオストリームのMPEG-2 TS多重化例を説明する図である。 図38は、HDRビデオストリームのMPEG-2 TS多重化例を説明する図である。 図39は、字幕ストリームの構造を示す図である。 図40は、字幕の表示制御に使われるパラメーターの関係を示す図である。 図41は、管理情報と、その内容を説明する図である。 図42は、データベースファイルのデータ構造を示す図である。 図43は、HDRビデオストリームとその拡張ビデオストリームとの同期再生を説明する図である。 図44は、HDRビデオストリームとその拡張ビデオストリームとの同期再生を説明する図である。 図45は、HDRビデオストリームのデコーダモデルを説明する図である。 図46は、データベースファイルへの各ストリームの登録方法を示す図である。 図47は、プレーヤの再生処理のフローチャートである。 図48は、異なる再生環境でディスクの再生を行う際の課題を説明するための図である。 図49は、Combi()のデータ構造の詳細を示す図である。 図50は、CombiExt()のデータ構造の詳細を示す図である。 図51は、HDRビデオとSDRビデオのストリームセットの両方を含むYYY.VOBIを示す図である。
 (本発明の基礎となった知見)
 上記特許文献では、更なる改善が必要とされていた。本発明者は、「背景技術」の欄において記載した技術に関して課題が生じることを見出した。その課題について、以下、詳細に説明する。
 映像データを記録した情報記録媒体の代表格は、DVD(以下、「Standard Difinition(SD)-DVD」ともいう。)である。以下に従来のDVDについて説明する。
 図1は、SD-DVDの構造を示す図である。図1の下段に示すように、DVDディスク上にはリードインからリードアウトまでの間に論理アドレス空間が設けられている。その論理アドレス空間には先頭からファイルシステムのボリューム情報が記録され、続いて映像音声などのアプリケーションデータが記録されている。
 ファイルシステムとは、ISO9660やUniversal Disc Format(UDF)等の規格により定められたデータを管理する仕組みのことであり、ディスク上のデータをディレクトリまたはファイルと呼ばれる単位で表現する仕組みである。
 日常使っているパーソナルコンピュータ(PC)の場合でも、File Allocation Tables(FAT)またはNT File System(NTFS)と呼ばれるファイルシステムにより、ディレクトリやファイルという構造でハードディスクに記録されたデータがコンピュータ上で表現され、ユーザビリティを高めている。
 SD-DVDの場合、UDF及びISO9660の両方のファイルシステムが使用されている。両方を合わせて「UDFブリッジ」とも呼ばれる。記録されているデータはUDFまたはISO9660どちらのファイルシステムドライバによってもデータの読み出しができるようになっている。なお、ここで取り扱うDVDはパッケージメディア用のROMディスクであり、物理的に書き込みが不可能である。
 DVD上に記録されたデータは、UDFブリッジを通して、図1左上に示すようなディレクトリまたはファイルとして見ることができる。ルートディレクトリ(図1における「ROOT」)の直下に「VIDEO_TS」と呼ばれるディレクトリが置かれ、ここにDVDのアプリケーションデータが記録されている。アプリケーションデータは、複数のファイルとして記録され、主なファイルとして以下の種類のファイルがある。
  VIDEO_TS.IFO  ディスク再生制御情報ファイル
  VTS_01_0.IFO  ビデオタイトルセット#1再生制御情報ファイル
  VTS_01_0.VOB  ビデオタイトルセット#1ストリームファイル
.....
 上記例に示すように2つの拡張子が規定されている。「IFO」は再生制御情報が記録されたファイルであることを示す拡張子であり、「VOB」はAVデータであるMPEGストリームが記録されたファイルであることを示す拡張子である。
 再生制御情報とは、DVDで採用されたインタラクティビティ(ユーザの操作に応じて再生を動的に変化させる技術)を実現するための情報や、メタデータのような、AVデータに付属する情報などのことである。また、DVDでは一般的に再生制御情報のことをナビゲーション情報と呼ぶことがある。
 再生制御情報ファイルは、ディスク全体を管理する「VIDEO_TS.IFO」と、個々のビデオタイトルセット毎の再生制御情報である「VTS_01_0.IFO」がある。なお、DVDでは複数のタイトル、言い換えれば複数の異なる映画や楽曲を1枚のディスクに記録することが可能である。
 ここで、ファイル名ボディにある「01」はビデオタイトルセットの番号を示しており、例えば、ビデオタイトルセット#2の場合は、「VTS_02_0.IFO」となる。
 図1の右上部は、DVDのアプリケーション層でのDVDナビゲーション空間であり、前述した再生制御情報が展開された論理構造空間である。「VIDEO_TS.IFO」内の情報は、VIDEO Manager Information(VMGI)として、「VTS_01_0.IFO」または、他のビデオタイトルセット毎に存在する再生制御情報はVideo Title Set Information(VTSI)としてDVDナビゲーション空間に展開される。
 VTSIの中にはProgram Chain(PGC)と呼ばれる再生シーケンスの情報であるProgram Chain Information(PGCI)が記述されている。PGCIは、Cellの集合とコマンドと呼ばれる一種のプログラミング情報によって構成されている。
 Cell自身はVOB(Video Objectの略であり、MPEGストリームを指す)の一部区間または全部区間を指定する情報であり、Cellの再生は、当該VOBのCellによって指定された区間を再生することを意味している。
 コマンドは、DVDの仮想マシンによって処理されるものであり、例えば、ウェブページを表示するブラウザ上で実行されるJava(登録商標)Scriptなどに近いものである。しかしながらJava(登録商標)Scriptが論理演算の他にウィンドウやブラウザの制御(例えば、新しいブラウザのウィンドウを開くなど)を行うのに対して、DVDのコマンドは、論理演算の他にAVタイトルの再生制御、例えば、再生するチャプターの指定などを実行するだけのものである点で異なっている。
 Cellはディスク上に記録されているVOBの開始及び終了アドレス(論理アドレス)をその内部情報として有しており、プレーヤは、Cellに記述されたVOBの開始及び終了アドレス情報を使ってデータの読み出し、再生を実行する。
 図2は、AVデータであるMPEGストリーム中に埋め込まれているナビゲーション情報を説明する概要図である。
 SD-DVDの特長であるインタラクティビティは前述した「VIDEO_TS.IFO」や「VTS_01_0.IFO」などに記録されているナビゲーション情報だけによって実現されているのではなく、幾つかの重要な情報はナビゲーション・パック(ナビパックまたは、NV_PCKという。)と呼ばれる専用キャリアを使いVOB内に映像、音声データと一緒に多重化されている。
 ここでは簡単なインタラクティビティの例としてメニュー画面について説明する。メニュー画面上には、幾つかのボタンが現れ、それぞれのボタンには当該ボタンが選択実行された時の処理が定義されている。
 また、メニュー画面上では一つのボタンが選択されており(選択ボタン上に半透明色がオーバーレイされることで該ボタンがハイライトされ、該ボタンが選択状態であることをユーザに示す)、ユーザは、リモコンの上下左右キーを使って、選択状態のボタンを上下左右の何れかのボタンに移動させることが出来る。
 リモコンの上下左右キーを使って、選択実行したいボタンまでハイライトを移動させ、決定する(決定キーを押す)ことによって対応するコマンドのプログラムが実行される。一般的には対応するタイトルやチャプターの再生がコマンドによって実行されている。
 図2の左上部はNV_PCKに格納される情報の概要を示している。NV_PCK内には、ハイライトカラー情報と個々のボタン情報などが含まれている。ハイライトカラー情報には、カラーパレット情報が記述され、オーバーレイ表示されるハイライトの半透明色が指定される。
 ボタン情報には、個々のボタンの位置情報である矩形領域情報と、当該ボタンから他のボタンへの移動情報(ユーザの上下左右キー操作それぞれに対応する移動先ボタンの指定)と、ボタンコマンド情報(当該ボタンが決定された時に実行されるコマンド)とが記述されている。
 メニュー画面上のハイライトは、図2の右上部に示すように、オーバーレイ画像として作られる。オーバーレイ画像は、ボタン情報の矩形領域情報にカラーパレット情報の色を付した物である。このオーバーレイ画像は図2の右部に示す背景画像と合成されて画面上に表示される。
 前述のようにして、DVDではメニュー画面を実現している。また、何故、ナビゲーションデータの一部をNV_PCKを使ってストリーム中に埋め込んでいるのかについては、以下の理由からである。
 すなわち、ストリームと同期して動的にメニュー情報を更新、例えば、映画再生中の途中5分~10分の間にだけメニュー画面を表示するといった、同期タイミングが問題となりやすい処理を問題なく実現できるようにするためである。
 また、もう一つの大きな理由は、NV_PCKには特殊再生を支援するための情報を格納し、DVD再生時の早送り、巻き戻しなどの非通常再生時にも円滑にAVデータをデコードし再生させる等、ユーザの操作性を向上させるためである。
 図3は、DVDにおけるVOBの構成を示す概要図である。図に示すように、映像、音声、字幕などのデータ(図3の(1))は、MPEGシステム(ISO/IEC13818-1)規格に基づいて、パケット及びパック化し(図3の(2))、それぞれを多重化して1本のMPEGプログラムストリームにしている(図3の(3))。
 また、前述した通りインタラクティブを実現するためのボタンコマンドを含んだNV_PCKも一緒に多重化をされている。
 MPEGシステムの多重化の特徴として、多重化する個々のデータは、そのデコード順に基づくビット列になっているが、多重化されるデータ間、即ち、映像、音声、字幕の間は必ずしも再生順、言い換えればデコード順に基づいてビット列が形成されているわけではないことが挙げられる。
 これはMPEGシステムストリームのデコーダモデル(図3の(4)、一般にSystem Target Decoder、またはSTDと呼ばれる)が多重化を解いた後に個々のエレメンタリストリームに対応するデコーダバッファを持ち、デコードタイミングまでに一時的にデータを蓄積している事に由来している。
 このデコーダバッファは、個々のエレメンタリストリーム毎にサイズが異なり、映像に対しては、232kB、音声に対しては4kB、字幕に対しては52kBをそれぞれ有している。
 このため、各デコーダバッファへのデータ入力タイミングは個々のエレメンタリストリームで異なるため、MPEGシステムストリームとしてビット列を形成する順番と表示(デコード)されるタイミングにずれが生じている。
 即ち、映像データと並んで多重化されている字幕データが必ずしも同一タイミングでデコードされているわけでは無い。
 ここで、ブルーレイディスク(Blu-ray(登録商標) Disc)のような大容量記録メディアにおいては、非常に高品位な映像情報を格納できる可能性がある。なお、Blu-ray(登録商標) Discは、BDまたはBD-ROMとも称される。
 例えば、4K(3840x2160ピクセルの解像度を持つ映像情報)またはHDR(High Dynamic Rangeと一般に呼ばれる高輝度映像情報)などの映像情報をBDに格納することができると考えられる。なお、従来の標準輝度映像情報は、SDR(Standard Dynamic Range)と一般に呼ばれる。
 ここで、HDR対応のテレビと、HDRに非対応(SDRのみに対応)のテレビとの両方でコンテンツを再生するために、HDRとSDRとが両方記録されるBDがある。このようなBDにおいては、高輝度のビデオの上に標準輝度の字幕またはグラフィックスを重畳すると、字幕またはグラフィックスの輝度が不足するため、SDRとHDRのそれぞれに応じたストリームの再生制御が行われる。また、HDRに対応している再生環境では、HDRビデオが再生される制御が行われ、HDRに対応していない再生環境では、SDRビデオが再生される制御が行われる。
 しかし、HDR対応の再生環境と、HDR非対応の再生環境とで、ビデオと同時に再生される字幕、メニューおよび音声などに違いがあると、ユーザに混乱を与えてしまうという課題がある。
 なお、HDR対応の再生環境と、HDR非対応の再生環境とにおいて、ビデオ、字幕およびメニューのそれぞれの輝度のダイナミックレンジは異なる。しかし、HDR対応の再生環境では、字幕が再生されるが、HDR非対応の再生環境では、字幕が再生されないことが生じると、輝度に対する視聴以外において、ユーザに異なる視聴体験を提供してしまう。または、それぞれの再生環境で字幕が再生されても、字幕の言語が、例えば日本語と英語のように異なっていると、ユーザに異なる視聴体験を提供してしまう。
 本発明者は、上記課題を解決するために、下記の改善策を検討した。
 本開示の一態様に係る記録媒体は、第1のダイナミックレンジの輝度によって表現される第1の輝度映像と、前記第1のダイナミックレンジよりも広い第2のダイナミックレンジの輝度によって表現される第2の輝度映像とを含むストリームファイルと、前記ストリームファイルの再生を制御するためのプレイリストファイルとが記録され、前記プレイリストファイルには、それぞれ同一の再生区間において同時に再生できるエレメンタリストリームの組み合わせを示す第1および第2の組み合わせ情報が記述され、前記第1の組み合わせ情報には、当該再生区間において、前記第1の輝度映像と同時に再生できるエレメンタリストリームが列挙され、前記第2の組み合わせ情報には、当該再生区間において、前記第2の輝度映像と同時に再生できるエレメンタリストリームが列挙され、それぞれ前記同一の再生区間において、前記第1の組み合わせ情報に列挙される所定の種類のエレメンタリストリームの本数と、前記第2の組み合わせ情報に列挙される前記所定の種類のエレメンタリストリームの本数とは等しい。なお、第1の輝度映像は例えばSDRビデオであり、第2の輝度映像は例えばHDRビデオである。また、ストリームファイルは、例えばVOBストリームファイルである。また、第1および第2の組み合わせ情報はそれぞれ、例えばCombiExt_for_Cell()およびCombi()である。
 これにより、第1および第2の組み合わせ情報において、同一種類のエレメンタリストリームの本数は等しい。したがって、例えば第1の輝度映像を再生するときには、第2の輝度映像と同時に再生されるエレメンタリストリームと同じ種類のエレメンタリストリームを、その第1の輝度映像と同時に再生することができる。つまり、第2の輝度映像(HDRビデオ)に対応した再生環境でも、第2の輝度映像(HDRビデオ)に対応していない再生環境でも、同じ種類のエレメンタリストリームを再生することができる。その結果、輝度に対する視聴以外において、再生環境によらず、同じ視聴体験をユーザに提供することができ、ユーザに与える混乱を抑えることができる。
 また、それぞれ前記同一の再生区間において、前記第1の組み合わせ情報に列挙されるM本(Mは1以上の整数)の前記所定の種類のエレメンタリストリームと、前記第2の組み合わせ情報に列挙されるM本の前記所定の種類のエレメンタリストリームとの、それぞれの同じN(Nは1以上M以下の任意の整数)番目のエレメンタリストリームの属性は同一であってもよい。例えば、前記所定の種類のエレメンタリストリームは、字幕ストリームであり、前記属性は、字幕の言語である。
 これにより、プログラムは、第1および第2の組み合わせ情報の何れの再生が行われているかを理解することなく、所望の言語(例えば日本語)の字幕をディスプレイに表示させることができる。つまり、第1および第2の組み合わせ情報の何れの再生が行われていても、プログラムは、N番目の字幕ストリームを指定すれば、例えば日本語の字幕を表示させることができる。
 また、例えば前記所定の種類のエレメンタリストリームは、メニューストリームであり、前記属性は、メニューの言語であってもよい。
 これにより、プログラムは、第1および第2の組み合わせ情報の何れの再生が行われているかを理解することなく、所望の言語(例えば日本語)のメニューをディスプレイに表示させることができる。つまり、第1および第2の組み合わせ情報の何れの再生が行われていても、プログラムは、N番目のメニューストリームを指定すれば、例えば日本語のメニューを表示させることができる。
 また、例えば前記所定の種類のエレメンタリストリームは、音声ストリームであり、前記属性は、音声の符号化方式、音声のチャンネル数、音声のサンプリング周波数、および音声の言語であってもよい。
 これにより、プログラムは、第1および第2の組み合わせ情報の何れで再生が行われているかを理解することなく、所望の符号化方式およびチャンネル数などの音声を再生することができる。つまり、第1および第2の組み合わせ情報の何れの再生が行われていても、プログラムは、N番目の音声ストリームを指定すれば、所望の符号化方式およびチャンネル数などの音声を再生することができる。
 また、本開示の一態様に係る再生装置は、記録媒体からストリームを読み出して再生する再生装置であって、前記記録媒体には、第1のダイナミックレンジの輝度によって表現される第1の輝度映像と、前記第1のダイナミックレンジよりも広い第2のダイナミックレンジの輝度によって表現される第2の輝度映像とを含むストリームファイルと、前記ストリームファイルの再生を制御するためのプレイリストファイルとが記録され、前記プレイリストファイルには、それぞれ同一の再生区間において同時に再生できるエレメンタリストリームの組み合わせを示す第1および第2の組み合わせ情報が記述され、前記第1の組み合わせ情報には、当該再生区間において、前記第1の輝度映像と同時に再生できるエレメンタリストリームが列挙され、前記第2の組み合わせ情報には、当該再生区間において、前記第2の輝度映像と同時に再生できるエレメンタリストリームが列挙され、それぞれ前記同一の再生区間において、前記第1の組み合わせ情報に列挙される、所定の種類のエレメンタリストリームの本数と、前記第2の組み合わせ情報に列挙される、前記所定の種類のエレメンタリストリームの本数とは等しく、前記再生装置は、前記第1の輝度映像を再生する場合には、前記プレイリストファイルの前記第1の組み合わせ情報に挙げられている何れかのエレメンタリストリームを読み出して、前記第1の輝度映像と同時に再生し、前記第2の輝度映像を再生する場合には、前記プレイリストファイルの前記第2の組み合わせ情報に挙げられている何れかのエレメンタリストリームを読み出して、前記第2の輝度映像と同時に再生する。
 これにより、再生装置は、例えば第1の輝度映像を再生するときには、第2の輝度映像と同時に再生されるエレメンタリストリームと同じ種類のエレメンタリストリームを、その第1の輝度映像と同時に再生することができる。その結果、輝度に対する視聴以外において、第2の輝度映像が再生される場合と同じ視聴体験をユーザに提供することができ、ユーザに与える混乱を抑えることができる。
 また、それぞれ前記同一の再生区間において、前記第1の組み合わせ情報に列挙されるM本(Mは1以上の整数)の前記所定の種類のエレメンタリストリームと、当該再生区間における前記第2の組み合わせ情報に列挙されるM本の前記所定の種類のエレメンタリストリームとの、それぞれの同じN(Nは1以上M以下の任意の整数)番目のエレメンタリストリームの属性は同一であり、前記再生装置は、N番目を指定することによって、前記第1の輝度映像が再生される場合にも、前記第2の輝度映像が再生される場合にも、前記所定の種類であって同一の属性のエレメンタリストリームを再生してもよい。
 これにより、第1の輝度映像が再生される場合にも、第2の輝度映像が再生される場合にも、輝度に対する視聴以外において、同じ視聴体験をユーザに提供することができる。
 なお、これらの全般包括的または具体的な態様は、装置、方法、システム、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なCD-ROMなどの記録媒体で実現されてもよく、システム、方法、集積回路、コンピュータプログラムまたは記録媒体の任意な組み合わせで実現されてもよい。
 以下、添付の図面を参照しながら、本開示を実施するための最良の形態ついて説明する。
 なお、本願請求項1に係る発明に最も近い実施の形態は実施の形態2であるが、理解を容易にするために、実施の形態2における情報記録媒体等の基本的な構成を説明する実施の形態1を先に説明する。
 (実施の形態1)
 まず、BD-ROMおよびBD-ROMを再生するBD-ROMプレーヤの基本的な構成および動作について、図1~図30を用いて説明する。
 (ディスク上の論理データ構造)
 図4は、BD-ROMのデータ階層を示す図である。
 図4に示すように、ディスク媒体であるBD-ROM104上には、AVデータ103と、AVデータに関する管理情報及びAV再生シーケンスなどのBD管理情報102と、インタラクティブを実現するBD再生プログラム101とが記録されている。
 なお、本実施の形態では、映画などのAVコンテンツを再生するためのAVアプリケーションを主眼においてBD-ROMの説明を行うが、BD-ROMをCD-ROMやDVD-ROMの様にコンピュータ用途の記録媒体として使用することも当然のことながら可能である。
 図5は、前述のBD-ROM104に記録されている論理データの構造を示す図である。BD-ROM104は、他の光ディスク、例えばDVDやCDなどと同様にその内周から外周に向けてらせん状に記録領域を持ち、内周のリードインと外周のリードアウトの間に論理データを記録できる論理アドレス空間を有している。
 また、リードインの内側にはBurst Cutting Area(BCA)と呼ばれる、ドライブでしか読み出せない特別な領域がある。この領域はアプリケーションから読み出せないため、例えば著作権保護技術などに利用されることがよくある。
 論理アドレス空間には、ファイルシステム情報(ボリューム)を先頭に映像データなどのアプリケーションデータが記録されている。ファイルシステムとは従来技術で説明した通り、UDFやISO9660等の規格により定められたデータを管理する仕組みのことであり、通常のPCと同じように記録されている論理データをディレクトリ、ファイル構造を使って読み出しする事が可能になっている。
 本実施の形態の場合、BD-ROM104上のディレクトリ、ファイル構造は、ルートディレクトリ(ROOT)直下にBDVIDEOディレクトリが置かれている。このディレクトリはBD-ROMで扱うAVデータや管理情報などのデータ(図4に示すBD再生プログラム101、BD管理情報102、AVデータ103)が記録されているディレクトリである。
 BDVIDEOディレクトリの下には、次の7種類のファイルが記録されている。
 BD.INFO(ファイル名固定)
 「BD管理情報」の一つであり、BD-ROM全体に関する情報を記録したファイルである。BD-ROMプレーヤは最初にこのファイルを読み出す。
 BD.PROG(ファイル名固定)
 「BD再生プログラム」の一つであり、BD-ROM全体に関わるプログラムを記録したファイルである。
 XXX.PL(「XXX」は可変、拡張子「PL」は固定)
 「BD管理情報」の一つであり、シナリオを記録するプレイリスト(Play List)情報を記録したファイルである。プレイリスト毎に1つのファイルを持っている。
 XXX.PROG(「XXX」は可変、拡張子「PROG」は固定)
 「BD再生プログラム」の一つであり、前述したプレイリスト毎のプログラムを記録したファイルである。プレイリストとの対応はファイルボディ名(「XXX」が一致する)によって識別される。
 YYY.VOB(「YYY」は可変、拡張子「VOB」は固定)
 「AVデータ」の一つであり、VOB(従来例で説明したVOBと同じ)を記録したファイルである。1つのVOBは1つのファイルに対応する。
 YYY.VOBI(「YYY」は可変、拡張子「VOBI」は固定)
 「BD管理情報」の一つであり、AVデータであるVOBに関わる管理情報を記録したファイルである。VOBとの対応はファイルボディ名(「YYY」が一致する)によって識別される。
 ZZZ.PNG(「ZZZ」は可変、拡張子「PNG」は固定)
 「AVデータ」の一つであり、字幕及びメニュー画面を構成するためのイメージデータであるPNG(World Wide Web Consortium(W3C)によって標準化された画像フォーマットであり「ピング」と読む。)形式のイメージファイルである。1つのPNGイメージは1つのファイルに対応する。
 (プレーヤの構成)
 次に、前述のBD-ROM104を再生するプレーヤの構成について図6及び図7を用いて説明する。
 図6は、BD-ROM104を再生するBD-ROMプレーヤの基本的な構成の概要を示す図である。
 図6に示すBD-ROMプレーヤにおいて、BD-ROM104上のデータは、光ピックアップ202を通して読み出される。読み出されたデータはそれぞれのデータの種類に応じて専用のメモリに記録される。
 BD再生プログラム(「BD.PROG」または「XXX.PROG」ファイル)はプログラム記録メモリ203に、BD管理情報(「BD.INFO」、「XXX.PL」または「YYY.VOBI」ファイル)は管理情報記録メモリ204に、AVデータ(「YYY.VOB」または「ZZZ.PNG」ファイル)はAV記録メモリ205にそれぞれ記録される。
 プログラム記録メモリ203に記録されたBD再生プログラムはプログラム処理部206によって処理される。管理情報記録メモリ204に記録されたBD管理情報は管理情報処理部207によって処理される。
 また、AV記録メモリ205に記録されたAVデータはプレゼンテーション処理部208によって処理される。
 プログラム処理部206は、管理情報処理部207から再生するプレイリストの情報やプログラムの実行タイミングなどのイベント情報を受け取りプログラムの処理を行う。また、プログラムで、再生するプレイリストを動的に変更する事が可能であり、この場合は管理情報処理部207に対して変更後のプレイリストの再生命令を送ることで実現する。
 プログラム処理部206は、更に、ユーザからのイベント、例えば、ユーザが操作するリモコンからのリクエストを受け付け、ユーザイベントに対応するプログラムがある場合は、実行処理する。
 管理情報処理部207は、プログラム処理部206の指示を受け、その指示に対応するプレイリスト及びそのプレイリストに対応したVOBの管理情報を解析する。更に、プレゼンテーション処理部208に再生の対象となるAVデータの再生を指示する。
 また、管理情報処理部207は、プレゼンテーション処理部208から基準時刻情報を受け取り、時刻情報に基づいてプレゼンテーション処理部208にAVデータ再生の停止指示を行う。更に、プログラム処理部206に対してプログラム実行タイミングを示すイベントを生成する。
 プレゼンテーション処理部208は、映像、音声、および字幕それぞれのデータに対応するデコーダを持ち、管理情報処理部207からの指示に従い、AVデータのデコード及び出力を行う。映像データ及び字幕データは、デコード後にそれぞれの専用プレーンに描画される。
 具体的には、映像データはビデオプレーン210に描画され、字幕データ等のイメージデータはイメージプレーン209に描画される。更に、2つのプレーンに描画された映像の合成処理が合成処理部211によって行われTVなどの表示デバイスへ出力される。
 図6で示すように、BD-ROMプレーヤは図4で示したBD-ROM104に記録されているデータ構造に基づいた構成をとっている。
 図7は、図6に示すプレーヤの構成を詳細化したブロック図である。図6に示す各構成部と、図7に示す各構成部との対応は以下の通りである。
 AV記録メモリ205はイメージメモリ308とトラックバッファ309に対応する。プログラム処理部206はプログラムプロセッサ302とUO(User Operation)マネージャ303に対応する。管理情報処理部207はシナリオプロセッサ305とプレゼンテーションコントローラ306とに対応する。プレゼンテーション処理部208はクロック307、デマルチプレクサ310、イメージプロセッサ311、ビデオプロセッサ312とサウンドプロセッサ313とに対応する。
 BD-ROM104から読み出されたVOBデータ(MPEGストリーム)はトラックバッファ309に、イメージデータ(PNG)はイメージメモリ308にそれぞれ記録される。
 デマルチプレクサ310は、クロック307から得られる時刻に基づき、トラックバッファ309に記録されたVOBデータを抜き出す。更に、VOBデータに含まれる映像データをビデオプロセッサ312に音声データをサウンドプロセッサ313にそれぞれ送り込む。
 ビデオプロセッサ312及びサウンドプロセッサ313はそれぞれMPEGシステム規格で定められる通りに、デコーダバッファとデコーダからそれぞれ構成されている。即ち、デマルチプレクサ310から送りこまれる映像、音声それぞれのデータは、それぞれのデコーダバッファに一時的に記録され、クロック307に従い個々のデコーダでデコード処理される。
 イメージメモリ308に記録されたPNGデータは、次の2つの処理方法がある。PNGデータが字幕用の場合は、プレゼンテーションコントローラ306によってデコードタイミングが指示される。クロック307からの時刻情報をシナリオプロセッサ305が一旦受け、適切な字幕表示が行えるように、字幕表示時刻(開始及び終了)になればプレゼンテーションコントローラ306に対して字幕の表示、非表示の指示を出す。
 プレゼンテーションコントローラ306からデコード/表示の指示を受けたイメージプロセッサ311は対応するPNGデータをイメージメモリ308から抜き出し、デコードし、イメージプレーン209に描画する。
 また、PNGデータがメニュー画面用の場合は、プログラムプロセッサ302によってデコードタイミングが指示される。プログラムプロセッサ302がいつイメージのデコードを指示するかは、プログラムプロセッサ302が処理しているBDプログラムに因るものであって一概には決まらない。
 イメージデータ及び映像データは、図6で説明したようにそれぞれデコード後にイメージプレーン209およびビデオプレーン210に描画され、合成処理部211によって合成出力される。
 BD-ROM104から読み出された管理情報(シナリオ、AV管理情報)は、管理情報記録メモリ204に記録されるが、シナリオ情報(「BD.INFO」及び「XXX.PL」)はシナリオプロセッサ305によって読み出され処理される。また、AV管理情報(「YYY.VOBI」)はプレゼンテーションコントローラ306によって読み出され処理される。
 シナリオプロセッサ305は、プレイリストの情報を解析し、プレイリストによって参照されているVOBとその再生位置をプレゼンテーションコントローラ306に指示し、プレゼンテーションコントローラ306は対象となるVOBの管理情報(「YYY.VOBI」)を解析して、対象となるVOBを読み出すようにドライブコントローラ317に指示を出す。
 ドライブコントローラ317はプレゼンテーションコントローラ306の指示に従い、光ピックアップ202を移動させ、対象となるAVデータの読み出しを行う。読み出されたAVデータは、前述したようにイメージメモリ308またはトラックバッファ309に記録される。
 また、シナリオプロセッサ305は、クロック307の時刻を監視し、管理情報で設定されているタイミングでイベントをプログラムプロセッサ302に投げる。
 プログラム記録メモリ203に記録されたBDプログラム(「BD.PROG」または「XXX.PROG」)は、プログラムプロセッサ302によって実行処理される。プログラムプロセッサ302がBDプログラムを処理するのは、シナリオプロセッサ305からイベントが送られてきた場合か、UOマネージャ303からイベントが送られてきた場合である。
 UOマネージャ303は、ユーザからリモコンキーによってリクエストが送られてきた場合に、当該リクエストに対応するイベントを生成しプログラムプロセッサ302に送る。
 このような各構成部の動作により、BD-ROMの再生がおこなわれる。
 (アプリケーション空間)
 図8は、BD-ROMのアプリケーション空間を示す図である。
 BD-ROMのアプリケーション空間では、プレイリスト(PlayList)が一つの再生単位になっている。プレイリストはセル(Cell)の再生シーケンスから構成される静的なシナリオと、プログラムによって記述される動的なシナリオとを有している。
 プログラムによる動的なシナリオが無い限り、プレイリストは個々のセルを順に再生するだけであり、また、全てのセルの再生を終了した時点でプレイリストの再生は終了する。
 一方で、プログラムは、プレイリストを超えての再生記述や、ユーザの選択またはプレーヤの状態に応じて再生する対象を動的に変えることが可能である。典型的な例としてはメニュー画面を介した再生対象の動的変更が挙げられる。BD-ROMの場合、メニューとはユーザの選択によって再生するシナリオ、即ちプレイリストを動的に選択するための機能の構成要素の1つである。
 また、ここで言うプログラムは、時間イベントまたはユーザイベントによって実行されるイベントハンドラの事である。
 時間イベントは、プレイリスト中に埋め込まれた時刻情報に基づいて生成されるイベントである。図7で説明したシナリオプロセッサ305からプログラムプロセッサ302に送られるイベントがこれに相当する。時間イベントが発行されると、プログラムプロセッサ302はIDによって対応付けられるイベントハンドラを実行処理する。
 前述した通り、実行されるプログラムが他のプレイリストの再生を指示することが可能であり、この場合には、現在再生されているプレイリストの再生は中止され、指定されたプレイリストの再生へと遷移する。
 ユーザイベントは、ユーザのリモコンキー操作によって生成されるイベントである。ユーザイベントは大きく2つのタイプに分けられる。一つ目は、リモコンが備えるカーソルキー(「上」「下」「左」「右」キー)または「決定」キーの操作によって生成されるメニュー選択のイベントである。
 メニュー選択のイベントに対応するイベントハンドラはプレイリスト内の限られた期間でのみ有効である。つまり、プレイリストの情報として、個々のイベントハンドラの有効期間が設定されている。プログラムプロセッサ302は、リモコンの「上」「下」「左」「右」キーまたは「決定」キーが押された時に有効なイベントハンドラを検索して、有効なイベントハンドラがある場合は当該イベントハンドラが実行処理される。他の場合は、メニュー選択のイベントは無視されることになる。
 二つ目のユーザイベントは、「メニュー」キーの操作によって生成されるメニュー画面呼び出しのイベントである。メニュー画面呼び出しのイベントが生成されると、グローバルイベントハンドラが呼ばれる。
 グローバルイベントハンドラはプレイリストに依存せず、常に有効なイベントハンドラである。この機能を使うことにより、DVDのメニューコールを実装することができる。メニューコールを実装することにより、タイトル再生中に音声、字幕メニューなどを呼び出し、音声または字幕を変更後に中断した地点からのタイトル再生を実行することができる。
 プレイリストで静的シナリオを構成する単位であるセル(Cell)はVOB(MPEGストリーム)の全部または一部の再生区間を参照したものである。セルはVOB内の再生区間を開始、終了時刻の情報として持っている。個々のVOBと一対になっているVOB管理情報(VOBI)は、その内部にタイムマップ(Time MapまたはTM)を有しており、このタイムマップによって前述したVOBの再生、終了時刻をVOB内(即ち対象となるファイル「YYY.VOB」内)での読み出し開始アドレス及び終了アドレスを導き出すことが可能である。なおタイムマップの詳細は図14を用いて後述する。
 (VOBの詳細)
 図9は、本実施の形態で使用するMPEGストリーム(VOB)の構成を示す図である。図9に示すように、VOBは複数のVideo Object Unit(VOBU)によって構成されている。VOBUは、MPEGビデオストリームにおけるGroup Of Pictures(GOP)を基準とする単位であり、音声データも含んだ多重化ストリームとしての一再生単位である。
 VOBUは0.4秒から1.0秒の再生時間を持ち、通常は0.5秒の再生時間を持っている。これはMPEGのGOPの構造が通常は15フレーム/秒(NTSCの場合)であることによって導かれるものである。
 VOBUは、その内部に映像データであるビデオパック(V_PCK)と、音声データであるオーディオパック(A_PCK)とを有している。各パックは1セクタで構成され、本実施の形態の場合は2kB単位で構成されている。
 図10は、MPEGストリームにおけるパックの構成を示す図である。
 図10に示すように、映像データ及び音声データといったエレメンタリデータは、ペイロードと呼ばれるパケットのデータ格納領域に先頭から順次入れられていく。ペイロードにはパケットヘッダが付けられ1つのパケットを構成する。
 パケットヘッダには、ペイロードに格納してあるデータがどのストリームのデータであるのか、映像データであるのか音声データであるのか、および、映像データまたは音声データがそれぞれ複数ストリーム分ある場合に、どのストリームのデータなのかを識別するためのID(stream_id)、並びに、当該ペイロードのデコード及び表示時刻情報であるタイムスタンプであるDecode Time Stamp(DTS)及びPresentation Time Stamp(PTS)が記録されている。
 DTSおよびPTSは必ずしも全てのパケットヘッダに記録されている訳ではなく、MPEGによって記録するルールが規定されている。ルールの詳細についてはMPEGシステム(ISO/IEC13818-1)規格書に記述されているので省略する。
 パケットには更にヘッダ(パックヘッダ)が付けられ、パックを構成する。パックヘッダには、当該パックがいつデマルチプレクサ310を通過し、個々のエレメンタリストリームのデコーダバッファに入力されるかを示すタイムスタンプであるSystem Clock Reference(SCR)が記録されている。
 (VOBのインターリーブ記録)
 図11及び図12を用いてVOBファイルのインターリーブ記録について説明する。
 図11は、AVデータとBD-ROMプレーヤの構成との関係を説明するための図である。
 図11上段の図は、図7を用いて前述したプレーヤ構成図の一部である。図の通り、BD-ROM上のデータは、光ピックアップ202を通してVOB即ちMPEGストリームであればトラックバッファ309へ入力され、PNG即ちイメージデータであればイメージメモリ308へと入力される。
 トラックバッファ309はFirst-In First-Out(FIFO)であり、入力されたVOBのデータは入力された順にデマルチプレクサ310へと送られる。この時、前述したSCRに従って個々のパックはトラックバッファ309から引き抜かれデマルチプレクサ310を介してビデオプロセッサ312またはサウンドプロセッサ313へとデータが送り届けられる。
 一方で、イメージデータの場合は、どのイメージを描画するかはプレゼンテーションコントローラ306(図7参照)によって指示される。また、描画に使ったイメージデータは、字幕用イメージデータの場合は同時にイメージメモリ308から削除されるが、メニュー用のイメージデータの場合は、イメージメモリ308内にそのまま残される。
 これはメニューの描画はユーザ操作に依存するところがあるため、同一イメージを複数回描画する可能性があるためである。
 図11下段の図は、BD-ROM上でのVOBファイル及びPNGファイルのインターリーブ記録を示す図である。
 一般的にROM、例えばCD-ROMやDVD-ROMの場合、一連の連続再生単位となるAVデータは連続記録されている。連続記録されている限り、ドライブは順次データを読み出しプレーヤ側に送り届けるだけでよい。
 しかしながら、連続再生すべきAVデータが分断されてディスク上に離散配置されている場合は、個々の連続区間の間でシーク操作が入ることになり、この間データの読み出しが止まることになる。つまり、データの供給が止まる可能性がある。
 BD-ROMの場合も同様に、VOBファイルは連続領域に記録することができる方が望ましいが、例えば字幕データのようにVOBに記録されている映像データと同期して再生されるデータがあり、VOBファイルと同様に字幕データも何らかの方法によってBD-ROMから読み出す事が必要になる。
 字幕データの読み出し方法の一手段として、VOBの再生開始前に一まとめで字幕用のイメージデータ(PNGファイル)を読み出してしまう方法がある。しかしながら、この場合には一時記録に使用する大量のメモリが必要となり、現実的ではない。
 そこで、本実施の形態では、VOBファイルを幾つかのブロックに分けて、VOBファイルとイメージデータとをインターリーブ記録する方式を使用する。
 図11下段はそのインターリーブ記録を説明するための図である。VOBファイルとイメージデータを適切にインターリーブ配置することで、前述したような大量の一時記録メモリ無しに、必要なタイミングでイメージデータをイメージメモリ308に格納することが可能になる。
 しかしながらイメージデータを読み出している際には、VOBデータの読み込みは当然のことながら停止することになる。
 図12は、上記のインターリーブ記録における問題を解決するトラックバッファ309を使ったVOBデータ連続供給モデルを説明するための図である。
 既に説明したように、VOBのデータは、一旦トラックバッファ309に蓄積される。トラックバッファ309へのデータ入力レートをトラックバッファ309からのデータ出力レートより高く設定すると、BD-ROMからデータを読み出し続けている限り、トラックバッファ309のデータ蓄積量は増加をしていくことになる。
 ここでトラックバッファ309への入力レートをVa、トラックバッファ309からの出力レートをVbとする。図12の上段の図に示すようにVOBの一連続記録領域が論理アドレスの“a1”から“a2”まで続くとする。また、“a2”から“a3”の間は、イメージデータが記録されていて、VOBデータの読み出しが行えない区間であるとする。
 図12の下段の図は、トラックバッファ309の蓄積量を示す図である。横軸が時間、縦軸がトラックバッファ309内部に蓄積されているデータ量を示している。時刻“t1”がVOBの一連続記録領域の開始点である“a1”の読み出しを開始した時刻を示している。
 この時刻以降、トラックバッファ309にはレートVa-Vbでデータが蓄積されていくことになる。このレートは言うまでもなくトラックバッファ309の入出力レートの差である。時刻“t2”は一連続記録領域の終了点である“a2”のデータを読み込む時刻である。
 即ち時刻“t1”から“t2”の間レートVa-Vbでトラックバッファ309内はデータ量が増加していき、時刻“t2”でのデータ蓄積量B(t2)は下記の(式1)によって求めることができる。
    B(t2) = (Va-Vb)×(t2-t1)    (式1)
 この後、BD-ROM上のアドレス“a3”まではイメージデータが続くため、トラックバッファ309への入力は0となり、出力レートである“-Vb”でトラックバッファ309内のデータ量は減少していくことになる。このデータ量の減少は読み出し位置“a3”まで、つまり、時刻でいう“t3”まで続く。
 ここで大事なことは、時刻“t3”より前にトラックバッファ309に蓄積されているデータ量が0になると、デコーダへ供給するVOBのデータが無くなってしまい、VOBの再生がストップしてしまうことである。
 しかしながら、時刻“t3”でトラックバッファ309にデータが残っている場合には、VOBの再生がストップすることなく連続して行われることを意味している。
 このVOBの再生がストップすることなく連続して行われるための条件は下記の(式2)によって示すことができる。
    B(t2) ≧ -Vb×(t3-t2)        (式2)
 即ち、(式2)を満たすようにイメージデータの配置を決めればよい事になる。
 (ナビゲーションデータ構造)
 図13から図19を用いて、BD-ROMに記録されたナビゲーションデータ(BD管理情報)の構造について説明をする。
 図13は、VOB管理情報ファイル(“YYY.VOBI”)の内部構造を示す図である。
 VOB管理情報は、当該VOBのストリーム属性情報(Attribute)とタイムマップ(TMAP)とを有している。ストリーム属性情報は、ビデオ属性(Video)、オーディオ属性(Audio#0~Audio#m)個々に持つ構成となっている。特にオーディオストリームの場合は、VOBが複数本のオーディオストリームを同時に持つことができることから、オーディオストリーム数(Number)によって、オーディオ属性のデータフィールドの数が特定される。
 下記はビデオ属性(Video)の持つフィールドとそれぞれが持ち得る値の例である。
  圧縮方式(Coding):
    MPEG1
    MPEG2
    MPEG4
  解像度(Resolution):
    1920x1080
    1280x720
    720x480
    720x565
  アスペクト比(Aspect):
    4:3
    16:9
  フレームレート(Framerate):
    60
    59.94
    50
    30
    29.97
    25
    24
 下記はオーディオ属性(Audio)の持つフィールドとそれぞれが持ち得る値の例である。
  圧縮方式(Coding):
    AC3
    MPEG1
    MPEG2
    LPCM
  チャンネル数(Ch):
    1~8
  言語属性(Language):
    JPN、ENG、・・・
 タイムマップ(TMAP)はVOBU毎の情報を持つテーブルであって、当該VOBが有するVOBU数(Number)と各VOBU情報(VOBU#1~VOBU#n)を持つ。
 個々のVOBU情報は、VOBUの再生時間長(Duration)とVOBUのデータサイズ(Size)とを有している。
 図14は、VOBU情報の詳細を説明するための図である。
 広く知られているように、MPEGストリームは時間的側面とデータサイズとしての側面との2つの物理量についての側面を有している。例えば、音声の圧縮規格であるAudio Code number 3(AC3)は固定ビットレートでの圧縮を行っているため、時間とアドレスとの関係は1次式によって求めることができる。
 しかしながらMPEGビデオデータの場合、個々のフレームは固定の表示時間、例えばNTSCの場合、1フレームは1/29.97秒の表示時間を持つが、個々のフレームの圧縮後のデータサイズは絵の特性や圧縮に使ったピクチャタイプ、いわゆるI/P/Bピクチャによってデータサイズは大きく変わってくる。
 従って、MPEGビデオの場合は、時間とアドレスとの関係は一般式の形で表現することは不可能である。
 当然の事として、MPEGビデオデータを多重化しているMPEGストリーム、即ちVOBについても、時間とデータとを一般式の形で表現することは不可能である。
 これに代わって、VOB内での時間とアドレスとの関係を結びつけるのがタイムマップ(TMAP)である。図14に示すように、VOBU毎にVOBU内のフレーム数と、VOBU内のパック数とをそれぞれエントリとして持つテーブルがタイムマップ(TMAP)である。
 図15を使って、タイムマップ(TMAP)の使い方を説明する。
 図15は、タイムマップを使ったアドレス情報取得方法を説明するための図である。
 図15に示すように時刻情報(Time)が与えられた場合、まずは当該時刻がどのVOBUに属するのかを検索する。具体的には、タイムマップのVOBU毎のフレーム数を加算して行き、フレーム数の和が、当該時刻をフレーム数に換算した値を超えるまたは一致するVOBUが当該時刻に対応するVOBUになる。
 次に、タイムマップのVOBU毎のサイズを当該VOBUの直前のVOBUまで加算して行き、その値が与えられた時刻を含むフレームを再生するために読み出すべきパックの先頭アドレス(Address)になっている。
 このようにして、MPEGストリームにおいて、与えられた時刻情報に対応するアドレスを得ることができる。
 次に図16を使って、プレイリスト(“XXX.PL”)の内部構造を説明する。
 図16は、プレイリストの構成を示す図である。
 プレイリストは、セルリスト(CellList)とイベントリスト(EventList)とから構成されている。
 セルリスト(CellList)は、プレイリスト内の再生セルシーケンスを示す情報であり、本リストの記述順でセルが再生される事になる。
 セルリスト(CellList)の中身は、セルの数(Number)と各セル情報(Cell#1~Cell#n)である。
 各セル情報(Cell#~Cell#n)は、VOBファイル名(VOBName)、当該VOB内での有効区間開始時刻(In)及び有効区間終了時刻(Out)と、字幕テーブル(SubtitleTable)を持っている。
 有効区間開始時刻(In)及び有効区間終了時刻(Out)は、それぞれ当該VOB内でのフレーム番号で表現され、前述したタイムマップ(TMAP)を使うことによって再生に必要なVOBデータのアドレスを得る事ができる。
 字幕テーブル(SubtitleTable)は、当該VOBと同期再生される字幕情報を持つテーブルである。字幕は音声同様に複数の言語を持つことができ、字幕テーブル(SubtitleTable)は言語数(Number)とそれに続く個々の言語ごとのテーブル(Language#1~Language#k)とから構成されている。
 各言語のテーブル(Language#1~Language#k)は、言語情報(Language)と、表示される字幕の字幕情報数(Number)と、表示される字幕の字幕情報(Speech#1~Speech#j)とから構成され、各字幕情報(Speech#1~Speech#j)は対応するイメージデータファイル名(Name)、字幕表示開始時刻(In)及び字幕表示終了時刻(Out)と、字幕の表示位置(Position)とから構成されている。
 イベントリスト(EventList)は、当該プレイリスト内で発生するイベントを定義したテーブルである。イベントリストは、イベント数(Number)に続いて個々のイベント(Event#1~Event#m)とから構成され、各イベント(Event#1~Event#m)は、イベントの種類(Type)、イベントのID(ID)、イベント生成時刻(Time)と有効期間(Duration)とから構成されている。
 図17は、個々のプレイリスト毎のイベントハンドラ(時間イベントと、メニュー選択用のユーザイベント)を持つイベントハンドラテーブル(“XXX.PROG”)の構成を示す図である。
 イベントハンドラテーブルは、定義されているイベントハンドラ/プログラム数(Number)と個々のイベントハンドラ/プログラム(Program#1~Program#n)を有している。
 各イベントハンドラ/プログラム(Program#1~Program#n)内の記述は、イベントハンドラ開始の定義(<event_handler>タグ)と前述したイベントのIDと対になるイベントハンドラのID(event_handler id)を持ち、その後に当該プログラムが“function”に続く括弧“{”と“}”との間に記述される。
 次に図18を用いてBD-ROM全体に関する情報(“BD.INFO”)の内部構造について説明をする。
 図18は、BD-ROM全体情報であるBD.INFOの構成を示す図である。
 BD-ROM全体情報は、タイトルリスト(TitleList)とグローバルイベント用のイベントリスト(EventList)とから構成されている。
 タイトルリスト(TitleList)は、ディスク内のタイトル数(Number)と、これに続く各タイトル情報(Title#1~Title#n)とから構成されている。
 各タイトル情報(Title#1~Title#n)は、タイトルに含まれるプレイリストのテーブル(PLTalble)とタイトル内のチャプターリスト(ChapterList)とを含んでいる。プレイリストのテーブル(PLTable)はタイトル内のプレイリストの数(Number)と、プレイリスト名(Name)即ちプレイリストのファイル名を有している。
 チャプターリスト(ChapterList)は、当該タイトルに含まれるチャプター数(Number)と各チャプター情報(Chapter#1~Chapter#n)とから構成され、各チャプター情報(Chapter#1~Chapter#n)は当該チャプターが含むセルのテーブル(CellTable)を持ち、セルのテーブル(CellTable)はセル数(Number)と各セルのエントリ情報(CellEntry#1~CellEntry#k)とから構成されている。
 セルのエントリ情報(CellEntry#1~CellEntry#k)は当該セルを含むプレイリスト名と、プレイリスト内でのセル番号によって記述されている。
 イベントリスト(EventList)は、グローバルイベントの数(Number)と各グローバルイベントの情報(Event#1~Event#m)とを持っている。ここで注意すべきは、最初に定義されるグローバルイベントは、ファーストイベント(FirstEvent)と呼ばれ、BD-ROMがプレーヤに挿入された時、最初に実行されるイベントである。
 各グローバルイベントの情報(Event#1~Event#m)はイベントタイプ(Type)とイベントのID(ID)だけを持っている。
 図19は、グローバルイベントハンドラテーブル(“BD.PROG”)の構成を示す図である。本テーブルは、図17で説明したイベントハンドラテーブルと同一内容であり、その説明は省略する。
 (イベント発生のメカニズム)
 図20から図22を使ってイベント発生のメカニズムについて説明する。
 図20は、タイムイベントの例を示す図である。
 前述したとおり、タイムイベントはプレイリスト(“XXX.PL”)のイベントリスト(EventList)で定義される。
 タイムイベントとして定義されているイベント、即ちイベントタイプ(Type)が“TimeEvent”の場合、イベント生成時刻(“t1”)になった時点で、ID“Ex1”を持つタイムイベントがシナリオプロセッサ305からプログラムプロセッサ302に対して出力される。
 プログラムプロセッサ302は、イベントID“Ex1”を持つイベントハンドラを探し、対象のイベントハンドラを実行処理する。例えば、本実施の形態の場合では、2つのボタンイメージの描画を行うことなどが可能である。
 図21は、ユーザのメニュー操作によるユーザイベントの例を示す図である。
 前述したとおり、メニュー操作によるユーザイベントもプレイリスト(“XXX.PL”)のイベントリスト(EventList)で定義される。
 ユーザイベントとして定義されるイベント、即ちイベントタイプ(Type)が“UserEvent”の場合、イベント生成時刻(“t1”)になった時点で、当該ユーザイベントがレディとなる。この時、イベント自身は未だ生成されてはいない。
 当該イベントは、有効規格情報(Duration)で記される期間(“T1”)レディ状態にある。
 図21に示すように、ユーザによりリモコンキーの「上」「下」「左」「右」キーのいずれかのキー、または「決定」キーが押された場合、まずUOイベントがUOマネージャ303によって生成されプログラムプロセッサ302に出力される。
 プログラムプロセッサ302は、シナリオプロセッサ305に対してUOイベントを流し、シナリオプロセッサ305はUOイベントを受け取った時刻に有効なユーザイベントが存在するかを検索する。
 シナリオプロセッサ305は、検索の結果、対象となるユーザイベントがあった場合、ユーザイベントを生成し、プログラムプロセッサ302に出力する。
 プログラムプロセッサ302では、イベントID、例えば、図21に示す例の場合では“Ev1”を持つイベントハンドラを探し、対象のイベントハンドラを実行処理する。本例の場合、プレイリスト#2の再生を開始する。
 生成されるユーザイベントには、どのリモコンキーがユーザによって押されたかの情報は含まれていない。選択されたリモコンキーの情報は、UOイベントによってプログラムプロセッサ302に伝えられ、仮想プレーヤが持つレジスタに記録保持される。
 イベントハンドラのプログラムは、このレジスタの値を調べ、分岐処理を実行することが可能である。
 図22は、グローバルイベントの例を示す図である。
 前述のように、グローバルイベントはBD-ROM全体情報(“BD.INFO”)のイベントリスト(EventList)で定義される。
 グローバルイベントとして定義されるイベント、即ちイベントタイプ(Type)が“GlobalEvent”であるイベントは、ユーザのリモコンキー操作があった場合にのみ生成される。
 ユーザによりメニューキーが押された場合、先ずUOイベントがUOマネージャ303によって生成されプログラムプロセッサ302に出力される。プログラムプロセッサ302は、シナリオプロセッサ305に対してUOイベントを流す。
 シナリオプロセッサ305は、該当するグローバルイベントを生成し、プログラムプロセッサ302に送る。プログラムプロセッサ302は、イベントID“menu”を持つイベントハンドラを探し、対象のイベントハンドラを実行する。例えば、図22に示す例の場合、プレイリスト#3の再生を開始している。
 本実施の形態では、単にメニューキーと呼んでいるが、DVDを再生するプレーヤにおけるリモコンのように複数のメニューキーがあってもよい。各メニューキーに対応するIDをそれぞれ定義することで各メニューキーに対応する適切な処理が可能である。
 (仮想プレーヤマシン)
 図23は、プログラムプロセッサ302の機能的な構成を説明するための図である。
 図23を用いてプログラムプロセッサ302の機能的な構成を説明する。
 プログラムプロセッサ302は、内部に仮想プレーヤマシンを持つ処理モジュールである。仮想プレーヤマシンはBD-ROMとして定義された機能モデルであって、各BD-ROMプレーヤの実装には依存しないものである。即ち、どのBD-ROMプレーヤにおいても同様の機能を実行できることを保証している。
 仮想プレーヤマシンは大きく2つの機能を持っている。プログラミング関数とプレーヤ変数である。プレーヤ変数はレジスタに記憶され保持されている。
 プログラミング関数は、Java(登録商標) Scriptをベースとして、以下に記す3つの機能をBD-ROM固有関数として定義している。
  リンク関数:現在の再生を停止し、指定するプレイリスト、セル、時刻からの再生を開始する。
  Link(PL#,Cell#,time)
    PL# : プレイリスト名
    Cell# : セル番号
    time : セル内での再生開始時刻
  PNG描画関数:指定PNGデータをイメージプレーン209に描画する
  Draw(File,X,Y)
    File : PNGファイル名
    X : X座標位置
    Y : Y座標位置
  イメージプレーンクリア関数:イメージプレーン209の指定領域をクリアする
  Clear(X,Y,W,H)
    X : X座標位置
    Y : Y座標位置
    W : X方向幅
    H : Y方向幅
 また、プレーヤ変数は、プレーヤの設定値等を示すシステムパラメータ(SPRM)と、一般用途として使用可能なゼネラルパラメータ(GPRM)とがある。
 図24は、システムパラメータ(SPRM)の一覧を示す図である。
  SPRM(0)   : 言語コード
  SPRM(1)   : 音声ストリーム番号
  SPRM(2)   : 字幕ストリーム番号
  SPRM(3)   : アングル番号
  SPRM(4)   : タイトル番号
  SPRM(5)   : チャプター番号
  SPRM(6)   : プログラム番号
  SPRM(7)   : セル番号
  SPRM(8)   : 選択キー情報
  SPRM(9)   : ナビゲーションタイマー
  SPRM(10)  : 再生時刻情報
  SPRM(11)  : カラオケ用ミキシングモード
  SPRM(12)  : パレンタル用国情報
  SPRM(13)  : パレンタルレベル
  SPRM(14)  : プレーヤ設定値(ビデオ)
  SPRM(15)  : プレーヤ設定値(オーディオ)
  SPRM(16)  : 音声ストリーム用言語コード
  SPRM(17)  : 音声ストリーム用言語コード(拡張)
  SPRM(18)  : 字幕ストリーム用言語コード
  SPRM(19)  : 字幕ストリーム用言語コード(拡張)
  SPRM(20)  : プレーヤリージョンコード
  SPRM(21)  : 予備
  SPRM(22)  : 予備
  SPRM(23)  : 再生状態
  SPRM(24)  : 予備
  SPRM(25)  : 予備
  SPRM(26)  : 予備
  SPRM(27)  : 予備
  SPRM(28)  : 予備
  SPRM(29)  : 予備
  SPRM(30)  : 予備
  SPRM(31)  : 予備
 なお、本実施の形態では、仮想プレーヤのプログラミング関数をJava(登録商標) Scriptベースとしたが、Java(登録商標) Scriptではなく、UNIX(登録商標) OSなどで使われているB-Shellや、Perl Scriptなど他のプログラミング関数であってもよい。言い換えれば、本開示におけるプログラム言語はJava(登録商標) Scriptに限定されるものでは無い。
 (プログラムの例)
 図25及び図26は、イベントハンドラにおけるプログラムの例を示す図である。
 図25は、2つの選択ボタンを持つメニュー画面の制御に係るイベントハンドラにおけるプログラムの例を示す図である。
 セル(PlayList#1.Cell#1)先頭でタイムイベントを使って図25左側のプログラムが実行される。ここでは、最初にゼネラルパラメータの一つGPRM(0)に“1”がセットされている。GPRM(0)は、当該プログラムの中で、選択されているボタンを識別するのに使っている。最初の状態では、左側に配置するボタン[1]が選択されている状態を初期値として持たされている。
 次に、PNGの描画を描画関数である“Draw”を使ってボタン[1]、ボタン[2]それぞれについて行っている。ボタン[1]は、座標(10、200)を起点(左上端)としてPNGイメージ“1black.png”を描画している。ボタン[2]は、座標(330,200)を起点(左上端)としてPNGイメージ“2white.png”を描画している。
 また、本セル最後ではタイムイベントを使って図25右側のプログラムが実行される。ここでは、Link関数を使って当該セルの先頭から再度再生するように指定している。
 図26は、メニュー選択のユーザイベントに係るイベントハンドラにおけるプログラムの例を示す図である。
 「左」キー、「右」キー、「決定」キー何れかのリモコンキーが押された場合それぞれに対応するプログラムがイベントハンドラに書かれている。ユーザによりリモコンキーが押された場合、図21を用いて説明したように、ユーザイベントが生成され、図26のイベントハンドラが起動されることになる。
 本イベントハンドラでは、選択ボタンを識別しているGPRM(0)の値と、選択されたリモコンキーを識別するSPRM(8)を使って以下のように分岐処理を行っている。
 条件1)ボタン[1]が選択されている、かつ、選択キーが「右」キーの場合
  GPRM(0)を2に再設定して、選択状態にあるボタンを右のボタン[2]に変更する。
  ボタン[1]、ボタン[2]のイメージをそれぞれ書き換える。
 条件2)選択キーが「決定(OK)」の場合で、ボタン[1]が選択されている場合
  プレイリスト#2の再生を開始する。
 条件3)選択キーが「決定(OK)」の場合で、ボタン[2]が選択されている場合
  プレイリスト#3の再生を開始する。
 図26に示すプログラムは、上記のように解釈され実行される。
 (プレーヤ処理フロー)
 図27から図30を用いてプレーヤでの処理の流れを説明する。
 図27は、BD-ROMプレーヤにおけるAVデータ再生の基本処理の流れを示すフローチャートである。
 BD-ROMが挿入されると(S101)、BD-ROMプレーヤは“BD.INFO”の読み込みと解析(S102)、および、“BD.PROG”の読み込み(S103)を実行する。“BD.INFO”及び“BD.PROG”は共に管理情報記録メモリ204に一旦格納され、シナリオプロセッサ305によって解析される。
 続いて、シナリオプロセッサ305は、“BD.INFO”ファイル内のファーストイベント(FirstEvent)情報に従い、最初のイベントを生成する(S104)。生成されたファーストイベントは、プログラムプロセッサ302で受け取られ、当該イベントに対応するイベントハンドラを実行処理する(S105)。
 ファーストイベントに対応するイベントハンドラには、最初に再生するべきプレイリストを指定する情報が記録されていることが期待される。仮に、プレイリスト再生が指示されていない場合には、プレーヤは何も再生することなく、ユーザイベントを受け付けるのを待ち続けるだけになる(S201でNo)。
 UOマネージャ303は、ユーザからのリモコン操作を受け付けると(S201でYes)、プログラムプロセッサ302に対するUOイベントを生成する(S202)。
 プログラムプロセッサ302は、UOイベントがメニューキーによるものであるかを判別し(S203)、メニューキーの場合(S203でYes)は、シナリオプロセッサ305にUOイベントを流し、シナリオプロセッサ305がユーザイベントを生成する(S204)。プログラムプロセッサ302は生成されたユーザイベントに対応するイベントハンドラを実行処理する(S205)。
 図28は、BD-ROMプレーヤにおけるプレイリスト再生開始からVOB再生終了までの処理の流れを示すフローチャートである。
 前述したように、ファーストイベントハンドラまたはグローバルイベントハンドラによってプレイリスト再生が開始される(S301)。シナリオプロセッサ305は、再生対象のプレイリスト再生に必要な情報として、プレイリスト“XXX.PL”の読み込みと解析(S302)、および、プレイリストに対応するプログラム情報“XXX.PROG”の読み込みを行う(S303)。
 続いてシナリオプロセッサ305は、プレイリストに登録されているセル情報に基づいてセルの再生を開始する(S304)。セル再生は、シナリオプロセッサからプレゼンテーションコントローラ306に対して要求が出される事を意味し、プレゼンテーションコントローラ306はAVデータ再生を開始する(S305)。
 AVデータの再生が開始されると、プレゼンテーションコントローラ306は、再生するセルに対応するVOBの情報ファイル“XXX.VOBI”を読み込み(S402)、解析する。プレゼンテーションコントローラ306は、タイムマップを使って再生開始するVOBUとそのアドレスを特定し、ドライブコントローラ317に読み出しアドレスを指示する。ドライブコントローラ317は対象となるVOBデータ“YYY.VOB”を読み出す(S403)。
 読み出されたVOBデータはデコーダに送られ再生が開始される(S404)。VOB再生は、当該VOBの再生区間が終了するまで続けられ(S405)、終了すると次のセルが存在する場合(S406でYes)、Cellの再生(S304)へ移行する。また、次のセルが無い場合(S406でNo)は、再生に係る処理が終了する。
 図29は、AVデータ再生開始後からのイベント処理の流れを示すフローチャートである。
 図29の(A)は、BD-ROMプレーヤにおけるタイムイベントに係る処理の流れを示すフローチャートである。
 なお、BD-ROMプレーヤはイベントドリブン型のプレーヤモデルである。プレイリストの再生を開始すると、タイムイベント系、ユーザイベント系、字幕表示系のイベント処理プロセスがそれぞれ起動され、平行してイベント処理を実行するようになる。
 BD-ROMプレーヤにおいてプレイリスト再生の再生が開始されると(S501)、プレイリスト再生が終了していないことが確認され(S502でNo)、シナリオプロセッサ305は、タイムイベント発生時刻になったかを確認する(S503)。
 タイムイベント発生時刻になっている場合(S503でYes)には、シナリオプロセッサ305はタイムイベントを生成する(S504)。プログラムプロセッサ302はタイムイベントを受け取り、イベントハンドラを実行処理する(S505)。
 また、タイムイベント発生時刻になっていない場合(S503でNo)、および、イベントハンドラの実行処理が終了した場合、プレイリスト再生の終了確認(S502)以降の処理を繰り返す。
 また、プレイリスト再生が終了したことが確認されると(S502でYes)、タイムイベント系の処理は強制的に終了する。
 図29の(B)は、BD-ROMプレーヤにおけるユーザイベントに係る処理の流れを示すフローチャートである。
 BD-ROMプレーヤにおいてプレイリストの再生が開始されると(S601)、プレイリスト再生が終了していないことが確認され(S602でNo)、UOマネージャ303は、UOの受け付けがあったかを確認する。
 UOの受け付けがあった場合(S603でYes)、UOマネージャ303はUOイベントを生成する(S604)。プログラムプロセッサ302はUOイベントを受け取り、そのUOイベントがメニューコールであるかを確認する。
 メニューコールであった場合(S605でYes)、プログラムプロセッサ302はシナリオプロセッサ305にイベントを生成させ(S607)、プログラムプロセッサ302はイベントハンドラを実行処理する(S608)。
 また、UOイベントがメニューコールで無いと判断された場合(S605でNo)、UOイベントはカーソルキーまたは「決定」キーによるイベントである事を示している。この場合、現在時刻がユーザイベント有効期間内であるかをシナリオプロセッサ305が判断し、有効期間内である場合(S606でYes)には、シナリオプロセッサ305がユーザイベントを生成し(S607)、プログラムプロセッサ302が対象のイベントハンドラを実行処理する(S608)。
 また、UO受付が無い場合(S603でNo)、現在時刻がユーザイベント有効期間内にない場合(S606でNo)、および、イベントハンドラの実行処理が終了した場合、プレイリスト再生の終了確認(S602)以降の処理を繰り返す。
 また、プレイリスト再生が終了したことが確認されると(S602でYes)、ユーザイベント系の処理は強制的に終了する。
 図30は、BD-ROMプレーヤにおける字幕データの処理の流れを示すフローチャートである。
 BD-ROMプレーヤにおいてプレイリストの再生が開始されると、プレイリスト再生が終了していないことが確認され(S702でNo)、シナリオプロセッサ305は、字幕表示開始時刻になったかを確認する。字幕表示開始時刻になっている場合(S703でYes)、シナリオプロセッサ305はプレゼンテーションコントローラ306に字幕描画を指示し、プレゼンテーションコントローラ306はイメージプロセッサ311に字幕描画を指示する。イメージプロセッサ311は、その指示に従い字幕をイメージプレーン209に字幕を描画する(S704)。
 また、字幕表示開始時刻になっていない場合(S703でNo)、字幕表示終了時刻であるかを確認する。字幕表示終了時刻であると判断された場合(S705でYes)、プレゼンテーションコントローラ306がイメージプロセッサ311に字幕消去指示を行う。
 イメージプロセッサ311は、その指示に従い描画されている字幕をイメージプレーン209から消去する(S706)。
 また、イメージプロセッサ311による字幕描画(S704)が終了した場合、イメージプロセッサ311による字幕消去(S706)のが終了した場合、および、字幕表示終了時刻でないと判断(S705でNo)された場合、プレイリスト再生の終了確認(S702)以降の処理を繰り返す。
 また、プレイリスト再生が終了したことが確認されると(S702でYes)、字幕表示系の処理は強制的に終了する。
 以上の動作により、BD-ROMプレーヤは、ユーザの指示またはBD-ROMに記録されているBD管理情報等に基づき、BD-ROMの再生に係る基本的な処理を行う。
 (実施の形態2)
 次に本開示の実施の形態2について説明する。
 実施の形態2は、BDでの高輝度(HDR:High Dynamic Range)映像情報の記録または再生に関する内容である。実施の形態2は、基本的には実施の形態1に基づくため、実施の形態2において拡張されている部分または異なる部分を中心に、以下、説明する。
 図31は、MPEG-4 AVC(別名H.264)、もしくはHEVC(別名H.265)のような映像符号化方式を用いて高輝度化メタデータを送る方法を説明する図である。ここでは、MPEG-2 Videoでのランダムアクセス性を高めるために用いられたGOP(Group Of Pictures)と同等のピクチャ参照構成から成る単位を、MPEG-4 AVC、もしくはHEVCでのGOPとして、複数のピクチャをグループ化して符号化している。
 図31の(a)は、GOP先頭のピクチャ(first access unit)における複数のNALユニットの符号化順番を示している。GOP先頭のピクチャでは、1つのAU delimiter、1つのSPS、1つ以上のPPS、0個または複数のSEI message、ピクチャを構成する1つ以上のSliceのそれぞれのNALユニットが続いた後、必要に応じてFiller data、End of sequence、End of streamのそれぞれのNALユニットが続く。
 SEI message(SEI(s))では、必要に応じて、Buffering period SEI messageに続けて、他の幾つかのSEI messageが続く。例えば、(1)このGOP内のピクチャの参照関係を示したUser data unregistered SEI message(GOP)、(2)このピクチャのClosed Captioning情報を持つUser data unregistered SEI message(CC)、(3)このビデオシーケンス(VOB)内の全てのピクチャの中での最大輝度または最小輝度などの輝度範囲を示す基本的かつ静的な高輝度化メタデータを含むUser data unregistered SEI message(HDRb)、(4)このピクチャもしくはGOP内の全てのピクチャの中での最大輝度または最小輝度などの輝度範囲を示すように、SEI message(HDRb)よりも詳細で動的な高輝度化メタデータを含むUser data unregistered SEI message(HDRe)、などの幾つかのSEI messageが、この順番で符号化されている。
 上述のSEI message(HDRb)またはSEI message(HDRe)は、映像情報と一緒に伝送される。これは、マスタリングの際に利用された輝度に関する情報を伝送し、映像情報をデコードした後に得られる各ピクセルごとの輝度値(Y)が、実際にはどの程度の明るさ(cd/m^2)に相当するのかなどの情報を与えるためである。
 例えば、ビデオをデコードした結果、輝度値(Y)が1000の値を持つピクセルのマスタリング時の輝度は5000cd/m^2だった、といったピクセルの持つ輝度とマスタリング時の輝度との相関情報などが、上述のSEI message(HDRb)またはSEI message(HDRe)に含まれる。また、プレーヤに接続したTVが表現できる最高輝度(cd/m^2)が取得された場合、ピクチャ全体の輝度方向のダイナミックレンジを変更するための情報を、上述のSEI message(HDRb)またはSEI message(HDRe)に持たせてもよい。
 SEI message(HDRb)は、HDRビデオシーケンスであることを示すためにピクチャ単位もしくはGOP単位で伝送されるSEI messageであり、ビデオシーケンス(VOB)全体の静的な輝度に関する情報を伝送している。ここで言うHDRビデオシーケンスとは、SEI message(HDRb)が記録されているビデオシーケンスのこととする。
 より詳細でかつ動的な輝度に関する情報を伝送するSEI message(HDRe)は、HDRビデオシーケンスに記録されている必要はなく、HDRビデオシーケンス中に1つも存在しなくてもよい。また、SEI message(HDRe)は、存在する場合には、必ずSEI message(HDRb)の直後に符号化されるSEI messageであり、ピクチャ単位もしくはGOP単位で輝度に関する情報を伝送している。
 図31の(b)は、GOP先頭のピクチャではないピクチャ(non-first access unit)における複数のNALユニットの符号化順番を示している。GOP先頭でないピクチャでは、1つのAU delimiter、0個または1個のPPS、0個または複数のSEI message、ピクチャを構成する1つ以上のSliceのそれぞれのNALユニットが続く。さらにその後に、必要に応じて、Filler data、End of sequence、End of streamのそれぞれのNALユニットが続く。
 SEI message(HDRb)またはSEI message(HDRe)は、それぞれ上記の情報を格納しており、この図31に示す方法では、ピクチャごとに付与されている。GOP単位で輝度に関する情報を伝送する場合には、SEI message(HDRb)およびSEI message(HDRe)はともにGOP先頭のピクチャのみに付与され、GOP先頭でないピクチャには一切付与されない。
 図32は、SEI message(HDRe)まで含むHDRビデオストリームをMPEG-2 TSで多重化する方法を説明する図である。なお、本実施の形態において、シーケンスは、ストリームと同義であってもよく、ストリームの一部であってもよい。1ピクチャ(1フレームまたは1 video access unit)を1PESパケットに格納して、HDRビデオストリームをPES化した後、PID=Xの各TSパケットのペイロードに、PESパケットにおけるデータが分割されて順番に格納される。
 図32に示す方法の場合、同じPID(PID=X)の各TSパケットに、stream_id=0xE1のPESパケットとされる、SEI message(HDRe)まで含むHDRビデオシーケンスが、分割されて順番に格納される。なお、HDMI(登録商標)でHDRビデオシーケンスを出力する際に、図32に示す方法のように、SEI message(HDRe)の情報が伝送されると、ビデオシーケンス全体からSEI message(HDRe)を検索するための処理が重くなる場合がある。
 図33は、SEI message(HDRe)まで含むHDRビデオストリームをMPEG-2 TSで多重化する別の方法を説明する図である。1ピクチャ(1フレームまたは1 video access unit)を1PESパケットに格納して、HDRビデオストリームをPES化した後、PID=XとZのそれぞれのTSパケットのペイロードに、PESパケットにおけるデータが分割されて順番に格納される。
 図33に示す方法の場合、PID=XのTSパケットに、stream_id=0xE1のPESパケットとしてHDRビデオシーケンスが格納され、SEI message(HDRe)のみがPID=ZのTSパケットに単独で格納されている。HDMI(登録商標)でHDRビデオを出力する際に、図33に示す方法のように、SEI message(HDRe)の情報が伝送されると、PID=ZのTSパケットにSEI message(HDRe)のみが格納されている。したがって、SEI message(HDRe)を検索するための処理は軽い。
 PID=XのTSパケットで伝送されるHDRビデオシーケンスのみをデコードするのは簡単である。しかし、SEI message(HDRe)までを含んだ更に高輝度な映像再生を行うためには、PID=XとZのそれぞれのTSパケットを同一のTBバッファ(MPEG-2 SystemのT-STDモデルにて使われる前段バッファ)に伝送する追加処理が必要となる。
 図34は、SEI message(HDRe)まで含むHDRビデオストリームをMPEG-2 TSで多重化する別の方法を説明する図である。1ピクチャ(1フレームまたは1 video access unit)を分割して3つのPESパケットのそれぞれに格納して、ビデオストリームをPES化する。その後、3つのPESパケットのそれぞれは、必要に応じて分割され、PID=Xの各TSパケットのペイロードに順番に格納される。
 図34に示す方法の場合、PID=XのTSパケットに、stream_id=0xE1の2つのPESパケットとしてHDRビデオシーケンスが格納される。そして、SEI message(HDRe)のみが、同じstream_id=0xE1ながらPES_priority=0のPESパケットとして、同じPID=XのTSパケットに単独で格納されている。
 HDMI(登録商標)でHDRビデオを出力する際に、図34に示す方法のように、SEI message(HDRe)の情報が伝送されると、PID=Xの各TSパケットから、stream_id=0xE1でPES_priority=0のPESパケットが検索される。したがって、SEI message(HDRe)を検索するための処理は、図33に示す方法のようには軽くはない。
 しかし、PID=XのTSパケットで伝送されるHDRビデオシーケンスのみをデコードするのも、HDRビデオシーケンスだけでなくSEI message(HDRe)も含めてデコードするのも大きな差異はなく、図34に示す方法は実現可能である。
 尚、PES_priorityの値は必ずしもこの組み合わせでなくても良く、SEI message(HDRe)を格納するPESパケットだけがPES_priority=1を取るようにしていても同様の効果を発揮することができる。
 図35は、SEI message(HDRe)まで含むHDRビデオストリームをMPEG-2 TSで多重化する別の方法を説明する図である。図34に示す方法との違いは、図35に示す方法では、SEI message(HDRe)を含むPESパケットを格納するTSパケットのtransport_priorityが0である点である。
 HDMI(登録商標)でHDRビデオを出力する際に、図35に示す方法のように、SEI message(HDRe)の情報が伝送されると、PID=Xでtransport_priority=0のTSパケットからSEI message(HDRe)が解析される。したがって、SEI message(HDRe)を検索するため処理量は、図33に示す方法とほぼ同じように軽く、図35に示す方法を実現することは可能である。
 また、この場合には、HDRビデオシーケンスのみをデコードするのも、HDRビデオシーケンスだけでなくSEI message(HDRe)も含めてデコードするのも、T-STDモデル上では差異はなく、図35に示す方法を実現することができる。例えば、TSデコーダのPIDデマルチプレクサは、transport_priorityの値にも基づいてストリームを分離する。これにより、SEI message(HDRe)には対応せず、SEI message(HDRb)までの情報を用いて高輝度化するデコーダは、上述のPIDデマルチプレクサによって、SEI message(HDRe)を含むTSパケットを容易に破棄することが可能である。
 尚、transport_priorityの値は必ずしもこの組み合わせでなくても良く、SEI message(HDRe)を格納するTSパケットだけがtransport_priority=1を取るようにしていても同様の効果を発揮することができる。
 図36は、SEI message(HDRe)まで含むHDRビデオストリームをMPEG-2 TSで多重化する別の方法を説明する図である。この図36に示す方法では、図33に示す方法のように、PIDを2種類使い、図34または図35に示す方法のように、PESパケットを構成している。この図36に示す方法は、図33に示す方法と同じような利点と欠点を併せ持つ。
 図37は、SEI message(HDRe)まで含むHDRビデオストリームをMPEG-2 TSで多重化する別の方法を説明する図である。この図37に示す方法では、SEI message(HDRe)を、SEI message(HDRb)などが格納されているPESパケットとは別のPESパケットである、PES_priority=0のPESパケットに格納する。そして、スライスNALユニットを格納し終わった後に、PES_priority=0のPESパケットを、PID=XのTSパケットとは別のPID=ZのTSパケットにて多重化している。SEI message(HDRe)の多重化位置はピクチャデータ直後となっている。したがって、図37に示す方法では、SEI message(HDRb)までのHDRビデオシーケンスが1つのPESパケットに格納されている。この点を除き、図37に示す方法は、図33に示す方法と同じような利点と欠点を併せ持つ。
 図38は、SEI message(HDRe)の代わりに、HDRビデオシーケンスとは別のビデオシーケンスである拡張ビデオシーケンスをMPEG-2 TSで多重化する方法を説明する図である。この図38に示す方法では、SEI message(HDRe)で高輝度拡張メタデータを伝送するのではなく、拡張ビデオシーケンス(Enhancement layer video sequence)を、HDRビデオシーケンス(Base layer video sequence with user data unregistered SEI message(HDRb))に対する拡張映像情報として伝送する。
 例えば、上記HDRビデオシーケンスに含まれるBase frame PES#nの基本ピクチャに対して、拡張ビデオシーケンスに含まれるEnhancement frame PES#nの拡張ピクチャを加える。これにより、HDRビデオシーケンスの高輝度拡張を、SEI messageよりも更に多くのデータを用いながら、より正確に行うことが可能になる。ここで、対応するピクチャ同士は同じPTSを持つようにして、ピクチャ間の相関が示されていても良い。例えば、「基本ピクチャのPTS#b1」=「拡張ピクチャのPTS#e1」を示す相関が示される。
 上述の基本ビデオシーケンスと拡張ビデオシーケンスとは、夫々全く異なる2本のビデオシーケンスとして異なるPIDで異なるPESパケットでMPEG-2 TSへ多重化される。
 PMTパケットには、基本ビデオシーケンスと拡張ビデオシーケンスとのペアを正しく指定するために、descriptor()を用いてそのペアを表現しても良い。例えば、この図38に示す方法では、PMTパケットの中に、HDR_pairing_descriptor()が記述される。HDR_pairing_descriptor()には、このMPEG-2 TS内のペア数(number_of_HDR_pairs)と、ペアごとの基本ビデオシーケンスと拡張ビデオシーケンスとが用いるPID値とが含まれる。基本ビデオシーケンスが用いるPID値は、base_layer_video_sequence_PIDによって示され、拡張ビデオシーケンスが用いるPID値は、enhancement_layer_video_sequence_PIDによって示される。このようなHDR_pairing_descriptor()が記述されることで、正しいペアの組み合わせを示すことができる。
 図39は、1つの表示単位を構成する字幕映像ストリームの構造を示している。1つの表示単位の字幕映像ストリームは、Presentation Setと呼ばれ、PMデータで始まりENDで終わる構造である。以下個々のデータセグメントについて説明する。
 PM(Presentation Manager)は必ず字幕映像ストリームの各Presentation Setの先頭に配置されるデータセグメントであり、以下のデータフィールドを含む。
 seg_typeはセグメントの種別を表しており、図39に示すようにseg_type=0x01の場合であれば、それを含むデータセグメントがPMであることを示している。
 presen_set_stateはこのPresentation Setが字幕の1つの表示単位として字幕表示に必要なデータを全て含むタイプか、表示色のみを変更するような部分的な更新データだけを格納するタイプなのかを示している。
 bitmap_id_refはこのPresentation Setが表示する字幕映像のビットマップの識別情報(bitmap_id)を示している。
 window_id_refはこのPresentation Setが利用する表示領域の識別情報(window_id)を示している。
 bitmap_pos_x及びbitmap_pos_yはbitmap_id_refで指定されたビットマップの左上座標の位置を示している。
 palette_id_refはこのPresentation Setが利用する表示色インデックスカラーテーブルの識別情報(palette_id)を示している。
 palette_update_judgeはこのPresentation Setが表示色インデックスカラーテーブルのみを更新するタイプのPresentation Setか否かを示している。palette_update_judge=1の場合は表示領域及びビットマップ自体は直前のPresentation Setと同じであるが、表示色インデックスカラーテーブルのみが変わる。これにより、例えば、カラオケのような徐々に色が変わるような図柄の表示制御をデータサイズが大きいビットマップを再送せずに実現することができる。
 WIN(WINdow)はPM直後に配置されるデータセグメントであり複数並べてもよい。WINはPresentation Setが用いる表示領域を指定するデータセグメントであり、以下のデータフィールドを含む。
 seg_type=0x02で、このデータセグメントがWINであることが示される。
 window_idは、このWINで指定される表示領域を識別するための情報である。
 window_pos_x及びwindow_posは、この表示領域の左上座標値を示している。_window_size_x及びwindow_size_yは、この表示領域の横方向(x)及び縦方向(y)のサイズをピクセル精度で示している。
 なお、表示領域をこのように区切るのは、限られたデコーダ伝送帯域の条件下であっても、表示領域を絞ることで、表示更新間隔を早くすることができるからである。
 PAL(PALette)はWIN直後に配置されるデータセグメントであり複数並べてもよい。PALはPresentation Setが用いる表示色(インデックスカラー)を格納したデータセグメントであり、以下のデータフィールドを含む。
 seg_type=0x03で、このデータセグメントがPALであることが示される。
 palette_idは、この表示色インデックスカラーテーブルを識別するための情報である。
 palette_versionは、同じpalette_idを持つPALの中でのバージョン(更新の有無)を示している。このpalette_versionは、表示色インデックスカラーテーブルのみを更新するようなPresentation Set(palette_updata_judge=1)において、palette_idは固定ながらpalette_versionのみを更新する目的で利用することができる。
 color_indexはカラーインデックスの番号(例えば0から255)を示している。
 Y、Cr、Cb及びalphaは該当するカラーインデックス番号(color_index)が実際に意味する色情報を示す。当該色情報は、Y(輝度情報)、Cr/Cb(色差情報)、alpha(透過度情報)として夫々格納される。これによりBMP()にて指定されるインデックスカラー番号(color_index)に対応する色が特定される。このカラーインデックスはループ処理により最大255色が登録される。
 BMP(BitMaP)はPAL直後に配置されるデータセグメントで複数並べてもよい。例えば、複数の字幕映像が同時に表示される場合に、複数のWIN、PAL及びBMPが配置される。BMPはPresentation Setが格納する字幕映像のビットマップ情報を格納している。
 seg_type=0x04で、このデータセグメントがBMPであることが示される。
 bitmap_idは、このビットマップ映像情報の識別情報である。
 bitmap_versionは、このビットマップのバージョン(更新の有無)を示している。
 bitmap_size_x及びbitmap_size_yは、このビットマップを展開した際のx及びy方向のサイズをピクセル精度で記述している。
 bitmap_image_data()は、このビットマップ映像を圧縮符号化したデータを格納している。
 このように、1つの字幕表示単位であるPresentation Setは、1回の字幕表示もしくは字幕更新に必要な情報をデータセグメント化して転送するためのエレメンタリストリームである。字幕ストリームは、このPresentation Setを複数ならべて字幕を更新させるものである。
 図40は、図39で説明した字幕表示時の位置関係を示す図である。
 字幕を表示するプレーンは左上を原点としてx及びy座標軸が夫々右及び下方向へ向かう。このプレーン内に表示領域(WIN)が配置され、その表示領域の内部に、ビットマップイメージ(BMP)が配置される。
 図41は、図5などで説明した管理情報(管理情報ファイル)と、その内容を説明する図である。
 図41の(a)に示されるように、BD.INFOファイルには、ディスク全体の代表属性情報を記述したDiscInfo()と、BD.INFOの拡張データ領域であるExtension()とが含まれる。Extension()には、Disc_Type()とHDR_meta()とが含まれる。
 Disc_Type()は、これが記録されたディスクの物理的特性を示す拡張情報である。Disc_Type()内のdisc_typeフィールドに示される3bitの情報に基づいて、下記のようにディスク種別の識別が可能である。
 disc_type: 3bits (bslbf)
 010b: 25GB/layerの記録密度を持ち、72Mbpsで読み込みが必要なディスク
 011b: 25GB/layerの記録密度を持ち、92Mbpsで読み込みが必要なディスク
 100b: 33GB/layerの記録密度を持ち、92Mbpsで読み込みが必要なディスク
 101b: 33GB/layerの記録密度を持ち、122Mbpsで読み込みが必要なディスク
 110b: 33GB/layerの記録密度を持ち、144Mbpsで読み込みが必要なディスク
 BD.INFOファイル内のHDR_meta()には、このディスクに対するHDR関連のメタデータが記述されている。
 また、図41の(b)に示されるように、XXX.PLファイルには、前述の情報に加えて、CellList内に拡張ビデオストリーム(Enhancement layer video stream)の再生制御情報が記述されたSubPLList()が含まれる。また、XXX.PLファイルの拡張データ領域であるExtension()内には、HDR_meta()とCombiExt()とを記録できる。
 XXX.PLファイル内のHDR_meta()は、このプレイリストに対するHDR関連のメタデータが記述されている。
 また、プレイリストファイルのExtension()内には、CombiExt()が格納される。CombiExt()は、後述する図42に記載されたCombi()と同じデータ構造とセマンティックスを持ち、同時に再生可能なエレメンタリストリームの組み合わせを示す情報である。CombiExt()には、標準輝度範囲のビデオストリーム(以下、SDRビデオストリームとも記載する)と、当該SDRビデオストリームと一緒に再生可能な標準輝度範囲の字幕ストリーム(以下、SDR字幕ストリームとも記載する)やオーディオストリームなどが登録されている。
 また、図41の(c)に示されるように、YYY.VOBIファイルには、当該VOBの使用用途を表す情報(VOB_type)、システムストリームの最大ビットレートを示す情報(SysRate)、ビデオストリームの属性情報(Video#0()など)、オーディオストリームの属性情報(Audio#0()など)、字幕ストリームの属性情報(Subtitle#0()など)を記録できる。また、YYY.VOBIファイルには、ランダムアクセスポイントが列挙されたTMAP()を記録できる。また、YYY.VOBIの拡張データ領域であるExtension()内には、HDR_meta()とTMAPExt()とを記録できる。
 YYY.VOBIファイル内のHDR_meta()は、このVOBストリームに対するHDR関連のメタデータが記述されている。
 TMAPExt()は、図13、図14、及び図15で示すようなランダムアクセスのテーブル情報であるTMAP()と、同じデータ構造及び同じセマンティックスを有する。TMAPExt()には、標準輝度(SDR)のビデオストリームに対するランダムアクセスポイント情報が格納される。
 VOB_typeに格納される値は、下記のような意味である。
 VOB_type=0x01(Main TS for movie application)である場合は、これが記述されたVOBが、通常の映画などの映像再生で使われるVOB(MPEG-2 TSストリーム)であることを意味する。
 VOB_type=0x10(Sub TS for Enhancement layer video stream)である場合は、これが記述されたVOBが拡張ビデオストリームを多重化した、SubPLでのみ利用可能なVOB(MPEG-2 TSストリーム)であることを意味する。
 図42は、図41で説明したデータベースファイルのデータ構造を示す図である。
 図42の(a)に示されるように、Cell#n()は、n番目のCellの情報である。Cell#n()は、当該Cell#n()において参照されるVOBストリームファイルの識別情報(VOBName)、Closed Captioningの情報(CC)、当該Cell#n()の再生開始時刻情報(In)、当該Cell#n()の再生終了時刻情報(Out)、当該Cell#n()内で同時に再生可能なエレメンタリストリームの組み合わせを示すCombi()情報などから構成される。
 Combi()には、当該Combiを含むCell#n()において同時に再生できる組み合わせとして許可されているエレメンタリストリームごとに様々な符号化属性情報が記述される。
 図42の(b)に示されるように、許可されているエレメンタリストリームがビデオストリームであれば、Combi()には、そのビデオストリームのPIDのような特定情報(VideoPID)、解像度及びアスペクトなどの符号化属性情報(VideoFormat)などが記述される。
 許可されているエレメンタリストリームが図38で示したような拡張ビデオストリームであれば、Combi()には、その拡張ビデオシーケンスのPIDのような特定情報(EnhVideoPID)、ビットデプス情報(EnhVideoBitDepth)、及び最高輝度情報(EnhVideoMaxLum)などが記述される。
 許可されているエレメンタリストリームがオーディオストリームであれば、Combi()には、そのオーディオストリームのPIDのような特定情報(AudioPID)、符号化方式(Coding)、及びチャンネル数(Ch.)などが記述される。
 許可されているエレメンタリストリームが字幕ストリームであれば、その字幕ストリームのPIDのような特定情報(SubtitlePID)、及び字幕の言語情報(Language)などが記述される。
 図42の(c)に示されるように、SubPL#n()は、n番目の追加の副再生経路を指定する情報である。SubPL#n()は、例えば、HDRビデオストリームと組み合わせて一緒に再生されるべき拡張ビデオストリームを指定する情報である。
 SubPL#n()に含まれるSubPL_type情報は、HDRビデオストリームと拡張ビデオストリームとの再生方法の種別を示す情報である。同期/非同期、または、再生に利用されるシステムストリーム本数(1or2本)などを特定するために用いられる。
 SubPL_type=0x0A(Synchronous Enhancement Layer Video SubPL in Sub TS)は、2本のシステムストリーム(MPEG-2 TS)の一方からHDRビデオストリームを読み出し、他方から拡張ビデオストリームを読み出し、読み出したストリーム同士を同期して再生する再生方法の種別である。なお、ここでの「同期」は、HDRビデオストリームのあるピクチャは、必ず拡張ビデオストリームのあるピクチャとしか同時に再生されないという固定的な関係にあることを意味する。
 SubPL_type=0x0B(Synchronous Enhancement Layer Video SubPL in Main TS)は、1本のMPEG-2 TSの中にあるHDRビデオストリームと、拡張ビデオストリームとを同期して再生する再生方法の種別である。
 SubCellList情報は、SubCell情報が束ねられた情報である。
 SubCell情報は、拡張ビデオストリームを含む1連続区間(SubCell)が参照するVOBファイルのファイル名(VOBName)、SubCell開始時刻情報(In)、SubCell終了時刻情報(Out)、及び、同時に再生されるCellの識別情報(CellNum)とを含む。
 このようなSubPL#n()は、どのような再生モデルで、どのファイルを用いて、HDRビデオストリームと拡張ビデオストリームとが再生されるのかをプレーヤに指示することができる。
 図43は、SubPL_type=0x0Aの場合における管理情報の各フィールドの意味を説明する図である。
 SubPL_type=0x0Aの再生モデルでは、2本のシステムストリームファイル(MPEG-2 TS)を用いて、HDRビデオストリーム(HDRb)をMain TSから、その拡張ビデオストリーム(Enh. Layer Video)をSub TSから、同時に読み出しながら再生する。
 Cell#0にて指定される再生区間として、HDRビデオストリーム(HDRb)におけるCell#0.InからCell#0.Outまでの再生区間が再生される。この再生に同期して、SubCell#0にて指定される連続区間として、拡張ビデオストリームにおけるSubCell#0.InからSubCell#0.Outまでの連続区間が再生される。これにより、後述の図45に示す基本デコーダ401にて復号されるHDRビデオストリーム(HDRb)よりもより高輝度でより量子化精度が高い高輝度映像情報が出力される。
 SubPL_type=0x0Aの再生モデルでは、2本のビデオストリームは同期して再生されるため、Cell#0.InとSubCell#0.Inとは同一であり、かつ、Cell#0.OutとSubCell#0.Outとは同一である。なお、Cell#0.In、Cell#0.Out、SubCell#0.InおよびSubCell#0.OutはそれぞれPTS時間軸で表現される時刻である。
 ここで、VOB_type=0x10 (Sub TS for Enh. Layer Video)は、このSubPL_type=0x0A (Synchronous Enhancement Layer Video SubPL in Sub TS)の再生モデルのみに利用される。
 図44は、SubPL_type=0x0Bの場合における管理情報の各フィールドの意味を説明する図である。
 SubPL_type=0x0Bの再生モデルでは、1本のシステムストリームファイル(MPEG-2 TS)の中に、HDRビデオストリーム(HDRb)と、その拡張ビデオストリームとが多重化されており、それらのストリームを同時に再生する。このように、SubPL_type=0x0Bの再生モデルでは、基本ビデオストリームと拡張ビデオストリームとが同一のトランスポートストリームに多重化されている。これにより、基本ビデオストリームと拡張ビデオストリームとを明確に対応付けることができ、広いダイナミックレンジの映像情報を適切に再生することができる。
 Cell#0にて指定される再生区間として、HDRビデオストリーム(HDRb)におけるCell#0.InからCell#0.Outまでの再生区間が再生される。この再生に同期して、SubCell#0にて指定される連続区間として、拡張ビデオストリームにおけるSubCell#0.InからSubCell#0.Outまでの連続区間が再生される。これにより、後述の図45に示す基本デコーダ401にて復号されるHDRビデオストリーム(HDRb)よりもより高輝度でより量子化精度が高い高輝度映像情報が出力される。
 このように、SubPL_type=0x0Bの再生モデルでは、2本のビデオストリームは、同一のシステムストリームファイル(MPEG-2 TSであるMain TS)に多重化されており、同期して再生される。したがって、Cell#0.InとSubCell#0.Inとは同一であり、かつ、Cell#0.OutとSubCell#0.Outとは同一である。
 つまり、管理情報ファイルであるPlayListには、基本ビデオストリームの再生経路に含まれる第1の区間と、拡張ビデオストリームの再生経路に含まれる第2の区間とが互いに対応付けて記述されている。そして、その第1の区間と第2の区間の再生時間は同じである。具体的には、PlayListには、互いに同一の時刻である、第1の区間の再生開始時刻と、第2の区間の再生開始時刻とが記述され、さらに、互いに同一の時刻である、第1の区間の再生終了時刻と、第2の区間の再生終了時刻とが記述されている。これにより、基本ビデオストリームと拡張ビデオストリームとを適切に同期させて再生することができる。
 図45は、本実施の形態におけるHDRビデオストリームのデコーダモデルを説明する図である。
 本実施の形態における再生装置は、デコーダシステム400を備えている。デコーダシステム400は、上述の各管理情報ファイルに基づいて、基本ビデオストリームまたは拡張ビデオストリームなどのビデオストリームと、字幕などを示すグラフィックスデータとを、BDから読み出して再生する映像再生部である。
 デコーダシステム400は、基本デコーダ(Base Dec)401、拡張デコーダ(Enh. Dec)402、基本プレーン(Base plane(HDRb))403、拡張プレーン(Enh. plane)404、拡張プレーン(HDRe plane)405、Base+Enh.プレーン406、字幕デコーダ(Sub. Dec)407、字幕プレーン(Subtitle Plane(8bit))408、グラフィックスプロセッサ(GP)409、高輝度字幕プレーン(Subtitle Plane(HDRb/e))410、および高輝度字幕プレーン(Subtitle Plane(Base+Enh.))411を備える。
 SEI message(HDRb)を含むHDRビデオストリームは、基本デコーダ(Base Dec)401にてデコードされる。そして、そのHDRビデオストリームのデコードによって生成された高輝度映像情報は、基本プレーン(Base plane(HDRb))403に展開される。ここで、SEI message(HDRb)に含まれる基本的な輝度情報(コンテンツ全体での最高/最低輝度値)などは、その高輝度映像情報と一緒に伝送されて、HDMI(登録商標)などの外部映像出力I/Fへと出力される。
 SEI message(HDRe)に対応した再生装置であるデコーダシステム400は、基本プレーン(Base plane(HDRb))403の高輝度映像情報に対して、SEI message(HDRe)の輝度拡張情報を加えて、拡張プレーン405に拡張高輝度映像情報を展開する。このSEI message(HDRe)までを加えた拡張高輝度映像情報は、SEI message(HDRe)に含まれる追加の輝度情報(シーン単位での最高/最低輝度値)などと一緒に、HDMI(登録商標)などの外部映像出力I/Fへと出力される。
 上述の拡張ビデオストリームに対応した再生装置であるデコーダシステム400では、拡張ビデオストリームを拡張デコーダ(Enh. Dec)402にてデコードする。そして、そのデコードによって生成された拡張映像情報は、拡張プレーン(Enh. plane)404に展開される。デコーダシステム400は、この拡張映像情報を、基本プレーン(Base plane(HDRb))403の高輝度映像情報と、同じPTSを持つ映像同士で合成する。この合成によって得られた拡張高輝度映像情報は、Base+Enh.プレーン406に展開される。デコーダシステム400は、この拡張高輝度映像情報を、SEI message(HDRb)にて伝送される基本的な輝度情報、または拡張ビデオストリーム内に格納された輝度拡張情報などと一緒に、HDMI(登録商標)などの外部映像出力I/Fへと出力する。
 ここで、ビデオに重畳するグラフィックスデータ、例えば字幕ストリームは、字幕デコーダ(Sub. Dec)407にてデコードされることによって、8ビットのインデックスカラー(255色)にて表現される。デコードされた字幕ストリームである字幕は、字幕プレーン(Subtitle Plane(8bit))408へ展開される。グラフィックスプロセッサ(GP)409は、その字幕を表現する8ビット諧調のYCrCbを10ビット諧調のYCrCbへ、さらに、字幕の輝度を標準輝度から、(高輝度映像情報または拡張高輝度映像情報に合わせた)高い輝度へ変換する。高輝度に変換された字幕である高輝度字幕は、高輝度字幕プレーン(Subtitle Plane(HDRb/e))410に展開される。そして、高輝度字幕プレーン410に展開された高輝度字幕は、同一表示時刻を持つ、基本プレーン(Base plane(HDRb))403のピクチャか、拡張プレーン(HDRe plane)405のピクチャと合成されて出力される。
 また、Base+Enh.プレーン406に拡張高輝度映像情報がある場合または、SubPL_type=0x0A or 0x0BのPlayListが再生されている場合には、グラフィックスプロセッサ(GP)409は、字幕を表現する8ビット諧調のYCrCbを12ビット諧調のYCrCbへ変換する。さらに、グラフィックスプロセッサ(GP)409は、字幕を拡張ビデオストリームにあわせて重畳するため、字幕の輝度を標準輝度から、(拡張ビデオストリームを用いて生成された拡張高輝度映像情報に合わせた)より高い輝度に変換する。より高い輝度に変換された字幕である高輝度字幕は、高輝度字幕プレーン(Subtitle Plane(Base+Enh.))411に展開される。そして、高輝度字幕プレーン411に展開された高輝度字幕は、同一表示時刻を持つ、Base+Enh.プレーン406のピクチャと合成されて出力される。
 ここで、グラフィックスプロセッサ(GP)409は、字幕プレーン(Subtitle Plane(8bit))408に展開された字幕に対するインデックスカラーテーブル(CLUT)を、字幕デコーダ(Sub. Dec)407から取得する。このインデックスカラーテーブル(CLUT)においては、字幕に合成される映像情報がSDRビデオストリームであるかHDRビデオストリームであるかに応じて、SDR用のCLUT及びHDR用のCLUTのいずれか一方のCLUTのみが多重化されている。また、映像情報のHDR種別は複数あるが、字幕ストリームのCLUTは、1種類のみがHDR用として提供される。
 図46は、データベースファイルへの各ストリームの登録方法を示す図である。図46は、プレイリストファイルに格納されるCombi()、CombiExt()、及び、SubPL()と、VOBIファイルに格納されるTMAP()及びTMAPExt()との5つのデータブロックに対して、ビデオストリームの組み合わせに応じてどこにどのような情報が登録及び管理されるのかを示す表である。尚、図46におけるELは、拡張ビデオストリームを指している。図46におけるHDRは、HDRbまたはHDReを指している。
 SDRビデオストリームだけがプレイリストファイルに登録される場合には、Combi()に、当該SDRビデオストリームと、それに重畳されるSDR字幕ストリーム(SDR用のPALのみを持つ字幕ストリーム)と、音声ストリームとが登録される。TMAP()には、SDRビデオストリームのランダムアクセス情報が登録される。
 同様に、HDRビデオストリームだけがプレイリストに登録される場合には、Combi()に、当該HDRビデオストリームと、それに重畳されるHDR字幕ストリーム(HDR用のPALのみを持つ字幕ストリーム)と、音声ストリームとが登録される。TMAP()にはHDRビデオストリームのランダムアクセス情報が登録される。
 次に、HDRビデオストリームとSDRビデオストリームとの2本が1つのプレイリストに登録される場合について説明する。この場合、Combi()には、HDRビデオストリームと、それに重畳されるHDR字幕ストリームと、音声ストリームとが登録される。つまり、Combi()には、HDRビデオストリーム及びHDR字幕ストリームを組み合わせて再生することが指定された第一再生制御情報が格納される。
 一方、TMAP()には、HDRビデオストリームのランダムアクセス情報が登録される。つまり、TMAP()には、HDRビデオストリームに含まれる独立して復号可能なピクチャの位置を示すランダムアクセス情報(以下、第一ランダムアクセス情報とも記載する)が格納される。
 これに加えて、CombiExt()には、SDRビデオストリームとそれに重畳されるSDR字幕ストリームと、音声ストリームとが登録される。つまり、CombiExtには、SDRビデオストリーム及びSDR字幕ストリームを組み合わせて再生することが指定された第二再生制御情報が格納される。
 そして、TMAPExt()には、SDRビデオストリームのランダムアクセス情報が登録される。つまり、TMAPExt()には、SDRビデオストリームに含まれる独立して復号可能なピクチャの位置を示すランダムアクセス情報(以下第二ランダムアクセス情報とも記載する)が格納される。
 次に、HDRビデオストリームと拡張ビデオストリーム(図46ではELと表記)との2本が1つのプレイリストに登録される場合について説明する。この場合、Combi()には、HDRビデオストリームと、それに重畳されるHDR字幕ストリームと、音声ストリームとが登録される。TMAP()には、HDRビデオストリームのランダムアクセス情報と拡張ビデオストリームのランダムアクセス情報とが登録される。つまり、この場合、TMAP()には、上記第一ランダムアクセス情報と、拡張ビデオストリームに含まれるピクチャの再生時刻を示すランダムアクセス情報(以下、第三ランダムアクセス情報とも記載する)が格納される。
 さらに、SubPL()には、拡張ビデオストリームの再生制御情報が登録される。つまり、SubPL()には、HDRビデオストリームの輝度範囲を拡張するための拡張ビデオストリームが指定された第三再生制御情報が格納される。これは、図43及び図44を用いて説明されたパターンである。
 次に、HDRビデオストリームと輝度拡張用ビデオストリームとSDRビデオストリームとの3本が1つのプレイリストに登録される場合について説明する。この場合、Combi()には、HDRビデオストリームと、それに重畳されるHDR字幕ストリームと、音声ストリームとが登録される。TMAP()には、HDRビデオストリームのランダムアクセス情報と、拡張ビデオストリームのランダムアクセス情報とが登録される。
 さらに、SubPL()には、拡張ビデオストリームの再生制御情報が登録される。加えて、CombiExt()には、SDRビデオストリームと、それに重畳されるSDR字幕ストリームと、音声ストリームとが登録される。TMAPExt()には、SDRビデオストリームのランダムアクセス情報が登録される。
 次に、SDRビデオストリームと拡張ビデオストリームとの2本が1つのプレイリストに登録される場合について説明する。この場合、Combi()には、SDRビデオストリームと、それに重畳されるSDR字幕ストリームと、音声ストリームとが登録される。TMAP()には、SDRビデオストリームのランダムアクセス情報と、拡張ビデオストリームのランダムアクセス情報が登録される。さらに、SubPL()には、拡張ビデオストリームの再生制御情報が登録される。
 ただし、このケースは、拡張ビデオストリームを用いてSDRビデオストリームを高輝度/高ビット精度のHDR映像へ変換することができる場合にのみ適用される。
 このように、HDRビデオストリームとSDRビデオストリームとを1つのプレイリストに登録する際には、HDRビデオストリームとセットになるストリームは、Combi()に登録され、SDRビデオストリームとセットになるストリームは、CombiExt()に登録される。つまり、HDRビデオストリームに関連するストリームのセットと、SDRビデオストリームに関連するストリームのセットとが全く別のセットとして別個に管理されている。
 このような構成によれば、HDRビデオストリーム及びSDRビデオストリームのどちらを再生するかが決定されれば、プレーヤ(再生装置)は、Combi()及びCombiExt()のどちらか1方だけを処理すればよい。Combi()及びCombiExt()は、同じデータ構造であり、かつ、同じセマンティックスであるため、Combi()への処理とCombiExt()への処理の一部を共通化し、処理を簡単にすることができる。また、システムのオーサリングが容易であるという利点、及び、プレーヤの実装/動作検証が容易である(開発コストを削減できる)という利点がある。
 ここで、「Combi()及びCombiExt()は、同じデータ構造、同じセマンティックスである」の意味について補足する。図41及び図42に示されるように、プレイリストファイルの中には、具体的には、Cell#nというデータブロックが設けられ、一つのCell#n()に、一つのCombi()が設けられる。
 これに対し、CombiExt()は、Cell#n()に対する拡張データであるため、Combi()は、CombiExt()の一部に対応する。上記の「Combi()及びCombiExt()は、同じデータ構造、同じセマンティックスである」は、より詳細には、CombiExt()に格納された第二再生制御情報の一部が、Combi()に格納された第一再生制御情報の一部と実質的に同一のデータ構造及びセマンティックスを有することを意味する。言い換えれば、CombiExt()に格納された第二再生制御情報の一部は、Combi()に格納された第一再生制御情報の一部と共通のデータ構造及びセマンテティックスを有する。
 また、Combi()と、CombiExt()とは、いずれもビデオストリームのPIDのような特定情報(VideoPID)を有していることも共通している。
 以上のように、図46に示されるようにデータベースファイルに各ストリームが登録されたBDには、再生環境に応じて選択的に用いられる、SDRビデオストリーム及びSDRビデオストリームよりも輝度範囲の広いHDRビデオストリームが記録される。SDRビデオストリームは、言い換えれば、標準輝度範囲のビデオストリームであり、HDRビデオストリームは、言い換えれば、高輝度範囲のビデオストリームである。BDは、記録媒体の一例である。
 また、このBDには、再生環境に応じて選択的に用いられる、SDR字幕ストリーム及びHDR字幕ストリームと、コンテンツの再生制御情報が格納されるプレイリストファイル(図46のXXX.PL)とが記録される。プレイリストファイルは、Combi()、及び、CombiExt()を含む。Combi()は、メインストリームに関する再生制御情報が格納される管理領域の一例であり、CombiExt()は、拡張領域の一例である。
 そして、HDRビデオストリームとSDRビデオストリームが1つのプレイリストに登録される場合、Combi()には、HDRビデオストリーム及びHDR字幕ストリームを組み合わせて再生することが指定された第一再生制御情報が格納される。CombiExt()には、SDRビデオストリーム及びSDR字幕ストリームを組み合わせて再生することが指定された第二再生制御情報が格納される。
 このような構成のBDを再生するプレーヤは、HDRビデオストリームを選択して再生する場合には、従来どおりCombi()内の第一再生制御情報を読み出せばよい。一方、プレーヤは、SDRビデオストリームを選択して再生する場合には、CombiExt()内の第二再生制御情報を読み出せばよい。
 また、HDRとSDRとが両方記録されるBDでは、HDRビデオストリームに、SDR字幕ストリームまたはSDRグラフィックスが重畳されてしまうことが想定される。つまり、高輝度の映像に輝度が不足した字幕及びグラフィックスが重畳されてしまうことが想定される。しかしながら、HDRビデオストリームとSDRビデオストリームが1つのプレイリストに登録される場合、Combi()に登録されるHDRビデオストリームには、当該Combi()の中でHDR字幕ストリームが組み合わされているため、HDRビデオストリームにSDR字幕ストリームが組み合わされるといったことが生じない。逆に、CombiExt()に登録されるSDRビデオストリームには、当該CombiExt()の中でSDR字幕ストリームが組み合わされているため、SDRビデオストリームにHDR字幕ストリームが組み合わされるといったことが生じない。
 このように、上記BDによれば、ビデオストリームの選択などの再生制御が簡素化される。上記BDによれば、当該BDを再生するプレーヤの、ビデオストリーム選択処理及び再生処理を容易にすることができる。
 また、第二再生制御情報の一部は、第一再生制御情報と共通のデータ構造を有する。これにより、プレーヤは、HDRビデオストリームとほぼ同様の処理でSDRビデオストリームの再生を行うことができる。
 また、図46に示されるように、上記BDには、さらに、上記BDの全体に関する属性を示すVOBIファイルが記録される。VOBIファイルは、TMAP()及びTMAPExt()を含む。TMAP()及びTMAPExt()のそれぞれには、ビデオストリームに含まれる独立して復号可能なピクチャの当該ビデオストリーム内の位置を示すランダムアクセス情報が格納される。VOBIファイルは、管理情報ファイルの一例であり、TMAP()は、マップ領域の一例であり、TMAPExt()は、拡張マップ領域の一例である。
 TMAP()には、HDRビデオストリームに含まれる独立して復号可能なピクチャの当該HDRビデオストリーム内の位置を示す第一ランダムアクセス情報が格納される。TMAPExt()には、SDRビデオストリームに含まれる独立して復号可能なピクチャの当該SDRビデオストリーム内の位置を示す第二ランダムアクセス情報が格納される。第一ランダムアクセス情報は、第一マップ情報の一例であり、第二ランダムアクセス情報は、第二マップ情報の一例である。
 このような構成のBDを再生するプレーヤは、HDRビデオストリームを選択してランダムアクセス再生等を行うときには、TMAP()内の第一ランダムアクセス情報を読み出せばよく、SDRビデオストリームを選択してランダムアクセス再生等を行うときには、TMAPExt()内の第二ランダムアクセス情報を読み出せばよい。つまり、このようなBDによれば、当該BDを再生するプレーヤの、ビデオストリーム選択処理及び再生処理を、ランダムアクセス再生等を行う場合においても容易にすることができる。
 また、図46に示されるように、上記BDには、さらに、メインストリームのファイルと同時に再生されるサブストリームに関する再生制御情報が記録されるサブプレイリストファイル(図46のSubPL())が記録される。サブプレイリストファイルには、HDRビデオストリームの輝度範囲を拡張するための拡張ビデオストリームに関する第三再生制御情報が格納される。そして、TMAP()には、第一ランダムアクセス情報と、拡張ビデオストリームに含まれる独立して復号可能なピクチャの当該拡張ストリーム内の位置を示す第三ランダムアクセス情報が格納される。第三ランダムアクセス情報は、第三マップ情報の一例である。
 このような構成のBDを再生するプレーヤは、Combi()内の第一再生制御情報とSubPL()内の第三再生制御情報とを読み出すことにより、HDRビデオストリームと拡張ストリームとを同時に再生することができる。つまり、このようなBDによれば、当該BDを再生するプレーヤの、HDRビデオストリームの拡張処理を容易にすることができる。
 また、プレーヤは、ランダムアクセス再生等を行うときには、TMAP()内の情報のみをさらに読み出せばよい。つまり、このようなBDによれば、HDRビデオストリームを拡張し、かつ、ランダムアクセス再生等を行う場合において、当該BDを再生するプレーヤの再生処理を容易にすることができる。
 次に、プレーヤの再生処理について説明する。図47は、1つのプレイリストにHDRビデオストリームを含む第一再生制御情報と、SDRビデオストリームを含む第二再生制御情報と、拡張ビデオストリームを含む第三再生制御情報、の3つの再生制御情報を含む場合の、プレーヤの再生処理のフローチャートである。図47に示されるように、プレーヤは、プレイリストファイルの実行開始後に、BDに記録されたコンテンツ、プレーヤのHDRビデオストリームのデコード対応可否、及び、プレーヤに接続されるテレビのHDRビデオストリームへの対応有無などに基づいてコンテンツの再生形態の判定を行う(S801)。
 プレーヤは、判定の結果、コンテンツのHDR再生を行う場合には、Combi()に登録されたストリームセットを読み出して再生する(S802)。
 言い換えれば、プレーヤ(再生装置)が備える映像再生部は、コンテンツをHDRのコンテンツとして再生する場合には、Combi()に格納された第一再生制御情報に基づいて、HDRビデオストリーム及びHDR字幕ストリームを読み出して再生する。
 なお、映像再生部は、コンテンツをHDRのコンテンツとしてランダムアクセス再生等を行う場合には、第一再生制御情報及び第一ランダムアクセス情報に基づいて、HDRビデオストリーム及びHDR字幕ストリームを読み出して再生する。
 また、プレーヤは、判定の結果、コンテンツの拡張HDR再生を行う場合には、Combi()とSubPL()とに登録されたストリームセットを読み出して再生する(S803)。
 言い換えれば、プレーヤが備える映像再生部は、コンテンツをより拡張された輝度範囲のHDRコンテンツとして再生する場合、第一再生制御情報に基づいて、HDRビデオストリーム及びHDRの字幕ストリームを読み出して再生し、かつ、第三再生制御情報に基づいて、拡張ビデオストリームを読み出して再生する。
 なお、映像再生部は、コンテンツをより拡張された輝度範囲のHDRコンテンツとしてランダムアクセス再生等を行う場合、第一再生制御情報及び第一ランダムアクセス情報に基づいて、HDRビデオストリーム及びHDR字幕ストリームを読み出して再生し、かつ、第三再生制御情報及び第三ランダムアクセス情報に基づいて、拡張ビデオストリームを読み出して再生する。
 また、プレーヤは、判定の結果、コンテンツのSDR再生を行う場合には、CombiExt()に登録されたストリームセットを読み出して再生する(S804)。
 言い換えれば、プレーヤが備える映像再生部は、コンテンツをSDRのコンテンツとして再生する場合には、第二再生制御情報に基づいて、SDRビデオストリーム及びSDR字幕ストリームを読み出して再生する。
 なお、映像再生部は、コンテンツをSDRのコンテンツとしてランダムアクセス再生等を行う場合には、第二再生制御情報及び第二ランダムアクセス情報に基づいて、SDRビデオストリーム及びSDR字幕ストリームを読み出して再生する。
 このように、上記BDによれば、当該BDを再生するプレーヤの、ビデオストリーム選択処理及び再生処理を容易にすることができる。
 図48は、HDRビデオとSDRビデオとが登録された1つのプレイリストにしたがって、異なる再生環境でディスクの再生を行う際の課題を説明するための図である。この図48では、このようなプレイリストが登録されたディスクの再生を、例えばリビングのHDRビデオが再生できるAV環境で行う際の状況と、寝室のHDRビデオが再生できないAV環境で行う際の状況とを比較している。
 同じユーザが同じディスクを同じように再生させる場合に、TVがHDRビデオに対応しているか、していないかで、選択できる字幕、音声、またはメニュー画面などが異なるとすると、ユーザに大きな混乱を与えかねない。例えば、ディスクの再生を行う場合に、リビングの再生環境では日本語音声で日本語字幕が選択できていたのに、そのディスクを寝室に持っていって再生すると、寝室の再生環境では例えば日本語字幕が選択できないことがある。もしくは、日本語音声が選択できなければ、日本語しか聞き取れない、または日本語しか読めないユーザには、視聴さえ困難な状況となってしまう。
 そこで、本実施の形態では、このような課題を避けるためには、各Cell(再生区間)に対するCombi()とCombiExt_for_Cell()のペアごとに制約をかける。
 図49は、Combi()のデータ構造の詳細を示す図である。Combi()では、ビデオおよび音声などの種類ごとに、その種類のストリームの本数が最初に登録され、それぞれのストリームごとに特定の属性情報が記述される。
 図50は、CombiExt()のデータ構造の詳細を示す図である。Combi()はCellごとに記述されるが、CombiExt()はXXX.PL()の中に1度しか記述されないため、Combi()同等のデータ(CombiExt_for_Cell)を纏めて記述するようなデータ構造となっている。
 プレーヤは、状況に応じてCombi()かCombiExt_for_Cell()かのどちらかを選択して再生する。このCombi()およびCombiExt_for_Cell()に次のような制約をかけることが、上記課題に対する一番効率的で簡単な解決策となる。
 本実施の形態では、所定のCell(つまり、同一のCell)に対するCombi()とCombiExt_for_Cell()のそれぞれに登録されるエレメンタリストリームに制約をかける。
 1)ビデオストリーム(Video#n())に関する制約事項:
 各Cellに対するCombi()とCombiExt_for_Cell()のそれぞれに登録されるビデオストリームは、同じ映像コンテンツを符号化したビデオストリームとするべきである。これにより、ビデオ自体が再生環境に依らず同じものとなる。VideoPID(ビデオストリームのPID)は、同一システムストリーム(MPEG-2 TS)に格納される場合など、Combi()とCombiExt_for_Cell()の双方で異なる値となることがある。各Cellに対するCombi()とCombiExt_for_Cell()のそれぞれに登録されるビデオストリームは、同じ属性(値)を持つべきである。属性(値)は、VideoFormat(解像度)、FrameRate(フレームレート)、AspectRatio(アスペクト比)、CC(クローズドキャプションの有無)、およびISRC(コンテンツの著作権情報)である。これは図48で説明したようにAV再生環境によらず同じ視聴体験を提供するために必要となる。
 2)字幕ストリーム(Subtitle#n())に関する制約事項:
 各Cellに対するCombi()とCombiExt_for_Cell()のそれぞれに登録される字幕ストリームは、同じ字幕コンテンツを符号化した字幕ストリームとするべきである。これにより、字幕自体が再生環境に依らず同じものとなる。字幕には、ビデオと同じように、HDR字幕とSDR字幕とがある。そして、それらの字幕は全く別個のストリームとして構成されるため、HDR字幕とSDR字幕のそれぞれのSubtitlePID(字幕ストリームのPID)は、ビデオストリームと同じように異なる。Combi()とCombiExt_for_Cell()のそれぞれに登録される字幕ストリームは、同じ属性(値)を持つべきである。その属性(値)は、Language(字幕の言語)およびISRC(コンテンツの著作権情報)である。Combi()とCombiExt_for_Cell()のそれぞれに登録される字幕ストリームの本数は同じであるべきである。また、それぞれ同一のCellにおいて、Combi()に列挙されるM本(Mは1以上の整数)の字幕ストリームと、CombiExt_for_Cell()に列挙されるM本の字幕ストリームとの、それぞれの同じN(Nは1以上M以下の任意の整数)番目の字幕ストリームの属性は同一であるべきである。つまり、Combi()とCombiExt_for_Cell()の双方で、同じ属性の字幕ストリームが、同じ順序で登録されるべきである。
 現在、再生選択されている字幕ストリームの番号は、図24に示すプレーヤ変数#2(Subtitle stream number)であらわされている。ここの番号は、このCombi()およびCombiExt_for_Cell()のそれぞれでの字幕ストリームの登録順番であって、字幕ストリームの識別番号として使われている。そのため、プログラムがN番目の字幕ストリームを指定して再生指示を出すと、Combi()またはCombiExt_for_Cell()の中でN番目に登録された字幕ストリームが選択される。よって、Combi()とCombiExt_for_Cell()のそれぞれで、このN番目に登録されている字幕ストリームのLanguage(字幕の言語)が異なるとすれば、プログラムは、N番目以外の順番にある字幕ストリームを探さなければならないことがある。例えば、Combi()においてN番目の字幕ストリームが指定されたとしても、CombiExt_for_Cell()では、その字幕ストリームがN番目に登録されていない。したがって、プログラムは、Combi()およびCombiExt_for_Cell()のうちのどちらを再生しているかを理解しなければならない。さらに、プログラムは、CombiExt_for_Cell()が再生されていると理解すると、N番目の字幕ストリームではなく、N番目以外の順番にある字幕ストリームを探し出して選択しなければならない。このように字幕ストリームを選択するプログラムをディスクに準備しておくことが必要になる。
 これを避けるために、本実施の形態では、Combi()およびCombiExt_for_Cell()のどちらを再生している時でも、同じように再生制御のプログラムが記述できるようにする。このために、本実施の形態では、各Cellに対するCombi()およびCombiExt_for_Cell()のそれぞれの字幕ストリームの本数、その登録順、登録順番ごとの字幕の各種属性(Language、ISRC)は同じであるべきである。
 3)メニューストリーム(Menu#n())に関する制約事項:
 各Cellに対するCombi()とCombiExt()のそれぞれに登録されるメニューストリームは、同じメニューコンテンツを符号化したメニューストリームとするべきである。これにより、メニュー自体が再生環境に依らず同じものとなる。メニューには、ビデオと同じように、HDRメニューとSDRメニューとがある。そしてこれらのメニューは全く別個のストリームとして構成されるため、HDRメニューとSDRメニューのそれぞれのMenuPID(メニューストリームのPID)は、ビデオストリームと同じように異なる。メニューストリームは字幕ストリームのデータ構造に加えて個々のボタンに命令を設定したものである。
 各Cellに対するCombi()とCombiExt_for_Cell()のそれぞれに登録されるメニューストリームは、同じ属性(値)を持つべきである。その属性(値)は、Language(メニューの言語)およびISRC(コンテンツの著作権情報)である。Combi()とCombiExt_for_Cell()のそれぞれに登録されるメニューストリームの本数は同じであるべきである。また、それぞれ同一のCellにおいて、Combi()に列挙されるM本(Mは1以上の整数)のメニューストリームと、CombiExt_for_Cell()に列挙されるM本のメニューストリームとの、それぞれの同じN(Nは1以上M以下の任意の整数)番目のメニューストリームの属性は同一であるべきである。つまり、各Cellに対するCombi()とCombiExt_for_Cell()の双方で、同じ属性のメニューストリームが、同じ順番で登録されるべきである。これも図48のように、異なる再生環境下でも同じ言語のメニューが同じように提供されるために必要である。
 4)音声ストリーム(Audio#n())に関する制約事項:
 音声については、HDR/SDRビデオに起因する変更はないため、同じ音声ストリームが、各Cellに対するCombi()とCombiExt_for_Cell()の双方で利用できるべきである。したがって、Combi()およびCombiExt_for_Cell()のそれぞれに登録される音声ストリームの本数は、同じであるべきである。さらに、Combi()に列挙されるM本(Mは1以上の整数)の音声ストリームと、当該Cellに対するCombiExt_for_Cell()に列挙されるM本の音声ストリームとの、それぞれの同じN(Nは1以上M以下の任意の整数)番目の音声ストリームの属性は同一であるべきである。つまり、各Cellに対するCombi()とCombiExt_for_Cell()の双方で、同じ属性の音声ストリームが、同じ順番で登録されるべきである。その属性は、AudioPID(音声ストリームのPID)、Coding(符号化方式)、Ch.(チャンネル数)、SamplingFreq.(サンプリング周波数)、Language(音声の言語)、およびISRC(コンテンツの著作権)である。
 図51は、YYY.VOBIがHDRビデオとSDRビデオのストリームセットの両方を含む場合の拡張例を示す図である。この図51では、YYY.VOBIが指し示すシステムストリームの中に、HDRビデオ、HDR字幕、HDRメニュー、SDRビデオ、SDR字幕、SDRメニュー、および音声などが含まれる。このような場合に、Attribute()には、HDRビデオと一緒に再生されるエレメンタリストリーム(HDRビデオ、HDR字幕、HDRメニュー、および音声)が登録されている。このAttribute()の記述内容は、図49に示すCombi()の記述内容と同じでも良い。一方、AttributeExt()には、SDRビデオと一緒に再生されるエレメンタリストリーム(SDRビデオ、SDR字幕、SDRメニュー、および音声)が登録されている。このAttributeExt()の記述内容は、Attribute()と同じ形式である。
 Attribute()とAttributeExt()に登録される各エレメンタリストリームは、それに対応する1つのシステムストリームの中に格納されている。尚、メニューストリームのみを別途システムストリーム化しても良い。
 このように、本実施の形態におけるディスクは、第1のダイナミックレンジの輝度によって表現されるSDRビデオと、その第1のダイナミックレンジよりも広い第2のダイナミックレンジの輝度によって表現されるHDRビデオとを含むVOBストリームファイルと、そのVOBストリームファイルの再生を制御するためのプレイリストファイル(xxx.PL())とが記録されている。プレイリストファイルには、それぞれ同一のCellにおいて同時に再生できるエレメンタリストリームの組み合わせを示すCombi()とCombiExt_for_Cell()が記述されている。CombiExt_for_Cell()には、そのCellにおいて、SDRビデオと同時に再生できるエレメンタリストリームが列挙され、Combi()には、そのCellにおいて、HDRビデオと同時に再生できるエレメンタリストリームが列挙されている。ここで、本実施の形態では、それぞれ同一のCellにおいて、CombiExt_for_Cell()に列挙される所定の種類のエレメンタリストリームの本数と、Combi()に列挙されるその所定の種類のエレメンタリストリームの本数とは等しい。
 これにより、Combi()とCombiExt_for_Cell()とにおいて、同一種類のエレメンタリストリームの本数は等しい。したがって、例えばSDRビデオを再生するときには、HDRビデオと同時に再生されるエレメンタリストリームと同じ種類のエレメンタリストリームを、そのSDRビデオと同時に再生することができる。つまり、HDRに対応した再生環境でも、HDRに対応していない再生環境でも、同じ種類のエレメンタリストリームを再生することができる。その結果、輝度に対する視聴以外において、再生環境によらず同じ視聴体験をユーザに提供することができる。
 また、それぞれ同一のCellにおいて、CombiExt_for_Cell()に列挙されるM本(Mは1以上の整数)の上記所定の種類のエレメンタリストリームと、Combi()に列挙されるM本の上記所定の種類のエレメンタリストリームとの、それぞれの同じN(Nは1以上M以下の任意の整数)番目のエレメンタリストリームの属性は同一である。
 例えば、上記所定の種類のエレメンタリストリームは字幕ストリームである。この場合、上述の属性は、字幕の言語である。具体的には、それぞれ同一のCellにおいて、CombiExt_for_Cell()のN番目の字幕ストリームの言語と、Combi()のN番目の字幕ストリームの言語とは同一(例えば、日本語)である。
 これにより、プログラムは、Combi()およびCombiExt_for_Cell()の何れの再生が行われているかを理解することなく、所望の言語(例えば日本語)の字幕をディスプレイに表示させることができる。つまり、Combi()およびCombiExt_for_Cell()の何れの再生が行われていても、プログラムは、N番目の字幕ストリームを指定すれば、例えば日本語の字幕を表示させることができる。
 また、例えば、上記所定の種類のエレメンタリストリームは、メニューストリームである。この場合、上述の属性は、メニューの言語である。具体的には、それぞれ同一のCellにおいて、CombiExt_for_Cell()のN番目のメニューストリームの言語と、Combi()のN番目のメニューストリームの言語とは同一(例えば、日本語)である。
 これにより、プログラムは、Combi()およびCombiExt_for_Cell()の何れの再生が行われているかを理解することなく、所望の言語(例えば日本語)のメニューをディスプレイに表示させることができる。つまり、Combi()およびCombiExt_for_Cell()の何れの再生が行われていても、プログラムは、N番目のメニューストリームを指定すれば、例えば日本語のメニューを表示させることができる。
 また、例えば、上記所定の種類のエレメンタリストリームは、音声ストリームである。この場合、上述の属性は、音声の符号化方式、音声のチャンネル数、音声のサンプリング周波数、および音声の言語である。つまり、それぞれ同一のCellにおいて、CombiExt_for_Cell()のN番目の音声ストリームの符号化方式およびチャンネル数などと、Combi()のN番目の音声ストリームの符号化方式およびチャンネル数などとは、同一である。
 これにより、プログラムは、Combi()およびCombiExt_for_Cell()の何れで再生が行われているかを理解することなく、所望の符号化方式およびチャンネル数などの音声を再生することができる。つまり、Combi()およびCombiExt_for_Cell()の何れの再生が行われていても、プログラムは、N番目の音声ストリームを指定すれば、所望の符号化方式およびチャンネル数などの音声を再生することができる。
 また、本実施の形態における再生装置は、上述のディスクからストリームを読み出して再生する。この場合、再生装置は、SDRビデオを再生する場合には、プレイリストファイルのCombiExt_for_Cell()に挙げられている何れかのエレメンタリストリームを読み出して、SDRビデオと同時に再生する。さらに、再生装置は、HDRビデオを再生する場合には、プレイリストファイルのCombi()に挙げられている何れかのエレメンタリストリームを読み出して、HDRビデオと同時に再生する。
 これにより、再生装置は、例えばSDRビデオを再生するときには、HDRビデオと同時に再生されるエレメンタリストリームと同じ種類のエレメンタリストリームを、そのSDRビデオと同時に再生することができる。その結果、輝度に対する視聴以外において、HDRビデオが再生される場合と同じ視聴体験をユーザに提供することができ、ユーザに与える混乱を抑えることができる。
 また、本実施の形態における再生装置は、N番目を指定することによって、SDRビデオが再生される場合にも、HDRビデオが再生される場合にも、所定の種類であって同一の属性のエレメンタリストリームを再生する。これにより、SDRビデオが再生される場合にも、HDRビデオが再生される場合にも、輝度に対する視聴以外において、同じ視聴体験をユーザに提供することができる。
 尚、上記の説明は一例に過ぎず、当該技術者にとっては、様々な応用が適用できる。
 なお、上記各実施の形態において、各構成要素は、専用のハードウェアで構成されるか、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、CPUまたはプロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。
 以上、一つまたは複数の態様に係る記録媒体、再生方法および再生装置について、実施の形態に基づいて説明したが、本開示は、この実施の形態に限定されるものではない。本開示の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したものや、異なる実施の形態における構成要素を組み合わせて構築される形態も、本開示の範囲に含まれてもよい。
 例えば、本開示は、上記のような記録媒体の製造方法(データの記録方法)または記録媒体の製造装置(データの記録装置)として実現されてもよい。
 本開示は、標準輝度範囲のビデオストリーム及び高輝度範囲のビデオストリームの両方が記録された光ディスクであって、ビデオストリームの再生制御が容易な光ディスクに利用可能である。また、本開示は、このような光ディスクからビデオストリームを読み出して再生する再生装置としても利用可能である。
  101  BD再生プログラム
  102  BD管理情報
  103  AVデータ
  104  BD-ROM
  202  光ピックアップ
  203  プログラム記録メモリ
  204  管理情報記録メモリ
  205  AV記録メモリ
  206  プログラム処理部
  207  管理情報処理部
  208  プレゼンテーション処理部
  209  イメージプレーン
  210  ビデオプレーン
  211  合成処理部
  302  プログラムプロセッサ
  303  UOマネージャ
  305  シナリオプロセッサ
  306  プレゼンテーションコントローラ
  307  クロック
  308  イメージメモリ
  309  トラックバッファ
  310  デマルチプレクサ
  311  イメージプロセッサ
  312  ビデオプロセッサ
  313  サウンドプロセッサ
  317  ドライブコントローラ
  400  デコーダシステム
  401  基本デコーダ
  402  拡張デコーダ
  404  拡張プレーン(Enh.plane)
  405  拡張プレーン(HDRe plane)
  406  Base+Enh.プレーン
  407  字幕デコーダ
  408  字幕プレーン
  409  グラフィックスプロセッサ
  410  高輝度字幕プレーン
  411  高輝度字幕プレーン

Claims (12)

  1.  第1のダイナミックレンジの輝度によって表現される第1の輝度映像と、前記第1のダイナミックレンジよりも広い第2のダイナミックレンジの輝度によって表現される第2の輝度映像とを含むストリームファイルと、
     前記ストリームファイルの再生を制御するためのプレイリストファイルとが記録され、
     前記プレイリストファイルには、それぞれ同一の再生区間において同時に再生できるエレメンタリストリームの組み合わせを示す第1および第2の組み合わせ情報が記述され、
     前記第1の組み合わせ情報には、当該再生区間において、前記第1の輝度映像と同時に再生できるエレメンタリストリームが列挙され、
     前記第2の組み合わせ情報には、当該再生区間において、前記第2の輝度映像と同時に再生できるエレメンタリストリームが列挙され、
     それぞれ前記同一の再生区間において、前記第1の組み合わせ情報に列挙される所定の種類のエレメンタリストリームの本数と、前記第2の組み合わせ情報に列挙される前記所定の種類のエレメンタリストリームの本数とは等しい、
     記録媒体。
  2.  それぞれ前記同一の再生区間において、前記第1の組み合わせ情報に列挙されるM本(Mは1以上の整数)の前記所定の種類のエレメンタリストリームと、前記第2の組み合わせ情報に列挙されるM本の前記所定の種類のエレメンタリストリームとの、それぞれの同じN(Nは1以上M以下の任意の整数)番目のエレメンタリストリームの属性は同一である
     請求項1に記載の記録媒体。
  3.  前記所定の種類のエレメンタリストリームは、字幕ストリームである
     請求項2に記載の記録媒体。
  4.  前記属性は、字幕の言語である
     請求項3に記載の記録媒体。
  5.  前記所定の種類のエレメンタリストリームは、メニューストリームである
     請求項2に記載の記録媒体。
  6.  前記属性は、メニューの言語である
     請求項5に記載の記録媒体。
  7.  前記所定の種類のエレメンタリストリームは、音声ストリームである
     請求項2に記載の記録媒体。
  8.  前記属性は、音声の符号化方式、音声のチャンネル数、音声のサンプリング周波数、および音声の言語である
     請求項7に記載の記録媒体。
  9.  記録媒体からストリームを読み出して再生する再生方法であって、
     前記記録媒体には、
     第1のダイナミックレンジの輝度によって表現される第1の輝度映像と、前記第1のダイナミックレンジよりも広い第2のダイナミックレンジの輝度によって表現される第2の輝度映像とを含むストリームファイルと、
     前記ストリームファイルの再生を制御するためのプレイリストファイルとが記録され、
     前記プレイリストファイルには、それぞれ同一の再生区間において同時に再生できるエレメンタリストリームの組み合わせを示す第1および第2の組み合わせ情報が記述され、
     前記第1の組み合わせ情報には、当該再生区間において、前記第1の輝度映像と同時に再生できるエレメンタリストリームが列挙され、
     前記第2の組み合わせ情報には、当該再生区間において、前記第2の輝度映像と同時に再生できるエレメンタリストリームが列挙され、
     それぞれ前記同一の再生区間において、前記第1の組み合わせ情報に列挙される、所定の種類のエレメンタリストリームの本数と、前記第2の組み合わせ情報に列挙される、前記所定の種類のエレメンタリストリームの本数とは等しく、
     前記再生方法は、
     前記第1の輝度映像を再生する場合には、前記プレイリストファイルの前記第1の組み合わせ情報に挙げられている何れかのエレメンタリストリームを読み出して、前記第1の輝度映像と同時に再生し、
     前記第2の輝度映像を再生する場合には、前記プレイリストファイルの前記第2の組み合わせ情報に挙げられている何れかのエレメンタリストリームを読み出して、前記第2の輝度映像と同時に再生する
     再生方法。
  10.  それぞれ前記同一の再生区間において、前記第1の組み合わせ情報に列挙されるM本(Mは1以上の整数)の前記所定の種類のエレメンタリストリームと、前記第2の組み合わせ情報に列挙されるM本の前記所定の種類のエレメンタリストリームとの、それぞれの同じN(Nは1以上M以下の任意の整数)番目のエレメンタリストリームの属性は同一であり、
     前記再生方法は、
     N番目を指定することによって、前記第1の輝度映像が再生される場合にも、前記第2の輝度映像が再生される場合にも、前記所定の種類であって同一の属性のエレメンタリストリームを再生する
     請求項9に記載の再生方法。
  11.  記録媒体からストリームを読み出して再生する再生装置であって、
     前記記録媒体には、
     第1のダイナミックレンジの輝度によって表現される第1の輝度映像と、前記第1のダイナミックレンジよりも広い第2のダイナミックレンジの輝度によって表現される第2の輝度映像とを含むストリームファイルと、
     前記ストリームファイルの再生を制御するためのプレイリストファイルとが記録され、
     前記プレイリストファイルには、それぞれ同一の再生区間において同時に再生できるエレメンタリストリームの組み合わせを示す第1および第2の組み合わせ情報が記述され、
     前記第1の組み合わせ情報には、当該再生区間において、前記第1の輝度映像と同時に再生できるエレメンタリストリームが列挙され、
     前記第2の組み合わせ情報には、当該再生区間において、前記第2の輝度映像と同時に再生できるエレメンタリストリームが列挙され、
     それぞれ前記同一の再生区間において、前記第1の組み合わせ情報に列挙される、所定の種類のエレメンタリストリームの本数と、前記第2の組み合わせ情報に列挙される、前記所定の種類のエレメンタリストリームの本数とは等しく、
     前記再生装置は、
     前記第1の輝度映像を再生する場合には、前記プレイリストファイルの前記第1の組み合わせ情報に挙げられている何れかのエレメンタリストリームを読み出して、前記第1の輝度映像と同時に再生し、
     前記第2の輝度映像を再生する場合には、前記プレイリストファイルの前記第2の組み合わせ情報に挙げられている何れかのエレメンタリストリームを読み出して、前記第2の輝度映像と同時に再生する
     再生装置。
  12.  それぞれ前記同一の再生区間において、前記第1の組み合わせ情報に列挙されるM本(Mは1以上の整数)の前記所定の種類のエレメンタリストリームと、当該再生区間における前記第2の組み合わせ情報に列挙されるM本の前記所定の種類のエレメンタリストリームとの、それぞれの同じN(Nは1以上M以下の任意の整数)番目のエレメンタリストリームの属性は同一であり、
     前記再生装置は、
     N番目を指定することによって、前記第1の輝度映像が再生される場合にも、前記第2の輝度映像が再生される場合にも、前記所定の種類であって同一の属性のエレメンタリストリームを再生する
     請求項11に記載の再生装置。
PCT/JP2015/005327 2014-11-17 2015-10-23 記録媒体、再生方法、および再生装置 WO2016079925A1 (ja)

Priority Applications (9)

Application Number Priority Date Filing Date Title
CN201580030305.XA CN106463150B (zh) 2014-11-17 2015-10-23 记录介质、再现方法以及再现装置
EP15860717.6A EP3223280B1 (en) 2014-11-17 2015-10-23 Recording medium
US15/589,021 US10102879B2 (en) 2014-11-17 2017-05-08 Recording medium, playback method, and playback device
US15/698,799 US9997202B2 (en) 2014-11-17 2017-09-08 Recording medium, playback method, and playback device
US16/127,507 US10236030B2 (en) 2014-11-17 2018-09-11 Recording medium, playback method, and playback device
US16/255,933 US10553253B2 (en) 2014-11-17 2019-01-24 Recording medium, playback method, and playback device
US16/714,132 US10770115B2 (en) 2014-11-17 2019-12-13 Recording medium, playback method, and playback device
US16/986,980 US11138999B2 (en) 2014-11-17 2020-08-06 Recording medium, playback method, and playback device
US16/987,036 US11133034B2 (en) 2014-11-17 2020-08-06 Recording medium, playback method, and playback device

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201462080634P 2014-11-17 2014-11-17
US62/080,634 2014-11-17
JP2015175197A JP2016100039A (ja) 2014-11-17 2015-09-04 記録媒体、再生方法、および再生装置
JP2015-175197 2015-09-04

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US15/589,021 Continuation US10102879B2 (en) 2014-11-17 2017-05-08 Recording medium, playback method, and playback device

Publications (1)

Publication Number Publication Date
WO2016079925A1 true WO2016079925A1 (ja) 2016-05-26

Family

ID=56013504

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2015/005327 WO2016079925A1 (ja) 2014-11-17 2015-10-23 記録媒体、再生方法、および再生装置

Country Status (1)

Country Link
WO (1) WO2016079925A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09282848A (ja) 1996-04-05 1997-10-31 Pioneer Electron Corp 情報記録媒体並びにその記録装置及び再生装置
WO2010146847A1 (ja) * 2009-06-17 2010-12-23 パナソニック株式会社 3d映像を再生するための情報記録媒体、及び再生装置
WO2012147350A1 (ja) * 2011-04-28 2012-11-01 パナソニック株式会社 高画質化に関わる記録媒体、再生装置、記録装置、符号化方法、復号化方法
JP2014528182A (ja) * 2011-06-14 2014-10-23 コーニンクレッカ フィリップス エヌ ヴェ 高ダイナミックレンジ・ビデオのためのグラフィック処理

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09282848A (ja) 1996-04-05 1997-10-31 Pioneer Electron Corp 情報記録媒体並びにその記録装置及び再生装置
WO2010146847A1 (ja) * 2009-06-17 2010-12-23 パナソニック株式会社 3d映像を再生するための情報記録媒体、及び再生装置
WO2012147350A1 (ja) * 2011-04-28 2012-11-01 パナソニック株式会社 高画質化に関わる記録媒体、再生装置、記録装置、符号化方法、復号化方法
JP2014528182A (ja) * 2011-06-14 2014-10-23 コーニンクレッカ フィリップス エヌ ヴェ 高ダイナミックレンジ・ビデオのためのグラフィック処理

Similar Documents

Publication Publication Date Title
JP7139543B1 (ja) 再生装置、及び、再生方法
JP6227827B2 (ja) 再生装置および再生方法
JP6616540B2 (ja) 再生方法および再生装置
WO2016038811A1 (ja) 記録媒体、再生装置、および再生方法
WO2016021120A1 (ja) 再生装置、再生方法および記録媒体
WO2016079925A1 (ja) 記録媒体、再生方法、および再生装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15860717

Country of ref document: EP

Kind code of ref document: A1

REEP Request for entry into the european phase

Ref document number: 2015860717

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE