WO2022091215A1 - 映像配信装置、映像配信システム、映像配信方法、及びプログラム - Google Patents

映像配信装置、映像配信システム、映像配信方法、及びプログラム Download PDF

Info

Publication number
WO2022091215A1
WO2022091215A1 PCT/JP2020/040259 JP2020040259W WO2022091215A1 WO 2022091215 A1 WO2022091215 A1 WO 2022091215A1 JP 2020040259 W JP2020040259 W JP 2020040259W WO 2022091215 A1 WO2022091215 A1 WO 2022091215A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
public place
video
teaching
terminal device
Prior art date
Application number
PCT/JP2020/040259
Other languages
English (en)
French (fr)
Inventor
出 瀬之口
Original Assignee
Amatelus株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Amatelus株式会社 filed Critical Amatelus株式会社
Priority to EP20959733.5A priority Critical patent/EP4240019A4/en
Priority to JP2022517484A priority patent/JP7208695B2/ja
Priority to PCT/JP2020/040259 priority patent/WO2022091215A1/ja
Publication of WO2022091215A1 publication Critical patent/WO2022091215A1/ja
Priority to JP2022207147A priority patent/JP2023027378A/ja
Priority to US18/139,397 priority patent/US20230269411A1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/21805Source of audio or video content, e.g. local disk arrays enabling multiple viewpoints, e.g. using a plurality of cameras
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/34Indicating arrangements 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25866Management of end-user data
    • H04N21/25875Management of end-user data involving end-user authentication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/437Interfacing the upstream path of the transmission network, e.g. for transmitting client requests to a VOD server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47217End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for controlling playback functions for recorded or on-demand content, e.g. using progress bars, mode or play-point indicators or bookmarks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/27Server based end-user applications
    • H04N21/274Storing end-user multimedia data in response to end-user request, e.g. network recorder
    • H04N21/2743Video hosting of uploaded data from client
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/462Content or additional data management, e.g. creating a master electronic program guide from data received from the Internet and a Head-end, controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities
    • H04N21/4627Rights management associated to the content

Definitions

  • the present invention relates to a technique for using free-viewpoint video data, etc., and particularly for setting and opening a public place, which is a place for editing free-viewpoint video data, generating teaching files for autopilot, and publishing them. Regarding the related technology.
  • a live view image acquisition unit that is wirelessly or wiredly connected to a plurality of cameras capable of capturing moving images and acquires one or a plurality of live view images from the plurality of cameras, and a live view image acquisition unit that acquires the images.
  • a display unit that displays one or more live view images, an operation unit that manually switches the live view image to be displayed on the display unit, and an operation history record that records operation history information that indicates the operation history of the operation unit.
  • one moving image is automatically generated based on the plurality of moving images captured by the plurality of cameras and the operation history information recorded in the operation history recording unit. It is equipped with a video editing unit that edits the video to be created.
  • a usage authority management device for a content sharing system that manages the usage authority of the content when sharing the content in the sharing unit of the sharing group (see, for example, Patent Document 3).
  • Patent Document 1 discloses a technique for combining moving images of each designated camera taken by a plurality of cameras each time, and edits the moving images to generate a teaching file for autopilot. The point to be done is not disclosed.
  • Patent Document 2 merely discloses that video editing for automatically creating one video based on a plurality of videos captured by a plurality of cameras and operation history information is performed. It is not disclosed that annotations such as camera and voice are added to the video and that the editing result is distributed as a teaching file for autopilot.
  • Patent Document 3 there is no disclosure or suggestion that the content can be distributed by opening a public place having a hierarchical nested structure in which the authority such as login is individually defined by the user's setting. not.
  • the present invention has been made in view of such a problem, and an object of the present invention is to provide a technique for setting and opening a hierarchical content disclosure place in which authority such as login is defined and distributing the content. To provide.
  • the video distribution system is a video distribution system including a video distribution device and a user's terminal device, and the video distribution device is from the terminal device.
  • the public place setting unit that sets the public place that publishes content data including at least free-viewpoint video data and teaching files so that it can be distributed, and the user about the content data of the public place.
  • the terminal device has a determination unit for executing the process, and the terminal device has a request unit for making a request for distribution of the content data of the public place of the video distribution device, and the video distribution device. It has an acquisition unit for acquiring the distributed content data and a display unit for displaying an image based on the content data.
  • the video distribution method is a video distribution method using a video distribution device and a user's terminal device, based on the public place setting information transmitted from the terminal device by the video distribution device.
  • the public place for distributing content data including free viewpoint video data and teaching files is set and the user's terminal device requests distribution of the content data in the public place.
  • the processing is executed and the terminal device performs the processing.
  • the content data of the public place of the video distribution device is requested to be distributed, the content data distributed from the video distribution device is acquired, and the video based on the content data is displayed.
  • the video distribution device is a video distribution device capable of communicating with a user's terminal device, and is at least free viewpoint video data and teaching based on public place setting information transmitted from the terminal device.
  • the public place setting unit that sets the public place that publishes the content data including the file so that it can be distributed. It has a determination unit that determines whether or not the processing related to the request is possible based on the authority of the user and the authority set in the public place, and if the conditions are satisfied, executes the processing.
  • the program according to the fourth aspect of the present invention uses a computer capable of communicating with a user's terminal device to provide content data including at least free viewpoint video data and a teaching file based on public place setting information transmitted from the terminal device.
  • the public place setting unit that sets the public place to be made publicly available for distribution, and the authority of the user who made the request at least when the terminal device of the user requests the content data of the public place. And, based on the authority set in the public place, it is determined whether or not the process related to the request is possible, and if the condition is satisfied, it functions as a determination unit for executing the process.
  • FIG. 15A is a diagram for defining and explaining a type of content
  • FIG. 15B is a diagram for defining and explaining a type of authority.
  • 16 (a) is a diagram showing an example of a user table
  • FIG. 16 (b) is a diagram showing an example of a public place table
  • FIG. 16 (c) is a diagram showing an example of a content table.
  • FIG. 1 shows and describes a configuration of a video distribution system according to an embodiment of the present invention.
  • the video distribution device 1, the editor's terminal device 2, and the viewer's terminal device 3 are connected wirelessly or by wire to a communication network 4 such as the Internet.
  • the video distribution device 1 may be realized by one or more server devices, a computer, or the like.
  • the terminal device 2 of the editor there are various types of terminals such as smartphones, tablet terminals, notebook personal computers, desktop personal computers, head-mounted displays, etc., which can accept operation input and display information. Things can be adopted.
  • the viewer's terminal device 3 is a terminal capable of accepting operation input and displaying information, such as a smartphone, a tablet terminal, a notebook personal computer, a desktop personal computer, and a head mount display. If there is, various things can be adopted.
  • the video distribution device 1 when the video distribution device 1 receives a request from the editor's terminal device 2, it transmits free-viewpoint video data or the like obtained by shooting a subject with a plurality of cameras to the editor's terminal device 2. ..
  • a predetermined editing screen which will be described in detail later, is displayed, and while viewing the free viewpoint video data, video switching (viewpoint switching), enlargement, reduction, and various annotations (characters, figures, symbols) are displayed. , And audio, etc.), and the teaching data, which is the editing result, is transmitted to the video distribution device 1.
  • the teaching data is transmitted from the terminal device 2 of each editor to the video distribution device 1.
  • the video distribution device 1 Upon receiving the teaching data, the video distribution device 1 generates a teaching file for the autopilot based on the teaching data. Further, the video distribution device 1 presents the teaching file for the autopilot to the terminal device 3 of the viewer so that it can be distributed. This presentation may be performed on a dedicated website or the like, or may be performed on a screen displayed by executing an application program on the terminal device 2.
  • autopilot means switching the viewpoint and moving the playback time position by automatic operation based on the composition of the teaching file without any operation by the viewer regarding the display of free viewpoint video data. It means to display by performing such as.
  • Live autopilot refers to the sequential generation and distribution of teaching files for autopilot after a predetermined time has elapsed, or as soon as possible, and live distribution of free-viewpoint video data (live distribution). ), It can be performed regardless of the distribution form such as on-demand distribution.
  • the video distribution device 1 When the instruction file for the autopilot is selected on the website provided by the video distribution device 1 on the terminal device 3 of the viewer and the distribution request is made, the video distribution device 1 is used for the selected autopilot.
  • the teaching file is distributed to the viewer's terminal device 3. At this time, depending on the authority of the viewer, it may be decided whether or not the teaching file can be distributed and whether or not the teaching file can be displayed. Therefore, for example, the presence / absence of the teaching file can be displayed to all, but the distribution of the teaching file can be made possible only by the person who has the purchased authority, or the teaching file itself can be hidden if there is no purchased authority.
  • the viewer's terminal device 3 When the viewer's terminal device 3 receives the instruction file for the autopilot, it reproduces the free viewpoint video based on the instruction file. Conventionally, the terminal device 3 of the viewer reproduces the free viewpoint image while switching to the desired viewpoint or the like, but according to the present embodiment, it is useful while automatically switching the viewpoint or the like. Reproduction is realized. As for the acquisition of the content accompanying the reproduction of the free-viewpoint video, for example, online streaming, download, or combined may be performed.
  • the viewer's terminal device 3 can freely play the free viewpoint video even if it is not in a communication environment, and edits them.
  • the teaching file can be regenerated.
  • the video distribution device 1 opens a public place, for example, on a website or the like, which is a place for publishing various contents such as free-viewpoint video data and teaching files in response to a request from a user's terminal devices 2 and 3.
  • the public place setting information is received from the terminal device 2 of the editor, the terminal device 3 of the viewer, etc., and the public place having a hierarchical nested structure is opened based on the setting information. ..
  • a user is defined as an editor, a viewer, and a general user. Since various permissions such as login to the site, streaming of content, and download can be set for the user, the public place, and the content, the video distribution device 1 receives various requests for the public place. Executes processing based on authority (for example, download, etc.). That is, even a general user can open a public place or the like as long as he / she has acquired the relevant authority. Details will be described later.
  • FIG. 2 shows and describes a detailed configuration of a video distribution device in a video distribution system.
  • the video distribution device 1 including a server device or the like has a control unit 10 that controls the entire control, a RAM (RandomAccessMemory) 11 and a ROM (ReadOnlyMemory) 12 as memories, and an MPEG. It has a decoding module 13, a storage unit 14 including an HDD (Hard Disc Drive), an SSD (Solid State Drive), a flash memory, and an I / O port 15, and these are connected to a bus line.
  • a router 17 is connected to the I / O port 15 via the HUB 16.
  • the control unit 10 may be composed of, for example, a CPU (Central Processing Unit), a microprocessor (Microprocessor), a multiprocessor (Multiprocessor), an ASIC, an FPGA, or the like.
  • the storage unit 14 has a content storage unit 14a, an operation data storage unit 14b, a teaching file storage unit 14c, a public place information storage unit 14k, and a user information storage unit 14l.
  • the content storage unit 14a stores free-viewpoint video data, still image data obtained by dividing the free viewpoint video data, and the like.
  • the operation data storage unit 14b stores operation data and the like sent from the editor's terminal device 2.
  • the teaching file storage unit 14c stores the generated teaching file for the autopilot.
  • the public place information storage unit 14k stores public place setting information, which will be described in detail later.
  • the user information storage unit 14l stores information such as user attribute information, authority, and browsing history.
  • the storage unit 14 further stores the OS 14d, the data acquisition program 14e, the data generation program 14f, the teaching file generation program 14g, the selection program 14h, the distribution program 14i, and the content generation program 14j. Therefore, by executing the distribution program 14i, the control unit 10 functions as a distribution unit 10a, a public place setting unit 10h, a determination unit 10i, a notification unit 10j, and a relevance suggestion unit 10k, and executes the data acquisition program 14e. By doing so, it functions as an acquisition unit 10b, by executing the data generation program 14f, it functions as a data generation unit 10c, and by executing the selection program 14h, it functions as a specified value reception unit 10d and a selection unit 10e, and is a teaching file. By executing the generation program 14g, it functions as a teaching file generation unit 10f. By executing the content generation program 14j, it also functions as a content generation unit 10g. In addition, it functions as a settlement unit 10l under OS14d.
  • the acquisition unit 10a acquires a plurality of video data as free viewpoint video data via the I / O port 15.
  • the acquisition unit 10a acquires a plurality of moving image data obtained by capturing images of the subject from different directions.
  • the acquired free viewpoint video data is stored in the content storage unit 14a.
  • the data generation unit 10c generates still image data by extracting frames at predetermined time intervals as still images for each of the free viewpoint video data acquired by the acquisition unit 10b, that is, a plurality of video data. More specifically, the data generation unit 10c decompresses the moving image data stored in the content storage unit 14a by the MPEG decoding module 13, prepares it as a set of still image data, and stores it in the content storage unit 14a. At this time, each still image data is saved in association with time data indicating the timing at which each image was taken.
  • the designated value receiving unit 10d receives the direction designated value (operation data) for designating the position data in the still image data to be browsed from the terminal device 3 of the viewer.
  • the selection unit 10e selects still image data along with time data based on the direction designation value received by the designated value reception unit 10d, and transmits the still image data to the viewer's terminal device 3 via the communication network 4.
  • the viewer's terminal device 3 receives the still image data and generates an image.
  • the teaching file generation unit 10f generates a teaching file for the autopilot based on the teaching data from the terminal device 2 of the editor, and stores it in the teaching file storage unit 14c.
  • the file structure of the teaching file will be described in detail later.
  • the distribution unit 10a reads the designated autopilot instruction file from the instruction file storage unit 14c in accordance with the distribution request from the viewer's terminal device 3, and transmits the instruction file to the viewer's terminal device 3 via the communication network 4. ..
  • the corresponding content data (including the divided still image data) may be transmitted at the same time, or the corresponding content data may be transmitted each time in the browsing process.
  • the content generation unit 10g generates the content of the free viewpoint video data or the content such as the streaming data of the moving image based on the free viewpoint video data and the teaching file. This content is also transmitted to the viewer's terminal device 3 by the distribution unit 10a.
  • the public place setting unit 10h opens a public place having a hierarchical nested structure based on the public place setting information from the terminal devices 2 and 3, and enables distribution of contents.
  • the determination unit 10i downloads, etc., based on the user's authority, the public place authority, and the content authority. Determine whether processing is possible.
  • the notification unit 10j notifies the public, etc. of the free viewpoint video data or the like published in the public place when the free viewpoint video data of another viewpoint is uploaded.
  • the relevance suggestion unit 10k suggests relevance when a related moving image or the like exists when the content is being played. Then, the payment unit 10l makes electronic payments related to sales and the like for the contents uploaded to the public place.
  • FIG. 3 shows and describes the configuration of the editor's terminal device 2 in the video distribution system.
  • the viewer's terminal device 3 has the same basic configuration.
  • the editor's terminal device 2 (the same applies to the viewer's terminal device 3) includes a control unit 21, a RAM 22, a ROM 23, a JPEG decoding module 24, an I / O port 25, and the like. It has a wireless communication unit 26, a drawing unit 27, a display monitor 28, an operation recognition unit 29, an operation unit 30, a storage unit 31, an image pickup unit 32, and a GPS unit 33. Each part is connected via a bus line.
  • the control unit 10 may be composed of, for example, a CPU, a microprocessor, a multiprocessor, an ASIC, an FPGA, or the like.
  • the storage unit 31 is an HDD or a flash memory.
  • the storage unit 31 has a content storage unit 31a, an operation data storage unit 31b, and a teaching file storage unit 31c.
  • the content storage unit 31a stores free-viewpoint video data, still image data, and the like sent from the video distribution device 1.
  • the operation data storage unit 31b stores the operation data when the viewpoint or the like of the reproduced video is changed based on the screen operation.
  • the teaching file storage unit 31c stores the teaching file sent from the video distribution device 1 and the teaching data generated at the time of editing.
  • the storage unit 31 stores the OS 31d, the browser program 31e, the editing program 31f, and the teaching file generation program 31g. Therefore, the control unit 21 functions as a request unit 21a, an acquisition unit 21d, a transmission unit 21f, a code analysis unit 21g, and a position information acquisition unit 21h based on the OS 31d, and executes the browser program 31e to generate a video generation unit. It functions as 21b, and functions as an editorial unit 21c by executing the editing program 31f.
  • the storage unit 31 stores the touch panel control firmware.
  • the control unit 21 functions as the teaching file generation unit 21e by executing the teaching file generation program 31g.
  • each part performs the following processing. That is, the requesting unit 21a requests the video distribution device 1 for free viewpoint video data (including divided still image data). The transmission of this request is performed by the wireless communication unit 26 connected via the I / O port 25. A wired communication unit may be provided instead of the wireless communication unit 26.
  • the acquisition unit 21d acquires free viewpoint video data (including divided still image data) sent from the video distribution device 1.
  • the video generation unit 21b generates content that can be displayed on the terminal device 3 from the free viewpoint video data.
  • the drawing unit 27 controls the display on the display monitor 28.
  • the acquired still image data is decoded by the JPEG decoding module 24.
  • the editorial unit 21c changes the viewpoint of free viewpoint video data (including divided still image data), screen allocation, enlargement / reduction, and change of playback speed based on the operation by the editor on the screen described in detail later.
  • Editing processing including addition of annotations (characters, figures, symbols, voices, etc.) is executed, teaching data is generated, and stored in the teaching file storage unit 31c.
  • the operation recognition unit 29 recognizes the operation of the operation unit 30 and stores it in the operation data storage unit 31b as operation data including the direction designation value.
  • the teaching file generation unit 21e generates a teaching file for autopilot based on the teaching data and stores it in the teaching file storage unit 31c.
  • the transmission unit 21f transmits the content data (for example, video streaming data, etc.) of the content storage unit 31a, the teaching data, the teaching file, and the like to the video distribution device 1 via the wireless communication unit 26.
  • each part when playing back based on the teaching file for the autopilot, each part performs the following processing. That is, the requesting unit 21a requests the video distribution device 1 for the teaching file for the autopilot.
  • the acquisition unit 21d acquires the teaching file for the autopilot sent from the video distribution device 1.
  • content data such as three-dimensional point cloud data, three-dimensional CG, moving image data, and still image data necessary for reproduction may be acquired.
  • the image generation unit 21b generates an image based on the teaching file, and the drawing unit 27 reproduces the moving image on the display monitor 28. If the teaching file contains annotation data or the like, the audio, text, figures, etc. are played back at the timing defined in the teaching file as well as the moving image.
  • the operation recognition unit 29 recognizes the operation and relates to the direction specified value. Generate operation data.
  • the request unit 21a transmits the operation data related to the direction designation value to the video distribution device 1 and requests the change of the viewpoint or the like.
  • the acquisition unit 21d acquires free viewpoint video data (including divided still image data) whose viewpoint has been changed from the video distribution device 1, playback based on the teaching file is temporarily stopped and playback with a different viewpoint is performed. Is executed.
  • the code analysis unit 21g analyzes a two-dimensional code such as a QR code (registered trademark) imaged by the image pickup unit 32 and acquires code information.
  • This code information may include, for example, a seat number, position information associated with the seat, and the like.
  • the position information acquisition unit 21h acquires position information based on the communication environment of the wireless communication unit 26 or the data acquired from the GPS unit 33. This location information may be uploaded to the public place in association with the generated content.
  • FIG. 4 shows and describes an example of an editing screen displayed on the editor's terminal device 2.
  • a file of free viewpoint video data that can be selected as an edit target is presented in the area 100a of the edit screen 100, and the editor can edit the free viewpoint video data (in this example, the division). (Still image data) can be selected.
  • a chat can be written in the area 100b, and when the editing work is divided by a plurality of editors, the work can be carried out while communicating with each other.
  • edit logs and the like can be displayed in the area 100b, and unnecessary edits can be invalidated according to the authority, and the invalidated edits can be undone.
  • a display area or function for voice call, video chat, etc. may be provided separately.
  • playback display is performed based on the selected free viewpoint video data.
  • the free viewpoint video data selected as the editing target in the area 100a is divided into predetermined units, and each division unit is shown together with a thumbnail or the like. In this example, the selected split unit is indicated by a dashed line.
  • various annotations can be added to each division unit by operating the operation unit 30.
  • Reference numeral 100e indicates that annotations such as text and figures have been added, and reference numeral 100f indicates that voice annotations have been added.
  • Reference numeral 100g indicates the current position of the live when editing is performed so as to follow the live distribution. In addition to the above, it may be possible to display how much the live is delayed from the current live, the remaining time until the arbitrary time when the live can be played after an arbitrary time, and the like.
  • the moving image data D1 is composed of a plurality of frames F1, F2, F3 ....
  • the data generation unit 10c of the video distribution device 1 may divide the moving image data into a plurality of frames and store the moving image data in the content storage unit 14a in units of the divided data. For example, as shown in FIG. 5B, when the data is divided into three frames, the divided data D2 divided into frames F1 to F3 and the divided data D2 divided into frames F4 to F6. , Multiple frames of moving image data are sequentially divided.
  • the data generation unit 10c may divide the moving image data into a plurality of frames and one frame and store the moving image data in the content storage unit 14a in units of the divided data.
  • the divided data includes a plurality of divided data (D2M) composed of a plurality of frames and a single divided data (D2S) composed of one frame. ).
  • the data generation unit 10c divides the moving image data so that one plurality of divided data and the plurality of single divided data are alternately arranged in time series, and stores the moving image data in the content storage unit 14a. You may.
  • the multi-sheet division data (D2M) divided into frames F1 to F3, the single-sheet division data D2S divided into frames F4, and the single-sheet division into frame F5.
  • the single-sheet divided data and the plurality of single-sheet divided data are divided so as to alternate in time series.
  • the video data B is divided into the divided data D2-A1, D2-A2, D2-A3, D2-A4, etc. obtained by dividing the moving image data A.
  • the divided data D2-B1, D2-B2, D2-B3, D2-B4 may be taken at different imaging times.
  • the distribution unit 10a when the distribution unit 10a sequentially transmits the divided data D2-A1 and D2-A2 based on the moving image data A and then receives the switching request from the viewer's terminal device 3, the distribution unit 10a receives the switching request.
  • the distribution unit 10a sequentially transmits the divided data D2-A1 and D2-A2 based on the moving image data A, and then receives the switching request from the viewer's terminal device 3. Then, the divided data D2-B2, which has the same timing as the divided data D2-A2 in terms of time, is read from the content storage unit 14a, and then the divided data D2-D3 ... It may be read from the storage unit 14a and transmitted sequentially.
  • the distribution unit 10a Since information on the imaging time is added to each moving image data, the distribution unit 10a reads out the divided data and other divided data in a timely continuous or substantially continuous manner based on the information on the imaging time. Delivery is possible.
  • the teaching file includes screen teaching data, content teaching data, and annotation teaching data.
  • FIG. 7 shows and explains the structure of the screen teaching data included in the teaching file.
  • the screen teaching data includes an object type, an object ID / URL, a teaching data object ID, time adjustment data, and screen allocation data.
  • the object type is screen.
  • the object ID / URL is an object ID in the teaching data.
  • the time adjustment data is data for operating with the time code including the adjustment time when the screen allocation data includes the time code.
  • the screen allocation data is basically the same as the screen allocation data of the content teaching data described later.
  • FIG. 8 shows and explains the structure of the content teaching data included in the teaching file.
  • the content teaching data includes pilot time code, object type, object ID / URL, teaching data object ID, pilot time code arrival action, content end action, specified time code arrival action, and start. It has a time code, an end time code, viewpoint-related data, playback speed data, zoom-related data, and screen allocation data.
  • the pilot time code defines the start time on the autopilot.
  • the object type is content.
  • the object ID / URL is an ID / URL that uniquely indicates the content on the system.
  • the teaching data object ID is an object ID in the teaching data.
  • the action at the time of reaching the pilot time code can specify the start position of the time code of the content or the action when the time in the pilot time code reaches the set start time code. For example, play, stop, video effect, etc. are specified. In the action when the specified time code is reached, it is determined whether the pilot time code or the time code of the content is used as the base point for each specified action, and the action to be executed when the time code as the base point is reached or passed is specified.
  • the term “passing” means, for example, when the pilot time code jumps from the 8th second to 15 seconds at once with a seek bar or the like for the sound that should have been played after 10 seconds on the pilot time code.
  • An example of the behavior is that the sound is reproduced from an appropriate audio position as long as it is within the audio reproduction range.
  • the behavior at the time of passing also behaves in an appropriate state with respect to the action at the time of reaching the pilot time code, the action at the end of the content, the action at the end of the pilot time code described later, etc., which are related to the time code. be.
  • the start time code is the playback start time on the content
  • the end time code is the playback end time. If the start time code and end time code are specified retroactively, reverse playback will occur.
  • the viewpoint-related information is information that can be specified according to the distribution method of the free viewpoint video. For example, in the case of the still image transmission method and in the case of the moving image transmission method, it becomes the camera ID, and in the case of the multi-camera method. Is a multi-camera ID, and in the case of 3D point group data or 3D CG, it is, for example, a 4 ⁇ 4 view conversion matrix.
  • the format does not matter as long as it is an expression method that can specify the position of the camera, the direction in which the camera is facing (the gazing point), and the posture of the camera.
  • the reproduction speed can be defined as 0.125, 0.25, 0.5, 0, 1, 1.25, 1.5, 2, 4, etc. from stop to shift reproduction.
  • the screen allocation data is the allocation data when displaying a plurality of contents on one screen.
  • the screen allocation data specify the basic position such as screen top left, screen top right, screen bottom left, screen bottom right, top, bottom, etc., specify in pixel units, set the ratio of the display area to the entire screen, etc. can do.
  • the display area is not limited to a rectangle, and a figure such as a perfect circle, a Pezier curve, a spline curve, a plurality of straight lines, or a polyline can be specified.
  • a wipe it is possible to superimpose another content on one content and display it. It is also possible to specify one or more time codes and the corresponding display area form at that time.
  • the time code the time when the display time of the screen object is reached can be specified as 0 seconds or the like, and it is of course possible to specify the time code based on the autopilot time code.
  • the above is the basic configuration of the content teaching data, but it can also be configured with only the pilot time code, teaching data object ID, and viewpoint-related data, and can be the minimum configuration when expressing the content.
  • it is composed only of pilot time code, teaching data object ID, start time code, end time code, and viewpoint-related data, and one or more time codes and the corresponding viewpoint-related information at that time are included in the viewpoint-related data. It can also be the minimum configuration.
  • FIG. 9 shows and explains the structure of annotation teaching data (voice) included in the teaching file.
  • the annotation teaching data (voice) includes pilot time code, object type, object ID / URL, teaching data object ID, pilot aim code arrival action, content end action, and specified time code arrival time. It has an action, a start time code, an end time code, a playback speed, and data.
  • the pilot time code is the start time on the autopilot.
  • the object type is content.
  • the object ID / URL is an ID / URL that uniquely indicates the position of the data on the system.
  • the teaching data object ID is an object ID on the teaching data. Playback, stop, video effects, etc. can be specified as actions when the pilot time code is reached.
  • an action to be performed when the time code at which the reproduction of the content ends is reached can be specified.
  • the start time code is the playback start time on the voice
  • the end time code is the playback end time on the voice.
  • the reproduction speed can be defined as 0.125, 0.25, 0.5, 0, 1, 1.25, 1.5, 2, 4, etc. from the reproduction stop to the shift reproduction.
  • the playback speed specified in the teaching data can be specified without affecting each other.
  • the playback speed of audio is specified without affecting the playback speed specified for the content. It is possible. For example, content is at 2x speed and audio is at 1x speed.
  • FIG. 10 shows and explains the structure of annotation teaching data (character strings, figures, images, etc.) included in the teaching file.
  • the annotation teaching data (character string, figure, image, etc.) is the pilot time code, end pilot time code, object type, object ID / URL, teaching data object ID, and action when the pilot time code is reached. , Pilot time code end action, specified time code arrival action, annotation action, time adjustment data, data, and screen allocation data.
  • the pilot time code is the start time on the autopilot.
  • the end pilot time code is the end time on the autopilot.
  • the object type is content.
  • the object ID / URL is an ID / URL that uniquely indicates the position of the data on the system.
  • the teaching data object ID is an object ID in the teaching data. Playback, stop, video effects, etc. can be specified as actions when the pilot time code is reached. Video effects, audio playback, video wipe display playback, etc. can be specified as actions at the end of the pilot time code. In the action when the specified time code is reached, it is determined whether the pilot time code or the time code of the content is used as the base point for each specified action, and the action to be executed when the time code as the base point is reached or passed is specified.
  • an action to be taken when a predetermined voice is input from a click, a tap, a microphone, etc. in the display area can be specified.
  • This action includes, for example, arbitrary audio output, returning the time of the pilot time code, stopping the playback of the content for a predetermined time and outputting the audio during that time, video effects, video playback, and the like.
  • the above-mentioned actions can be appropriately specified for actions at the time of reaching the pilot time code, actions at the end of the pilot time code, actions at the end of the content, actions at the time of reaching the specified time code, etc. Of course.
  • Time adjustment data is data for operating with a time code that takes into account the adjustment time.
  • the data it is possible to specify a character string, a figure, an image, etc. to be displayed, a display position, a display style, and the like. If the screen allocation data is not set, it is displayed on the entire display screen with a layer above the content.
  • the teaching file including the screen teaching data, the content teaching data, and the annotation teaching data is delivered as a video when the teaching data generated based on the operation on the editing screen of FIG. 4 described above is sent from the editor's terminal device 2.
  • the device 1 receives it, the teaching file generation unit 10f generates it based on the teaching data, and stores it in the teaching file storage unit 14c.
  • the generated instruction file for the autopilot is published on the web site or the like operated by the video distribution device 1 and is provided as appropriate. Therefore, the viewer's terminal device 3 wants to view the instruction file from the instruction file. To receive.
  • the viewer's terminal device 3 stores the received teaching file in the teaching file storage unit 31c, and based on the teaching file, the video generation unit 21b generates content that can be displayed on the terminal device 3 and displays the display monitor 28. Playback display is performed above.
  • the teaching file for the autopilot defines the viewpoint, playback speed, presence / absence of zoom, screen allocation, etc. of the content (for example, divided still image data), playback is executed according to these specified contents. ..
  • the instruction file for the autopilot also contains annotation instruction data such as voice and characters, the reproduction of characters and voice is performed at a specified timing in synchronization with the reproduction according to the annotation instruction data. Can be done. Therefore, if the viewer acquires a teaching file for the autopilot that matches his / her taste and purpose, he / she can automatically obtain an opportunity to browse the content suitable for himself / herself without changing his / her viewpoint. Will be.
  • the playback of the autopilot is temporarily interrupted, and the screen based on the user operation is performed. Switching and playback are executed.
  • this point will be described in detail with reference to FIG.
  • the autopilot playback it is possible to shift playback, rewind, move to an arbitrary autopilot time code, etc. in the autopilot time code, and further, except for switching the viewpoint, the autopilot does not have to be interrupted.
  • the above-mentioned user operation includes an operation of pressing the UI such as a button of suspending the autopilot.
  • the vertical axis is the identification number as the direction data
  • the horizontal axis is the time data
  • the file names of the still image data corresponding to the vertical axis and the horizontal axis are shown.
  • the displayed still image data changes according to the user operation as shown in the lower part of FIG. 11. That is, it means that the still image data corresponding to the cell through which the arrow indicated by the solid line passes in the figure is displayed on the terminal device 3 of the viewer.
  • the moving images are sequentially reproduced in chronological order.
  • the designated value receiving unit 10d receives the direction specified value by the swipe operation of the viewer during the execution of the automatic reproduction
  • the automatic reproduction based on the teaching file for the autopilot is temporarily suspended, and the selection unit 10e specifies the direction.
  • the still image data (K005) whose direction specified value is specified by the swipe operation is displayed, the state is temporarily stopped. Then, when the user presses the playback start button again, the still image data corresponding to the direction designation value at that time is continuously played. It should be noted that the still image data corresponding to the direction specified value at that time may be continuously reproduced without being stopped once.
  • the selection unit 10e selects the still image data corresponding to the same time data frame by frame as the direction specified value changes, as described above. Select in the order of identification numbers (K100 to F100). Then, after the still image data (F100) designated by the swipe operation is displayed, if the stop state is not once stopped, the still image data corresponding to the same direction specified value is continuously reproduced.
  • the embodiment in which the selection unit 10e selects the same time data as the still image data based on the time data (t 5p) of the corresponding still image data when the direction designation value is received.
  • the time data next to the current time data may be sequentially selected. In this case, the moving image can be maintained in the played state without being stopped even during the swipe.
  • the selection unit 10e is stationary so that the direction data are continuously connected when the designated value receiving unit 10d does not accept the direction specified value and the amount of change in the direction specified value per unit time is less than the threshold value.
  • Select image data On the other hand, the selection unit 10e selects the still image data so that the direction data is intermittently connected when the change amount of the direction designation value per unit time is equal to or more than the threshold value.
  • intermittently means to acquire only a part of the directional data that are continuously arranged.
  • the operation recognition unit 29 determines that the operation amount by the swipe operation is large due to the user 40 moving the finger large or fast, the still image data corresponding to the adjacent direction data is not acquired. Still image data corresponding to distant direction data can be acquired from the original direction data. Then, the terminal device 3 displays the still image data of the subject at the direction designation value that changes based on the direction designation operation during the direction designation operation by the still image data received from the selection unit 10e. On the other hand, when the direction designation operation is not performed, the terminal device 3 corresponds to the completion position by sequentially receiving and displaying the still image data of the direction designation value corresponding to the completion position of the direction designation operation in chronological order. Display a pseudo video from the direction you want to.
  • control unit 21 executes the editing program 31f in the terminal device 2 of the viewer, and the editing screen 100 as shown in FIG. 4 is displayed on the display monitor 28.
  • the display mode is not limited to FIG.
  • the requesting unit 21a requests the video distribution device 1 to distribute the free-viewpoint video data (S1).
  • the acquisition unit 10b receives the distribution request (S2), and the distribution unit 10a reads the free viewpoint video data related to the distribution request from the content storage unit 14a and directs the viewer to the terminal device 2.
  • Deliver (S3) the free viewpoint video data related to the distribution request from the content storage unit 14a and directs the viewer to the terminal device 2.
  • the viewer's terminal device 2 receives this free viewpoint video data (S4), the video generation unit 21b generates content that can be displayed on the terminal device 2, and the area of the editing screen 100 displayed on the display monitor 28.
  • the selected video is displayed in the 100c and the area 100d (S5).
  • the divided still image data is displayed together with thumbnails and the like in a manner in which the viewer can grasp the division unit.
  • the image selected as the editing target is reproduced.
  • the editorial unit 21c executes the editing process (S6).
  • the details of the editing process will be described in detail later, but for example, selection of divided still image data (viewpoint information), reproduction speed, addition of various annotations, and the like will be performed.
  • the editing unit 21c stores, for example, teaching data conceptually including screen teaching data, content teaching data, and annotation teaching data in the teaching file storage unit 31c and transmits the teaching data to the video distribution device 1. (S7).
  • the acquisition unit 10b receives the teaching data and stores it in the teaching file storage unit 14c (S8), and receives the teaching data from the terminal devices 2 of all the editors (S9 is Yes).
  • the teaching file generation unit 10f generates a teaching file based on the stored teaching data (S10) and stores it in the file storage unit 14c (S11). In this way, a series of processes related to the generation of the teaching file for the autopilot is completed.
  • the teaching file for the autopilot stored in the teaching file storage unit 14c is published to the viewer in a selectable manner on a predetermined website or the like.
  • the editorial unit 21c determines whether or not the content has been selected (S6-1), and when the content is selected (branches S6-1 to Yes), teaches the content teaching data. It is stored in the file storage unit 31c (S6-2). If no content is selected (S6-1 is branched to No), the process proceeds to step S6-3.
  • the content teaching data stored in the teaching file storage unit 31c in step S6-2 includes a pilot time code, an object type, an object ID / URL, a teaching data object ID, an action when the pilot time code is reached, an action when the content ends, and a designated time. It has a code arrival action, a start time code, an end time code, viewpoint-related information, playback speed, zoom-related information, and screen allocation information. These details are as described above.
  • the editorial unit 21c determines whether or not the annotation (character) has been added (S6-3), and when the annotation (character) is added (branches S6-3 to Yes), the annotation is taught. Data (characters) are stored in the teaching file storage unit 31c (S6-4). If the annotation (character) is not added (branch S6-3 to No), the process proceeds to step S6-5.
  • the annotation teaching data (characters) stored in the teaching file storage unit 31c in step S6-4 are the pilot time code, the end pilot time code, the object type, the object ID / URL, the teaching data object ID, and the action when the pilot time code is reached. , Action at the end of the pilot time code, action at the time of reaching the specified time code, annotation action, time adjustment, data, and screen allocation information. These details are as described above.
  • the editorial unit 21c determines whether or not the annotation (figure, symbol, etc.) has been added (S6-5), and when the annotation (figure, symbol, etc.) is added (S6-5 Yes. (Branch to), and the annotation teaching data (graphics, symbols, etc.) are stored in the teaching file storage unit 31c (S6-6). If no annotation (figure, symbol, etc.) is added (S6-5 is branched to No), the process proceeds to step S6-7.
  • the annotation teaching data (figures, symbols, etc.) stored in the teaching file storage unit 31c in step S6-6 are a pilot time code, an end pilot time code, an object type, an object ID / URL, a teaching data object ID, and a pilot time code. It has arrival action, pilot time code end action, specified time code arrival action, annotation action, time adjustment, data, and screen allocation information. These details are as described above.
  • the editorial unit 21c determines whether or not the annotation (voice) has been added (S6-7), and when the annotation (voice) is added (branches S6-7 to Yes), the annotation is taught.
  • the data (voice) is stored in the teaching file storage unit 31c (S6-8). If the annotation (voice) is not added (branch S6-7 to No), the process proceeds to step S6-9.
  • the annotation teaching data (voice) stored in the teaching file storage unit 31c in step S6-8 includes a pilot time code, an object type, an object ID / URL, a teaching data object ID, an action when the pilot aim code is reached, and an action when the content ends. , Action when the specified time code is reached, start time code, end time code, playback speed, and data.
  • the editorial unit 21c determines whether or not all the edits have been completed (S6-9), and if all the edits have not been completed (branches S6-9 to No), step S6-1.
  • the edit process is completed and the process returns to the process after step S8 in FIG.
  • the video distribution device 1 presents a plurality of teaching files for autopilot in a selectable manner on the website.
  • the acquisition unit 21d acquires the teaching file and executes reproduction based on the teaching file (S21).
  • the requesting unit 21a requests the video distribution device 1 to distribute free viewpoint video data (including divided still image data and the like) taught by the content teaching data. (S22).
  • the video distribution device 1 receives a distribution request (S23), and the distribution unit 10a reads out the corresponding free viewpoint video data from the content storage unit 14a and distributes it (S24).
  • the viewer's terminal device 3 receives the free viewpoint video data (S25), the video generation unit 21b generates content that can be displayed on the terminal device 3 based on the free viewpoint video data, and displays the content on the display monitor 28 for playback.
  • Do (S26).
  • it is determined whether or not a user operation for example, a screen swipe operation
  • S27 is if there is no operation (S27 is branched to No), until the end of reproduction (S34).
  • the control unit 21 transmits the operation data (including the direction specified value) to the video distribution device (S28).
  • the video distribution device 1 receives the operation data and stores it in the operation data storage unit 14b (S29).
  • the selection unit 10e selects the free viewpoint video data (still image data) whose direction designation value is designated by the user operation based on the time when the direction designation value is received (S30), and the distribution unit 10a is selected.
  • the free viewpoint video data (still image data) is distributed to the viewer's terminal device 3 (S31).
  • the acquisition unit 21d receives the selected free viewpoint video data (still image data) (S32), and the video generation unit 21b generates content that can be displayed on the terminal device 3. ,
  • the display of the display monitor 28 is switched (S33).
  • the control unit 21 determines whether or not to end the reproduction (S34), returns to the step S22 if the reproduction is not terminated, repeats the above process, and if the reproduction is terminated, a series of steps. Ends the processing of.
  • the end of this reproduction is the end of the automatic reproduction based on the teaching file for the autopilot, and the end of the reproduction when the autopilot is temporarily interrupted based on the user operation and the reproduction is performed based on the user operation. including.
  • the data that the video distribution device 1 can publish in the public place arbitrarily and hierarchically set by the user are classified as shown in FIG. 15A, for example. That is, first is free viewpoint video data, second is a teaching file, third is free viewpoint video data and teaching file, and fourth is a moving image file generated by free viewpoint video data and teaching file.
  • first is free viewpoint video data
  • second is a teaching file
  • third is free viewpoint video data and teaching file
  • fourth is a moving image file generated by free viewpoint video data and teaching file.
  • the teaching file and the moving image file generated by the teaching file or the like will be referred to as an autopilot file.
  • the data published in the public place in this way can be streamed, downloaded, etc. by the terminal device 2 of another user based on his / her own authority.
  • the distribution device 1 determines whether or not to download or the like based on the authority given to the data that can be disclosed and the authority of another user such as viewing.
  • the data that can be disclosed and the authority given to other users such as viewing are classified as shown in FIG. 15 (b), for example.
  • the determination unit 10i of the distribution device 1 determines whether or not the request is possible based on these permissions (A1 to A13), and if the permissions are satisfied, proceeds with processing according to the request such as download and streaming. Become.
  • a user table is stored in the user information storage unit 14l of the storage unit 14 of the video distribution device 1.
  • An example of this user table is as shown in FIG. 16 (a), for example, attribute information such as a name, an address, and a maid address, and the authority (A1 to A1 to) given to the user in association with the user ID.
  • A13 history information such as downloads and purchases is stored.
  • the public place table is stored in the public place information storage unit 14k of the storage unit 14 of the video distribution device 1.
  • An example of a public place table is, for example, as shown in FIG. 16 (b).
  • the public place table the hierarchy of the public place, the relationship with the upper layer, the authority given to the public place or the content, the disclosure range, the publication deadline, the publication target, the published user, and the public place table are linked to the place ID.
  • the content ID is stored.
  • the content stored in the content storage unit 14a of the storage unit 14 of the video distribution device 1 also stores the content associated with the public place in the content table.
  • An example of this content table is as shown in FIG. 16 (c).
  • the type of content (C1 to C4), content data, relevance information, and user ID of the user who is the creator are stored in association with the content ID.
  • the relevance information is information for suggesting that there is a related free-viewpoint video data or an autopilot file for an arbitrary time code when playing back the free-viewpoint video data or the like.
  • the relevance suggestion unit 10k refers to the relevance information at the time of reproducing the free viewpoint video data and the like, and executes the suggestion at the associated timing.
  • the public place setting unit 10h sets the public place table based on the public place setting information sent from the terminal device 2, etc., and opens the public place.
  • the public place includes the hierarchy and the relationship with the upper layer, the public place explained can have a multi-layer nested structure.
  • Public place (organizer; company name, etc.) -2. Public Place (Event Category) -3. Public place (event) -4. Public place (for upload) That is, in the uppermost layer, the public place is published by the name of the organizer, in the middle layer, the public place is published by the category of the event handled by the organizer, and in the lower layer, the public place is published by the event belonging to each category.
  • a public place for uploading content by browsing users and the like can be published.
  • the authority (A1 to A13) can be given to each public place.
  • the public place can have the following nested structure, for example. 1.
  • the authority can be set as follows for each public place. That is, a user login (ID, password) is required for the music company public place. Content in the public place for each artist can be viewed by anyone who can log in to the public place of the music company. The music video / live video purchaser public place can be logged in by entering a PIN code, etc., and the target free-viewpoint video data can be viewed.
  • ID a user login
  • password a password
  • Content in the public place for each artist can be viewed by anyone who can log in to the public place of the music company.
  • the music video / live video purchaser public place can be logged in by entering a PIN code, etc., and the target free-viewpoint video data can be viewed.
  • this is an example, and the present invention is not limited to this.
  • a user with creation authority can create an autopilot file and upload it to the public place.
  • the user having the sales authority may present the price and receive the settlement by the settlement unit 10l, or may receive the grant of alternative points or the like.
  • the official autopilot file may be sold by a music company that is a content holder.
  • the range of people who can purchase the official teaching and video files can be expanded to the music company public place, or it can be narrowed down to only the music video / live video public place, and the range of people who can purchase after a predetermined number of days has passed. It is also possible to change the price and change the price. These changes are made by updating the public place table by the public place setting unit 10h.
  • the nested structure makes it possible to publish only the autopilot file group without disclosing the free viewpoint video data as shown below.
  • 1. Music company public place -2. Public place for each artist -3. Music video / live video purchaser public place -4. Autopilot file group public place In this case, it is possible to disable the transition to the free viewpoint video data for the autopilot file as an authority.
  • the disclosure of publicly available data uploaded to the public place can be regulated by authority, disclosure range, release deadline, disclosure target, etc. If the scope of disclosure is limited to contributors or groups of contributors, the scope of disclosure can be restricted to those persons by restricting that fact within the scope of disclosure. In this case, when a plurality of users shoot the original data of the free viewpoint video data and upload it to the public place, the plurality of users are in a unit called a group. In addition, if access is restricted according to the authority, it may be restricted by the authority. In addition, it is also possible to set that the SNS is allowed to be the public destination within the public range.
  • the terminal device 2 accepts the input of the public place setting information by the operation of the operation unit 30, for example, by accessing the website or the like provided by the distribution device 1, and the transmission unit 21f receives the public place setting information. It is transmitted to the distribution device 1 (S51).
  • the public place setting information includes information such as the hierarchy of the public place, the upper layer if there is an upper layer, the authority, the disclosure range, the publication deadline, and the disclosure target.
  • the acquisition unit 10b acquires the public place setting information (S52)
  • the distribution device 1 sets the public place setting information in the public place information storage unit 14k (S53). At this time, a place ID is assigned and associated with the user ID of the public user.
  • the notification unit 10j transmits a setting completion notification to the terminal device 2 (S54).
  • the terminal device 2 when the acquisition unit 21d receives the setting completion notification, it displays it on the display monitor 28 (S55). Then, the transmission unit 21f transmits the contents (C1 to C4) to be uploaded to the set public place (S56).
  • the acquisition unit 10b receives the sent content (S57), it is associated with the place ID of the public place, registered in the content storage unit 14a, and registered in the content storage unit 14a, and the public place of the public place information storage unit 14k. Update the contents of the table (S58). In this way, the public place setting unit 10h starts publishing the public place (S59).
  • the request unit 21a sends a place ID and a user ID of the selected public place to the distribution device 1 to make a request for browsing or the like (S61).
  • the determination unit 10i determines whether or not the request is possible (S63). Specifically, the determination unit 10i refers to the user table of the user information storage unit 14l, identifies the user from the user ID, confirms the authority given to the user, and publishes the public place information storage unit 14k. The public place is specified from the place ID by referring to the place table, the authority set for the public place is confirmed, and the approval or disapproval of the request is determined by comparing these authority.
  • the determination unit 10i determines that the user has the authority to request processing such as browsing the public place, the determination unit 10i performs the processing according to the authority (S64). Specifically, if the request is download or streaming, those processes are performed.
  • the terminal device 2 receives the content (S65), the terminal device 2 starts playback or the like (S66).
  • the distribution device 1 establishes a public place that accepts uploads of videos taken by users, 3D CG data, 3D point cloud data, etc. (hereinafter referred to as "original data"), and is based on these original data. You may be prompted to generate free-viewpoint video data or an auto-pilot file. For example, by uploading data taken by a plurality of users of a soccer game at a stadium or the like, it is urged to generate free viewpoint video data or an autopilot file based on the original data.
  • Such a public place may be held as a public place related to a shooting event by the event management side, or may be a public place related to an event arbitrarily created by the user side.
  • the determination unit 10i determines whether or not the public place of the original data can be updated based on the authority.
  • the shooting of the original data in addition to being able to shoot only according to the navigation of the official app distributed by the distribution device 1, it is also possible to shoot with a normal camera, ToF, etc.
  • the disclosure target as part of the public place information, it is possible to define acceptable original data.
  • location information can be associated with the original data. For example, when the original data is obtained by shooting the above-mentioned official application, the position information can be obtained from the ticket or the seat.
  • the shooting location may be specified by reading a two-dimensional code such as a QR code (registered trademark) written on the ticket, and whether or not shooting is possible may be known only after going to the seat.
  • shooting can be restricted based on location information, such as the connection status to the designated WiFi, the reception status of Bluetooth installed at the venue, and the ability to participate if the GPS is within the expected range.
  • position identification communication between terminals (BlueTooth, UWB, etc.), position information such as WiFi, wide area position information such as GPS, matching of feature points between photographed objects (ToF, photogrammetry, etc.) Considerable, direction information, pitch angle, roll angle, yaw angle, sea level information, etc. may be acquired and transmitted if they can be acquired. In this case, these information are managed in association with the original data.
  • the time during shooting the time when the file itself was generated, the time stamp included in the original data, the time information acquired from GPS, etc., included in the shot may be used.
  • the time during shooting is calculated from the match with the position identification information (especially the communication information between terminals at that time, the match of feature points, etc.). Of course, it is also good.
  • the distribution device 1 has the qualification authority (purchased, teaching file only, video only, both, etc.) capable of creating an autopilot file for the data when the free viewpoint video data is published to the public place. You may decide (such as granting authority), and for autopilot file generation, give settings for the autopilot file generation upper limit time (60 seconds, etc.) and / or the lower limit time (10 seconds or more, etc.). Is also possible.
  • the qualification authority purchased, teaching file only, video only, both, etc.
  • the user may be able to set the autopilot file generation upper limit time individually.
  • the information on the upper limit time is associated with the data. For example, the total generation upper limit time (600 seconds, etc.) of the autopilot file that can be generated in one month, the generation upper limit time (30 seconds, etc.) when one autopilot file is generated, and the like. It may be possible to extend the upper limit time by paying some consideration for any generation upper limit time, or by obtaining a certain evaluation for the autopilot generated from another user and raising the rank. For example, it is an image that the total generation upper limit time in the period is extended to 1200 seconds, or the generation upper limit time is extended to 120 seconds.
  • the distribution device 1 may enable the free viewpoint video data of each viewpoint to be selectively acquired when a plurality of viewpoints exist in the free viewpoint video data.
  • a service such as cheaper than buying the 5-viewpoint individually for each viewpoint.
  • you may give the privilege viewpoint or privilege autopilot file for a fee or free of charge.
  • you have the right to create an autopilot file for the free viewpoint video data for a fee or free of charge. You may give it at. As a result, it is possible to purchase only the necessary viewpoints and make it cheaper as a result, or to give motivation to complete all viewpoints.
  • the notification unit 10j acquires the free viewpoint video data or the autopilot file, and the new viewpoint or the autopilot file is added to the data later, the user obtains the free viewpoint video data or the autopilot file. Notify the side (whether notification is possible or not, notification reception conditions may be decided by the user side).
  • the notification method may be Web push, application notification, attention at the time of viewing the data, notification to the user's email, or the like.
  • the notification unit 10j even if the user has not acquired the free viewpoint video data and the autopilot file, the notification unit 10j notifies the user side when the user has made settings such as anxiety. (The notification availability and notification reception conditions may be set by the user).
  • the relevance suggestion unit 10k suggests that there is a related free viewpoint video data or an autopilot file for an arbitrary time code when viewing normal free viewpoint video data.
  • notifications such as autopilot files such as fine play
  • cosmetologists for education when it was difficult to understand the explanation of the cut in a certain time code, a normal video was associated and uploaded. It is like notifying (suggesting) to that effect.
  • the relevance suggestion unit 10k is a player corresponding to the autopilot file viewing, it suggests that there is a related free viewpoint video data or an autopilot file for an arbitrary time code. For example, in the case of sports, it is like an "autopilot file" such as fine play. In this case as well, it is possible to notify (suggest) at any time when viewing the data regardless of the time code.
  • a privilege such as access to free-viewpoint video data or an autopilot file may be given to a physical device (DVD, etc.) or a music video acquired (purchased, etc.) digitally.
  • the user may create an autopilot file so that it can be shared on the public place according to the authority. Whether or not a paid setting can be made can be decided by setting qualifications on the content holder side. You may be able to give points when you get a high evaluation and use it like money in the public place.
  • the content holder side can also publish the autopilot file (the upper limit of the number of publications may be set by the contract plan with our company). You may set the amount by watching for one month as a subscription.
  • there is a wonderful autopilot file created by the user or a highly evaluated one that surpasses the one generated by the content holder it is possible to link it to a mechanism that allows you to request work or recruit. ..
  • the distribution device 1 can also be set as a swipe time based on the instruction of the publisher. When you enter this swipe time, it will automatically stop at any time code (you can stop the sound or select the sound during the swipe time separately), and it will automatically rotate there (not only the movement of the viewpoint but also the time code). It is also possible to proceed at any speed), and when it finishes turning arbitrarily, playback will start automatically, or you will instruct yourself to play. Regarding this swipe time, the viewer log may be taken and skipped from the second time may be arbitrarily selected, or the arbitrary selection may be selected by the setting on the public side.
  • the video distribution system of the present invention can also be used for auditions and contests.
  • an idol audition will be held on the official app for C, and participation will be possible if the participation qualifications, shooting conditions, etc. are met.
  • This audition or contest can be held in tie-up with a company, and if the user has the authority, the audition or contest can be held by setting the disclosure range, granting viewing qualification, etc.
  • a normal user's usage method for example, it can be considered to be used at a school festival or the like.
  • 5 smartphones with the official app for C installed will shoot according to the guide of the official app for C, for example, the 5 smartphones are within the expected range in terms of GPS location information, and each terminal will It is possible to specify a state in which communication is bidirectional by BlueTooth, UWB, etc. and it is guaranteed to exist within the expected range with high accuracy.
  • the size of the subject with respect to the shooting range is attended (please lower it a little so that the entire subject can be included, etc.) and the conditions are not met, shooting cannot be started.
  • one terminal is used as a parent to start shooting, and its children (here, the other four) behave synchronously in response to a shooting start command, a pause command, and a complete stop command.
  • a cout down may be spoken and displayed before the start and stop of shooting. It is possible to have a terminal that participates in shooting as a parent or a terminal that does not participate in shooting as a parent. Furthermore, the parent can be the parent who started shooting first, or can be the parent only for a fixed terminal. In addition, it is possible for a child to pause or completely stop shooting. If the participation qualification is 15 years old or older, 18 years old or younger, etc., it is possible to set a flow for whether or not the participation qualification is made. For example, it is like sending a photo of a face such as a student ID card and a photo of one's own face together. Regarding the participation qualification, there are cases where the participation qualification is judged immediately, and there are cases where only the items necessary for the participation qualification are sent and the participation qualification is judged later after shooting.
  • the organizer can make various settings for the distribution device 1. For example, the free-viewpoint video data and videos of the dance that you want to dance first will be released from a week ago, and you will be asked to dance the dance. It's like having them speak with a gesture. I know what the audition is (such as the role of the movie %), but without prior information on the audition content, the audition content will be announced from the smartphone after the participation starts, and singing and dancing to the music. , It is possible to use various methods such as ad-lib play for flowing lines from smartphones, and it is also possible to set restrictions such as the script etc. being displayed after the start of participation and the shooting for posting must be completed within 1 hour. be.
  • the organizer may set the disclosure range and establish a mechanism to win by the evaluation from the browsing user, or the user takes the initiative until the third selection.
  • the final selection can be decided by the organizer, etc., a tournament ceremony divided into groups, a repechage, etc. are also possible.
  • the video distribution system of the present invention it is possible to utilize free-viewpoint video data by tie-up planning. For example, if you take a picture of the QR code (registered trademark) given to the product when you purchase the soft drink according to the guide of the official app, you can upload the original data, and the tie-up company side selected the original data. It is a usage method such as creating free viewpoint video data from the above and diverting it to campaign videos, commercials, etc.
  • the imaging timing of the original data is a pattern in which shooting is performed by the application at a predetermined date and time (for example, 30 seconds from 23:59:45 on December 31 to 0: 0:15 at the beginning of the year, etc., in each country.
  • the result data created from the original data may be other than the free viewpoint video data. For example, videos of thousands of people may be merged and arranged in tiles.
  • messages and fixed songs are accepted during the time of the earthquake (for example, 1 minute), and the place is like around a street piano in Kobe City.
  • the shooting spots of the free viewpoint video data scattered in various places are displayed on the map, the shot spots can be recognized, and if the publishing authority is turned on, other people participating However, if you know that you shot at that place, or if you have the public authority for data and the public authority for autopilot files turned on, you can have other people see your own free-viewpoint video data, etc. Is also possible.
  • the teaching file for the autopilot can be generated. Therefore, if the terminal device of the viewer acquires the teaching file for the autopilot, the teaching file is the teaching file. Automatic playback based on is possible. At this time, since the teaching file contains various annotation teaching data such as voice, characters, images, and figures, additional effects are automatically reproduced along with the reproduction. Therefore, the viewer can enjoy the reproduction accompanied by the switching of the desired viewpoint or the like only by acquiring and executing the teaching file that meets the needs without switching the viewpoint or the like by himself / herself.
  • Such an autopilot responds to needs such as complicated browsing while changing the viewpoint by oneself, not knowing when it is useful, and wanting to browse in a short time at once.
  • a live video or the like may be first published as free viewpoint video data (including divided still image data), and a teaching file generated based on the teaching data edited by the editor may be published later. It is possible. For example, when handling free-viewpoint video data related to a live performance, it is possible to generate a teaching file or the like that enables reproduction following only a specific artist.
  • the editor's terminal device 2 basically generates various teaching data as described above, and the video distribution device 1 side generates a teaching file for the autopilot. It is also possible to record user operations (eg, swipe operations) on devices 2 and 3 and use them as part of the teaching data.
  • user operations eg, swipe operations
  • the automatic playback can be temporarily interrupted and the viewpoint can be switched based on the user operation.
  • a degree of freedom for example, a swipe operation
  • teaching file for autopilot can be re-edited by forking (branching and copying), merging (combining), cloning (copying), etc., so the published teaching file can be shared by multiple people. By doing so, it can be expected that it will develop into various things.
  • the embodiment of the present invention also includes the following contents.
  • the teaching file for the autopilot may be generated based on the free viewpoint video data in the live distribution (live distribution).
  • the teaching file for the autopilot automatically generated by machine learning may be live-streamed (live-streamed), created by humans (co-editing work is also possible), and live at any time (for example, 5). After a minute delay, etc.), the viewer may be able to play the content from the start of the live with a delay of any time.
  • the editor may view and edit the teaching file for autopilot created by machine learning in a complex manner and perform live distribution (live distribution).
  • the normal free-viewpoint video data may be distributed for a certain period of time, and the teaching file for the autopilot may be live-distributed (live-distributed) again at the stage of creation.
  • teaching file for the autopilot For co-editing of teaching files for autopilot, you can quickly autopilot by performing editing merge using already established co-editing technology, exclusive control on your own timeline, OT (Operational Transformation) method, etc. You may create it.
  • the teaching file for autopilot is automatically generated by machine learning, and the teaching file for autopilot generated by machine learning can be viewed and edited by the editor, auto.
  • a "video file" up to the point where the work is completed while creating the teaching file for the autopilot may be generated, or it may be distributed as a normal video file.
  • information about free-viewpoint video content, etc. included in the components of each time code for the video file can be embedded in the video as metadata (for example, XMP format, etc.), or can be obtained by associating it as a separate file (for example).
  • the location of the file may be described in XMP, etc., for example, in the case of HLS format, the location and contents of the file may be described in the m3u8 file, etc., or an inquiry may be made to a predetermined server.
  • the metadata By referring to the metadata, the content of the file and the location of the file may be obtained), and if the video player supports it, the free-viewpoint video currently being viewed from the video file during playback, etc.
  • the content of the free viewpoint video of the generation source is arbitrarily transitioned to.
  • the free-viewpoint video can be viewed, and the autopilot and live autopilot (both free-viewpoint video and video file) can be restarted by returning to the transition point.
  • the content owner creates it personally (collaboration work is also possible, and it is possible to grant the collaborative editing function to general users based on authority), and a teaching file for live autopilot after a predetermined time has elapsed. May be delivered.
  • the teaching file for the live autopilot may be generated and distributed from the most commonly viewed viewpoint. good.
  • moving image streaming data such as, for example, HLS format may be sequentially generated from the teaching file for the live autopilot and live-distributed (live-distributed).
  • information about free-viewpoint video content, etc. included in the components of each time code for video streaming data can be embedded in the video as metadata (for example, XMP format, etc.) or associated with it as a separate file.
  • the location of the file may be described in XMP, etc., or for example, in the case of HLS format, the location and contents of the file may be described in the m3u8 file, etc., and an inquiry is made to a predetermined server. (You may acquire the contents of the file and the location of the file, etc.), and by referring to the metadata, if it is a compatible video player, the free viewpoint that was currently being viewed from the video file during playback, etc. Of course, it may be possible to transition to the video content and change to an arbitrary viewpoint, and it may be possible to return to the position at the transition point of the moving image file and resume playback.
  • a teaching file for autopilot that realizes content playback with a viewpoint, enlargement, etc. suitable for the user is generated based on the attribute information.
  • it may be provided to the user. For example, in the case of sports, if "ball" or the like is selected, a teaching file for an autopilot that recognizes the ball as an object and always follows it may be generated and distributed.
  • Public place information storage 14l ... User Information storage unit, 15 ... I / O port, 16 ... hub, 17 ... router, 21 ... control unit, 21a ... request unit, 21b ... video generation unit, 21c ... editorial unit, 21d ... acquisition unit, 22 ... RAM, 23 ... ROM, 24 ... PEG code module, 25 ... I / O port, 26 ... wireless communication unit, 27 ... drawing unit, 28 ... display monitor, 29 ... operation recognition unit, 30 ... operation unit, 31 ... storage unit, 31a ... Content storage unit, 31b ... Operation data storage unit, 31c ... Teaching file storage unit, 31d ... OS, 31e ... Browser program, 31f ... Editing program.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Graphics (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本発明は、ログイン等の権限を定めた階層的なコンテンツ公開の場を設定及び開設し、コンテンツを配信する技術を提供する。 本発明は、映像配信装置とユーザの端末装置とからなる映像配信システムであって、映像配信装置は、端末装置から送信された公開プレイス設定情報に基づき、少なくとも自由視点映像データ及び教示ファイルを含むコンテンツデータを配信可能に公開する公開プレイスを設定する公開プレイス設定部と、公開プレイスの前記コンテンツデータについてユーザの端末装置より配信に係る要求があったときに、少なくとも要求をしたユーザの権限及び前記公開プレイスに設定された権限に基づいて、要求に係る処理の可否を判定し、条件を満たす場合には、処理を実行する判定部と、を有する。

Description

映像配信装置、映像配信システム、映像配信方法、及びプログラム
 本発明は、自由視点映像データ等を利用する技術に係り、特に自由視点映像データ等を編集し、オートパイロット用の教示ファイルを生成し、それらを公開する場である公開プレイスの設定及び開設に関わる技術に関する。
 従来、自由視点映像データ等を利用する技術は多岐に亘る。そのような中で、複数のカメラで撮影された画像を利用する映像配信装置ついても種々の技術が提案されている。例えば、同一の被写体に対して視点が異なる複数台のカメラのうち、予めユーザ指定された一部のカメラの配置状態を基準として、被写体に対する視点を変える技術がある(例えば特許文献1等参照)。同技術では、一連の結合動画像の生成に用いる画像を撮影する1又は2以上の他のカメラを、ユーザ指定のカメラと共にグループ指定し、この指定したグループ内の各カメラの各撮影動画像を所定の切り換えタイミングで切り換え結合して一連の結合動画像を生成するために、その結合する順番を決定する。
 一方、複数のカメラにより同時に撮像された複数の動画を編集して1本の動画を作成する技術がある(例えば特許文献2等参照)。同技術では、動画撮像可能な複数のカメラと無線又は有線により接続され、前記複数のカメラから1乃至複数のライブビュー画像を取得するライブビュー画像取得部と、前記ライブビュー画像取得部により取得した1乃至複数のライブビュー画像を表示する表示部と、前記表示部に表示させるライブビュー画像を手動操作により切り替える操作部と、前記操作部での操作履歴を示す操作履歴情報を記録する操作履歴記録部と、前記複数のカメラによる動画撮像の終了後、前記複数のカメラによりそれぞれ撮像された複数の動画と前記操作履歴記録部に記録された操作履歴情報とに基づいて一本の動画を自動的に作成する動画編集を行う動画編集部とを備える。
 さらに、共有グループの共有部にてコンテンツの共有を行う際に前記コンテンツの利用権限を管理するコンテンツ共有システム用利用権限管理装置に関する技術がある(例えば特許文献3参照)。このコンテンツ共有システム用利用権限管理装置では、コンテンツの利用権限を登録する登録ユーザの操作入力に基づいてコンテンツを固有に識別する登録識別情報をコンテンツに割り当ててコンテンツの利用権限を登録する登録手段と、コンテンツの登録識別情報と登録ユーザの登録ユーザ識別情報とを対応させて登録ユーザによる利用上の情報管理を行う管理手段とを備えている。
特開2015-177394号公報 特許第6302564号公報 特許第4697468号公報
 しかしながら、特許文献1は、複数のカメラで撮影された、それぞれ指定されたカメラの動画を、その都度結合処理する技術を開示するものであり、動画を編集し、オートパイロット用の教示ファイルを生成する点については開示されていない。
 一方、特許文献2は、複数のカメラにより撮像された複数の動画と操作履歴情報とに基づいて一本の動画を自動的に作成する動画編集を行うことを開示しているにすぎず、文字や音声等のアノテーションを動画に付加することや、編集の結果をオートパイロット用の教示ファイルとして配信する点については開示されていない。
 さらに、特許文献3では、ユーザの設定により、ログイン等の権限を個別に定めた階層的なネスト構造の公開プレイスを開設し、コンテンツを配信可能とする点については、何ら開示も示唆もされていない。
 本発明は、このような課題に鑑みてなされたものであり、その目的とするところは、ログイン等の権限を定めた階層的なコンテンツ公開の場を設定及び開設し、コンテンツを配信する技術を提供することにある。
 上記課題を解決するために、本発明の第1の態様に係る映像配信システムは、映像配信装置とユーザの端末装置とからなる映像配信システムであって、前記映像配信装置は、前記端末装置から送信された公開プレイス設定情報に基づき、少なくとも自由視点映像データ及び教示ファイルを含むコンテンツデータを配信可能に公開する前記公開プレイスを設定する公開プレイス設定部と、前記公開プレイスの前記コンテンツデータについて前記ユーザの端末装置より配信に係る要求があったときに、少なくとも要求をした前記ユーザの権限、及び前記公開プレイスに設定された権限に基づいて、前記要求に係る処理の可否を判定し、条件を満たす場合には、前記処理を実行する判定部と、を有し、前記端末装置は、前記映像配信装置の前記公開プレイスの前記コンテンツデータについて配信に係る要求を行う要求部と、前記映像配信装置から配信されたコンテンツデータを取得する取得部と、前記コンテンツデータに基づく映像を表示する表示部と、を有する。
 本発明の第2の態様に係る映像配信方法は、映像配信装置とユーザの端末装置とよる映像配信方法であって、前記映像配信装置が、前記端末装置から送信された公開プレイス設定情報に基づき、少なくとも自由視点映像データ及び教示ファイルを含むコンテンツデータを配信可能に公開する前記公開プレイスを設定し、前記公開プレイスの前記コンテンツデータについて前記ユーザの端末装置より配信に係る要求があったときに、少なくとも要求をした前記ユーザの権限、及び前記公開プレイスに設定された権限に基づいて、前記要求に係る処理の可否を判定し、条件を満たす場合には、前記処理を実行し、前記端末装置が、前記映像配信装置の前記公開プレイスの前記コンテンツデータについて配信に係る要求を行い、前記映像配信装置から配信されたコンテンツデータを取得し、前記コンテンツデータに基づく映像を表示する。
 本発明の第3の態様に係る映像配信装置は、ユーザの端末装置と通信自在な映像配信装置であって、前記端末装置から送信された公開プレイス設定情報に基づき、少なくとも自由視点映像データ及び教示ファイルを含むコンテンツデータを配信可能に公開する前記公開プレイスを設定する公開プレイス設定部と、前記公開プレイスの前記コンテンツデータについて前記ユーザの端末装置より配信に係る要求があったときに、少なくとも要求をした前記ユーザの権限、及び前記公開プレイスに設定された権限に基づいて、前記要求に係る処理の可否を判定し、条件を満たす場合には、前記処理を実行する判定部と、を有する。
 本発明の第4の態様に係るプログラムは、ユーザの端末装置と通信自在なコンピュータを、前記端末装置から送信された公開プレイス設定情報に基づき、少なくとも自由視点映像データ及び教示ファイルを含むコンテンツデータを配信可能に公開する前記公開プレイスを設定する公開プレイス設定部、及び前記公開プレイスの前記コンテンツデータについて前記ユーザの端末装置より配信に係る要求があったときに、少なくとも要求をした前記ユーザの権限、及び前記公開プレイスに設定された権限に基づいて、前記要求に係る処理の可否を判定し、条件を満たす場合には、前記処理を実行する判定部として機能させる。
 本発明によれば、ログイン等の権限を定めた階層的なコンテンツ公開の場を設定及び開設し、コンテンツを配信する技術を提供することができる。
本発明の実施形態に係る映像配信システムの構成図である。 同システムにおける映像配信装置の構成図である。 同システムにおける端末装置の構成図である。 編集画面の一例を示す図である。 動画データ及び分割データについて示す図である。 分割データの切り換えについて示す図である。 スクリーン教示データの構造を示す図である。 コンテンツ教示データの構造を示す図である。 アノテーション教示データの構造を示す図である。 アノテーション教示データの構造を示す図である。 生成された静止画データの順番を示す図である。 同システムによる自由視点映像データ等の編集に係る処理手順を示すフローチャートである。 編集処理の詳細な処理手順を示すフローチャートである。 オートパイロット用の教示ファイルに基づく再生等の処理手順を示すフローチャートである。 図15(a)はコンテンツの種別を定義して説明する図であり、図15(b)は権限の種別を定義して説明する図である。 図16(a)はユーザテーブルの一例を示す図であり、図16(b)は公開プレイステーブルの一例を示す図であり、図16(c)はコンテンツテーブルの一例を示す図である。 公開プレイス開設に関わる処理手順を示すフローチャートである。 権限に応じた処理の処理手順を示すフローチャートである。
 以下、図面を参照しつつ本発明の一実施形態について説明する。
 図1には、本発明の実施形態に係る映像配信システムの構成を示し説明する。
 同図に示されるように、映像配信システムは、映像配信装置1と、編集者の端末装置2と、閲覧者の端末装置3とが、インターネット等の通信網4に無線又は有線で接続されている。映像配信装置1は、1又は2以上のサーバ装置やコンピュータ等により実現されてよい。編集者の端末装置2としては、スマートフォン、タブレット端末、ノート型パーソナルコンピュータ、デスクトップ型パーソナルコンピュータ、ヘッドマウントディスプレイ等、操作入力受付け等が可能で、情報表示を可能とする端末であれば、各種のものを採用することができる。これと同様に、閲覧者の端末装置3としては、スマートフォン、タブレット端末、ノート型パーソナルコンピュータ、デスクトップ型パーソナルコンピュータ、ヘッドマウントディスプレイ等、操作入力受付け等が可能で、情報表示を可能とする端末であれば、各種のものを採用することができる。
 このような構成において、映像配信装置1は、編集者の端末装置2からの要求を受けると、複数のカメラで被写体を撮影した自由視点映像データ等を、当該編集者の端末装置2に送信する。編集者の端末装置2では、詳細は後述する所定の編集画面が表示され、自由視点映像データを閲覧しながら、映像の切り替え(視点の切り換え)、拡大、縮小、各種アノテーション(文字、図形、記号、及び音声等)の付加等を行い、編集結果である教示データを映像配信装置1に送信する。編集者が複数の場合には、各編集者の端末装置2より教示データが映像配信装置1に送信される。映像配信装置1は、教示データを受信すると、当該教示データに基づいて、オートパイロット用の教示ファイルを生成する。更に、映像配信装置1は、オートパイロット用の教示ファイルを、閲覧者の端末装置3に配信可能に提示する。この提示は、専用のWebサイト等により行ってもよく、或いは端末装置2でのアプリケーションプログラムの実行により表示される画面にて行ってもよい。
 ここで、「オートパイロット」とは、自由視点映像データの表示等に関して、閲覧者が任意に操作せずとも、教示ファイルの構成内容に基づいて自動操作により視点の切替えや、再生時間位置の移動等を行い表示することをいう。「ライブオートパイロット」とは、任意に指定した所定時間経過後、または可能な限り即時に、オートパイロット用の教示ファイルを逐次生成、配信することをいい、自由視点映像データのライブ配信(生配信)、オンデマンド配信等の配信形態を問わず行うことができる。
 閲覧者の端末装置3で、映像配信装置1の提供するWebサイト等で、オートパイロット用の教示ファイルが選択され、配信要求がなされると、映像配信装置1は、選択されたオートパイロット用の教示ファイルを閲覧者の端末装置3に配信する。このとき、閲覧者の有する権限に応じて、教示ファイルの配信の可否、及び教示ファイル有無の表示の可否について決定するようにしてもよい。従って、例えば、教示ファイル有無の表示は全員にできるが、教示ファイルの配信に関しては購入済権限を持つ人のみに可能としたり、購入済権限が無ければ教示ファイル自体表示されないようにしたりできる。
 閲覧者の端末装置3は、オートパイロット用の教示ファイルを受信すると、当該教示ファイルに基づいて、自由視点映像を再生する。従来であれば、閲覧者の端末装置3で、所望とする視点等に切り換えながら自由視点映像の再生を行っていたが、本実施形態によれば、自動的に視点等を切り換えながらの有用な再生が実現される。なお、自由視点映像の再生に伴う、コンテンツの取得については、例えば、オンラインストリーミングでも、ダウンロードでもよく、複合的に行ってもよいことは勿論である。
 すなわち、閲覧者の端末装置3は、一旦、教示ファイルと自由視点映像データをダウンロードすれば、通信環境下でなくても、いずれも自由に自由視点映像を再生することが可能となり、それらを編集して、教示ファイルの再生成が可能であることは勿論である。また、自由視点映像データのみをダウンロードした場合にも、それらを編集して、教示データの生成及び教示ファイルの生成が可能であることは勿論である。また、端末装置3で編集、生成ないしは再生成した教示ファイルを任意に映像配信装置1へ送信し、権限を付与し配信することが可能であることは勿論である。
 映像配信装置1は、ユーザの端末装置2,3からのリクエストに応じて、自由視点映像データや教示ファイル等の各種コンテンツを公開する場である公開プレイスを例えばWebサイト等で開設する。この公開プレイスの開設に際しては、編集者の端末装置2、及び閲覧者の端末装置3等から公開プレイス設定情報を受信し、当該設定情報に基づいて、階層的なネスト構造の公開プレイスを開設する。以下では、編集者、閲覧者に一般ユーザを加えたものをユーザと定義する。ユーザ、公開プレイス、及びコンテンツには、例えば、サイトへのログインやコンテンツのストリーミング、ダウンロード等の各種権限を設定することができるので、映像配信装置1は、公開プレイスについて、各種要求があった場合には、権限に基づく処理(例えば、ダウンロード等)を実行する。即ち、一般ユーザであっても、当該権限さえ取得していれば、公開プレイスの開設等が可能となる。
詳細は後述する。
 図2には、映像配信システムにおける映像配信装置の詳細な構成を示し説明する。
 同図に示されるように、サーバ装置等からなる映像配信装置1は、全体の制御を司る制御部10と、メモリとしてのRAM(Random Access Memory)11及びROM(Read Only Memory)12と、MPEGデコードモジュール13と、HDD(Hard Disc Drive)、SSD(Solid State Drive)、フラッシュメモリ等からなる記憶部14と、I/Oポート15とを有し、これらがバスラインに接続されている。I/Oポート15には、HUB16を介してルータ17が接続されている。尚、制御部10は、例えば、CPU(Central Processing Unit)、マイクロプロセッサ(Microprocessor)、マルチプロセッサ(Multiprocessor)、ASIC、FPGA等で構成されてよい。
 記憶部14は、コンテンツ記憶部14a、操作データ記憶部14b、教示ファイル記憶部14c、公開プレイス情報記憶部14k、及びユーザ情報記憶部14lを有する。コンテンツ記憶部14aには、自由視点映像データや、それを分割した静止画データ等が記憶されている。操作データ記憶部14bには、編集者の端末装置2から送られてきた操作データ等が記憶されている。教示ファイル記憶部14cには、生成したオートパイロット用の教示ファイルが記憶されている。公開プレイス情報記憶部14kには、詳細は後述する公開プレイス設定情報が記憶されている。そして、ユーザ情報記憶部14lには、ユーザの属性情報や権限、閲覧履歴等の情報が記憶されている。
 記憶部14には、更にOS14d、データ取得プログラム14e、データ生成プログラム14f、教示ファイル生成プログラム14g、選択プログラム14h、配信プログラム14i、及びコンテンツ生成プログラム14jが記憶されている。したがって、制御部10は、配信プログラム14iを実行することで、配信部10a、公開プレイス設定部10h、判定部10i、通知部10j、及び関連性示唆部10kとして機能し、データ取得プログラム14eを実行することで取得部10bとして機能し、データ生成プログラム14fを実行することでデータ生成部10cとして機能し、選択プログラム14hを実行することで指定値受付部10d及び選択部10eとして機能し、教示ファイル生成プログラム14gを実行することで教示ファイル生成部10fとして機能する。コンテンツ生成プログラム14jを実行することで、コンテンツ生成部10gとしても機能する。このほかOS14dの下、決済部10lとして機能する。
 取得部10aは、複数の動画データを自由視点動画データとしてI/Oポート15を介して取得する。本実施形態では、取得部10aは、被写体をそれぞれ異なる方向から撮像した複数の動画データを取得する。取得した自由視点動画データはコンテンツ記憶部14aに記憶される。
 データ生成部10cは、取得部10bが取得した自由視点動画データ、即ち複数の動画データそれぞれについて、所定の時間ごとのフレームを静止画として抽出して静止画データを生成する。より詳細には、データ生成部10cは、コンテンツ記憶部14aに記憶された動画データをMPEGデコードモジュール13で解凍し、静止画データの集合とした上で、コンテンツ記憶部14aに保存する。この際、各静止画データは、それぞれが撮像されたタイミングを示す時間データと関連付けて保存される。
 指定値受付部10dは、閲覧者の端末装置3より、閲覧したい静止画データにおける位置データを指定する方向指定値(操作データ)を受け付ける。選択部10eは、指定値受付部10dが受け付けた方向指定値に基づいて、時間データに沿って静止画データを選択し、通信網4を介して、閲覧者の端末装置3に送信する。本実施形態では、閲覧者の端末装置3が静止画データを受信して、映像を生成する。
 教示ファイル生成部10fは、編集者の端末装置2からの教示データに基づいて、オートパイロット用の教示ファイルを生成し、教示ファイル記憶部14cに記憶する。教示ファイルのファイル構造については、後に詳述する。配信部10aは、閲覧者の端末装置3からの配信要求に従い、教示ファイル記憶部14cから指定されたオートパイロット用の教示ファイルを読み出し、通信網4を介して閲覧者の端末装置3に送信する。この送信の際には、該当するコンテンツデータ(分割された静止画データを含む)を同時に送信しても、閲覧の過程で該当するコンテンツデータを都度送信してもよい。
 コンテンツ生成部10gは、自由視点映像データ及び教示ファイルに基づいて、自由視点映像データのコンテンツを生成、または動画のストリーミングデータ等のコンテンツを生成する。このコンテンツも、配信部10aにより閲覧者の端末装置3に送信される。
 公開プレイス設定部10hは、端末装置2,3からの公開プレイス設定情報に基づいて階層的なネスト構造の公開プレイスを開設し、コンテンツの配信を可能とする。判定部10iは、ユーザから公開プレイスにアップロードされているコンテンツに対してダウンロードやストリーミング等のリクエストがあった場合に、ユーザの権限、公開プレイスの権限、及びコンテンツの権限に基づいて、ダウンロード等の処理の可否を判定する。通知部10jは、公開プレイスで公開されている自由視点映像データ等について、他の視点の自由視点映像データがアップロードされた場合等に、その旨を、公開者等に通知する。関連性示唆部10kは、コンテンツが再生されているときに、関連する動画等が存在する場合には、関連性を示唆する。そして、決済部10lは、公開プレイスにアップロードされているコンテンツについて、販売等に関わる電子決済を行う。
 図3には、映像配信システムにおける編集者の端末装置2の構成を示し説明する。閲覧者の端末装置3も基本構成は同じである。
 同図に示されるように、編集者の端末装置2(閲覧者の端末装置3も同様)は、制御部21と、RAM22と、ROM23と、JPEGデコードモジュール24と、I/Oポート25と、無線通信部26と、描画部27と、表示モニタ28と、操作認識部29と、操作部30と、記憶部31と、撮像部32と、GPS部33とを有する。各部は、バスラインを介して接続されている。制御部10は、例えば、CPU、マイクロプロセッサ、マルチプロセッサ、ASIC、FPGA等で構成されてよい。記憶部31は、HDDやフラッシュメモリである。
 記憶部31は、コンテンツ記憶部31a、操作データ記憶部31b、及び教示ファイル記憶部31cを有する。コンテンツ記憶部31aは、映像配信装置1から送られてきた自由視点動画データや静止画データ等を記憶する。操作データ記憶部31bは、画面操作に基づいて再生映像の視点等が変更されたときに、その操作データを記憶する。そして、教示ファイル記憶部31cは、映像配信装置1から送られてきた教示ファイルや、編集時に生成された教示データを記憶する。
 記憶部31は、OS31d、ブラウザプログラム31e、編集プログラム31f、教示ファイル生成プログラム31gを記憶している。したがって、制御部21は、OS31dに基づき、要求部21a、取得部21d、送信部21f、コード解析部21g、及び位置情報取得部21hとして機能し、ブラウザプログラム31eを実行することで、映像生成部21bとして機能し、編集プログラム31fを実行することで編集部21cとして機能する。閲覧者の端末装置3の表示モニタ28がタッチパネルである場合には、記憶部31は、タッチパネル制御ファームウェアを記憶する。制御部21は、教示ファイル生成プログラム31gを実行することで、教示ファイル生成部21eとして機能する。
 編集時においては、次のような処理を各部が行う。即ち、要求部21aは、映像配信装置1に対して、自由視点映像データ(分割された静止画データを含む)を要求する。この要求の送信は、I/Oポート25を介して接続された無線通信部26が行う。無線通信部26に代えて、有線通信部を備えてもよい。取得部21dは、映像配信装置1から送られてきた自由視点映像データ(分割された静止画データを含む)を取得する。映像生成部21bは、自由視点映像データから端末装置3に表示可能なコンテンツを生成する。このとき描画部27は、表示モニタ28への表示を制御する。なお、取得した静止画データは、JPEGデコードモジュール24によりデコードされる。
 編集部21cは、詳細は後述する画面での編集者による操作に基づいて、自由視点映像データ(分割された静止画データを含む)の視点の変更、画面割、拡大/縮小、再生速度の変更、アノテーション(文字、図形、記号、及び音声等)の付加などを含む編集処理を実行し、教示データを生成し、教示ファイル記憶部31cに保存する。教示データの一部を操作データとする場合には、操作認識部29が、操作部30の操作を認識して、方向指定値を含む操作データとして操作データ記憶部31bに保存する。教示ファイル生成部21eは、教示データに基づいて、オートパイロット用の教示ファイルを生成し、教示ファイル記憶部31cに記憶する。送信部21fは、コンテンツ記憶部31aのコンテンツデータ(例えば、動画のストリーミングデータ等)や、教示データ、教示ファイル等を、無線通信部26を介して映像配信装置1に送信する。
 一方、オートパイロット用の教示ファイルに基づく再生を行う場合には、次のような処理を各部が行う。即ち、要求部21aは、映像配信装置1に対して、オートパイロット用の教示ファイルを要求する。取得部21dは、映像配信装置1から送られてきたオートパイロット用の教示ファイルを取得する。このとき、再生に必要な3次元点群データ、3次元CG、動画データや静止画データ等のコンテンツデータを取得してもよい。そして、映像生成部21bが、教示ファイルに基づいて映像を生成し、描画部27により表示モニタ28にて動画の再生を行う。教示ファイルにアノテーションデータ等が含まれている場合、動画の再生と共に、音声、テキスト、図形等の再生も教示ファイルで定義されたタイミングで行う。
 オートパイロット用の教示ファイルに基づく再生の過程で、閲覧者により操作部30が操作され、視点の変更等が指示されると、操作認識部29が、その操作を認識し、方向指定値に係る操作データを生成する。要求部21aは、方向指定値に係る操作データを映像配信装置1に送信し、視点の変更等を要求する。映像配信装置1から、視点の変更等がなされた自由視点映像データ(分割された静止画データを含む)を取得部21dが取得すると教示ファイルに基づく再生を一旦中止して、視点を変えた再生が実行される。
 コード解析部21gは、撮像部32により撮像したQRコード(登録商標)等の二次元コードを解析し、コード情報を取得する。このコード情報には、例えば、座席番号や、当該座席と紐づけられている位置情報等が含まれてよい。位置情報取得部21hは、無線通信部26の通信環境、或いはGPS部33から取得したデータに基づいて、位置情報を取得する。この位置情報は、生成したコンテンツと紐づけて公開プレイスにアップロードするようにしてもよい。
 図4には、編集者の端末装置2で表示される編集画面の一例を示し説明する。
 同図に示されるように、編集画面100の領域100aには、編集対象として選択可能な自由視点映像データのファイルが提示され、編集者が、編集対象の自由視点映像データ(この例では、分割された静止画データ)を選択できるようになっている。領域100bはチャットを書き込むことができ、複数の編集者により編集作業が分業される場合等において、コミュニケーションを取りながら作業を進められるようになっている。なお、領域100bには、チャットのほか、編集ログ等も表示可能であり、不要な編集を権限に応じて無効にしたり、無効にした編集を元に戻したりすることができる。音声通話、ビデオチャット等の為の表示領域や機能を別途設けてもよい。
 領域100cでは、選択している自由視点映像データに基づく再生表示がなされる。領域100dでは、領域100aで編集対象として選択した自由視点映像データが、所定単位で分割され、分割単位ごとにサムネイル等と共に示される。この例では、選択された分割単位を破線で示している。編集作業においては、操作部30の操作により、各分割単位に各種アノテーションを付加することができるようになっている。符号100eは、テキストや図形などのアノテーションが付加されたことを示しており、符号100fは、音声のアノテーションが付加されたことを示している。符号100gは、ライブ配信を追いかけるように、編集を行う場合に、ライブの現在位置を示す。以上に加えて、現在のライブからどの程度遅れているか、ライブとして任意時間後に再生可能とした場合に当該任意時間までの残り時間等を表示するようにしてもよい。
 ここで、図5(A)乃至図5(D)を参照して、自由視点映像データに概念的に含まれる、動画データ及び分割データについて詳細に説明する。
 図5(A)に示されるように、動画データD1は、複数のフレームF1、F2、F3…から構成されている。映像配信装置1のデータ生成部10cは、動画データを複数のフレーム毎に分割して、分割データの単位で動画データをコンテンツ記憶部14aに記憶してもよい。例えば、図5(B)に示されるように、3枚のフレーム毎に分割される場合、フレームF1~F3に分割された分割データD2、フレームF4~F6に分割された分割データD2のように、動画データの複数のフレームは、順次分割される。
 また、データ生成部10cは、動画データを、複数のフレームと、1のフレームとに分割して、分割データの単位でコンテンツ記憶部14aに記憶してもよい。この場合、例えば、図5(C)に示されるように、分割データは、複数のフレームで構成される複数枚分割データ(D2M)と、1枚のフレームで構成される単数枚分割データ(D2S)で構成される。
 また、データ生成部10cは、動画データを、1枚の複数枚分割データと、複数の単数枚分割データとが、時系列に交互に配されるように分割して、コンテンツ記憶部14aに記憶してもよい。この場合、図5(D)に示されるように、フレームF1~F3に分割された複数枚分割データ(D2M)、フレームF4に分割された単数枚分割データD2S、フレームF5に分割された単数枚分割データD2S、フレームF5に分割された単数枚分割データD2Sのように、1枚の複数枚分割データと、複数の単数枚分割データとが、時系列に交互となるように分割される。
 次に、図6(A)乃至図6(C)を参照して、分割データの切り替えについて説明する。
 図6(A)に示されるように、本実施形態では、動画データAを分割して得られる分割データD2-A1,D2-A2,D2-A3、D2-A4…と、動画データBを分割して得られる分割データD2-B1,D2-B2,D2-B3,D2-B4…とは、同じまたはほぼ同じ撮像時刻に撮像して得られるフレームから構成されてよい。但し、他の実施形態によっては、異なる撮像時刻に撮像されてものでもよい。
 図6(B)に示されるように、配信部10aは、動画データAに基づく分割データD2-A1,D2-A2を順次送信した後、閲覧者の端末装置3からの切換要求を受け付けると、時間的に分割データD2-A2の直後となる、分割データD2-B3をコンテンツ記憶部14aから読み出し、続いて分割データD2-B3から時間的に後になる分割データD2-D4…をコンテンツ記憶部14aから読み出し、順次送信する。
 また、図6(C)に示されるように、配信部10aは、動画データAに基づく分割データD2-A1,D2-A2を順次送信した後、閲覧者の端末装置3からの切換要求を受け付けると、時間的に分割データD2-A2と同じタイミングとなる、分割データD2-B2をコンテンツ記憶部14aから読み出し、続いて分割データD2-B2から時間的に後になる分割データD2-D3…をコンテンツ記憶部14aから読み出し、順次送信するようにしてもよい。
 各動画データには撮像時刻の情報が付加されているので、配信部10aは、当該撮像時刻の情報に基づいて、分割データと他の分割データとの時間的に連続又はほぼ連続した読み出し、及び配信が可能となる。
 次に、図7乃至図10を参照して、教示ファイル生成部10fが生成する、オートパイロット用の教示ファイルの構造について詳細に説明する。教示ファイルは、スクリーン教示データ、コンテンツ教示データ、アノテーション教示データを含む。
 図7には、教示ファイルに含まれるスクリーン教示データの構造を示し説明する。
 同図に示されるように、スクリーン教示データは、オブジェクトタイプ、オブジェクトID/URL、教示データオブジェクトID、時間調整データ、画面割データを有する。オブジェクトタイプは、スクリーンとなる。オブジェクトID/URLとは、教示データでのオブジェクトIDである。時間調整データとは、画面割データにタイムコードが含まれている場合に、調整時間を加味したタイムコードで動作させるためのデータである。そして、画面割データとは、基本的には後述するコンテンツ教示データの画面割データと同じになる。
 図8には、教示ファイルに含まれるコンテンツ教示データの構造を示し説明する。
 同図に示されるように、コンテンツ教示データは、パイロットタイムコード、オブジェクトタイプ、オブジェクトID/URL、教示データオブジェクトID、パイロットタイムコード到達時アクション、コンテンツ終了時アクション、指定タイムコード到達時アクション、スタートタイムコード、エンドタイムコード、視点関連データ、再生速度データ、ズーム関連データ、及び画面割データを有する。
 パイロットタイムコードは、オートパイロット上での開始時間を規定する。オブジェクトタイプは、コンテンツとなる。オブジェクトID/URLとは、システム上でコンテンツを一意に示すID/URLである。教示データオブジェクトIDとは、教示データでのオブジェクトIDである。そして、パイロットタイムコード到達時アクションとは当該コンテンツが持つタイムコードの開始位置、もしくは設定されたスタートタイムコードにパイロットタイムコードにおける時間が到達した際のアクションを規定できる。例えば、再生、停止、映像エフェクト等が規定される。指定タイムコード到達時アクションでは、規定するアクション毎にパイロットタイムコードもしくはコンテンツが持つタイムコードのどちらを基点とするか決定し、基点とするタイムコード到達時もしくは通過時に実行されるアクションを規定する。ここで、通過時とは、例えばパイロットタイムコード上では10秒経過時点で再生されるはずであった音声に関して、パイロットタイムコードがシークバー等で8秒目から一気に15秒等へジャンプした際に当該音声の再生範囲内であれば適宜な音声位置から再生される様な挙動が例示される。また、この通過時の挙動が、タイムコードと関連する、パイロットタイムコード到達時アクション、コンテンツ終了時アクション、後述するパイロットタイムコード終了時アクション等に関しても同様に適宜な状態で挙動する事は勿論である。
 スタートタイムコードは、コンテンツ上での再生開始時間であり、エンドタイムコードとは、再生終了時間である。スタートタイムコードとエンドタイムコードを遡及的に指定した場合には逆再生となる。視点関連情報とは、自由視点映像の配信方式に応じて指定可能な情報であって、例えば、静止画送信方式の場合、及び動画送信方式の場合には、カメラIDとなり、マルチカメラ方式の場合には、マルチカメラIDとなり、3次元点群データや3次元CGの場合には例えば4×4のビュー変換行列となる。ビュー変換行列以外であっても、カメラの位置、カメラの向いている方向(注視点)、カメラの姿勢が特定できる表現方法であれば、形式は問わないことは勿論である。再生速度は、停止から変速再生を0.125、0.25、0.5、0、1、1.25、1.5、2、4等の如く定義できる。
 そして、画面割データとは、1つのスクリーンに複数のコンテンツを表示する際の割データである。画面割データでは、画面上部左、画面上部右、画面下部左、画面下部右、上部、下部など、基本位置を指定したり、ピクセル単位指定をしたり、画面全体に対する表示領域の割合等を設定することができる。表示領域は、矩形に限定されず、正円、ペジエ曲線、スプライン曲線、複数直線、ポリラインのような図形も指定可能である。ワイプのように、一のコンテンツの上に他のコンテンツを重ね合わせて表示することも可能であることは勿論である。また、1つ以上のタイムコードとその時点での対応した表示領域形態を指定することもできる。また、モーフィングを行う事を指定する事で、新たな表示領域形態へ移行する際に、滑らかに形態を変化させる指定行う事も可能であり、形態変化に掛かる時間を任意に指定する事も可能であることは勿論である。タイムコードは当該スクリーンオブジェクトの表示時間に到達した時間を0秒等として規定することができるし、オートパイロットタイムコードを基点とした規定も可能であることは勿論である。
 以上がコンテンツ教示データの基本構成となるが、パイロットタイムコード、教示データオブジェクトID、及び視点関連データのみで構成し、コンテンツ表現時の最小構成とすることもできる。また、パイロットタイムコード、教示データオブジェクトID、スタートタイムコード、エンドタイムコード、及び視点関連データのみで構成し、視点関連データに1つ以上のタイムコードとその時点での対応した視点関連情報を入れた最小構成とすることもできる。
 図9には、教示ファイルに含まれるアノテーション教示データ(音声)の構造を示し説明する。同図に示されるように、アノテーション教示データ(音声)は、パイロットタイムコード、オブジェクトタイプ、オブジェクトID/URL、教示データオブジェクトID、パイロットアイムコード到達時アクション、コンテンツ終了時アクション、指定タイムコード到達時アクション、スタートタイムコード、エンドタイムコード、再生速度、及びデータを有する。
 パイロットタイムコードは、オートパイロット上での開始時間である。オブジェクトタイプは、コンテンツとなる。オブジェクトID/URLは、システム上でデータの位置を一意に示すID/URLである。教示データオブジェクトIDは、教示データ上でのオブジェクトIDである。パイロットタイムコード到達時アクションとして、再生、停止、映像エフェクト等が規定できる。コンテンツ終了時アクションとして、当該コンテンツの再生が終了するタイムコードに到達した際に行うアクションを規定できる。指定タイムコード到達時アクションでは、規定するアクション毎にパイロットタイムコードもしくはコンテンツが持つタイムコードのどちらを基点とするか決定し、基点とするタイムコード到達時もしくは通過時に実行されるアクションを規定する。スタートタイムコードとは、音声上での再生開始時間であり、エンドタイムコードとは、音声上での再生終了時間である。再生速度は、再生停止から変速再生を0.125、0.25、0.5、0、1、1.25、1.5、2、4等の如く定義できる。データとしては、参照ではなく、音声データ自体を埋め込むことも可能である。なお、教示データで指定された再生速度は相互に影響し合うことなく指定を行うことが可能であり、例えばコンテンツに指定された再生速度とは相互に影響せずに音声の再生速度を指定することが可能である。例えば、コンテンツは2倍速、音声は1倍速の如くである。
 図10には、教示ファイルに含まれるアノテーション教示データ(文字列、図形、画像など)の構造を示し説明する。
 同図に示されるように、アノテーション教示データ(文字列、図形、画像など)は、パイロットタイムコード、エンドパイロットタイムコード、オブジェクトタイプ、オブジェクトID/URL、教示データオブジェクトID、パイロットタイムコード到達時アクション、パイロットタイムコード終了時アクション、指定タイムコード到達時アクション、アノテーションアクション、時間調整データ、データ、及び画面割データを有する。
 パイロットタイムコードは、オートパイロット上での開始時間である。エンドパイロットタイムコードは、オートパイロット上での終了時間である。オブジェクトタイプは、コンテンツとなる。オブジェクトID/URLは、システム上でデータの位置を一意に示すID/URLである。教示データオブジェクトIDは、教示データでのオブジェクトIDである。パイロットタイムコード到達時アクションとして、再生、停止、映像エフェクト等が規定できる。パイロットタイムコード終了時アクションとして映像エフェクト、音声の再生、動画のワイプ表示再生等を規定できる。指定タイムコード到達時アクションでは、規定するアクション毎にパイロットタイムコードもしくはコンテンツが持つタイムコードのどちらを基点とするか決定し、基点とするタイムコード到達時もしくは通過時に実行されるアクションを規定する。アノテーションアクションとしては、表示領域をクリック、タップ、マイクから所定の音声が入力された等したときに起こすアクションを規定できる。このアクションとしては、例えば、任意の音声出力、パイロットタイムコードの時間を戻すこと、コンテンツの再生を所定時間停止してその間に音声出力する、映像エフェクト、動画の再生等がある。また、前述のアクションを、アクションを規定可能な、パイロットタイムコード到達時アクション、パイロットタイムコード終了時アクション、コンテンツ終了時アクション、指定タイムコード到達時アクション等に関しても同様に適宜に規定可能な事は勿論である。
 時間調整データとは、調整時間を加味したタイムコードで動作させるためのデータである。データでは、表示したい文字列、図形、画像などと、表示位置、表示スタイル等を規定することができる。画面割データについては、設定しない場合には、表示画面全体にコンテンツよりも上のレイヤーで重ねて表示される。
 これらスクリーン教示データ、コンテンツ教示データ、アノテーション教示データを含む教示ファイルは、前述した図4の編集画面での操作に基づいて生成される教示データが編集者の端末装置2から送られると、映像配信装置1がそれを受信し、教示ファイル生成部10fが当該教示データに基づいて生成し、教示ファイル記憶部14cに保存する。
 生成されたオートパイロット用の教示ファイルは、映像配信装置1が運営するwebサイト等で公表され、適宜提供されるので、閲覧者の端末装置3では、当該教示ファイルの中から閲覧を所望するものを受信する。閲覧者の端末装置3では、受信した教示ファイルを教示ファイル記憶部31cに保存し、当該教示ファイルに基づいて、映像生成部21bが端末装置3に表示可能なコンテンツを生成して、表示モニタ28上で再生表示を行う。
 このとき、オートパイロット用の教示ファイルでは、コンテンツ(例えば分割された静止画データ)の視点、再生速度、ズームの有無、画面割等を規定しているので、それら規定内容に従って再生が実行される。さらに、オートパイロット用の教示ファイルには、音声、文字等のアノテーション教示データも含まれているので、アノテーション教示データにしたがって、再生と同期して規定されたタイミングで文字や音声等の再生を併せて行うことができる。したがって、閲覧者は、自分の嗜好や目的に合致したオートパイロット用の教示ファイルを取得すれば、自ら視点等を変更させることなく、自動的に自身に好適なコンテンツ閲覧の機会を得ることが可能となる。
 ここで、閲覧者の端末装置3において、オートパイロット用の教示ファイルに基づく再生を実行している途中で、ユーザ操作がなされると、オートパイロットの再生が一時中断されて、ユーザ操作に基づく画面の切り換え、再生が実行される。以下、この点を、図11を参照しつつ詳細に説明する。尚、オートパイロットの再生中において、オートパイロットタイムコードにおける変速再生、巻き戻し、任意オートパイロットタイムコードへの移動等も可能であり、更に、視点切り替え等以外に関しては、オートパイロットを中断せずとも可能であることは勿論である。また、上述のユーザ操作には、オートパイロットを中断というボタン等のUIへの押下という操作も含まれる。
 図11は、縦軸が方向データとしての識別番号、横軸が時間データとなっており、縦軸及び横軸に対応する静止画データのファイル名が示されている。図11の下に図示するようなユーザ操作に応じて、表示される静止画データは推移する。即ち、図中、実線で示す矢印が通過するセルに該当する静止画データが、閲覧者の端末装置3にて表示されることを意味している。
 まず、オートパイロット用の教示ファイルに従って、C001の静止画データを再生している状態において、時系列にそって、順次動画が再生される。そして、自動再生の実行中に、閲覧者のスワイプ操作により指定値受付部10dが方向指定値を受付けると、オートパイロット用の教示ファイルに基づく自動再生は一時中断され、選択部10eは、方向指定値を受付けた時に対応する静止画データの時間データ(t=5p)を基準にして、スワイプ操作における方向指定値の変化量に基づいて、対応する静止画データ(C005~K005)を選択する。
 すなわち、選択部10eは、方向指定値を受付けた時刻(t=5p)を基準とし、その瞬間において選択されている位置データ(方向データ)に対応する静止画データ(C005)を最初に選択する。そして、方向指定値が変化していく過程において、選択部10eは、同一の時間データに相当する静止画データを1フレームずつ、識別番号の順に選択していく。方向指定値がスワイプ操作により指定された静止画データ(K005)を表示したとき、一度停止状態となる。そして、ユーザが再度再生開始ボタンを押すことで、その時の方向指定値に対応する静止画データが継続して再生される。なお、一度停止状態とせずに、連続してその時の方向指定値に対応する静止画データを継続再生してもよい。
 また、ユーザが再度スワイプ操作を行うと(t=100p)、前述と同様に、方向指定値の変化に伴って、選択部10eが、同一の時間データに相当する静止画データを1フレームずつ、識別番号の順に選択していく(K100~F100)。そして、スワイプ操作により指定された静止画データ(F100)を表示した後は、一度停止状態としない場合、同じ方向指定値に対応する静止画データが引き続き継続して再生される。なお、前述の説明では、選択部10eが方向指定値を受付けた時に対応する静止画データの時間データ(t=5p)を基準にして、当該静止画データと同じ時間データを選択するという態様について説明しているがこのような態様に限られない。
 すなわち、本発明の映像配信装置では、破線で示す矢印のように、選択部10eが方向指定値を受付けた時に対応する静止画データの時間データ(t=5p)を基準にして、既に選択されている時間データの次の時間データを順次選択してもよい。この場合には、スワイプ中も動画が停止されることなく、再生された状態を維持することができる。
 また、選択部10eは、指定値受付部10dが方向指定値を受付けない場合で、単位時間当たりの方向指定値の変化量が閾値未満のときは、方向データが連続的につながるように、静止画データを選択する。一方、選択部10eは、単位時間当たりの方向指定値の変化量が閾値以上の場合には、方向データが間欠的につながるように、静止画データを選択する。ここで、「間欠的に」とは、連続的に並ぶ方向データに対して、一部のデータのみを取得することを意味している。
 すなわち、ユーザ40が指を大きく、又は速く動かすことで、スワイプ操作による操作量が大きいと操作認識部29が判断した場合には、隣り合う方向データに対応する静止画データを取得することなく、元の方向データから、離れた方向データに対応する静止画データを取得することができる。そして、端末装置3では、選択部10eから受信する静止画データにより、方向指定操作中は、該方向指定操作に基づき変化する方向指定値における被写体の静止画データを表示する。一方、端末装置3では、方向指定操作がされていない時には、該方向指定操作の完了位置に対応する方向指定値の静止画データを、時系列順に順次受信し表示することで、完了位置に対応する方向からの疑似的動画を表示する。
 なお、閲覧者操作に基づく視点方向を切り替えながらの上記再生から、オートパイロット用の教示ファイルに基づく自動再生に復帰する場合には、閲覧者の端末装置3の再生画面上に表示される所定のボタンをタップ等することで、中断したタイミングから、或いは切り換えのタイミングから、オートパイロット用の教示ファイルに基づく自動再生を再開するよう指示することができる。
 以下、図12のフローチャートを参照して、本発明の実施形態に係る映像配信システムによるオートパイロット用の教示フィルの生成に関わる処理手順を説明する。
 この処理では、閲覧者の端末装置2において、制御部21が編集プログラム31fを実行し、表示モニタ28に図4に示したような編集画面100が表示されていることを前提としている。但し、表示態様は、図4には限定されない。
 編集画面100において、領域100aに示された選択可能な自由視点映像データが選択されると、要求部21aが、映像配信装置1に対して、自由視点映像データの配信要求をする(S1)。映像配信装置1では、取得部10bが、配信要求を受付け(S2)、配信部10aが、当該配信要求に関わる自由視点映像データをコンテンツ記憶部14aから読み出し、閲覧者の端末装置2に向けて配信する(S3)。
 閲覧者の端末装置2では、この自由視点映像データを受信し(S4)、映像生成部21bが端末装置2に表示可能なコンテンツを生成し、表示モニタ28に表示されている編集画面100の領域100c、及び領域100dに、選択された映像を表示する(S5)。領域100dでは、分割された静止画データが、サムネイル等と共に、分割単位も閲覧者が把握できる態様で表示される。領域100cでは、編集対象として選択された映像が再生される。
 続いて、閲覧者の端末装置2では、編集部21cが編集処理を実行する(S6)。編集処理の詳細は、後に詳述するが、例えば、分割された静止画データの選択(視点情報)、再生速度、各種アノテーションの付加等が実施されることになる。編集部21cは、編集処理を完了すると、例えば、スクリーン教示データ、コンテンツ教示データ、アノテーション教示データを概念的に含む教示データを、教示ファイル記憶部31cに保存すると共に、映像配信装置1へと送信する(S7)。
 映像配信装置1は、取得部10bが、この教示データを受信し、教示ファイル記憶部14cに保存する(S8)、そして、全ての編集者の端末装置2から教示データを受信すると(S9をYesに分岐)、教示ファイル生成部10fが、保存している教示データに基づいて教示ファイルを生成し(S10)、上記ファイル記憶部14cに記憶する(S11)。こうしてオートパイロット用の教示ファイル生成に関わる一連の処理を終了する。教示ファイル記憶部14cに保存されているオートパイロット用の教示ファイルは、所定のWebサイトなどにおいて、閲覧者に選択可能に公表される。
 ここで、図13のフローチャートを参照して、図12のステップS7で実行される編集処理の処理手順について更に詳細に説明する。
 編集処理に入ると、編集部21cは、コンテンツの選択がなされたか否かを判断し(S6-1)、コンテンツの選択がなされると(S6-1をYesに分岐)、コンテンツ教示データを教示ファイル記憶部31cに記憶する(S6-2)。コンテンツの選択がなされない場合には(S6-1をNoに分岐)、ステップS6-3に移行する。
 ステップS6-2で教示ファイル記憶部31cに記憶されるコンテンツ教示データは、パイロットタイムコード、オブジェクトタイプ、オブジェクトID/URL、教示データオブジェクトID、パイロットタイムコード到達時アクション、コンテンツ終了時アクション、指定タイムコード到達時アクション、スタートタイムコード、エンドタイムコード、視点関連情報、再生速度、ズーム関連情報、及び画面割情報を有する。これら詳細については、前述した通りである。
 続いて、編集部21cは、アノテーション(文字)の付加がなされたか否かを判断し(S6-3)、アノテーション(文字)の付加がなされると(S6-3をYesに分岐)、アノテーション教示データ(文字)を教示ファイル記憶部31cに記憶する(S6-4)。アノテーション(文字)の付加がなされない場合には(S6-3をNoに分岐)、ステップS6-5に移行する。
 ステップS6-4で教示ファイル記憶部31cに記憶されるアノテーション教示データ(文字)は、パイロットタイムコード、エンドパイロットタイムコード、オブジェクトタイプ、オブジェクトID/URL、教示データオブジェクトID、パイロットタイムコード到達時アクション、パイロットタイムコード終了時アクション、指定タイムコード到達時アクション、アノテーションアクション、時間調整、データ、及び画面割情報を有する。これら詳細については、前述した通りである。
 続いて、編集部21cは、アノテーション(図形、記号等)の付加がなされたか否かを判断し(S6-5)、アノテーション(図形、記号等)の付加がなされると(S6-5をYesに分岐)、アノテーション教示データ(図形、記号等)を教示ファイル記憶部31cに記憶する(S6-6)。アノテーション(図形、記号等)の付加がなされない場合には(S6-5をNoに分岐)、ステップS6-7に移行する。
 ステップS6-6で教示ファイル記憶部31cに記憶されるアノテーション教示データ(図形、記号等)は、パイロットタイムコード、エンドパイロットタイムコード、オブジェクトタイプ、オブジェクトID/URL、教示データオブジェクトID、パイロットタイムコード到達時アクション、パイロットタイムコード終了時アクション、指定タイムコード到達時アクション、アノテーションアクション、時間調整、データ、及び画面割情報を有する。これら詳細については、前述した通りである。
 続いて、編集部21cは、アノテーション(音声)の付加がなされたか否かを判断し(S6-7)、アノテーション(音声)の付加がなされると(S6-7をYesに分岐)、アノテーション教示データ(音声)を教示ファイル記憶部31cに記憶する(S6-8)。アノテーション(音声)の付加がなされない場合には(S6-7をNoに分岐)、ステップS6-9に移行する。
 ステップS6-8で教示ファイル記憶部31cに記憶されるアノテーション教示データ(音声)は、パイロットタイムコード、オブジェクトタイプ、オブジェクトID/URL、教示データオブジェクトID、パイロットアイムコード到達時アクション、コンテンツ終了時アクション、指定タイムコード到達時アクション、スタートタイムコード、エンドタイムコード、再生速度、及びデータを有する。これら詳細については、前述した通りである。
 こうして、編集部21cは、全ての編集が完了したか否かを判断し(S6-9)、全ての編集を完了していない場合には(S6-9をNoに分岐)、ステップS6-1に戻り、上記処理を繰り返し、全ての編集を完了した場合には(S6-9をYesに分岐)、編集処理を完了し、図12のステップS8以降の処理にリターンする。
 次に、図14のフローチャートを参照して、本発明の実施形態に係る映像配信システムによるオートパイロット用の教示ファイルの配信処理について説明する。
 先ず、前提として、映像配信装置1は、Webサイトにおいて、オートパイロット用の教示ファイルを、複数、選択可能に提示している。閲覧者の端末装置3は、取得部21dが、教示ファイルを取得し、当該教示ファイルに基づく再生を実行する(S21)。このオートパイロットに係る再生開始に伴い、要求部21aは、映像配信装置1に対して、コンテンツ教示データにより教示された自由視点映像データ(分割された静止画データ等を含む)の配信要求をする(S22)。
 映像配信装置1は、配信要求を受付け(S23)、配信部10aがコンテンツ記憶部14aより該当する自由視点映像データを読み出し、配信する(S24)。閲覧者の端末装置3では、自由視点映像データを受信し(S25)、映像生成部21bが、自由視点映像データに基づく端末装置3に表示可能なコンテンツを生成し、表示モニタ28で再生表示を行う(S26)。このオートパイロットに係る再生の過程で、ユーザ操作(例えば、画面のスワイプ操作)等がなされたか否かを判断し(S27)、操作がなければ(S27をNoに分岐)、再生終了まで(S34)、オートパイロット用の教示ファイルに基づく再生表示を継続する。
 一方、オートパイロットに係る再生の過程で、ユーザ操作がなされると(S27をYesに分岐)、制御部21は、操作データ(方向指定値を含む)を映像配信装置に送信する(S28)。映像配信装置1では、操作データを受付け、操作データ記憶部14bに保存する(S29)。そして、選択部10eは、方向指定値を受付けた時刻を基準とし、方向指定値がユーザ操作により指定された自由視点映像データ(静止画データ)を選択し(S30)、配信部10aが選択された自由視点映像データ(静止画データ)を閲覧者の端末装置3へと配信する(S31)。
 閲覧者の端末装置3では、取得部21dが、この選択された自由視点映像データ(静止画データ)を受信し(S32)、映像生成部21bが、端末装置3に表示可能なコンテンツを生成し、表示モニタ28の表示を切り替える(S33)。続いて、制御部21は、再生を終了するか否かを判断し(S34)、再生を終了しない場合には、上記ステップS22に戻り、上記処理を繰り返し、再生を終了する場合には、一連の処理を終了する。
 なお、この再生の終了は、オートパイロット用の教示ファイルに基づく自動再生の終了と、ユーザ操作に基づいてオートパイロットが一時中断され、当該ユーザ操作に基づく再生が行われた場合の当該再生の終了を含む。
 次に、公開プレイスについて更に詳細に言及する。
 映像配信装置1が、ユーザにより任意且つ階層的に設定された公開プレイスで公開可能とするデータは、例えば、図15(a)に示されるように分類される。即ち、第1に自由視点映像データ、第2に教示ファイル、第3に自由視点映像データ及び教示ファイル、第4に自由視点映像データ及び教示ファイルにより生成された動画ファイル等である。以下では、教示ファイルと教示ファイル等によって生成された動画ファイルをオートパイロットファイルと称する。
 このように公開プレイスにて公開されたデータを、他のユーザの端末装置2は、自己の権限に基づいてストリーミング、ダウンロード等することが可能となる。このとき、配信装置1は、公開可能なデータに付与された権限、及び視聴等する他のユーザの権限によりダウンロード等の可否を決定する。
 ここで、公開可能なデータ及び視聴等する他のユーザに付与される権限は、例えば、図15(b)に示されるように分類される。ログイン(A1)、閲覧(A2)、ストリーミング(A3)、にダウンロード(A4)、アップロード(A5)、作成可能(購入済のみ)(A6)、作成可能(教示ファイルのみ)(A7)、作成可能(動画のみ)(A8)、作成可能(その他;例えばオートパイロットファイル等)(A9)、参加(A10)、投票(A11)、販売(A12)、及び招待(A13)等に分類される。配信装置1の判定部10iは、これら権限(A1~A13)に基づいて、リクエストの可否を判断し、権限を満たしている場合には、ダウンロード、ストリーミング等のリクエストに応じた処理を進めることになる。
 映像配信装置1の記憶部14のユーザ情報記憶部14lには、ユーザテーブルが記憶されている。このユーザテーブルの一例は、例えば、図16(a)に示される通りであり、ユーザIDと紐づけて、氏名、住所、メードアドレス等の属性情報と、当該ユーザに付与された権限(A1~A13)、ダウンロードや購入等の履歴情報が記憶されている。
 映像配信装置1の記憶部14の公開プレイス情報記憶部14kには、公開プレイステーブルが記憶されている。公開プレイステーブルの一例は、例えば、図16(b)に示される通りである。公開プレイステーブルには、プレイスIDと紐づけて、当該公開プレイスの階層、上位層との関係、当該公開プレイス又はコンテンツに付与された権限、公開範囲、公開期限、公開対象、公開したユーザ、及びコンテンツIDが記憶されている。
 映像配信装置1の記憶部14のコンテンツ記憶部14aには、公開プレイスに対応付けられるコンテンツもコンテンツテーブルで記憶されている。このコンテンツテーブルの一例は、図16(c)に示される通りである。このコンテンツテーブルでは、コンテンツIDと紐づけて、コンテンツの種別(C1~C4)、コンテンツデータ、関連性情報、作成者であるユーザのユーザIDが記憶されている。ここで、関連性情報とは、自由視点映像データ等の再生時に任意タイムコードに対して、関連する自由視点映像データやオートパイロットファイルがある事を示唆させるための情報である。映像配信装置1では、関連性示唆部10kが、自由視点映像データ等の再生時に関連性情報を参照し、関連付けられているタイミングで示唆を実行する。
 映像配信装置1では、公開プレイス設定部10hが、端末装置2等から送られてきた公開プレイス設定情報に基づいて、公開プレイステーブルに設定をなし、公開プレイスを開設するが、前述したように、公開プレイスには、階層、及び上位層との関係も含まれるので、解説される公開プレイスは多階層のネスト構造とすることが可能となる。
 例えば、以下のようなネスト構造を構築することが可能である。
  1.公開プレイス(主催者;会社名等)
   -2.公開プレイス(イベントカテゴリ)
    -3.公開プレイス(イベント)
     -4.公開プレイス(アップロード用)
 即ち、最上位層では、主催者名で公開プレイスを公開し、中位層では当該主催者の取り扱うイベントのカテゴリ別に公開プレイスを公開し、更に下位層では各カテゴリに属するイベント別に公開プレイスを公開し、このほか、閲覧ユーザ等によるコンテンツのアップロード用の公開プレイスを公開することができる。各公開プレイスについて、先に図16(b)で示したように、権限(A1~A13)を付与することができる。
 従って、公開プレイスに係るサービスを利用して、自社ブランドや自社製品等のプロモーションを行うことも可能となる。その場合、より具体的には、公開プレイスには、例えば、以下のようなネスト構造を持たせことが可能となる。
  1.音楽会社公開プレイス
   -2.アーティスト毎の公開プレイス
    -3.ミュージックビデオ・ライブ映像購入者公開プレイス
     -4.自由視点映像データ群公開プレイス
      -5.オートパイロットファイル群公開プレイス
 ストリーミング又はダウンロードの権限(A1、A2等)を持つユーザや、購入物品に付与されていたPINコード等を入力する事で、対象のミュージックビデオ・ライブ映像公開プレイスにログインすることが可能であり、当該公開プレイスにある対象の自由視点映像データ等を閲覧することが可能となる。
 権限については、公開プレイス毎に、以下にように設定することができる。即ち、音楽会社公開プレイスにはユーザーログイン(ID、パスワード)が必須とする。アーティスト毎の公開プレイスにあるコンテンツは、音楽会社公開プレイスにログインできれば誰でも閲覧等することができる。ミュージックビデオ・ライブ映像購入者公開プレイスはPINコードを入力等する事でログインすることが可能で、対象の自由視点映像データを閲覧することができる。但し、これは一例であって、これには限定されない。
 作成権限(A6,A7,A8,A9等)を持つユーザは、オートパイロットファイルを作成して、公開プレイスにアップロードすることができる。このとき、販売権限(A12)を有するユーザは、値段を提示し決済部10lによる決済を受けるようにしてもよく、代替するポイント等の付与を受けるようにしてもよい。コンテンツホルダーである音楽会社から公式オートパイロットファイルが販売等されても良い。この場合の公式教示、動画ファイルの購入可能者の範囲は音楽会社公開プレイスまで広げることも、ミュージックビデオ・ライブ映像公開プレイスのみに絞る事も可能であり、所定日数経過後等に購入可能者範囲を変更し、価格変更する等も可能とする。これら変更は、公開プレイス設定部10hにより公開プレイステーブルを更新することでなされる。
 なお、ネスト構造は、例えば以下のように自由視点映像データは公開せずにオートパイロットファイル郡のみを公開する事も可能とする。
  1.音楽会社公開プレイス
   -2.アーティスト毎の公開プレイス
    -3.ミュージックビデオ・ライブ映像購入者公開プレイス
     -4.オートパイロットファイル群公開プレイス
 この場合、権限としてオートパイロットファイルに対して自由視点映像データへの遷移は不可とする事も可能である。
 前述したような公開プレイスのネスト構造は、個人レベルまで落とす事も勿論可能であり、例えばアミューズメントパークで撮影したものを、顧客に渡す際にはその顧客のみがログイン可能な公開プレイスを提供し、購入済み権限があれば、自由視点映像データ等の閲覧や、権限によりオートパイロットファイルを作成可能としてもよい。
 ここで、公開プレイスにアップロードされた公開可能データの公開については、権限や公開範囲、公開期限、公開対象等で規制できるようになっている。公開範囲を投稿者もしくは投稿者グループのみとする場合には、公開範囲でその旨を規制すれば、それらの者に公開範囲を規制することができる。この場合、ユーザが複数人で自由視点映像データの元データを撮影して公開プレイスにアップロードした場合には、これら複数人のユーザはグループという単位になる。このほか、権限に応じてアクセス制限をかける場合には、権限で規制すればよい。このほか、公開範囲で、SNSを公開先とすることを認める旨の設定することも可能である。
 以下、図17のフローチャートを参照して、本発明の一実施形態に係る映像配信システムによる、公開プレイス開設までの処理の流れを説明する。
 端末装置2は、例えば、配信装置1が提供するWebサイト等にアクセスするなどして、操作部30の操作により、公開プレイスの設定情報の入力を受付け、送信部21fが、公開プレイス設定情報を配信装置1へと送信する(S51)。ここで、公開プレイス設定情報とは、当該公開プレイスの階層、上位層がある場合には上位層、権限、公開範囲、公開期限、公開対象等の情報を含んでいる。配信装置1は、取得部10bが、この公開プレイス設定情報を取得すると(S52)、公開プレイス設定部10hが、これら公開プレイス設定情報を、公開プレイス情報記憶部14kに設定する(S53)。このとき、プレイスIDが付与され、公開ユーザのユーザIDとの紐づけ行われる。
 配信装置1は、通知部10jが、設定完了通知を端末装置2に送信する(S54)。端末装置2では、取得部21dが、この設定完了通知を受信すると、表示モニタ28に表示する(S55)。そして、設定された公開プレイスにアップロードするコンテンツ(C1~C4)を送信部21fが送信する(S56)。配信装置1では、取得部10bが、この送られてきたコンテンツを受信すると(S57)、公開プレイスのプレイスIDと紐づけて、コンテンツ記憶部14aに登録し、公開プレイス情報記憶部14kの公開プレイステーブルの内容を更新する(S58)。こうして、公開プレイス設定部10hが、公開プレイスの公開を開始する(S59)。
 次に、図18のフローチャートを参照して、本発明の一実施形態に係る映像配信システムにより、権限に応じた処理の流れを詳細に説明する。
 ユーザの端末装置2は、例えば、配信装置1が提供している公開プレイスに係るWebサイト等にアクセスするなどして、操作部30の操作による閲覧を所望とする公開プレイスの選択を受付けると、要求部21aが、選択された公開プレイスのプレイスIDとユーザIDを配信装置1に送信することで、閲覧等のリクエストを行う(S61)。
 配信装置1は、取得部10bが、このリクエストを受信すると(S62)、判定部10iがリクエストの可否を判定する(S63)。具体的には、判定部10iは、ユーザ情報記憶部14lのユーザテーブルを参照して、ユーザIDよりユーザを特定し、当該ユーザに付与された権限を確認し、公開プレイス情報記憶部14kの公開プレイステーブルを参照して、プレイスIDより公開プレイスを特定し、当該公開プレイスについて設定されている権限を確認し、これら権限を比較することで、リクエストの可否を判定する。
 判定部10iにより、ユーザが公開プレイスの閲覧等の処理をリクエストする権限を有すると判定した場合には、権限に応じた処理を行う(S64)。具体的には、リクエストがダウンロード、ストリーミングである場合には、それら処理を行う。端末装置2では、コンテンツを受信すると(S65),再生等を開始する(S66)。
 次に、前述したような映像配信システムの実施例を説明する。
 (1)配信装置1は、ユーザの撮影した動画、3次元CGデータ、3次元点群データ等(以下、「元データ」という)のアップロードを受け付ける公開プレイスを開設し、これら元データに基づいて自由視点映像データ、もしくはオートパイロットファイルを生成するように促してもよい。例えば、スタジアム等でサッカーの試合を複数のユーザが撮影したデータをアップロードすることで、それら元データに基づいて自由視点映像データ、もしくはオートパイロットファイルを生成するように促す。このような公開プレイスは、イベント運営側が撮影イベントに係る公開プレイスとして開催しても良いし、ユーザ側が任意で作成したイベントに係る公開プレイスであっても良い。元データの公開プレイスのアップデートの可否は、権限に基づいて、判定部10iが判定する。
 元データの撮影に関しては、配信装置1が配信する公式アプリのナビゲーションに従った撮影のみを可能とする事のほか、通常のカメラやToF等で撮影したものでも可とする事も出来る。公開プレイス情報の一部として、公開対象を規定することで、受け入れ可能な元データを定義することが可能となる。また、元データには、位置情報を紐づけることも可能である。例えば、前述した公式アプリの撮影で元データを得る場合には、チケットや座席より位置情報を取得することができる。
 また、例えばチケットに記載されたQRコード(登録商標)等の二次元コードを読み取る等する事で撮影場所を特定し、撮影可能か否かは座席に行って初めて分かるようにしてもよい。このほか、指定されたWiFiへの接続状況、会場に設置されたBlueToothの受信状況、GPSの想定範囲内にいる場合に参加可能とする等、位置情報に基づいて撮影を規制することもできる。また、位置同定としては、端末同士の通信(BlueTooth、UWB等)、WiFi等の位置情報、GPS等の広域な位置情報、撮影したもの同士の特徴点の合致(ToF、写真測量法等)が考えられ、方角情報、ピッチ角、ロール角、ヨー角及び海抜情報等も取得可能であれば取得し送信してもよい。この場合、これら情報は、元データと紐づけられて管理される。
 撮影中時刻に関しては、撮影したものに含まれる、ファイル自体の生成時刻、元データに含まれるタイムスタンプ、GPS等から取得した時刻情報を用いてもよい。これら情報を取得できない、或いは信頼性に欠けるファイルに関しては、位置同定情報関連との合致から(特に、その時点での端末同士の通信情報や、特徴点の合致等)、撮影中時刻を割り出しても良いことは勿論である。
 (2)配信装置1は、公開プレイスに、自由視点映像データを公開するときに、当該データに対してオートパイロットファイルを作成可能な資格権限(購入済み、教示ファイルのみ、動画のみ、その両等権限を付与可能等)を決定しても良く、また、オートパイロットファイル生成に関して、オートパイロットファイル生成上限時間(60秒等)、及び/又は下限時間(10秒以上等)の設定を付与することも可能とする。
 自由視点映像データにオートパイロットファイル生成上限時間が設定されていない場合にも、ユーザが個別にオートパイロットファイル生成上限時間を設定できるようにしてもよい。その場合には、当該データに上限時間の情報が紐づけられる。例えば1ヶ月の間に生成可能なオートパイロットファイルの期間内合計生成上限時間(600秒等)、1つのオートパイロットファイルを生成する際の生成上限時間(30秒等)等の如くである。いずれの生成上限時間に対しても、何らかの対価を支払う、もしくは他のユーザから生成したオートパイロットに対して一定の評価を得てランクを上げる事で上限時間を伸ばす事を可能としてもよい。例えば、期間内合計生成上限時間が1200秒に伸びたり、生成上限時間が120秒に伸びたりするようなイメージである。
 (3)配信装置1は、自由視点映像データに複数視点が存在する場合に、視点を選択的に各視点の自由視点映像データを取得できるようにしてもよい。この場合には、例えば視点毎に購入や5視点パックを買えば1視点個別に5視点買うより安価等のサービスを提供できる。全ての視点を購入(コンプリート)した場合に、特典視点もしくは特典オートパイロットファイルを有償・無償で与えても良いし、例えば当該自由視点映像データに対してオートパイロットファイルを作成する権利を有償・無償で与えても良い。これにより必要な視点だけを購入して結果的に安価にできたり、全ての視点をコンプリートするモチベーションを与えたりする事ができる。
 また、購入した視点に係る自由支援映像データに関してダウンロードしているのであれば、購入後に必要なくなれば自身のディスクから任意視点を削除する事でディスク容量を空けてもよく、既に購入済みであれば権限によるが、削除後に再度同視点をダウンロードする事も可能とし、この回数制限やダウンロード可能期限を設けても良い。ダウンロードではなくストリーミングの場合に、閲覧の必要性が無いと感じる視点を読み込まない設定にする事も可能する。これにより、自身に好適な視点のみ閲覧可能としたり、ストリーミング時の通信容量を削減したりすることができる。
 (4)配信装置1では、通知部10jが、自由視点映像データやオートパイロットファイルをユーザが取得した場合に、当該データに新たな視点やオートパイロットファイルが後に追加された場合に、これをユーザ側に通知(通知可否、通知受信条件はユーザ側で決められても良い)する。通知方法は、Webプッシュ、アプリ通知でも、当該データ閲覧時にアテンション、ユーザのメールへ通知等何でも良い。また、配信装置1では、通知部10jが、自由視点映像データ及びオートパイロットファイルをユーザが取得していなくても、当該ユーザが気になる等の設定を行っている場合に、ユーザ側に通知(通知可否及び通知受信条件は、ユーザ側で設定可能としてもよい)をしてもよい。
 また、配信装置1では、関連性示唆部10kが、通常の自由視点映像データ閲覧時に任意タイムコードに対して、関連する自由視点映像データやオートパイロットファイルがある事を示唆させる。例えば、スポーツであればファインプレー等のオートパイロットファイル等の通知(示唆)、教育向けで美容師であれば、あるタイムコードにおけるカットの説明がわかりにくかった際に、通常の動画を関連付けてアップした旨を通知(示唆)する等の如くである。このとき、タイムコードに拘らずに、当該データ閲覧時に任意のタイミングで通知(示唆)することも可能である。
 また、配信装置1では、関連性示唆部10kが、オートパイロットファイル閲覧時に対応したプレイヤであれば、任意タイムコードに対して、関連する自由視点映像データやオートパイロットファイルがある事を示唆させる。例えばスポーツであればファインプレー等の「オートパイロットファイル」等の如くである。この場合も、タイムコードに拘らずに当該データ閲覧時に任意のタイミングで通知(示唆)することも可能である。
 (5)物理デバイス(DVD等)、あるいはデジタルで取得(購入等)したミュージックビデオ等に自由視点映像データやオートパイロットファイルにアクセス可能な特典等を付与してもよい。また、ユーザ側でオートパイロットファイルを作成して権限に応じて公開プレイス上でシェアできるようにしてもよい。有償の設定ができるか否かはコンテンツホルダー側で資格等を設けて決定可能である。高評価を貰った際にポイントを付与して、公開プレイス内においてお金の様に使用できてもよい。コンテンツホルダー側もオートパイロットファイルを公開(弊社との契約プランによって公開数上限を設定出来てもよい)する事が可能である。サブスクリプション的に1ヶ月視聴で金額を設定してもよい。このほか、ユーザが作成したオートパイロットファイルで素晴らしいものや、コンテンツホルダー生成のものを凌ぐ高い評価を得たものがあれば、仕事を依頼したり、リクルートできたりする仕組みに結び付けることも可能である。
 (6)配信装置1は、公開者側の指示に基づいて、スワイプタイムと称する設定をすることもできる。このスワイプタイムに入ると、任意のタイムコードで勝手に停止状態になり(音声を止めたり、もしくはスワイプタイム中の音声を別途選べる)、そこで自動で回ったり(視点の移動だけでなく、タイムコードを任意速度で進める事も可能)、任意に回し終わると自動で再生が開始されるか、自分で再生指示する。このスワイプタイムに関しては、閲覧者ログを取り、2回目からはスキップする等を任意で選べてもよいし、任意に選ぶ事を公開者側の設定で選べるようにしてもよい。
 (7)本発明の映像配信システムは、オーディションやコンテストに利用することも可能である。例えばC向け公式アプリ上でアイドルオーディションを開催し、参加資格、撮影条件等を満たせば参加可能とする。このオーディションやコンテストは、企業とのタイアップで行う事も出来るし、通常ユーザも権限があれば公開範囲設定、閲覧資格付与等でオーディションやコンテストを開催可能とする。通常ユーザの使用方法としては、例えば学園祭等で利用する等が考えられる。
 撮影条件として、例えばC向け公式アプリがインストールされた5台のスマホでC向け公式アプリのガイドに従って撮影し、例えば5台のスマホはGPS位置情報的にも想定範囲内に存在し、各端末がBlueToothやUWB等によって双方向に通信し想定範囲内に存在する事が確度高く保証されている状態等を指定できる。同様に、被写体の撮影範囲に対する大きさをアテンド等してくれて(もう少し下がって被写体全体が入る様にして下さい等)条件を満たさなければ撮影開始が出来ない。撮影開始は1台の端末を親として撮影を開始し、その子(ここでは他の4台)達は撮影開始命令、一時停止、完全停止命令を受けて同期的に挙動する。撮影開始、撮影停止前にはカウトダウンが発話、表示されてもよい。撮影に参加している端末を親とする事も、参加していない端末を親とする事も可能である。更に、親は最初に撮影開始を行ったものを親にもできるし、決まった端末のみを親にもできる。また、撮影の一時停止、完全停止の両方、または何れかを子でも可能にできる。参加資格が15歳以上、18歳以下などであれば、参加資格があるかどうかの為のフローを設定することが可能である。例えば、学生証等の様に顔写真があるものと、自身の顔を一緒に撮影したものを送信する等の如くである。参加資格に関しては、即時に判定される事もあれば、参加資格に必要なものだけ送って、撮影後に、後から参加資格を判断される場合もある。
 オーディションやコンテストに際しては、主催者側が配信装置1に対して様々設定を行うことが可能である。例えば、先に踊って欲しいダンスの自由視点映像データや動画を1週間前から公開し、そのダンスを踊ってもらう、先に台本が渡されて、スマホから流れるセリフに対して、決まったセリフを身振り付きで喋ってもらう如くである。何のオーディションかは分かっているが(…という映画の…の役等)、オーディション内容の事前情報が無い中で、参加開始後にスマホからオーディション内容が発表され、音楽に合わせて歌ったり、踊ったり、スマホから流れセリフに対するアドリブでの芝居等諸々の使用方法を可能とし、参加開始後に台本等が表示され1時間以内に投稿用の撮影を完了しなければならない等の制約を設ける事も可能である。また、投稿されてきた自由視点映像データ等に関して、公開範囲を主催者側が設定し、閲覧したユーザからの評価で勝ち上がる様な仕組みを設けても良いし、3次選考まではユーザ主導で、最終選考は主催者側等の決定権指定も可能、グループ分けしたトーナメント式や、敗者復活等も可能である。
 (8)本発明の映像配信システムでは、タイアップ企画による自由視点映像データの活用を行うことが可能である。例えば、清涼飲料水を購入した際に当該商品に付与されているQRコード(登録商標)を公式アプリのガイドに従って撮影すると、元データのアップロードが可能となり、タイアップした企業側は選別した元データから自由視点映像データを作成してキャンペーン動画や、CM等に流用するといった利用方法である。元データの撮像タイミングは所定の日時に撮影がアプリ主導で行われるパターンと(例えば12月31日の23時59分45秒~年明けの0時0分15秒の30秒間等であり、各国の当該日時となる)、いつまでに何秒の元データをアップロードするという様な期限付きのパターン等が想定される。元データの撮影環境は指定することが可能であり(例えば、当該清涼飲料水を飲んでいる映像等)、ラベルが元データに入る様にする等の細かな指定が可能である。
 選別においては、卑猥なもの等、不適切なものに関しては機械学習により除外し、適切であると思われる元データの確度を百分率等で自動的にラベリングして、それをフィルタとして選択する事や、性別、年齢、背景に流れる音楽、位置情報等の指定等を利用してフィルタリングする事も可能である。いかに適切なスクリーニングを行い、それを企業側に提示出来るかがポイントになると考える。元データから作成される結果データは、自由視点映像データ以外であっても構わない。例えば、数千人の動画をマージして、タイル状に並べたものであっても良い。神戸市のタイアップであれば、震災が起きた時間帯(例えば1分間等)にメッセージや決まった歌を受付ける、場所は神戸市にあるストリートピアノの周り等の如くである。
 (9)このほか、各地に点在する自由視点映像データの撮影スポットがマップ上に表示され、撮影したスポットは認識可能となり、公開権限をONにしていると、参加している他の人にも自分がその場所で撮影した事が分かったり、データに関する公開権限やオートパイロットファイルに関する公開権限をONにしていれば、他の人にも自身の自由視点映像データなどを見てもらったりする事も可能とする。
 以上説明したように、本発明の実施形態に係る映像配信システム等によれば、以下の効果が奏される。
 本発明の実施形態に係る映像配信システム等によれば、オートパイロット用の教示ファイルを生成することができるので、閲覧者の端末装置では、オートパイロット用の教示ファイルを取得すれば、当該教示ファイルに基づく自動再生が実行可能となる。このとき、教示ファイルには、音声、文字、画像、図形などの各種アノテーション教示データが含まれているので、再生と共に付加的な演出も自動的に再現される。従って、閲覧者は、自ら視点等を切り替えることなく、ニーズに合致した教示ファイルを取得し実行するだけで、所望とする視点等の切り換えを伴う再生を楽しむことが可能となる。
 このようなオートパイロットは、自分で視点を変えながらの閲覧が煩雑である、どの時点が有用であるかが分からない、まとめて時間短縮して閲覧したい、などといったニーズに応えるものである。使用例として、ライブ映像等を、先ずは自由視点映像データ(分割された静止画データを含む)として公開し、編集者が編集した教示データに基づいて生成した教示ファイルを後で公開することも可能である。例えば、ライブに関する自由視点映像データを取り扱う場合には、特定のアーチストのみを追った再生を可能とする教示ファイル等も生成可能である。
 また、編集者の端末装置2で、前述したように各種教示データを生成し、映像配信装置1側でオートパイロット用の教示ファイルを生成することを基本とするが、編集者又は閲覧者の端末装置2,3でのユーザ操作(例えば、スワイプ操作)を記録し、それを教示データの一部として用いることも可能である。
 また、オートパイロット用の教示ファイルに基づく自動再生の過程で、ユーザ操作(例えばスワイプ操作)がなされた場合には、自動再生を一旦中断し、ユーザ操作に基づく視点の切り換えなどを行うことができる自由度もある。
 このほか、オートパイロット用の教示ファイルは、フォーク(分岐及びコピー)、マージ(結合)、クローン(コピー)等により再編集することも可能であるので、公開された教示ファイルは、複数人で共有されることで、多様なものに発展していくことが期待できる。
 ここで、本発明の実施形態には、以下の内容も含まれる。
 オートパイロット用の教示ファイルを、ライブ配信(生配信)における自由視点映像データに基づいて生成してもよい。例えば、機械学習により自動生成したオートパイロット用の教示ファイルをライブ配信(生配信)しても良いし、人的に作成(共同編集作業も可能とする)し、ライブとしては任意時間(例えば5分遅延等)後に閲覧者側では任意時間の遅延にて、ライブ開始時点からのコンテンツ再生を可能としてもよい。また、複合的に機械学習により作成したオートパイロット用の教示ファイルを、編集者が閲覧、編集してライブ配信(生配信)するようにしてもよい。さらに、人的な作業が間に合わない場合には一定時間通常の自由視点映像データを配信し、作成された段階で再度オートパイロット用の教示ファイルをライブ配信(生配信)してもよい。オートパイロット用の教示ファイルの共同編集も、既に確立されている共同編集技術、自身のタイムラインにおける排他制御や、OT(Operational Transformation)法等を用いた編集マージを行う事で迅速にオートパイロットを作成するようにしてもよい。また、オンデマンドの自由視点映像データに対しても、機械学習によりオートパイロット用の教示ファイルを自動生成、機械学習による生成されたオートパイロット用の教示ファイルを、編集者が閲覧、編集可能、オートパイロット用の教示ファイルの共同編集作業が可能である事は勿論である。また、1つの自由視点映像コンテンツに対して1つ以上のオートパイロット情報、ライブオートパイロット情報を同時に付与、配信できることも可能であることは勿論である。
 上記の流れにおいて、オートパイロット用の教示ファイルの作成中に作業が完了したところまでの「動画ファイル」を生成してもよく、それを通常の動画ファイルとして配信するようにしてもよい。その場合、専用のWebサイト等に公開可能であり、権限によりストリーミングでの閲覧、ダウンロード可能とするとよい。また、動画ファイルに対してタイムコード毎に構成要素に含まれる自由視点映像コンテンツ等に関する情報をメタデータ(例えば、XMP形式等)として動画に埋め込み、または別ファイルとして関連付けて取得可能な状態とし(XMP等に当該ファイルの場所を記述しても良いし、例えばHLS形式であればm3u8ファイル等に当該ファイルの場所や内容を記述しても良いし、所定のサーバに対して問合せを行う等して当該ファイルの内容や、配置場所を取得する等しても良い)、当該メタデータを参照することで、対応した動画プレイヤであれば、再生中等に動画ファイルから現在閲覧していた自由視点映像コンテンツに遷移して任意の視点に変更することも可能であり、動画ファイルの遷移時点の箇所に戻って再生を再開することも可能であることは勿論である。また、自由視点映像のオートパイロット及びライブオートパイロット時、ないしはオートパイロット及びライブオートパイロットの教示ファイル内容から生成された動画ファイル閲覧時に、任意に、生成元の自由視点映像のコンテンツへ遷移して、当該自由視点映像を閲覧することもでき、また遷移時の箇所に戻ってオートパイロット及びライブオートパイロット(自由視点映像、動画ファイル双方)を再開することも可能である。
 さらに、各個人の自由視点映像の閲覧方法や近似属性の閲覧方法を学習して、送信されてきた自由視点映像を自動的に学習結果に基づいて切り替えるようにしてもよい。また、コンテンツオーナー側が人的に作成して(共同作業も可能、当該共同編集機能は一般ユーザ向けに権限に基づいて付与する事も可能と算段)、所定時間経過後にライブオートパイロット用の教示ファイルを配信するようにしてもよい。
 また、先行して自由視点映像を閲覧しているユーザの閲覧統計データを基に、例えば最も良く見られている視点等から、ライブオートパイロット用の教示ファイルを生成し、配信するようにしてもよい。また、ライブオートパイロット用の教示ファイルから逐次、例えばHLS形式等の動画ストリーミングデータを生成してそれをライブ配信(生配信)してもよい。また、動画ストリーミングデータに対してタイムコード毎に構成要素に含まれる自由視点映像コンテンツ等に関する情報を、メタデータ(例えば、XMP形式等)として動画に埋め込み、または別ファイルとして関連付けて取得可能な状態とし(XMP等に当該ファイルの場所を記述しても良いし、例えばHLS形式であればm3u8ファイル等に当該ファイルの場所や内容を記述しても良いし、所定のサーバに対して問合せを行う等して当該ファイルの内容や、配置場所を取得する等しても良い)、当該メタデータを参照することで、対応した動画プレイヤであれば再生中等に動画ファイルから現在閲覧していた自由視点映像コンテンツに遷移して任意の視点に変更することも可能とし、動画ファイルの遷移時点の箇所に戻って再生を再開することも可能としてもよいことは勿論である。
 このほか、ユーザが好むターゲットやジャンルを属性情報として保持している場合、それら属性情報に基づいて、当該ユーザに好適な視点、拡大等を伴うコンテンツ再生を実現するオートパイロット用の教示ファイルを生成し、当該ユーザに提供するようにしてもよい。例えば、スポーツであれば「ボール」等を選択しておくと、ボールを物体認識して常に追従したようなオートパイロット用の教示ファイルを生成、配信してもよい。
 以上、本発明の実施形態について説明したが、本発明はこれに限定されることなくその趣旨を逸脱しない範囲で種々の更なる改良・変更が可能である。
 1…映像配信装置、2…端末装置、3…端末装置、4…通信網、10…制御部、10a…配信部、10b…取得部、10c…データ生成部、10d…指定値受付部、10e…選択部、10f…教示ファイル生成部、11…RAM、12…ROM、13…MPEGデコードモジュール、14…記憶部、14a…コンテンツ記憶部、14b…操作データ記憶部、14c…教示ファイル記憶部、14d…OS、14e…データ所得プログラム、14f…データ生成プログラム、14g…教示ファイル生成プログラム、14h…選択プログラム、14i…配信プログラム、14j…コンテンツ生成プログラム、14k…公開プレイス情報記憶部、14l…ユーザ情報記憶部、15…I/Oポート、16…ハブ、17…ルータ、21…制御部、21a…要求部、21b…映像生成部、21c…編集部、21d…取得部、22…RAM、23…ROM、24…JPEGでコードモジュール、25…I/Oポート、26…無線通信部、27…描画部、28…表示モニタ、29…操作認識部、30…操作部、31…記憶部、31a…コンテンツ記憶部、31b…操作データ記憶部、31c…教示ファイル記憶部、31d…OS、31e…ブラウザプログラム、31f…編集プログラム。

Claims (9)

  1.  映像配信装置とユーザの端末装置とからなる映像配信システムであって、
     前記映像配信装置は、
     前記端末装置から送信された公開プレイス設定情報に基づき、少なくとも自由視点映像データ及び教示ファイルを含むコンテンツデータを配信可能に公開する前記公開プレイスを設定する公開プレイス設定部と、
     前記公開プレイスの前記コンテンツデータについて前記ユーザの端末装置より配信に係る要求があったときに、少なくとも要求をした前記ユーザの権限、及び前記公開プレイスに設定された権限に基づいて、前記要求に係る処理の可否を判定し、条件を満たす場合には、前記処理を実行する判定部と、を有し、
     前記端末装置は、
     前記映像配信装置の前記公開プレイスの前記コンテンツデータについて配信に係る要求を行う要求部と、
     前記映像配信装置から配信されたコンテンツデータを取得する取得部と、
     前記コンテンツデータに基づく映像を表示する表示部と、を有する
    映像配信システム。
  2.  前記権限とは、ログイン、ストリーミング、ダウンロード、アップロード、コンテンツデータの作成、イベントへの参加、投票、及びコンテンツデータの販売の少なくともいずれかを含む
     請求項1に記載の映像配信システム。
  3.  前記公開プレイスは、階層的な構造となっており、前記公開プレイス設定情報は、前記公開プレイスの階層に係る情報、権限に係る情報を含む
     請求項1又は請求項2に記載の映像配信システム
  4.  前記教示ファイルは、教示データを含み、
     前記教示データは、スクリーンの態様を教示するスクリーン教示データ、コンテンツを教示するコンテンツ教示データ、及び、文字、図形、記号、及び音声の少なくともいずれかの付加を教示するアノテーション教示データの少なくともいずれかを含む
     請求項1に記載の映像配信システム。
  5.  前記映像配信装置は、前記端末装置において、オートパイロット用の教示ファイルに基づく再生を実行している途中で、ユーザ操作がなされると、オートパイロットの再生を一時中断し、ユーザ操作に基づく画面の切り換え、再生を実行するよう促す
     請求項1に記載の映像配信システム。
  6.  前記映像配信装置は、前記端末装置において、自由視点映像のオートパイロット及びライブオートパイロット時、ないしはオートパイロット及びライブオートパイロットの教示ファイル内容から生成された動画ファイル閲覧時に、任意に、生成元の自由視点映像のコンテンツへ遷移して、当該自由視点映像を閲覧し、また遷移時の箇所に戻ってオートパイロット及びライブオートパイロットを再開するよう促す
     請求項1乃至請求項5のいずれか1項に記載の映像配信システム。
  7.  映像配信装置とユーザの端末装置とよる映像配信方法であって、
     前記映像配信装置が、
     前記端末装置から送信された公開プレイス設定情報に基づき、少なくとも自由視点映像データ及び教示ファイルを含むコンテンツデータを配信可能に公開する前記公開プレイスを設定し、
     前記公開プレイスの前記コンテンツデータについて前記ユーザの端末装置より配信に係る要求があったときに、少なくとも要求をした前記ユーザの権限、及び前記公開プレイスに設定された権限に基づいて、前記要求に係る処理の可否を判定し、条件を満たす場合には、前記処理を実行し、
     前記端末装置が、
     前記映像配信装置の前記公開プレイスの前記コンテンツデータについて配信に係る要求を行い、
     前記映像配信装置から配信されたコンテンツデータを取得し、
     前記コンテンツデータに基づく映像を表示する
     映像配信方法。
  8.  ユーザの端末装置と通信自在な映像配信装置であって、
     前記端末装置から送信された公開プレイス設定情報に基づき、少なくとも自由視点映像データ及び教示ファイルを含むコンテンツデータを配信可能に公開する前記公開プレイスを設定する公開プレイス設定部と、
     前記公開プレイスの前記コンテンツデータについて前記ユーザの端末装置より配信に係る要求があったときに、少なくとも要求をした前記ユーザの権限、及び前記公開プレイスに設定された権限に基づいて、前記要求に係る処理の可否を判定し、条件を満たす場合には、前記処理を実行する判定部と、を有する
    映像配信装置。
  9.  ユーザの端末装置と通信自在なコンピュータを、
     前記端末装置から送信された公開プレイス設定情報に基づき、少なくとも自由視点映像データ及び教示ファイルを含むコンテンツデータを配信可能に公開する前記公開プレイスを設定する公開プレイス設定部、及び
     前記公開プレイスの前記コンテンツデータについて前記ユーザの端末装置より配信に係る要求があったときに、少なくとも要求をした前記ユーザの権限、及び前記公開プレイスに設定された権限に基づいて、前記要求に係る処理の可否を判定し、条件を満たす場合には、前記処理を実行する判定部として機能させる
    プログラム。
PCT/JP2020/040259 2020-10-27 2020-10-27 映像配信装置、映像配信システム、映像配信方法、及びプログラム WO2022091215A1 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
EP20959733.5A EP4240019A4 (en) 2020-10-27 2020-10-27 VIDEO DISTRIBUTION DEVICE, VIDEO DISTRIBUTION SYSTEM, VIDEO DISTRIBUTION METHOD AND PROGRAM
JP2022517484A JP7208695B2 (ja) 2020-10-27 2020-10-27 映像配信装置、映像配信システム、映像配信方法、及びプログラム
PCT/JP2020/040259 WO2022091215A1 (ja) 2020-10-27 2020-10-27 映像配信装置、映像配信システム、映像配信方法、及びプログラム
JP2022207147A JP2023027378A (ja) 2020-10-27 2022-12-23 映像配信装置、映像配信システム、映像配信方法、及びプログラム
US18/139,397 US20230269411A1 (en) 2020-10-27 2023-04-26 Video distribution device, video distribution system, video distribution method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/040259 WO2022091215A1 (ja) 2020-10-27 2020-10-27 映像配信装置、映像配信システム、映像配信方法、及びプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US18/139,397 Continuation US20230269411A1 (en) 2020-10-27 2023-04-26 Video distribution device, video distribution system, video distribution method, and program

Publications (1)

Publication Number Publication Date
WO2022091215A1 true WO2022091215A1 (ja) 2022-05-05

Family

ID=81382029

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/040259 WO2022091215A1 (ja) 2020-10-27 2020-10-27 映像配信装置、映像配信システム、映像配信方法、及びプログラム

Country Status (4)

Country Link
US (1) US20230269411A1 (ja)
EP (1) EP4240019A4 (ja)
JP (2) JP7208695B2 (ja)
WO (1) WO2022091215A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6571859B1 (ja) * 2018-12-26 2019-09-04 Amatelus株式会社 映像配信装置、映像配信システム、映像配信方法及び映像配信プログラム
KR102638162B1 (ko) * 2020-01-30 2024-02-20 아마텔러스 인크. 영상 배신 장치, 영상 배신 시스템, 영상 배신 방법 및 프로그램
US11968185B2 (en) * 2022-02-25 2024-04-23 Microsoft Technology Licensing, Llc On-device experimentation

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4697468B2 (ja) 2007-01-31 2011-06-08 日本電気株式会社 利用権限管理装置、コンテンツ共有システム、コンテンツ共有方法、及びコンテンツ共有用プログラム
JP2011228845A (ja) * 2010-04-16 2011-11-10 Canon Inc 画像処理装置および方法
JP2015177394A (ja) 2014-03-17 2015-10-05 カシオ計算機株式会社 画像処理装置、画像処理方法及びプログラム
JP6302564B2 (ja) 2014-09-05 2018-03-28 富士フイルム株式会社 動画編集装置、動画編集方法及び動画編集プログラム
WO2018147089A1 (ja) * 2017-02-10 2018-08-16 ソニー株式会社 情報処理装置および方法
JP2019133214A (ja) * 2018-01-29 2019-08-08 電駆ビジョン株式会社 画像表示装置、該装置を含む映像表示システム、画像表示方法および画像表示用プログラム
JP2019139443A (ja) * 2018-02-08 2019-08-22 キヤノン株式会社 通信装置、通信方法、及びプログラム

Family Cites Families (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004207948A (ja) * 2002-12-25 2004-07-22 Fuji Xerox Co Ltd ビデオ閲覧システム
US20070103558A1 (en) * 2005-11-04 2007-05-10 Microsoft Corporation Multi-view video delivery
US20070157281A1 (en) * 2005-12-23 2007-07-05 United Video Properties, Inc. Interactive media guidance system having multiple devices
US7822280B2 (en) * 2007-01-16 2010-10-26 Microsoft Corporation Epipolar geometry-based motion estimation for multi-view image and video coding
US20090144237A1 (en) * 2007-11-30 2009-06-04 Michael Branam Methods, systems, and computer program products for providing personalized media services
US8566353B2 (en) * 2008-06-03 2013-10-22 Google Inc. Web-based system for collaborative generation of interactive videos
JP2010218423A (ja) * 2009-03-18 2010-09-30 Toshiba Corp 音楽概念データ処理方法及び映像表示装置及び音楽概念データ処理サーバ
US8769589B2 (en) * 2009-03-31 2014-07-01 At&T Intellectual Property I, L.P. System and method to create a media content summary based on viewer annotations
US20110078717A1 (en) * 2009-09-29 2011-03-31 Rovi Technologies Corporation System for notifying a community of interested users about programs or segments
US8930849B2 (en) * 2010-03-31 2015-01-06 Verizon Patent And Licensing Inc. Enhanced media content tagging systems and methods
US9565476B2 (en) * 2011-12-02 2017-02-07 Netzyn, Inc. Video providing textual content system and method
WO2014025319A1 (en) * 2012-08-08 2014-02-13 National University Of Singapore System and method for enabling user control of live video stream(s)
US9699485B2 (en) * 2012-08-31 2017-07-04 Facebook, Inc. Sharing television and video programming through social networking
US9497424B2 (en) * 2012-12-05 2016-11-15 At&T Mobility Ii Llc System and method for processing streaming media of an event captured by nearby mobile phones
US20160006981A1 (en) * 2013-02-19 2016-01-07 Wizeo Methods and systems for hosting interactive live stream video events for payment or donation
US20160037217A1 (en) * 2014-02-18 2016-02-04 Vidangel, Inc. Curating Filters for Audiovisual Content
US20160366464A1 (en) * 2015-06-11 2016-12-15 Flune Interactive, Inc. Method, device, and system for interactive television
US9967618B2 (en) * 2015-06-12 2018-05-08 Verizon Patent And Licensing Inc. Capturing a user reaction to media content based on a trigger signal and using the user reaction to determine an interest level associated with a segment of the media content
WO2016199608A1 (ja) * 2015-06-12 2016-12-15 ソニー株式会社 情報処理装置および情報処理方法
US9883249B2 (en) * 2015-06-26 2018-01-30 Amazon Technologies, Inc. Broadcaster tools for interactive shopping interfaces
US10390064B2 (en) * 2015-06-30 2019-08-20 Amazon Technologies, Inc. Participant rewards in a spectating system
US11132099B2 (en) * 2015-09-14 2021-09-28 Sony Corporation Information processing device and information processing method
US10187687B2 (en) * 2015-11-06 2019-01-22 Rovi Guides, Inc. Systems and methods for creating rated and curated spectator feeds
US10114689B1 (en) * 2015-12-28 2018-10-30 Amazon Technologies, Inc. Dynamic playlist generation
US10775882B2 (en) * 2016-01-21 2020-09-15 Microsoft Technology Licensing, Llc Implicitly adaptive eye-tracking user interface
US11012719B2 (en) * 2016-03-08 2021-05-18 DISH Technologies L.L.C. Apparatus, systems and methods for control of sporting event presentation based on viewer engagement
EP3432590A4 (en) * 2016-03-14 2019-02-27 Sony Corporation DISPLAY DEVICE AND TERMINAL INFORMATION PROCESSING DEVICE
JP2018026104A (ja) * 2016-08-04 2018-02-15 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America アノテーション付与方法、アノテーション付与システム及びプログラム
JP6996514B2 (ja) * 2016-10-26 2022-01-17 ソニーグループ株式会社 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム
KR20180074180A (ko) * 2016-12-23 2018-07-03 삼성전자주식회사 가상현실 영상에 대한 정보를 제공하는 장치 및 방법
US10148910B2 (en) * 2016-12-30 2018-12-04 Facebook, Inc. Group video session
US10997558B2 (en) * 2017-02-20 2021-05-04 Vspatial, Inc. System and method for creating a collaborative virtual session
JP2018163461A (ja) * 2017-03-24 2018-10-18 ソニー株式会社 情報処理装置、および情報処理方法、並びにプログラム
US10187690B1 (en) * 2017-04-24 2019-01-22 Gopro, Inc. Systems and methods to detect and correlate user responses to media content
JP3211786U (ja) * 2017-05-24 2017-08-03 ボーダレス・ビジョン株式会社 ライブ映像利用の対話装置
US10419790B2 (en) * 2018-01-19 2019-09-17 Infinite Designs, LLC System and method for video curation
US11064102B1 (en) * 2018-01-25 2021-07-13 Ikorongo Technology, LLC Venue operated camera system for automated capture of images
GB2571106A (en) * 2018-02-16 2019-08-21 Sony Corp Image processing apparatuses and methods
WO2019191708A1 (en) * 2018-03-30 2019-10-03 Realnetworks, Inc. Socially annotated audiovisual content
US11477516B2 (en) * 2018-04-13 2022-10-18 Koji Yoden Services over wireless communication with high flexibility and efficiency
US10757109B2 (en) * 2018-05-10 2020-08-25 Rovi Guides, Inc. Systems and methods for connecting a public device to a private device with pre-installed content management applications
US11825066B2 (en) * 2018-12-25 2023-11-21 Sony Corporation Video reproduction apparatus, reproduction method, and program
US11141656B1 (en) * 2019-03-29 2021-10-12 Amazon Technologies, Inc. Interface with video playback
CN113647098A (zh) * 2019-03-29 2021-11-12 索尼集团公司 图像处理装置、图像处理方法和程序
JP6776400B1 (ja) * 2019-04-26 2020-10-28 株式会社コロプラ プログラム、方法、および情報端末装置
JP6971282B2 (ja) * 2019-08-30 2021-11-24 株式会社コロプラ プログラム、方法、および情報端末装置
US20210097338A1 (en) * 2019-09-26 2021-04-01 International Business Machines Corporation Using Domain Constraints And Verification Points To Monitor Task Performance
KR102638162B1 (ko) * 2020-01-30 2024-02-20 아마텔러스 인크. 영상 배신 장치, 영상 배신 시스템, 영상 배신 방법 및 프로그램
EP4167577A4 (en) * 2020-06-10 2023-09-27 Sony Group Corporation INFORMATION PROCESSING APPARATUS, INFORMATION PROCESSING METHOD, IMAGING APPARATUS AND IMAGE TRANSMISSION SYSTEM
JP7083380B2 (ja) * 2020-09-28 2022-06-10 グリー株式会社 コンピュータプログラム、方法及びサーバ装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4697468B2 (ja) 2007-01-31 2011-06-08 日本電気株式会社 利用権限管理装置、コンテンツ共有システム、コンテンツ共有方法、及びコンテンツ共有用プログラム
JP2011228845A (ja) * 2010-04-16 2011-11-10 Canon Inc 画像処理装置および方法
JP2015177394A (ja) 2014-03-17 2015-10-05 カシオ計算機株式会社 画像処理装置、画像処理方法及びプログラム
JP6302564B2 (ja) 2014-09-05 2018-03-28 富士フイルム株式会社 動画編集装置、動画編集方法及び動画編集プログラム
WO2018147089A1 (ja) * 2017-02-10 2018-08-16 ソニー株式会社 情報処理装置および方法
JP2019133214A (ja) * 2018-01-29 2019-08-08 電駆ビジョン株式会社 画像表示装置、該装置を含む映像表示システム、画像表示方法および画像表示用プログラム
JP2019139443A (ja) * 2018-02-08 2019-08-22 キヤノン株式会社 通信装置、通信方法、及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP4240019A4

Also Published As

Publication number Publication date
JP7208695B2 (ja) 2023-01-19
EP4240019A4 (en) 2024-06-05
US20230269411A1 (en) 2023-08-24
EP4240019A1 (en) 2023-09-06
JP2023027378A (ja) 2023-03-01
JPWO2022091215A1 (ja) 2022-05-05

Similar Documents

Publication Publication Date Title
WO2022091215A1 (ja) 映像配信装置、映像配信システム、映像配信方法、及びプログラム
US11743544B2 (en) Interactive content feedback system
Allocca Videocracy: How YouTube is changing the world... with double rainbows, singing foxes, and other trends we can't stop watching
US8867901B2 (en) Mass participation movies
JP5767108B2 (ja) 媒体生成システム及び方法
US20140108932A1 (en) Online search, storage, manipulation, and delivery of video content
US20170337841A1 (en) Interactive multimedia story creation application
US20140149867A1 (en) Web-based interactive experience utilizing video components
US20040098754A1 (en) Electronic messaging synchronized to media presentation
US20090063496A1 (en) Automated most popular media asset creation
TW201005583A (en) Interactive systems and methods for video compositing
US20220329644A1 (en) Real-time system and method for silent party hosting and streaming
US20220108726A1 (en) Machine learned video template usage
Vollans Cross media promotion: entertainment industries and the trailer
CN114761943A (zh) 创建、维护和发展虚拟音乐主题世界
CN114846808B (zh) 内容发布系统、内容发布方法以及存储介质
US20150169592A1 (en) System and a method for facilitating a platform for one or more users to compete
JP7365076B2 (ja) 映像配信装置、映像配信システム、映像配信方法、及びプログラム
US20230038412A1 (en) Digital Story Generation
KR101109170B1 (ko) 창작영상제공시스템
Fernandes Moodle 1.9 Multimedia
JP7445272B1 (ja) 動画処理方法、動画処理システム、及び動画処理プログラム
Griffin Get rich blogging
Boyle et al. Talent, multi-channel networks (MCN) and the YouTube generation
Hernandez Jr The Storyteller's Dilemma: Overcoming the Challenges in the Digital Media Age

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2022517484

Country of ref document: JP

Kind code of ref document: A

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20959733

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 202327028261

Country of ref document: IN

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2020959733

Country of ref document: EP

Effective date: 20230530