WO2021111906A1 - コンテンツ提供システム、コンテンツ提供方法、及び記憶媒体 - Google Patents

コンテンツ提供システム、コンテンツ提供方法、及び記憶媒体 Download PDF

Info

Publication number
WO2021111906A1
WO2021111906A1 PCT/JP2020/043424 JP2020043424W WO2021111906A1 WO 2021111906 A1 WO2021111906 A1 WO 2021111906A1 JP 2020043424 W JP2020043424 W JP 2020043424W WO 2021111906 A1 WO2021111906 A1 WO 2021111906A1
Authority
WO
WIPO (PCT)
Prior art keywords
user
content
comment
script
program
Prior art date
Application number
PCT/JP2020/043424
Other languages
English (en)
French (fr)
Inventor
丹下 明
長坂 英夫
Original Assignee
ソニーグループ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニーグループ株式会社 filed Critical ソニーグループ株式会社
Priority to US17/775,586 priority Critical patent/US20220391441A1/en
Publication of WO2021111906A1 publication Critical patent/WO2021111906A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/686Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • G10K15/02Synthesis of acoustic waves

Definitions

  • Patent Document 2 discloses an advertisement distribution device that cancels the distribution of advertisements while viewing the content.
  • Patent Document 3 discloses a device that switches the content when the concentration of the viewer is low and resumes the reproduction of the original content when the concentration is restored.
  • This technology was made in view of such a situation, and makes it possible to provide the comment together with the content more appropriately.
  • a script generated by a creator and consisting of content identification information and comment information is stored in a predetermined storage medium so that the user can view it, and the script selected by the user.
  • the reading of the content indicated by the content identification information contained in the script is controlled so as to be executed and provided to the user by utilizing the rights already acquired by the user by the contract with the specific service.
  • a control unit that controls to read a comment and provide the comment to a user according to the comment information included in the script, at least either before or after the provision of the content, is provided, and the control unit responds to the context of the user.
  • This is a content providing system that controls the provision of the content or the comment.
  • the storage medium of one aspect of the present technology is a computer, and a script composed of content identification information and comment information generated by the creator is stored in a predetermined storage medium so that the user can view it, and is selected by the user.
  • the reading of the content indicated by the content identification information contained in the script is controlled to be executed and provided to the user by utilizing the rights already acquired by the user by the contract with the specific service.
  • the comment is controlled to be read and provided to the user according to the comment information included in the script, and the content or the content is provided according to the context of the user.
  • It is a storage medium in which a program for functioning as a control unit for controlling the provision of comments is recorded.
  • FIG. 1 is a representative diagram showing an outline of the present technology.
  • This technology provides content and comments more appropriately by providing comments on the content and the like together with the content by using the context of the user when the content is made into a program.
  • the podcast program created by the creator is registered on the distribution server.
  • the user can watch the program by operating his / her own terminal device and playing the podcast program distributed from the distribution server.
  • the above-mentioned programming, distribution copyright processing, and monetization are inevitable items for creators who distribute podcast programs, and a mechanism to easily solve these items is required. Has been done.
  • the virtual podcast system allows creators to create and distribute podcast programs so that users can watch the podcast programs, while also responding to creators' requests for programming, distribution copyright processing, and monetization. Provide a mechanism for this.
  • Each track is composed of a previous story (Warm-up), a song (song), and a later story (After-song).
  • the postscript is a postscript after watching the music and consists of text (sentence).
  • the text "It's the best " is written as a postscript.
  • the text corresponding to this later can be read aloud using TTS.
  • the first is the case of distributing a program including music.
  • the creator creates a complete podcast program including the music and chat (previous and later), and the podcast program is distributed. Therefore, the copyright of the music Processing occurs for the creator who delivers.
  • the second is the case of VPC type distribution.
  • the music is distributed using the music distribution service, and the creator only creates and distributes the chat (previous and postscript), so that the copyright processing of the music is performed. , Does not occur for creators.
  • the music streamed by the music distribution service and the chatter (previous and postscript) distributed by the creator are combined into a program by the user terminal device used by the user, so that the user terminal The user handles the rights processing of the music part in the podcast program programmed on the device side.
  • VPC type distribution when the podcast is distributed, the creator distributes the music identification information (music ID) without creating a complete package podcast program, so that the user terminal device side used by the user can use the music. So, based on the music ID, the music distributed by the music distribution service is played.
  • music ID music identification information
  • the contract with the music distribution service of the user is not only a paid user contract (premium user) but also a free user contract (free user), the music is played only by inserting an advertisement. If you can, you can use that right.
  • the music distribution service corresponds to the music distribution service contracted (subscribed) by the user who uses the user terminal device.
  • the music distribution service distributes music specified by the music ID set in the podcast program in response to a request from the user terminal device.
  • the music distribution service provides a music list for music selection to the creator terminal device.
  • the program renderer When playing a desired program from the podcast programs released by the program distribution service, the program renderer includes the music distributed from the music distribution service and the music distributed from the music distribution service based on the configuration data (reproduction data) related to the configuration of the program. Renders the TTS audio distributed from the audio distribution service.
  • the song ID of the song and the script consisting of the preamble and the postscript about the song are generated by the creator terminal device used by the creator and registered in the program distribution service to be disclosed to the user.
  • the script only describes the song ID of the song and the preamble and postscript in text, but does not contain the song or audio data itself that is played in the podcast program.
  • the program created by the creator is reproduced by playing back the music and audio data based on the music ID described in the script and the information indicated by the previous and subsequent explanations.
  • the program distribution server 30A when it is not necessary to distinguish between the program distribution server 30A, the music distribution server 30B, and the audio distribution server 30C, the program distribution server 30A will be referred to as the distribution server 30. Further, the program distribution business operator, the music distribution business operator, and the audio distribution business operator may be the same business operator or different business operators.
  • the output unit 206 outputs various information according to the control from the CPU 201 via the input / output I / F 210.
  • the output unit 206 has a display unit 221 and a sound output unit 222.
  • the display unit 221 displays an image or the like according to the image data according to the control from the CPU 201. It is composed of a display unit 221 and a panel unit such as a liquid crystal panel or an OLED (Organic Light Emitting Diode) panel and a signal processing unit.
  • a panel unit such as a liquid crystal panel or an OLED (Organic Light Emitting Diode) panel and a signal processing unit.
  • control unit 200 includes a program acquisition unit 251, a music acquisition unit 252, an audio acquisition unit 253, a renderer unit 254, a presentation control unit 255, a sensor data acquisition unit 256, and a context analysis unit 257.
  • the voice acquisition unit 253 acquires voice data according to the previous and subsequent explanations supplied from the communication unit 208 that communicates with the voice distribution server 30C, and supplies the voice data to the renderer unit 254.
  • FIG. 11 shows an example of the configuration of the distribution server 30 of FIG.
  • the distribution server 30 corresponds to any of the program distribution server 30A, the music distribution server 30B, and the audio distribution server 30C shown in FIG.
  • the CPU 301, ROM 302, and RAM 303 are connected to each other by the bus 304.
  • An input / output I / F 310 is further connected to the bus 304.
  • An input unit 305, an output unit 306, a storage unit 307, a communication unit 308, and a drive 309 are connected to the input / output I / F 310.
  • the input unit 305 is composed of a microphone, a keyboard, a mouse, and the like.
  • the output unit 306 is composed of a speaker, a display, and the like.
  • the drive 309 drives a removable recording medium 311 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory.
  • FIG. 12 shows an example of the functional configuration of the control unit 300 in the distribution server 30.
  • the function of the control unit 300 is realized by executing the program of each service by the CPU 301.
  • control unit 300 has a request reception / response unit 351, a distribution processing unit 352, and a database 353.
  • the request reception / response unit 351 receives various requests supplied from the communication unit 308 that communicates with the creator terminal device 10 or the user terminal device 20, and supplies them to the distribution processing unit 352.
  • the distribution processing unit 352 processes various data stored in the database 353, generates responses corresponding to various requests, and supplies them to the request reception / response unit 351.
  • the request reception / response unit 351 controls the communication unit 308 to send a response according to various requests supplied from the distribution processing unit 352 to the creator terminal device 10 or the user terminal device 20 of the request source via the network 50. Send to.
  • FIG. 13 is a sequence diagram showing the overall processing flow of the content providing system 1.
  • the program creation tool is executed by the creator terminal device 10, and the program renderer is executed by the user terminal device 20. Further, in FIG. 13, the program distribution service is provided by the program distribution server 30A, the music distribution service is provided by the music distribution server 30B, and the TTS service is provided by the audio distribution server 30C.
  • the program creation tool requests the music list from the music distribution server 30B, acquires the music list transmitted from the music distribution server 30B, and presents it to the creator (S11, S12).
  • the script of the podcast program created by the creator is stored in the database 353 and can be viewed by the user who uses the user terminal device 20.
  • the program renderer requests the voice distribution server 30C to synthesize the text of the previous story based on the previous story set at the beginning of the received script (S17).
  • the voice synthesis of the text of the previous theory is performed (S18) in response to the request from the program renderer, and the result of the voice synthesis is delivered (S19).
  • the program renderer As a result, in the program renderer, the result of the voice synthesis delivered from the voice distribution server 30C is received, and the rendering process is performed to reproduce the TTS sound of the part of the previous theory set in the programmed music. ..
  • the program renderer sends the music specified by the music ID to the music distribution server 30B that provides the music distribution service contracted by the user, based on the music ID set next to the preamble of the received script.
  • Request delivery (S20).
  • the rights acquired by the user through the contract with the music distribution service are confirmed (S21), and the user has a legitimate right and is specified by the music ID.
  • the music is streamed and distributed (S22).
  • the program renderer requests the voice distribution server 30C to synthesize the text of the later text based on the later explanation set next to the music ID of the received script. (S23).
  • the voice synthesis of the text described later is performed (S24) in response to the request from the program renderer, and the result of the voice synthesis is delivered (S25).
  • the playback is repeated in the order of the previous story, the song, and the latter story for each song ID set in the script of the program, and the user can watch the podcast program.
  • the types of user actions include “stationary”, “paused”, “walking”, “running”, and “jumping”.
  • the states such as “sitting”, “standing”, “elevating up”, “elevating down”, and “on the train” are based on the sensor data from the accelerometer. It can be identified by analysis.
  • FIGS. 16 to 18 are the control of the creator terminal device 10 (control unit 100), the user terminal device 20 (control unit 200), and the distribution server 30 (control) in the content providing system to which the present technology is applied. It is realized by operating in cooperation with the unit 300).
  • the user has already acquired the reading of the content indicated by the content identification information included in the script according to the user's context by contracting with a specific service. It is executed by utilizing the right to be provided and is controlled to be provided to the user (S151).
  • Playback control methods include skipping audio when the user is listening to a program while doing other work such as work, or inserting advertisements when the user is concentrating on the music. There is a way to ban it. This control is performed not only because it does not interfere with the user who is concentrating on the music, but also because the effect is small even if an advertisement is inserted when the user is concentrating on the music.
  • the degree of concentration of the user can be estimated by using the user's respiration, heartbeat, brain wave, fluctuation of skin potential, etc. based on the sensor data from the sensor unit 213.
  • the program renderer recognizes that the user concentrates on one point and concentrates on other than viewing the music as the user context, the music specified by the music ID based on the script of the program to be played.
  • the reproduction of the previous theory, the music, and the latter is repeated, the reproduction of the previous theory and the latter is skipped (S52, S53) so that only the music is reproduced.
  • the advertisement distribution server 30D identifies an advertisement managed by an advertisement management or an advertisement database 353 in response to a request from the program distribution server 30A, and delivers the specified advertisement (advertisement body).
  • the advertisement distribution server 30D has the same configuration as the configuration of the distribution server 30 and the functional configuration of the control unit 300 shown in FIGS. 11 and 12.
  • FIG. 21 shows an example of an advertisement inserted in a script of a podcast program.
  • FIG. 22 is a sequence diagram showing a processing flow when prohibiting the insertion of an advertisement when the user is concentrating on the music.
  • the advertisement may hinder the concentration of the user. Therefore, the reproduction of the advertisement is skipped and more appropriate reproduction control is performed. I'm trying to do it.
  • the content providing system 1 controls so that the advertisement is not provided to the user (S232).
  • the control of skipping the playback of the advertisement is controlled so as not to disturb the user who is concentrating on watching the music. Will be done.
  • the preamble, the postscript, and the advertisement are not played.
  • the type of the advertisement to be played may be controlled to be changed from "an advertisement of a type that reads aloud a sentence" to "an advertisement consisting of music itself”.
  • FIG. 25 is a sequence diagram showing a processing flow when displaying subtitles according to the user's context.
  • the program renderer shifts from the audio output mode in which the preamble and the postscript are output by voice to the text display mode in which the subtitles are displayed as the output mode of the preamble and the postscript.
  • the program renderer when a user is instructed to play a podcast program that is open to the public for viewing on the program distribution server 30A, the program is played (S15 to S26). Playback control is performed according to the user context (S72, S73).
  • FIG. 26 shows an example of subtitle display of the preamble and the postscript displayed on the display unit 221 of the user terminal device 20.
  • the text of the previous story subtitled in the upper area 511 of the screen 510 containing information about the program or music to be played (for example, the image of the jacket of the music to be played). Can be superimposed and displayed.
  • the subtitled text of the later story can be superimposed and displayed on the area 512 at the lower part of the screen 510 containing information on the program or music to be played.
  • the preamble and the postscript displayed in the areas 511 and 512 of the screen 510 may be displayed in a fixed manner, or may flow in a predetermined direction such as from the right to the left of the screen. Also, for example, when multiple creators are inputting comments for the same song, and multiple preambles and postscripts are set for a certain song, all of those comments are converted into text and displayed at the same time. The text may be flowed in a predetermined direction, such as from the right to the left of the screen.
  • FIG. 27 is a flowchart illustrating an overall picture of the process according to the third embodiment.
  • the processing shown in FIG. 27 is realized by the user terminal device 20 (control unit 200) in the content providing system to which the present technology is applied and the distribution server 30 (control unit 300) operating in cooperation with each other.
  • the process shown in FIG. 27 is a process corresponding to the reproduction control process (S133) according to the user context shown in FIG.
  • the content providing system 1 when the user detects an instruction to skip the voice provision of the comment (“Yes” in S311), the content providing system 1 is controlled to display the comment as text (S312). ).
  • Control is performed to display the text of the theory as subtitles.
  • the pre- and post-preceding type is a method of automatically generating a new script by automatically selecting the pre- and post-scripts registered in the program distribution server 30A according to the user's situation and the surrounding environment.
  • the content corresponding to the playlist generated according to the user's context is used as a key, and the preambles and postscripts (for example, popular preambles and postscripts) registered in the program distribution server 30A are used. This is a method to identify and automatically generate a new script.
  • the program renderer when a user is instructed to play a podcast program that is open to the public for viewing on the program distribution server 30A, the program is played (S15 to S26). Playback control is performed according to the user context (S82).
  • the program distribution server 30A since the program distribution server 30A includes the search keys of the preamble and the postscript according to the user context in the playback request from the program renderer, the prelude and the postscript of the registered program are used by the search key. Is searched and automatically selected, and a new script is automatically generated and distributed (S82, S16).
  • the season is winter, it will be automatically based on the preamble or postscript set in the song, which contains words related to winter, such as "I think it's perfect for winter.” It is possible to generate a script of a program. Also, for example, if the season is summer, the preamble or postscript set in the song, such as "sea”, “pool”, “chilled Chinese”, and “watermelon”, that contains words related to summer. You may choose.
  • FIG. 29 is a sequence diagram showing a processing flow when a new script is automatically generated and played back in the content-first type.
  • the user's context is recognized based on the analysis result from the context analysis unit 257 prior to the reproduction of the podcast program (S91).
  • the title of the song contains not only “summer” but also summer-related words such as “sea”, “pool”, “chilled Chinese”, and “suika”.
  • the song order of the songs to be made into a program can be, for example, the order of the matching degree of vibration synchronization.
  • the program renderer may specify the playback order of the music in consideration of the contexts of the preamble and the postscript.
  • playlists are generated according to the user's context, but not only that, the listening ranking of songs today / this week / this month / this year, the number of likes (Like) ranking, etc.
  • a playlist may be generated by adding all ranking information such as rankings by prefecture / country / area such as Asia.
  • comments included in the script stored in the predetermined storage medium are automatically selected (S411) according to the user's context, and based on the automatically selected comments.
  • a new script is automatically generated (S412), and the automatically generated script is played back (S413).
  • the preamble and the postscript included in the script of the program registered (uploaded) in the program distribution server 30A are automatically selected and automatically selected according to the context of the user by the preamble / postscript predecessor type control.
  • a new script is automatically generated based on the previous and subsequent theories.
  • the package is searched by the script stored in the predetermined storage medium according to the context of the user (S431), and is included in the searched package.
  • the comment information corresponding to the comment is specified (S432), and the specified comment information is packaged with the content identification information, so that a new script is automatically generated (S433) and automatically generated.
  • the created script is played back (S434).
  • the preamble and the postscript (for example, popular) registered (uploaded) in the program distribution server 30A by using the content corresponding to the playlist generated according to the user's context as a key by the content-first control.
  • a new script is automatically generated by identifying a certain prelude or postscript) and packaging the identified prelude or postscript with the song ID.
  • the audio of the preamble and the postscript is skipped depending on whether or not the user is watching with the surrounding users, or whether the prelude and the postscript are self-made. More specifically, the audio of the preamble and the postscript is skipped for a specific user by setting conditions such as not allowing only registered users with different hobbies to listen to the self-made prelude and postscript. Can be.
  • FIG. 32 is a flowchart illustrating an overall picture of the process according to the fifth embodiment.
  • step S511 If it is determined in the determination process of step S511 that the user is viewing alone, the process proceeds to step S515.
  • the reproduction control process according to the reproduction mode of the preamble and the postscript is performed (S515).
  • the preamble and postscript playback mode both the preamble and the postscript are played back.
  • step S511 If it is determined in the determination process of step S511 that the user is not viewing alone, the process proceeds to step S512. Then, it is determined whether or not the user is viewing with a registered user who has a similar hobby (S512).
  • step S513 If it is determined in the determination process of step S513 that the user is viewing with other registered users, the process proceeds to step S514. Then, it is determined whether the preamble and the postscript are created by another user (S514).
  • step S514 If it is determined in the determination process of step S514 that the preamble and the postscript are created by another user, the process proceeds to step S515.
  • the reproduction control process according to the preamble and postscript reproduction mode is performed, and both the preamble and the postscript are reproduced (S515).
  • playback control is performed so as to skip the audio of the preamble and the postscript, depending on whether or not the user is watching with the surrounding users, and whether the preamble or the postscript is created by the user. Can be done.
  • the preamble and the postscript created by the user are controlled so that only registered users with different hobbies can hear them.
  • the judgment condition here is an example, and for example, the judgment threshold value may be adjusted or a new judgment condition may be added in consideration of the personality of the user. For example, if a user has a high extroversion, in the determination process of step S513, when it is determined that the user is viewing with other registered users, the reproduction control process according to the reproduction mode of the previous theory and the latter is performed. The preamble and the postscript may be reproduced together (S515).
  • the user may manually set the "previous and postscript playback mode" and the "previous and postscript skip mode” when performing the above-mentioned playback control process.
  • the playback control process is performed in the "previous and subsequent explanation skip mode". You may do so.
  • a program can be installed in a storage unit via an input / output I / F by mounting a removable recording medium in a drive. Further, the program can be received by the communication unit and installed in the storage unit via a wired or wireless transmission medium. In addition, the program can be installed in advance in the ROM or storage unit.
  • the processing performed by the computer according to the program does not necessarily have to be performed in chronological order in the order described as the flowchart. That is, the processing performed by the computer according to the program also includes processing executed in parallel or individually (for example, parallel processing or processing by an object).
  • the program may be processed by one computer (processor) or may be distributed processed by a plurality of computers.
  • the program may be transferred to a distant computer for execution.
  • the system means a set of a plurality of components (devices, modules (parts), etc.), and it does not matter whether all the components are in the same housing. Therefore, a plurality of devices housed in separate housings and connected via a network, and a device in which a plurality of modules are housed in one housing are both systems. ..
  • the embodiment of the present technology is not limited to the above-described embodiment, and various changes can be made without departing from the gist of the present technology.
  • the present technology can have a cloud computing configuration in which one function is shared and jointly processed by a plurality of devices via a network.
  • each step described in the above flowchart can be executed by one device or shared by a plurality of devices. Further, when a plurality of processes are included in one step, the plurality of processes included in the one step can be executed by one device or shared by a plurality of devices.
  • a script generated by the creator and consisting of content identification information and comment information is stored in a predetermined storage medium so that the user can view it.
  • the reading of the content indicated by the content identification information contained in the script is executed and provided to the user by utilizing the rights already acquired by the user by the contract with the specific service.
  • It is provided with a control unit that controls the content to be read and provided to the user according to the comment information included in the script, at least either before or after the provision of the content.
  • the control unit is a content providing system that controls the provision of the content or the comment according to the context of the user.
  • the control unit controls so that the comment is not provided when it is determined that the user is not concentrating on viewing the content.
  • the control unit It has a function of providing an advertisement to a user before or after providing the comment to the user.
  • the content according to (8) above which automatically generates a new script by specifying the comment information and packaging it with the content identification information according to the user's evaluation of the comment indicated by the comment information included in the searched package.
  • Offering system (11) The content providing according to any one of (1) to (10) above, wherein the control unit controls so that the comment is not provided to the user depending on whether or not the user is viewing with surrounding users. system. (12) The control unit controls so that the comment is not provided to the user when the user is viewing the content together with surrounding users and the comment is created by the user himself / herself (11).
  • Content provision system described in. (13) The content includes music
  • the comment includes at least one of the preamble and the postscript set in the music.
  • the content providing system according to any one of (1) to (12) above, wherein the specific service includes a music distribution service contracted by the user.
  • a script generated by the creator and consisting of content identification information and comment information is stored in a predetermined storage medium so that the user can view it. According to the script selected by the user, the reading of the content indicated by the content identification information contained in the script is executed and provided to the user by utilizing the rights already acquired by the user by the contract with the specific service.
  • the comment is read and provided to the user according to the comment information included in the script.
  • a content providing method that controls the provision of the content or the comment according to the context of the user.
  • (16) Computer A script generated by the creator and consisting of content identification information and comment information is stored in a predetermined storage medium so that the user can view it. According to the script selected by the user, the reading of the content indicated by the content identification information contained in the script is executed and provided to the user by utilizing the rights already acquired by the user by the contract with the specific service. And at least either before or after the provision of the content, the comment is read and provided to the user according to the comment information included in the script.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Library & Information Science (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本技術は、より適切に、コンテンツとともにそのコメントを提供することができるようにするコンテンツ提供システム、コンテンツ提供方法、及び記憶媒体に関する。 クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後の少なくともいずれか一方で、そのスクリプトに含まれるコメント情報に従ってコメントを読み出しユーザに提供するように制御する制御部を備え、制御部は、ユーザのコンテキストに応じて、コンテンツ又はコメントの提供を制御するコンテンツ提供システムが提供される。

Description

コンテンツ提供システム、コンテンツ提供方法、及び記憶媒体
 本技術は、コンテンツ提供システム、コンテンツ提供方法、及び記憶媒体に関し、特に、より適切に、コンテンツとともにそのコメントを提供することができるようにしたコンテンツ提供システム、コンテンツ提供方法、及び記憶媒体に関する。
 近年、コンテンツを提供する方法の多様化に伴い、様々なサービスや機器が提供されている(例えば、特許文献1乃至3参照)。
 特許文献1には、携帯音楽プレイヤで曲を視聴中に、その曲が特定のアーティストのものである場合は、ニュース速報を保留して曲が終了した際に音声合成することで、ユーザがコンテンツに集中したいタイミングを避けて情報提供が可能な装置が開示されている。
 特許文献2には、コンテンツの視聴中は、広告の配信を取りやめる広告配信装置が開示されている。
 特許文献3には、視聴者の集中度が低下しているときには、コンテンツを切り替えて、集中度が戻ったら、元のコンテンツの再生を再開する装置が開示されている。
特開2006-295799号公報 特開2018-125856号公報 特開2016-100033号公報
 ところで、コンテンツとともにそのコンテンツ等に関するコメントを提供するに際しては、より適切に、コンテンツとそのコメントを提供することが求められる。
 本技術はこのような状況に鑑みてなされたものであり、より適切に、コンテンツとともにそのコメントを提供することができるようにするものである。
 本技術の一側面のコンテンツ提供システムは、クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後の少なくともいずれか一方で、そのスクリプトに含まれる前記コメント情報に従ってコメントを読み出しユーザに提供するように制御する制御部を備え、前記制御部は、前記ユーザのコンテキストに応じて、前記コンテンツ又は前記コメントの提供を制御するコンテンツ提供システムである。
 本技術の一側面のコンテンツ提供方法は、クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後の少なくともいずれか一方で、そのスクリプトに含まれる前記コメント情報に従ってコメントを読み出しユーザに提供するように制御するとともに、前記ユーザのコンテキストに応じて、前記コンテンツ又は前記コメントの提供を制御するコンテンツ提供方法である。
 本技術の一側面の記憶媒体は、コンピュータを、クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後の少なくともいずれか一方で、そのスクリプトに含まれる前記コメント情報に従ってコメントを読み出しユーザに提供するように制御するとともに、前記ユーザのコンテキストに応じて、前記コンテンツ又は前記コメントの提供を制御する制御部として機能させるためのプログラムを記録した記憶媒体である。
 本技術の一側面のコンテンツ提供システム、コンテンツ提供方法、及び記憶媒体においては、クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しが、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行されてユーザに提供されるように制御されるとともに、当該コンテンツの提供の前か後の少なくともいずれか一方で、そのスクリプトに含まれる前記コメント情報に従ってコメントが読み出されてユーザに提供されるように制御される。また、前記ユーザのコンテキストに応じて、前記コンテンツ又は前記コメントの提供が制御される。
本技術の概要を示した代表図である。 本技術を適用したコンテンツ提供システムの概要を示す図である。 本技術を適用したコンテンツ提供システムによるコンテンツ再生の流れを示す図である。 音楽を含む配信を行う場合の権利処理の例を示す図である。 VPC型配信を行う場合の権利処理の例を示す図である。 本技術を適用したコンテンツ提供システムの全体の構成の例を示す図である。 コンテンツ提供システムで用いられるスクリプトの例を示す図である。 本技術を適用したコンテンツ提供システムの一実施の形態の構成の例を示す図である。 ユーザ端末装置の構成の例を示す図である。 ユーザ端末装置における制御部の機能的構成の例を示す図である。 配信サーバの構成の例を示す図である。 配信サーバにおける制御部の機能的構成の例を示す図である。 コンテンツ提供システムの全体の処理の流れを示したシーケンス図である。 ユーザのコンテキストに応じた再生制御を行う場合の処理の流れを示したシーケンス図である。 ユーザコンテキストの例を示す図である。 第1の実施の形態における処理の全体像を説明するフローチャートである。 第1の実施の形態における処理の全体像を説明するフローチャートである。 第1の実施の形態における処理の全体像を説明するフローチャートである。 ユーザが仕事等の他の作業をしながら番組を聴いているときに音声をスキップする場合の処理の流れを示したシーケンス図である。 本技術を適用したコンテンツ提供システムの一実施の形態の他の構成の例を示す図である。 番組に挿入される広告の例を示す図である。 ユーザが楽曲に集中しているときに広告の挿入を禁止する場合の処理の流れを示したシーケンス図である。 第2の実施の形態における処理の全体像を説明するフローチャートである。 第2の実施の形態における処理の全体像を説明するフローチャートである。 ユーザのコンテキストに応じた字幕表示を行う場合の処理の流れを示したシーケンス図である。 前説と後説の字幕表示の例を示す図である。 第3の実施の形態における処理の全体像を説明するフローチャートである。 前説・後説先行型で新たなスクリプトを自動生成して再生する場合の処理の流れを示したシーケンス図である。 コンテンツ先行型で新たなスクリプトを自動生成して再生する場合の処理の流れを示したシーケンス図である。 第4の実施の形態における処理の全体像を説明するフローチャートである。 第4の実施の形態における処理の全体像を説明するフローチャートである。 第5の実施の形態における処理の全体像を説明するフローチャートである。
 以下、図面を参照しながら本技術の実施の形態について説明する。説明は以下の順序で行うものとする。
1.第1の実施の形態:ユーザコンテキストに応じた再生制御機能(基本の構成)
2.第2の実施の形態:ながら聴きや集中聴きに応じた再生制御機能
3.第3の実施の形態:ユーザコンテキストに応じた字幕制御機能
4.第4の実施の形態:新たなスクリプトの自動生成機能
5.第5の実施の形態:周囲のユーザ属性に応じた音声スキップ機能
6.変形例
7.コンピュータの構成
<代表図>
 図1は、本技術の概要を示した代表図である。
 本技術は、コンテンツを番組化するに際して、ユーザのコンテキストを利用して、コンテンツとともにそのコンテンツ等に関するコメントを提供することで、より適切に、コンテンツとコメントを提供するものである。
 図1において、DJは、自身が選曲した楽曲を楽曲配信サーバから配信するとともに、マイクを使ってその楽曲に関するコメントを発信している。一方で、ユーザは、楽曲配信サーバから配信される、DJが選曲した楽曲と発信しているコメントを聴いている。
 ここで、DJは、クリエイタにより作成された仮想的なものとされるが、例えば、ユーザが仕事中で忙しいときには、DJが選曲した楽曲(BGMなど)を、ユーザが既に契約している音楽配信サービスを利用してユーザに提供するが、DJがコメントを発信しないようにすることで、ユーザは、BGMなどの楽曲を聴きながら集中して仕事を行うことができる。
<1.第1の実施の形態>
(バーチャルポッドキャストシステムの概要)
 図2は、本技術を適用したコンテンツ提供システムの概要を示している。図2の例では、本技術を適用したコンテンツ提供システムの一実施の形態として、バーチャルポッドキャストシステムを例示している。
 バーチャルポッドキャストシステムは、クリエイタが自身の端末装置を操作して、楽曲を選んで文章を書くだけで、ポッドキャストの番組を作成することが可能なシステムである。ポッドキャストは、インターネット上で音声や動画のデータファイルを公開する手法の1つであり、インターネットラジオやインターネットテレビの一種である。なお、文章は、テキストに限らず、音声ファイルとして提供されても構わない。
 クリエイタにより作成されたポッドキャストの番組は、配信サーバに登録される。これにより、ユーザは、自身の端末装置を操作して、配信サーバから配信されるポッドキャストの番組を再生することで、その番組を視聴することができる。
 ところで、ポッドキャストの番組を配信するクリエイタからすれば、自身が作成したポッドキャストの番組を効率的に配信して、より多くのユーザに視聴してほしいと思うはずである。
 また、ポッドキャストで、楽曲を配信する場合には、楽曲の著作権処理が配信を行うクリエイタに対して発生するため、クリエイタからすればそのような作業は手間である。そのため、楽曲の著作権処理を、他の者に代行してほしいと思うはずである。
 近年、動画配信サイトでは、クリエイタが自身の動画配信チャンネルを開設して、様々なテーマの動画コンテンツを通じて情報発信が行われており、クリエイタは、動画コンテンツをユーザに提供する対価として、動画の再生回数に応じた広告収入や、広告主とのタイアップ動画の制作による広告収入などの対価を得ている。
 ポッドキャストの番組を配信するクリエイタにとっても、自身の作成したポッドキャストの番組に対する対価は極めて重要な関心事であり、適切な対価が還元されることを望んでいるはずである。
 以上のような番組化と、配信著作権処理と、収益化は、ポッドキャストの番組を配信するクリエイタにとっては、避けては通れない事項であり、これらの事項を容易に解決するための仕組みが求められている。バーチャルポッドキャストシステムでは、クリエイタがポッドキャストの番組を作成して配信して、そのポッドキャストの番組をユーザが視聴できるようにしつつ、クリエイタによる番組化と、配信著作権処理と、収益化の要望にも応えるための仕組みを提供する。
 図3は、バーチャルポッドキャストシステムにより生成されたポッドキャストの番組の再生の流れを示している。
 図3においては、ポッドキャストの番組に含まれるトラック(Track)のうち、時間的に連続したN番目とN+1番目のトラックを示している。
 各トラックは、前説(Warm-up)、楽曲(song)、及び後説(After-song)から構成される。
 前説は、楽曲を紹介する前説であって、テキスト(文章)からなる。この例では、前説として、「この曲が書かれたのは、・・・、そんな最高の一曲ですね!」であるテキストが記述されている。この前説に対応するテキストは、TTS(Text To Speech)により音声に変換して読み上げることが可能である。
 楽曲は、その楽曲を識別するための識別情報(id)と、その曲のタイトル(title)とアーティスト名(artist)に関する情報を含む。例えば、"1234567"である楽曲IDを用いることで、ユーザが契約している音楽配信サービスに対して、当該楽曲IDにより特定される楽曲のストリーミング配信を要求することができる。
 後説は、楽曲の視聴後の後説であって、テキスト(文章)からなる。この例では、後説として、「やっぱり最高ですね。・・・」であるテキストが記述されている。この後説に対応するテキストは、TTSを用いて読み上げることができる。
 ここで、ポッドキャストの番組の配信を行うに際し、番組に楽曲を含めるための権利処理としては、以下の2つのケースが想定される。
 第1に、楽曲を含む番組の配信を行うケースである。このケースでは、図4に示すように、クリエイタによって、楽曲としゃべり(前説と後説)を含む完パケとなるポッドキャストの番組が作成され、当該ポッドキャストの番組が配信されるため、楽曲の著作権処理が、配信を行うクリエイタに対して発生する。
 第2に、VPC型配信を行うケースである。このケースでは、図5に示すように、音楽配信サービスを利用して楽曲が配信され、クリエイタは、しゃべり(前説と後説)を作成して配信するだけであるため、楽曲の著作権処理が、クリエイタに対して発生しない。
 すなわち、クリエイタが、ポッドキャストの番組を配信するに際して、当該番組の構成に関する構成データと前説と後説が配信されるようにする。これにより、番組における楽曲の部分は、音楽配信サービスにより配信されることになるため、楽曲の著作権処理が、クリエイタに対しては発生しないことになる。
 VPC型配信では、音楽配信サービスによりストリーミング配信される楽曲と、クリエイタにより配信されるしゃべり(前説と後説)とは、ユーザが使用するユーザ端末装置で合成されて番組化されるため、ユーザ端末装置側で番組化されたポッドキャストの番組における楽曲の部分の権利処理は、ユーザによって行われる。
 このように、VPC型配信では、ポッドキャストの配信時に、クリエイタは、完パケのポッドキャストの番組を作らずに、楽曲の識別情報(楽曲ID)を配信することで、ユーザが使用するユーザ端末装置側で、当該楽曲IDに基づき、音楽配信サービスによりストリーミング配信される楽曲が再生されるようにしている。
 つまり、ユーザ端末装置では、当該ユーザが音楽配信サービスとの契約により既に獲得している権利を用いて楽曲が再生されるため、クリエイタに対して、楽曲の著作権処理は発生しない。一方で、ユーザにとっても、自身が契約している音楽配信サービスにおける通常の楽曲配信範囲内で楽曲を再生可能であるため、特に追加料金を支払ったりすることなく、クリエイタにより指示された楽曲IDにより特定される楽曲を再生することができる。バーチャルポッドキャストシステムでは、このVPC(Virtual Pod Cast)型配信によりポッドキャストの番組の配信が行われるようにする。
 なお、ユーザの音楽配信サービスとの契約は、有料のユーザ契約(プレミアムユーザ)は勿論、無料のユーザ契約(フリーユーザ)であっても、広告が挿入されるだけで、楽曲の再生を行うことができる場合には、その権利を利用することができる。
 図6は、バーチャルポッドキャストシステムの全体の構成の例を示している。
 図6に示すように、このバーチャルポッドキャストシステムにより提供される機能は、大別すると、クリエイタ端末装置により提供されるクリエイタ側の機能と、配信サーバにより提供される各種の配信サービス側の機能と、ユーザ端末装置により提供されるユーザ側の機能とに分けられる。
 クリエイタ端末装置では、クリエイタ(PodCaster)の操作に応じて、番組作成ツールと音声作成ツールが実行され、ポッドキャストの番組が生成される。
 例えば、番組作成ツールは、楽曲配信サービスから提供される選曲用の楽曲リスト(カタログ)から選択された楽曲の楽曲IDと、音声作成ツールにより音声合成時の音調整がなされた当該楽曲の前説と後説のテキストに基づき、ポッドキャストの番組を生成し、番組配信サービスに登録する。
 音声作成ツールは、音声配信サービスから提供される音声作成用のデータに基づき、TTSの音調整機能を提供する。クリエイタは、音声作成ツールを操作して、TTSの音調整機能を利用することで、ユーザ側で再生されるTTS音声を、自身の好みの音声とすることができる。
 番組配信サービスは、番組作成ツールにより登録されたポッドキャストの番組を、ユーザ端末装置に配信するサービスを提供する。
 楽曲配信サービスは、ユーザ端末装置を使用するユーザが契約(加入)している音楽配信サービスに相当する。楽曲配信サービスは、ユーザ端末装置からの要求に応じて、ポッドキャストの番組に設定された楽曲IDにより特定される楽曲を配信する。また、楽曲配信サービスは、選曲用の楽曲リストを、クリエイタ端末装置に提供する。
 音声配信サービスは、ポッドキャストの番組に設定された楽曲の前説と後説のテキストを音声合成して得られるTTS音声を、ユーザ端末装置に配信するサービスを提供する。また、音声配信サービスは、音声作成用のデータを、クリエイタ端末装置に提供する。
 ユーザ端末装置では、ユーザ(Listener)の操作に応じて、番組レンダラが実行され、ポッドキャストの番組が再生される。
 番組レンダラは、番組配信サービスにより公開されているポッドキャストの番組の中から所望の番組を再生するに際し、当該番組の構成に関する構成データ(再現データ)に基づき、楽曲配信サービスから配信される楽曲と、音声配信サービスから配信されるTTS音声のレンダリングを行う。
 これにより、ポッドキャストの番組が再生(再現)され、ユーザによって、視聴可能とされる。なお、ユーザ端末装置で実行される番組レンダラは、再生プレイヤであるとも言える。
 図7は、ポッドキャストの番組の構成を記述したスクリプトの例を示している。
 図7に示すように、バーチャルポッドキャストシステムでは、番組化される楽曲の楽曲IDと、その楽曲の前説と後説とがセットになって複数設定されることで、ポッドキャストの番組が構成されている。このポッドキャストの番組の構成は、図7に示したスクリプトにより記述される。
 図7において、スクリプトには、番組に関する情報として、冒頭に、番組のタイトルや所有者、公開日、楽曲の配信元となるサービス名などが記述される。
 スクリプトには、番組に関する情報に続いて、トラックに関する情報が記述される。図7では、N個のトラックのうち、1つ目のトラックの記述の例を示している。
 トラックには、対象のトラックの番号(Number)と、前説(Warm-up)と、楽曲(song)と、及び後説(After-song)に関する情報が記述される。
 楽曲(song)には、その楽曲を識別するための識別情報(id)と、その曲のタイトル(title)とアーティスト名(artist)に関する情報などが記述される。例えば、"1234567"である楽曲IDを記述することで、"serviceA"である音楽配信サービスに対し、当該楽曲IDにより特定される楽曲の配信を要求することができる。
 前説(Warm-up)と後説(After-song)には、その楽曲に関するコメントに対応するコメント情報が記述される。例えば、前説として、「この曲が書かれたのは、・・・、そんな最高の一曲ですね!」であるテキストを記述し、後説として、「やっぱり最高ですね。・・・」であるテキストを記述することで、TTSサービスを利用して、これらのテキストを音声に変換して読み上げることができる。
 図7においては、1つ目のトラックのみを記述、すなわち、1曲目の楽曲に関する情報の記述例を示したが、2曲目以降の楽曲についても、1曲目の楽曲と同様に、楽曲ごとに、楽曲IDと前説と後説をセットにして記述されるようにする。
 このように、楽曲の楽曲IDと、その楽曲に関する前説と後説からなるスクリプトが、クリエイタが使用するクリエイタ端末装置により生成され、番組配信サービスに登録されることで、ユーザに公開される。
 一方で、当該ユーザが使用するユーザ端末装置では、番組配信サービスにより公開されているスクリプトに従い、楽曲IDが示す楽曲が、当該ユーザが音楽配信サービスとの契約により既に獲得している権利を利用して、ストリーミング配信されるように制御するとともに、前説と後説のTTS音声が提供されるように制御する。
 換言すれば、スクリプトには、楽曲の楽曲IDと、前説と後説がテキストで記述されているだけで、ポッドキャストの番組で再生される楽曲や音声のデータそのものが含まれているわけではないが、ユーザ端末装置では、スクリプトに記述された楽曲IDと前説と後説が示す情報に基づき、楽曲や音声のデータが再生されることで、クリエイタが作成した番組が再現されている。
 また、既に存在するプレイリストの楽曲(の楽曲ID)に対し、前説と後説が付加されたスクリプトを生成することで、プレイリストを番組化することが可能であるため、ユーザは、楽曲の前説と後説を入力するだけで、簡単にプレイリストを番組化することができる。
(システムの構成)
 図8は、本技術を適用したコンテンツ提供システムの一実施の形態の構成の例として、バーチャルポッドキャストシステムの構成を示している。
 図8において、コンテンツ提供システム1は、クリエイタ端末装置10、ユーザ端末装置20、番組配信サーバ30A、楽曲配信サーバ30B、及び音声配信サーバ30Cから構成される。
 コンテンツ提供システム1において、クリエイタ端末装置10と、ユーザ端末装置20と、番組配信サーバ30A、楽曲配信サーバ30B、及び音声配信サーバ30Cとは、ネットワーク50を介して相互に接続されている。
 クリエイタ端末装置10は、スマートフォン、タブレット端末、パーソナルコンピュータなどの機器であり、クリエイタにより使用される。
 クリエイタ端末装置10は、クリエイタの操作に応じて、ポッドキャストの番組のスクリプトを生成し、ネットワーク50を介して番組配信サーバ30Aに送信(アップロード)する。
 ユーザ端末装置20は、スマートフォン、タブレット端末、音楽プレイヤ、ゲーム機、パーソナルコンピュータなどの機器であり、ユーザにより使用される。
 ユーザ端末装置20は、ユーザの操作に応じて、ネットワーク50を介して番組配信サーバ30Aにアクセスして、ポッドキャストの番組のスクリプトを受信(ダウンロード)する。
 番組配信サーバ30Aは、番組配信サービスを提供する1又は複数のサーバから構成される。番組配信サービスは、ポッドキャストの番組を配信するサービスであり、番組配信事業者により提供される。
 番組配信サーバ30Aは、ネットワーク50を介してクリエイタ端末装置10から送信(アップロード)される番組のスクリプトを受信し、ユーザ端末装置20を使用するユーザが閲覧可能に記憶媒体に登録する。
 番組配信サーバ30Aは、ネットワーク50を介してユーザ端末装置20から送信される番組の再生要求を受信した場合、当該番組のスクリプトを記憶媒体から読み出し、再生要求元のユーザ端末装置20に配信する。
 楽曲配信サーバ30Bは、音楽配信サービスを提供する1又は複数のサーバから構成される。音楽配信サービスは、インターネットを通じて楽曲を配信するサービスであり、音楽配信事業者により提供される。例えば、音楽配信サービスは、定額制のストリーミングの聴き放題の形式で提供される。
 楽曲配信サーバ30Bは、ネットワーク50を介してユーザ端末装置20から送信される楽曲の配信要求を受信した場合、受信した配信要求に応じた楽曲を特定し、当該楽曲のストリーミングデータを、配信要求元のユーザ端末装置20に配信する。
 音声配信サーバ30Cは、音声配信サービスを提供する1又は複数のサーバから構成される。音声配信サービスは、インターネットを通じてTTS音声や生声等の音声を配信するサービスであり、音声配信事業者により提供される。
 音声配信サーバ30Cは、ネットワーク50を介してユーザ端末装置20から送信される音声の配信要求を受信した場合、受信した配信要求に応じた音声を取得し、当該音声のデータを、配信要求元のユーザ端末装置20に配信する。
 なお、以下の説明では、番組配信サーバ30Aと、楽曲配信サーバ30Bと、音声配信サーバ30Cを特に区別する必要がない場合、配信サーバ30と称して説明する。また、番組配信事業者と、音楽配信事業者と、音声配信事業者は、同一の事業者であってもよいし、異なる事業者であってもよい。
 ネットワーク50は、インターネット、イントラネット、又は携帯電話網などの通信網を含んで構成され、TCP/IP(Transmission Control Protocol / Internet Protocol)等の通信プロトコルを用いた機器間の相互接続を可能にしている。
(ユーザ端末装置の構成)
 図9は、図8のユーザ端末装置20の構成の例を示している。
 図9に示すように、ユーザ端末装置20において、CPU(Central Processing Unit)201、ROM(Read Only Memory)202、及びRAM(Random Access Memory)203は、バス204により相互に接続される。
 CPU201は、ROM202や記憶部207に記録されたプログラムを実行することで、ユーザ端末装置20の各部の動作を制御する。RAM203には、各種のデータが適宜記憶される。
 バス204にはまた、入出力I/F210が接続される。入出力I/F210には、入力部205、出力部206、記憶部207、通信部208、及び近距離無線通信部209が接続される。
 入力部205は、各種の入力データを、入出力I/F210を介してCPU201を含む各部に供給する。例えば、入力部205は、操作部211、カメラ部212、及びセンサ部213を有する。
 操作部211は、ユーザによって操作され、その操作に対応する操作データをCPU201に供給する。操作部211は、物理的なボタンやタッチパネル等から構成される。
 カメラ部212は、そこに入射される被写体からの光を光電変換して、その結果得られる電気信号に対する信号処理を行うことで撮影画像データを生成し、出力する。カメラ部212は、イメージセンサや信号処理部等から構成される。
 センサ部213は、空間情報や時間情報等のセンシングを行い、そのセンシングの結果得られるセンサデータを出力する。
 センサ部213は、加速度センサやジャイロセンサなどを含む。加速度センサは、XYZ軸の3方向の加速度を測定する。ジャイロセンサは、XYZ軸の3軸の角速度を測定する。なお、慣性計測装置(IMU:Inertial Measurement Unit)を設けて、3方向の加速度計と3軸のジャイロスコープにより、3次元の加速度と角速度を測定してもよい。
 また、センサ部213には、ユーザの声などの音を検出する音センサ(マイクロフォン)、生物の持つ心拍数、体温、又は姿勢といった情報を測定する生体センサ、近接するものを測定する近接センサ、磁場(磁界)の大きさや方向を測定する磁気センサなどの各種のセンサを含めることができる。
 出力部206は、入出力I/F210を介してCPU201からの制御に従い、各種の情報を出力する。例えば、出力部206は、表示部221、及び音出力部222を有する。
 表示部221は、CPU201からの制御に従い、画像データに応じた画像等を表示する。表示部221、液晶パネルやOLED(Organic Light Emitting Diode)パネル等のパネル部と信号処理部などから構成される。
 音出力部222は、CPU201からの制御に従い、音データに応じた音を出力する。音出力部222は、スピーカや出力端子に接続されるヘッドホンなどから構成される。
 記憶部207は、CPU201からの制御に従い、各種のデータやプログラムを記録する。CPU201は、記憶部207から各種のデータを読み出して処理したり、プログラムを実行したりする。
 記憶部207は、半導体メモリ等の補助記憶装置として構成される。記憶部207は、内部ストレージとして構成されてもよいし、メモリカード等の外部ストレージであってもよい。
 通信部208は、CPU201からの制御に従い、ネットワーク50を介して他の機器と通信を行う。通信部208は、セルラー方式の通信(例えばLTE-Advancedや5G等)や、無線LAN(Local Area Network)などの無線通信、又は有線通信に対応した通信モジュールとして構成される。
 近距離無線通信部209は、Bluetooth(登録商標)やNFC(Near Field Communication)等の近距離無線通信規格による無線通信を行い、各種のデータをやりとりする。
 なお、図9に示したユーザ端末装置20の構成は一例であって、例えば、入力部としてマイクロフォンを設けたり、GPU(Graphics Processing Unit)等の画像処理回路や、電源回路などを設けたりしても構わない。
 図10は、ユーザ端末装置20における制御部200の機能的構成の例を示している。制御部200の機能は、CPU201によって、番組レンダラ等のプログラムが実行されることで実現される。
 図10において、制御部200は、番組取得部251、楽曲取得部252、音声取得部253、レンダラ部254、提示制御部255、センサデータ取得部256、及びコンテキスト分析部257を有する。
 番組取得部251は、番組配信サーバ30Aと通信を行う通信部208から供給される、ユーザの操作に応じたポッドキャストの番組のスクリプトを取得し、レンダラ部254に供給する。
 楽曲取得部252は、楽曲配信サーバ30Bと通信を行う通信部208から供給される、楽曲IDに応じた楽曲のストリーミングデータを取得し、レンダラ部254に供給する。
 音声取得部253は、音声配信サーバ30Cと通信を行う通信部208から供給される、前説と後説に応じた音声データを取得し、レンダラ部254に供給する。
 レンダラ部254は、番組取得部251から供給される番組のスクリプトに基づいて、音声取得部253から供給される前説の音声データと、楽曲取得部252から供給される楽曲のストリーミングデータと、音声取得部253から供給される後説の音声データに対するレンダリング処理を行い、その結果得られるデータを、提示制御部255に供給する。
 提示制御部255は、レンダラ部254から供給されるデータを、出力部206に供給することで、ユーザに対して番組を提示する。
 例えば、提示制御部255は、前説の音声データと、楽曲のストリーミングデータと、後説の音声データを、音出力部222に供給することで、番組化された楽曲の音とともに、当該番組に設定された前説と後説の音を、当該楽曲の前後に出力して提示することができる。
 センサデータ取得部256は、センサ部213から供給されるセンサデータを取得し、コンテキスト分析部257に供給する。
 コンテキスト分析部257は、センサデータ取得部256から供給されるセンサデータに基づいて、ユーザのコンテキストの分析を行い、その分析結果を、レンダラ部254に供給する。レンダラ部254では、コンテキスト分析部257からの分析結果に基づき、ユーザコンテキストに応じた再生制御処理が行われる。
(配信サーバの構成)
 図11は、図8の配信サーバ30の構成の例を示している。なお、配信サーバ30は、図8に示した番組配信サーバ30A、楽曲配信サーバ30B、及び音声配信サーバ30Cのいずれかのサーバに相当するものである。
 配信サーバ30において、CPU301、ROM302、RAM303は、バス304により相互に接続されている。バス304には、さらに、入出力I/F310が接続されている。入出力I/F310には、入力部305、出力部306、記憶部307、通信部308、及びドライブ309が接続されている。
 入力部305は、マイクロフォン、キーボード、マウスなどから構成される。出力部306は、スピーカ、ディスプレイなどから構成される。
 記憶部307は、HDD(Hard Disk Drive)や半導体メモリなどから構成される。通信部308は、無線LAN等の無線通信、又はイーサーネット(登録商標)等の有線通信に対応した通信モジュールとして構成される。
 ドライブ309は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブル記録媒体311を駆動する。
 図12は、配信サーバ30における制御部300の機能的構成の例を示している。制御部300の機能は、CPU301によって、各サービスのプログラムが実行されることで実現される。
 図12において、制御部300は、要求受付・応答部351、配信処理部352、及びデータベース353を有する。
 要求受付・応答部351は、クリエイタ端末装置10又はユーザ端末装置20と通信を行う通信部308から供給される各種の要求を受け付け、配信処理部352に供給する。
 配信処理部352は、要求受付・応答部351から供給される各種の要求に応じた配信処理を行う。
 データベース353は、HDDや半導体メモリ等の大容量のストレージからなる記憶部307に記録される。
 例えば、番組配信サーバ30Aのデータベース353には、ポッドキャストの番組のスクリプト等が格納される。また、楽曲配信サーバ30Bのデータベース353には、音楽配信サービスにより提供される楽曲が楽曲IDに対応付けて格納される。さらに、音声配信サーバ30Cのデータベース353には、音声合成時や音声作成時の音声に関する情報、前説や後説の音声データ等が格納される。
 配信処理部352は、配信処理を行うに際し、データベース353に格納された各種のデータを処理して、各種の要求に応じた応答を生成し、要求受付・応答部351に供給する。
 要求受付・応答部351は、通信部308を制御して、配信処理部352から供給される各種の要求に応じた応答を、ネットワーク50を介して要求元のクリエイタ端末装置10又はユーザ端末装置20に送信する。
 次に、コンテンツ提供システム1の各装置で実行される処理の流れを説明する。
(全体の処理の流れ)
 図13は、コンテンツ提供システム1の全体の処理の流れを示したシーケンス図である。
 図13において、番組作成ツールは、クリエイタ端末装置10により実行され、番組レンダラは、ユーザ端末装置20により実行される。また、図13において、番組配信サービスは、番組配信サーバ30Aにより提供され、音楽配信サービスは、楽曲配信サーバ30Bにより提供され、TTSサービスは、音声配信サーバ30Cにより提供される。
 クリエイタ端末装置10では、制御部100により番組作成ツールが実行され、ステップS11乃至S14の処理が実行される。
 番組作成ツールは、楽曲リストを楽曲配信サーバ30Bに要求することで、楽曲配信サーバ30Bから送信されてくる楽曲リストを取得し、クリエイタに提示する(S11,S12)。
 番組作成ツールは、クリエイタにより楽曲リストから選択された楽曲の楽曲IDと、クリエイタにより入力された当該楽曲の前説と後説のテキストに基づき、ポッドキャストの番組のスクリプトを生成し(S13)、番組配信サーバ30Aに登録する(S14)。
 これにより、番組配信サーバ30Aでは、クリエイタにより作成されたポッドキャストの番組のスクリプトがデータベース353に格納され、ユーザ端末装置20を使用するユーザによって閲覧可能とされる。
 ユーザ端末装置20では、制御部200により番組レンダラが実行されるとともに、当該番組レンダラが、各配信サーバ30と協働して動作することで、ステップS15乃至S26の処理が実行される。
 番組レンダラでは、ユーザの操作によって、番組配信サーバ30A上で閲覧可能に公開されているポッドキャストの番組の再生が指示された場合、番組配信サーバ30Aから配信される当該番組のスクリプトが受信される(S15,S16)。
 番組レンダラは、受信したスクリプトの冒頭に設定される前説に基づき、音声配信サーバ30Cに対し、当該前説のテキストの音声合成を要求する(S17)。
 音声配信サーバ30Cでは、番組レンダラからの要求に応じて、前説のテキストの音声合成が行われ(S18)、その音声合成の結果が配信される(S19)。
 これにより、番組レンダラでは、音声配信サーバ30Cから配信される音声合成の結果が受信され、レンダリング処理が行われることで、番組化された楽曲に設定された前説の部分のTTS音声が再生される。
 次に、番組レンダラは、受信したスクリプトの前説の次に設定される楽曲IDに基づき、ユーザが契約している音楽配信サービスを提供する楽曲配信サーバ30Bに、当該楽曲IDにより特定される楽曲の配信を要求する(S20)。
 楽曲配信サーバ30Bでは、番組レンダラからの要求に応じて、ユーザによる音楽配信サービスとの契約により獲得している権利が確認され(S21)、当該ユーザが正当な権利を有し、楽曲IDにより特定される楽曲の再生が可能であると判定した場合、当該楽曲のストリーミング配信が行われる(S22)。
 これにより、番組レンダラでは、楽曲配信サーバ30Bから配信される楽曲のストリーミングデータが受信され、レンダリング処理が行われることで、楽曲IDにより特定される楽曲が、番組化された楽曲として再生される。
 その後、ストリーミング配信される楽曲の再生が完了すると、番組レンダラが、受信したスクリプトの楽曲IDの次に設定される後説に基づき、音声配信サーバ30Cに、当該後説のテキストの音声合成を要求する(S23)。
 音声配信サーバ30Cでは、番組レンダラからの要求に応じて、後説のテキストの音声合成が行われ(S24)、その音声合成の結果が配信される(S25)。
 これにより、番組レンダラでは、音声配信サーバ30Cから配信される音声合成の結果が受信され、レンダリング処理が行われることで、番組化された楽曲に設定された後説の部分のTTS音声が再生される。
 また、ポッドキャストの番組のスクリプトには、複数の楽曲ごとの楽曲IDがその楽曲の前説と後説のテキストとともに番組化されているため、ステップS17乃至S25の処理が完了した後に、処理は、ステップS17の処理に戻り(S26)、楽曲IDの数に応じてステップS17乃至S26の処理が繰り返される。
 これにより、番組レンダラでは、番組のスクリプトに設定された楽曲IDごとに、前説、楽曲、後説の順に再生が繰り返して行われ、ユーザによって、ポッドキャストの番組が視聴可能とされる。
 以上、全体の処理の流れを説明した。
(コンテキストに応じた再生制御の流れ)
 図14は、ユーザのコンテキストに応じた再生制御を行う場合の処理の流れを示したシーケンス図である。
 図14において、番組レンダラでは、ポッドキャストの番組の再生に先立って、ユーザのコンテキストが認識される(S41)。ユーザコンテキストは、コンテキスト分析部257によりセンサデータが分析されることで得られる。
 図15は、ユーザコンテキストの例を示している。
 図15に示すように、ユーザの行動の種類として、「静止している」、「一時停止している」、「歩行している」、「走行している」、「跳躍している」、「座っている」、「立っている」、「エレベータで上昇している」、「エレベータで下降している」、及び「電車に乗っている」等の状態は、加速度センサからのセンサデータを分析することで、特定することができる。
 また、ユーザの行動の種類として、「右折している」、及び「左折している」等の状態は、加速度センサとジャイロセンサからのセンサデータを分析することで、特定することができる。
 また、図15において、排他関係が共にAで表される状態である「静止している」と「一時停止している」は、排他関係にある。すなわち、これらの行動は同時に起こりえない。また、排他関係が共にBで表される状態である「歩行している」と、「走行している」と、「跳躍している」は、同時に行動が起こることはない。
 さらに、排他関係が共にCで表される状態である「座っている」と「立っている」は、同時に行動が起こることはない。排他関係が共にDで表される状態である「エレベータで上昇している」と、「エレベータで下降している」と、「電車に乗っている」は、同時に行動が起こることはない。排他関係が共にEで表される状態である「右折している」と「左折している」は、同時に行動が起こることはない。
 また、ユーザコンテキストの検出方法としては、例えば、スケジューラを利用してユーザが仕事中であるかどうかを検出したり、生体センサから得られるセンサデータを用いてユーザの集中度を検出したり、ユーザの顔を含む画像データを分析して顔の表情を検出したり、環境センサから得られるセンサデータを用いて、季節や気温、天気などを検出したり、振動センサから得られるセンサデータを用いてユーザの行動を認識したりしてもよい。
 図14の説明に戻り、番組レンダラでは、ユーザの操作によって、番組配信サーバ30A上で閲覧可能に公開されているポッドキャストの番組の再生が指示された場合、当該番組の再生が行われる(S15乃至S26)が、ここでは、ユーザコンテキストに応じた再生制御が行われる(S42)。
 すなわち、番組レンダラは、番組のスクリプトに基づき、楽曲配信サーバ60Bと音声配信サーバ60Cにアクセスして、楽曲IDにより特定される楽曲ごとに、前説、楽曲、後説の順の再生を繰り返すに際して、認識済みのユーザコンテキストを用い、ユーザにとってより適切な再生が行われるようにする。
 例えば、仕事に集中していたり、楽曲を聴くことに集中していたりするユーザを邪魔しないように、ユーザコンテキストに基づき、より適切な再生制御が行われるようにする。
(処理の全体像)
 図16乃至図18は、第1の実施の形態における処理の全体像を説明するフローチャートである。
 図16乃至図18に示した処理は、本技術を適用したコンテンツ提供システムにおけるクリエイタ端末装置10(の制御部100)と、ユーザ端末装置20(の制御部200)と、配信サーバ30(の制御部300)とが協働して動作することで実現される。
 すなわち、この処理は、制御部100、制御部200、及び制御部300のうち、少なくともいずれか1つの制御部により実行される。
 コンテンツ提供システム1では、図16に示すように、クリエイタ端末装置10を使用するクリエイタからの入力があった場合(S111の「Yes」)、その入力に基づき、コンテンツの識別情報と、そのコンテンツのコメントに対応するコメント情報からなるスクリプトが生成され(S112)、そのスクリプトが、ユーザ端末装置20を使用するユーザに閲覧可能に所定の記憶媒体に格納される(S113)。
 ここで、コンテンツは、音楽配信サービスで配信される楽曲などを含み、そのコンテンツの識別情報は、楽曲を識別可能な楽曲IDなどを含む。また、コメントは、例えば、楽曲に設定される前説と後説であり、前説と後説のうち、少なくともいずれか一方が設定されていればよい。例えば、楽曲を番組化するに際して、楽曲単位で前説又は後説を挿入するほか、前説としてナレーション等を挿入してから、3曲連続で楽曲を再生したり、4曲連続で楽曲を再生した後に、後説として曲の感想等を挿入したりしてもよい。
 コメント情報は、コメントを表すテキスト、又はクリエイタ等の生声へのリンク情報などを含む。なお、コメント情報は、コンテンツに関するコメントに対応するものとして説明するが、必ずしもコンテンツに関連するものとは限らず、コンテンツに関係しないコメントに対応するものでも構わない。所定の記憶媒体は、例えば、番組配信サーバ30Aの記憶部307(のデータベース353)とすることができる。
 また、コンテンツ提供システム1では、図17に示すように、ユーザのコンテキストが取得され(S131)、ユーザによって、所定の記憶媒体に格納されたスクリプトへの再生要求がなされた場合(S132の「Yes」)、ユーザコンテキストに応じた再生制御処理が行われる(S133)。
 ユーザコンテキストに応じた再生制御処理では、図18に示したように、ユーザのコンテキストに応じて、スクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しが、ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行され、ユーザに提供するように制御される(S151)。
 ここで、コンテンツ識別情報は、楽曲を識別可能な楽曲IDなどを含む。また、例えば、特定のサービスは、音楽配信サービスであり、ユーザが既に獲得している権利は、有料のプレミアムユーザや、無料のフリーユーザの権利などを含む。
 また、ユーザコンテキストに応じた再生制御処理では、図18に示すように、ユーザのコンテキストに応じて、スクリプトに含まれるコメント情報に従ってコメントが読み出され、ユーザに提供するように制御される(S152)。
 ここで、コメントは、前説及び後説の少なくとも一方を含み、スクリプトのコメント情報に従って読み出される前説と後説には、TTS音声又は生声などの音声を含む。
 以上のように、コンテンツを番組化するに際して、ユーザのコンテキストを利用して、コンテンツとそのコンテンツ等に関するコメントを提供することで、より適切に、コンテンツとコメントを提供することができる。
<2.第2の実施の形態>
 ユーザコンテキストに応じた再生の制御方法としては、ユーザが仕事等の他の作業をしながら番組を聴いているときに音声をスキップしたり、ユーザが楽曲に集中しているときに広告の挿入を禁止したりする方法がある。楽曲に集中しているユーザの邪魔をしないためだけでなく、ユーザが楽曲に集中しているときには広告を挿入したとしてもその効果が薄いために、このような制御を行っている。
(ながら聴きに応じた再生制御の流れ)
 図19は、ユーザが仕事等の他の作業をしながら番組を聴いているときに音声をスキップする場合の処理の流れを示したシーケンス図である。
 図19において、番組レンダラでは、ポッドキャストの番組の再生に先立って、コンテキスト分析部257からの分析結果に基づき、ユーザが一点に集中し、コンテンツ(楽曲)の視聴以外に集中していることを示すユーザコンテキストが認識されている(S51)。
 例えば、この集中度のセンシング法としては、センサ部213からのセンサデータに基づき、ユーザの呼吸、心拍、脳波や皮膚電位の変動などを用いることで、ユーザの集中度合いを推定することができる。
 番組レンダラでは、ユーザの操作によって、番組配信サーバ30A上で閲覧可能に公開されているポッドキャストの番組の再生が指示された場合、当該番組の再生が行われる(S15乃至S26)が、ここでは、ユーザコンテキストに応じた再生制御が行われる(S52,S53)。
 すなわち、番組レンダラは、ユーザコンテキストとして、ユーザが一点に集中して楽曲の視聴以外に集中していることを認識しているため、再生対象の番組のスクリプトに基づき、楽曲IDにより特定される楽曲ごとに、前説、楽曲、後説の順の再生を繰り返すに際して、前説と後説の再生をスキップして(S52,S53)、楽曲の再生のみが行われるようにする。
 このように、ユーザが仕事等の他の作業に集中しながら番組を聴いている場合には、前説や後説によりユーザの集中を妨げてしまう恐れがあるため、前説や後説の再生をスキップしてより適切な再生制御が行われるようにしている。
 なお、上述した説明では、前説や後説の再生をスキップする制御を説明したが、例えば、番組(特に前説や後説の音声)の音量を下げたり、環境音のノイズをキャンセルしたりしてもよい。要は、仕事等の他の作業に集中しているユーザを邪魔しないように、番組の再生の制御が行われればよいのであって、その制御方法は任意である。
(システムの他の構成)
 図20は、本技術を適用したコンテンツ提供システムの一実施の形態の他の構成の例を示している。
 図20においては、図8と同様に、コンテンツ提供システム1が、クリエイタ端末装置10、ユーザ端末装置20、番組配信サーバ30A、楽曲配信サーバ30B、及び音声配信サーバ30Cを含んでいるが、広告配信サーバ30Dがさらに設けられている。
 広告配信サーバ30Dは、広告配信サービスを提供する1又は複数のサーバから構成される。広告配信サービスは、インターネットを通じて広告を配信するサービスであり、例えば、広告配信事業者により提供される。
 例えば、広告配信サーバ30Dは、番組配信サーバ30Aからの要求に応じて、広告管理用や広告用のデータベース353で管理している広告を特定し、特定した広告(広告本文)を配信する。
 なお、広告配信サーバ30Dは、図11と図12に示した配信サーバ30の構成と制御部300の機能的構成と同様の構成を有している。
(広告の例)
 図21は、ポッドキャストの番組のスクリプトに挿入される広告の例を示している。
 上述したように、ポッドキャストの番組のスクリプトには、番組化される楽曲(song)と、その楽曲の前説(Warm-up)と後説(After-song)とがセットになって記述されるが、図21では、後説の後に、広告が挿入されている。
 例えば、前説に、「・・・、今でも夏に聞きたくなる、・・・」であるテキストが含まれ、後説に、「・・・暑い夏が本当に楽しくなる曲ですね!」であるテキストが含まれている場合、これらのテキストが分析される。そして、これらのテキストの分析結果に応じて、「夏」であるキーワードに関する広告として、「夏の暑い日には、やっぱりビール。のど越し爽やかX社のドライ!」であるテキストからなるビールの広告が、スクリプトに挿入される。
 なお、図21の例では、後説の後に広告を挿入した場合を示したが、広告は、任意の場所に挿入することができ、特に、楽曲との関係から、広告を、前説の前、又は後説の後に挿入するのが好適である。
(集中聴きに応じた再生制御の流れ)
 図22は、ユーザが楽曲に集中しているときに広告の挿入を禁止する場合の処理の流れを示したシーケンス図である。
 図22において、番組レンダラでは、ポッドキャストの番組の再生に先立って、コンテキスト分析部257からの分析結果に基づき、ユーザがリズムを刻んでいるなど、コンテンツ(楽曲)の視聴に集中していることを示すユーザコンテキストが認識されている(S61)。
 番組配信サーバ30Aでは、ユーザにより操作される番組レンダラによって、閲覧可能に公開されているポッドキャストの番組の再生が指示された場合、当該番組のスクリプトが分析されて番組に広告が挿入される(S15,S62A乃至S62F)が、ここでは、ユーザコンテキストに応じた広告挿入が行われる(S62)。
 すなわち、番組配信サーバ30Aは、番組レンダラからの再生要求に、ユーザコンテキストに応じた広告禁止フラグが含まれているため、当該広告禁止フラグに従い、広告配信サーバ30D等に対する広告要求をスキップする(S62)。
 番組配信サーバ30Aは、番組レンダラから再生が指示されたポッドキャストの番組のスクリプトを配信する(S16)。このスクリプトは、ユーザコンテキストに応じた広告禁止フラグに従い、広告が未挿入とされる。
 番組レンダラでは、番組配信サーバ30Aから配信される番組のスクリプトが受信され、当該番組の再生が行われる(S17乃至S26)が、ユーザコンテキストに応じた再生制御が行われる(S63)。
 すなわち、番組レンダラは、ユーザコンテキストとして、ユーザが楽曲の視聴に集中していることを認識し、番組配信サーバ30Aに対して広告禁止フラグを通知しているため、広告が未挿入となる番組のスクリプトに基づき、楽曲IDにより特定される楽曲ごとに、前説、楽曲、後説の順の再生を繰り返すに際して、広告の再生がステップされて(S63A乃至S63C)、番組の再生が行われる。
 このように、ユーザが番組(特に楽曲)の視聴に集中している場合には、広告によりユーザの集中を妨げてしまう恐れがあるため、広告の再生をスキップして、より適切な再生制御が行われるようにしている。
 なお、上述したポッドキャストの番組を、ユーザが自分の利益を得る目的で利用(商用利用)する場合に、ユーザが一定額の利用料金を支払うことで、広告をオフできるようにしてもよい。
 また、上述した説明では、ユーザが番組の視聴に集中している場合に、番組配信サーバ30Aから、広告が未挿入となる番組のスクリプトが配信されるようにしたが、広告が挿入された番組のスクリプトを配信して、番組レンダラが、ユーザコンテキストに応じて、当該スクリプトに挿入された広告を提示しないように制御しても構わない(S63)。要は、番組(特に楽曲)に集中しているユーザを邪魔しないように、広告の再生が禁止されればよいのであって、その制御方法は任意である。
(処理の全体像)
 図23と図24は、第2の実施の形態における処理の全体像を説明するフローチャートである。
 図23と図24に示した処理は、本技術を適用したコンテンツ提供システムにおけるユーザ端末装置20(の制御部200)と、配信サーバ30(の制御部300)とが協働して動作することで実現される。なお、図23と図24に示した処理は、図17に示したユーザコンテキストに応じた再生制御処理(S133)に対応する処理とされる。
 コンテンツ提供システム1では、図23に示すように、ユーザがコンテンツ視聴に集中していない場合(S211の「No」)、コンテンツのコメントがユーザに提供されないように制御される(S212)。
 すなわち、例えば、ユーザが仕事に集中している場合など、楽曲の視聴以外の他の作業に集中している場合には、他の作業に集中しているユーザの邪魔をしないように、前説や後説の再生をスキップする制御が行われる。
 また、コンテンツ提供システム1では、図24に示すように、ユーザがコンテンツ視聴に集中している場合(S231の「Yes」)、広告がユーザに提供されないように制御する(S232)。
 すなわち、例えば、ユーザがリズムを刻んでいる場合など、楽曲の視聴に集中している場合には、楽曲の視聴に集中しているユーザの邪魔をしないように、広告の再生をスキップする制御が行われる。
 なお、上述した説明では、楽曲の視聴以外の他の作業にユーザが集中している場合や、番組(特に楽曲)にユーザが集中している場合には、前説、後説、広告が再生されないように制御する方法を示したが、例えば、再生される広告の種類を、「文章を読み上げるタイプの広告」から、「音楽そのものからなる広告」に変更するように制御してもよい。
<3.第3の実施の形態>
 ユーザコンテキストに応じた再生の制御方法としては、前説と後説のテキストを字幕表示する方法がある。
 例えば、ユーザの操作によって、番組化された楽曲に設定された前説や後説をスキップする旨の指示があったとき、ユーザがプレイリストとしての視聴を希望していることを推定し、前説と後説をテキストで字幕表示する。
(字幕表示制御の流れ)
 図25は、ユーザのコンテキストに応じた字幕表示を行う場合の処理の流れを示したシーケンス図である。
 図25において、番組レンダラでは、ポッドキャストの番組の再生に先立って、コンテキスト分析部257からの分析結果に基づき、前説のスキップの指示により、ユーザがプレイリストでの視聴を希望していることを示すユーザコンテキストが認識されている(S71)。
 これにより、番組レンダラは、前説と後説の出力モードとして、前説と後説を、音声で出力する音声出力モードから、字幕で表示するテキスト表示モードに移行する。
 番組レンダラでは、ユーザの操作によって、番組配信サーバ30A上で閲覧可能に公開されているポッドキャストの番組の再生が指示された場合、当該番組の再生が行われる(S15乃至S26)が、ここでは、ユーザコンテキストに応じた再生制御が行われる(S72,S73)。
 すなわち、番組レンダラは、前説と後説の出力モードがテキスト表示モードとなるため、再生対象の番組のスクリプトに基づき、楽曲IDにより特定される楽曲ごとに、前説、楽曲、後説の順の再生を繰り返すに際して、前説と後説がテキストにより字幕表示されるように制御する(S72,S73)。
 図26は、ユーザ端末装置20の表示部221に表示される前説と後説の字幕表示の例を示している。
 図26のAに示すように、例えば、再生対象の番組や楽曲に関する情報(例えば、再生対象の楽曲のジャケットの画像等)を含む画面510の上部の領域511に、字幕化された前説のテキストを重畳表示することができる。
 図26のBに示すように、例えば、再生対象の番組や楽曲に関する情報を含む画面510の下部の領域512に、字幕化された後説のテキストを重畳表示することができる。
 画面510の領域511と領域512に表示される前説と後説は、固定で表示されてもよいし、画面の右から左の方向などの所定の方向に流れるようにしてもよい。また、例えば同一の楽曲に対して複数のクリエイタがコメントを入力している場合などに、ある楽曲に複数の前説と後説が設定されているときには、それらのコメントの全てをテキスト化して同時に表示させてもよいし、それらのテキストを、画面の右から左の方向などの所定の方向に流してもよい。
 このように、ユーザが前説や後説のスキップを指示した場合には、前説や後説の音声出力を煩わしいと感じている恐れがあるため、前説や後説をテキストにより字幕表示して、より適切な再生制御が行われるようにしている。
 なお、番組レンダラは、ユーザの国籍を認識して、当該ユーザの母国語に合わせて、前説と後説を翻訳し、そのテキストを字幕表示するようにしてもよい。
(処理の全体像)
 図27は、第3の実施の形態における処理の全体像を説明するフローチャートである。
 図27に示した処理は、本技術を適用したコンテンツ提供システムにおけるユーザ端末装置20(の制御部200)と、配信サーバ30(の制御部300)とが協働して動作することで実現される。なお、図27に示した処理は、図17に示したユーザコンテキストに応じた再生制御処理(S133)に対応する処理とされる。
 コンテンツ提供システム1では、図27に示すように、ユーザによりコメントの音声による提供をスキップする指示が検知された場合(S311の「Yes」)、コメントをテキストとして表示するように制御される(S312)。
 すなわち、例えば、ユーザが前説又は後説の音声をスキップする指示を行った場合、前説又は後説の音声を煩わしいと感じている可能性が高いので、ユーザの邪魔にならないように、前説と後説のテキストを字幕表示する制御が行われる。
<4.第4の実施の形態>
 ユーザコンテキストに応じた再生の制御方法としては、ユーザのコンテキスト、嗜好、周囲の環境などに応じて、新たなスクリプトをリアルタイムで生成して再生する方法がある。
 ここで、新たなスクリプトを生成して再生する方法には、前説・後説先行型と、コンテンツ先行型の2つのタイプがある。
 前説・後説先行型は、ユーザの状況や周囲の環境に応じて、番組配信サーバ30Aに登録されている前説や後説を自動選択することにより、新たなスクリプトを自動生成する方法である。
 コンテンツ先行型は、ユーザのコンテキストに応じて生成されたプレイリストに対応するコンテンツをキーにして、番組配信サーバ30Aに登録されている前説や後説(例えば、人気のある前説や後説)を特定して、新たなスクリプトを自動生成する方法である。
(前説・後説先行型の制御の流れ)
 図28は、前説・後説先行型で新たなスクリプトを自動生成して再生する場合の処理の流れを示したシーケンス図である。
 図28において、番組レンダラでは、ポッドキャストの番組の再生に先立って、コンテキスト分析部257からの分析結果に基づき、ユーザのコンテキストが認識される(S81)。
 番組レンダラでは、ユーザの操作によって、番組配信サーバ30A上で閲覧可能に公開されているポッドキャストの番組の再生が指示された場合、当該番組の再生が行われる(S15乃至S26)が、ここでは、ユーザコンテキストに応じた再生制御が行われる(S82)。
 すなわち、番組配信サーバ30Aは、番組レンダラからの再生要求に、ユーザコンテキストに応じた前説と後説の検索キーが含まれているため、当該検索キーを用い、登録済みの番組の前説と後説を検索して自動選択し、新たなスクリプトを自動生成して配信する(S82,S16)。
 例えば、季節が冬である場合には、楽曲に設定された前説又は後説で、「冬にはぴったりだと思うんだよね」など、冬に関わる単語が入っているものをベースに、自動的に番組のスクリプトを生成することができる。また、例えば、季節が夏である場合には、「海」、「プール」、「冷やし中華」、「すいか」など、楽曲に設定された前説又は後説で、夏に関する単語が入っているものを選択してもよい。
 なお、番組化する楽曲の曲順は、例えば、単語とのマッチング度の順序とすることができる。また、番組レンダラ側で、前説と後説の文脈を考慮して、楽曲の再生順序を規定してもよい。
 番組レンダラでは、番組配信サーバ30Aから配信される番組のスクリプトが受信され、当該番組の再生が行われる(S17乃至S26)。
 すなわち、番組レンダラでは、新たに自動生成されたスクリプトに基づき、楽曲配信サーバ60Bと音声配信サーバ60Cにアクセスすることで、楽曲IDにより特定される楽曲ごとに、前説、楽曲、後説の順の再生が繰り返される。
(コンテンツ先行型の制御の流れ)
 図29は、コンテンツ先行型で新たなスクリプトを自動生成して再生する場合の処理の流れを示したシーケンス図である。
 図29において、番組レンダラでは、ポッドキャストの番組の再生に先立って、コンテキスト分析部257からの分析結果に基づき、ユーザのコンテキストが認識される(S91)。
 番組レンダラでは、ユーザの操作によって、番組配信サーバ30A上で閲覧可能に公開されているポッドキャストの番組の再生が指示された場合、当該番組の再生が行われる(S15乃至S26)が、ここでは、ユーザコンテキストに応じた再生制御が行われる(S92)。
 すなわち、番組配信サーバ30Aは、番組レンダラからの再生要求に、ユーザコンテキストに応じたコンテンツの検索キーが含まれているため、当該検索キーを用い、登録済みの番組の前説と後説(例えば、人気のある前説や後説)を特定し、新たなスクリプトを自動生成して配信する(S92,S16)。
 例えば、季節が夏である場合には、楽曲のタイトルに、「夏」だけでなく、「海」、「プール」、「冷やし中華」、「すいか」など、夏に関連する単語が入っている楽曲を検索し、その楽曲の中で人気のある前説と後説を特定して取得し、自動的に番組のスクリプトを生成することができる。また、例えば、ユーザが運動しているときに、その身体の振動に同期するような楽曲を特定し、その楽曲の中で人気のある前説と後説を特定して取得し、自動的に番組のスクリプトを生成してもよい。
 なお、番組化する楽曲の曲順は、例えば、振動の同期のマッチング度の順序とすることができる。また、番組レンダラ側で、前説と後説の文脈を考慮して、楽曲の再生順序を規定してもよい。
 また、上述したコンテンツ先行型では、ユーザのコンテキストに応じてプレイリストを生成しているが、それだけでなく、楽曲の今日/今週/今月/今年のリスニングランキング、いいね(Like)の数ランキング、県別/国別/アジア等のエリア別ランキングなど、あらゆるランキング情報を加味して、プレイリストを生成するようにしても構わない。
(処理の全体像)
 図30と図31は、第4の実施の形態における処理の全体像を説明するフローチャートである。
 図30と図31に示した処理は、本技術を適用したコンテンツ提供システムにおけるユーザ端末装置20(の制御部200)と、配信サーバ30(の制御部300)とが協働して動作することで実現される。なお、図30と図31に示した処理は、図17に示したユーザコンテキストに応じた再生制御処理(S133)に対応する処理とされる。
 コンテンツ提供システム1では、図30に示したように、ユーザのコンテキストに応じて、所定の記憶媒体に格納されているスクリプトに含まれるコメントが自動選択され(S411)、自動選択されたコメントに基づき、新たなスクリプトが自動生成され(S412)、自動生成されたスクリプトが再生される(S413)。
 すなわち、前説・後説先行型の制御によって、ユーザのコンテキストに応じて、番組配信サーバ30Aに登録(アップロード)されている番組のスクリプトに含まれる前説や後説が自動選択され、この自動選択された前説や後説に基づき、新たなスクリプトが自動生成される。
 また、コンテンツ提供システム1では、図31に示したように、ユーザのコンテキストに応じて、パッケージが、所定の記憶媒体に格納されているスクリプトにより検索され(S431)、検索されたパッケージに含まれるユーザ評価に応じて、コメントに対応するコメント情報が特定され(S432)、特定されたコメント情報がコンテンツ識別情報とパッケージ化されることで、新たなスクリプトが自動生成される(S433)、自動生成されたスクリプトが再生される(S434)。
 すなわち、コンテンツ先行型の制御によって、ユーザのコンテキストに応じて生成されたプレイリストに対応するコンテンツをキーにして、番組配信サーバ30Aに登録(アップロード)されている前説や後説(例えば、人気のある前説や後説)が特定され、特定された前説や後説が楽曲IDとパッケージ化されることで、新たなスクリプトが自動生成される。
<5.第5の実施の形態>
 ユーザコンテキストに応じた再生の制御方法としては、周囲のユーザの属性に応じてコメントの音声をスキップする方法がある。
 例えば、周囲のユーザと共に視聴しているか否か、又は前説と後説が自作のものであるかなどに応じて、前説と後説の音声がスキップされるように制御することができる。より具体的には、自作の前説と後説は、趣味違いの登録ユーザ以外には聴かせないなどの条件を設定して、特定のユーザに対し、前説と後説の音声がスキップされるようにすることができる。
(処理の全体像)
 図32は、第5の実施の形態における処理の全体像を説明するフローチャートである。
 コンテンツ提供システム1では、まず、ユーザの単独視聴であるかどうかが判定される(S511)。
 ステップS511の判定処理で、ユーザの単独視聴であると判定された場合、処理は、ステップS515に進められる。この場合、番組レンダラでは、前説後説再生モードに応じた再生制御処理が行われる(S515)。前説後説再生モードでは、前説と後説が共に再生される。
 また、ステップS511の判定処理で、ユーザの単独視聴ではないと判定された場合、処理は、ステップS512に進められる。そして、趣味が近い登録ユーザと共に視聴中であるかどうかが判定される(S512)。
 ステップS512の判定処理で、趣味が近い登録ユーザとともに視聴中であると判定された場合、処理は、ステップS515に進められる。この場合、番組レンダラでは、前説後説再生モードに応じた再生制御処理が行われ、前説と後説が共に再生される(S515)。
 また、ステップS512の判定処理で、趣味が近い登録ユーザとともに視聴中ではないと判定された場合、処理は、ステップS513に進められる。そして、それ以外の登録ユーザと共に視聴中であるかどうかが判定される(S513)。
 ステップS513の判定処理で、それ以外の登録ユーザと共に視聴中であると判定された場合、処理は、ステップS514に進められる。そして、前説と後説が他のユーザが作成したものかどうかが判定される(S514)。
 ステップS514の判定処理で、前説と後説が他のユーザが作成したものであると判定された場合、処理は、ステップS515に進められる。この場合、番組レンダラでは、前説後説再生モードに応じた再生制御処理が行われ、前説と後説が共に再生される(S515)。
 一方で、ステップS513の判定処理で、それ以外の登録ユーザと共に視聴中ではない、すなわち、非登録ユーザと共に視聴中であると判定された場合、又はステップS514の判定処理で、前説と後説が他のユーザが作成したものではない、すなわち、前説と後説がユーザ自身により作成されたものであると判定された場合、処理は、ステップS516に進められる。
 この場合、番組レンダラでは、前説後説スキップモードに応じた再生制御処理が行われる(S516)。前説後説スキップモードでは、前説と後説が共にスキップされ、再生されない。
 このように、周囲のユーザと共に視聴しているか否か、前説や後説がユーザにより自作されたものであるかなどに応じて、前説と後説の音声をスキップするような再生制御を行うことができる。図32の例では、ユーザにより自作された前説と後説は、趣味違いの登録ユーザ以外には聴かせないような制御となる。
 なお、ここでの判定条件は一例であり、例えば、ユーザの性格などを考慮して判定の閾値を調整したり、新たな判定条件を加えたりしてもよい。例えば、外向性が高いユーザであれば、ステップS513の判定処理で、それ以外の登録ユーザと共に視聴中であると判定された場合に、前説後説再生モードに応じた再生制御処理が行われ、前説と後説が共に再生されるようにしてもよい(S515)。
 ステップS515,又はS516の処理が完了すると、処理を終了する。
<6.変形例>
 なお、上述した説明では、前説と後説の再生のスキップについて説明したが、例えば、3回目の再生等の所定の回数の再生が行われたときに、前説と後説の再生がスキップされるように制御してもよい。
 上述した再生制御処理を行う際の「前説後説再生モード」と「前説後説スキップモード」は、ユーザがマニュアルで設定してもよい。
 上述した説明では、前説、楽曲、後説の順で再生されるとして説明したが、楽曲の再生の後に、前説を再生する機能を設けても構わない。
 例えば、ユーザコンテキストの認識により、ユーザが歩行中であると認識された場合には、前説や後説の音声を聴き入ってしまうと危ないので、「前説後説スキップモード」で再生制御処理が行われるようにしてもよい。
<7.コンピュータの構成>
 上述したフローチャートの各ステップの処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、各装置のコンピュータにインストールされる。
 コンピュータが実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線又は無線の伝送媒体を介して提供することができる。
 コンピュータでは、プログラムは、リムーバブル記録媒体をドライブに装着することにより、入出力I/Fを介して、記憶部にインストールすることができる。また、プログラムは、有線又は無線の伝送媒体を介して、通信部で受信し、記憶部にインストールすることができる。その他、プログラムは、ROMや記憶部に、あらかじめインストールしておくことができる。
 ここで、本明細書において、コンピュータがプログラムに従って行う処理は、必ずしもフローチャートとして記載された順序に沿って時系列に行われる必要はない。すなわち、コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含む。
 また、プログラムは、1のコンピュータ(プロセッサ)により処理されるものであってもよいし、複数のコンピュータによって分散処理されるものであってもよい。さらに、プログラムは、遠方のコンピュータに転送されて実行されてもよい。
 さらに、本明細書において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、1つの筐体の中に複数のモジュールが収納されている1つの装置は、いずれも、システムである。
 なお、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。例えば、本技術は、1つの機能を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
 また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
 また、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。
 なお、本技術は、以下のような構成をとることができる。
(1)
 クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
 ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後の少なくともいずれか一方で、そのスクリプトに含まれる前記コメント情報に従ってコメントを読み出しユーザに提供するように制御する制御部を備え、
 前記制御部は、前記ユーザのコンテキストに応じて、前記コンテンツ又は前記コメントの提供を制御する
 コンテンツ提供システム。
(2)
 前記制御部は、前記ユーザのコンテキストに応じて、前記コメントがユーザに提供されないように制御する
 前記(1)に記載のコンテンツ提供システム。
(3)
 前記制御部は、前記ユーザがコンテンツの視聴に集中していないと判定した場合、前記コメントが提供されないように制御する
 前記(2)に記載のコンテンツ提供システム。
(4)
 前記制御部は、
  前記コメントをユーザに提供する前か後に、広告をユーザに提供する機能を有し、
  前記ユーザのコンテキストに応じて、前記広告がユーザに提供されないように、又は前記広告の種類を変更するように制御する
 前記(1)乃至(3)のいずれかに記載のコンテンツ提供システム。
(5)
 前記制御部は、前記ユーザがコンテンツ視聴に集中していると判定した場合、前記広告がユーザに提供されないように制御する
 前記(4)に記載のコンテンツ提供システム。
(6)
 前記制御部は、前記ユーザのコンテキストに応じて、前記コメントをテキストとして表示するように制御する
 前記(1)乃至(5)のいずれかに記載のコンテンツ提供システム。
(7)
 前記制御部は、前記ユーザにより、前記コメントの音声による提供をスキップする指示を検知した場合、前記コメントをテキストとして表示するように制御する
 前記(6)に記載のコンテンツ提供システム。
(8)
 前記制御部は、前記ユーザのコンテキストに応じて、新たなスクリプトを自動生成する
 前記(1)乃至(7)のいずれかに記載のコンテンツ提供システム。
(9)
 前記制御部は、前記ユーザのコンテキストに応じて、前記所定の記憶媒体に格納されているスクリプトに含まれるコメント情報が示すコメントを自動選択することにより、新たなスクリプトを自動生成する
 前記(8)に記載のコンテンツ提供システム。
(10)
 前記制御部は、
  ユーザのコンテキストに応じて特定されたコンテンツを示すコンテンツ識別情報とコメント情報からなるパッケージを、前記所定の記憶媒体に格納されているスクリプトにより検索し、
  検索されたパッケージに含まれるコメント情報が示すコメントに対するユーザ評価に応じて、コメント情報を特定し前記コンテンツ識別情報とパッケージ化することにより、新たなスクリプトを自動生成する
 前記(8)に記載のコンテンツ提供システム。
(11)
 前記制御部は、前記ユーザが、周囲のユーザと共に視聴しているか否かに応じて、前記コメントがユーザに提供されないように制御する
 前記(1)乃至(10)のいずれかに記載のコンテンツ提供システム。
(12)
 前記制御部は、前記ユーザが、周囲のユーザと共に視聴しており、かつ、前記コメントが当該ユーザ自身に作成されたものであるとき、当該コメントがユーザに提供されないように制御する
 前記(11)に記載のコンテンツ提供システム。
(13)
 前記コンテンツは、楽曲を含み、
 前記コメントは、前記楽曲に設定される前説と後説の少なくともいずれか一方を含み、
 前記特定のサービスは、前記ユーザが契約している音楽配信サービスを含んでいる
 前記(1)乃至(12)のいずれかに記載のコンテンツ提供システム。
(14)
 前記クリエイタにより使用される第1の端末装置と、
 前記ユーザにより使用される第2の端末装置と、
 前記スクリプトを格納した前記所定の記憶媒体を有する第1のサーバと、
 前記コンテンツを配信する第2のサーバと
 を含む前記(1)乃至(13)のいずれかに記載のコンテンツ提供システム。
(15)
 クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
 ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後の少なくともいずれか一方で、そのスクリプトに含まれる前記コメント情報に従ってコメントを読み出しユーザに提供するように制御するとともに、
 前記ユーザのコンテキストに応じて、前記コンテンツ又は前記コメントの提供を制御する
 コンテンツ提供方法。
(16)
 コンピュータを、
 クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
 ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後の少なくともいずれか一方で、そのスクリプトに含まれる前記コメント情報に従ってコメントを読み出しユーザに提供するように制御するとともに、
 前記ユーザのコンテキストに応じて、前記コンテンツ又は前記コメントの提供を制御する
 制御部として機能させるためのプログラムを記録した記憶媒体。
 1 コンテンツ提供システム, 10 クリエイタ端末装置, 20 ユーザ端末装置, 30 配信サーバ, 30A 番組配信サーバ, 30B 楽曲配信サーバ, 30C 音声配信サーバ, 30D 広告配信サーバ, 50 ネットワーク, 200 制御部, 201 CPU, 202 ROM, 203 RAM, 204 バス, 205 入力部, 206 出力部, 207 記憶部, 208 通信部, 209 近距離無線通信部, 210 入出力I/F, 211 操作部, 212 カメラ部, 213 センサ部, 221 表示部, 222 音出力部, 251 番組取得部, 252 楽曲取得部, 253 音声取得部, 254 レンダラ部, 255 提示制御部, 256 センサデータ取得部, 257 コンテキスト分析部, 300 制御部, 301 CPU, 302 ROM, 303 RAM, 304 バス, 305 入力部, 306 出力部, 307 記憶部, 308 通信部, 309 ドライブ, 310 入出力I/F, 351 要求・受付応答部, 352 配信処理部, 353 データベース

Claims (16)

  1.  クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
     ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後の少なくともいずれか一方で、そのスクリプトに含まれる前記コメント情報に従ってコメントを読み出しユーザに提供するように制御する制御部を備え、
     前記制御部は、前記ユーザのコンテキストに応じて、前記コンテンツ又は前記コメントの提供を制御する
     コンテンツ提供システム。
  2.  前記制御部は、前記ユーザのコンテキストに応じて、前記コメントがユーザに提供されないように制御する
     請求項1に記載のコンテンツ提供システム。
  3.  前記制御部は、前記ユーザがコンテンツの視聴に集中していないと判定した場合、前記コメントが提供されないように制御する
     請求項2に記載のコンテンツ提供システム。
  4.  前記制御部は、
      前記コメントをユーザに提供する前か後に、広告をユーザに提供する機能を有し、
      前記ユーザのコンテキストに応じて、前記広告がユーザに提供されないように、又は前記広告の種類を変更するように制御する
     請求項1に記載のコンテンツ提供システム。
  5.  前記制御部は、前記ユーザがコンテンツ視聴に集中していると判定した場合、前記広告がユーザに提供されないように制御する
     請求項4に記載のコンテンツ提供システム。
  6.  前記制御部は、前記ユーザのコンテキストに応じて、前記コメントをテキストとして表示するように制御する
     請求項1に記載のコンテンツ提供システム。
  7.  前記制御部は、前記ユーザにより、前記コメントの音声による提供をスキップする指示を検知した場合、前記コメントをテキストとして表示するように制御する
     請求項6に記載のコンテンツ提供システム。
  8.  前記制御部は、前記ユーザのコンテキストに応じて、新たなスクリプトを自動生成する
     請求項1に記載のコンテンツ提供システム。
  9.  前記制御部は、前記ユーザのコンテキストに応じて、前記所定の記憶媒体に格納されているスクリプトに含まれるコメント情報が示すコメントを自動選択することにより、新たなスクリプトを自動生成する
     請求項8に記載のコンテンツ提供システム。
  10.  前記制御部は、
      ユーザのコンテキストに応じて特定されたコンテンツを示すコンテンツ識別情報とコメント情報からなるパッケージを、前記所定の記憶媒体に格納されているスクリプトにより検索し、
      検索されたパッケージに含まれるコメント情報が示すコメントに対するユーザ評価に応じて、コメント情報を特定し前記コンテンツ識別情報とパッケージ化することにより、新たなスクリプトを自動生成する
     請求項8に記載のコンテンツ提供システム。
  11.  前記制御部は、前記ユーザが、周囲のユーザと共に視聴しているか否かに応じて、前記コメントがユーザに提供されないように制御する
     請求項1に記載のコンテンツ提供システム。
  12.  前記制御部は、前記ユーザが、周囲のユーザと共に視聴しており、かつ、前記コメントが当該ユーザ自身に作成されたものであるとき、当該コメントがユーザに提供されないように制御する
     請求項11に記載のコンテンツ提供システム。
  13.  前記コンテンツは、楽曲を含み、
     前記コメントは、前記楽曲に設定される前説と後説の少なくともいずれか一方を含み、
     前記特定のサービスは、前記ユーザが契約している音楽配信サービスを含んでいる
     請求項1に記載のコンテンツ提供システム。
  14.  前記クリエイタにより使用される第1の端末装置と、
     前記ユーザにより使用される第2の端末装置と、
     前記スクリプトを格納した前記所定の記憶媒体を有する第1のサーバと、
     前記コンテンツを配信する第2のサーバと
     を含む請求項1に記載のコンテンツ提供システム。
  15.  クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
     ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後の少なくともいずれか一方で、そのスクリプトに含まれる前記コメント情報に従ってコメントを読み出しユーザに提供するように制御するとともに、
     前記ユーザのコンテキストに応じて、前記コンテンツ又は前記コメントの提供を制御する
     コンテンツ提供方法。
  16.  コンピュータを、
     クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
     ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後の少なくともいずれか一方で、そのスクリプトに含まれる前記コメント情報に従ってコメントを読み出しユーザに提供するように制御するとともに、
     前記ユーザのコンテキストに応じて、前記コンテンツ又は前記コメントの提供を制御する
     制御部として機能させるためのプログラムを記録した記憶媒体。
PCT/JP2020/043424 2019-12-06 2020-11-20 コンテンツ提供システム、コンテンツ提供方法、及び記憶媒体 WO2021111906A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US17/775,586 US20220391441A1 (en) 2019-12-06 2020-11-20 Content providing system, content providing method, and storage medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019221523 2019-12-06
JP2019-221523 2019-12-06

Publications (1)

Publication Number Publication Date
WO2021111906A1 true WO2021111906A1 (ja) 2021-06-10

Family

ID=76222201

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/043424 WO2021111906A1 (ja) 2019-12-06 2020-11-20 コンテンツ提供システム、コンテンツ提供方法、及び記憶媒体

Country Status (2)

Country Link
US (1) US20220391441A1 (ja)
WO (1) WO2021111906A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011166833A (ja) * 2007-03-30 2011-08-25 Dowango:Kk コメント配信システム、端末装置、コメント配信方法、及びプログラム
JP2015060545A (ja) * 2013-09-20 2015-03-30 本田技研工業株式会社 情報処理システム及びクライアント端末
JP2015518171A (ja) * 2012-04-03 2015-06-25 ソニー株式会社 再生制御装置、再生制御方法、およびプログラム
JP2017162006A (ja) * 2016-03-07 2017-09-14 ヤフー株式会社 配信装置、配信方法及び配信プログラム

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2299946A1 (en) * 2000-03-03 2001-09-03 Destiny Software Productions Inc. Digital media distribution method and system
US7917557B2 (en) * 2002-09-05 2011-03-29 Koninklijke Philips Electronics N.V. Method and devices for creating a second playlist based on a first playlist
US7299411B2 (en) * 2002-09-27 2007-11-20 Liberate Technologies Providing a presentation engine adapted for use by a constrained resource client device
US8180731B2 (en) * 2005-08-01 2012-05-15 Sony Corporation Apparatus and method for computing evaluation values of content data stored for reproduction
US20070260460A1 (en) * 2006-05-05 2007-11-08 Hyatt Edward C Method and system for announcing audio and video content to a user of a mobile radio terminal
US20080177782A1 (en) * 2007-01-10 2008-07-24 Pado Metaware Ab Method and system for facilitating the production of documents
US20080256109A1 (en) * 2007-04-13 2008-10-16 Google Inc. Dynamic Podcast Content Delivery
US8055655B1 (en) * 2008-02-15 2011-11-08 Google Inc. User interaction based related digital content items
US8712776B2 (en) * 2008-09-29 2014-04-29 Apple Inc. Systems and methods for selective text to speech synthesis
JP5684992B2 (ja) * 2010-02-26 2015-03-18 キヤノン株式会社 情報処理システム、情報処理装置、処理方法及びプログラム
US20120143701A1 (en) * 2010-12-01 2012-06-07 Google Inc. Re-publishing content in an activity stream
CN103238311A (zh) * 2011-01-13 2013-08-07 株式会社尼康 电子设备及电子设备的控制程序
JP5156123B1 (ja) * 2011-12-28 2013-03-06 楽天株式会社 情報処理装置、情報処理方法、情報処理プログラム、及び記録媒体
JP2013210721A (ja) * 2012-03-30 2013-10-10 Sony Corp 情報処理装置及びプログラム
WO2014102722A1 (en) * 2012-12-26 2014-07-03 Sia Technology Ltd. Device, system, and method of controlling electronic devices via thought
US10768771B2 (en) * 2015-06-05 2020-09-08 Apple Inc. Social interaction in a media streaming service
US20210161482A1 (en) * 2017-07-28 2021-06-03 Sony Corporation Information processing device, information processing method, and computer program
EP3506255A1 (en) * 2017-12-28 2019-07-03 Spotify AB Voice feedback for user interface of media playback device
US10657318B2 (en) * 2018-08-01 2020-05-19 Microsoft Technology Licensing, Llc Comment notifications for electronic content
JPWO2021111872A1 (ja) * 2019-12-02 2021-06-10
EP4072155A4 (en) * 2019-12-06 2023-03-08 Sony Group Corporation INFORMATION PROCESSING SYSTEM, INFORMATION PROCESSING METHOD AND STORAGE MEDIUM

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011166833A (ja) * 2007-03-30 2011-08-25 Dowango:Kk コメント配信システム、端末装置、コメント配信方法、及びプログラム
JP2015518171A (ja) * 2012-04-03 2015-06-25 ソニー株式会社 再生制御装置、再生制御方法、およびプログラム
JP2015060545A (ja) * 2013-09-20 2015-03-30 本田技研工業株式会社 情報処理システム及びクライアント端末
JP2017162006A (ja) * 2016-03-07 2017-09-14 ヤフー株式会社 配信装置、配信方法及び配信プログラム

Also Published As

Publication number Publication date
US20220391441A1 (en) 2022-12-08

Similar Documents

Publication Publication Date Title
Geoghegan et al. Podcast solutions
US6633741B1 (en) Recap, summary, and auxiliary information generation for electronic books
US20070166683A1 (en) Dynamic lyrics display for portable media devices
US20080119953A1 (en) Device and System for Utilizing an Information Unit to Present Content and Metadata on a Device
US20130151364A1 (en) System and method for offering a title for sale over the internet
US20080120312A1 (en) System and Method for Creating a New Title that Incorporates a Preexisting Title
US20080140702A1 (en) System and Method for Correlating a First Title with a Second Title
US20080120330A1 (en) System and Method for Linking User Generated Data Pertaining to Sequential Content
US20110167390A1 (en) Apparatus and method for utilizing an information unit to provide navigation features on a device
US20080120342A1 (en) System and Method for Providing Data to be Used in a Presentation on a Device
US20080120311A1 (en) Device and Method for Protecting Unauthorized Data from being used in a Presentation on a Device
US20050276570A1 (en) Systems, processes and apparatus for creating, processing and interacting with audiobooks and other media
JP2019091014A (ja) マルチメディアを再生するための方法及び装置
TW201123111A (en) Video/audio teaching system
US20240205515A1 (en) Information processing system, information processing method, and storage medium
WO2020039702A1 (ja) 情報処理装置、情報処理システム、情報処理方法及びプログラム
Salmon et al. EBOOK: How to Create Podcasts for Education
US20220391440A1 (en) Content providing system, content providing method, and storage medium
KR20140025082A (ko) Sns 디지털 오디오북 제작 시스템 및 방법
McHugh et al. Towards inclusive streaming: Building multimodal music experiences for the deaf and hard of hearing
JP3668364B2 (ja) 連続メディア情報アクセス方法、連続メディア情報アクセス装置及び連続メディア情報アクセスプログラムを記録した記録媒体
WO2021111906A1 (ja) コンテンツ提供システム、コンテンツ提供方法、及び記憶媒体
Hurst Getting started with podcasting
KR20090000745A (ko) 인터넷을 이용한 사용자 녹음방식의 소리책 제작 시스템 및방법
Tidal Podcasting: A practical guide for librarians

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20895906

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20895906

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP