WO2021111872A1 - コンテンツ提供システム、コンテンツ提供方法、及び記憶媒体 - Google Patents

コンテンツ提供システム、コンテンツ提供方法、及び記憶媒体 Download PDF

Info

Publication number
WO2021111872A1
WO2021111872A1 PCT/JP2020/042907 JP2020042907W WO2021111872A1 WO 2021111872 A1 WO2021111872 A1 WO 2021111872A1 JP 2020042907 W JP2020042907 W JP 2020042907W WO 2021111872 A1 WO2021111872 A1 WO 2021111872A1
Authority
WO
WIPO (PCT)
Prior art keywords
content
user
script
music
program
Prior art date
Application number
PCT/JP2020/042907
Other languages
English (en)
French (fr)
Inventor
丹下 明
長坂 英夫
Original Assignee
ソニーグループ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニーグループ株式会社 filed Critical ソニーグループ株式会社
Priority to CN202080071752.0A priority Critical patent/CN114556400A/zh
Priority to KR1020227016697A priority patent/KR20220110735A/ko
Priority to JP2021562555A priority patent/JPWO2021111872A1/ja
Priority to EP20897321.4A priority patent/EP4071751A4/en
Priority to US17/774,145 priority patent/US20220391440A1/en
Publication of WO2021111872A1 publication Critical patent/WO2021111872A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/101Collaborative creation, e.g. joint development of products or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/383Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/483Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0252Targeted advertisements based on events or environment, e.g. weather or festivals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0276Advertisement creation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • G06Q50/184Intellectual property management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/50Business processes related to the communications industry
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems

Definitions

  • the present technology relates to a content providing system, a content providing method, and a storage medium, and more particularly to a content providing system, a content providing method, and a storage medium that enable easier provision of content and its comments.
  • Patent Documents 1 and 2 In recent years, with the diversification of methods for providing content, various services and devices have been provided (see, for example, Patent Documents 1 and 2).
  • Patent Document 1 discloses a device that automatically selects a stream to be reproduced and outputs it to a television monitor based on sequence information that controls the reproduction order of the streams.
  • the stream and the character string to be output are combined and output according to the sequence information.
  • Patent Document 2 elements are sequentially extracted from hypertext downloaded based on an address extracted from a program list, and when there is text, voice synthesis is performed to generate voice, and if there is a link, the linked material is extracted.
  • a program that functions to sequentially repeat the output corresponding to the material is disclosed.
  • a script generated by a creator and consisting of content identification information and comment information is stored in a predetermined storage medium so that the user can view it, and the script selected by the user.
  • the reading of the content indicated by the content identification information contained in the script is controlled so as to be executed and provided to the user by utilizing the rights already acquired by the user by the contract with the specific service.
  • a script generated by a creator and consisting of content identification information and comment information is stored in a predetermined storage medium so that the user can view it, and the script selected by the user.
  • the reading of the content indicated by the content identification information contained in the script is controlled so as to be executed and provided to the user by utilizing the rights already acquired by the user by the contract with the specific service. It is a content providing method that controls to read a comment and provide it to a user according to the comment information contained in the script, at least either before or after the content is provided.
  • the storage medium of one aspect of the present technology is selected by the user because a script generated by the creator of the computer and consisting of content identification information and comment information is stored in a predetermined storage medium so that the user can view it.
  • the reading of the content indicated by the content identification information contained in the script is controlled to be executed and provided to the user by utilizing the rights already acquired by the user by the contract with the specific service.
  • it is a storage medium that records a program for functioning as a control unit that controls to read the comment according to the comment information contained in the script and provide the comment to the user. ..
  • a script composed of content identification information and comment information generated by the creator is stored in a predetermined storage medium so that the user can view it.
  • the reading of the content indicated by the content identification information contained in the script is executed by using the right that the user has already acquired by contracting with a specific service. It is controlled so that the comment is read and provided to the user according to the comment information contained in the script, at least either before or after the provision of the content. ..
  • FIG. 1 is a representative diagram showing an outline of the present technology.
  • This technology makes it easier to provide content and its comments by providing comments on the content along with the content by using the contract with the user's service and text-to-speech synthesis when the content is made into a program. It is a thing.
  • the DJ distributes the music selected by himself / herself from the music distribution server and sends a comment about the music using a microphone.
  • the user is listening to the music selected by the DJ and the comment sent from the music distribution server.
  • the DJ is assumed to be a virtual one created by the creator, but the music selected by the DJ is provided to the user using the music distribution service already contracted by the user, and is transmitted by the DJ. Since the comment is provided to the user by text-speech synthesis, the content and the comment can be provided more easily.
  • FIG. 2 shows an outline of a content providing system to which the present technology is applied.
  • a virtual podcast system is illustrated as an embodiment of a content providing system to which the present technology is applied.
  • the virtual podcast system is a system that allows creators to create podcast programs simply by operating their own terminal devices, selecting songs, and writing sentences.
  • Podcasts are one of the methods for publishing audio and video data files on the Internet, and are a type of Internet radio and Internet television.
  • the text is not limited to text, and may be provided as an audio file.
  • the podcast program created by the creator is registered on the distribution server.
  • the user can watch the program by operating his / her own terminal device and playing the podcast program distributed from the distribution server.
  • creators have opened their own video distribution channels to disseminate information through video content of various themes, and creators play videos in return for providing video content to users. They receive compensation such as advertising revenue according to the number of times and advertising revenue from producing tie-up videos with advertisers.
  • the above-mentioned programming, distribution copyright processing, and monetization are inevitable items for creators who distribute podcast programs, and a mechanism to easily solve these items is required. Has been done.
  • the virtual podcast system allows creators to create and distribute podcast programs so that users can watch the podcast programs, while also responding to creators' requests for programming, distribution copyright processing, and monetization. Provide a mechanism for this.
  • FIG. 3 shows the playback flow of the podcast program generated by the virtual podcast system.
  • FIG. 3 shows the Nth and N + 1th tracks that are consecutive in time among the tracks (Tracks) included in the podcast program.
  • Each track is composed of a previous story (Warm-up), a song (song), and a later story (After-song).
  • the previous theory is a previous theory that introduces music, and consists of texts.
  • the text "This song was written ... is such a great song!” Is described.
  • the text corresponding to this previous theory can be converted into voice by TTS (Text To Speech) and read aloud.
  • the song includes identification information (id) for identifying the song, and information on the title and artist name of the song. For example, by using the music ID of "1234567", it is possible to request the music distribution service contracted by the user to stream the music specified by the music ID.
  • the postscript is a postscript after watching the music and consists of text (sentence).
  • a postscript the text "After all, it's the best " is described.
  • the text corresponding to this later can be read aloud using TTS.
  • the first is the case of distributing a program including music.
  • the creator creates a complete podcast program including the music and chat (previous and later), and the podcast program is distributed. Therefore, the copyright of the music Processing occurs for the creator who delivers.
  • the second is the case of VPC type distribution.
  • the music is distributed using the music distribution service, and the creator only creates and distributes the chat (previous and postscript), so that the copyright processing of the music is performed. , Does not occur for creators.
  • the composition data regarding the structure of the program and the preamble and the postscript are distributed.
  • the part of the music in the program is distributed by the music distribution service, so that the copyright processing of the music does not occur to the creator.
  • the music streamed by the music distribution service and the chatter (previous and postscript) distributed by the creator are combined into a program by the user terminal device used by the user, so that the user terminal The user handles the rights processing of the music part in the podcast program programmed on the device side.
  • VPC type distribution when the podcast is distributed, the creator distributes the music identification information (music ID) without creating a complete package podcast program, so that the user terminal device side used by the user can use the music. So, based on the music ID, the music distributed by the music distribution service is played.
  • music ID music identification information
  • the music is played using the rights that the user has already acquired through the contract with the music distribution service, so that the creator does not have to process the copyright of the music.
  • the music ID specified by the creator can be used without paying an additional fee.
  • the specified music can be played.
  • the podcast program will be distributed by this VPC (Virtual PodCast) type distribution.
  • the contract with the music distribution service of the user is not only a paid user contract (premium user) but also a free user contract (free user), the music is played only by inserting an advertisement. If you can, you can use that right.
  • FIG. 6 shows an example of the overall configuration of the virtual podcast system.
  • the functions provided by this virtual podcast system are roughly classified into the functions on the creator side provided by the creator terminal device, the functions on the creator side provided by the distribution server, and the functions on the various distribution service side provided by the distribution server. It is divided into user-side functions provided by the user terminal device.
  • the program creation tool and the audio creation tool are executed according to the operation of the creator (PodCaster), and the podcast program is generated.
  • the program creation tool includes the music ID of the music selected from the music list (catalog) for music selection provided by the music distribution service, and the preamble of the music whose sound is adjusted at the time of voice synthesis by the voice creation tool.
  • the voice creation tool provides the TTS sound adjustment function based on the voice creation data provided by the voice distribution service. By operating the voice creation tool and using the sound adjustment function of TTS, the creator can make the TTS voice played by the user his / her favorite voice.
  • the program distribution service provides a service for distributing a podcast program registered by a program creation tool to a user terminal device.
  • the music distribution service corresponds to the music distribution service contracted (subscribed) by the user who uses the user terminal device.
  • the music distribution service distributes music specified by the music ID set in the podcast program in response to a request from the user terminal device.
  • the music distribution service provides a music list for music selection to the creator terminal device.
  • the voice distribution service provides a service that distributes TTS voice obtained by synthesizing the texts of the preamble and the postscript of the music set in the podcast program to the user terminal device.
  • the voice distribution service provides data for voice creation to the creator terminal device.
  • the program renderer is executed and the podcast program is played according to the operation of the user (Listener).
  • the program renderer When playing a desired program from the podcast programs released by the program distribution service, the program renderer includes the music distributed from the music distribution service and the music distributed from the music distribution service based on the configuration data (reproduction data) related to the configuration of the program. Renders the TTS audio distributed from the audio distribution service.
  • the podcast program is played (reproduced) and can be viewed by the user. It can be said that the program renderer executed by the user terminal device is a playback player.
  • FIG. 7 shows an example of a script that describes the structure of a podcast program.
  • a podcast program is configured by setting a plurality of music IDs of the music to be programmed and a plurality of preambles and postscripts of the music as a set. ..
  • the structure of the program of this podcast is described by the script shown in FIG.
  • FIG. 7 shows an example of the description of the first track among the N tracks.
  • the number of the target track (Number), the previous story (Warm-up), the song (song), and the information about the latter story (After-song) are described.
  • identification information for identifying the song, information about the title of the song and the artist name, etc. are described. For example, by describing the music ID of "1234567", it is possible to request the music distribution service of "service A" to distribute the music specified by the music ID.
  • the song ID of the song and the script consisting of the preamble and the postscript about the song are generated by the creator terminal device used by the creator and registered in the program distribution service to be disclosed to the user.
  • the music indicated by the music ID uses the right that the user has already acquired through the contract with the music distribution service. Then, it is controlled so that it is streamed and the TTS audio of the previous and subsequent articles is provided.
  • the script only describes the song ID of the song and the preamble and postscript in text, but does not contain the song or audio data itself that is played in the podcast program.
  • the program created by the creator is reproduced by playing back the music and audio data based on the music ID described in the script and the information indicated by the previous and subsequent explanations.
  • FIG. 8 shows the configuration of a virtual podcast system as an example of the configuration of an embodiment of a content providing system to which the present technology is applied.
  • the content providing system 1 is composed of a creator terminal device 10, a user terminal device 20, a program distribution server 30A, a music distribution server 30B, and an audio distribution server 30C.
  • the creator terminal device 10 In the content providing system 1, the creator terminal device 10, the user terminal device 20, the program distribution server 30A, the music distribution server 30B, and the voice distribution server 30C are connected to each other via the network 50.
  • the creator terminal device 10 is a device such as a smartphone, a tablet terminal, or a personal computer, and is used by the creator.
  • the creator terminal device 10 generates a script of a podcast program according to the operation of the creator, and transmits (uploads) it to the program distribution server 30A via the network 50.
  • the user terminal device 20 is a device such as a smartphone, a tablet terminal, a music player, a game machine, or a personal computer, and is used by the user.
  • the user terminal device 20 accesses the program distribution server 30A via the network 50 in response to the user's operation, and receives (downloads) the script of the podcast program.
  • the program distribution server 30A is composed of one or a plurality of servers that provide a program distribution service.
  • the program distribution service is a service that distributes podcast programs, and is provided by a program distribution company.
  • the program distribution server 30A receives the script of the program transmitted (uploaded) from the creator terminal device 10 via the network 50, and registers it in the storage medium so that the user using the user terminal device 20 can view it.
  • the program distribution server 30A When the program distribution server 30A receives a playback request for a program transmitted from the user terminal device 20 via the network 50, the program distribution server 30A reads the script of the program from the storage medium and distributes it to the user terminal device 20 that is the playback request source.
  • the music distribution server 30B is composed of one or a plurality of servers that provide music distribution services.
  • the music distribution service is a service for distributing music via the Internet, and is provided by a music distribution company.
  • music distribution services are offered in the form of flat-rate, all-you-can-listen streaming.
  • the music distribution server 30B When the music distribution server 30B receives a distribution request for a music transmitted from the user terminal device 20 via the network 50, the music distribution server 30B identifies the music corresponding to the received distribution request, and uses the streaming data of the music as the distribution request source. It is delivered to the user terminal device 20 of the above.
  • the voice distribution server 30C is composed of one or a plurality of servers that provide a voice distribution service.
  • the voice distribution service is a service that distributes voice such as TTS voice and live voice via the Internet, and is provided by a voice distribution company.
  • the voice distribution server 30C When the voice distribution server 30C receives a voice distribution request transmitted from the user terminal device 20 via the network 50, the voice distribution server 30C acquires the voice corresponding to the received distribution request, and obtains the voice data from the distribution request source. It is delivered to the user terminal device 20.
  • the program distribution server 30A when it is not necessary to distinguish between the program distribution server 30A, the music distribution server 30B, and the audio distribution server 30C, the program distribution server 30A will be referred to as the distribution server 30. Further, the program distribution business operator, the music distribution business operator, and the audio distribution business operator may be the same business operator or different business operators.
  • the network 50 is configured to include a communication network such as the Internet, an intranet, or a mobile phone network, and enables interconnection between devices using a communication protocol such as TCP / IP (Transmission Control Protocol / Internet Protocol). ..
  • a communication protocol such as TCP / IP (Transmission Control Protocol / Internet Protocol).
  • FIG. 9 shows an example of the configuration of the creator terminal device 10 of FIG.
  • the CPU Central Processing Unit
  • the ROM Read Only Memory
  • the RAM Random Access Memory
  • the CPU 101 controls the operation of each part of the creator terminal device 10 by executing the program recorded in the ROM 102 or the storage unit 107. Various data are appropriately stored in the RAM 103.
  • the input / output I / F 110 is also connected to the bus 104.
  • An input unit 105, an output unit 106, a storage unit 107, a communication unit 108, and a short-range wireless communication unit 109 are connected to the input / output I / F 110.
  • the input unit 105 supplies various input data to each unit including the CPU 101 via the input / output I / F 110.
  • the input unit 105 has an operation unit 111, a camera unit 112, and a sensor unit 113.
  • the operation unit 111 is operated by the creator and supplies the operation data corresponding to the operation to the CPU 101.
  • the operation unit 111 is composed of physical buttons, a touch panel, and the like.
  • the camera unit 112 generates and outputs captured image data by photoelectrically converting the light from the subject incident therein and performing signal processing on the electric signal obtained as a result.
  • the camera unit 112 is composed of an image sensor, a signal processing unit, and the like.
  • the sensor unit 113 senses spatial information, time information, etc., and outputs sensor data obtained as a result of the sensing.
  • the sensor unit 113 includes an acceleration sensor, a gyro sensor, and the like.
  • the accelerometer measures acceleration in three directions on the XYZ axes.
  • the gyro sensor measures the angular velocities of the three axes of the XYZ axes.
  • An inertial measurement unit may be provided to measure three-dimensional acceleration and angular velocity with a three-direction accelerometer and a three-axis gyroscope.
  • the sensor unit 113 includes a sound sensor (microphone) that detects sounds such as the voice of a creator, a biological sensor that measures information such as the heart rate, body temperature, or posture of an organism, and a proximity sensor that measures nearby objects.
  • a sound sensor microphone
  • a biological sensor that measures information such as the heart rate, body temperature, or posture of an organism
  • a proximity sensor that measures nearby objects.
  • sensors such as magnetic sensors that measure the magnitude and direction of the magnetic field (magnetic field) can be included.
  • the output unit 106 outputs various information according to the control from the CPU 101 via the input / output I / F 110.
  • the output unit 106 has a display unit 121 and a sound output unit 122.
  • the display unit 121 displays an image or the like according to the image data according to the control from the CPU 101. It is composed of a display unit 121, a panel unit such as a liquid crystal panel or an OLED (Organic Light Emitting Diode) panel, and a signal processing unit.
  • a display unit 121 a panel unit such as a liquid crystal panel or an OLED (Organic Light Emitting Diode) panel, and a signal processing unit.
  • the sound output unit 122 outputs a sound according to the sound data according to the control from the CPU 101.
  • the sound output unit 122 is composed of a speaker, headphones connected to an output terminal, and the like.
  • the storage unit 107 records various data and programs according to the control from the CPU 101.
  • the CPU 101 reads various data from the storage unit 107, processes the data, and executes a program.
  • the storage unit 107 is configured as an auxiliary storage device for a semiconductor memory or the like.
  • the storage unit 107 may be configured as an internal storage, or may be an external storage such as a memory card.
  • the communication unit 108 communicates with other devices via the network 50 according to the control from the CPU 101.
  • the communication unit 108 is configured as a communication module that supports cellular communication (for example, LTE-Advanced, 5G, etc.), wireless communication such as wireless LAN (Local Area Network), or wired communication.
  • cellular communication for example, LTE-Advanced, 5G, etc.
  • wireless communication such as wireless LAN (Local Area Network), or wired communication.
  • the short-range wireless communication unit 109 performs wireless communication based on short-range wireless communication standards such as Bluetooth (registered trademark) and NFC (Near Field Communication), and exchanges various data.
  • short-range wireless communication standards such as Bluetooth (registered trademark) and NFC (Near Field Communication)
  • the configuration of the creator terminal device 10 shown in FIG. 9 is an example.
  • a microphone is provided as an input unit
  • an image processing circuit such as a GPU (Graphics Processing Unit), a power supply circuit, or the like is provided. It doesn't matter.
  • FIG. 10 shows an example of the functional configuration of the control unit 100 in the creator terminal device 10.
  • the function of the control unit 100 is realized by executing a program such as a program creation tool or a voice creation tool by the CPU 101.
  • control unit 100 includes an input reception unit 151, a music information acquisition unit 152, a program generation unit 153, a voice information acquisition unit 154, a voice generation unit 155, and a registration unit 156.
  • the input reception unit 151 receives the operation data supplied from the input unit 105 according to the operation of the creator and supplies the operation data to the program generation unit 153.
  • the music information acquisition unit 152 acquires music information related to music supplied from the communication unit 108 that communicates with the music distribution server 30B, and supplies the music information to the program generation unit 153.
  • the music information includes information such as a music list and a music ID received from the music distribution server 30B.
  • the program generation unit 153 processes the music information supplied from the music information acquisition unit 152 and the comment information related to the preamble and the postscript based on the operation data supplied from the input reception unit 151, thereby producing the podcast program.
  • a script is generated and supplied to the registration unit 156.
  • the voice information acquisition unit 154 acquires voice information related to the voices of the previous and subsequent explanations supplied from the communication unit 108 that communicates with the voice distribution server 30C, and supplies the voice information to the voice generation unit 155.
  • the voice information includes information such as information related to voice received from the voice distribution server 30C at the time of voice synthesis and voice creation.
  • the voice generation unit 155 processes the voice information supplied from the voice information acquisition unit 154 to generate voice for the creator to set the preamble and the postscript, and supplies the voice to the program generation unit 153.
  • the program generation unit 153 uses the voice supplied from the voice generation unit 155 to provide the creator with information regarding the settings of the preamble and the postscript (voice at the time of voice synthesis, etc.). Then, a script of the program is generated and supplied to the registration unit 156.
  • the registration unit 156 controls the communication unit 108 and registers the script of the program supplied from the program generation unit 153 by uploading it to the program distribution server 30A via the network 50.
  • FIG. 11 shows an example of the configuration of the user terminal device 20 of FIG.
  • the configuration of the user terminal device 20 corresponds to the configuration of the creator terminal device 10 shown in FIG. That is, since the CPU 201 to the short-range wireless communication unit 209 have the same functions as the CPU 101 to the short-range wireless communication unit 109 described above, the description thereof will be omitted here.
  • FIG. 12 shows an example of the functional configuration of the control unit 200 in the user terminal device 20.
  • the function of the control unit 200 is realized by executing a program such as a program renderer by the CPU 201.
  • control unit 200 includes a program acquisition unit 251, a music acquisition unit 252, an audio acquisition unit 253, a renderer unit 254, and a presentation control unit 255.
  • the program acquisition unit 251 acquires a podcast program script supplied from the communication unit 208 that communicates with the program distribution server 30A according to the user's operation, and supplies the script to the renderer unit 254.
  • the music acquisition unit 252 acquires the streaming data of the music corresponding to the music ID supplied from the communication unit 208 that communicates with the music distribution server 30B, and supplies it to the renderer unit 254.
  • the voice acquisition unit 253 acquires voice data according to the previous and subsequent explanations supplied from the communication unit 208 that communicates with the voice distribution server 30C, and supplies the voice data to the renderer unit 254.
  • the renderer unit 254 acquires the audio data of the previous theory supplied from the audio acquisition unit 253, the streaming data of the music supplied from the music acquisition unit 252, and the audio acquisition based on the program script supplied from the program acquisition unit 251.
  • the later-described audio data supplied from the unit 253 is rendered, and the resulting data is supplied to the presentation control unit 255.
  • the presentation control unit 255 presents the program to the user by supplying the data supplied from the renderer unit 254 to the output unit 206.
  • the presentation control unit 255 supplies the audio data of the previous theory, the streaming data of the music, and the audio data of the latter to the sound output unit 222, and sets the program together with the sound of the programmed music. It is possible to output and present the sounds of the previous and subsequent theories before and after the music.
  • FIG. 13 shows an example of the configuration of the distribution server 30 of FIG.
  • the distribution server 30 corresponds to any of the program distribution server 30A, the music distribution server 30B, and the audio distribution server 30C shown in FIG.
  • the CPU 301, ROM 302, and RAM 303 are connected to each other by the bus 304.
  • An input / output I / F 310 is further connected to the bus 304.
  • An input unit 305, an output unit 306, a storage unit 307, a communication unit 308, and a drive 309 are connected to the input / output I / F 310.
  • the input unit 305 is composed of a microphone, a keyboard, a mouse, and the like.
  • the output unit 306 is composed of a speaker, a display, and the like.
  • the storage unit 307 is composed of an HDD (Hard Disk Drive), a semiconductor memory, and the like.
  • the communication unit 308 is configured as a communication module corresponding to wireless communication such as wireless LAN or wired communication such as Ethernet (registered trademark).
  • the drive 309 drives a removable recording medium 311 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory.
  • FIG. 14 shows an example of the functional configuration of the control unit 300 in the distribution server 30.
  • the function of the control unit 300 is realized by executing the program of each service by the CPU 301.
  • control unit 300 has a request reception / response unit 351, a distribution processing unit 352, and a database 353.
  • the request reception / response unit 351 receives various requests supplied from the communication unit 308 that communicates with the creator terminal device 10 or the user terminal device 20, and supplies them to the distribution processing unit 352.
  • the distribution processing unit 352 performs distribution processing according to various requests supplied from the request reception / response unit 351.
  • the database 353 is recorded in a storage unit 307 composed of a large-capacity storage such as an HDD or a semiconductor memory.
  • a podcast program script or the like is stored in the database 353 of the program distribution server 30A.
  • the music provided by the music distribution service is stored in association with the music ID.
  • the database 353 of the voice distribution server 30C stores information on the voice at the time of voice synthesis and voice creation, voice data of the previous and subsequent explanations, and the like.
  • the distribution processing unit 352 processes various data stored in the database 353, generates responses corresponding to various requests, and supplies them to the request reception / response unit 351.
  • the request reception / response unit 351 controls the communication unit 308 to send a response according to various requests supplied from the distribution processing unit 352 to the creator terminal device 10 or the user terminal device 20 of the request source via the network 50. Send to.
  • FIG. 15 is a sequence diagram showing a flow of processing when voice synthesis is used when providing a prelude and a postscript of the music together with the programmed music.
  • the program creation tool is executed by the creator terminal device 10, and the program renderer is executed by the user terminal device 20. Further, in FIG. 15, the program distribution service is provided by the program distribution server 30A, the music distribution service is provided by the music distribution server 30B, and the TTS service is provided by the audio distribution server 30C.
  • control unit 100 executes the program creation tool, and the processes of steps S11 to S13 are executed.
  • the program creation tool acquires the music list transmitted from the music distribution server 30B and presents it to the creator (S11).
  • the program creation tool generates a podcast program script based on the music ID of the music selected from the music list by the creator and the texts of the preamble and the post of the music input by the creator (S12), and distributes the program. Register with the server 30A (S13).
  • the script of the podcast program created by the creator is stored in the database 353 and can be viewed by the user who uses the user terminal device 20.
  • the program renderer is executed by the control unit 200, and the program renderer operates in cooperation with each distribution server 30, so that the processes of steps S14 to S25 are executed.
  • the script of the program distributed from the program distribution server 30A is received ( S14, S15).
  • the program renderer requests the voice distribution server 30C to synthesize the text of the previous story based on the previous story set at the beginning of the received script (S16).
  • the voice synthesis of the text of the previous theory is performed (S17) in response to the request from the program renderer, and the result of the voice synthesis is delivered (S18).
  • the program renderer As a result, in the program renderer, the result of the voice synthesis delivered from the voice distribution server 30C is received, and the rendering process is performed to reproduce the TTS sound of the part of the previous theory set in the programmed music. ..
  • the program renderer sends the music specified by the music ID to the music distribution server 30B that provides the music distribution service contracted by the user, based on the music ID set next to the preamble of the received script.
  • Request delivery (S19).
  • the rights acquired by the user through the contract with the music distribution service are confirmed (S20), and the user has a legitimate right and is specified by the music ID.
  • the music is streamed and distributed (S21).
  • the streaming data of the music distributed from the music distribution server 30B is received and the rendering process is performed, so that the music specified by the music ID is played as a programized music.
  • the program renderer requests the voice distribution server 30C to synthesize the text of the later text based on the later explanation set next to the music ID of the received script. (S22).
  • the voice synthesis of the text described later is performed (S23) in response to the request from the program renderer, and the result of the voice synthesis is delivered (S24).
  • the program renderer As a result, in the program renderer, the result of the voice synthesis delivered from the voice distribution server 30C is received and the rendering process is performed, so that the TTS sound of the later part set in the programmed music is reproduced. To.
  • the song IDs for each of the plurality of songs are programmed together with the texts of the preamble and the postscript of the song, so that the process is performed after the processes of steps S16 to S24 are completed.
  • the processes of steps S16 to S25 are repeated according to the number of music IDs.
  • the playback is repeated in the order of the previous story, the song, and the latter story for each song ID set in the script, and the user can watch the podcast program.
  • FIG. 16 shows a first example of the user interface (UI: User Interface) of the program creation tool.
  • the program creation screen 410 is a screen displayed when the program creation tool is executed, and is a UI for creating a podcast program according to the operation of the creator.
  • the program creation screen 410 has an operation area 411, a title setting area 412, an opening talk setting area 413, a set music / preamble and postscript area 414, and a music / preamble and postscript setting area 415.
  • the operation area 411 is an area for operating and listening to the music set in the program.
  • the operation area 411 includes a button for playing or stopping the music, a button for selecting the previous music and the next music, a seek bar indicating the position of the music being played, and the like.
  • the title setting area 412 is an area for setting the title of the program.
  • the opening talk setting area 413 is an area for setting the opening talk. For example, in the opening talk setting area 413, the audio file of the opening talk is set, but it is not always necessary to set it when the opening talk is not required.
  • the set music / preamble and postscript area 414 is an area in which the set music and the prelude and postscript of the music are displayed.
  • a prelude that is "Speech File1" and a postscript that is “Speech File2” are set for the music that is "Song1".
  • the preamble that is "Speech File3” and the postscript that is "Speech File4" are set for the music that is "Song2”.
  • the music / preamble / postscript setting area 415 is an area for setting the prelude and the postscript of the music and the music.
  • a music add button (“Add Music from Song Catalog”) for selecting a desired music file from a music catalog
  • a preamble add button for setting a desired preamble
  • a postscript add button (“Add Speech File after”) for setting a desired postscript.
  • the previous and subsequent theories are set as text format files according to the creator's input operation, and may be set as voice format files according to the creator's voice input, for example.
  • this program creation screen 410 By operating this program creation screen 410 by the creator, for example, a script of the program shown in FIG. 17 is created.
  • this program creation tool may be provided as a function of an application (hereinafter, also referred to as a music distribution application) distributed by the music distribution service contracted by the creator.
  • 18 to 23 show an example of a program creation tool provided as a function of a music distribution application executed by the creator terminal device 10.
  • the music playback screen 510 is a screen provided as a function of the music distribution application, and is a UI for playing music distributed by a music distribution service via a network 50 such as the Internet.
  • the music reproduction screen 510 has a music area 511 to be reproduced and a music operation area 512.
  • the playback target music area 511 is an area for displaying the title, artist name, jacket image, etc. of the playback target music.
  • the music operation area 512 is an area for operating music.
  • the music operation area 512 includes a button for playing or stopping the music, a button for selecting the previous music and the next music, a seek bar indicating the position of the music being played, and the like.
  • the playlist selection screen 520 shown in FIG. 19 is displayed.
  • the playlist selection screen 520 is a screen provided as a function of the music distribution application, and is a UI for selecting a desired playlist.
  • the playlist selection screen 520 has a playlist list area 521.
  • the playlist list area 521 is an area for displaying and selecting a list of playlists provided by a music distribution service, or playlists (published playlists) created by the creator himself or another user. is there.
  • the playlist edit screen 530 shown in FIG. 20 is displayed. Will be done.
  • the playlist edit screen 530 is a screen provided as a function of the music distribution application, and is a UI for editing the playlist to be selected.
  • the playlist edit screen 530 has a music list area 531 and a music addition button 532.
  • the music list area 531 is an area for displaying and selecting a list of music registered in the playlist to be selected.
  • the music addition button 532 is a button operated when a new music is added to the playlist to be selected.
  • the music / preamble and postscript edit screen 540A is a UI for editing the prelude and postscript of the music to be selected.
  • the music / preamble and postscript edit screen 540A has a preamble description area 541A and a postscript description area 542A.
  • the preamble description area 541A is an area for describing the preamble text for the music to be selected.
  • the creator terminal device 10 when the creator terminal device 10 is a device such as a smartphone having a touch panel, the creator taps the software keyboard displayed on the display unit 121 on which the touch panel is superimposed to input a desired preamble as text. Can be done.
  • the creator terminal device 10 can use the service of the voice recognition API (Application Programming Interface) on the cloud, the voice recognition service is used to convert the desired voice input by the creator into text. You can convert it.
  • the voice recognition API Application Programming Interface
  • the creator terminal device 10 is a device such as a personal computer having a keyboard
  • the creator may operate the keyboard and input a desired comment of the previous theory.
  • the postscript description area 542A is an area for describing the postscript text for the music to be selected.
  • a desired postscript text corresponding to the operation of the software keyboard or the voice input operation by the creator is input.
  • the music / preamble and postscript edit screen 540B is a UI for editing the prelude and postscript of the music to be selected.
  • the music / preamble and postscript edit screen 540B has a preamble description area 541B and a postscript description area 542B.
  • the preamble description area 541B is an area for describing the preamble text for the music to be selected.
  • the desired preamble text corresponding to the operation of the software keyboard or the voice input operation by the creator is input.
  • the postscript description area 542B is an area for describing the postscript text for the music to be selected.
  • a desired postscript text corresponding to the operation of the software keyboard or the voice input operation by the creator is input.
  • the above-mentioned music / preamble and postscript edit screens 540A and 540B are examples of UI for setting the prelude and the postscript for the music, and the preamble and the postscript may be set by another UI. Absent.
  • the playlist setting screen 550 is a screen provided as a function of the music distribution application, and is a UI for making various settings related to the playlist that has been made into a program.
  • the playlist setting screen 550 has a setting area 551.
  • the setting area 551 includes items for setting the name change of the programmed playlist, the publication of the programmed playlist, the deletion of the programmed playlist, and the like.
  • “Publish” surrounded by the frame F3 in the figure is tapped from the items displayed in this setting area, the playlist made into a program is published to other users.
  • the script of the playlist made into a program that is, the script of the program is stored in the database 353 of the program distribution server 30A and can be viewed by the user who uses the user terminal device 20.
  • a program creation function can be added as one function of the music distribution application provided by the music distribution service.
  • a creator can program a playlist as a premium user of a music distribution service, set a preamble and a postscript for each song, and publish a script of the playlist that has been programmed.
  • the music ID set in the script generated by the music distribution application is the ID of the music managed by the music distribution service contracted by the creator.
  • FIG. 24 is a sequence diagram showing a processing flow when playing back a programmed music as a playlist when the preamble and the post-song of the music can be provided by using voice synthesis.
  • FIG. 24 it is shown that the program creation tool and the program renderer are executed by the creator and the user's terminal devices, respectively, and the program distribution service, the music distribution service, and the TTS service are provided by each distribution server. It is the same as the first example described with reference to 15.
  • steps S31 to S33 of FIG. 24 a program script is generated by the program creation tool and registered in the program distribution server 30A, as in steps S11 to S13 of FIG.
  • the script of the program distributed from the program distribution server 30A is received (S34, S35).
  • the user is instructed to play the program as a playlist.
  • the program renderer requests the music distribution server 30B that provides the music distribution service contracted by the user to distribute the music specified by the music ID set in the received script (S36).
  • the music distribution server 30B in response to the request from the program renderer, the rights acquired by the user through the contract with the music distribution service are confirmed (S37), and the user has a legitimate right and is specified by the music ID.
  • the music is streamed and distributed (S38).
  • the streaming data of the music distributed from the music distribution server 30B is received and rendered, so that the music specified by the music ID is played.
  • step S36 S39
  • steps S36 to S38 the processing returns to step S36 (S39) after the processing of steps S36 to S38 is completed, and the number of music IDs.
  • the processing of steps S36 to S39 is repeated accordingly.
  • the music is repeatedly played in the order of the music ID set in the script, and the user can watch the music to be played as a playlist.
  • the music ID included in the script indicates the music ID included in the script without reading the preamble and the postscript included in the script according to the script selected by the user. The music is read and provided to the user.
  • FIG. 25 is a sequence diagram showing a processing flow when a live voice is used when providing a prelude and a postscript of the music together with the programmed music.
  • the program creation tool and the program renderer are executed by the creator and the user's terminal devices, respectively, and the program distribution service and the music distribution service are each provided by each distribution server, see FIG. This is the same as the first example described above.
  • the voice distribution server 30C provides a live voice distribution service instead of the TTS service.
  • steps S51 to S53 of FIG. 25 a script of the podcast program is generated by the program creation tool and registered in the program distribution server 30A, as in steps S11 to S13 of FIG.
  • the preamble and the postscript of the music are not included in the script as text, but the preamble and the postscript are read aloud by the creator's live voice, so that the audio data (file) is It is registered in the voice distribution server 30C (S54).
  • the link information to the live voice data of the preamble and the postscript is set together with the music ID that identifies the music.
  • steps S55 and S56 of FIG. 25 similarly to steps S14 and S15 of FIG. 15, when the program renderer is instructed to play a podcast program that is open to the public for viewing on the program distribution server 30A, the program The script of the program distributed from the distribution server 30A is received.
  • the program renderer accesses the audio distribution server 30C based on the link information of the previous theory set at the beginning of the received script, and requests the live voice distribution of the previous theory (S57).
  • the live voice data of the previous theory registered by the creator is processed (S58), and the live voice data is delivered (S59).
  • the live voice data of the previous story delivered from the voice distribution server 30C is received and rendered, so that the live voice of the part of the previous story set in the programmed music is reproduced. Will be done.
  • steps S60 to S62 of FIG. 25 similarly to steps S19 to S21 of FIG. 15, in the program renderer, the music is streamed from the music distribution server 30B based on the music ID set next to the preamble of the received script. The music is played.
  • the program renderer accesses the voice distribution server 30C based on the link information of the later explanation set next to the music ID of the received script, and the raw content of the later explanation is obtained.
  • Request voice distribution (S63).
  • the voice data of the later voice registered by the creator is processed (S64), and the voice data of the voice is delivered (S65).
  • the live voice data of the postscript delivered from the voice distribution server 30C is received and rendered, so that the live voice of the postscript part set in the programmed music is performed. Is played.
  • the script of the podcast program contains the song IDs of a plurality of songs together with the link information of the live voices of the preamble and the postscript of the song, it is processed after the processes of steps S57 to S65 are completed. Returns to the process of step S57 (S66), and the processes of steps S57 to S66 are repeated.
  • the playback is repeated in the order of the previous story, the song, and the latter story for each song ID set in the script, and the user can watch the podcast program.
  • FIG. 26 is a sequence diagram showing a processing flow when playing back a programmed music as a playlist when the preamble and the post-song of the music can be provided by using live voice.
  • the program creation tool and the program renderer are executed by the creator and the user's terminal devices, respectively, and the program distribution service, the music distribution service, and the live voice distribution service are each provided by each distribution server. , The same as the third example described with reference to FIG. 25.
  • steps S71 to S74 of FIG. 26 as in steps S51 to S54 of FIG. 25, the program script is registered in the program distribution server 30A by the program creation tool, and the preamble read aloud by the creator's voice.
  • the voice data (file) described later is registered in the voice distribution server 30C.
  • the script of the program distributed from the program distribution server 30A is received (S75, S76).
  • the user is instructed to play the program as a playlist.
  • the program renderer requests the music distribution server 30B that provides the music distribution service contracted by the user to distribute the music specified by the music ID set in the received script (S77).
  • the music distribution server 30B in response to a request from the program renderer, the rights acquired by the user through the contract with the music distribution service are confirmed (S78), and the user has a legitimate right and is specified by the music ID. When it is determined that the music to be played can be played, the music is streamed and distributed (S79).
  • the streaming data of the music distributed from the music distribution server 30B is received and rendered, so that the music specified by the music ID is played.
  • step S77 S80
  • steps S77 to S79 the processing returns to steps S77 to 80. Processing is repeated.
  • the music is repeatedly played in the order of the music ID set in the script, and the user can watch the music to be played as a playlist.
  • the music ID included in the script indicates the music ID included in the script without reading the preamble and the postscript included in the script according to the script selected by the user. The music is read and provided to the user.
  • FIGS. 27 and 28 are the control of the creator terminal device 10 (control unit 100), the user terminal device 20 (control unit 200), and the distribution server 30 (control) in the content providing system to which the present technology is applied. It is realized by operating in cooperation with the unit 300).
  • this process is executed by at least one of the control unit 100, the control unit 200, and the control unit 300.
  • the content providing system 1 when there is an input from a creator who uses the creator terminal device 10 (“Yes” in S211), the content identification information and the content are based on the input.
  • a script consisting of comment information corresponding to the preamble and the postscript is generated (S212), and the script is stored in a predetermined storage medium so that it can be viewed by a user who uses the user terminal device 20 (S213).
  • the content includes a song or the like distributed by the music distribution service
  • the identification information of the content includes a song ID or the like that can identify the song.
  • the preamble and the postscript are examples of comments regarding the content, and at least one of the preamble and the postscript may be set. For example, when making a song into a program, in addition to inserting a prelude or a post-song for each song, after inserting a narration or the like as a prelude, the song is played three times in a row, or after four songs are played continuously. , You may insert the impression of the song as a postscript.
  • Comment information includes text representing comments or link information to the creator's live voice. Although the comment information is described as corresponding to a comment related to the content, it is not necessarily related to the content and may correspond to a comment not related to the content.
  • the predetermined storage medium can be, for example, the storage unit 307 (database 353) of the program distribution server 30A.
  • the predetermined storage medium can be, for example, the storage unit 307 (database 353) of the program distribution server 30A.
  • the preamble read according to the comment information of the script includes a voice such as a TTS voice or a live voice.
  • the reading of the content indicated by the content identification information included in the script is executed by using the right already acquired by the user by the contract with the specific service, and the content is provided to the user. (S233).
  • the content identification information includes a music ID or the like that can identify the music.
  • the specific service is a music distribution service
  • the rights already acquired by the user include the rights of a paid premium user and the rights of a free free user.
  • the content providing system 1 after the content is provided, the latter is read out according to the comment information included in the script, and is controlled to be provided to the user (S234).
  • the postscript read according to the comment information of the script includes voice such as TTS voice or live voice.
  • voice such as TTS voice or live voice.
  • the comment texts such as the preamble and the postscript
  • the comment information may be converted (translated) into a foreign language and provided to the user.
  • the system knows the user's profile and knows the user's native language
  • the comment may be converted to the native language and provided to the user as text, or the text may be provided to the user.
  • the voice may be synthesized by TTS and the voice synthesis result may be provided to the user.
  • the content and its comment are more easily provided because the comment about the content is provided together with the content by using the contract with the user's service, text-to-speech synthesis, etc. Can be provided.
  • the business operator that distributes the programmed music is not limited to the same business operator that distributes the podcast program, but may be a different business operator.
  • a script of a program created on a specific music distribution application provided by one music distribution service can be provided to another music distribution service.
  • the script of the created program is stored so that it can be referred to not only by the music distribution service that provides a specific music distribution application but also by other music distribution services.
  • the script of the created program is stored so that it can be referred to not only by the music distribution service that provides a specific music distribution application but also by other music distribution services.
  • metadata that allows the music to be searched is also stored.
  • this metadata can include song titles, lyricists, composers, artist names, and the like.
  • the information such as the music title included in the metadata is used by the self.
  • Music can be specified from the managed database, and the specified music can be streamed.
  • FIG. 29 is a sequence diagram illustrating a processing flow when a script created by using a certain music distribution service is provided to another music distribution service.
  • the program creation tool and the program renderer are executed by the creator and the user's terminal devices, respectively, and the program distribution service, the music distribution service, and the live voice distribution service are provided by each distribution server, respectively. This is the same as the third example described with reference to FIG. 25.
  • the music distribution server 30B-1 of the company A that provides the music distribution service A and the music distribution server 30B-2 of the company B that provides the music distribution service B are provided, and the program distribution server 30A is provided. Shall be provided by Company A. Further, it is assumed that the user terminal device 20 is executing a program renderer as a music distribution application provided by Company B.
  • the program renderer of company B when executed and the user is instructed to play a program that is open to the public for viewing on the program distribution server 30A of company A, the program distribution of company A is performed.
  • the script of the program delivered from the server 30A is received (S95, S96).
  • This script contains metadata for searching the content in addition to the song ID for the song that was made into a program.
  • the metadata includes a song title, a lyricist, a composer, an artist name, and the like. More specifically, the information specified in the items such as "title” and "artist” in the script shown in FIG. 7 can be used as metadata.
  • the program renderer of company B distributes the music specified by the metadata to the music distribution server 30B-2 of company B, which provides the music distribution service B contracted by the user, based on the received script. Request (S97).
  • the music distribution server 30B-2 in response to a request from the program renderer of company B, the rights acquired by the user through the contract with the music distribution service B are confirmed, and it is determined that the user has a legitimate right. If so, the music is specified using the metadata (S98).
  • the music distribution server 30B-2 searches for music using metadata for the music distributed by the music distribution service B, and when the music can be identified by the metadata, the user terminal device 20 On the other hand, streaming distribution of the music is performed (S99).
  • the previous theory set to the programized music is set by accessing the voice distribution server 30C based on the link information of the previous theory set in the script.
  • the live voice of the part is reproduced (S101 to S102).
  • the program renderer of the company B the music stream-distributed from the music distribution server 30B-2 of the company B is reproduced.
  • the program renderer of Company B sets the music as a program by accessing the voice distribution server 30C based on the link information set in the script.
  • the live voice of the later part is reproduced (S103 to S105).
  • the program renderer of Company B By repeating the processes of steps S97 to S106, the program renderer of Company B repeatedly reproduces the previous story, the song, and the latter story in this order for each song ID set in the script, and the podcast is performed by the user.
  • the program can be viewed.
  • the music distribution server 30B-2 of the company B responds to the program renderer of the company B to that effect so that the unidentified music and the reproduction of the preamble and the postscript of the music are skipped. To do.
  • the target music is skipped by the program renderer of the company B, and the next music (or the preamble of the next music) is started to be played.
  • the music distribution server 30B-2 of the company B causes the music distribution server 30B-1 of the company A to distribute the sample music of the music corresponding to the metadata to the user terminal device 20.
  • the program renderer of the company B reproduces the sample song distributed by the music distribution service A for which the user has not contracted.
  • FIGS. 30 and 31 are the control of the creator terminal device 10 (control unit 100), the user terminal device 20 (control unit 200), and the distribution server 30 (control) in the content providing system to which the present technology is applied. It is realized by operating in cooperation with the unit 300).
  • the content providing system 1 when there is an input from a creator who uses the creator terminal device 10 (“Yes” in S311), the content that the first service can recognize based on the input.
  • a script consisting of the identification information of the above, the metadata for searching the content, and the comment information corresponding to the preamble and the postscript of the content is generated (S312), and the script is viewed by the user who uses the user terminal device 20. It is potentially stored in a predetermined storage medium (S313).
  • the content includes a song or the like distributed by the music distribution service, and the identification information of the content includes a song ID or the like that can identify the song.
  • the preamble and the postscript are examples of comments regarding the content, and at least one of the preamble and the postscript may be set.
  • the first service is, for example, the music distribution service A provided by company A.
  • the metadata includes song titles and the like.
  • the predetermined storage medium can be, for example, the database 353 of the program distribution server 30A.
  • the second service is, for example, the music distribution service B provided by company B.
  • the content includes songs and the like distributed by the music distribution service
  • the metadata includes song titles and the like.
  • step S333 If it is determined in the determination process of step S333 that the corresponding content has been identified, the content is read out using the rights already acquired by the user through the contract with the second service. It is controlled to provide to the user (S334).
  • the rights already acquired by the user include the rights of a paid premium user in the music distribution service B provided by the company B, the rights of a free free user, and the like, and the user terminal device 20 distributes the rights from the music distribution service B.
  • the music to be played is played.
  • step S333 when it is determined in the determination process of step S333 that the corresponding content could not be specified, it is controlled so that the reading of the content and the corresponding comment is skipped, or the first service.
  • the sample data corresponding to the content managed by the user is read out and controlled to be provided to the user (S335).
  • the music to be played back and the preamble and the postscript of the music are skipped, or the sample music distributed from the music distribution service A provided by the company A is played.
  • words and contexts that are not suitable as prelude or postscript of a song such as slanderous terms are automatically identified for the preamble and postscript set in the programized music, and such words and contexts, etc. If there is a sentence in which is specified, a warning can be displayed at the program creation stage, or registration can be disallowed at the program registration stage.
  • the copyright holder of the song points out that continuous playback of a specific prelude or postscript and the song is not permitted, for example, only the prelude or postscript.
  • the reproduction may be prohibited (the reproduction of the music is possible), the reproduction of the preamble, the music, and the latter may be prohibited, or the reproduction of the music itself may be prohibited.
  • the minimum license function can be used when registering and providing podcast programs.
  • FIG. 32 shows another example of the functional configuration of the control unit 300 in the distribution server 30.
  • control unit 300 has a request reception / response unit 351, a distribution processing unit 352, and a database 353, but a text check unit 161 is further provided.
  • the distribution processing unit 352 supplies the texts of the preamble and the postscript included in the script of the program to the sentence check unit 161 when the program creation tool requests the registration of the script of the program.
  • the text check unit 161 performs a text check process on the texts of the preamble and the postscript supplied from the distribution processing unit 352, and supplies the result of the text check to the distribution processing unit 352.
  • sentence check process for example, natural language processing including morphological analysis and parsing is performed, the sentences of the texts of the preamble and the postscript are analyzed, and words and contexts (sentence meanings) such as slanderous terms are extracted. It is checked whether it is included.
  • the distribution processing unit 352 creates a database of the script of the program requested to be registered by the program creation tool. Store in 353.
  • the sentence check unit 161 can be provided inside the program distribution server 30A, for example, but is provided as an external server to check sentences in response to a request from the program distribution server 30A. The result of the sentence check may be responded.
  • FIG. 33 is a sequence diagram showing a processing flow when performing a sentence check.
  • the program creation tool and the program renderer are executed by the creator and the user's terminal devices, respectively, and the program distribution service, the music distribution service, and the TTS service are provided by each distribution server, respectively.
  • the program distribution server 30A also executes the process related to the sentence check.
  • the program creation tool is executed, and by operating in cooperation with each distribution server 30, the processes of steps S111 to 124 are executed.
  • the program creation tool acquires the music list transmitted from the music distribution server 30B and presents it to the creator (S111).
  • the program creation tool generates a podcast program script based on the music ID of the music selected from the music list by the creator and the texts of the preamble and the post of the music input by the creator (S112), and distributes the program.
  • a registration request is made to the server 30A (S113).
  • the program distribution server 30A requests the text check of the preamble and the postscript by sending the texts of the preamble and the postscript requested to be registered by the program creation tool to the text check unit 361 (S114).
  • the sentence check unit 361 in response to the request for the sentence check, the sentence check of the texts of the preamble and the postscript is performed (S115), and the result of the sentence check is notified (S116).
  • the result of the sentence check is notified to the program creation tool based on the response from the sentence check unit 361 (S117).
  • the program creation tool displays the result of the sentence check (S118).
  • the sentence check unit 361 notifies that it is not permitted when it is determined that the sentences of the previous and subsequent articles are not suitable.
  • the creator can correct the preamble and postscript of the music to be programmed based on the notification presented by the program creation tool.
  • the program creation tool regenerates the podcast program based on the texts of the preamble and the postscript of the music modified by the creator (S119), and requests the program distribution server 30A to register again (S120).
  • the program distribution server 30A requests the text check of the preamble and the postscript by sending the texts of the preamble and the postscript requested to be registered by the program creation tool to the text check unit 361 (S121).
  • the sentence check unit 361 in response to the request for the sentence check, the sentence check of the texts of the preamble and the postscript is performed (S122), and the result of the sentence check is notified (S123).
  • the text check unit 361 notifies that it is permitted when it is determined that the text is suitable for the texts of the preamble and the postscript.
  • the program script including the preamble and postscript texts of the modified music requested to be re-registered by the program creation tool is stored in the database 353. It can be viewed by a user who uses the user terminal device 20 (S124).
  • FIG. 34 is a flowchart illustrating an overall picture of the process according to the third embodiment.
  • the processing shown in FIG. 34 is realized by the creator terminal device 10 (control unit 100) in the content providing system to which the present technology is applied and the distribution server 30 (control unit 300) operating in cooperation with each other. To.
  • the content providing system 1 when a script corresponding to an input from a creator using the creator terminal device 10 is generated (“Yes” in S411), the content preamble included in the script is included.
  • the content of the comment indicated by the comment information corresponding to the latter is analyzed (S412), and based on the analysis result, it is determined whether or not the content of the comment is suitable as a comment regarding the content (S413).
  • the content includes music and the like distributed by the music distribution service.
  • the preamble and the postscript are examples of comments regarding the content, and at least one of the preamble and the postscript may be set.
  • step S413 determines that the content of the comment is suitable as a comment regarding the content
  • the script including the comment information is stored in a predetermined storage medium so that the user who uses the user terminal device 20 can view it. It is stored (S414).
  • the prelude or postscript of the music to be made into a program does not include words or contexts such as slanderous terms, it is judged to be suitable for the prelude or postscript, and the script of the program is the program distribution server. It is registered in the database 353 of 30A.
  • step S413 if it is determined in the determination process of step S413 that the content of the comment is not suitable as a comment regarding the content, the creator terminal device 10 used by the creator is notified to that effect.
  • Advertisements may be inserted in podcast programs. For example, analyzing the content of at least one of the preamble and the postscript set in the programmed music, and inserting the related advertisement before or after the prelude, depending on the analysis result. Can be done.
  • the advertisement inserted in the program can be described in a script as text, for example, and the voice synthesis can be performed based on the same phoneme as the voice synthesis of the texts of the previous and later explanations.
  • the preamble and the postscript included in the script are voice-synthesized with a specific voice and provided to the user according to the script of the program selected by the user, the text of the advertisement is also specified. To synthesize the voice with the voice of and provide it to the user.
  • FIG. 35 shows an example of another configuration of one embodiment of the content providing system to which the present technology is applied.
  • the content providing system 1 includes the creator terminal device 10, the user terminal device 20, the program distribution server 30A, the music distribution server 30B, and the voice distribution server 30C.
  • a server 30D is further provided.
  • the advertisement distribution server 30D is composed of one or a plurality of servers that provide an advertisement distribution service.
  • the advertisement distribution service is a service that distributes advertisements via the Internet, and is provided by, for example, an advertisement distribution business operator.
  • the advertisement distribution server 30D identifies an advertisement managed by an advertisement management or an advertisement database 353 in response to a request from the program distribution server 30A, and delivers the specified advertisement (advertisement body).
  • the advertisement distribution server 30D has the same configuration as the configuration of the distribution server 30 and the functional configuration of the control unit 300 shown in FIGS. 13 and 14.
  • FIG. 36 shows an example of an advertisement inserted in a script for a podcast show.
  • the script of the podcast program describes the song to be programmed (song) and the prelude (Warm-up) and post-song (After-song) of the song as a set.
  • the text of the advertisement is inserted after the latter part.
  • the preamble contains the text "..., I still want to hear it in the summer ", and the postscript says “... the song makes hot summer really fun.” ”Text is included and these texts are analyzed.
  • the advertisement about the keyword "summer” consists of the text "Beer on a hot summer day. A beer ad is inserted.
  • the URL Uniform Resource Locator
  • the text of the text can be analyzed by natural language processing for the text, so that the live voice is delivered. A more accurate analysis can be performed as compared with the case of performing an analysis.
  • the inserted advertisement text when the inserted advertisement text is voice-synthesized and the TTS voice is read aloud, it may be read aloud as it is, but for example, it may be read aloud according to the tone of the DJ or read aloud in a dialect.
  • the tone of the TTS voice of the advertisement may be matched with the tone of the TTS voice of the preamble and the post.
  • the advertisement is inserted after the later theory, but the advertisement can be inserted at any place. Alternatively, it is preferable to insert it after the later explanation.
  • FIG. 37 is a sequence diagram showing a flow of processing when an advertisement is inserted into a program.
  • the program renderer is executed by the user terminal device 20 and the program distribution service, the music distribution service, and the TTS service are each provided by each distribution server. Similar to the first example, the advertisement distribution server 30D that provides the advertisement distribution service and the advertisement management DB is provided.
  • the script of the program is analyzed (S131, S132).
  • the program distribution server 30A acquires a word / advertisement list from the advertisement management database 353 by transmitting a request according to the analysis result of the script of the program to the advertisement distribution server 30D (S133, S134).
  • the sentences of the texts of the preamble and the postscript set in the script are analyzed, the words and meanings contained in the sentences are extracted, and the place where the advertisement is inserted in the program is determined. .. Further, since the word or the meaning of the sentence is associated with the advertisement ID in the advertisement management database 353, the advertisement ID corresponding to the previous theory and the latter theory is acquired as the word / advertisement list.
  • the advertisement (advertisement body) is acquired by transmitting the request including the advertisement ID to the advertisement distribution server 30D (S135, S136).
  • the advertisement ID and the advertisement body are associated and managed by the advertisement database 353, so that the program distribution server 30A is the advertisement body specified by the advertisement ID according to the previous and subsequent explanations. Can be obtained and inserted into the determined insertion location (S137). The script of the program in which the advertisement is inserted is transmitted to the program renderer (S138).
  • steps S139 to S147 similarly to steps S16 to S24 of FIG. 15, in the program renderer, the preamble set in the script of the program, the music specified by the music ID, and the postscript are reproduced in this order, and the program is reproduced. Can be viewed.
  • the program renderer requests the voice distribution server 30C that provides the TTS service to synthesize the text of the advertisement (S148). ).
  • the voice synthesis of the text of the advertisement is performed (S149) in response to the request from the program renderer, and the result of the voice synthesis is delivered (S150).
  • the program renderer As a result, in the program renderer, the result of voice synthesis delivered from the voice distribution server 30C is received, and the rendering process is performed to reproduce the TTS voice of the advertisement part inserted in the program.
  • step S139 is performed after the processes of steps S139 to S150 are completed.
  • step S151 the processing of steps S139 to S151 is repeated according to the number of music IDs.
  • the playback is repeated in the order of the previous story, the song, and the latter story for each song ID set in the script of the program, and the user can watch the podcast program.
  • the TTS voice of the advertisement is also played, so that the user is notified of the previous or later theory.
  • Music and advertisements can be linked.
  • the advertisement is not limited to the voice output, and may be presented as a GUI (Graphical User Interface).
  • the advertisement can be displayed in a predetermined area on the screen of the music distribution application.
  • a specific music is created by using the voice data of the live voice as a learning material, and the specific music is used.
  • You may create a TTS that synthesizes voice.
  • the voice distribution server 30C may voice-synthesize the text of the advertisement and distribute it to the user terminal device 20.
  • the advertisement is provided with a voice close to the voice that the user likes, which may lead to an improvement in the conversion rate of the advertisement.
  • FIG. 38 is a flowchart illustrating an overall picture of the process according to the fourth embodiment.
  • the process shown in FIG. 38 is realized by the user terminal device 20 (control unit 200) in the content providing system to which the present technology is applied and the distribution server 30 (control unit 300) operating in cooperation with each other. To.
  • the comment includes at least one of the preamble and the postscript of the music as the content, for example, the sentences of the texts of the preamble and the postscript are analyzed, and the words and sentences contained in the sentences are analyzed.
  • the contents of the previous and subsequent theories are analyzed.
  • the advertisement data (advertisement body) is acquired from the advertisement distribution server 30D (S513), and the user receives the advertisement data before or after the comment to be provided. It is controlled to provide to (S514).
  • the original ID owned by each record company may be used as the content identification information such as the music ID described in the script of the podcast program.
  • FIG. 39 shows an example of another configuration of one embodiment of the content providing system to which the present technology is applied.
  • the content providing system 1 includes the creator terminal device 10, the user terminal device 20, the program distribution server 30A, the music distribution server 30B, and the voice distribution server 30C, but ID management.
  • a server 31 is further provided.
  • the ID management server 31 manages the music IDs used for each music distribution service by associating them with the management database.
  • the ID management server 31 provides information on the managed music ID in response to a request from a device such as the user terminal device 20.
  • the ID management server 31 has the same configuration as the distribution server 30 shown in FIG.
  • FIG. 40 is a sequence diagram showing a processing flow when managing music IDs and sharing program information.
  • the program creation tool and the program renderer are executed by the creator and the user's terminal devices, respectively, and the program distribution service and the music distribution service are provided by each distribution server, respectively. It is the same as the first example described with reference.
  • the music distribution server 30B-1 of the company A that provides the music distribution service A and the music distribution server 30B-2 of the company B that provides the music distribution service B are provided, and the program distribution server 30A is provided. Shall be provided by Company A.
  • an ID management server 31 that manages program IDs is provided. Further, it is assumed that the user terminal device 20 executes a program renderer as a music distribution application provided by Company B.
  • the ID management server 31 receives the music ID used by the music distribution service A, which is transmitted from the music distribution server 30B-1 of the company A, and the music distribution, which is transmitted from the music distribution server 30B-2 of the company B.
  • the music IDs used in the service B are received (S171, S172), respectively. These music IDs are the original IDs owned by each of Company A and Company B.
  • the ID management server 31 uses the music master ID to manage the music ID used by the music distribution service A and the music ID used by the music distribution service B in association with each other.
  • steps S173 to S175 as in steps S11 to S13 of FIG. 15, the program creation tool executed by the creator terminal device 10 is based on the music list and the like transmitted from the music distribution server 30B-1 of the company A.
  • a program script including a song to which the song ID of the company A is assigned is generated and registered in the program distribution server 30A of the company A.
  • the user terminal device 20 executes the program renderer of the company B, and reproduces the podcast program that is open to the public for viewing on the program distribution server 30A by the operation of the user who has a contract with the music distribution service B. Is instructed, the script of the program distributed from the program distribution server 30A is received (S176, S177).
  • the program renderer of company B sends a list of music IDs of company A set in the received script to the ID management server 31 and requests conversion of the music ID (S178).
  • the ID management server 31 converts the list of music IDs of company A into a list of music IDs of company B and transmits it to the program renderer of company B in response to a request from the program renderer (S179, S180).
  • the music ID set in the program script is the original ID of company A
  • the user has a contract with the music distribution service B of company B, so the music distribution service B is used as it is. Therefore, the music specified by the music ID cannot be played.
  • the ID management server 31 is set in the script by using the music distribution service B of the company B by converting the original music ID of the company A into the original music ID of the company B by ID conversion.
  • the music specified by the music ID of company A can be played.
  • the program renderer requests the music distribution server 30B-2 that provides the music distribution service B to distribute the music specified by the converted music ID (S181).
  • the rights acquired by the user through the contract with the music distribution service B are confirmed (S182), and the music specified by the music ID is used. If it is determined that the music can be played back, the music is streamed to the program renderer of the company B (S183).
  • the streaming data of the music distributed from the music distribution server 30B-2 of company B is received, and the rendering process is performed to reproduce the music specified by the music ID. ..
  • the song ID is programmed together with the texts of the preamble and the postscript in the script of the podcast program, the song specified by the song ID. After the sound of the part of the previous story that introduces is played, the music is played, and the sound of the part of the latter story is played after the music is played.
  • the process returns to step S181 after the processes of steps S181 to S183 are completed. (S184), the processes of steps S181 to S184 are repeated.
  • FIGS. 41 and 42 are the control of the creator terminal device 10 (control unit 100), the user terminal device 20 (control unit 200), and the distribution server 30 (control) in the content providing system to which the present technology is applied. This is achieved by the operation of the unit 300) and the ID management server 31 (control unit) in cooperation with each other.
  • the first service recognizes the input from the creator.
  • a script consisting of the first possible content identification information and comment information corresponding to the preamble and the postscript of the content is generated (S612), and the script is stored in a predetermined storage medium so that the user can view it (S612). S613).
  • the content includes a song or the like distributed by the music distribution service, and the identification information of the content includes a song ID or the like that can identify the song.
  • the preamble and the postscript are examples of comments regarding the content, and at least one of the preamble and the postscript may be set.
  • Comment information includes text representing a comment, link information to a live voice, and the like.
  • the first service is, for example, a music distribution service A provided by company A.
  • the predetermined storage medium can be, for example, the database 353 of the program distribution server 30A.
  • the content providing system 1 when a user who has a contract with the second service requests playback of the script stored in the predetermined storage medium (“Yes” in S631). ),
  • the second content identification information that can be recognized by the second service corresponding to the first content identification information is specified (S632), and the content managed by the second service corresponds to the second content identification information.
  • the content to be used is specified (S633), and the content is read out and controlled to be provided to the user by using the right already acquired by the user by the contract with the second service (S634). ..
  • the second service is, for example, the music distribution service B provided by company B, and the rights already acquired by the user include the rights of paid premium users and free free users.
  • the program executed by the computer can be recorded and provided on a removable recording medium such as a package medium.
  • the program can also be provided via a wired or wireless transmission medium such as a local area network, the Internet, or digital satellite broadcasting.
  • a program can be installed in a storage unit via an input / output I / F by mounting a removable recording medium in a drive. Further, the program can be received by the communication unit and installed in the storage unit via a wired or wireless transmission medium. In addition, the program can be installed in advance in the ROM or storage unit.
  • the processing performed by the computer according to the program does not necessarily have to be performed in chronological order in the order described as the flowchart. That is, the processing performed by the computer according to the program also includes processing executed in parallel or individually (for example, parallel processing or processing by an object).
  • the program may be processed by one computer (processor) or may be distributed processed by a plurality of computers.
  • the program may be transferred to a distant computer for execution.
  • the system means a set of a plurality of components (devices, modules (parts), etc.), and it does not matter whether all the components are in the same housing. Therefore, a plurality of devices housed in separate housings and connected via a network, and a device in which a plurality of modules are housed in one housing are both systems. ..
  • the embodiment of the present technology is not limited to the above-described embodiment, and various changes can be made without departing from the gist of the present technology.
  • the present technology can have a cloud computing configuration in which one function is shared and jointly processed by a plurality of devices via a network.
  • each step described in the above flowchart can be executed by one device or shared by a plurality of devices. Further, when a plurality of processes are included in one step, the plurality of processes included in the one step can be executed by one device or shared by a plurality of devices.
  • a script generated by the creator and consisting of content identification information and comment information is stored in a predetermined storage medium so that the user can view it. According to the script selected by the user, the reading of the content indicated by the content identification information contained in the script is executed and provided to the user by utilizing the rights already acquired by the user by the contract with the specific service.
  • a content providing system including a control unit that controls the content to be read and provided to the user according to the comment information contained in the script, at least either before or after the content is provided.
  • the control unit controls to access the link information to the voice data as the comment information included in the script according to the script selected by the user, read the voice data, and provide the voice data to the user (1).
  • Content provision system described in.
  • the control unit receives a playlist playback request from the user, the control unit does not read the comment according to the comment information included in the script according to the script selected by the user, but is included in the script.
  • the content providing system according to any one of (1) to (3) above, which controls to read and provide the content indicated by the content identification information to the user.
  • the content providing system according to any one of (1) to (4) above, which is controlled so as to read a later story and provide it to a user according to the second comment information following the content identification information.
  • the control unit A script generated by the creator and consisting of content identification information and comment information that can be recognized by a specific service is stored in a predetermined storage medium so that the user can view it. According to the script selected by the user, the reading of the content indicated by the content identification information contained in the script is executed by utilizing the rights already acquired by the user by the contract with the specific service and provided to the user.
  • the content provision according to the above (1) is controlled so as to read the comment according to the comment information included in the script and provide the comment to the user at least either before or after the provision of the content. system.
  • the control unit A script generated by the creator, consisting of content identification information recognizable by the first service, metadata for searching the content, and comment information, is stored in a predetermined storage medium so that the user can view it.
  • the script is selected by a user who has a contract with a second service different from the first service, the corresponding content is specified by the content managed by the second service based on the metadata.
  • the content providing system according to (6) above, wherein the user controls to read the content and provide the content to the user by using the right already acquired by the contract with the second service.
  • the control unit cannot identify the corresponding content from the content managed by the second service based on the metadata.
  • the content providing system which controls so as to skip reading the content and the corresponding comment.
  • the control unit cannot identify the corresponding content from the content managed by the second service based on the metadata.
  • the content providing system according to (7) wherein the sample data corresponding to the content managed by the first service is read out and controlled to be provided to the user.
  • the control unit Before the script generated by the creator is stored in the predetermined storage medium, the comment content indicated by the comment information included in the script is analyzed.
  • the content providing system according to any one of (1) to (9) above, which controls to notify the user when it is determined that the comment is not suitable for the content based on the analysis result.
  • the content providing system according to any one of (1) to (12) above, which is controlled to be provided to the user after the above.
  • the control unit According to the script selected by the user, the text as the comment information included in the script is voice-synthesized with a specific phoneme and provided to the user.
  • the master identification information that identifies specific content and the content identification information that each service can recognize the specific content are managed in association with each other by the management database.
  • the control unit A script generated by the creator and consisting of the first content identification information and the comment information that can be recognized by the first service is stored in a predetermined storage medium so that the user can view it.
  • the script is selected by a user who has a contract with a second service different from the first service
  • the second service corresponding to the first content identification information corresponds to the management database according to the management database. Identify a second recognizable content identity and The content corresponding to the second content identification information is specified by the content managed by the second service, and the content is identified.
  • the content providing system according to (1) above wherein the user executes reading of the content and provides the user with the right already acquired by the contract with the second service.
  • the content includes music
  • the comment includes at least one of the preamble and the postscript set in the music.
  • the content providing system according to any one of (1) to (16) above, wherein the specific service includes a music distribution service contracted by the user.
  • a script generated by the creator and consisting of content identification information and comment information is stored in a predetermined storage medium so that the user can view it.
  • the reading of the content indicated by the content identification information contained in the script is executed and provided to the user by utilizing the rights already acquired by the user by the contract with the specific service.
  • a content providing method that controls the content to be read and provided to the user according to the comment information contained in the script, at least either before or after the content is provided.
  • Computer A script generated by the creator and consisting of content identification information and comment information is stored in a predetermined storage medium so that the user can view it.
  • the reading of the content indicated by the content identification information contained in the script is executed and provided to the user by utilizing the rights already acquired by the user by the contract with the specific service.
  • a program was recorded to function as a control unit that controls the content to be read and provided to the user according to the comment information contained in the script, at least either before or after the provision of the content. Storage medium.
  • 1 content provision system 10 creator terminal device, 20 user terminal device, 30 distribution server, 30A program distribution server, 30B music distribution server, 30C voice distribution server, 30D advertisement distribution server, 31 ID management server, 50 network, 100 control unit , 101 CPU, 102 ROM, 103 RAM, 104 bus, 105 input unit, 106 output unit, 107 storage unit, 108 communication unit, 109 short-range wireless communication unit, 110 input / output I / F, 111 operation unit, 112 camera unit , 113 sensor unit, 121 display unit, 122 sound output unit, 151 input reception unit, 152 music information acquisition unit, 153 program generation unit, 154 audio information acquisition unit, 155 voice generation unit, 156 registration unit, 200 control unit, 201 CPU, 202 ROM, 203 RAM, 204 bus, 205 input unit, 206 output unit, 207 storage unit, 208 communication unit, 209 short-range wireless communication unit, 210 input / output I / F, 211 operation unit, 212 camera unit, 213 Sensor unit, 221 display unit

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Technology Law (AREA)
  • Environmental & Geological Engineering (AREA)
  • Quality & Reliability (AREA)
  • Information Transfer Between Computers (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本技術は、より簡単に、コンテンツとそのコメントを提供することができるようにするコンテンツ提供システム、コンテンツ提供方法、及び記憶媒体に関する。 クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後ろの少なくともいずれか一方で、そのスクリプトに含まれるコメント情報に従ってコメントを読み出しユーザに提供するように制御する制御部を備えるコンテンツ提供システムが提供される。

Description

コンテンツ提供システム、コンテンツ提供方法、及び記憶媒体
 本技術は、コンテンツ提供システム、コンテンツ提供方法、及び記憶媒体に関し、特に、より簡単に、コンテンツとそのコメントを提供することができるようにしたコンテンツ提供システム、コンテンツ提供方法、及び記憶媒体に関する。
 近年、コンテンツを提供する方法の多様化に伴い、様々なサービスや機器が提供されている(例えば、特許文献1,2参照)。
 特許文献1には、ストリームの再生順序を制御するシーケンス情報に基づき、再生すべきストリームを自動的に選択してテレビモニタに出力する装置が開示されている。この装置では、シーケンス情報に従って、ストリームと出力すべき文字列とを組み合わせて出力している。
 特許文献2には、番組リストから取り出したアドレスを基にダウンロードしたハイパーテキストから要素を順次抽出してテキストがあるときには音声合成して音声を発生し、リンクがあればリンク先の素材を取り出して当該素材に対応した出力を行うことを順次繰り返すように機能させるプログラムについて開示されている。
国際公開第2004/073309号 特開2002-342206号公報
 ところで、コンテンツとともにそのコンテンツ等に関するコメントを提供するに際しては、より簡単に、コンテンツとそのコメントを提供することが求められる。
 本技術はこのような状況に鑑みてなされたものであり、より簡単に、コンテンツとそのコメントを提供することができるようにするものである。
 本技術の一側面のコンテンツ提供システムは、クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後ろの少なくともいずれか一方で、そのスクリプトに含まれるコメント情報に従ってコメントを読み出しユーザに提供するように制御する制御部を備えるコンテンツ提供システムである。
 本技術の一側面のコンテンツ提供方法は、クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後ろの少なくともいずれか一方で、そのスクリプトに含まれるコメント情報に従ってコメントを読み出しユーザに提供するように制御するコンテンツ提供方法である。
 本技術の一側面の記憶媒体は、コンピュータを、クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後ろの少なくともいずれか一方で、そのスクリプトに含まれるコメント情報に従ってコメントを読み出しユーザに提供するように制御する制御部として機能させるためのプログラムを記録した記憶媒体である。
 本技術の一側面のコンテンツ提供システム、コンテンツ提供方法、及び記憶媒体においては、クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しが、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行されてユーザに提供されるように制御されるとともに、当該コンテンツの提供の前か後ろの少なくともいずれか一方で、そのスクリプトに含まれるコメント情報に従ってコメントが読み出されてユーザに提供されるように制御される。
本技術の概要を示した代表図である。 本技術を適用したコンテンツ提供システムの概要を示す図である。 本技術を適用したコンテンツ提供システムによるコンテンツ再生の流れを示す図である。 音楽を含む配信を行う場合の権利処理の例を示す図である。 VPC型配信を行う場合の権利処理の例を示す図である。 本技術を適用したコンテンツ提供システムの全体の構成の例を示す図である。 コンテンツ提供システムで用いられるスクリプトの例を示す図である。 本技術を適用したコンテンツ提供システムの一実施の形態の構成の例を示す図である。 クリエイタ端末装置の構成の例を示す図である。 クリエイタ端末装置における制御部の機能的構成の例を示す図である。 ユーザ端末装置の構成の例を示す図である。 ユーザ端末装置における制御部の機能的構成の例を示す図である。 配信サーバの構成の例を示す図である。 配信サーバにおける制御部の機能的構成の例を示す図である。 番組化された楽曲とともにその楽曲の前説と後説を提供する際に音声合成を利用する場合の処理の流れを示したシーケンス図である。 番組作成ツールのユーザインターフェースの第1の例を示す図である。 番組作成ツールにより生成される番組のスクリプトの例を示す図である。 番組作成ツールのユーザインターフェースの第2の例を示す図である。 番組作成ツールのユーザインターフェースの第2の例を示す図である。 番組作成ツールのユーザインターフェースの第2の例を示す図である。 番組作成ツールのユーザインターフェースの第2の例を示す図である。 番組作成ツールのユーザインターフェースの第2の例を示す図である。 番組作成ツールのユーザインターフェースの第2の例を示す図である。 楽曲の前説と後説が音声合成を利用して提供可能な場合に、番組化された楽曲をプレイリストとして再生する場合の処理の流れを示したシーケンス図である。 番組化された楽曲とともにその楽曲の前説と後説を提供する際に生声を利用する場合の処理の流れを示したシーケンス図である。 楽曲の前説と後説が生声を利用して提供可能な場合に、番組化された楽曲をプレイリストとして再生する場合の処理の流れを示したシーケンス図である。 第1の実施の形態における処理の全体像を説明するフローチャートである。 第1の実施の形態における処理の全体像を説明するフローチャートである。 スクリプトを他の音楽配信サービスに提供する場合の処理の流れを示したシーケンス図である。 第2の実施の形態における処理の全体像を説明するフローチャートである。 第2の実施の形態における処理の全体像を説明するフローチャートである。 配信サーバにおける制御部の機能的構成の他の例を示す図である。 文章チェックを行う場合の処理の流れを示したシーケンス図である。 第3の実施の形態における処理の全体像を説明するフローチャートである。 本技術を適用したコンテンツ提供システムの一実施の形態の他の構成の例を示す図である。 番組に挿入される広告の例を示す図である。 番組に広告を挿入する場合の処理の流れを示したシーケンス図である。 第4の実施の形態における処理の全体像を説明するフローチャートである。 本技術を適用したコンテンツ提供システムの一実施の形態の他の構成の例を示す図である。 楽曲IDを管理して番組情報を共有化する場合の処理の流れを示したシーケンス図である。 変形例における処理の全体像を説明するフローチャートである。 変形例における処理の全体像を説明するフローチャートである。
 以下、図面を参照しながら本技術の実施の形態について説明する。説明は以下の順序で行うものとする。
1.第1の実施の形態:基本構成
2.第2の実施の形態:他のサービスとの連携機能
3.第3の実施の形態:最低限の利用許諾機能
4.第4の実施の形態:広告機能
5.変形例
6.コンピュータの構成
<代表図>
 図1は、本技術の概要を示した代表図である。
 本技術は、コンテンツを番組化するに際して、ユーザのサービスとの契約やテキスト音声合成を利用して、コンテンツとともにそのコンテンツ等に関するコメントを提供することで、より簡単に、コンテンツとそのコメントを提供するものである。
 図1において、DJは、自身が選曲した楽曲を楽曲配信サーバから配信するとともに、マイクを使ってその楽曲に関するコメントを発信している。一方で、ユーザは、楽曲配信サーバから配信される、DJが選曲した楽曲と発信しているコメントを聴いている。
 ここで、DJは、クリエイタにより作成された仮想的なものとされるが、DJが選曲した楽曲は、ユーザが既に契約している音楽配信サービスを利用してユーザに提供され、DJが発信するコメントは、テキスト音声合成によりユーザに提供されるものであるため、より簡単に、コンテンツとそのコメントを提供することができる。
<1.第1の実施の形態>
(バーチャルポッドキャストシステムの概要)
 図2は、本技術を適用したコンテンツ提供システムの概要を示している。図2の例では、本技術を適用したコンテンツ提供システムの一実施の形態として、バーチャルポッドキャストシステムを例示している。
 バーチャルポッドキャストシステムは、クリエイタが自身の端末装置を操作して、楽曲を選んで文章を書くだけで、ポッドキャストの番組を作成することが可能なシステムである。ポッドキャストは、インターネット上で音声や動画のデータファイルを公開する手法の1つであり、インターネットラジオやインターネットテレビの一種である。なお、文章は、テキストに限らず、音声ファイルとして提供されても構わない。
 クリエイタにより作成されたポッドキャストの番組は、配信サーバに登録される。これにより、ユーザは、自身の端末装置を操作して、配信サーバから配信されるポッドキャストの番組を再生することで、その番組を視聴することができる。
 ところで、ポッドキャストの番組を配信するクリエイタからすれば、自身が作成したポッドキャストの番組を効率的に配信して、より多くのユーザに視聴してほしいと思うはずである。
 また、ポッドキャストで、楽曲を配信する場合には、楽曲の著作権処理が配信を行うクリエイタに対して発生するため、クリエイタからすればそのような作業は手間である。そのため、楽曲の著作権処理を、他の者に代行してほしいと思うはずである。
 近年、動画配信サイトでは、クリエイタが自身の動画配信チャンネルを開設して、様々なテーマの動画コンテンツを通じて情報発信が行われており、クリエイタは、動画コンテンツをユーザに提供する対価として、動画の再生回数に応じた広告収入や、広告主とのタイアップ動画の制作による広告収入などの対価を得ている。
 ポッドキャストの番組を配信するクリエイタにとっても、自身の作成したポッドキャストの番組に対する対価は極めて重要な関心事であり、適切な対価が還元されることを望んでいるはずである。
 以上のような番組化と、配信著作権処理と、収益化は、ポッドキャストの番組を配信するクリエイタにとっては、避けては通れない事項であり、これらの事項を容易に解決するための仕組みが求められている。バーチャルポッドキャストシステムでは、クリエイタがポッドキャストの番組を作成して配信して、そのポッドキャストの番組をユーザが視聴できるようにしつつ、クリエイタによる番組化と、配信著作権処理と、収益化の要望にも応えるための仕組みを提供する。
 図3は、バーチャルポッドキャストシステムにより生成されたポッドキャストの番組の再生の流れを示している。
 図3においては、ポッドキャストの番組に含まれるトラック(Track)のうち、時間的に連続したN番目とN+1番目のトラックを示している。
 各トラックは、前説(Warm-up)、楽曲(song)、及び後説(After-song)から構成される。
 前説は、楽曲を紹介する前説であって、テキスト(文章)からなる。この例では、前説として、「この曲が書かれたのは、・・・、そんな最高の一曲ですね!」であるテキストが記述されている。この前説に対応するテキストは、TTS(Text To Speech)により音声に変換して読み上げることが可能である。
 楽曲は、その楽曲を識別するための識別情報(id)と、その曲のタイトル(title)とアーティスト名(artist)に関する情報を含む。例えば、"1234567"である楽曲IDを用いることで、ユーザが契約している音楽配信サービスに対して、当該楽曲IDにより特定される楽曲のストリーミング配信を要求することができる。
 後説は、楽曲の視聴後の後説であって、テキスト(文章)からなる。この例では、後説として、「やっぱり最高でね。・・・」であるテキストが記述されている。この後説に対応するテキストは、TTSを用いて読み上げることができる。
 ここで、ポッドキャストの番組の配信を行うに際し、番組に楽曲を含めるための権利処理としては、以下の2つのケースが想定される。
 第1に、楽曲を含む番組の配信を行うケースである。このケースでは、図4に示すように、クリエイタによって、楽曲としゃべり(前説と後説)を含む完パケとなるポッドキャストの番組が作成され、当該ポッドキャストの番組が配信されるため、楽曲の著作権処理が、配信を行うクリエイタに対して発生する。
 第2に、VPC型配信を行うケースである。このケースでは、図5に示すように、音楽配信サービスを利用して楽曲が配信され、クリエイタは、しゃべり(前説と後説)を作成して配信するだけであるため、楽曲の著作権処理が、クリエイタに対して発生しない。
 すなわち、クリエイタが、ポッドキャストの番組を配信するに際して、当該番組の構成に関する構成データと前説と後説が配信されるようにする。これにより、番組における楽曲の部分は、音楽配信サービスにより配信されることになるため、楽曲の著作権処理が、クリエイタに対しては発生しないことになる。
 VPC型配信では、音楽配信サービスによりストリーミング配信される楽曲と、クリエイタにより配信されるしゃべり(前説と後説)とは、ユーザが使用するユーザ端末装置で合成されて番組化されるため、ユーザ端末装置側で番組化されたポッドキャストの番組における楽曲の部分の権利処理は、ユーザによって行われる。
 このように、VPC型配信では、ポッドキャストの配信時に、クリエイタは、完パケのポッドキャストの番組を作らずに、楽曲の識別情報(楽曲ID)を配信することで、ユーザが使用するユーザ端末装置側で、当該楽曲IDに基づき、音楽配信サービスによりストリーミング配信される楽曲が再生されるようにしている。
 つまり、ユーザ端末装置では、当該ユーザが音楽配信サービスとの契約により既に獲得している権利を用いて楽曲が再生されるため、クリエイタに対して、楽曲の著作権処理は発生しない。一方で、ユーザにとっても、自身が契約している音楽配信サービスにおける通常の楽曲配信範囲内で楽曲を再生可能であるため、特に追加料金を支払ったりすることなく、クリエイタにより指示された楽曲IDにより特定される楽曲を再生することができる。バーチャルポッドキャストシステムでは、このVPC(Virtual Pod Cast)型配信によりポッドキャストの番組の配信が行われるようにする。
 なお、ユーザの音楽配信サービスとの契約は、有料のユーザ契約(プレミアムユーザ)は勿論、無料のユーザ契約(フリーユーザ)であっても、広告が挿入されるだけで、楽曲の再生を行うことができる場合には、その権利を利用することができる。
 図6は、バーチャルポッドキャストシステムの全体の構成の例を示している。
 図6に示すように、このバーチャルポッドキャストシステムにより提供される機能は、大別すると、クリエイタ端末装置により提供されるクリエイタ側の機能と、配信サーバにより提供される各種の配信サービス側の機能と、ユーザ端末装置により提供されるユーザ側の機能とに分けられる。
 クリエイタ端末装置では、クリエイタ(PodCaster)の操作に応じて、番組作成ツールと音声作成ツールが実行され、ポッドキャストの番組が生成される。
 例えば、番組作成ツールは、楽曲配信サービスから提供される選曲用の楽曲リスト(カタログ)から選択された楽曲の楽曲IDと、音声作成ツールにより音声合成時の音調整がなされた当該楽曲の前説と後説のテキストに基づき、ポッドキャストの番組を生成し、番組配信サービスに登録する。
 音声作成ツールは、音声配信サービスから提供される音声作成用のデータに基づき、TTSの音調整機能を提供する。クリエイタは、音声作成ツールを操作して、TTSの音調整機能を利用することで、ユーザ側で再生されるTTS音声を、自身の好みの音声とすることができる。
 番組配信サービスは、番組作成ツールにより登録されたポッドキャストの番組を、ユーザ端末装置に配信するサービスを提供する。
 楽曲配信サービスは、ユーザ端末装置を使用するユーザが契約(加入)している音楽配信サービスに相当する。楽曲配信サービスは、ユーザ端末装置からの要求に応じて、ポッドキャストの番組に設定された楽曲IDにより特定される楽曲を配信する。また、楽曲配信サービスは、選曲用の楽曲リストを、クリエイタ端末装置に提供する。
 音声配信サービスは、ポッドキャストの番組に設定された楽曲の前説と後説のテキストを音声合成して得られるTTS音声を、ユーザ端末装置に配信するサービスを提供する。また、音声配信サービスは、音声作成用のデータを、クリエイタ端末装置に提供する。
 ユーザ端末装置では、ユーザ(Listener)の操作に応じて、番組レンダラが実行され、ポッドキャストの番組が再生される。
 番組レンダラは、番組配信サービスにより公開されているポッドキャストの番組の中から所望の番組を再生するに際し、当該番組の構成に関する構成データ(再現データ)に基づき、楽曲配信サービスから配信される楽曲と、音声配信サービスから配信されるTTS音声のレンダリングを行う。
 これにより、ポッドキャストの番組が再生(再現)され、ユーザによって、視聴可能とされる。なお、ユーザ端末装置で実行される番組レンダラは、再生プレイヤであるとも言える。
 図7は、ポッドキャストの番組の構成を記述したスクリプトの例を示している。
 図7に示すように、バーチャルポッドキャストシステムでは、番組化される楽曲の楽曲IDと、その楽曲の前説と後説とがセットになって複数設定されることで、ポッドキャストの番組が構成されている。このポッドキャストの番組の構成は、図7に示したスクリプトにより記述される。
 図7において、スクリプトには、番組に関する情報として、冒頭に、番組のタイトルや所有者、公開日、楽曲の配信元となるサービス名などが記述される。
 スクリプトには、番組に関する情報に続いて、トラックに関する情報が記述される。図7では、N個のトラックのうち、1つ目のトラックの記述の例を示している。
 トラックには、対象のトラックの番号(Number)と、前説(Warm-up)と、楽曲(song)と、及び後説(After-song)に関する情報が記述される。
 楽曲(song)には、その楽曲を識別するための識別情報(id)と、その曲のタイトル(title)とアーティスト名(artist)に関する情報などが記述される。例えば、"1234567"である楽曲IDを記述することで、"serviceA"である音楽配信サービスに対し、当該楽曲IDにより特定される楽曲の配信を要求することができる。
 前説(Warm-up)と後説(After-song)には、その楽曲に関するコメントに対応するコメント情報が記述される。例えば、前説として、「この曲が書かれたのは、・・・、そんな最高の一曲ですね!」であるテキストを記述し、後説として、「やっぱり最高でね。・・・」であるテキストを記述することで、TTSサービスを利用して、これらのテキストを音声に変換して読み上げることができる。
 図7においては、1つ目のトラックのみを記述、すなわち、1曲目の楽曲に関する情報の記述例を示したが、2曲目以降の楽曲についても、1曲目の楽曲と同様に、楽曲ごとに、楽曲IDと前説と後説をセットにして記述されるようにする。
 このように、楽曲の楽曲IDと、その楽曲に関する前説と後説からなるスクリプトが、クリエイタが使用するクリエイタ端末装置により生成され、番組配信サービスに登録されることで、ユーザに公開される。
 一方で、当該ユーザが使用するユーザ端末装置では、番組配信サービスにより公開されているスクリプトに従い、楽曲IDが示す楽曲が、当該ユーザが音楽配信サービスとの契約により既に獲得している権利を利用して、ストリーミング配信されるように制御するとともに、前説と後説のTTS音声が提供されるように制御する。
 換言すれば、スクリプトには、楽曲の楽曲IDと、前説と後説がテキストで記述されているだけで、ポッドキャストの番組で再生される楽曲や音声のデータそのものが含まれているわけではないが、ユーザ端末装置では、スクリプトに記述された楽曲IDと前説と後説が示す情報に基づき、楽曲や音声のデータが再生されることで、クリエイタが作成した番組が再現されている。
 また、既に存在するプレイリストの楽曲(の楽曲ID)に対し、前説と後説が付加されたスクリプトを生成することで、プレイリストを番組化することが可能であるため、ユーザは、楽曲の前説と後説を入力するだけで、簡単にプレイリストを番組化することができる。
(システムの構成)
 図8は、本技術を適用したコンテンツ提供システムの一実施の形態の構成の例として、バーチャルポッドキャストシステムの構成を示している。
 図8において、コンテンツ提供システム1は、クリエイタ端末装置10、ユーザ端末装置20、番組配信サーバ30A、楽曲配信サーバ30B、及び音声配信サーバ30Cから構成される。
 コンテンツ提供システム1において、クリエイタ端末装置10と、ユーザ端末装置20と、番組配信サーバ30A、楽曲配信サーバ30B、及び音声配信サーバ30Cとは、ネットワーク50を介して相互に接続されている。
 クリエイタ端末装置10は、スマートフォン、タブレット端末、パーソナルコンピュータなどの機器であり、クリエイタにより使用される。
 クリエイタ端末装置10は、クリエイタの操作に応じて、ポッドキャストの番組のスクリプトを生成し、ネットワーク50を介して番組配信サーバ30Aに送信(アップロード)する。
 ユーザ端末装置20は、スマートフォン、タブレット端末、音楽プレイヤ、ゲーム機、パーソナルコンピュータなどの機器であり、ユーザにより使用される。
 ユーザ端末装置20は、ユーザの操作に応じて、ネットワーク50を介して番組配信サーバ30Aにアクセスして、ポッドキャストの番組のスクリプトを受信(ダウンロード)する。
 番組配信サーバ30Aは、番組配信サービスを提供する1又は複数のサーバから構成される。番組配信サービスは、ポッドキャストの番組を配信するサービスであり、番組配信事業者により提供される。
 番組配信サーバ30Aは、ネットワーク50を介してクリエイタ端末装置10から送信(アップロード)される番組のスクリプトを受信し、ユーザ端末装置20を使用するユーザが閲覧可能に記憶媒体に登録する。
 番組配信サーバ30Aは、ネットワーク50を介してユーザ端末装置20から送信される番組の再生要求を受信した場合、当該番組のスクリプトを記憶媒体から読み出し、再生要求元のユーザ端末装置20に配信する。
 楽曲配信サーバ30Bは、音楽配信サービスを提供する1又は複数のサーバから構成される。音楽配信サービスは、インターネットを通じて楽曲を配信するサービスであり、音楽配信事業者により提供される。例えば、音楽配信サービスは、定額制のストリーミングの聴き放題の形式で提供される。
 楽曲配信サーバ30Bは、ネットワーク50を介してユーザ端末装置20から送信される楽曲の配信要求を受信した場合、受信した配信要求に応じた楽曲を特定し、当該楽曲のストリーミングデータを、配信要求元のユーザ端末装置20に配信する。
 音声配信サーバ30Cは、音声配信サービスを提供する1又は複数のサーバから構成される。音声配信サービスは、インターネットを通じてTTS音声や生声等の音声を配信するサービスであり、音声配信事業者により提供される。
 音声配信サーバ30Cは、ネットワーク50を介してユーザ端末装置20から送信される音声の配信要求を受信した場合、受信した配信要求に応じた音声を取得し、当該音声のデータを、配信要求元のユーザ端末装置20に配信する。
 なお、以下の説明では、番組配信サーバ30Aと、楽曲配信サーバ30Bと、音声配信サーバ30Cを特に区別する必要がない場合、配信サーバ30と称して説明する。また、番組配信事業者と、音楽配信事業者と、音声配信事業者は、同一の事業者であってもよいし、異なる事業者であってもよい。
 ネットワーク50は、インターネット、イントラネット、又は携帯電話網などの通信網を含んで構成され、TCP/IP(Transmission Control Protocol / Internet Protocol)等の通信プロトコルを用いた機器間の相互接続を可能にしている。
(クリエイタ端末装置の構成)
 図9は、図8のクリエイタ端末装置10の構成の例を示している。
 図9に示すように、クリエイタ端末装置10において、CPU(Central Processing Unit)101、ROM(Read Only Memory)102、及びRAM(Random Access Memory)103は、バス104により相互に接続される。
 CPU101は、ROM102や記憶部107に記録されたプログラムを実行することで、クリエイタ端末装置10の各部の動作を制御する。RAM103には、各種のデータが適宜記憶される。
 バス104にはまた、入出力I/F110が接続される。入出力I/F110には、入力部105、出力部106、記憶部107、通信部108、及び近距離無線通信部109が接続される。
 入力部105は、各種の入力データを、入出力I/F110を介してCPU101を含む各部に供給する。例えば、入力部105は、操作部111、カメラ部112、及びセンサ部113を有する。
 操作部111は、クリエイタによって操作され、その操作に対応する操作データをCPU101に供給する。操作部111は、物理的なボタンやタッチパネル等から構成される。
 カメラ部112は、そこに入射される被写体からの光を光電変換して、その結果得られる電気信号に対する信号処理を行うことで撮影画像データを生成し、出力する。カメラ部112は、イメージセンサや信号処理部等から構成される。
 センサ部113は、空間情報や時間情報等のセンシングを行い、そのセンシングの結果得られるセンサデータを出力する。
 センサ部113は、加速度センサやジャイロセンサなどを含む。加速度センサは、XYZ軸の3方向の加速度を測定する。ジャイロセンサは、XYZ軸の3軸の角速度を測定する。なお、慣性計測装置(IMU:Inertial Measurement Unit)を設けて、3方向の加速度計と3軸のジャイロスコープにより、3次元の加速度と角速度を測定してもよい。
 また、センサ部113には、クリエイタの声などの音を検出する音センサ(マイクロフォン)、生物の持つ心拍数、体温、又は姿勢といった情報を測定する生体センサ、近接するものを測定する近接センサ、磁場(磁界)の大きさや方向を測定する磁気センサなどの各種のセンサを含めることができる。
 出力部106は、入出力I/F110を介してCPU101からの制御に従い、各種の情報を出力する。例えば、出力部106は、表示部121、及び音出力部122を有する。
 表示部121は、CPU101からの制御に従い、画像データに応じた画像等を表示する。表示部121、液晶パネルやOLED(Organic Light Emitting Diode)パネル等のパネル部と信号処理部などから構成される。
 音出力部122は、CPU101からの制御に従い、音データに応じた音を出力する。音出力部122は、スピーカや出力端子に接続されるヘッドホンなどから構成される。
 記憶部107は、CPU101からの制御に従い、各種のデータやプログラムを記録する。CPU101は、記憶部107から各種のデータを読み出して処理したり、プログラムを実行したりする。
 記憶部107は、半導体メモリ等の補助記憶装置として構成される。記憶部107は、内部ストレージとして構成されてもよいし、メモリカード等の外部ストレージであってもよい。
 通信部108は、CPU101からの制御に従い、ネットワーク50を介して他の機器と通信を行う。通信部108は、セルラー方式の通信(例えばLTE-Advancedや5G等)や、無線LAN(Local Area Network)などの無線通信、又は有線通信に対応した通信モジュールとして構成される。
 近距離無線通信部109は、Bluetooth(登録商標)やNFC(Near Field Communication)等の近距離無線通信規格による無線通信を行い、各種のデータをやりとりする。
 なお、図9に示したクリエイタ端末装置10の構成は一例であって、例えば、入力部としてマイクロフォンを設けたり、GPU(Graphics Processing Unit)等の画像処理回路や、電源回路などを設けたりしても構わない。
 図10は、クリエイタ端末装置10における制御部100の機能的構成の例を示している。制御部100の機能は、CPU101によって、番組作成ツールや音声作成ツール等のプログラムが実行されることで実現される。
 図10において、制御部100は、入力受付部151、楽曲情報取得部152、番組生成部153、音声情報取得部154、音声生成部155、及び登録部156を有する。
 入力受付部151は、入力部105から供給される、クリエイタの操作に応じた操作データを受け付け、番組生成部153に供給する。
 楽曲情報取得部152は、楽曲配信サーバ30Bと通信を行う通信部108から供給される、楽曲に関する楽曲情報を取得し、番組生成部153に供給する。楽曲情報は、楽曲配信サーバ30Bから受信した楽曲リストや楽曲IDなどの情報を含む。
 番組生成部153は、入力受付部151から供給される操作データに基づいて、楽曲情報取得部152から供給される楽曲情報や、前説と後説に関するコメント情報を処理することで、ポッドキャストの番組のスクリプトを生成し、登録部156に供給する。
 音声情報取得部154は、音声配信サーバ30Cと通信を行う通信部108から供給される、前説と後説の音声に関する音声情報を取得し、音声生成部155に供給する。音声情報は、音声配信サーバ30Cから受信した音声合成時や音声作成時の音声に関する情報などの情報を含む。
 音声生成部155は、音声情報取得部154から供給される音声情報を処理することで、クリエイタが前説と後説を設定するための音声を生成し、番組生成部153に供給する。
 番組生成部153は、ポッドキャストの番組を生成するに際し、音声生成部155から供給される音声を用い、クリエイタに対し、前説と後説の設定に関する情報(音声合成時の音声等)を提供することで、当該番組のスクリプトを生成し、登録部156に供給する。
 登録部156は、通信部108を制御して、番組生成部153から供給される番組のスクリプトを、ネットワーク50を介して番組配信サーバ30Aにアップロードすることで登録する。
(ユーザ端末装置の構成)
 図11は、図8のユーザ端末装置20の構成の例を示している。
 図11において、ユーザ端末装置20の構成は、図9に示したクリエイタ端末装置10の構成と対応している。すなわち、CPU201乃至近距離無線通信部209は、上述したCPU101乃至近距離無線通信部109と同様の機能を有しているため、ここではその説明は省略する。
 図12は、ユーザ端末装置20における制御部200の機能的構成の例を示している。制御部200の機能は、CPU201によって、番組レンダラ等のプログラムが実行されることで実現される。
 図12において、制御部200は、番組取得部251、楽曲取得部252、音声取得部253、レンダラ部254、及び提示制御部255を有する。
 番組取得部251は、番組配信サーバ30Aと通信を行う通信部208から供給される、ユーザの操作に応じたポッドキャストの番組のスクリプトを取得し、レンダラ部254に供給する。
 楽曲取得部252は、楽曲配信サーバ30Bと通信を行う通信部208から供給される、楽曲IDに応じた楽曲のストリーミングデータを取得し、レンダラ部254に供給する。
 音声取得部253は、音声配信サーバ30Cと通信を行う通信部208から供給される、前説と後説に応じた音声データを取得し、レンダラ部254に供給する。
 レンダラ部254は、番組取得部251から供給される番組のスクリプトに基づいて、音声取得部253から供給される前説の音声データと、楽曲取得部252から供給される楽曲のストリーミングデータと、音声取得部253から供給される後説の音声データに対するレンダリング処理を行い、その結果得られるデータを、提示制御部255に供給する。
 提示制御部255は、レンダラ部254から供給されるデータを、出力部206に供給することで、ユーザに対して番組を提示する。
 例えば、提示制御部255は、前説の音声データと、楽曲のストリーミングデータと、後説の音声データを、音出力部222に供給することで、番組化された楽曲の音とともに、当該番組に設定された前説と後説の音を、当該楽曲の前後に出力して提示することができる。
(配信サーバの構成)
 図13は、図8の配信サーバ30の構成の例を示している。なお、配信サーバ30は、図8に示した番組配信サーバ30A、楽曲配信サーバ30B、及び音声配信サーバ30Cのいずれかのサーバに相当するものである。
 配信サーバ30において、CPU301、ROM302、RAM303は、バス304により相互に接続されている。バス304には、さらに、入出力I/F310が接続されている。入出力I/F310には、入力部305、出力部306、記憶部307、通信部308、及びドライブ309が接続されている。
 入力部305は、マイクロフォン、キーボード、マウスなどから構成される。出力部306は、スピーカ、ディスプレイなどから構成される。
 記憶部307は、HDD(Hard Disk Drive)や半導体メモリなどから構成される。通信部308は、無線LAN等の無線通信、又はイーサーネット(登録商標)等の有線通信に対応した通信モジュールとして構成される。
 ドライブ309は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブル記録媒体311を駆動する。
 図14は、配信サーバ30における制御部300の機能的構成の例を示している。制御部300の機能は、CPU301によって、各サービスのプログラムが実行されることで実現される。
 図14において、制御部300は、要求受付・応答部351、配信処理部352、及びデータベース353を有する。
 要求受付・応答部351は、クリエイタ端末装置10又はユーザ端末装置20と通信を行う通信部308から供給される各種の要求を受け付け、配信処理部352に供給する。
 配信処理部352は、要求受付・応答部351から供給される各種の要求に応じた配信処理を行う。
 データベース353は、HDDや半導体メモリ等の大容量のストレージからなる記憶部307に記録される。
 例えば、番組配信サーバ30Aのデータベース353には、ポッドキャストの番組のスクリプト等が格納される。また、楽曲配信サーバ30Bのデータベース353には、音楽配信サービスにより提供される楽曲が楽曲IDに対応付けて格納される。さらに、音声配信サーバ30Cのデータベース353には、音声合成時や音声作成時の音声に関する情報、前説や後説の音声データ等が格納される。
 配信処理部352は、配信処理を行うに際し、データベース353に格納された各種のデータを処理して、各種の要求に応じた応答を生成し、要求受付・応答部351に供給する。
 要求受付・応答部351は、通信部308を制御して、配信処理部352から供給される各種の要求に応じた応答を、ネットワーク50を介して要求元のクリエイタ端末装置10又はユーザ端末装置20に送信する。
 次に、コンテンツ提供システム1の各装置で実行される処理の流れを説明する。
(第1の例)
 図15は、番組化された楽曲とともにその楽曲の前説と後説を提供する際に音声合成を利用する場合の処理の流れを示したシーケンス図である。
 図15において、番組作成ツールは、クリエイタ端末装置10により実行され、番組レンダラは、ユーザ端末装置20により実行される。また、図15において、番組配信サービスは、番組配信サーバ30Aにより提供され、音楽配信サービスは、楽曲配信サーバ30Bにより提供され、TTSサービスは、音声配信サーバ30Cにより提供される。
 クリエイタ端末装置10では、制御部100により番組作成ツールが実行され、ステップS11乃至S13の処理が実行される。
 番組作成ツールは、楽曲配信サーバ30Bから送信されてくる楽曲リストを取得し、クリエイタに提示する(S11)。
 番組作成ツールは、クリエイタにより楽曲リストから選択された楽曲の楽曲IDと、クリエイタにより入力された当該楽曲の前説と後説のテキストに基づき、ポッドキャストの番組のスクリプトを生成し(S12)、番組配信サーバ30Aに登録する(S13)。
 これにより、番組配信サーバ30Aでは、クリエイタにより作成されたポッドキャストの番組のスクリプトがデータベース353に格納され、ユーザ端末装置20を使用するユーザによって閲覧可能とされる。
 ユーザ端末装置20では、制御部200により番組レンダラが実行されるとともに、当該番組レンダラが、各配信サーバ30と協働して動作することで、ステップS14乃至S25の処理が実行される。
 番組レンダラでは、ユーザの操作によって、番組配信サーバ30A上で閲覧可能に公開されているポッドキャストの番組の再生が指示された場合、番組配信サーバ30Aから配信される当該番組のスクリプトが受信される(S14,S15)。
 番組レンダラは、受信したスクリプトの冒頭に設定される前説に基づき、音声配信サーバ30Cに対し、当該前説のテキストの音声合成を要求する(S16)。
 音声配信サーバ30Cでは、番組レンダラからの要求に応じて、前説のテキストの音声合成が行われ(S17)、その音声合成の結果が配信される(S18)。
 これにより、番組レンダラでは、音声配信サーバ30Cから配信される音声合成の結果が受信され、レンダリング処理が行われることで、番組化された楽曲に設定された前説の部分のTTS音声が再生される。
 次に、番組レンダラは、受信したスクリプトの前説の次に設定される楽曲IDに基づき、ユーザが契約している音楽配信サービスを提供する楽曲配信サーバ30Bに、当該楽曲IDにより特定される楽曲の配信を要求する(S19)。
 楽曲配信サーバ30Bでは、番組レンダラからの要求に応じて、ユーザによる音楽配信サービスとの契約により獲得している権利が確認され(S20)、当該ユーザが正当な権利を有し、楽曲IDにより特定される楽曲の再生が可能であると判定した場合、当該楽曲のストリーミング配信が行われる(S21)。
 これにより、番組レンダラでは、楽曲配信サーバ30Bから配信される楽曲のストリーミングデータが受信され、レンダリング処理が行われることで、楽曲IDにより特定される楽曲が、番組化された楽曲として再生される。
 その後、ストリーミング配信される楽曲の再生が完了すると、番組レンダラが、受信したスクリプトの楽曲IDの次に設定される後説に基づき、音声配信サーバ30Cに、当該後説のテキストの音声合成を要求する(S22)。
 音声配信サーバ30Cでは、番組レンダラからの要求に応じて、後説のテキストの音声合成が行われ(S23)、その音声合成の結果が配信される(S24)。
 これにより、番組レンダラでは、音声配信サーバ30Cから配信される音声合成の結果が受信され、レンダリング処理が行われることで、番組化された楽曲に設定された後説の部分のTTS音声が再生される。
 また、ポッドキャストの番組のスクリプトには、複数の楽曲ごとの楽曲IDがその楽曲の前説と後説のテキストとともに番組化されているため、ステップS16乃至S24の処理が完了した後に、処理は、ステップS16の処理に戻り(S25)、楽曲IDの数に応じてステップS16乃至S25の処理が繰り返される。
 これにより、番組レンダラでは、スクリプトに設定された楽曲IDごとに、前説、楽曲、後説の順に再生が繰り返して行われ、ユーザによって、ポッドキャストの番組が視聴可能とされる。
 以上、番組化された楽曲とともにその楽曲の前説と後説を提供する際に音声合成を利用する場合において、各装置で実行される処理の流れを説明した。
(番組作成ツールのUIの例)
 図16乃至図23を参照して、クリエイタ端末装置10で実行される番組作成ツールの詳細を説明する。
 図16は、番組作成ツールのユーザインターフェース(UI:User Interface)の第1の例を示している。
 図16において、番組作成画面410は、番組作成ツールの実行時に表示される画面であって、クリエイタの操作に応じて、ポッドキャストの番組を作成するためのUIである。
 番組作成画面410は、操作エリア411、タイトル設定エリア412、オープニングトーク設定エリア413、設定済み楽曲・前説後説エリア414、及び楽曲・前説後説設定エリア415を有する。
 操作エリア411は、番組に設定する楽曲を操作して聴くための領域である。操作エリア411は、楽曲の再生又は停止のためのボタン、前の楽曲と次の楽曲を選択するためのボタン、再生中の楽曲の位置を示すシークバーなどを含む。
 タイトル設定エリア412は、番組のタイトルを設定するための領域である。
 オープニングトーク設定エリア413は、オープニングトークを設定するための領域である。例えば、オープニングトーク設定エリア413では、オープニングトークの音声ファイルが設定されるが、オープニングトークが必要ない場合には必ずしも設定しなくても構わない。
 設定済み楽曲・前説後説エリア414は、設定済みの楽曲とその楽曲の前説と後説が表示される領域である。
 例えば、設定済み楽曲・前説後説エリア414-1では、"Song1"である楽曲に対し、"Speech File1"である前説と"Speech File2"である後説が設定されている。また、設定済み楽曲・前説後説エリア414-2では、"Song2"である楽曲に対し、"Speech File3"である前説と"Speech File4"である後説が設定されている。
 楽曲・前説後説設定エリア415は、楽曲とその楽曲の前説と後説を設定するための領域である。
 例えば、楽曲・前説後説設定エリア415は、楽曲のカタログから所望の楽曲のファイルを選択するための楽曲追加ボタン("Add Music from Song Catalog")、所望の前説を設定するための前説追加ボタン("Add Speech File before")、及び所望の後説を設定するための後説追加ボタン("Add Speech File after")などを含む。
 なお、前説と後説は、クリエイタの入力操作に応じたテキスト形式のファイルとして設定されるほか、例えば、クリエイタの音声入力などに応じて、音声形式のファイルとして設定されても構わない。
 クリエイタによって、この番組作成画面410が操作されることで、例えば、図17に示した番組のスクリプトが作成される。
 図17では、ポッドキャストの番組として、オープニングトーク("Opening Talk File")の次に、1曲目の前説("Speech File1")と、1曲目の楽曲("Song1")と、1曲目の後説("Speech File2")がその順に再生され、さらに、2曲目の前説("Speech File3")と、2曲目の楽曲("Song2")と、2曲目の後説("Speech File4")とがその順に再生されるように番組化されている。
 ところで、この番組作成ツールは、クリエイタが契約している音楽配信サービスで配信しているアプリケーション(以下、音楽配信アプリともいう)の機能として提供してもよい。図18乃至図23は、クリエイタ端末装置10により実行される音楽配信アプリの機能として提供される番組作成ツールの例を示している。
 図18において、楽曲再生画面510は、音楽配信アプリの機能として提供される画面であって、インターネット等のネットワーク50を介して音楽配信サービスにより配信される楽曲を再生するためのUIである。楽曲再生画面510は、再生対象楽曲エリア511、及び楽曲操作エリア512を有する。
 再生対象楽曲エリア511は、再生対象の楽曲のタイトルやアーティスト名、ジャケットの画像などを表示するための領域である。
 楽曲操作エリア512は、楽曲を操作するための領域である。楽曲操作エリア512は、楽曲の再生又は停止のためのボタン、前の楽曲と次の楽曲を選択するためのボタン、再生中の楽曲の位置を示すシークバーなどを含む。
 楽曲再生画面510において、クリエイタにより所定の操作がなされた場合、図19に示したプレイリスト選択画面520が表示される。
 図19において、プレイリスト選択画面520は、音楽配信アプリの機能として提供される画面であって、所望のプレイリストを選択するためのUIである。プレイリスト選択画面520は、プレイリスト一覧エリア521を有する。
 プレイリスト一覧エリア521は、音楽配信サービスにより提供されるプレイリスト、又はクリエイタ自身若しくは他のユーザが作成したプレイリスト(公開されたプレイリスト)などの一覧を表示して、選択するための領域である。
 このプレイリスト一覧エリア521に表示されたプレイリストの中から、図中の枠F1で囲まれた"70 SOUL"のプレイリストが選択された場合、図20に示したプレイリスト編集画面530が表示される。
 図20において、プレイリスト編集画面530は、音楽配信アプリの機能として提供される画面であって、選択対象のプレイリストを編集するためのUIである。プレイリスト編集画面530は、楽曲一覧エリア531、及び楽曲追加ボタン532を有する。
 楽曲一覧エリア531は、選択対象のプレイリストに登録されている楽曲の一覧を表示して、選択するための領域である。楽曲追加ボタン532は、選択対象のプレイリストに、新たな楽曲を追加する際に操作されるボタンである。
 この楽曲一覧エリア531に表示された楽曲の中から、図中の枠F2で囲まれた所望の楽曲が選択され、選択対象の楽曲の編集ボタン533が操作された場合、図21の楽曲・前説後説編集画面540A又は図22の楽曲・前説後説編集画面540Bが表示される。
 図21において、楽曲・前説後説編集画面540Aは、選択対象の楽曲の前説と後説を編集するためのUIである。楽曲・前説後説編集画面540Aは、前説記述エリア541A、及び後説記述エリア542Aを有する。
 前説記述エリア541Aは、選択対象の楽曲に対し、前説のテキストを記述するための領域である。
 例えば、クリエイタ端末装置10が、タッチパネルを有するスマートフォン等の機器である場合、クリエイタは、タッチパネルが重畳された表示部121に表示されるソフトウェアキーボードをタップ操作して、所望の前説をテキスト入力することができる。あるいは、クリエイタ端末装置10が、クラウド上の音声認識API(Application Programming Interface)のサービスを利用可能である場合には、当該音声認識サービスを利用して、クリエイタによる所望の前説の音声入力をテキストに変換しても構わない。
 あるいは、クリエイタ端末装置10が、キーボードを有するパーソナルコンピュータ等の機器である場合には、クリエイタは、キーボードを操作して、所望の前説のコメントを入力すればよい。
 後説記述エリア542Aは、選択対象の楽曲に対し、後説のテキストを記述するための領域である。後説記述エリア542Aには、クリエイタによるソフトウェアキーボードの操作や音声入力の操作などに応じた所望の後説のテキストが入力される。
 また、図22において、楽曲・前説後説編集画面540Bは、選択対象の楽曲の前説と後説を編集するためのUIである。楽曲・前説後説編集画面540Bは、前説記述エリア541B、及び後説記述エリア542Bを有する。
 前説記述エリア541Bは、選択対象の楽曲に対し、前説のテキストを記述するための領域である。前説記述エリア541Bには、クリエイタによるソフトウェアキーボードの操作や音声入力の操作などに応じた所望の前説のテキストが入力される。
 後説記述エリア542Bは、選択対象の楽曲に対し、後説のテキストを記述するための領域である。後説記述エリア542Bには、クリエイタによるソフトウェアキーボードの操作や音声入力の操作などに応じた所望の後説のテキストが入力される。
 このようにして、クリエイタは、プレイリストの各楽曲に、前説と後説のテキストを追加することで、プレイリストを番組化することができる。なお、上述した楽曲・前説後説編集画面540A,540Bは、楽曲に対して前説と後説を設定するためのUIの一例であって、他のUIにより前説と後説を設定しても構わない。
 図20の説明に戻り、プレイリスト編集画面530において、クリエイタにより所定の操作がなされた場合、図23に示したプレイリスト設定画面550が表示される。
 図23において、プレイリスト設定画面550は、音楽配信アプリの機能として提供される画面であって、番組化されたプレイリストに関する各種の設定を行うためのUIである。プレイリスト設定画面550は、設定エリア551を有する。
 設定エリア551には、番組化されたプレイリストの名前の変更、番組化されたプレイリストの公開、番組化されたプレイリストの削除などを設定するための項目を含む。この設定エリアに表示された項目の中から、図中の枠F3で囲まれた「公開する」がタップ操作された場合、番組化されたプレイリストが他のユーザに公開される。
 これにより、番組化されたプレイリストのスクリプト、つまり、番組のスクリプトが、番組配信サーバ30Aのデータベース353に格納され、ユーザ端末装置20を使用するユーザにより閲覧可能とされる。
 このように、音楽配信サービスが提供する音楽配信アプリの一機能として、番組のクリエイション機能を追加することができる。
 例えば、クリエイタは、音楽配信サービスのプレミアムユーザとしてプレイリストを番組化して各楽曲に前説と後説を設定し、番組化されたプレイリストのスクリプトを公開することができる。このとき、音楽配信アプリにより生成されたスクリプトに設定される楽曲IDは、クリエイタが契約している音楽配信サービスで管理される楽曲のIDとされる。
(第2の例)
 図24は、楽曲の前説と後説が音声合成を利用して提供可能な場合に、番組化された楽曲をプレイリストとして再生する場合の処理の流れを示したシーケンス図である。
 図24において、番組作成ツールと番組レンダラが、クリエイタとユーザの各端末装置でそれぞれ実行され、番組配信サービスと、音楽配信サービスと、TTSサービスが、各配信サーバによりそれぞれ提供されることは、図15を参照して説明した第1の例と同様である。
 図24のステップS31乃至S33においては、図15のステップS11乃至S13と同様に、番組作成ツールによって、番組のスクリプトが生成され、番組配信サーバ30Aに登録されている。
 番組レンダラでは、ユーザの操作によって、番組配信サーバ30A上で閲覧可能に公開されている番組の再生が指示された場合、番組配信サーバ30Aから配信される当該番組のスクリプトが受信される(S34,S35)。ここでは、例えば、ユーザによって、番組を、プレイリストとして再生するように指示されているものとする。
 番組レンダラは、ユーザが契約している音楽配信サービスを提供する楽曲配信サーバ30Bに対し、受信したスクリプトに設定される楽曲IDにより特定される楽曲の配信を要求する(S36)。
 楽曲配信サーバ30Bでは、番組レンダラからの要求に応じて、ユーザによる音楽配信サービスとの契約により獲得している権利が確認され(S37)、当該ユーザが正当な権利を有し、楽曲IDにより特定される楽曲の再生が可能であると判定した場合、当該楽曲のストリーミング配信が行われる(S38)。
 これにより、番組レンダラでは、楽曲配信サーバ30Bから配信される楽曲のストリーミングデータが受信され、レンダリングが行われることで、楽曲IDにより特定される楽曲が再生される。
 また、番組のスクリプトには、複数の楽曲の楽曲IDが再生順にリスト化されているため、ステップS36乃至S38の処理が完了した後に、処理は、ステップS36に戻り(S39)、楽曲IDの数に応じてステップS36乃至S39の処理が繰り返される。
 これにより、番組レンダラでは、スクリプトに設定された楽曲IDの順に、楽曲の再生が繰り返して行われ、ユーザによって、プレイリストとして再生される楽曲が視聴可能とされる。
 このように、ユーザによりプレイリスト再生の要求を受け付けたときには、当該ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれる前説と後説の読み出しは行わずに、そのスクリプトに含まれる楽曲IDが示す楽曲が読み出されてユーザに提供される。
 以上、楽曲の前説と後説が音声合成を利用して提供可能な場合に、番組化された楽曲をプレイリストとして再生する場合において、各装置で実行される処理の流れを説明した。
(第3の例)
 図25は、番組化された楽曲とともにその楽曲の前説と後説を提供する際に生声を利用する場合の処理の流れを示したシーケンス図である。
 図25において、番組作成ツールと番組レンダラが、クリエイタとユーザの各端末装置でそれぞれ実行され、番組配信サービスと、音楽配信サービスとが、各配信サーバによりそれぞれ提供されることは、図15を参照して説明した第1の例と同様である。一方で、図25の第3の例では、図15に示した第1の例とは異なり、音声配信サーバ30Cによって、TTSサービスの代わりに、生声配信サービスが提供される。
 図25のステップS51乃至S53においては、図15のステップS11乃至S13と同様に、番組作成ツールによって、ポッドキャストの番組のスクリプトが生成され、番組配信サーバ30Aに登録される。
 ただし、図25のシーケンス図では、楽曲の前説と後説を、テキストとしてスクリプトに含めるのではなく、クリエイタの生の声で前説と後説を読み上げているため、その音声データ(のファイル)が音声配信サーバ30Cに登録される(S54)。
 すなわち、番組配信サーバ30Aに登録されるスクリプトには、楽曲を特定する楽曲IDとともに、前説と後説の生声の音声データへのリンク情報が設定される。
 図25のステップS55,S56においては、図15のステップS14,S15と同様に、番組レンダラでは、番組配信サーバ30A上で閲覧可能に公開されているポッドキャストの番組の再生が指示された場合、番組配信サーバ30Aから配信される当該番組のスクリプトが受信される。
 番組レンダラは、受信したスクリプトの冒頭に設定される前説のリンク情報に基づき、音声配信サーバ30Cにアクセスし、当該前説の生声配信を要求する(S57)。
 音声配信サーバ30Cでは、番組レンダラからの要求に応じて、クリエイタにより登録された前説の生声の音声データが処理され(S58)、その生声の音声データが配信される(S59)。
 これにより、番組レンダラでは、音声配信サーバ30Cから配信される前説の生声の音声データが受信され、レンダリングが行われることで、番組化された楽曲に設定された前説の部分の生声が再生される。
 図25のステップS60乃至S62においては、図15のステップS19乃至S21と同様に、番組レンダラでは、受信したスクリプトの前説の次に設定される楽曲IDに基づき、楽曲配信サーバ30Bからストリーミング配信される楽曲の再生が行われる。
 その後、ストリーミング配信される楽曲の再生が終了すると、番組レンダラが、受信したスクリプトの楽曲IDの次に設定される後説のリンク情報に基づき、音声配信サーバ30Cにアクセスし、当該後説の生声配信を要求する(S63)。
 音声配信サーバ30Cでは、番組レンダラからの要求に応じて、クリエイタにより登録された後説の生声の音声データが処理され(S64)、その生声の音声データが配信される(S65)。
 これにより、番組レンダラでは、音声配信サーバ30Cから配信される後説の生声の音声データが受信され、レンダリングが行われることで、番組化された楽曲に設定された後説の部分の生声が再生される。
 また、ポッドキャストの番組のスクリプトには、複数の楽曲の楽曲IDがその曲の前説と後説の生声のリンク情報とともに番組化されているため、ステップS57乃至S65の処理が完了した後に、処理は、ステップS57の処理に戻り(S66)、ステップS57乃至S66の処理が繰り返される。
 これにより、番組レンダラでは、スクリプトに設定された楽曲IDごとに、前説、楽曲、後説の順に再生が繰り返して行われ、ユーザによって、ポッドキャストの番組が視聴可能とされる。
 以上、番組化された楽曲とともにその楽曲の前説と後説を提供する際に生声を利用する場合において、各装置で実行される処理の流れを説明した。
(第4の例)
 図26は、楽曲の前説と後説が生声を利用して提供可能な場合に、番組化された楽曲をプレイリストとして再生する場合の処理の流れを示したシーケンス図である。
 図26において、番組作成ツールと番組レンダラが、クリエイタとユーザの各端末装置でそれぞれ実行され、番組配信サービスと、音楽配信サービスと、生声配信サービスが、各配信サーバによりそれぞれ提供されることは、図25を参照して説明した第3の例と同様である。
 図26のステップS71乃至S74においては、図25のステップS51乃至S54と同様に、番組作成ツールによって、番組のスクリプトが番組配信サーバ30Aに登録されるとともに、クリエイタの生の声で読み上げられた前説と後説の音声データ(のファイル)が音声配信サーバ30Cに登録されている。
 番組レンダラでは、ユーザの操作によって、番組配信サーバ30A上で閲覧可能に公開されている番組の再生が指示された場合、番組配信サーバ30Aから配信される当該番組のスクリプトが受信される(S75,S76)。ここでは、例えば、ユーザによって、番組を、プレイリストとして再生するように指示されているものとする。
 番組レンダラは、ユーザが契約している音楽配信サービスを提供する楽曲配信サーバ30Bに、受信したスクリプトに設定される楽曲IDにより特定される楽曲の配信を要求する(S77)。
 楽曲配信サーバ30Bでは、番組レンダラからの要求に応じて、ユーザによる音楽配信サービスとの契約により獲得している権利が確認され(S78)、当該ユーザが正当な権利を有し、楽曲IDにより特定される楽曲の再生が可能であると判定した場合、当該楽曲のストリーミング配信が行われる(S79)。
 これにより、番組レンダラでは、楽曲配信サーバ30Bから配信される楽曲のストリーミングデータが受信され、レンダリングが行われることで、楽曲IDにより特定される楽曲が再生される。
 また、番組のスクリプトには、複数の楽曲の楽曲IDが再生順にリスト化されているため、ステップS77乃至S79の処理が完了した後に、処理は、ステップS77に戻り(S80)、ステップS77乃至80の処理が繰り返される。
 これにより、番組レンダラでは、スクリプトに設定された楽曲IDの順に、楽曲の再生が繰り返して行われ、ユーザによって、プレイリストとして再生される楽曲が視聴可能とされる。
 このように、ユーザによりプレイリスト再生の要求を受け付けたときには、当該ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれる前説と後説の読み出しは行わずに、そのスクリプトに含まれる楽曲IDが示す楽曲が読み出されてユーザに提供される。
 以上、楽曲の前説と後説が生声を利用して提供可能な場合に、番組化された楽曲をプレイリストとして再生する場合において、各装置で実行される処理の流れを説明した。
(処理の全体像)
 図27と図28は、第1の実施の形態における処理の全体像を説明するフローチャートである。
 図27と図28に示した処理は、本技術を適用したコンテンツ提供システムにおけるクリエイタ端末装置10(の制御部100)と、ユーザ端末装置20(の制御部200)と、配信サーバ30(の制御部300)とが協働して動作することで実現される。
 すなわち、この処理は、制御部100、制御部200、及び制御部300のうち、少なくともいずれか1つの制御部により実行される。
 コンテンツ提供システム1では、図27に示すように、クリエイタ端末装置10を使用するクリエイタからの入力があった場合(S211の「Yes」)、その入力に基づき、コンテンツの識別情報と、そのコンテンツの前説と後説に対応するコメント情報からなるスクリプトが生成され(S212)、そのスクリプトが、ユーザ端末装置20を使用するユーザに閲覧可能に所定の記憶媒体に格納される(S213)。
 ここで、コンテンツは、音楽配信サービスで配信される楽曲などを含み、そのコンテンツの識別情報は、楽曲を識別可能な楽曲IDなどを含む。また、前説と後説は、コンテンツに関するコメントの一例であり、前説と後説のうち、少なくともいずれか一方が設定されていればよい。例えば、楽曲を番組化するに際して、楽曲単位で前説又は後説を挿入するほか、前説としてナレーション等を挿入してから、3曲連続で楽曲を再生したり、4曲連続で楽曲を再生した後に、後説として曲の感想等を挿入したりしてもよい。
 コメント情報は、コメントを表すテキスト、又はクリエイタの生声へのリンク情報などを含む。なお、コメント情報は、コンテンツに関するコメントに対応するものとして説明するが、必ずしもコンテンツに関連するものとは限らず、コンテンツに関係しないコメントに対応するものでも構わない。所定の記憶媒体は、例えば、番組配信サーバ30Aの記憶部307(のデータベース353)とすることができる。
 また、コンテンツ提供システム1では、図28に示すように、ユーザ端末装置20を使用するユーザによって、所定の記憶媒体に格納されたスクリプトへの再生要求がなされた場合(S231の「Yes」)、まず、スクリプトに含まれるコメント情報に従って前説が読み出され、当該ユーザに提供するように制御される(S232)。
 ここで、所定の記憶媒体は、例えば、番組配信サーバ30Aの記憶部307(のデータベース353)とすることができる。また、スクリプトのコメント情報に従って読み出される前説は、TTS音声又は生声などの音声を含む。
 続いて、コンテンツ提供システム1では、スクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しが、ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行され、当該ユーザに提供するように制御される(S233)。
 ここで、コンテンツ識別情報は、楽曲を識別可能な楽曲IDなどを含む。また、例えば、特定のサービスは、音楽配信サービスであり、ユーザが既に獲得している権利は、有料のプレミアムユーザや、無料のフリーユーザの権利などを含む。
 また、コンテンツ提供システム1では、当該コンテンツの提供の後には、スクリプトに含まれるコメント情報に従って後説が読み出され、当該ユーザに提供するように制御される(S234)。
 ここで、スクリプトのコメント情報に従って読み出される後説には、TTS音声又は生声などの音声を含む。なお、コメント情報が示すコメント(前説や後説等のテキスト)を外国語に変換(翻訳)して、ユーザに提供しても構わない。例えば、システム側でユーザのプロファイルを把握している場合に、当該ユーザの母国語が分かっているときには、コメントを母国語に変換してテキストでユーザに提供してもよいし、あるいは、テキストをTTSにより音声合成してその音声合成結果をユーザに提供してもよい。
 以上のように、コンテンツを番組化するに際して、ユーザのサービスとの契約やテキスト音声合成等を利用して、コンテンツとともにそのコンテンツ等に関するコメントを提供しているため、より簡単に、コンテンツとそのコメントを提供することができる。
<2.第2の実施の形態>
 番組化された楽曲を配信する事業者は、ポッドキャストの番組を配信する事業者と同一の事業者に限らず、異なる事業者であってもよい。例えば、ある音楽配信サービスにより提供される特定の音楽配信アプリ上で作成した番組のスクリプトを、他の音楽配信サービスに提供することができる。
 具体的には、作成された番組のスクリプトが、特定の音楽配信アプリを提供する音楽配信サービスだけでなく、他の音楽配信サービスからも参照可能に格納されるようにする。その際に、特定の音楽配信アプリが認識可能な楽曲IDなどの識別情報に加えて、楽曲を検索できるようなメタデータが併せて格納されるようにする。例えば、このメタデータとしては、曲名、作詞家、作曲家、アーティスト名などを含めることができる。
 そして、他の音楽配信サービスでは、当該他の音楽配信サービスと契約しているユーザが使用するユーザ端末装置20からの再生要求に応じて、メタデータに含まれる曲名などの情報を用い、自己が管理しているデータベースから楽曲を特定し、特定した楽曲をストリーミング配信すればよい。
 なお、ユーザと、他の音楽配信サービスとの契約により、その楽曲再生に関わる著作権処理は解消済みとされる。また、このような、他の音楽配信サービスから配信された楽曲の再生に応じたレベニューの一部が、特定の音楽配信アプリを提供した音楽配信サービスに還元されたり、その一部がクリエイタに還元されたりしてもよい。
 なお、第2の実施の形態におけるコンテンツ提供システム1の構成は、第1の実施の形態の構成と同様であるため、その説明は省略する。以下、コンテンツ提供システム1の各装置で実行される処理の流れを説明する。
(配信事業者が異なる場合の処理の流れ)
 図29は、ある音楽配信サービスを利用して作成したスクリプトを他の音楽配信サービスに提供する場合の処理の流れを説明するシーケンス図である。
 図29の例では、番組作成ツールと番組レンダラが、クリエイタとユーザの各端末装置でそれぞれ実行され、番組配信サービスと、音楽配信サービスと、生声配信サービスが、各配信サーバによりそれぞれ提供されることは、図25を参照して説明した第3の例などと同様である。
 また、図29の例では、音楽配信サービスAを提供するA社の楽曲配信サーバ30B-1と、音楽配信サービスBを提供するB社の楽曲配信サーバ30B-2が設けられ、番組配信サーバ30Aは、A社により提供されるものとする。また、ユーザ端末装置20では、B社により提供される音楽配信アプリとしての番組レンダラが実行されているものとする。
 図29のステップS91乃至S94においては、図25のステップS51乃至S54と同様に、クリエイタ端末装置10により実行される番組作成ツールによって、番組のスクリプトがA社の番組配信サーバ30Aに登録されるとともに、クリエイタの生の声で読み上げられた前説と後説の音声データ(のファイル)が音声配信サーバ30Cに登録されている。
 ユーザ端末装置20では、B社の番組レンダラが実行され、ユーザの操作によって、A社の番組配信サーバ30A上で閲覧可能に公開されている番組の再生が指示された場合、A社の番組配信サーバ30Aから配信される当該番組のスクリプトが受信される(S95,S96)。
 このスクリプトには、番組化された楽曲に関して、楽曲IDの他に、コンテンツを検索するためのメタデータが含まれる。
 例えば、メタデータとしては、曲名、作詞家、作曲家、アーティスト名などを含む。より具体的には、図7に示したスクリプトにおける"title"や"artist"等の項目に指定される情報を、メタデータとして用いることができる。
 次に、B社の番組レンダラは、受信したスクリプトに基づき、ユーザが契約している音楽配信サービスBを提供するB社の楽曲配信サーバ30B-2に、メタデータにより特定される楽曲の配信を要求する(S97)。
 楽曲配信サーバ30B-2では、B社の番組レンダラからの要求に応じて、ユーザによる音楽配信サービスBとの契約により獲得している権利が確認され、当該ユーザが正当な権利を有すると判定された場合、メタデータを用いた楽曲の特定が行われる(S98)。
 楽曲配信サーバ30B-2では、音楽配信サービスBで配信している楽曲を対象として、メタデータを用いた楽曲の検索が行われることで、メタデータにより楽曲が特定できた場合、ユーザ端末装置20に対し、当該楽曲のストリーミング配信が行われる(S99)。
 この場合、B社の番組レンダラでは、当該楽曲の提供の前に、スクリプトに設定される前説のリンク情報に基づき、音声配信サーバ30Cにアクセスすることで、番組化された楽曲に設定された前説の部分の生声が再生される(S101乃至S102)。続いて、B社の番組レンダラでは、B社の楽曲配信サーバ30B-2からストリーミング配信された楽曲の再生が行われる。
 その後、ストリーミング配信される楽曲の再生が終了すると、B社の番組レンダラでは、スクリプトに設定される後説のリンク情報に基づき、音声配信サーバ30Cにアクセスすることで、番組化された楽曲に設定された後説の部分の生声が再生される(S103乃至S105)。
 なお、ステップS97乃至S106の処理が繰り返されることで、B社の番組レンダラでは、スクリプトに設定された楽曲IDごとに、前説、楽曲、後説の順に再生が繰り返して行われ、ユーザによって、ポッドキャストの番組が視聴可能とされる。
 一方で、ステップS98の処理で、B社の楽曲配信サーバ30B-2によって、B社の番組レンダラからの要求に含まれるメタデータにより楽曲を特定できなかった場合には、例えば、次のような処理が行われる。
 第1に、B社の楽曲配信サーバ30B-2は、B社の番組レンダラに対してその旨を応答し、特定できなかった楽曲とその楽曲の前説と後説の再生がスキップされるようにする。これにより、ユーザ端末装置20では、B社の番組レンダラによって、対象の楽曲がスキップされ、次の楽曲(又は次の楽曲の前説)の再生が開始される。
 第2に、B社の楽曲配信サーバ30B-2は、A社の楽曲配信サーバ30B-1から、メタデータに応じた楽曲のサンプル曲が、ユーザ端末装置20に配信されるようにする。これにより、ユーザ端末装置20では、B社の番組レンダラによって、ユーザが未契約の音楽配信サービスAから配信されるサンプル曲が再生される。
 なお、図29の例では、番組化された楽曲とともにその楽曲の前説と後説を提供する際に生声を利用する場合を示したが、楽曲の前説と後説が音声合成を利用して提供されても構わない。
(処理の全体像)
 図30と図31は、第2の実施の形態における処理の全体像を説明するフローチャートである。
 図30と図31に示した処理は、本技術を適用したコンテンツ提供システムにおけるクリエイタ端末装置10(の制御部100)と、ユーザ端末装置20(の制御部200)と、配信サーバ30(の制御部300)とが協働して動作することで実現される。
 コンテンツ提供システム1では、図30に示すように、クリエイタ端末装置10を使用するクリエイタからの入力があった場合(S311の「Yes」)、その入力に基づき、第1のサービスが認識可能なコンテンツの識別情報と、コンテンツを検索するためのメタデータと、コンテンツの前説と後説に対応するコメント情報からなるスクリプトが生成され(S312)、そのスクリプトが、ユーザ端末装置20を使用するユーザに閲覧可能に所定の記憶媒体に格納される(S313)。
 ここで、コンテンツは、音楽配信サービスで配信される楽曲などを含み、そのコンテンツの識別情報は、楽曲を識別可能な楽曲IDなどを含む。また、前説と後説は、コンテンツに関するコメントの一例であり、前説と後説のうち、少なくともいずれか一方が設定されていればよい。
 また、第1のサービスは、例えば、A社が提供する音楽配信サービスAである。また、メタデータには、曲名等が含まれる。所定の記憶媒体は、例えば、番組配信サーバ30Aのデータベース353とすることができる。
 また、コンテンツ提供システム1では、図31に示すように、第2のサービスと契約しているユーザによって、所定の記憶媒体に記録されたスクリプトへの再生要求がなされた場合(S331の「Yes」)、コンテンツを検索するためのメタデータに基づき、第2のサービスが管理するコンテンツの中から、対応するコンテンツを特定する処理が行われ(S332)、対応するコンテンツが特定できたか否かが判定される(S333)。
 ここで、第2のサービスは、例えば、B社が提供する音楽配信サービスBである。また、コンテンツは、音楽配信サービスで配信される楽曲などを含み、メタデータには、曲名等が含まれる。
 ステップS333の判定処理で、対応するコンテンツが特定できたと判定された場合には、ユーザが第2のサービスとの契約により既に獲得している権利を利用して、当該コンテンツの読み出しが実行され、当該ユーザに提供するように制御される(S334)。
 すなわち、ユーザが既に獲得している権利は、B社が提供する音楽配信サービスBにおける有料のプレミアムユーザや、無料のフリーユーザの権利などを含み、ユーザ端末装置20では、音楽配信サービスBから配信される楽曲が再生される。
 一方で、ステップS333の判定処理で、対応するコンテンツが特定できなかったと判定された場合には、当該コンテンツ及び対応するコメントの読み出しがスキップされるように制御されるか、あるいは、第1のサービスが管理する当該コンテンツに対応するサンプルデータの読み出しが実行され、ユーザに提供するように制御される(S335)。
 すなわち、ユーザ端末装置20では、再生対象の楽曲とその楽曲の前説と後説がスキップされるか、あるいは、A社が提供する音楽配信サービスAから配信されるサンプル曲が再生される。
<3.第3の実施の形態>
 番組化された楽曲に設定される前説と後説に対して、例えば、誹謗中傷用語などの楽曲の前説や後説として相応しくないワードや文脈などを自動で特定し、そのようなワードや文脈などが特定された文章が存在する場合には、番組の作成段階で警告を表示したり、番組の登録段階で登録を不許可にしたりすることができる。
 また、番組が登録された後に、楽曲の著作権者等から、特定の前説や後説と楽曲との連続再生を許可しない旨の指摘があった場合には、例えば、その前説や後説のみ再生を禁止したり(楽曲の再生は可能)、その前説、楽曲、後説の順の再生を禁止したり、楽曲そのものの再生を禁止したりしてもよい。
 このように、ポッドキャストの番組の登録や提供を行うに際して、最低限の利用許諾機能を用いることができる。
(配信サーバの他の構成)
 図32は、配信サーバ30における制御部300の機能的構成の他の例を示している。
 図32においては、図14と同様に、制御部300が、要求受付・応答部351、配信処理部352、及びデータベース353を有しているが、文章チェック部161がさらに設けられている。
 番組配信サーバ30Aにおいて、配信処理部352は、番組作成ツールから番組のスクリプトの登録が要求されたとき、当該番組のスクリプトに含まれる前説と後説のテキストを、文章チェック部161に供給する。
 文章チェック部161は、配信処理部352から供給される前説と後説のテキストに対して、文章チェック処理を行い、その文章チェックの結果を、配信処理部352に供給する。
 この文章チェック処理では、例えば、形態素解析や構文解析を含む自然言語処理などが行われ、前説や後説のテキストの文章が解析されて、誹謗中傷用語などの単語や文脈(文意)などが含まれるかどうかがチェックされる。
 配信処理部352は、文章チェック部161から供給される文章チェックの結果が、前説と後説の文章として相応しいことを示している場合、番組作成ツールから登録を要求された番組のスクリプトを、データベース353に格納する。
 なお、文章チェック部161は、例えば、番組配信サーバ30Aの内部に設けることができるが、外部のサーバとして設けられるようにして、番組配信サーバ30Aからの要求に応じて、文章のチェックを行い、その文章チェックの結果を応答するようにしても構わない。
(文章チェックを行う場合の処理の流れ)
 図33は、文章チェックを行う場合の処理の流れを示したシーケンス図である。
 図33の例では、番組作成ツールと番組レンダラが、クリエイタとユーザの各端末装置でそれぞれ実行され、番組配信サービスと、音楽配信サービスと、TTSサービスが、各配信サーバによりそれぞれ提供されることは、図15を参照して説明した第1の例などと同様であるが、番組配信サーバ30Aでは、文章チェックに関する処理も実行される。
 クリエイタ端末装置10では、番組作成ツールが実行され、各配信サーバ30と協働して動作することで、ステップS111乃至124の処理が実行される。
 番組作成ツールは、楽曲配信サーバ30Bから送信されてくる楽曲リストを取得し、クリエイタに提示する(S111)。
 番組作成ツールは、クリエイタにより楽曲リストから選択された楽曲の楽曲IDと、クリエイタにより入力された当該楽曲の前説と後説のテキストに基づき、ポッドキャストの番組のスクリプトを生成し(S112)、番組配信サーバ30Aに対して登録依頼を行う(S113)。
 このとき、番組配信サーバ30Aでは、番組作成ツールにより登録が要求された前説と後説のテキストを、文章チェック部361に送ることで、前説と後説の文章チェックを要求する(S114)。
 文章チェック部361では、文章チェックの要求に応じて、前説と後説のテキストの文章チェックが行われ(S115)、その文章チェックの結果を通知する(S116)。
 番組配信サーバ30Aでは、文章チェック部361からの応答に基づき、文章チェックの結果が、番組作成ツールに通知される(S117)。これにより、番組作成ツールでは、文章チェックの結果が表示される(S118)。
 例えば、文章チェック部361は、前説と後説の文章として相応しくないと判定した場合、不許可である旨を通知する。
 この不許可の通知に際しては、チェックされた文章における不許可になった箇所を通知してもよい。この不許可箇所を含む不許可通知は、番組作成ツールに通知され、クリエイタに対し、当該クリエイタにより入力された楽曲の前説と後説が不許可であることと、その不許可になった箇所の文章が提示される。
 クリエイタは、番組作成ツールにより提示された通知に基づき、番組化する楽曲の前説と後説の文章を修正することができる。
 番組作成ツールは、クリエイタにより修正された楽曲の前説と後説のテキストに基づき、ポッドキャストの番組を再生成し(S119)、番組配信サーバ30Aに対して再度の登録依頼を行う(S120)。
 このとき、番組配信サーバ30Aは、番組作成ツールにより登録が要求された前説と後説のテキストを、文章チェック部361に送ることで、前説と後説の文章チェックを要求する(S121)。
 文章チェック部361では、文章チェックの要求に応じて、前説と後説のテキストの文章チェックが行われ(S122)、その文章チェックの結果を通知する(S123)。
 例えば、文章チェック部361は、前説と後説の文章として相応しいと判定した場合、許可である旨を通知する。
 番組配信サーバ30Aでは、文章チェック部361からの許可通知に基づき、番組作成ツールから再登録が依頼された修正後の楽曲の前説と後説のテキストを含む番組のスクリプトがデータベース353に格納され、ユーザ端末装置20を使用するユーザによって閲覧可能とされる(S124)。
(処理の全体像)
 図34は、第3の実施の形態における処理の全体像を説明するフローチャートである。
 図34に示した処理は、本技術を適用したコンテンツ提供システムにおけるクリエイタ端末装置10(の制御部100)と、配信サーバ30(の制御部300)とが協働して動作することで実現される。
 コンテンツ提供システム1では、図34に示すように、クリエイタ端末装置10を使用するクリエイタからの入力に応じたスクリプトが生成された場合(S411の「Yes」)、そのスクリプトに含まれる、コンテンツの前説と後説に対応するコメント情報が示すコメントの内容が分析され(S412)、その分析結果に基づき、当該コメントの内容がコンテンツに関するコメントとして相応しいかどうかが判定される(S413)。
 ここで、コンテンツは、音楽配信サービスで配信される楽曲などを含む。また、前説と後説は、コンテンツに関するコメントの一例であり、前説と後説のうち、少なくともいずれか一方が設定されていればよい。
 ステップS413の判定処理で、当該コメントの内容がコンテンツに関するコメントとして相応しいと判定された場合には、そのコメント情報を含むスクリプトが、ユーザ端末装置20を使用するユーザに閲覧可能に所定の記憶媒体に格納される(S414)。
 すなわち、番組化する楽曲の前説や後説に、誹謗中傷用語などのワードや文脈などが含まれていない場合には、前説や後説に相応しいと判断され、その番組のスクリプトが、番組配信サーバ30Aのデータベース353に登録される。
 一方で、ステップS413の判定処理で、当該コメントの内容がコンテンツに関するコメントとして相応しくないと判定された場合には、その旨が、クリエイタが使用するクリエイタ端末装置10に通知される。
 すなわち、番組化する楽曲の前説や後説に、誹謗中傷用語などのワードや文脈などが含まれる場合には、それらが自動で特定され、番組作成ツールによる番組の作成段階で警告を表示したり、番組の登録段階で登録を不許可にしたりする。
<4.第4の実施の形態>
 ポッドキャストの番組には、広告を挿入してもよい。例えば、番組化された楽曲に設定される前説又は後説の少なくともいずれか一方の内容を分析し、その分析結果に応じて、関連する広告を、前説の前、又は後説の後に挿入することができる。
 番組に挿入される広告は、例えば、スクリプトにテキストで記述することができ、前説と後説のテキストの音声合成と同じ音素に基づいて、音声合成を行うことができる。
 すなわち、ユーザ端末装置20では、ユーザによって選択された番組のスクリプトに従い、そのスクリプトに含まれる前説と後説を特定の音声で音声合成してユーザに提供した場合に、広告のテキストも、当該特定の音声で音声合成してユーザに提供するようにする。
(システムの他の構成)
 図35は、本技術を適用したコンテンツ提供システムの一実施の形態の他の構成の例を示している。
 図35においては、図8と同様に、コンテンツ提供システム1が、クリエイタ端末装置10、ユーザ端末装置20、番組配信サーバ30A、楽曲配信サーバ30B、及び音声配信サーバ30Cを含んでいるが、広告配信サーバ30Dがさらに設けられている。
 広告配信サーバ30Dは、広告配信サービスを提供する1又は複数のサーバから構成される。広告配信サービスは、インターネットを通じて広告を配信するサービスであり、例えば、広告配信事業者により提供される。
 例えば、広告配信サーバ30Dは、番組配信サーバ30Aからの要求に応じて、広告管理用や広告用のデータベース353で管理している広告を特定し、特定した広告(広告本文)を配信する。
 なお、広告配信サーバ30Dは、図13と図14に示した配信サーバ30の構成と制御部300の機能的構成と同様の構成を有している。
(広告の例)
 図36は、ポッドキャストの番組のスクリプトに挿入される広告の例を示している。
 上述したように、ポッドキャストの番組のスクリプトには、番組化される楽曲(song)と、その楽曲の前説(Warm-up)と後説(After-song)とがセットになって記述されるが、図36では、後説の後に、広告のテキストが挿入されている。
 図36の例では、前説に、「・・・、今でも夏に聞きたくなる、・・・」であるテキストが含まれ、後説に、「・・・暑い夏が本当に楽しくなる曲ですね!」であるテキストが含まれており、これらのテキストが分析される。
 番組のスクリプトでは、これらのテキストの分析結果に応じて、「夏」であるキーワードに関する広告として、「夏の暑い日には、やっぱりビール。のど越し爽やかX社のドライ!」であるテキストからなるビールの広告が挿入されている。また、ビールの広告のテキストとともに、X社のビールに関するウェブページのURL(Uniform Resource Locator)も記述されている。
 ここで、前説と後説のテキストを音声合成してTTS音声を読み上げる場合には、そのテキストに対する自然言語処理などにより、テキストの文章の分析を行うことができるため、生声配信に際して生声の分析を行う場合と比べて、より正確な分析を行うことができる。
 そのため、前説と後説のテキストを分析することで、より関連の深い広告を提示することができる。例えば、「この曲を聴きながら、ワインを飲みたいですね。」である前説や後説のナレーションがあった場合に、ワインの広告を提示することができる。
 また、挿入された広告のテキストを、音声合成してTTS音声を読み上げる際には、そのまま読み上げても構わないが、例えば、DJの口調に合わせて読み上げたり、方言で読み上げたりしてもよい。あるいは、広告のTTS音声の口調を、前説や後説のTTS音声の口調と合わせてもよい。
 なお、図36の例では、後説の後に広告を挿入した場合を示したが、広告は、任意の場所に挿入することができ、特に、楽曲との関係から、広告を、前説の前、又は後説の後に挿入するのが好適である。
(番組に広告を挿入する場合の処理の流れ)
 図37は、番組に広告を挿入する場合の処理の流れを示したシーケンス図である。
 図37の例では、番組レンダラが、ユーザ端末装置20で実行され、番組配信サービスと、音楽配信サービスと、TTSサービスが、各配信サーバによりそれぞれ提供されることは、図15を参照して説明した第1の例などと同様であるが、広告配信サービスと広告管理DBを提供する広告配信サーバ30Dが設けられている。
 番組配信サーバ30Aでは、ユーザにより操作される番組レンダラによって、閲覧可能に公開しているポッドキャストの番組の再生が指示された場合、当該番組のスクリプトが分析される(S131,S132)。
 番組配信サーバ30Aでは、当該番組のスクリプトの分析結果に応じた要求を、広告配信サーバ30Dに送信することで、広告管理データベース353から、ワード・広告リストが取得される(S133,S134)。
 例えば、スクリプトの分析に際しては、スクリプトに設定された前説と後説のテキストの文章が解析され、その文章に含まれる単語や文意が抽出され、さらに、番組における広告の挿入場所が決定される。また、広告管理データベース353には、単語や文意が広告IDと対応付けられているため、ワード・広告リストとして、前説と後説に応じた広告IDが取得される。
 また、番組配信サーバ30Aでは、広告IDを含む要求を、広告配信サーバ30Dに送信することで、広告(広告本文)が取得される(S135,S136)。
 すなわち、広告配信サーバ30Dでは、広告IDと広告本文とが対応付けられて広告データベース353により管理されているため、番組配信サーバ30Aは、前説と後説に応じた広告IDにより特定される広告本文を取得し、決定した挿入場所に差し込むことができる(S137)。広告が挿入された番組のスクリプトは、番組レンダラに送信される(S138)。
 ステップS139乃至S147においては、図15のステップS16乃至S24と同様に、番組レンダラでは、番組のスクリプトに設定された前説、楽曲IDにより特定される楽曲、後説の順に再生が行われ、当該番組が視聴可能とされる。
 また、番組のスクリプトには、後説の後に、広告のテキストが挿入されているため、番組レンダラは、TTSサービスを提供する音声配信サーバ30Cに、当該広告のテキストの音声合成を要求する(S148)。
 音声配信サーバ30Cでは、番組レンダラからの要求に応じて、広告のテキストの音声合成が行われ(S149)、その音声合成の結果が配信される(S150)。
 これにより、番組レンダラでは、音声配信サーバ30Cから配信される音声合成の結果が受信され、レンダリング処理が行われることで、番組に挿入された広告の部分のTTS音声が再生される。
 また、ポッドキャストの番組のスクリプトには、複数の曲の楽曲IDがその曲の前説と後説のテキストとともに番組化されているため、ステップS139乃至S150の処理が完了した後に、ステップS139の処理に戻り(S151)、楽曲IDの数に応じてステップS139乃至S151の処理が繰り返される。
 これにより、番組レンダラでは、番組のスクリプトに設定された楽曲IDごとに、前説、楽曲、後説の順に再生が繰り返して行われ、ユーザによって、ポッドキャストの番組が視聴可能とされる。
 また、前説の前や後説の後ろなどに、前説や後説に関連した広告が挿入されている場合には、広告のTTS音声も再生されるため、ユーザに対して、前説や後説、楽曲と、広告とをリンクさせることができる。なお、広告は、音声出力に限らず、GUI(Graphical User Interface)として提示してもよく、例えば、音楽配信アプリの画面の所定の領域に広告を表示することができる。
 なお、例えば、前説や後説等のコメントの生声の音声データを配信する場合には、その生声の音声データを学習素材とすることにより、特定の音楽を作成し、その特定の音楽により音声合成を行うTTSを作成してもよい。このTTSによって、音声配信サーバ30Cが広告のテキストを音声合成し、ユーザ端末装置20に配信するようにしてもよい。これにより、ユーザが好きな生声に近い音声で広告が提供されるため、広告のコンバージョン率の向上などに繋がる可能性がある。
 また、図37に示したシーケンス図では、説明を簡略化するため、番組配信サービスと番組分析に関する処理が共に、番組配信サーバ30Aにより実行されるとして説明したが、それらの処理は、別々のサーバにより実行されてもよい。また、広告配信サービスと広告管理DBに関する処理が共に、広告配信サーバ30Dにより実行されるとして説明したが、それらの処理は、別々のサーバにより実行されてもよい。
(処理の全体像)
 図38は、第4の実施の形態における処理の全体像を説明するフローチャートである。
 図38に示した処理は、本技術を適用したコンテンツ提供システムにおけるユーザ端末装置20(の制御部200)と、配信サーバ30(の制御部300)とが協働して動作することで実現される。
 コンテンツ提供システム1では、図38に示すように、ユーザ端末装置20を使用するユーザによって、所定の記憶媒体に格納されたスクリプトへの再生要求がなされた場合(S511の「Yes」)、そのスクリプトに含まれるコメント情報が示すコメントの内容が分析される(S512)。
 ここで、コメントには、コンテンツとしての楽曲の前説と後説のうち、少なくともいずれか一方を含み、例えば、それらの前説と後説のテキストの文章が解析され、その文章に含まれる単語や文意が抽出されることで、前説と後説の内容が分析される。
 そして、コンテンツ提供システム1では、コメントの内容の分析結果に基づき、広告配信サーバ30Dから広告データ(広告本文)が取得され(S513)、当該広告データが、提供されるコメントの前又は後に、ユーザに提供するように制御される(S514)。
<5.変形例>
 ポッドキャストの番組のスクリプトに記述される楽曲ID等のコンテンツ識別情報として、各レコード会社が保有するオリジナルのIDを用いるようにしてもよい。
(システムの他の構成)
 図39は、本技術を適用したコンテンツ提供システムの一実施の形態の他の構成の例を示している。
 図39においては、図8と同様に、コンテンツ提供システム1が、クリエイタ端末装置10、ユーザ端末装置20、番組配信サーバ30A、楽曲配信サーバ30B、及び音声配信サーバ30Cを含んでいるが、ID管理サーバ31がさらに設けられている。
 ID管理サーバ31は、管理データベースによって、音楽配信サービスごとに用いられる楽曲IDを紐付けて管理する。ID管理サーバ31は、ユーザ端末装置20等の機器からの要求に応じて、管理している楽曲IDに関する情報を提供する。
 なお、ID管理サーバ31は、図13に示した配信サーバ30の構成と同様の構成を有している。
(番組情報を共有化する場合の処理の流れ)
 図40は、楽曲IDを管理して番組情報を共有化する場合の処理の流れを示したシーケンス図である。
 図40の例では、番組作成ツールと番組レンダラが、クリエイタとユーザの各端末装置でそれぞれ実行され、番組配信サービスと、音楽配信サービスが、各配信サーバによりそれぞれ提供されることは、図15を参照して説明した第1の例などと同様である。
 また、図40の例では、音楽配信サービスAを提供するA社の楽曲配信サーバ30B-1と、音楽配信サービスBを提供するB社の楽曲配信サーバ30B-2が設けられ、番組配信サーバ30Aは、A社により提供されるものとする。
 また、番組IDの管理を行うID管理サーバ31が設けられている。さらに、ユーザ端末装置20では、B社により提供される音楽配信アプリとしての番組レンダラが実行されているものとする。
 ID管理サーバ31には、A社の楽曲配信サーバ30B-1から送信されてくる、音楽配信サービスAで用いられる楽曲IDと、B社の楽曲配信サーバ30B-2から送信されてくる、音楽配信サービスBで用いられる楽曲IDがそれぞれ受信される(S171,S172)。これらの楽曲IDは、A社とB社のそれぞれが保有するオリジナルのIDとされる。
 ID管理サーバ31では、楽曲マスタIDを用い、音楽配信サービスAで用いられる楽曲IDと、音楽配信サービスBで用いられる楽曲IDとが紐付けて管理される。
 ステップS173乃至S175においては、図15のステップS11乃至S13と同様に、クリエイタ端末装置10により実行される番組作成ツールによって、A社の楽曲配信サーバ30B-1から送信される楽曲リストなどに基づき、A社の楽曲IDが付与された楽曲を含む番組のスクリプトが生成され、A社の番組配信サーバ30Aに登録されている。
 このとき、ユーザ端末装置20では、B社の番組レンダラが実行され、音楽配信サービスBと契約しているユーザの操作によって、番組配信サーバ30A上で閲覧可能に公開されているポッドキャストの番組の再生が指示された場合、番組配信サーバ30Aから配信される当該番組のスクリプトが受信される(S176,S177)。
 B社の番組レンダラは、受信したスクリプトに設定されたA社の楽曲IDのリストをID管理サーバ31に送信して、楽曲IDの変換を要求する(S178)。
 ID管理サーバ31では、番組レンダラからの要求に応じて、A社の楽曲IDのリストを、B社の楽曲IDのリストに変換して、B社の番組レンダラに送信する(S179,S180)。
 すなわち、番組のスクリプトに設定された楽曲IDがA社のオリジナルのIDである一方で、ユーザは、B社の音楽配信サービスBと契約しているため、このままでは、音楽配信サービスBを利用して、当該楽曲IDにより特定される楽曲を再生することはできない。
 そこで、ID管理サーバ31は、ID変換によって、A社のオリジナルの楽曲IDを、B社のオリジナルの楽曲IDに変換することで、B社の音楽配信サービスBを利用して、スクリプトに設定されたA社の楽曲IDにより特定される楽曲を再生可能にしている。
 番組レンダラは、音楽配信サービスBを提供する楽曲配信サーバ30B-2に対し、変換後の楽曲IDにより特定される楽曲の配信を要求する(S181)。
 B社の楽曲配信サーバ30B-2では、番組レンダラからの要求に応じて、ユーザによる音楽配信サービスBとの契約により獲得している権利が確認され(S182)、楽曲IDにより特定される楽曲の再生が可能であると判定した場合、B社の番組レンダラに対し、当該楽曲のストリーミング配信が行われる(S183)。
 これにより、B社の番組レンダラでは、B社の楽曲配信サーバ30B-2から配信される楽曲のストリーミングデータが受信され、レンダリング処理が行われることで、楽曲IDにより特定される楽曲が再生される。
 なお、ここでは、説明を分かりやすくするために省略したが、ポッドキャストの番組のスクリプトにでは、楽曲IDが、前説と後説のテキストとともに番組化されているため、その楽曲IDにより特定される楽曲を紹介する前説の部分の音声が再生された後に、当該楽曲の再生が行われ、当該楽曲の再生後に後説の部分の音声が再生されることになる。
 また、ポッドキャストの番組のスクリプトには、複数の楽曲の楽曲IDが、その楽曲の前説と後説のテキストとともに番組化されているため、ステップS181乃至S183の処理が完了した後に、ステップS181に戻り(S184)、ステップS181乃至S184の処理が繰り返される。
 これにより、B社の番組レンダラでは、番組のスクリプトに設定されたA社の楽曲IDごとに、前説、楽曲(B社の音楽配信サービスBにより配信される楽曲)、後説の順に再生が繰り返して行われる。
(処理の全体像)
 図41と図42は、変形例における処理の全体像を説明するフローチャートである。
 図41と図42に示した処理は、本技術を適用したコンテンツ提供システムにおけるクリエイタ端末装置10(の制御部100)と、ユーザ端末装置20(の制御部200)と、配信サーバ30(の制御部300)と、ID管理サーバ31(の制御部)が協働して動作することで実現される。
 コンテンツ提供システム1では、図41に示すように、クリエイタ端末装置10を使用するクリエイタからの入力があった場合(S611の「Yes」)、当該クリエイタからの入力に基づき、第1のサービスが認識可能な第1のコンテンツ識別情報と、そのコンテンツの前説と後説に対応するコメント情報からなるスクリプトが生成され(S612)、当該スクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納される(S613)。
 ここで、コンテンツは、音楽配信サービスで配信される楽曲などを含み、そのコンテンツの識別情報は、楽曲を識別可能な楽曲IDなどを含む。また、前説と後説は、コンテンツに関するコメントの一例であり、前説と後説のうち、少なくともいずれか一方が設定されていればよい。
 コメント情報は、コメントを表すテキスト、又は生声へのリンク情報などを含む。また、第1のサービスは、例えば、A社が提供する音楽配信サービスAである。所定の記憶媒体は、例えば、番組配信サーバ30Aのデータベース353とすることができる。
 また、コンテンツ提供システム1では、図42に示すように、第2のサービスと契約しているユーザによって、所定の記憶媒体に格納されたスクリプトへの再生要求がなされた場合(S631の「Yes」)、第1のコンテンツ識別情報に対応する第2のサービスが認識可能な第2のコンテンツ識別情報が特定され(S632)、第2のサービスが管理するコンテンツより、第2のコンテンツ識別情報に対応するコンテンツが特定され(S633)、ユーザが第2のサービスとの契約により既に獲得している権利を利用して、当該コンテンツの読み出しが実行され、ユーザに提供するように制御される(S634)。
 ここで、第2のサービスは、例えば、B社が提供する音楽配信サービスBであり、ユーザが既に獲得している権利は、有料のプレミアムユーザや、無料のフリーユーザの権利などを含む。
(その他の変形例)
 なお、ユーザ端末装置20において、番組レンダラにより楽曲を再生する際には、キャラクタや画像を付加することで、ビデオジョッキー(VJ:Video Jockey)化も可能である。
<6.コンピュータの構成>
 上述したフローチャートの各ステップの処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、各装置のコンピュータにインストールされる。
 コンピュータが実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線又は無線の伝送媒体を介して提供することができる。
 コンピュータでは、プログラムは、リムーバブル記録媒体をドライブに装着することにより、入出力I/Fを介して、記憶部にインストールすることができる。また、プログラムは、有線又は無線の伝送媒体を介して、通信部で受信し、記憶部にインストールすることができる。その他、プログラムは、ROMや記憶部に、あらかじめインストールしておくことができる。
 ここで、本明細書において、コンピュータがプログラムに従って行う処理は、必ずしもフローチャートとして記載された順序に沿って時系列に行われる必要はない。すなわち、コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含む。
 また、プログラムは、1のコンピュータ(プロセッサ)により処理されるものであってもよいし、複数のコンピュータによって分散処理されるものであってもよい。さらに、プログラムは、遠方のコンピュータに転送されて実行されてもよい。
 さらに、本明細書において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、1つの筐体の中に複数のモジュールが収納されている1つの装置は、いずれも、システムである。
 なお、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。例えば、本技術は、1つの機能を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
 また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
 また、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。
 なお、本技術は、以下のような構成をとることができる。
(1)
 クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
 ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後ろの少なくともいずれか一方で、そのスクリプトに含まれるコメント情報に従ってコメントを読み出しユーザに提供するように制御する制御部を備える
 コンテンツ提供システム。
(2)
 前記制御部は、前記ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれる前記コメント情報としてのテキストを音声合成してユーザに提供するように制御する
 前記(1)に記載のコンテンツ提供システム。
(3)
 前記制御部は、前記ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれる前記コメント情報としての音声データへのリンク情報にアクセスして音声データを読み出しユーザに提供するように制御する
 前記(1)に記載のコンテンツ提供システム。
(4)
 前記制御部は、前記ユーザによりプレイリスト再生の要求を受け付けたときには、前記ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれる前記コメント情報に応じたコメントの読み出しは行わず、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツを読み出しユーザに提供するように制御する
 前記(1)乃至(3)のいずれかに記載のコンテンツ提供システム。
(5)
 前記制御部は、
  クリエイタによって生成された、コンテンツの識別情報と、そのコンテンツを紹介する前説に対応する第1のコメント情報と、そのコンテンツの再生後の後説に対応する第2のコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
  ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれる前記第1のコメント情報に従って前説を読み出してユーザに提供し、
  前記第1のコメント情報に続くコンテンツ識別情報が示すコンテンツを読み出してユーザに提供し、
  前記コンテンツ識別情報に続く前記第2のコメント情報に従って後説を読み出してユーザに提供する
 ように制御する
 前記(1)乃至(4)のいずれかに記載のコンテンツ提供システム。
(6)
 前記制御部は、
  クリエイタによって生成された、特定のサービスが認識可能なコンテンツ識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
  ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが前記特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後の少なくともいずれか一方で、そのスクリプトに含まれる前記コメント情報に従ってコメントを読み出しユーザに提供するように制御する
 前記(1)に記載のコンテンツ提供システム。
(7)
 前記制御部は、
  クリエイタによって生成された、第1のサービスが認識可能なコンテンツ識別情報、コンテンツを検索するためのメタデータ、及びコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
  当該スクリプトが、前記第1のサービスとは異なる第2のサービスと契約を交わしているユーザによって選択されたときには、前記メタデータにより前記第2のサービスが管理するコンテンツにより、対応するコンテンツを特定し、当該ユーザが前記第2のサービスとの契約により既に獲得している権利を利用してコンテンツの読み出しを実行しユーザに提供するように制御する
 前記(6)に記載のコンテンツ提供システム。
(8)
 前記制御部は、前記スクリプトが、前記第2のサービスと契約を交わしているユーザによって選択されたときに、前記メタデータにより前記第2のサービスが管理するコンテンツから、対応するコンテンツを特定できなかったときには、当該コンテンツ、及び対応するコメントの読み出しもスキップするように制御する
 前記(7)に記載のコンテンツ提供システム。
(9)
 前記制御部は、前記スクリプトが、前記第2のサービスと契約を交わしているユーザによって選択されたときに、前記メタデータにより前記第2のサービスが管理するコンテンツから、対応するコンテンツを特定できなかったときには、前記第1のサービスが管理する当該コンテンツに対応するサンプルデータの読み出しを実行しユーザに提供するように制御する
 前記(7)に記載のコンテンツ提供システム。
(10)
 前記制御部は、
  クリエイタによって生成された前記スクリプトが前記所定の記憶媒体に格納される前に、当該スクリプトに含まれる前記コメント情報が示すコメント内容を分析し、
  その分析結果に基づいて、前記コンテンツに関するコメントとして相応しくないと判定した場合に、その旨を前記ユーザに通知するように制御する
 前記(1)乃至(9)のいずれかに記載のコンテンツ提供システム。
(11)
 前記制御部は、前記コンテンツに関するコメントとして相応しくないと判定した場合、当該コメントの相応しくない箇所を前記ユーザに通知するように制御する
 前記(10)に記載のコンテンツ提供システム。
(12)
 前記制御部は、前記コンテンツに関するコメントとして相応しくないと判定した場合、当該コメントに対応する前記コメント情報を含んだスクリプトが、前記所定の記憶媒体に格納されないように制御する
 前記(10)又は(11)に記載のコンテンツ提供システム。
(13)
 前記制御部は、
  ユーザによって選択されたスクリプトに含まれる前記コメント情報が示すコメントの内容を分析し、
  その分析結果に応じて、広告配信サーバから取得した広告データを、前記コンテンツのユーザへの提供の前に、提供されるコメントの前、又は前記コンテンツのユーザへの提供の後に、提供されるコメントの後に、ユーザに提供するように制御する
 前記(1)乃至(12)のいずれかに記載のコンテンツ提供システム。
(14)
 前記制御部は、
  前記ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれる前記コメント情報としてのテキストを特定の音素で音声合成してユーザに提供し、
  前記広告データとしてのテキストも、前記特定の音素で音声合成してユーザに提供するように制御する
 前記(13)に記載のコンテンツ提供システム。
(15)
 前記制御部は、前記ユーザによって選択されたスクリプトに含まれる前記コメント情報としてのテキストの内容を分析する
 前記(13)又は(14)に記載のコンテンツ提供システム。
(16)
 特定のコンテンツを識別するマスタ識別情報と、当該特定のコンテンツを各サービスがそれぞれ認識可能なコンテンツ識別情報とが、管理データベースにより対応付けて管理されており、
 前記制御部は、
  クリエイタによって生成された、第1のサービスが認識可能な第1のコンテンツ識別情報、及びコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
  当該スクリプトが、前記第1のサービスとは異なる第2のサービスと契約を交わしているユーザによって選択されたときには、前記管理データベースに従って、前記第1のコンテンツ識別情報に対応する、第2のサービスが認識可能な第2のコンテンツ識別情報を特定し、
  前記第2のサービスが管理するコンテンツにより、当該第2のコンテンツ識別情報に対応するコンテンツを特定し、
  当該ユーザが前記第2のサービスとの契約により既に獲得している権利を利用してコンテンツの読み出しを実行しユーザに提供する
 前記(1)に記載のコンテンツ提供システム。
(17)
 前記コンテンツは、楽曲を含み、
 前記コメントは、前記楽曲に設定される前説と後説の少なくともいずれか一方を含み、
 前記特定のサービスは、前記ユーザが契約している音楽配信サービスを含んでいる
 前記(1)乃至(16)のいずれかに記載のコンテンツ提供システム。
(18)
 前記クリエイタにより使用される第1の端末装置と、
 前記ユーザにより使用される第2の端末装置と、
 前記スクリプトを格納した前記所定の記憶媒体を有する第1のサーバと、
 前記コンテンツを配信する第2のサーバと
 を含む前記(1)乃至(17)のいずれかに記載のコンテンツ提供システム。
(19)
 クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
 ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後ろの少なくともいずれか一方で、そのスクリプトに含まれるコメント情報に従ってコメントを読み出しユーザに提供するように制御する
 コンテンツ提供方法。
(20)
 コンピュータを、
 クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
 ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後ろの少なくともいずれか一方で、そのスクリプトに含まれるコメント情報に従ってコメントを読み出しユーザに提供するように制御する
 制御部として機能させるためのプログラムを記録した記憶媒体。
 1 コンテンツ提供システム, 10 クリエイタ端末装置, 20 ユーザ端末装置, 30 配信サーバ, 30A 番組配信サーバ, 30B 楽曲配信サーバ, 30C 音声配信サーバ, 30D 広告配信サーバ, 31 ID管理サーバ, 50 ネットワーク, 100 制御部, 101 CPU, 102 ROM, 103 RAM, 104 バス, 105 入力部, 106 出力部, 107 記憶部, 108 通信部, 109 近距離無線通信部, 110 入出力I/F, 111 操作部, 112 カメラ部, 113 センサ部, 121 表示部, 122 音出力部, 151 入力受付部, 152 楽曲情報取得部, 153 番組生成部, 154 音声情報取得部, 155 音声生成部, 156 登録部, 200 制御部, 201 CPU, 202 ROM, 203 RAM, 204 バス, 205 入力部, 206 出力部, 207 記憶部, 208 通信部, 209 近距離無線通信部, 210 入出力I/F, 211 操作部, 212 カメラ部, 213 センサ部, 221 表示部, 222 音出力部, 251 番組取得部, 252 楽曲取得部, 253 音声取得部, 254 レンダラ部, 255 提示制御部, 300 制御部, 301 CPU, 302 ROM, 303 RAM, 304 バス, 305 入力部, 306 出力部, 307 記憶部, 308 通信部, 309 ドライブ, 310 入出力I/F, 351 入力受付部, 352 配信処理部, 353 データベース, 361 文章チェック部

Claims (20)

  1.  クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
     ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後ろの少なくともいずれか一方で、そのスクリプトに含まれるコメント情報に従ってコメントを読み出しユーザに提供するように制御する制御部を備える
     コンテンツ提供システム。
  2.  前記制御部は、前記ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれる前記コメント情報としてのテキストを音声合成してユーザに提供するように制御する
     請求項1に記載のコンテンツ提供システム。
  3.  前記制御部は、前記ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれる前記コメント情報としての音声データへのリンク情報にアクセスして音声データを読み出しユーザに提供するように制御する
     請求項1に記載のコンテンツ提供システム。
  4.  前記制御部は、前記ユーザによりプレイリスト再生の要求を受け付けたときには、前記ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれる前記コメント情報に応じたコメントの読み出しは行わず、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツを読み出しユーザに提供するように制御する
     請求項1に記載のコンテンツ提供システム。
  5.  前記制御部は、
      クリエイタによって生成された、コンテンツの識別情報と、そのコンテンツを紹介する前説に対応する第1のコメント情報と、そのコンテンツの再生後の後説に対応する第2のコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
      ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれる前記第1のコメント情報に従って前説を読み出してユーザに提供し、
      前記第1のコメント情報に続くコンテンツ識別情報が示すコンテンツを読み出してユーザに提供し、
      前記コンテンツ識別情報に続く前記第2のコメント情報に従って後説を読み出してユーザに提供する
     ように制御する
     請求項1に記載のコンテンツ提供システム。
  6.  前記制御部は、
      クリエイタによって生成された、特定のサービスが認識可能なコンテンツ識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
      ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが前記特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後の少なくともいずれか一方で、そのスクリプトに含まれる前記コメント情報に従ってコメントを読み出しユーザに提供するように制御する
     請求項1に記載のコンテンツ提供システム。
  7.  前記制御部は、
      クリエイタによって生成された、第1のサービスが認識可能なコンテンツ識別情報、コンテンツを検索するためのメタデータ、及びコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
      当該スクリプトが、前記第1のサービスとは異なる第2のサービスと契約を交わしているユーザによって選択されたときには、前記メタデータにより前記第2のサービスが管理するコンテンツにより、対応するコンテンツを特定し、当該ユーザが前記第2のサービスとの契約により既に獲得している権利を利用してコンテンツの読み出しを実行しユーザに提供するように制御する
     請求項6に記載のコンテンツ提供システム。
  8.  前記制御部は、前記スクリプトが、前記第2のサービスと契約を交わしているユーザによって選択されたときに、前記メタデータにより前記第2のサービスが管理するコンテンツから、対応するコンテンツを特定できなかったときには、当該コンテンツ、及び対応するコメントの読み出しもスキップするように制御する
     請求項7に記載のコンテンツ提供システム。
  9.  前記制御部は、前記スクリプトが、前記第2のサービスと契約を交わしているユーザによって選択されたときに、前記メタデータにより前記第2のサービスが管理するコンテンツから、対応するコンテンツを特定できなかったときには、前記第1のサービスが管理する当該コンテンツに対応するサンプルデータの読み出しを実行しユーザに提供するように制御する
     請求項7に記載のコンテンツ提供システム。
  10.  前記制御部は、
      クリエイタによって生成された前記スクリプトが前記所定の記憶媒体に格納される前に、当該スクリプトに含まれる前記コメント情報が示すコメント内容を分析し、
      その分析結果に基づいて、前記コンテンツに関するコメントとして相応しくないと判定した場合に、その旨を前記ユーザに通知するように制御する
     請求項1に記載のコンテンツ提供システム。
  11.  前記制御部は、前記コンテンツに関するコメントとして相応しくないと判定した場合、当該コメントの相応しくない箇所を前記ユーザに通知するように制御する
     請求項10に記載のコンテンツ提供システム。
  12.  前記制御部は、前記コンテンツに関するコメントとして相応しくないと判定した場合、当該コメントに対応する前記コメント情報を含んだスクリプトが、前記所定の記憶媒体に格納されないように制御する
     請求項10に記載のコンテンツ提供システム。
  13.  前記制御部は、
      ユーザによって選択されたスクリプトに含まれる前記コメント情報が示すコメントの内容を分析し、
      その分析結果に応じて、広告配信サーバから取得した広告データを、前記コンテンツのユーザへの提供の前に、提供されるコメントの前、又は前記コンテンツのユーザへの提供の後に、提供されるコメントの後に、ユーザに提供するように制御する
     請求項1に記載のコンテンツ提供システム。
  14.  前記制御部は、
      前記ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれる前記コメント情報としてのテキストを特定の音素で音声合成してユーザに提供し、
      前記広告データとしてのテキストも、前記特定の音素で音声合成してユーザに提供するように制御する
     請求項13に記載のコンテンツ提供システム。
  15.  前記制御部は、前記ユーザによって選択されたスクリプトに含まれる前記コメント情報としてのテキストの内容を分析する
     請求項13に記載のコンテンツ提供システム。
  16.  特定のコンテンツを識別するマスタ識別情報と、当該特定のコンテンツを各サービスがそれぞれ認識可能なコンテンツ識別情報とが、管理データベースにより対応付けて管理されており、
     前記制御部は、
      クリエイタによって生成された、第1のサービスが認識可能な第1のコンテンツ識別情報、及びコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
      当該スクリプトが、前記第1のサービスとは異なる第2のサービスと契約を交わしているユーザによって選択されたときには、前記管理データベースに従って、前記第1のコンテンツ識別情報に対応する、第2のサービスが認識可能な第2のコンテンツ識別情報を特定し、
      前記第2のサービスが管理するコンテンツにより、当該第2のコンテンツ識別情報に対応するコンテンツを特定し、
      当該ユーザが前記第2のサービスとの契約により既に獲得している権利を利用してコンテンツの読み出しを実行しユーザに提供する
     請求項1に記載のコンテンツ提供システム。
  17.  前記コンテンツは、楽曲を含み、
     前記コメントは、前記楽曲に設定される前説と後説の少なくともいずれか一方を含み、
     前記特定のサービスは、前記ユーザが契約している音楽配信サービスを含んでいる
     請求項1に記載のコンテンツ提供システム。
  18.  前記クリエイタにより使用される第1の端末装置と、
     前記ユーザにより使用される第2の端末装置と、
     前記スクリプトを格納した前記所定の記憶媒体を有する第1のサーバと、
     前記コンテンツを配信する第2のサーバと
     を含む請求項1に記載のコンテンツ提供システム。
  19.  クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
     ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後ろの少なくともいずれか一方で、そのスクリプトに含まれるコメント情報に従ってコメントを読み出しユーザに提供するように制御する
     コンテンツ提供方法。
  20.  コンピュータを、
     クリエイタによって生成された、コンテンツの識別情報とコメント情報からなるスクリプトが、ユーザに閲覧可能に所定の記憶媒体に格納されており、
     ユーザによって選択されたスクリプトに従って、そのスクリプトに含まれるコンテンツ識別情報が示すコンテンツの読み出しを、当該ユーザが特定のサービスとの契約により既に獲得している権利を利用して実行しユーザに提供するように制御するとともに、当該コンテンツの提供の前か後ろの少なくともいずれか一方で、そのスクリプトに含まれるコメント情報に従ってコメントを読み出しユーザに提供するように制御する
     制御部として機能させるためのプログラムを記録した記憶媒体。
PCT/JP2020/042907 2019-12-02 2020-11-18 コンテンツ提供システム、コンテンツ提供方法、及び記憶媒体 WO2021111872A1 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN202080071752.0A CN114556400A (zh) 2019-12-02 2020-11-18 内容提供系统、内容提供方法和存储介质
KR1020227016697A KR20220110735A (ko) 2019-12-02 2020-11-18 콘텐츠 제공 시스템, 콘텐츠 제공 방법, 및 기억 매체
JP2021562555A JPWO2021111872A1 (ja) 2019-12-02 2020-11-18
EP20897321.4A EP4071751A4 (en) 2019-12-02 2020-11-18 CONTENT DELIVERY SYSTEM AND METHOD AND STORAGE MEDIA
US17/774,145 US20220391440A1 (en) 2019-12-02 2020-11-18 Content providing system, content providing method, and storage medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019-218214 2019-12-02
JP2019218214 2019-12-02

Publications (1)

Publication Number Publication Date
WO2021111872A1 true WO2021111872A1 (ja) 2021-06-10

Family

ID=76222130

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/042907 WO2021111872A1 (ja) 2019-12-02 2020-11-18 コンテンツ提供システム、コンテンツ提供方法、及び記憶媒体

Country Status (6)

Country Link
US (1) US20220391440A1 (ja)
EP (1) EP4071751A4 (ja)
JP (1) JPWO2021111872A1 (ja)
KR (1) KR20220110735A (ja)
CN (1) CN114556400A (ja)
WO (1) WO2021111872A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220391441A1 (en) * 2019-12-06 2022-12-08 Sony Group Corporation Content providing system, content providing method, and storage medium
EP4072155A4 (en) * 2019-12-06 2023-03-08 Sony Group Corporation INFORMATION PROCESSING SYSTEM, INFORMATION PROCESSING METHOD AND STORAGE MEDIUM

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002342206A (ja) 2001-05-18 2002-11-29 Fujitsu Ltd 情報提供プログラム、情報提供方法、および記録媒体
WO2004073309A1 (ja) 2003-02-14 2004-08-26 Sharp Kabushiki Kaisha ストリーム出力装置及び情報提供装置
JP2011166833A (ja) * 2007-03-30 2011-08-25 Dowango:Kk コメント配信システム、端末装置、コメント配信方法、及びプログラム
JP2015060545A (ja) * 2013-09-20 2015-03-30 本田技研工業株式会社 情報処理システム及びクライアント端末
JP2015518171A (ja) * 2012-04-03 2015-06-25 ソニー株式会社 再生制御装置、再生制御方法、およびプログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004348895A (ja) * 2003-05-23 2004-12-09 Clarion Co Ltd 車載再生装置及びその制御方法、制御プログラム及び記録媒体
US20070260460A1 (en) * 2006-05-05 2007-11-08 Hyatt Edward C Method and system for announcing audio and video content to a user of a mobile radio terminal
US20080256109A1 (en) * 2007-04-13 2008-10-16 Google Inc. Dynamic Podcast Content Delivery
GB0709174D0 (en) * 2007-05-12 2007-06-20 Univ Edinburgh Automated disc jockey
US8712776B2 (en) * 2008-09-29 2014-04-29 Apple Inc. Systems and methods for selective text to speech synthesis
US8606792B1 (en) * 2010-02-08 2013-12-10 Google Inc. Scoring authors of posts
US11113449B2 (en) * 2019-11-10 2021-09-07 ExactNote, Inc. Methods and systems for creating, organizing, and viewing annotations of documents within web browsers

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002342206A (ja) 2001-05-18 2002-11-29 Fujitsu Ltd 情報提供プログラム、情報提供方法、および記録媒体
WO2004073309A1 (ja) 2003-02-14 2004-08-26 Sharp Kabushiki Kaisha ストリーム出力装置及び情報提供装置
JP2011166833A (ja) * 2007-03-30 2011-08-25 Dowango:Kk コメント配信システム、端末装置、コメント配信方法、及びプログラム
JP2015518171A (ja) * 2012-04-03 2015-06-25 ソニー株式会社 再生制御装置、再生制御方法、およびプログラム
JP2015060545A (ja) * 2013-09-20 2015-03-30 本田技研工業株式会社 情報処理システム及びクライアント端末

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP4071751A4

Also Published As

Publication number Publication date
EP4071751A1 (en) 2022-10-12
CN114556400A (zh) 2022-05-27
JPWO2021111872A1 (ja) 2021-06-10
EP4071751A4 (en) 2023-01-25
KR20220110735A (ko) 2022-08-09
US20220391440A1 (en) 2022-12-08

Similar Documents

Publication Publication Date Title
US9380410B2 (en) Audio commenting and publishing system
US20070294374A1 (en) Music reproducing method and music reproducing apparatus
WO2021111872A1 (ja) コンテンツ提供システム、コンテンツ提供方法、及び記憶媒体
JP2019091014A (ja) マルチメディアを再生するための方法及び装置
KR20090126200A (ko) 콘텐츠 재생 장치, 콘텐츠 재생 방법, 프로그램, 콘텐츠 재생 시스템
US20130110513A1 (en) Platform for Sharing Voice Content
KR20040007639A (ko) 컨텐츠 배신방법, 시나리오 데이터, 기록매체 및 시나리오데이터 생성방법
US20170177175A1 (en) System and method for editing and generating multimedia contents according to digital playbooks
JP4932435B2 (ja) コンテンツ提供サーバ及びコンテンツ提供プログラム
Copeland et al. A guide to academic podcasting
WO2021111905A1 (ja) 情報処理システム、情報処理方法、及び記憶媒体
KR20090000745A (ko) 인터넷을 이용한 사용자 녹음방식의 소리책 제작 시스템 및방법
JP6058991B2 (ja) 歌唱音声に対応する歌唱動画選択システム
KR20150028972A (ko) 동영상 동기화 재생 방법
WO2021157380A1 (ja) コンテンツ提供システム、コンテンツ提供方法、及び記憶媒体
KR20000012324A (ko) 인터넷에서 서적 내용의 멀티미디어형 정보를 제공하는방법 및 그 시스템
WO2021111906A1 (ja) コンテンツ提供システム、コンテンツ提供方法、及び記憶媒体
KR20180014966A (ko) 미발표 신곡 공유 및 가수 발굴 오디션 서비스 제공 방법
KR20120140427A (ko) 멀티미디어 포토 북 제공 장치 및 방법
JP2007012091A (ja) コンテンツ配信方法
JP6121139B2 (ja) カラオケ歌唱映像の歌唱音声選択システム
KR20170088255A (ko) 온라인 기반의 연기자 대본 리딩을 위한 전자 대본 제공 시스템 및 방법
KR102484057B1 (ko) 크리에이팅 음원에 대한 선택적 보컬 매칭을 통한 음원 에스티메이팅 시스템
WO2022163023A1 (ja) コンテンツ修正装置、コンテンツ配信サーバ、コンテンツ修正方法、および、記録媒体
KR20090038276A (ko) 동영상 패키지 제공 방법 및 시스템과 이를 위한 기록매체

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20897321

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2021562555

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2020897321

Country of ref document: EP

Effective date: 20220704