WO2020039702A1 - 情報処理装置、情報処理システム、情報処理方法及びプログラム - Google Patents
情報処理装置、情報処理システム、情報処理方法及びプログラム Download PDFInfo
- Publication number
- WO2020039702A1 WO2020039702A1 PCT/JP2019/023004 JP2019023004W WO2020039702A1 WO 2020039702 A1 WO2020039702 A1 WO 2020039702A1 JP 2019023004 W JP2019023004 W JP 2019023004W WO 2020039702 A1 WO2020039702 A1 WO 2020039702A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- data
- program content
- information
- information processing
- control
- Prior art date
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 58
- 238000003672 processing method Methods 0.000 title claims description 9
- 238000003860 storage Methods 0.000 claims description 51
- 239000000463 material Substances 0.000 claims description 44
- 238000004891 communication Methods 0.000 claims description 42
- 238000009826 distribution Methods 0.000 description 180
- 230000006870 function Effects 0.000 description 59
- 238000000034 method Methods 0.000 description 45
- 238000004458 analytical method Methods 0.000 description 36
- 230000015572 biosynthetic process Effects 0.000 description 24
- 238000003786 synthesis reaction Methods 0.000 description 24
- 230000000007 visual effect Effects 0.000 description 24
- 238000007726 management method Methods 0.000 description 21
- 238000012545 processing Methods 0.000 description 21
- 230000014509 gene expression Effects 0.000 description 17
- 230000008569 process Effects 0.000 description 17
- 230000008859 change Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 15
- 230000000694 effects Effects 0.000 description 14
- 230000005540 biological transmission Effects 0.000 description 12
- 230000006399 behavior Effects 0.000 description 7
- 238000012790 confirmation Methods 0.000 description 7
- 230000033001 locomotion Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 230000008921 facial expression Effects 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 206010002953 Aphonia Diseases 0.000 description 1
- 238000003287 bathing Methods 0.000 description 1
- 238000005266 casting Methods 0.000 description 1
- 230000035606 childbirth Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/34—Indicating arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23424—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for inserting or substituting an advertisement
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
Definitions
- the present disclosure relates to an information processing device, an information processing system, an information processing method, and a program.
- Patent Literature 1 discloses a technology for generating program content by combining various text information provided on a website, such as news, weather, and twitter feed, with audio data such as music, and a generated program content.
- a technology for outputting sound is disclosed.
- An object of the present disclosure is to provide an information processing apparatus, an information processing system, an information processing method, and a program that can easily create and edit program content even for a user without specialized knowledge. One.
- a communication unit that receives message information including text data including a control character transmitted from an arbitrary terminal; If the account information of the received message information is preset account information, the sentence data is analyzed, output based on the sentence data is performed, and program content data on which control based on the control characters is reflected is automatically generated.
- An information processing system comprising:
- the control unit obtains material data including text data including control characters, analyzes the material data, automatically outputs program content data, and automatically generates program content data in which control based on the control characters is reflected. This is an information processing method.
- the control unit obtains material data including text data including control characters, analyzes the material data, automatically outputs program content data, and automatically generates program content data in which control based on the control characters is reflected.
- a program that causes a computer to execute an information processing method.
- program contents can be easily created and edited.
- the effects described here are not necessarily limited, and may be any of the effects described in the present disclosure.
- the contents of the present disclosure are not to be construed as being limited by the illustrated effects.
- FIG. 1 is a diagram illustrating a configuration of a program providing system according to an embodiment of the present disclosure.
- FIG. 2 is a diagram illustrating an example of “genre” which is information input by a creator of the program content.
- FIG. 3 is a diagram illustrating an example of “type” which is information input by the creator of the program content.
- 4A to 4C are diagrams illustrating an example of a “template” that is information input by a creator of the program content.
- FIG. 5 is a diagram illustrating an example of a plurality of pieces of document data when a plurality of pieces of document data having different reproduction times are generated for certain transmission information.
- FIG. 6A and FIG. 6B are diagrams for explaining a function of adapting visual information to transmitted information or reproduction date and time.
- FIG. 7 is a diagram for explaining a function of automatically adding a motion of a character.
- FIG. 8 is a block diagram illustrating an example of a functional configuration of the distribution device.
- FIG. 9 is a block diagram illustrating an example of a functional configuration of the user terminal.
- FIG. 10 is a flowchart illustrating an example of the operation of the distribution device.
- FIG. 11 is a flowchart illustrating an example of the operation of the user terminal.
- FIG. 12 is a block diagram illustrating an example of a hardware configuration of the distribution device and the user terminal.
- FIG. 13 is a diagram showing an example of a setting screen for performing various settings for automatically generating program content data.
- FIG. 14 is a diagram illustrating an example of a screen of a mail created on the user terminal.
- FIGS. 17A and 17B are diagrams illustrating an example of an image attached to a mail.
- FIG. 16 is a flowchart for describing an operation example performed by the distribution device according to the second embodiment.
- FIG. 17 is a diagram illustrating a specific example of automatically generated program content with reference to FIGS. 17A and 17B.
- the program content broadcast on a television, radio or Internet video distribution site or the like is composed of a manuscript prepared in advance and an ad lib of a speaker (for example, an announcer, a moderator or a radio personality).
- the speaker adjusts the program content to end at a predetermined broadcast time by adding, changing, or deleting the content to be transmitted based on his / her skill and experience. are doing. For example, if the content of the manuscript is greater than can be transmitted during the remaining broadcast time, the speaker may omit the lower priority content or change it to a shorter expression, etc. Adjustments are made so that the program content is ended at the broadcast time while transmitting high priority information.
- the speaker may use a conjunction (for example, “Okay,” “Continue,” “Okay,” “By the way, after reading one manuscript and before starting to read the next. ) Or an ad-lib, etc., as appropriate, so that the transition from one document to the next is performed smoothly.
- the speaker may put an ad-lib depending on the viewing situation of the user. For example, when information transmitted in the past is transmitted again, the speaker may put an ad lib as an introductory part to the contents of the manuscript, such as "as reported.” Also, when new information that has not been transmitted in the past is transmitted, the speaker may put an ad-lib such as "New information has been input.”
- the speaker may transmit the emergency information in the middle of the information being transmitted, or the order of the transmitted information.
- the emergency information was transmitted preferentially by replacing the information.
- a speaker may transmit information while making a gesture such as a gesture according to the content of the information to be transmitted. For example, in a weather forecast, a speaker may transmit information while pointing to a part of a weather chart with a pointing stick, or transmit information while turning his or her eyes on a displayed moving image or still image.
- the speaker changes the expression or tone of the voice as appropriate based on the content to be transmitted. For example, when the content to be conveyed is sad news (for example, occurrence of an accident or disaster or death of a person), the speaker conveys information by changing his facial expression to dark and changing his voice tone to low. Conversely, if the content to be transmitted is good news (for example, marriage, childbirth, or a championship at a tournament, etc.), the speaker changes the facial expression brightly and changes the tone of the voice to a higher level to transmit the information. Further, in addition to the expression or the tone of the voice, for example, the costume of the speaker, the background music, the background, and the like may be changed based on the content transmitted.
- the background music, the background, the expression of the speaker, the tone of the voice, the costume, and the like are based not only on the content to be transmitted, but also on the date and time or region in which the program content is reproduced, or on the season, weather or temperature at the time of reproduction. Subject to change. For example, when the reproduction season is summer, the costume of the speaker may be changed to summer clothes, and the background music and the background may be changed to songs and backgrounds reminiscent of summer.
- the present disclosure can acquire material data, analyze the content of the material data, and automatically generate program content including visual information based on the content.
- program content including visual information based on the content.
- the program providing system includes a distribution device 100 and a user terminal 200, and distribution device 100 and user terminal 200 are connected by network 300.
- the distribution device 100 is an information processing device having a function of automatically generating and distributing program content. More specifically, when the creator of the program content inputs material data as a source of the program content to the distribution device 100, the distribution device 100 automatically converts the program content including the visual information based on the content of the material data. Generate.
- the distribution apparatus 100 generates document data based on text data input as material data. Then, the distribution device 100 generates program content including visual information based on the original data and moving image data or still image data input as material data.
- the program content may be capable of outputting audio by performing voice synthesis processing on the original data, may be capable of displaying the original data as subtitles, For example, any character other than the input moving image data or still image data may be displayed.
- the program content includes, but is not limited to, content broadcast on a television, content distributed on a video distribution site on the Internet, content displayed on a predetermined advertisement medium, content broadcast on a radio, and the like. . Details of the contents of the program content and the generation method will be described later.
- the distribution device 100 provides the program content to the viewer by providing the generated program content to the user terminal 200. More specifically, the distribution apparatus 100 uploads the program content to a server accessible by the user terminal 200 (for example, a WEB server that manages a specific WEB (World Wide Web) site on the Internet), and 200 downloads the program content from the server.
- a server accessible by the user terminal 200 for example, a WEB server that manages a specific WEB (World Wide Web) site on the Internet
- the method of providing the program content is not limited to this.
- the user terminal 200 may directly access the distribution device 100 via the network 300 to acquire the program content.
- push-type distribution may be performed instead of pull-type distribution in which the user terminal 200 downloads program content.
- the user terminal 200 is an information processing device having a function of reproducing the program content distributed by the distribution device 100. More specifically, the user terminal 200 reproduces the program content selected based on the operation of the viewer using an output unit (for example, a display, a speaker, or the like) provided in the user terminal 200.
- an output unit for example, a display, a speaker, or the like
- the user terminal 200 has a function of editing the program content generated by the distribution device 100.
- the user terminal 200 may set the content of the program content (original data, moving image data, still image data, BGM, or the like) or a reproduction method (for example, display) based on the setting by the viewer or the preference information of the viewer. It has a function to edit the size, volume, speed, etc.).
- the user terminal 200 also has a function of generating program content using material data partially processed by the distribution device 100.
- the user terminal 200 has a function in which the distribution apparatus 100 generates program content using material data that has been subjected to noise removal, trimming, format conversion, and the like by filtering.
- the distribution apparatus 100 distributes data (material data itself or data obtained by processing the material data) that is the source of the program content, and the user terminal 200 uses the data and viewer preference information to program content. May be automatically generated and reproduced.
- the user terminal 200 may provide the distribution information 100 with the preference information of the viewer, and the distribution device 100 may distribute the program content automatically generated using the information to the user terminal 200.
- the distribution device 100 and the user terminal 200 include, for example, desktop, notebook or tablet PCs (Personal Computers), smartphones, general-purpose computers, and various wearable terminals (for example, glasses-type terminals, watch-type terminals, clothes-type terminals, and rings). Terminal, a bracelet terminal, an earring terminal, a necklace terminal, etc.), a head mounted display, etc., but are not limited thereto.
- the network 300 is a wired or wireless transmission path for information communicated by the distribution device 100 and the user terminal 200 connected to the network 300.
- the network 300 may include a public line network such as the Internet, various LANs (Local Area Network) including Ethernet (registered trademark), and a WAN (Wide Area Network).
- the network 300 may include a dedicated line network such as an IP-VPN (Internet Protocol-Virtual Private Network) or a short-range wireless communication network such as Bluetooth (registered trademark).
- IP-VPN Internet Protocol-Virtual Private Network
- Bluetooth registered trademark
- the configuration in FIG. 1 is merely an example, and the configuration of the program providing system according to the present embodiment is not limited to this.
- the program providing system according to the present embodiment may be configured by either distribution device 100 or user terminal 200.
- the program providing system has a function of automatically generating original data to be broadcast.
- the distribution apparatus 100 receives text data as material data, and genre or type of the content of the text data, or information about a template.
- the text data is assumed to be a text file, a data file generated by word processing software or the like, but is not limited to this.
- the text data is an image file in which the text is displayed, and the distribution device 100 may extract the text by analyzing the image file.
- the sentence data may be singular or plural.
- the genre of the content of the sentence data is a classification of information to be transmitted. For example, as shown in FIG. 2, “politics”, “economy”, “entertainment”, “sports”, “international”, Such as “weather” is not limited to this.
- the genre is a subdivision of the above genre (for example, “weather”) such as “national weather”, “Tokyo weather”, “weekly weather”, “daily weather” and the like. It may be a modified one. Note that input of the genre is not essential.
- the type of the content of the sentence data is a type in which the information to be transmitted is distinguished according to some type. For example, as shown in FIG. 3, "the world”, “nationwide”, “prefecture”, “city” , “District”, “individual”, and the like, but are not limited thereto.
- the type of the content of the sentence data may be classified according to the type of the target of information transmission, such as "male”, “female”, “elderly", “child”,
- the information may be identified by the type of urgency of information transmission, such as “urgent” or "normal”, or may be identified by the information content, such as "sad news" or "good news.” May be.
- the input of the type is not essential.
- the template is information indicating a configuration pattern of the program content.
- the template is a configuration pattern of “opening (4A)”, “topic (4B)”, and “ending (4C)”.
- the template is not limited to the example of FIG. 4, and may be, for example, a configuration pattern in which any of “opening (4A)”, “topic (4B)”, and “ending (4C)” is omitted.
- a configuration pattern in which a configuration other than these is added may be used.
- the template includes camera work, screen composition (characters, moving images, still images, telops, etc.), presence / absence of characters, character attributes (sex, age, voice quality, costumes, characters other than humans (animals, etc.))
- the information may be information to which a setting such as the presence or absence of a sound is added.
- the template may be created by the creator, or may be automatically generated based on a learning result of an existing program (for example, a television program, an Internet distribution program, a radio program, and the like). The creator can cause the distribution device 100 to generate desired program content by selecting such a template. Note that input of a template is not essential.
- the distribution apparatus 100 automatically generates document data based on the various types of information input. More specifically, the distribution device 100 analyzes the input text data and grasps the content of the text data. For example, the distribution device 100 extracts a word included in the sentence data, and extracts the content of the word using information stored in the device itself or information acquired from an external device (for example, an external WEB server or the like). recognize. Thus, the distribution apparatus 100 recognizes not only the input genre or type, but also the genre or type of the content of the text data based on the result of analyzing the text data by itself, and uses the genre or type for the subsequent processing. Can be.
- the distribution apparatus 100 automatically generates the original data to be broadcast based on the genre, type, template, analysis result of the sentence data, and the like. More specifically, distribution device 100 automatically generates document data by deleting or changing a part of the input text data, or adding information not included in the text data.
- the automatic generation of the document data will be described by taking as an example the case where the template of FIG.
- text data of information broadcast on the topic (4B) is input to the distribution device 100.
- the distribution apparatus 100 automatically generates original data broadcast on the topic (4B) using the input text data, and also automatically generates original data broadcast on the opening (4A) and the ending (4C).
- the distribution apparatus 100 transmits the content of the information to be transmitted, the date and time or the region in which the program content data is reproduced, Based on the season, weather, or temperature at the time of reproduction, contents that are not included in the input text data are added. For example, the distribution device 100 adds a content based on the date and time when the program content data is reproduced to the opening (4A), such as “Happy new year. We will tell you the news of January 1, 2017.” You may. In addition, the distribution device 100 may add a content based on the content of the information to be transmitted, such as "although sad news has arrived immediately" at the beginning of the topic (4B).
- the distribution device 100 states in the ending (4C) that "From 10:00 am to 15:00 pm, heavy rain is expected to occur in Tokyo after this. Do not forget the rain gear.” Content based on the region to be played back and the weather at the time of playback may be added.
- distribution device 100 analyzes data obtained by various sensors (for example, an acceleration sensor, a gyro sensor, or a barometric pressure sensor) of a wearable terminal worn by a viewer. In this way, the behavior of the viewer, the situation where the viewer is placed, or the like may be recognized, and the content corresponding thereto may be added. For example, when the distribution apparatus 100 or the like recognizes that the viewer is commuting, the ending (4C) may add a content such as "Please work hard today.”
- sensors for example, an acceleration sensor, a gyro sensor, or a barometric pressure sensor
- the distribution device 100 or the like predicts the behavior of the viewer or the situation (or environment) where the viewer is placed at a certain point in the future by analyzing the above sensing data and the like, and responds to the prediction result.
- Content may be added.
- the distribution device 100 or the like recognizes that the viewer has got on a vehicle (for example, a train or a car) when commuting
- the delivery device 100 or the like in the disembarkation time predicted based on the past action history, says “Work hard today. Please. "Etc. may be added.
- the content to be added as described above may be automatically generated by inputting other text data in advance.
- the distribution device 100 deletes or changes part of the input text data. For example, when the content added as described above includes a content that is duplicated with the input text data (for example, the content of “I will tell you the news of January 1, 2017.” is added. In the case where the same meaning is included in the text data), the distribution apparatus 100 may appropriately delete or change the overlapping part in the text data. In addition, when the same word occurs frequently or when there is a difficult word, the distribution device 100 may appropriately change the expression to another expression.
- the distribution apparatus 100 may generate the manuscript data without changing the text data that is the material data. For example, when the change of the sentence data is prohibited for some reason (for example, when the sentence data is protected by copyright), the distribution apparatus 100 transmits the sentence data without changing the input sentence data.
- the original data may be generated by adjusting the contents added before and after the data. At this time, the distribution device 100 can make the viewer less likely to feel uncomfortable by adjusting the reading speed of the original or providing an appropriate time interval (adjustment of the reproduction time will be described later).
- the distribution apparatus 100 can generate high-quality program content provided by a speaker (for example, an announcer, a moderator, or a radio personality) with ad lib, and at the same time, the generation cost of the program content. Can be reduced.
- the creator of the program content can focus on creating text data, which is the core information.
- the distribution device 100 can generate the document data so that the program content ends at the broadcast time. More specifically, the distribution device 100 calculates the reproduction time of the audio data when generating the document data. For example, the distribution device 100 calculates the reproduction time of the voice data after the voice synthesis of the document data based on the contents of various parameters used for the voice synthesis.
- the distribution device 100 edits the document data. For example, the distribution apparatus 100 deletes information having low priority in the input text data, changes the expression to a different expression from the text data, deletes or changes the added content, and the like. The original data is edited so that the broadcast time is determined in advance. Conversely, when the reproduction time of the generated document data (or the document data being generated) is shorter than the predetermined broadcast time, the distribution device 100 changes the expression to a different expression from the input text data, The original data is edited by changing the added content or adding another content so that the reproduction time of the original data becomes a predetermined broadcast time.
- the distribution apparatus 100 generates a plurality of document data having different reproduction times for certain transmission information, and selects appropriate document data from among the plurality of document data, so that the document ending at the broadcast time is generated.
- Data generation may be realized.
- the distribution device 100 analyzes the input text data and generates a plurality of document data that have different reproduction times and can be understood by the viewer, as shown in FIG. 5, based on the analysis result. I do.
- the distribution device 100 realizes generation of the document data ending at the broadcast time by selecting appropriate document data from a plurality of document data based on the document data of the broadcast time or other transmission information. You may.
- the distribution apparatus 100 may allow the creator to select desired document data from a plurality of document data by presenting the list as shown in FIG. 5 to the creator.
- the distribution apparatus 100 allows the speaker (for example, an announcer, presenter, or radio personality) to change the content to be transmitted, the expression method, or the speaking speed based on the information to be transmitted and the remaining broadcast time. It can operate and program content can be terminated at broadcast time.
- the speaker for example, an announcer, presenter, or radio personality
- the program providing system has a function of automatically generating sound or visual information of program content.
- the distribution device 100 receives moving image data, still image data, or the like as material data. Then, the distribution apparatus 100 automatically generates program contents including sound or visual information by using the data, the information (genre, type, template, or the like) set above and the original data generated above.
- the distribution apparatus 100 generates a program content including audio data by performing audio synthesis processing using the generated original data.
- the distribution device 100 can add not only sound but also some sound (for example, BGM, sound effect, and the like).
- the distribution device 100 may add some sound based on the analysis result of the input material data. For example, when the material data is analyzed as moving image data related to a sports tournament, the distribution device 100 may add the theme music of the sports tournament as BGM.
- the distribution apparatus 100 may configure the configuration pattern of the program content (camera work, screen configuration (character, moving image, still image, or telop positional relationship, etc.)) based on the set template, the presence or absence of a character, and the attribute of the character (sex, Age, voice quality, costume, character if the character is other than a human (animal or the like), etc.) (including information to which settings such as the presence / absence of voice) are included). Then, the distribution device 100 inserts the input moving image data or still image data at a predetermined timing and position in the configuration pattern. More specifically, with reference to FIG. 4, the distribution device 100 inserts the input moving image data or still image data into the topic (4B) at the upper left position on the screen.
- the configuration pattern of the program content camera work, screen configuration (character, moving image, still image, or telop positional relationship, etc.)
- the distribution device 100 inserts the input moving image data or still image data at a predetermined timing and position in the configuration pattern. More specifically, with
- the distribution device 100 may appropriately edit the input moving image data or still image data. More specifically, the distribution device 100 analyzes moving image data or still image data and recognizes a portion having higher importance in the moving image data or still image data. Note that the distribution device 100 may refer to the contents of the document data when analyzing the moving image data or the still image data. For example, when the word “astronaut” is present in the manuscript data, the distribution device 100 may recognize that the astronauts included in the moving image data or the still image data have higher importance. Then, the distribution device 100 edits the moving image data or the still image data (for example, trims, changes the aspect ratio, or the like) so that the portion having higher importance is easily recognized, so that the moving image data or the still image data is more easily recognized. It may be appropriately inserted into the screen.
- the distribution device 100 edits the moving image data or the still image data (for example, trims, changes the aspect ratio, or the like) so that the portion having higher importance is easily recognized, so that the moving image data or the still image data is more easily recognized.
- the distribution device 100 can reduce the cost of generating program content including sound or visual information while maintaining high quality of program content.
- the method of generating the characters displayed in the program content is not particularly limited, and any technique for generating a two-dimensional animation may be used.
- a technique of generating a two-dimensional animation by designating a plurality of feature points in an illustration generated by arbitrary software and designating a temporal change in position coordinates of each feature point may be used.
- a three-dimensional animation may be generated by using an arbitrary three-dimensional modeling technique (for example, modeling, rendering, or retouching).
- the program providing system has a function of adapting sound or visual information to the content of information to be transmitted or the reproduction date and time.
- the distribution apparatus 100 recognizes the content of the transmitted information based on the analysis result of the transmitted information or the set information (genre, type, template, or the like), and sounds or visualizes the program content. Adapt the information to the content. For example, when the content of the transmitted information is related to good news, as illustrated in FIG. 6A, the distribution device 100 determines a costume that gives a bright impression to the viewer as the costume of the character. Conversely, if the content of the transmitted information is related to sad news, as shown in FIG. 6B, the distribution device 100 changes the costume that gives the viewer a dark impression (or a modified impression) to the character's costume. To be determined.
- the specific contents of the costume are not limited to FIG. For example, if the content of the transmitted information relates to a sports tournament, the character's costume may be a sports team uniform or the like.
- the distribution apparatus 100 can adapt not only the costume of the character but also the background music, the attributes of the background or the character, the expression or the tone of the voice, and the like. For example, when the information to be transmitted is good news, the distribution device 100 sets the BGM, the background, and the character to a song, a background, and a character that gives a bright impression, and sets the expression of the character to a bright expression, You may increase the tone of the character's voice.
- the distribution device 100 adapts the sound or the visual information to the date and time or area where the program content data is reproduced, or the season, weather or temperature at the time of reproduction. For example, when the broadcasting season is summer, the distribution device 100 sets the BGM and the background to a song and a background pronounced of summer, the character's costume to summer clothes, and the character's skin to a tanned state. Is also good. Note that the above is only an example, and the distribution apparatus 100 may control the sound or visual information based on information other than the date and time or area in which the program content data is reproduced, or the season, weather or temperature at the time of reproduction. good.
- the distribution device 100 adapts the sound or the visual information to the behavior of the viewer or the situation (or environment) where the viewer is placed. More specifically, the distribution device 100 analyzes data acquired by various sensors (for example, an acceleration sensor, a gyro sensor, or a barometric pressure sensor) of the wearable terminal worn by the viewer, and Recognize the behavior or the situation where the viewer is placed, and adapt sound or visual information to them. For example, when the distribution device 100 recognizes that the viewer is spending a holiday in a relaxed state, the distribution device 100 sets the background music and the background to songs and backgrounds with a high relaxation effect, and changes the character costume to a more casual costume. good. Further, the distribution device 100 predicts the behavior of the viewer or the situation (or environment) where the viewer is placed at a certain point in the future by analyzing the sensing data and the like, and makes the prediction result sound or visual. The information may be adapted.
- various sensors for example, an acceleration sensor, a gyro sensor, or a barometric pressure sensor
- the targets controlled in the above are not limited to BGM, background or character attributes, costumes, facial expressions, or voice tones, but may be anything related to the sound or visual information of the program contents.
- the distribution device 100 allows the speaker (for example, an announcer, a moderator or a radio personality, etc.) to change the expression and tone of the voice based on the content of the information to be transmitted or the reproduction date and time, or to change the costume of the speaker, The same effect as when the BGM or the background is changed can be produced.
- the speaker for example, an announcer, a moderator or a radio personality, etc.
- the program providing system has a function of automatically adding a character action.
- the distribution device 100 analyzes the input moving image data or still image data, and controls the operation of the character so as to be linked to the display position of the target included in the moving image data or still image data. For example, as illustrated in FIG. 7, when moving image data regarding a transition of a weather chart is input, the distribution device 100 analyzes the moving image data and recognizes a display position of a typhoon eye displayed on the weather chart. . Then, the distribution device 100 may move the hand of the character in conjunction with the transition of the weather chart so that the tip of the pointing stick is located at the display position of the eye of the typhoon.
- control content of the operation is not limited to the example of FIG.
- the distribution device 100 may cause the character to take a happy reaction at the timing when the highlight scene is reproduced.
- the target with which the movement of the character is linked is not particularly limited.
- the target with which the motion of the character is linked may be a person, an animal, an object, light (for example, fireworks or illuminations), an illustration, a character, or the like included in the moving image data or the still image data.
- the distribution device 100 can produce the same effect as a speaker (for example, an announcer, a moderator, a radio personality, or the like) actually operating in response to a moving image or a still image.
- a speaker for example, an announcer, a moderator, a radio personality, or the like
- the program providing system has a function of requesting information used for automatically generating program content.
- the distribution apparatus 100 lacks the various information (for example, genre, type, template, text data, moving image data, or still image data, etc.) used for automatically generating the program content described above. Information, or if the information is inappropriate (moving images or still images are not clear, or moving images are too short or too long, etc.), etc. High quality new information can be requested from the creator.
- various information for example, genre, type, template, text data, moving image data, or still image data, etc.
- the method of requesting the missing information or the like is not particularly limited.
- the distribution device 100 may make a request for missing information or the like using an output unit (for example, a display or a speaker) provided in the distribution device 100.
- the distribution apparatus 100 not only notifies the user that the information is “insufficient” or “the information is inappropriate”, but also specifies the content of the missing information or the appropriate information. By doing so, a clearer request may be made to the creator.
- the distribution device 100 can automatically generate the program content more smoothly.
- the distribution device 100 can automatically generate the program content using more appropriate information, so that the quality of the program content can be improved.
- the program providing system has a function of automatically generating document data (or a function of automatically editing) according to the reproduction status of program content by a user.
- the user terminal 200 grasps the state of reproduction of the program content by the viewer. For example, the user terminal 200 grasps the content of the information transmitted to the user in the program content that has already been reproduced, or the content of the information transmitted to the viewer in the reproduced portion of the program content being reproduced. I do.
- the user terminal 200 automatically edits the original data, for example, to “ You can add a comment such as "I do it" to the manuscript data.
- the user terminal 200 automatically edits the original data, for example, " May be added to the manuscript data.
- the editing contents of the manuscript data are not limited to these.
- the distribution device 100 may realize the function in addition to the user terminal 200.
- the distribution apparatus 100 may use, for example, “as reported” or the like when automatically generating document data. Comments may be added to the manuscript data.
- the program providing system can produce the same effect as a speaker (for example, an announcer, a moderator, a radio personality, or the like) appropriately adding an ad-lib according to the information transmission status.
- a speaker for example, an announcer, a moderator, a radio personality, or the like
- the program providing system has a function of inserting information of another content (or another program content) into a program content being reproduced (or a program content to be reproduced).
- the program providing system can set a position where information of another content can be inserted into the document data (hereinafter, referred to as an "insertable position").
- the insertable position is, for example, an end position of the program content, a position serving as a delimiter of the content of the program content (for example, a position at which a topic is changed), or a position of a period, but is not limited thereto. .
- emergency information for example, disaster information or other information having a high degree of importance
- the user terminal 200 transmits the program content being reproduced.
- Emergency information can be inserted at the position where it can be inserted.
- a comment such as "I am in the middle of a program, I will inform you of the emergency information" may be added to the beginning of the emergency information as appropriate.
- the information to be inserted is not limited to emergency information.
- information of another content When information of another content is inserted, information of another content may be transmitted within the program content being reproduced (for example, the character of the program content being reproduced is not changed, and In the case of transmitting information, for example), the information of another content may be transmitted by switching the program content being reproduced to another program content.
- the content of the program content reproduced after the inserted information of another content can be edited as appropriate.
- the program content reproduced after the inserted information of another content may be edited so as to be reproduced from a position serving as a break of the content (for example, a position at which the topic changes).
- a comment such as “The emergency information has been conveyed. At this point, we will return to the original program” may be added to the beginning of the program content reproduced after the inserted information of another content. .
- another new program content may be reproduced instead of reproducing the original program content.
- the program providing system can insert information of another content into the program content being reproduced without giving the viewer a sense of discomfort.
- the program providing system has a function of providing unplayed program content to a viewer.
- the program providing system notifies the viewer of the unreproduced part ( Or, the entire program content including the unplayed portion) can be provided.
- the function may be used when all the program contents are not reproduced for some reason.
- the method of providing the unreproduced program content is not particularly limited.
- an unplayed program content may be provided to a predetermined application (for example, a predetermined application installed on the user terminal 200 or a My Page on a predetermined WEB site).
- program content including sound or visual information may be provided, or only a text file (for example, only a text file of a topic portion) may be provided.
- the viewer may be able to specify the providing method by a predetermined method.
- the program providing system can provide the viewer with the program content that could not be reproduced by the viewer for some reason, and can improve the convenience of the viewer.
- the program providing system has a function of editing program content accompanying skipping and the like.
- the viewer when viewing the program content, the viewer can skip the content of the program content or commercials (or fast-forward, double-speed playback, etc.) on the way.
- the program content ends earlier than the broadcast time due to the skip or the like.
- This function is to shorten the playback time of the program content that was originally scheduled due to skipping, etc., by automatically adding another program content that was not scheduled to be played back, etc. Can be prevented from being terminated.
- the timing at which the different program content is added is not particularly limited.
- the different program content may be added at the last timing of the program content originally scheduled to be reproduced, or may be added at a timing in the middle of a plurality of program contents.
- an unedited portion of the program content being reproduced or another program content scheduled to be reproduced may be automatically edited.
- the playback time of the unplayed portion of the program content being played back may be extended.
- the original data, sound, or visual information of the unreproduced portion of the program content is edited.
- the original data may be edited, and an expression method that makes the reproduction time longer may be adopted, or new contents may be added.
- the deleted program content may be deleted or shortened.
- the program providing system can end the program content at the scheduled broadcast time even when the viewer performs an operation such as skipping. Further, the program providing system can transmit as much information as possible to a viewer within a predetermined broadcast time.
- the distribution device 100 and the user terminal 200 may have the same functional configuration. However, hereinafter, as an example, a case where the functional configurations of the distribution device 100 and the user terminal 200 are different will be described. More specifically, a functional configuration for generating program content will be described for distribution device 100, and a functional configuration for generating (or editing) program content using information provided by distribution device 100 will be described for user terminal 200. explain.
- the distribution device 100 includes a control unit 110, a communication unit 120, an input unit 130, an output unit 140, and a storage unit 150.
- the control unit 110 controls the overall processing of the distribution device 100 in an integrated manner.
- the control unit 110 comprehensively controls the automatic generation processing of the program content described below, distributes the generated program content data, and the like.
- the control unit 110 includes a document generation unit 111, a document analysis unit 112, a voice synthesis unit 113, a request management unit 114, a configuration generation unit 115, and a moving image generation unit 116.
- each functional configuration of the control unit 110 will be described.
- the document generation unit 111 has a functional configuration for automatically generating document data. For example, the document generation unit 111 generates document data by editing one or two or more pieces of text data input from the input unit 130 described later.
- the document generation unit 111 may appropriately regenerate the document data based on the control of the configuration generation unit 115 described later. For example, when the configuration generation unit 115 determines that the original data needs to be changed based on the analysis result of the original data after the original data is generated, the original generation unit 111 The document data is regenerated based on the.
- the document generation unit 111 provides the generated document data to the document analysis unit 112 and the voice synthesis unit 113.
- the document analyzer 112 analyzes document data generated by the document generator 111. More specifically, the document analysis unit 112 extracts information related to the contents of the document data, for example, by extracting words by decomposing the document data. As a result, the document analysis unit 112 can provide information that is not included in various types of information (eg, genre or type) input to the user to the configuration generation unit 115 described below.
- various types of information eg, genre or type
- the information extracted by the document analysis unit 112 by analyzing the document data is not particularly limited.
- the manuscript analyzing unit 112 determines whether a word included in the manuscript data (for example, “sea”) and information associated with the word (for example, “sea bathing” or “summer” associated with “sea”) Or an image such as "wide” or “blue” associated with “the sea”), or information similar to the genre or type described above.
- the original analyzing unit 112 may use information obtained from the outside.
- the document analysis unit 112 may acquire information existing on the Internet and automatically determine the meaning of a word included in the document data, information associated with the word, and the like.
- the document analysis unit 112 may request the creator for information used for analyzing the document data.
- the document analysis unit 112 may request the creator of information on the content of a word included in the document data or information associated with the word.
- the document analysis unit 112 may update the analysis logic by learning information used for analyzing the document data. As a result, the document analysis unit 112 can improve the analysis accuracy as it is used.
- the document analysis unit 112 provides the analysis result to the configuration generation unit 115.
- the voice synthesis unit 113 has a functional configuration that generates voice data corresponding to the document data by performing voice synthesis processing using the document data generated by the document generation unit 111.
- the method of speech synthesis is not particularly limited.
- the speech synthesis unit 113 can use any speech synthesis technique such as waveform connection type speech synthesis or formant synthesis.
- the voice synthesis unit 113 provides the generated voice data to the configuration generation unit 115.
- the request management unit 114 has a functional configuration that receives a request from a creator of the program content and manages the request. For example, the request management unit 114 receives various setting information related to generation of program content.
- the setting information received by the request management unit 114 is the genre, type, template, or the like described above, but is not limited thereto.
- the setting information may include a target of the program content, a broadcast time, a data amount, a screen size, a resolution, a sound volume, subtitle information, and the like (for example, whether or not subtitles exist, a language, and the like).
- the request management unit 114 provides information on these requests to the configuration generation unit 115.
- the configuration generation unit 115 is a functional configuration that generates a configuration of the entire program content.
- the configuration generation unit 115 has a logic for generating program content realized by artificial intelligence technology. More specifically, the configuration generation unit 115 includes information on the creator's request provided from the request management unit 114, an analysis result provided from the document analysis unit 112, audio data provided from the voice synthesis unit 113, Information obtained from the storage unit 150 and arbitrary information obtained from outside (including, for example, a wearable terminal or the like worn by a viewer) (date and time of broadcasting, season, weather, temperature, broadcasting area, etc.) By inputting sensing data of various sensors (for example, an acceleration sensor, a gyro sensor, or a barometric pressure sensor), information on the behavior of the viewer, and the situation (or environment) where the viewer is placed, etc., to the generation logic. Outputs the composition of the content.
- various sensors for example, an acceleration sensor, a gyro sensor, or a barometric pressure sensor
- the program content generation logic outputs a configuration of the program content considered to be optimal based on the above various information by learning a large amount of program content in advance.
- the learning method is not particularly limited, and any method used for machine learning can be used.
- the “configuration” generated by the configuration generation unit 115 refers to the content of document data, the content or setting of sound or visual information (for example, sound quality, volume, voice synthesis method, BGM content, moving image or still image
- sound or visual information for example, sound quality, volume, voice synthesis method, BGM content, moving image or still image
- the configuration of the program content generated by the configuration generating unit 115 is not limited at all by the various types of input information.
- the configuration generation unit 115 generates the configuration of the program content based on the input template.
- the configuration generation unit 115 does not necessarily generate the configuration according to the template.
- the configuration may be generated based on the newly generated template. Accordingly, for example, when an error is included in a part of the input template, the configuration generation unit 115 can generate a template without an error based on a past learning result, so that a more appropriate program A composition of the content can be generated.
- the configuration generation unit 115 determines that it is necessary to regenerate (or edit or the like) the document data or the audio data based on the configuration of the generated program content, the configuration generation unit 111, the document analysis unit 112, and the audio By controlling the synthesizing unit 113, re-generation of original data, analysis of original data, re-generation of audio data, and the like may be performed. If the configuration generation unit 115 determines that it is necessary to regenerate (or edit or the like) moving image data or still image data based on the configuration of the generated program content, the configuration generation unit 115 sets the Alternatively, reproduction (or editing or the like) of still image data or the like may be performed. The configuration generation unit 115 provides information on the configuration of the program content, sound data (including audio data), moving image data, or still image data to the moving image generation unit 116.
- the moving image generating unit 116 has a functional configuration for automatically generating program content data using information related to the configuration of the program content, sound data (including audio data), moving image data, or still image data provided from the configuration generating unit 115. is there. More specifically, the moving image generating unit 116 determines the format, size, security setting (for example, access right, etc.) of the program content data based on the information on the configuration of the program content, and Program content data is generated by integrating and packaging still image data.
- the communication unit 120 has a functional configuration for communicating with an external device.
- the communication unit 120 controls various types of information used by the control unit 110 to generate the program content data (for example, information used by the document analysis unit 112 to analyze the document data, or configuration generation unit 115 by which the configuration generation unit 115 generates the program content configuration).
- Information to be used is received from an external device (for example, a web server on the Internet).
- the communication unit 120 transmits the program content data to the external device.
- the communication method of the communication unit 120 is not particularly limited.
- any wired communication method or wireless communication method may be used.
- the input unit 130 has a functional configuration for receiving an input by a creator.
- the input unit 130 includes an input unit such as a mouse, a keyboard, a touch panel, or a button.
- various information for example, genre, type, template, (Text data, moving image data, still image data, etc.).
- the output unit 140 has a functional configuration for outputting various information.
- the output unit 140 includes a display unit such as a display and an audio output unit such as a speaker, and displays various kinds of visual information on a display or the like based on a control signal from the control unit 110, and outputs various sounds to a speaker or the like. Or caused by
- the storage unit 150 has a functional configuration for storing various information.
- the storage unit 150 stores various information (eg, genre, type, template, text data, moving image data, still image data, and the like) input by the creator, and various information (document data, audio Data, moving image data, still image data or program content data).
- the configuration generation unit 115 may update the generation logic by learning the past program content data stored in the storage unit 150.
- the storage unit 150 stores programs and parameters used for various processes by the distribution device 100. Note that the information stored in the storage unit 150 is not limited to the above.
- the user terminal 200 includes a control unit 210, a communication unit 220, an input unit 230, an output unit 240, and a storage unit 250.
- the control unit 210 controls the overall processing of the user terminal 200 in an integrated manner. For example, the control unit 210 comprehensively controls the automatic generation processing of the program content described below, and reproduces the generated program content data. As shown in FIG. 9, the control unit 210 includes a request management unit 211, a configuration generation unit 212, and a moving image generation unit 213. Hereinafter, each functional configuration of the control unit 210 will be described.
- the request management unit 211 has a functional configuration that receives a request from a viewer of the program content and manages the request.
- the request management unit 211 may request a program content selected by a viewer, a request for skipping, repetitively reproducing, fast-forwarding or rewinding a program content being reproduced, and a request for editing program content data (for example, attributes of characters, subtitles, etc.). And information on various settings (for example, display size, volume, speed, etc.) associated with viewing program contents, and manages them.
- the request management unit 211 may manage information on these requests as viewer preference information.
- the information received and managed by the request management unit 211 is not limited to these.
- the request management unit 211 provides information on these requests to the configuration generation unit 212.
- the configuration generation unit 212 is a functional configuration that generates a configuration of the entire program content.
- the user terminal 200 can generate the program content using the viewer's request and the various information provided by the distribution device 100.
- the distribution device 100 provides original data, analysis results thereof, audio data generated based on the original data, and the like, and the user terminal 200 generates program content using the information.
- the configuration generation unit 212 has the logic of generating program content realized by artificial intelligence technology, similarly to the configuration generation unit 115 of the distribution device 100. Then, the configuration generation unit 212 receives various information (document data, an analysis result thereof, audio data generated based on the document data, etc.) provided by the distribution apparatus 100, and a viewer request provided from the request management unit 211. Information, various information obtained from the storage unit 250 described later, and arbitrary information obtained from the outside (information on the date and time of broadcasting, season, weather, temperature, broadcasted area, etc.) are input to the generation logic. Output the structure of the program content.
- the configuration generation unit 212 provides the video generation unit 213 with information on the configuration of the program content, sound data (including audio data), moving image data, or still image data.
- the moving image generation unit 213 has a functional configuration for automatically generating program content data using information related to the configuration of program content, sound data (including audio data), moving image data, or still image data provided from the configuration generation unit 212. is there. More specifically, the moving image generating unit 213 determines the format, size, security setting (for example, access right, etc.) of the program content data based on the information on the configuration of the program content, and Program content data is generated by integrating and packaging still image data.
- the communication unit 220 has a functional configuration for communicating with an external device. For example, when the user terminal 200 downloads and reproduces the program content data generated by the distribution device 100, the communication unit 220 receives the program content data from an external device including the distribution device 100. Further, when the user terminal 200 generates program content using various information provided by the distribution device 100, the communication unit 220 receives the various information from an external device including the distribution device 100. The reception of such information may be performed based on an operation performed by the viewer, or may be performed by the communication unit 220 at a predetermined timing. For example, the communication unit 220 may access an external device including the distribution device 100 at a predetermined timing and, when new information is generated, receive the information.
- the communication method of the communication unit 220 is not particularly limited.
- any wired communication method or wireless communication method may be used.
- the input unit 230 has a functional configuration for receiving an input by a viewer.
- the input unit 230 includes input means such as a touch panel or a button, and the creator performs various operations using these input means to select program content to be viewed and to perform various settings associated with the viewing of the program content. And so on.
- the output unit 240 has a functional configuration for outputting various information.
- the output unit 240 includes display means such as a display and audio output means such as a speaker, and displays various kinds of visual information on a display or the like based on a control signal from the control unit 210, and outputs various sounds to a speaker or the like. Or caused by
- the storage unit 250 has a functional configuration for storing various information.
- the storage unit 250 stores program content data and the like.
- the storage unit 250 may store viewer preference information.
- the storage unit 250 may store, as viewer preference information, information on various settings made by the viewer as the viewer views the program content, characteristics of the program content viewed by the viewer, and the like.
- the storage unit 250 stores programs and parameters used for various processes by the user terminal 200. Note that the information stored in the storage unit 250 is not limited to the above.
- step S1000 text data is input to the input unit 130 by the creator of the program content.
- step S1004 the document generation unit 111 generates document data using the input text data.
- step S1008, the document analysis unit 112 analyzes the generated document data.
- step S1012, the voice synthesis unit 113 performs voice synthesis processing using the document data, thereby generating voice data corresponding to the document data. Note that the processing in step S1008 and the processing in step S1012 are assumed to be executed in parallel with each other, but are not limited thereto.
- step S1016 the request management unit 114 acquires information on a request from the creator, such as various setting information on generation of program content.
- the processing in step S1016 is assumed to be executed in parallel with the processing up to step S1012, but is not limited to this.
- step S1020 the configuration generation unit 115 generates the information on the creator's request provided from the request management unit 114, the analysis result provided from the document analysis unit 112, the voice data provided from the voice synthesis unit 113, and the like. To generate a program content configuration.
- step S1024 / yes If the document data needs to be regenerated based on the configuration of the generated program content (step S1024 / yes), the process moves to step S1004, and the document generation unit 111 regenerates the document data. If it is not necessary to regenerate the original data (step S1024 / no), in step S1028, the moving image generation unit 116 transmits the information on the structure of the program content, sound data (including sound data), moving image data or still image data. The process ends by generating the program content data using the program content data.
- step S1100 the configuration generation unit 212 outputs various information (document data, analysis results, and audio generated based on the document data) used for generation of the program content provided from the distribution device 100 via the communication unit 220. Data, etc.).
- step S1104 the request management unit 211 acquires information on a request from a viewer, such as various setting information on generation of program content.
- the process of step S1104 is assumed to be executed in parallel with the process of step S1100, but is not limited to this.
- step S ⁇ b> 1112 the configuration generation unit 212 transmits the various information (document data, analysis result, audio data generated based on the document data, etc.) provided from the distribution apparatus 100 and the viewer provided from the request management unit 211.
- the configuration of the program content is generated by inputting information relating to the request to the generation logic.
- step S1116 the moving image generation unit 213 generates program content data using information on the configuration of the program content, and the process ends.
- each data may be regenerated by providing the same functional configuration as the document generation unit 111, the document analysis unit 112, or the speech synthesis unit 113 of the distribution device 100.
- FIG. 12 is a diagram illustrating a hardware configuration of an information processing device 900 that embodies the distribution device 100 and the user terminal 200.
- the information processing apparatus 900 includes a CPU (Central Processing Unit) 901, a ROM (Read Only Memory) 902, a RAM (Random Access Memory) 903, a host bus 904, a bridge 905, an external bus 906, an interface 907, , An input device 908, an output device 909, a storage device (HDD) 910, a drive 911, and a communication device 912.
- a CPU Central Processing Unit
- ROM Read Only Memory
- RAM Random Access Memory
- the CPU 901 functions as an arithmetic processing device and a control device, and controls overall operations in the information processing device 900 according to various programs. Further, the CPU 901 may be a microprocessor.
- the ROM 902 stores programs used by the CPU 901 and operation parameters.
- the RAM 903 temporarily stores a program used in the execution of the CPU 901 and parameters that change as appropriate in the execution. These are mutually connected by a host bus 904 including a CPU bus and the like.
- the functions of the control unit 110 of the distribution device 100 and the control unit 210 of the user terminal 200 are realized by the cooperation of the CPU 901, the ROM 902, and the RAM 903.
- the host bus 904 is connected via a bridge 905 to an external bus 906 such as a PCI (Peripheral Component Interconnect / Interface) bus.
- an external bus 906 such as a PCI (Peripheral Component Interconnect / Interface) bus.
- PCI Peripheral Component Interconnect / Interface
- the host bus 904, the bridge 905, and the external bus 906 do not necessarily need to be separately configured, and these functions may be mounted on one bus.
- An input device 908 includes an input unit such as a mouse, a keyboard, a touch panel, a button, a microphone, a switch, and a lever for inputting information by a user, and an input control circuit that generates an input signal based on an input by the user and outputs the input signal to the CPU 901. It is composed of By operating the input device 908, the user using the information processing device 900 can input various data to each device and instruct a processing operation. Each function of the input unit 130 of the distribution device 100 and the input unit 230 of the user terminal 200 is realized by the input device 908.
- the output device 909 includes a display device such as a CRT (Cathode Ray Tube) display device, a liquid crystal display (LCD) device, an OLED (Organic Light Emitting Diode) device, and a lamp. Further, the output device 909 includes a sound output device such as a speaker and headphones. The output device 909 outputs the reproduced content, for example. Specifically, the display device displays various information such as reproduced video data as text or images. On the other hand, the audio output device converts reproduced audio data and the like into audio and outputs the audio. The output device 909 realizes the functions of the output unit 140 of the distribution device 100 and the output unit 240 of the user terminal 200.
- a display device such as a CRT (Cathode Ray Tube) display device, a liquid crystal display (LCD) device, an OLED (Organic Light Emitting Diode) device, and a lamp.
- the output device 909 includes a sound output device such as a speaker and headphones.
- the storage device 910 is a device for storing data.
- the storage device 910 may include a storage medium, a recording device that records data on the storage medium, a reading device that reads data from the storage medium, a deletion device that deletes data recorded on the storage medium, and the like.
- the storage device 910 is composed of, for example, an HDD (Hard ⁇ Disk ⁇ Drive).
- the storage device 910 drives a hard disk and stores programs executed by the CPU 901 and various data. Each function of the storage unit 150 of the distribution device 100 and the storage unit 250 of the user terminal 200 is realized by the storage device 910.
- the drive 911 is a reader / writer for a storage medium, and is built in or external to the information processing apparatus 900.
- the drive 911 reads information recorded on a removable storage medium 913 such as a mounted magnetic disk, optical disk, magneto-optical disk, or semiconductor memory, and outputs the information to the RAM 903.
- the drive 911 can also write information on the removable storage medium 913.
- the communication device 912 is a communication interface including, for example, a communication device for connecting to the communication network 914.
- the communication device 912 implements the functions of the communication unit 120 of the distribution device 100 and the communication unit 220 of the user terminal 200.
- the program providing system has a function of automatically generating original data to be broadcast, a function of automatically generating sound or visual information of program contents, information to be transmitted, or reproduction date and time.
- a function for adapting sound or visual information a function for automatically adding the action of a character, a function for requesting information used for automatic generation of program content, a function for automatically generating an original according to a reproduction state of program content, and a reproduction. It is possible to realize a function of inserting information of another content into the program content in the middle, a function of providing unreproduced program content to the user, a function of editing program content accompanying skipping and the like. Accordingly, the program providing system according to the present disclosure can reduce the cost of generating program content while maintaining high quality of program content including sound or visual information.
- material data including text data including control characters is transmitted from the user terminal 200 to the distribution device 100.
- the material data is transmitted using, for example, an electronic mail system.
- the distribution device 100 that has received the mail data analyzes the material data included in the mail data and automatically generates program content data based on the material data when the address information of the mail data is preset address information. I do.
- the second embodiment will be described in detail.
- various settings for automatically generating program content data are made. Such setting is performed by the distribution device 100, for example.
- the setter is, for example, a service provider that provides program content data.
- automatic generation of program content data can also be performed by the user terminal 200. In such a case, the setting described below is performed on the user terminal 200, and the setter is the owner of the user terminal 200 or the like.
- various settings may be made on the user terminal 200, the settings may be transmitted to the distribution device 100, and the distribution device 100 may automatically generate program content data according to the transmitted settings.
- FIG. 13 shows an example of a setting screen (setting screen 400) for performing various settings for automatically generating program content data.
- the setting screen 400 is displayed on the output unit 140 (specifically, a display) of the distribution device 100, for example.
- the output unit 140 specifically, a display
- FIG. 13 shows an example of the setting items on the setting screen 400 and the contents that can be set by the setting items will be described.
- the setting item 401 is an item for performing setting relating to the aspect ratio of the display for displaying the program content. In the illustrated example, “horizontal (16: 9)” is set.
- the setting item 402 is an item for setting whether or not to reproduce a sound effect. When the check box in the setting item 402 is checked, the sound effect is reproduced, and when the check box is not checked, the sound effect is not reproduced.
- the sound effects according to the present embodiment are preset data.
- the setting item 403 is an item for setting whether or not to display subtitles. When the check box in the setting item 403 is checked, a subtitle corresponding to the sound emitted by the character is displayed, and when the check is not added, the subtitle is not displayed.
- the setting item 404 is an item for performing setting relating to the type of the character and the costume of the character.
- "AA" for example, a female character
- "summer clothes" is set as the character costume.
- the setting item 405 is an item for performing setting related to a background theme (background color). In the illustrated example, “blue” is set as the background theme.
- the setting item 406 is an item for performing setting relating to a background mode (for example, a background change pattern). In the illustrated example, “normal” is set as the background mode. As the background mode, a plurality of patterns different from the predetermined background mode “normal” can be selected.
- the setting item 407 is an item for performing setting related to a moving image output format.
- the program content data automatically generated by the distribution device 100 is output to a storage device or the like included in the distribution device 100.
- the file format at the time of output can be set using the setting item 407.
- “mp4” is set as the moving image output format.
- another moving image output format avi, etc.
- the setting items 408 to 410 are items for performing settings relating to the mail coordination function of the distribution apparatus 100.
- the mail cooperation function is a function of reflecting the contents of a mail on automatic generation of program contents (the details will be described later). The specific contents of each item will be described.
- the setting item 408 is an item for performing setting relating to a mail address.
- one mail address is shown in the setting item 408, but a plurality of mail addresses may be set.
- the distribution apparatus 100 automatically generates program content data when receiving mail data having the mail address set in the setting item 408.
- the distribution device 100 does not automatically generate program content data.
- “AAA @ .co.jp” is set as the mail address.
- the setting item 409 is an item for performing a setting regarding a cycle (polling cycle) of receiving (or transmitting and receiving) mail data.
- “10 minutes” is set as the confirmation cycle, but any time can be set as the confirmation cycle.
- the setting item 410 is a storage device to which the program content data automatically generated by the distribution device 100 is written. More specifically, the setting item 410 is an item for setting the address of the shared folder. The automatically generated program content data is stored in the shared folder set in the setting item 410. Note that the shared folder set in the setting item 410 is accessible to a predetermined user terminal 200, and the predetermined user terminal 200 can view program content corresponding to the program content data stored in the shared folder. can do.
- the setting item 411 is an item for performing setting relating to the inflection of TTS (Text to Speech).
- TTS Text to Speech
- the user dictionary relating to the inflection of the TTS is set as “none”.
- the save icon 412 is selected when the setting using the setting screen 400 is completed.
- the return icon 413 is selected when the display content is changed from the setting screen 400 to another screen.
- the display for performing each setting described above is displayed on the right side of the setting screen 400, for example.
- a confirmation screen 415 is displayed on the left side of the setting screen 400.
- the confirmation screen 415 is a screen on which each setting content can be confirmed.
- a character or the like is displayed on the confirmation screen 415, and when the setting regarding the type and the clothing of the character is made, the type and the clothing of the character on the confirmation screen 415 change. The same applies to background themes and the like.
- the setter can confirm a specific display corresponding to the setting content.
- Example of email contents Next, an example of text data included in the message information created by the user terminal 200 will be described.
- mail data will be described as an example of message information, and an example in which text data is described in a mail will be described.
- account information a description will be given using a mail address for identifying individual mail data.
- the mail data described below may be created by the distribution device 100 and transmitted to the distribution device 100 itself.
- FIG. 14 shows an example of a screen of a mail created on the user terminal 200 (mail screen 420).
- the mail screen 420 is displayed on the output unit 240 (specifically, a display) of the user terminal 200.
- the input of the mail is performed using the input unit 230, for example.
- a transmission address (mail address of the user terminal 200 of the mail creator) 421 is displayed on the upper side of the mail screen 420.
- the transmission address 421 is, for example, “AAA@co.jp”, and is assumed to be the mail address set in the item related to the mail cooperation function described above.
- a reception address 422 to which the mail is transmitted is displayed.
- “BBB@co.jp” is displayed as the reception address 422.
- the reception address 422 “BBB@co.jp” is, for example, a mail address of the distribution device 100.
- a text (message) 423 input by the user is displayed below the reception address 422.
- the text 423 includes a subject 424 and a text 425.
- the subject 424 may be blank.
- the body 425 includes, for example, a first body 425a, a second body 425b, and a control character 425c input between the first body 425a and the second body 425b.
- the first text 425a is a sentence, for example, "It is clear that the evening in the Kanto region is sunny, the maximum temperature is 25 degrees, the temperature is unlikely to drop to dawn, and it is likely to be a tropical night.”
- the second main text 425b is a text whose text content changes, for example, "By the way, in this hot weather, sales of shaved ice seem to be going well in town.”
- the first and second texts 425a and 425b are both sentences of one sentence, but are not limited to this, and may be sentences of an arbitrary number of sentences.
- one blank line is inserted after the control character 425c, but the one line is not always necessary, and the first body 425a, the control character 425c, and the second body 425b are continuously input. May be.
- the control character 425c is, for example, two characters “@@” and is input at the end of the first body 425a.
- the control character 425c may be a character string different from "@", but from the viewpoint of input convenience, it is a character that is relatively frequently used and has a relatively small number of characters (for example, 1 to 16 characters). Is preferred.
- the control character 425c may be a character, a symbol, a number, or a combination thereof.
- predetermined control is performed at a timing corresponding to the position where the control character 425c is defined.
- the image is switched at a timing corresponding to the position where the control character 425c is defined.
- the control content corresponding to the control character 425c is programmed in the control unit 110 in advance.
- the control content corresponding to the control character 425c may be selected from a plurality of control contents using the setting screen 400, for example.
- the material data according to the present embodiment includes text data (text data corresponding to the first and second texts 425a and 425b) including the control character 425c and image data.
- FIG. 15 shows an example of the attached image.
- FIG. 15A shows an example of the image data 431.
- the image data 431 is an image indicating a general weather condition in the Kanto region, a maximum / minimum temperature for each prefecture in the Kanto region, and the like, and is an image corresponding to the contents of the first text 425a.
- the image data 432 is an image indicating a plurality of shaved ice, and is an image corresponding to the content of the second text 425b.
- the user of the user terminal 200 creates a mail having the contents illustrated in FIG. 14, and then transmits the mail to the distribution device 100. Since the mail is a tool that is widely used, the user terminal 200 can easily create the mail illustrated in FIG.
- the distribution device 100 that has received the mail analyzes the material data included in the mail and automatically generates program content data.
- the distribution apparatus 100 automatically generates program content data.
- step S1201 settings related to the mail coordination function and the like are performed using the setting screen 400 described above. Then, the process proceeds to step S1202.
- step S1202 the distribution device 100 receives the mail transmitted from the user terminal 200 via the communication unit 120. Then, the process proceeds to step S1203.
- step S1203 the control unit 110 of the distribution device 100 determines that the mail address of the received mail is not the mail address registered on the setting screen 400 (more specifically, the setting item 408 related to the mail cooperation function on the setting screen 400). Is determined.
- the process returns to step S1202. If the mail address of the received mail matches the registered mail address (Yes in step S1203), the process proceeds to step S1204.
- step S1204 the control unit 110 of the distribution device 100, specifically, the voice synthesis unit 113 generates voice data corresponding to the text data of the text included in the mail data. At this time, the voice synthesis unit 113 generates voice data corresponding to the text data excluding the control characters 425c (characters with “@”). Then, the process proceeds to step S1205.
- step S1205 program content data is generated.
- the program content data is automatically generated by the moving image generation unit 116 based on the configuration of the program content generated by the configuration generation unit 115.
- the configuration generation unit 115 generates a configuration of program content data based on the content set on the setting screen 400. More specifically, the configuration generation unit 115 sets the preset image and sound data such as the character set on the setting screen 400, the character costume, the background setting, and the sound effect so that the program content data is reflected. Generate a configuration. Further, the configuration generation unit 115 generates a configuration in which the image corresponding to the image data attached to the mail data is switched at the position where the control character 425c is specified, and outputs the configuration as information on the configuration of the program content.
- the configuration generation unit 115 includes information on the configuration of the program content, audio data corresponding to the text data of the mail, image data attached to the mail, and a preset which is set to be output on the setting screen 400.
- the output data and the like are output to the moving image generation unit 116.
- the moving image generator 116 automatically generates program content data based on the information and data supplied from the configuration generator 115. As described above, the moving image generation unit 116 acquires the material data including the text data including the control characters, analyzes the material data, outputs the text data, and reflects the control based on the control characters. Automatically generate program content data. Note that the output based on the sentence data is assumed to be audio output in this example, but may be feedback such as display and vibration of the program content to the viewer. Then, the process proceeds to step S1206.
- the moving image generating unit 116 writes and stores the automatically generated program content data in, for example, the storage unit 150.
- the storage unit 150 in which the program content data is stored is, for example, a storage device that can be connected to a network such as a NAS (Network Attached Storage).
- the sender who sent the mail to the distribution device 100 connects to the storage device and plays back the stored program content data to check what kind of program content was created by the mail created by the sender. can do.
- the storage device in which the automatically created program content data is stored is not limited to the storage unit 150, but may be a storage device of a device on the cloud.
- FIGS. 17A and 17B A specific example of automatically generated program content will be described with reference to FIGS. 17A and 17B.
- a reproduction instruction is issued for the automatically generated program content, and the program content is reproduced.
- a character 450 is displayed on the right side of the screen.
- the type, costume, and the like of the character 450 are as set on the setting screen 400.
- On the left side of the screen an image (weather image) corresponding to the image data 431 attached to the mail data is displayed.
- the content described in the subject of the mail is displayed as the title of the program content.
- the text data corresponding to the subject of the mail is displayed, and the setting contents are described in the program executed by the moving image generating unit 116. If there is no e-mail subject, nothing may be displayed.
- the opening theme is played.
- Reproduction of the opening theme is performed, for example, by reproducing preset audio data when “with sound effect” is set on the setting screen 400.
- the character 450 speaks.
- the content of the story is the content of the first text 425a described in the text of the mail.
- the character 450 is displayed so that the mouth moves while speaking.
- the expression of the character 450 may change or the intonation of the voice may change.
- the content of the character 450 is changed to the content of the second text 425b.
- the control character 425c indicating the switching of the image is input. Therefore, the control based on the control character 425c is reflected in the program content.
- the display image changes to an image (shaved ice image) corresponding to the image data 432, as shown in FIG. 17B.
- the character 450 speaks the content corresponding to the second text 425b.
- the program content reflecting the content (including the content of the control) described in the mail is reproduced.
- the user can obtain the program content data in which the control desired by the user is reflected only by transmitting the mail to the apparatus for automatically generating the program content data.
- the automatically generated program content data is output to a NAS or the like, and the program content data can be accessed, so that the user can view the program content reflecting the control desired by the user. If the user who has viewed the program content is dissatisfied with the result (for example, the timing of switching images), the user can easily edit and correct the content of the program content simply by editing the mail content again and transmitting it to the distribution device. be able to.
- the content of the control corresponding to the control character is the switching of the image.
- the content of the control corresponding to the control character can be set as appropriate.
- the content of the control corresponding to the control character may be, for example, that the character in the program content performs a predetermined operation. In this case, at the timing corresponding to the position where the control character is defined in the text of the mail, the program content in which the character performs a predetermined operation is automatically generated.
- the content of the control corresponding to the control character may be defined using the setting screen 400 or the like. Further, the content of the control corresponding to the control character may be defined in the transmitted mail.
- control character is described as “@@”.
- the present invention is not limited to this, and other characters and numbers may be used.
- the number of characters for example, 16 characters or less
- the type of characters are easy to remember and easy for the user to remember. Note that what characters are easy to use and easy to remember as control characters differs depending on the user. Therefore, the control character itself may be defined by the user.
- the image data is attached to the mail.
- the image data may not be attached, and the material data may be only the text data.
- different program contents may be automatically generated depending on the presence or absence of attached data such as image data.
- the program content in which the character is displayed on the right side of the screen is automatically generated.
- the display position of the character does not need to be on the right side. Therefore, when image data is not attached to the mail, for example, the program content in which the character's standing position is in front may be automatically generated.
- the control unit of the distribution device may change the content of the control corresponding to the control character according to whether or not the image data is attached.
- the automatically generated program content data is stored in the storage unit. Access to the stored program content data may be restricted. For example, a restriction may be set such that only the mail sender or a specific user can access the stored program content data. Further, the automatically generated program content data may be disclosed to an unspecified number of users. In this case, restrictions on the viewing period of the program content and the like may be set. Publication of the program contents may be performed for a fee. Further, feedback (for example, impression, evaluation, etc.) from a user who has viewed the program content may be made. The created program content data may be automatically distributed to a specific user terminal.
- a restriction may be set such that only the mail sender or a specific user can access the stored program content data.
- the automatically generated program content data may be disclosed to an unspecified number of users. In this case, restrictions on the viewing period of the program content and the like may be set. Publication of the program contents may be performed for a fee. Further, feedback (for example, impression, evaluation, etc.) from a user who has
- control characters may be forgotten to be inserted. Therefore, even if there is no control character, a process for appropriately switching the image may be performed. For example, if the control unit has a term (for example, “from here”) indicating a topic change but no control character inserted before it, a process of switching images regardless of the presence or absence of the control character May be performed.
- a process of switching images regardless of the presence or absence of the control character May be performed.
- the automatically generated program content data may be automatically distributed at a predetermined time.
- the predetermined time can be set using the setting screen 400 or the like.
- the sentence data included in the above-described mail may be input by a plurality of users.
- one program content data on which predetermined control is reflected can be shared and created by a plurality of users.
- the message information may be SMS (Short Message Service), MMS (Multimedia Messaging Service), chat, comment, a bulletin board provided via a network, etc.
- SMS Short Message Service
- MMS Multimedia Messaging Service
- chat comment
- bulletin board provided via a network
- a bulletin board on a network that can be written on the distribution device side may be prepared, and the user may log in to the bulletin board and input text data including control characters into the bulletin board.
- the distribution device automatically generates the program content data according to the text data or the like input to the bulletin board.
- the e-mail address is used as an example of the account information.
- any information that can identify the sender such as a telephone number, a password, and a user ID (Identification), may be used.
- the processing performed by the above-described distribution device may be performed by the user terminal. Further, the above-described processing can be realized by a method or a program. By downloading and installing the program, the user can automatically generate the program content data on his / her own terminal.
- steps shown in the above-mentioned flowcharts do not necessarily need to be processed in chronological order in the order described in the flowcharts. That is, each step may be processed in an order different from the order described in the flowchart, or may be processed in parallel.
- the functional configuration of the distribution device or the user terminal may be changed as appropriate.
- a part of the functional configuration of the distribution device or the user terminal may be appropriately provided in an external device.
- the control unit of the distribution device may realize some functions of the communication unit, the input unit, and the output unit.
- the control unit of the user terminal may realize some functions of the communication unit, the input unit, and the output unit.
- the present disclosure may have the following configurations.
- An information processing device including a control unit.
- the information processing apparatus according to (1) wherein, when receiving message information having predetermined account information, the control unit analyzes the material data included in the message information.
- the message information includes first text data corresponding to a subject and second text data corresponding to a text, The information processing apparatus according to (2), wherein the control unit automatically generates at least program content data on which the first text data is displayed and audio output corresponding to the second text data is performed.
- the control unit automatically generates program content data for outputting audio corresponding to the second text data excluding the control character (3)
- An information processing apparatus according to claim 1.
- the information processing device according to any one of (2) to (4), wherein the control unit automatically generates program content data in which an image is switched at a timing corresponding to a position where the control character is defined.
- the images are a plurality of images attached to the message information.
- the information processing apparatus according to any one of (2) to (6), wherein the control unit automatically generates program content data in which a character performs a predetermined operation at a timing corresponding to a position where the control character is defined.
- the information processing apparatus (13) The information processing apparatus according to (12), wherein the restriction is at least one of a restriction on a viewer of the program content data and a restriction on a viewing period of the program content data. (14) The information processing device according to any one of (1) to (13), wherein the control unit automatically generates the program content data including preset content data. (15) The information processing apparatus according to any one of (1) to (14), wherein the control character is one to 16 characters, symbols, numbers, or a combination thereof.
- a communication unit that receives message information including text data including a control character transmitted from an arbitrary terminal; When the account information of the received message information is predetermined account information, the sentence data is analyzed, the output based on the sentence data is performed, and the program content data reflecting the control based on the control character is reflected.
- An information processing system comprising: a control unit that automatically generates the control unit.
- a control unit acquires material data including text data containing control characters, analyzes the material data, outputs based on the text data, and reflects program content data on which control based on the control characters is reflected.
- a control unit acquires material data including text data containing control characters, analyzes the material data, outputs based on the text data, and reflects program content data on which control based on the control characters is reflected.
- a program that causes a computer to execute an information processing method that automatically generates a program.
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Computer Security & Cryptography (AREA)
- Business, Economics & Management (AREA)
- Marketing (AREA)
- Information Transfer Between Computers (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
制御文字が含まれる文章データを含む素材データを取得し、前記素材データを解析し、前記文章データに基づく出力がなされ、且つ、前記制御文字に基づく制御が反映された番組コンテンツデータを自動生成する制御部を備える情報処理装置である。 図16
Description
本開示は、情報処理装置、情報処理システム、情報処理方法及びプログラムに関する。
近年、情報処理技術の進歩に伴い、テレビ、ラジオ又はインターネットの動画配信サイト等で放送される番組コンテンツについて、様々な生成方法又は提供方法が開発されている。例えば、以下の特許文献1には、ニュース、天気、ツイッタフィードなど、ウェブサイトで提供される各種テキスト情報を、楽曲などのオーディオデータと組み合わせて番組コンテンツを生成する技術及び生成された番組コンテンツを音声出力する技術が開示されている。
このような分野では、例えば、専門的な知識を有しないユーザであっても、番組コンテンツを容易に作成、編集等できることが望まれる。
本開示は、専門的な知識を有しないユーザであっても、番組コンテンツを容易に作成、編集等することができる情報処理装置、情報処理システム、情報処理方法及びプログラムを提供することを目的の一つとする。
本開示は、例えば、
制御文字が含まれる文章データを含む素材データを取得し、素材データを解析し、文章データに基づく出力がなされ、且つ、制御文字に基づく制御が反映された番組コンテンツデータを自動生成する制御部を備える
情報処理装置である。
制御文字が含まれる文章データを含む素材データを取得し、素材データを解析し、文章データに基づく出力がなされ、且つ、制御文字に基づく制御が反映された番組コンテンツデータを自動生成する制御部を備える
情報処理装置である。
本開示は、例えば、
任意の端末から送信された、制御文字が含まれる文章データを含むメッセージ情報を受信する通信部と、
受信したメッセージ情報のアカウント情報が予め設定されたアカウント情報である場合に、文章データを解析し、文章データに基づく出力がなされ、且つ、制御文字に基づく制御が反映された番組コンテンツデータを自動生成する制御部と
を備える情報処理システムである。
任意の端末から送信された、制御文字が含まれる文章データを含むメッセージ情報を受信する通信部と、
受信したメッセージ情報のアカウント情報が予め設定されたアカウント情報である場合に、文章データを解析し、文章データに基づく出力がなされ、且つ、制御文字に基づく制御が反映された番組コンテンツデータを自動生成する制御部と
を備える情報処理システムである。
本開示は、例えば、
制御部が、制御文字が含まれる文章データを含む素材データを取得し、素材データを解析し、文章データに基づく出力がなされ、且つ、制御文字に基づく制御が反映された番組コンテンツデータを自動生成する
情報処理方法である。
制御部が、制御文字が含まれる文章データを含む素材データを取得し、素材データを解析し、文章データに基づく出力がなされ、且つ、制御文字に基づく制御が反映された番組コンテンツデータを自動生成する
情報処理方法である。
本開示は、例えば、
制御部が、制御文字が含まれる文章データを含む素材データを取得し、素材データを解析し、文章データに基づく出力がなされ、且つ、制御文字に基づく制御が反映された番組コンテンツデータを自動生成する
情報処理方法をコンピュータに実行させるプログラムである。
制御部が、制御文字が含まれる文章データを含む素材データを取得し、素材データを解析し、文章データに基づく出力がなされ、且つ、制御文字に基づく制御が反映された番組コンテンツデータを自動生成する
情報処理方法をコンピュータに実行させるプログラムである。
少なくとも一つの実施の形態によれば、番組コンテンツを容易に作成、編集等することができる。なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれの効果であっても良い。また、例示された効果により本開示の内容が限定して解釈されるものではない。
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を適宜、省略する。
なお、説明は以下の順序で行うものとする。
<第1の実施の形態>
<第2の実施の形態>
<変形例>
<第1の実施の形態>
<第2の実施の形態>
<変形例>
<第1の実施の形態>
[背景]
まず、本開示の背景について説明する。テレビ、ラジオ又はインターネットの動画配信サイト等で放送される番組コンテンツは、予め作成された原稿と話者(例えば、アナウンサー、司会者又はラジオパーソナリティ等)のアドリブ等によって構成されている。
[背景]
まず、本開示の背景について説明する。テレビ、ラジオ又はインターネットの動画配信サイト等で放送される番組コンテンツは、予め作成された原稿と話者(例えば、アナウンサー、司会者又はラジオパーソナリティ等)のアドリブ等によって構成されている。
より具体的には、話者は、自らのスキル及び経験等に基づいて、伝達する内容の追加、変更又は削除等を行うことによって、番組コンテンツが予め決められた放送時間に終了するように調整している。例えば、原稿の内容が残りの放送時間に伝達可能な量よりも多い場合には、話者は、より優先度が低い内容を省略したり、より短い表現に変更したりすること等によって、より優先度が高い情報を伝達しつつ番組コンテンツを放送時間に終了させるように調整している。
また、原稿が複数存在する場合、話者は、ある原稿を読み終えて、次の原稿を読み始めるまでの間に、接続詞(例えば、「さて」、「続いて」、「それでは」、「ところで」等)又はアドリブ等を適宜挿入することによって、ある原稿から次の原稿への移行を円滑に行っている。
また、話者は、ユーザの視聴状況に応じてアドリブを入れる場合がある。例えば、過去に伝達された情報が再び伝達される場合、話者は、「お伝えしているとおり」等のように原稿の内容への導入部分としてアドリブを入れる場合がある。また、過去に伝達されていない新規情報が伝達される場合、話者は、「について新たな情報が入ってきました。」等のアドリブを入れる場合がある。
また、緊急情報(災害情報、その他重要度の高い情報等)を伝達する必要が生じた場合には、話者は、伝達中の情報の途中に緊急情報を伝達したり、伝達する情報の順番を入れ替えることによって優先的に緊急情報を伝達したりしていた。
また、話者は、伝達する情報の内容に応じて身振り手振り等のジェスチャーを交えながら情報を伝達することがある。例えば、天気予報において、話者が指示棒で天気図の一部を指し示しながら情報を伝達したり、表示された動画又は静止画に視線を向けながら情報を伝達したりする場合がある。
また、話者は、伝達する内容に基づいて表情又は声のトーン等を適宜変える。例えば、伝達する内容が悲報(例えば、事故もしくは災害の発生又は人の死去等)である場合には、話者は、表情を暗く変え、声のトーンを低く変えて情報を伝達する。逆に、伝達する内容が朗報(例えば、結婚、出産又は大会での優勝等)である場合には、話者は、表情を明るく変え、声のトーンを高く変えて情報を伝達する。また、表情又は声のトーンだけでなく、例えば、話者の衣装、BGM又は背景等が、伝達される内容に基づいて変更される場合もある。
また、BGM、背景、話者の表情、声のトーンもしくは衣装等は、伝達される内容だけでなく、番組コンテンツが再生される日時もしくは地域、又は、再生時の季節、天気もしくは気温にも基づいて変更される場合がある。例えば、再生時の季節が夏である場合には、話者の衣装が夏服にされ、BGM及び背景が夏を連想させる曲及び背景に変更される場合がある。
以上も踏まえて、一つの番組コンテンツが作成されるまでには、原稿の作成、衣装の決定及び調達、BGMの決定及び編集、背景の決定、作成及び設置、カメラワークの決定、話者のキャスティング、話者との打ち合わせ、話者によるアドリブの内容の検討等、リハーサル、本番撮影、編集及び放送等のように、多くの作業が行われることによって、番組コンテンツの作成コストは大きくなる傾向にあった。また、番組コンテンツの品質(視聴者が心地よく視聴可能か否か、アドリブが適切であるか否か等)及び番組コンテンツが放送時間に終了するか否か等については話者のスキル又は経験等に依存していた。
本件の開示者は、上記事情に鑑み、本開示を創作するに至った。本開示は、素材データを取得し、素材データの内容を解析し、その内容に基づいて視覚情報を含む番組コンテンツを自動生成することができる。以降では、本開示の実施の形態に係る番組提供システムの詳細について説明していく。
[番組提供システムの構成]
上記では、本開示の背景について説明した。続いて、図1を参照して、本開示の実施の形態に係る番組提供システムの構成について説明する。
上記では、本開示の背景について説明した。続いて、図1を参照して、本開示の実施の形態に係る番組提供システムの構成について説明する。
図1に示すように、本実施の形態に係る番組提供システムは、配信装置100と、ユーザ端末200とを備え、配信装置100及びユーザ端末200はネットワーク300によって接続されている。
配信装置100は、番組コンテンツを自動生成し、配信する機能を有する情報処理装置である。より具体的には、番組コンテンツの作成者が番組コンテンツの元となる素材データを配信装置100に対して入力すると、配信装置100は、素材データの内容に基づいて視覚情報を含む番組コンテンツを自動生成する。
例えば、配信装置100は、素材データとして入力された文章データに基づいて原稿データを生成する。そして、配信装置100は、当該原稿データと、素材データとして入力された動画データ又は静止画データ等に基づいて視覚情報を含む番組コンテンツを生成する。ここで、番組コンテンツは、原稿データに対して音声合成処理が施されることによって音声を出力可能なものであっても良いし、原稿データを字幕として表示可能なものであっても良いし、入力された動画データ又は静止画データ以外の、例えば、任意のキャラクターを表示可能なものであっても良い。また、番組コンテンツは、テレビで放送されるコンテンツ、インターネットの動画配信サイトで配信されるコンテンツ、所定の広告媒体に表示されるコンテンツ又はラジオで放送されるコンテンツ等を含み、且つ、これらに限定されない。番組コンテンツの内容及び生成方法等の詳細については後述する。
そして、配信装置100は、生成した番組コンテンツをユーザ端末200に提供することで視聴者に対して番組コンテンツを提供する。より具体的には、配信装置100は、ユーザ端末200がアクセス可能なサーバ(例えば、インターネット上の特定のWEB(World Wide Web)サイトを管理するWEBサーバ等)に番組コンテンツをアップロードし、ユーザ端末200が当該サーバから番組コンテンツをダウンロードする。なお、番組コンテンツの提供方法はこれに限定されない。例えば、ユーザ端末200がネットワーク300を介して配信装置100に直接アクセスして、番組コンテンツを取得しても良い。また、ユーザ端末200が番組コンテンツをダウンロードするプル型配信ではなく、プッシュ型配信が行われても良い。
ユーザ端末200は、配信装置100によって配信された番組コンテンツを再生する機能を有する情報処理装置である。より具体的には、ユーザ端末200は、視聴者の操作に基づいて選択された番組コンテンツを、自装置に備えられる出力部(例えば、ディスプレイ、スピーカー等)を用いて再生する。
また、ユーザ端末200は、配信装置100によって生成された番組コンテンツを編集する機能を有する。例えば、ユーザ端末200は、視聴者による設定、又は、視聴者の嗜好情報等に基づいて番組コンテンツの内容(原稿データ、動画データ、静止画データ又はBGMの内容等)又は再生方法(例えば、表示サイズ、音量、速度等)を編集する機能を有する。また、ユーザ端末200は、配信装置100が途中まで加工した素材データを用いて番組コンテンツを生成する機能も有する。例えば、ユーザ端末200は、配信装置100が、フィルタリングによるノイズ除去、トリミング、フォーマット変換等を施した素材データを用いて番組コンテンツを生成する機能を有する。
なお、本明細書では一例として、上記のように、配信装置100が生成した番組コンテンツを、ユーザ端末200が再生したり編集したりする場合を説明するが、各種処理は配信装置100及びユーザ端末200のどちらで実行されても良い(換言すると、配信装置100とユーザ端末200は互いに同一の機能構成を備え得る。)。例えば、配信装置100が番組コンテンツの元となるデータ(素材データ自体、又は、素材データが加工されたデータ)を配信し、ユーザ端末200が当該データ及び視聴者の嗜好情報等を用いて番組コンテンツを自動生成して再生しても良い。また、ユーザ端末200が視聴者の嗜好情報等を配信装置100に提供し、配信装置100が当該情報を用いて自動生成した番組コンテンツをユーザ端末200に配信しても良い。
配信装置100及びユーザ端末200は、例えば、デスクトップ型、ノート型もしくはタブレット型のPC(Personal Computer)、スマートフォン、汎用コンピュータ、各種ウェアラブル端末(例えば、メガネ型端末、時計型端末、衣服型端末、指輪型端末、ブレスレット型端末、イヤリング型端末、ネックレス型端末等)、ヘッドマウント型ディスプレイ等であるが、これらに限定されない。
ネットワーク300は、ネットワーク300に接続されている配信装置100及びユーザ端末200によって通信される情報のための有線、又は無線の伝送路である。例えば、ネットワーク300は、インターネットなどの公衆回線網や、Ethernet(登録商標)を含む各種のLAN(Local Area Network)、WAN(Wide Area Network)などを含んでも良い。また、ネットワーク300は、IP-VPN(Internet Protocol-Virtual PrivateNetwork)などの専用回線網や、Bluetooth(登録商標)などの近距離無線通信網を含んでも良い。
なお、図1の構成はあくまで一例であり、本実施の形態に係る番組提供システムの構成は、これに限定されない。例えば、上記のとおり、本実施の形態に係る番組提供システムは、配信装置100又はユーザ端末200のいずれかによって構成されても良い。
[機能概要]
上記では、本開示の実施の形態に係る番組提供システムの構成について説明した。続いて、実施の形態に係る番組提供システムの機能概要について説明する。
上記では、本開示の実施の形態に係る番組提供システムの構成について説明した。続いて、実施の形態に係る番組提供システムの機能概要について説明する。
(原稿生成機能)
本実施の形態に係る番組提供システムは、放送される原稿データを自動生成する機能を有する。
本実施の形態に係る番組提供システムは、放送される原稿データを自動生成する機能を有する。
より具体的に説明すると、まず、配信装置100は、素材データとして文章データ、及び、当該文章データの内容についてのジャンルもしくは種別、又は、テンプレートに関する情報を入力される。
ここで、文章データは、テキストファイル、ワープロソフト等で生成されたデータファイルを想定しているが、これに限定されない。例えば、文章データは、文章が表示された画像ファイルであり、配信装置100が当該画像ファイルを解析することで文章を抽出しても良い。また、文章データは単数であっても良いし、複数であっても良い。
また、文章データの内容についてのジャンルとは、伝達される情報の分類であり、例えば、図2に示すように、「政治」、「経済」、「エンターテインメント」、「スポーツ」、「国際」、「天気」等であるがこれに限定されない。例えば、ジャンルとは、「全国の天気」、「東京都の天気」、「1週間の天気」、「1日の天気」等のように、上記のジャンル(例えば、「天気」等)を細分化したものであっても良い。なお、当該ジャンルの入力は必須ではない。
また、文章データの内容についての種別とは、伝達される情報が何らかの種類によって区別されたものであり、例えば、図3に示すように、「世界」、「全国」、「県」、「市」、「区町村」、「個人」等のように情報伝達の対象範囲の種類によって区別されたもの等であるがこれに限定されない。例えば、文章データの内容についての種別とは、「男性」、「女性」、「老人」、「子供」等のように情報伝達の対象者の種類によって区別されたものであっても良いし、「緊急」又は「通常」等のように情報伝達の緊急性の種類によって区別されたものであっても良いし、「悲報」又は「朗報」等のように情報内容によって区別されたものであっても良い。なお、当該種別の入力は必須ではない。
テンプレートとは、番組コンテンツの構成パターンを示す情報である。例えば、テンプレートとは、図4に示すように、「オープニング(4A)」、「トピック(4B)」、「エンディング(4C)」という構成パターンである。なお、テンプレートは、図4の例に限定されず、例えば、「オープニング(4A)」、「トピック(4B)」、「エンディング(4C)」のいずれかが省略された構成パターンであっても良いし、これら以外の構成が追加された構成パターンであっても良い。また、テンプレートは、カメラワーク、画面構成(キャラクター、動画、静止画又はテロップの位置関係等)、キャラクターの有無、キャラクターの属性(性別、年齢、声質、衣装、キャラクターが人間以外(動物等)である場合にはその種類等)、音声の有無等の設定が付加された情報であっても良い。当該テンプレートは、作成者によって作成されても良いし、既存の番組(例えば、テレビ番組、インターネット配信番組、ラジオ番組等)の学習結果に基づいて自動生成されても良い。作成者は、このようなテンプレートを選択することによって、所望の番組コンテンツを配信装置100に生成させることができる。なお、テンプレートの入力は必須ではない。
配信装置100は、入力された上記の各種情報に基づいて原稿データを自動生成する。より具体的には、配信装置100は、入力された文章データを解析し文章データの内容を把握する。例えば、配信装置100は、文章データに含まれる単語を抽出し、自装置に記憶されている情報又は外部装置(例えば、外部のWEBサーバ等)から取得した情報等を用いて当該単語の内容を認識する。これによって、配信装置100は、入力されたジャンル又は種別だけでなく、文章データを自ら解析した結果に基づいて、文章データの内容についてのジャンル又は種別等を認識し、この後の処理に用いることができる。
そして、配信装置100は、ジャンル、種別、テンプレート、文章データの解析結果等に基づいて放送される原稿データを自動生成する。より具体的には、配信装置100は、入力された文章データの一部の削除もしくは変更、又は、文章データに含まれない情報の追加等を行うことで原稿データを自動生成する。
ここで、図4のテンプレートが用いられる場合を一例として、原稿データの自動生成について説明する。例えば、トピック(4B)で放送される情報についての文章データが配信装置100に入力されたとする。配信装置100は、入力された文章データを用いて、トピック(4B)で放送される原稿データを自動生成するとともに、オープニング(4A)及びエンディング(4C)で放送される原稿データも自動生成する。
配信装置100は、オープニング(4A)、トピック(4B)及びエンディング(4C)にて放送される原稿データを生成するにあたり、伝達される情報の内容、番組コンテンツデータが再生される日時もしくは地域、又は、再生時の季節、天気もしくは気温に基づいて、入力された文章データに含まれない内容を追加する。例えば、配信装置100は、オープニング(4A)に「明けましておめでとうございます。2017年1月1日のニュースをお伝えします。」等のように番組コンテンツデータが再生される日時に基づく内容を追加しても良い。また、配信装置100は、トピック(4B)の冒頭に「早速ですが、悲報が入ってきました。」等のように伝達される情報の内容に基づく内容を追加しても良い。また、配信装置100は、エンディング(4C)に「この後、午前10時から午後15時までに、東京都では強い雨が降ることが予想されます。雨具をお忘れなく。」等のように再生される地域及び再生時の天気に基づく内容を追加しても良い。
また、視聴者の行動又は視聴者が置かれた状況(又は環境)等に応じた内容が追加されても良い。より具体的には、配信装置100(又はユーザ端末200)が、視聴者によって装着されているウェアラブル端末の各種センサ(例えば、加速度センサ、ジャイロセンサ又は気圧センサ等)によって取得されたデータを解析することで、視聴者の行動又は視聴者が置かれた状況等を認識し、これらに応じた内容を追加しても良い。例えば、配信装置100等は、視聴者が通勤中であると認識した場合には、エンディング(4C)に「今日もお仕事頑張ってください。」等の内容を追加しても良い。
また、配信装置100等は、未来のある時点における視聴者の行動又は視聴者が置かれる状況(又は環境)等を、上記のセンシングデータ等を解析することで予測し、当該予測結果に応じた内容を追加しても良い。例えば、配信装置100等は、視聴者が通勤時に乗り物(例えば、電車又は自動車等)に乗ったことを認識した場合、過去の行動履歴に基づいて予測した降車時間において、「今日もお仕事頑張ってください。」等の内容を追加しても良い。なお、上記のように追加される内容は、予め、他の文章データが入力されることによって自動生成されたものであっても良い。
また、配信装置100は、入力された文章データの一部の削除又は変更を行う。例えば、上記のように追加された内容の中に、入力された文章データと重複する内容が含まれる場合(例えば、「2017年1月1日のニュースをお伝えします。」という内容が追加され、同様の趣旨の内容が文章データにも含まれる場合)、配信装置100は、文章データにおける重複部分の削除又は変更を適宜行っても良い。また、配信装置100は、同一の単語が頻発したり難解な単語が存在したりする場合に適宜別の表現に変更しても良い。
なお、配信装置100は、素材データである文章データを変更することなく原稿データを生成しても良い。例えば、何らかの理由で文章データの変更が禁止されている場合(例えば、文章データが著作権で保護されている場合等)において、配信装置100は、入力された文章データを変更することなく、文章データの前後に付加する内容を調整することで原稿データを生成しても良い。その際、配信装置100は、原稿の読み上げ速度を調整したり、適宜間を設けたりすることで、視聴者が違和感を受けにくくすることができる(なお、再生時間の調整については後述する)。
これによって、配信装置100は、話者(例えば、アナウンサー、司会者又はラジオパーソナリティ等)がアドリブを交えつつ提供するような品質の高い番組コンテンツを生成することができ、かつ、番組コンテンツの生成コストを削減することができる。また、番組コンテンツの作成者は、核となる情報である文章データの作成に注力することができる。
また、予め放送時間が決められている番組コンテンツにおいて、配信装置100は、放送時間に番組コンテンツが終了するように、原稿データを生成することができる。より具体的には、配信装置100は、原稿データを生成する際に、音声データの再生時間を算出する。例えば、配信装置100は、音声合成に用いられる各種パラメータの内容に基づいて、原稿データの音声合成後の音声データの再生時間を算出する。
そして、生成された原稿データ(又は生成中の原稿データ)の再生時間が予め決められた放送時間よりも長い場合、配信装置100は、原稿データを編集する。例えば、配信装置100は、入力された文章データにおいて優先度の低い情報を削除したり、文章データとは異なる表現に変更したり、追加した内容の削除又は変更等によって、原稿データの再生時間が予め決められた放送時間になるように原稿データを編集する。逆に、生成された原稿データ(又は生成中の原稿データ)の再生時間が予め決められた放送時間よりも短い場合、配信装置100は、入力された文章データとは異なる表現に変更したり、追加した内容を変更したり、新たに別の内容を追加すること等によって、原稿データの再生時間が予め決められた放送時間になるように原稿データを編集する。
ここで、配信装置100は、ある伝達情報に対して再生時間が異なる複数の原稿データを生成し、当該複数の原稿データの中から適切な原稿データを選択することで、放送時間に終了する原稿データの生成を実現しても良い。例えば、配信装置100は、入力された文章データを解析し、その解析結果に基づいて、図5に示すような、再生時間が互いに異なり、かつ、視聴者が理解し得る複数の原稿データを生成する。そして、配信装置100は、放送時間又は他の伝達情報の原稿データ等に基づいて、複数の原稿データの中から適切な原稿データを選択することで、放送時間に終了する原稿データの生成を実現しても良い。なお、配信装置100は、図5に示すようなリストを作成者に提示することによって、作成者に複数の原稿データの中から所望の原稿データを選択させても良い。
以上によって、配信装置100は、話者(例えば、アナウンサー、司会者又はラジオパーソナリティ等)が、伝達すべき情報と残りの放送時間に基づいて伝達する内容、表現方法又は話す速度等を変えるように動作することができ、番組コンテンツを放送時間に終了させることができる。
(音又は視覚情報の生成機能)
また、本実施の形態に係る番組提供システムは、番組コンテンツの音又は視覚情報を自動生成する機能を有する。
また、本実施の形態に係る番組提供システムは、番組コンテンツの音又は視覚情報を自動生成する機能を有する。
より具体的に説明すると、配信装置100は、素材データとして動画データ又は静止画データ等を入力される。そして、配信装置100は、これらのデータと、上記で設定された情報(ジャンル、種別又はテンプレート等)及び上記で生成した原稿データを用いて、音又は視覚情報を含む番組コンテンツを自動生成する。
例えば、配信装置100は、生成した原稿データを用いて音声合成処理を行うことによって、音声データを含む番組コンテンツを生成する。また、配信装置100は、音声だけでなく、何らかの音(例えば、BGM、効果音等)を付加することもできる。また、配信装置100は、入力された素材データの解析結果に基づいて何らかの音を付加しても良い。例えば、素材データがスポーツ大会に関する動画データ等であると解析された場合、配信装置100は、当該スポーツ大会のテーマ曲をBGMとして付加しても良い。
また、配信装置100は、設定されたテンプレートに基づいて番組コンテンツの構成パターン(カメラワーク、画面構成(キャラクター、動画、静止画又はテロップの位置関係等)、キャラクターの有無、キャラクターの属性(性別、年齢、声質、衣装、キャラクターが人間以外(動物等)である場合にはその種類等)、音声の有無等の設定が付加された情報を含む)を決定する。そして、配信装置100は、入力された動画データ又は静止画データを構成パターンにおける所定のタイミング及び位置に挿入する。図4を参照して具体的に説明すると、配信装置100は、入力された動画データ又は静止画データをトピック(4B)における、画面左上の位置に挿入する。
このとき、配信装置100は、入力された動画データ又は静止画データを適宜編集しても良い。より具体的には、配信装置100は、動画データ又は静止画データを解析して動画データ又は静止画データにおいてより重要度が高い部分を認識する。なお、配信装置100は、動画データ又は静止画データの解析にあたり、原稿データの内容を参照しても良い。例えば、原稿データに「宇宙飛行士」という単語が存在する場合に、配信装置100は、動画データ又は静止画データに含まれる宇宙飛行士の重要度がより高いと認識しても良い。そして、配信装置100は、より重要度が高い部分が視認され易いように動画データ又は静止画データを編集(例えば、トリミング、縦横比の変更等)することで、動画データ又は静止画データがより適切に画面中に挿入されるようにしても良い。
これによって、配信装置100は、番組コンテンツの品質を高く維持しつつ、音又は視覚情報を含む番組コンテンツの生成コストを削減することができる。
なお、番組コンテンツに表示されるキャラクターの生成方法は特に限定されず、2次元のアニメーションを生成する任意の技術が用いられ得る。例えば、任意のソフトウェアによって生成されたイラストにおいて複数の特徴点を指定し、各特徴点の位置座標の時間的変化を指定することによって2次元のアニメーションを生成する技術が用いられても良い。また、任意の3次元モデリング技術(例えば、モデリング、レンダリング又はレタッチ等)が併用されることで、3次元のアニメーションが生成されても良い。
(伝達される情報又は再生日時等に、音又は視覚情報を適応させる機能)
また、本実施の形態に係る番組提供システムは、伝達される情報の内容又は再生日時等に、音又は視覚情報を適応させる機能を有する。
また、本実施の形態に係る番組提供システムは、伝達される情報の内容又は再生日時等に、音又は視覚情報を適応させる機能を有する。
より具体的に説明すると、配信装置100は、伝達される情報の解析結果又は設定された情報(ジャンル、種別又はテンプレート等)によって、伝達される情報の内容を認識し、番組コンテンツの音又は視覚情報を当該内容に適応させる。例えば、伝達される情報の内容が朗報に関するものであった場合、図6Aに示すように、配信装置100は、視聴者に明るい印象を与えるような衣装をキャラクターの衣装として決定する。逆に、伝達される情報の内容が悲報に関するものであった場合、図6Bに示すように、配信装置100は、視聴者に暗い印象(又は改まった印象)を与えるような衣装をキャラクターの衣装として決定する。もちろん、衣装の具体的内容は図6に限定されない。例えば、伝達される情報の内容がスポーツの大会に関するものであれば、キャラクターの衣装はスポーツチームのユニフォーム等であっても良い。
なお、配信装置100は、キャラクターの衣装だけでなく、BGM、背景又はキャラクターの属性、表情もしくは声のトーン等を適応させることができる。例えば、配信装置100は、伝達される情報が朗報である場合には、配信装置100は、BGM、背景及びキャラクターを、明るい印象を与える曲、背景及びキャラクターにし、キャラクターの表情を明るい表情にし、キャラクターの声のトーンを高くしても良い。
また、配信装置100は、音又は視覚情報を、番組コンテンツデータが再生される日時もしくは地域、又は、再生時の季節、天気もしくは気温等に適応させる。例えば、放送時の季節が夏である場合には、配信装置100は、BGM及び背景を、夏を連想させる曲及び背景にし、キャラクターの衣装を夏服にし、キャラクターの肌を日焼けさせた状態にしても良い。なお、上記はあくまで一例であり、配信装置100は、番組コンテンツデータが再生される日時もしくは地域、又は、再生時の季節、天気もしくは気温以外の情報に基づいて音又は視覚情報を制御しても良い。
また、配信装置100は、音又は視覚情報を、視聴者の行動又は視聴者が置かれた状況(又は環境)等に適応させる。より具体的には、配信装置100が、視聴者によって装着されているウェアラブル端末の各種センサ(例えば、加速度センサ、ジャイロセンサ又は気圧センサ等)によって取得されたデータを解析することで、視聴者の行動又は視聴者が置かれた状況等を認識し、これらに音又は視覚情報を適応させる。例えば、配信装置100は、視聴者がリラックスした状態で休日を過ごしていると認識した場合、BGM及び背景を、リラクゼーション効果の高い曲及び背景にし、キャラクターの衣装を、よりカジュアルな衣装にしても良い。また、配信装置100は、未来のある時点における視聴者の行動又は視聴者が置かれる状況(又は環境)等を、上記のセンシングデータ等を解析することで予測し、当該予測結果に音又は視覚情報を適応させても良い。
また、上記において制御される対象は、BGM、背景又はキャラクターの属性、衣装、表情もしくは声のトーンだけに限定されず、番組コンテンツの音又は視覚情報に関するものであれば何でも良い。
これによって、配信装置100は、伝達される情報の内容又は再生日時等に基づいて話者(例えば、アナウンサー、司会者又はラジオパーソナリティ等)が表情及び声のトーンを変えたり、話者の衣装、BGM又は背景等が変更されたりすることと同様の効果を生じさせることができる。
(キャラクターの動作付加機能)
また、本実施の形態に係る番組提供システムは、キャラクターの動作を自動的に付加する機能を有する。
また、本実施の形態に係る番組提供システムは、キャラクターの動作を自動的に付加する機能を有する。
より具体的に説明すると、配信装置100は、入力された動画データ又は静止画データを解析し、動画データ又は静止画データに含まれる対象の表示位置に連動するようにキャラクターの動作を制御する。例えば、図7に示すように、天気図の遷移に関する動画データが入力された場合、配信装置100は、当該動画データを解析し、天気図に表示されている台風の目の表示位置を認識する。そして、配信装置100は、台風の目の表示位置に指示棒の先が位置するように、天気図の遷移に連動してキャラクターの手を動作させても良い。
もちろん、動作の制御内容は図7の例に限定されない。例えば、配信装置100は、スポーツの動画データが入力された場合、ハイライトシーンが再生されるタイミングでキャラクターに喜ぶリアクションをとらせても良い。また、キャラクターの動作が連動する対象は特に限定されない。例えば、キャラクターの動作が連動する対象は、動画データもしくは静止画データに含まれる人間、動物、物、光(例えば、花火又はイルミネーション等)、イラスト又は文字等であっても良い。
これによって、配信装置100は、話者(例えば、アナウンサー、司会者又はラジオパーソナリティ等)が、実際に、動画又は静止画に反応して動作することと同様の効果を生じさせることができる。
(各種情報の要求機能)
また、本実施の形態に係る番組提供システムは、番組コンテンツの自動生成に用いられる情報を要求する機能を有する。
また、本実施の形態に係る番組提供システムは、番組コンテンツの自動生成に用いられる情報を要求する機能を有する。
より具体的に説明すると、配信装置100は、上記で説明してきた、番組コンテンツの自動生成に用いられる各種情報(例えば、ジャンル、種別、テンプレート、文章データ、動画データ又は静止画データ等)が不足している場合、又は、情報が不適切である場合(動画又は静止画が鮮明でない場合、又は、動画が短過ぎたり長過ぎたりする場合等)等において、不足している情報、又は、より品質の高い新たな情報を作成者に要求することができる。
ここで、不足している情報等の要求方法は特に限定されない。例えば、配信装置100は、自装置に備えられる出力部(例えば、ディスプレイ又はスピーカー等)を用いて不足している情報等の要求を行っても良い。その際、配信装置100は、単に「情報が不足している」又は「情報が不適切である」という情報を通知するだけでなく、不足している情報の内容又は適切な情報の内容を明示することによって、作成者に対してより明確な要求を行っても良い。
これによって、配信装置100は、より円滑に番組コンテンツを自動生成することができる。また、配信装置100は、より適切な情報を用いて番組コンテンツを自動生成することができるため、番組コンテンツの品質を向上させることができる。
(再生状況に応じた原稿生成(編集)機能)
また、本実施の形態に係る番組提供システムは、ユーザによる番組コンテンツの再生状況に応じて原稿データを自動生成する機能(又は自動編集する機能)を有する。
また、本実施の形態に係る番組提供システムは、ユーザによる番組コンテンツの再生状況に応じて原稿データを自動生成する機能(又は自動編集する機能)を有する。
より具体的に説明すると、ユーザ端末200は、視聴者による番組コンテンツの再生状況を把握する。例えば、ユーザ端末200は、既に全て再生された番組コンテンツにてユーザに伝達された情報の内容、又は、再生中の番組コンテンツの再生済み部分にて視聴者に伝達された情報の内容等を把握する。
そして、その後に番組コンテンツにて伝達される情報の内容が、既に伝達された情報と同一であったり類似していたりする場合、ユーザ端末200は原稿データを自動編集することで、例えば、「お伝えしているとおり」等のコメントを原稿データに追加することができる。また、その後に番組コンテンツにて伝達される情報の内容が、未だ伝達されていない情報である場合、ユーザ端末200は原稿データを自動編集することで、例えば、「について新たな情報が入ってきました。」等のコメントを原稿データに追加しても良い。なお、原稿データの編集内容は、これらに限定されない。
また、ユーザ端末200だけでなく、配信装置100が当該機能を実現しても良い。例えば、ある番組コンテンツの中で、同一又は類似の内容の情報が複数回にわたって伝達される場合、配信装置100は、原稿データの自動生成の際に、例えば、「お伝えしているとおり」等のコメントを原稿データに追加しても良い。
これによって、番組提供システムは、話者(例えば、アナウンサー、司会者又はラジオパーソナリティ等)が、情報の伝達状況に応じて適宜アドリブを入れることと同様の効果を生じさせることができる。
(別内容の情報の挿入機能)
また、本実施の形態に係る番組提供システムは、再生中の番組コンテンツ(又は、再生予定の番組コンテンツ)に、別内容の情報(又は別の番組コンテンツ)を挿入する機能を有する。
また、本実施の形態に係る番組提供システムは、再生中の番組コンテンツ(又は、再生予定の番組コンテンツ)に、別内容の情報(又は別の番組コンテンツ)を挿入する機能を有する。
より具体的に説明すると、番組提供システムは、原稿データ中に別内容の情報を挿入可能な位置を設定することができる(以降、「挿入可能位置」と呼称する)。ここで、挿入可能位置は、例えば、番組コンテンツの終了位置、番組コンテンツの内容の区切りとなる位置(例えば、話題が転換する位置等)、又は、句点の位置等であるが、これらに限定されない。
そして、例えば、ユーザ端末200が番組コンテンツを再生している途中に、緊急情報(例えば、災害情報、その他重要度の高い情報等)が配信された場合、ユーザ端末200は、再生中の番組コンテンツの挿入可能位置に緊急情報を挿入することができる。このとき、緊急情報の冒頭部分に「番組の途中ですが、緊急情報をお伝えします。」等のコメントが適宜追加されても良い。なお、上記はあくまで一例であり、挿入される情報は緊急情報に限定されない。
また、別内容の情報が挿入される場合、再生中だった番組コンテンツ内で別内容の情報が伝達されても良いし(例えば、再生中だった番組コンテンツのキャラクターが変更されることなく、緊急情報を伝達する場合等)、再生中だった番組コンテンツが別の番組コンテンツに切り替わることで別内容の情報が伝達されても良い。
なお、挿入された別内容の情報の後に再生される番組コンテンツ(換言すると、挿入前に再生中だった番組コンテンツの未再生部分)の内容は、適宜編集され得る。例えば、挿入された別内容の情報の後に再生される番組コンテンツは、内容の区切りとなる位置(例えば、話題が転換する位置等)から再生されるように編集されても良い。また、挿入された別内容の情報の後に再生される番組コンテンツの冒頭部分に「以上、緊急情報をお伝えしました。では、元の番組に戻ります。」等のコメントが適宜追加されても良い。また、別内容の情報が挿入された後には、元の番組コンテンツが再生されるのではなく、別の新たな番組コンテンツが再生されても良い。
なお、単に、アラームの鳴動と共にディスプレイの一部に緊急情報等が表示される場合(すなわち、キャラクターの音声による緊急情報等の伝達が行われない場合)においては、上記のように原稿データへの挿入等は不要である。
これによって、番組提供システムは、視聴者に対して違和感を与えることなく、再生中の番組コンテンツに対して別内容の情報を挿入することができる。
(未再生の番組コンテンツの提供機能)
また、本実施の形態に係る番組提供システムは、未再生の番組コンテンツを視聴者に対して提供する機能を有する。
また、本実施の形態に係る番組提供システムは、未再生の番組コンテンツを視聴者に対して提供する機能を有する。
例えば、上記のように、緊急情報が番組コンテンツの途中に挿入されること等によって、番組コンテンツにおいて再生されなかった部分が生じた場合、番組提供システムは、視聴者に対して当該未再生部分(又は未再生部分を含む番組コンテンツ全体)を提供することができる。なお、緊急情報等の挿入ではなくても、番組コンテンツが何らかの理由によって全て再生されなかった場合に、当該機能が使用されても良い。
ここで、未再生の番組コンテンツの提供方法は特に限定されない。例えば、所定のアプリケーション(例えば、ユーザ端末200にインストールされた所定のアプリケーション、又は、所定のWEBサイトにおけるマイページ等)に対して未再生の番組コンテンツが提供されても良い。また、音又は視覚情報を含む番組コンテンツが提供されても良いが、テキストファイルのみ(例えば、トピック部分のテキストファイルのみ等)が提供されても良い。また、視聴者が提供方法を所定の方法で指定することができても良い。
これによって、番組提供システムは、視聴者が何らかの理由により再生できなかった番組コンテンツを視聴者に提供することができ、視聴者の利便性を向上させることができる。
(スキップ等に伴う番組コンテンツの編集機能等)
また、本実施の形態に係る番組提供システムは、スキップ等に伴う番組コンテンツの編集機能等を有する。
また、本実施の形態に係る番組提供システムは、スキップ等に伴う番組コンテンツの編集機能等を有する。
より具体的に説明すると、視聴者は、番組コンテンツを視聴する際、途中で番組コンテンツの内容又はコマーシャル等をスキップすること(又は、早送りすること、倍速再生すること等)ができる。
例えば、予め放送時間が決められており、その放送時間に終了するように1又は2以上の番組コンテンツが再生される場合、上記のスキップ等によって放送時間よりも早く番組コンテンツが終了することになる。
本機能は、スキップ等によって当初予定されていた番組コンテンツの再生時間が短縮された場合、再生が予定されていなかった別の番組コンテンツの自動追加等を行うことで、放送時間よりも早く番組コンテンツが終了することを防ぐことができる。
なお、当該別の番組コンテンツが追加されるタイミングは特に限定されない。例えば、当該別の番組コンテンツは、当初再生が予定されていた番組コンテンツの最後のタイミングで追加されても良いし、複数の番組コンテンツの途中のタイミングで追加されても良い。
また、別の番組コンテンツが追加されるのではなく、再生中の番組コンテンツの未再生部分もしくは再生が予定されている別の番組コンテンツの自動編集が行われても良い。例えば、再生中の番組コンテンツの未再生部分の再生時間が拡大されても良い。この場合、番組コンテンツの未再生部分の原稿データ、音又は視覚情報が編集される。例えば、原稿データが編集され、より再生時間が長くなる表現方法が採用されたり、新たな内容が追加されたりしても良い。
なお、ユーザが同一の番組コンテンツを繰り返し再生すること(又は、巻き戻しすること、スロー再生すること等)によって、当初予定されていた番組コンテンツの再生時間が延長された場合には、再生が予定されていた番組コンテンツの削除又は短縮化が行われても良い。
これによって、番組提供システムは、視聴者がスキップ等の操作を行った場合であっても、番組コンテンツを予定された放送時間に終了させることができる。また、番組提供システムは、予め決められた放送時間内にできる限り多くの情報を視聴者に伝達することができる。
[機能構成]
上記では、本実施の形態に係る番組提供システムの機能概要について説明した。続いて、本実施の形態に係る配信装置100及びユーザ端末200の機能構成について説明する。
上記では、本実施の形態に係る番組提供システムの機能概要について説明した。続いて、本実施の形態に係る配信装置100及びユーザ端末200の機能構成について説明する。
上記のとおり、配信装置100及びユーザ端末200は、同一の機能構成を備え得るが、以降では、一例として、配信装置100及びユーザ端末200の機能構成が異なる場合について説明する。より具体的には、配信装置100については番組コンテンツを生成する機能構成を説明し、ユーザ端末200については配信装置100によって提供された情報を用いて番組コンテンツを生成(又は編集)する機能構成を説明する。
(配信装置100の機能構成)
まず、図8を参照して、配信装置100の機能構成について説明する。
まず、図8を参照して、配信装置100の機能構成について説明する。
図8に示すように、配信装置100は、制御部110と、通信部120と、入力部130と、出力部140と、記憶部150と、を備える。
(制御部)
制御部110は、配信装置100の処理全般を統括的に制御する。例えば、制御部110は、以降で説明する番組コンテンツの自動生成処理を統括的に制御したり、生成された番組コンテンツデータの配布等を行ったりする。制御部110は、図8に示すように、原稿生成部111と、原稿解析部112と、音声合成部113と、要求管理部114と、構成生成部115と、動画生成部116と、を備える。以降では、制御部110が備える各機能構成について説明する。
制御部110は、配信装置100の処理全般を統括的に制御する。例えば、制御部110は、以降で説明する番組コンテンツの自動生成処理を統括的に制御したり、生成された番組コンテンツデータの配布等を行ったりする。制御部110は、図8に示すように、原稿生成部111と、原稿解析部112と、音声合成部113と、要求管理部114と、構成生成部115と、動画生成部116と、を備える。以降では、制御部110が備える各機能構成について説明する。
(原稿生成部)
原稿生成部111は、原稿データを自動生成する機能構成である。例えば、原稿生成部111は、後述する入力部130から入力された1又は2以上の文章データを編集することによって原稿データを生成する。
原稿生成部111は、原稿データを自動生成する機能構成である。例えば、原稿生成部111は、後述する入力部130から入力された1又は2以上の文章データを編集することによって原稿データを生成する。
なお、原稿データの生成の際、原稿生成部111は、後述する構成生成部115の制御に基づいて適宜原稿データの再生成を行っても良い。例えば、原稿データが生成された後の原稿データの解析結果等に基づいて、構成生成部115が原稿データの変更が必要であると判断した場合、原稿生成部111は、構成生成部115の制御に基づいて原稿データの再生成を行う。原稿生成部111は、生成した原稿データを原稿解析部112及び音声合成部113に提供する。
(原稿解析部)
原稿解析部112は、原稿生成部111によって生成された原稿データを解析する。より具体的には、原稿解析部112は、原稿データを分解することで単語の抽出等を行ったりすることによって、原稿データの内容に関する情報を抽出する。これによって、原稿解析部112は、ユーザに入力される各種情報(例えば、ジャンル又は種別等)には含まれない情報を後述する構成生成部115に提供することができる。
原稿解析部112は、原稿生成部111によって生成された原稿データを解析する。より具体的には、原稿解析部112は、原稿データを分解することで単語の抽出等を行ったりすることによって、原稿データの内容に関する情報を抽出する。これによって、原稿解析部112は、ユーザに入力される各種情報(例えば、ジャンル又は種別等)には含まれない情報を後述する構成生成部115に提供することができる。
なお、原稿解析部112が原稿データの解析によって抽出する情報は特に限定されない。例えば、原稿解析部112は、原稿データに含まれる単語(例えば、「海」等)、当該単語から連想される情報(例えば、「海」から連想される「海水浴」又は「夏」等の別の単語、「海」から連想される「広い」又は「青い」等のイメージ等)、又は、上記で説明したジャンル又は種別と同様の情報等を抽出しても良い。
また、原稿解析部112は、原稿データを解析するにあたり、外部から取得した情報を使用しても良い。例えば、原稿解析部112は、インターネット上に存在する情報を取得し、原稿データに含まれる単語の意味、当該単語から連想される情報等を自動的に判断しても良い。また、原稿解析部112は、原稿データの解析に用いられる情報を作成者に対して要求しても良い。例えば、原稿解析部112は、原稿データに含まれる単語の内容に関する情報又は当該単語から連想される情報を作成者に対して要求しても良い。また、原稿解析部112は、原稿データの解析に用いた情報を学習することによって、解析ロジックを更新しても良い。これによって、原稿解析部112は、使用されるにつれて、解析精度を向上させることができる。原稿解析部112は、解析結果を構成生成部115に提供する。
(音声合成部)
音声合成部113は、原稿生成部111によって生成された原稿データを用いて音声合成処理を行うことで、原稿データに対応する音声データを生成する機能構成である。なお、音声合成の手法は特に限定されない。例えば、音声合成部113は、波形接続型音声合成又はフォルマント合成等の任意の音声合成手法を用いることができる。音声合成部113は、生成した音声データを構成生成部115に提供する。
音声合成部113は、原稿生成部111によって生成された原稿データを用いて音声合成処理を行うことで、原稿データに対応する音声データを生成する機能構成である。なお、音声合成の手法は特に限定されない。例えば、音声合成部113は、波形接続型音声合成又はフォルマント合成等の任意の音声合成手法を用いることができる。音声合成部113は、生成した音声データを構成生成部115に提供する。
(要求管理部)
要求管理部114は、番組コンテンツの作成者からの要求を受け付け、当該要求を管理する機能構成である。例えば、要求管理部114は、番組コンテンツの生成に関する各種設定情報を受け付ける。ここで、要求管理部114が受け付ける設定情報は、上記で説明したジャンル、種別又はテンプレート等であるが、これらに限定されない。例えば、設定情報は、番組コンテンツの対象者、放送時間、データ量、画面サイズ、解像度、音量、字幕情報等(例えば、字幕の有無、言語等)を含んでも良い。要求管理部114は、これらの要求に関する情報を構成生成部115に提供する。
要求管理部114は、番組コンテンツの作成者からの要求を受け付け、当該要求を管理する機能構成である。例えば、要求管理部114は、番組コンテンツの生成に関する各種設定情報を受け付ける。ここで、要求管理部114が受け付ける設定情報は、上記で説明したジャンル、種別又はテンプレート等であるが、これらに限定されない。例えば、設定情報は、番組コンテンツの対象者、放送時間、データ量、画面サイズ、解像度、音量、字幕情報等(例えば、字幕の有無、言語等)を含んでも良い。要求管理部114は、これらの要求に関する情報を構成生成部115に提供する。
(構成生成部)
構成生成部115は、番組コンテンツ全体の構成を生成する機能構成である。構成生成部115は、人工知能技術によって実現される番組コンテンツの生成ロジックを有している。より具体的には、構成生成部115は、要求管理部114から提供される作成者の要求に関する情報、原稿解析部112から提供される解析結果、音声合成部113から提供される音声データ、後述する記憶部150から取得する各種情報及び外部(例えば、視聴者によって装着されているウェアラブル端末等を含む)から取得する任意の情報等(放送時の日時、季節、天気、気温、放送される地域、各種センサ(例えば、加速度センサ、ジャイロセンサ又は気圧センサ等)のセンシングデータ、視聴者の行動、視聴者が置かれた状況(又は環境)等に関する情報)を、生成ロジックに入力することによって番組コンテンツの構成を出力する。
構成生成部115は、番組コンテンツ全体の構成を生成する機能構成である。構成生成部115は、人工知能技術によって実現される番組コンテンツの生成ロジックを有している。より具体的には、構成生成部115は、要求管理部114から提供される作成者の要求に関する情報、原稿解析部112から提供される解析結果、音声合成部113から提供される音声データ、後述する記憶部150から取得する各種情報及び外部(例えば、視聴者によって装着されているウェアラブル端末等を含む)から取得する任意の情報等(放送時の日時、季節、天気、気温、放送される地域、各種センサ(例えば、加速度センサ、ジャイロセンサ又は気圧センサ等)のセンシングデータ、視聴者の行動、視聴者が置かれた状況(又は環境)等に関する情報)を、生成ロジックに入力することによって番組コンテンツの構成を出力する。
番組コンテンツの生成ロジックは、事前に大量の番組コンテンツを学習することによって、上記の各種情報に基づいて、最適と考えられる番組コンテンツの構成を出力する。なお、当該学習方法は特に限定されず、機械学習に用いられる任意の方法が使用され得る。
ここで、構成生成部115が生成する「構成」とは、原稿データの内容、音もしくは視覚情報の内容もしくは設定(例えば、音質、音量、音声合成の方法、BGMの内容、動画もしくは静止画の内容、キャラクターの属性、衣装もしくは表情等)、又は、番組コンテンツデータのフォーマット、サイズもしくはセキュリティ設定等(例えば、アクセス権等)、番組コンテンツを構成する全ての情報を含む概念である。
なお、構成生成部115によって生成される番組コンテンツの構成は、入力された各種情報によって何ら制限を受けない。例えば、構成生成部115は、入力されたテンプレートに基づいて番組コンテンツの構成を生成するが、必ずテンプレート通りの構成を生成しなければならないわけではなく、テンプレートの内容を一部変更したテンプレートを新たに生成し、当該新たに生成したテンプレートに基づいて構成を生成しても良い。これによって、例えば、入力されたテンプレートの一部に誤りが含まれる場合、構成生成部115は、過去の学習結果に基づいて誤りが含まれないテンプレートを生成することができるため、より適切な番組コンテンツの構成を生成することができる。
構成生成部115は、生成した番組コンテンツの構成に基づいて、原稿データ又は音声データ等の再生成(又は編集等)が必要であると判断した場合、原稿生成部111、原稿解析部112及び音声合成部113を制御することで、原稿データの再生成、原稿データの解析、音声データの再生成等を行わせても良い。また、構成生成部115は、生成した番組コンテンツの構成に基づいて、動画データ又は静止画データ等の再生成(又は編集等)が必要であると判断した場合、構成生成部115は、動画データ又は静止画データ等の再生成(又は編集等)を行っても良い。構成生成部115は、番組コンテンツの構成に関する情報、音データ(音声データを含む)、動画データ又は静止画データを動画生成部116に提供する。
(動画生成部)
動画生成部116は、構成生成部115から提供された、番組コンテンツの構成に関する情報、音データ(音声データを含む)、動画データ又は静止画データを用いて番組コンテンツデータを自動生成する機能構成である。より具体的には、動画生成部116は、番組コンテンツの構成に関する情報に基づいて、番組コンテンツデータのフォーマット、サイズ、セキュリティ設定(例えば、アクセス権等)等を決定し、音データ、動画データ又は静止画データの統合及びパッケージングを行うことで、番組コンテンツデータを生成する。
動画生成部116は、構成生成部115から提供された、番組コンテンツの構成に関する情報、音データ(音声データを含む)、動画データ又は静止画データを用いて番組コンテンツデータを自動生成する機能構成である。より具体的には、動画生成部116は、番組コンテンツの構成に関する情報に基づいて、番組コンテンツデータのフォーマット、サイズ、セキュリティ設定(例えば、アクセス権等)等を決定し、音データ、動画データ又は静止画データの統合及びパッケージングを行うことで、番組コンテンツデータを生成する。
(通信部)
通信部120は、外部装置との通信を行う機能構成である。例えば、通信部120は、制御部110が番組コンテンツデータの生成に用いる各種情報(例えば、原稿解析部112が原稿データの解析に用いる情報、又は、構成生成部115が番組コンテンツの構成の生成に用いる情報等)を外部装置(例えば、インターネット上のWEBサーバ等)から受信する。また、制御部110によって生成された番組コンテンツデータが外部装置を介してユーザ端末200に配信される場合、通信部120は、番組コンテンツデータを当該外部装置へ送信する。
通信部120は、外部装置との通信を行う機能構成である。例えば、通信部120は、制御部110が番組コンテンツデータの生成に用いる各種情報(例えば、原稿解析部112が原稿データの解析に用いる情報、又は、構成生成部115が番組コンテンツの構成の生成に用いる情報等)を外部装置(例えば、インターネット上のWEBサーバ等)から受信する。また、制御部110によって生成された番組コンテンツデータが外部装置を介してユーザ端末200に配信される場合、通信部120は、番組コンテンツデータを当該外部装置へ送信する。
なお、通信部120の通信方式は特に限定されない。例えば、通信部120の通信方式には、いかなる有線通信方式又は無線通信方式が用いられても良い。
(入力部)
入力部130は、作成者による入力を受ける機能構成である。例えば、入力部130はマウス、キーボード、タッチパネル又はボタン等の入力手段を備えており、作成者がこれらの入力手段を用いて各種操作を行うことによって、各種情報(例えば、ジャンル、種別、テンプレート、文章データ、動画データ又は静止画データ等)が入力される。
入力部130は、作成者による入力を受ける機能構成である。例えば、入力部130はマウス、キーボード、タッチパネル又はボタン等の入力手段を備えており、作成者がこれらの入力手段を用いて各種操作を行うことによって、各種情報(例えば、ジャンル、種別、テンプレート、文章データ、動画データ又は静止画データ等)が入力される。
(出力部)
出力部140は、各種情報を出力する機能構成である。例えば、出力部140は、ディスプレイ等の表示手段及びスピーカ等の音声出力手段を備えており、制御部110からの制御信号に基づいて各種視覚情報をディスプレイ等に表示させたり、各種音をスピーカ等によって発生させたりする。
出力部140は、各種情報を出力する機能構成である。例えば、出力部140は、ディスプレイ等の表示手段及びスピーカ等の音声出力手段を備えており、制御部110からの制御信号に基づいて各種視覚情報をディスプレイ等に表示させたり、各種音をスピーカ等によって発生させたりする。
(記憶部)
記憶部150は、各種情報を記憶する機能構成である。例えば、記憶部150は、作成者によって入力された各種情報(例えば、ジャンル、種別、テンプレート、文章データ、動画データ、静止画データ等)、配信装置100によって生成された各種情報(原稿データ、音声データ、動画データ、静止画データ又は番組コンテンツデータ等)等を記憶する。
記憶部150は、各種情報を記憶する機能構成である。例えば、記憶部150は、作成者によって入力された各種情報(例えば、ジャンル、種別、テンプレート、文章データ、動画データ、静止画データ等)、配信装置100によって生成された各種情報(原稿データ、音声データ、動画データ、静止画データ又は番組コンテンツデータ等)等を記憶する。
ここで、構成生成部115は、記憶部150が記憶している過去の番組コンテンツデータを学習することによって生成ロジックを更新しても良い。また、記憶部150は、配信装置100による各種処理に使用されるプログラム、パラメータを記憶する。なお、記憶部150が記憶する情報は上記に限定されない。
(ユーザ端末200の機能構成)
続いて、図9を参照して、ユーザ端末200の機能構成について説明する。
続いて、図9を参照して、ユーザ端末200の機能構成について説明する。
図9に示すように、ユーザ端末200は、制御部210と、通信部220と、入力部230と、出力部240と、記憶部250と、を備える。
(制御部)
制御部210は、ユーザ端末200の処理全般を統括的に制御する。例えば、制御部210は、以降で説明する番組コンテンツの自動生成処理を統括的に制御したり、生成された番組コンテンツデータの再生等を行ったりする。制御部210は、図9に示すように、要求管理部211と、構成生成部212と、動画生成部213と、を備える。以降では、制御部210が備える各機能構成について説明する。
制御部210は、ユーザ端末200の処理全般を統括的に制御する。例えば、制御部210は、以降で説明する番組コンテンツの自動生成処理を統括的に制御したり、生成された番組コンテンツデータの再生等を行ったりする。制御部210は、図9に示すように、要求管理部211と、構成生成部212と、動画生成部213と、を備える。以降では、制御部210が備える各機能構成について説明する。
(要求管理部)
要求管理部211は、番組コンテンツの視聴者からの要求を受け付け、当該要求を管理する機能構成である。例えば、要求管理部211は、視聴者によって選択された番組コンテンツ、再生中の番組コンテンツのスキップ、繰り返し再生、早送りもしくは巻き戻しに関する要求、番組コンテンツデータの編集に関する要求(例えば、キャラクターの属性、字幕の内容、BGMの内容、背景の内容等)、番組コンテンツの視聴に伴う各種設定(例えば、表示サイズ、音量、速度等)等に関する情報を受け付け、管理する。要求管理部211は、これらの要求に関する情報を視聴者の嗜好情報として管理しても良い。なお、要求管理部211によって受け付けられ、管理される情報はこれらに限定されない。要求管理部211は、これらの要求に関する情報を構成生成部212に提供する。
要求管理部211は、番組コンテンツの視聴者からの要求を受け付け、当該要求を管理する機能構成である。例えば、要求管理部211は、視聴者によって選択された番組コンテンツ、再生中の番組コンテンツのスキップ、繰り返し再生、早送りもしくは巻き戻しに関する要求、番組コンテンツデータの編集に関する要求(例えば、キャラクターの属性、字幕の内容、BGMの内容、背景の内容等)、番組コンテンツの視聴に伴う各種設定(例えば、表示サイズ、音量、速度等)等に関する情報を受け付け、管理する。要求管理部211は、これらの要求に関する情報を視聴者の嗜好情報として管理しても良い。なお、要求管理部211によって受け付けられ、管理される情報はこれらに限定されない。要求管理部211は、これらの要求に関する情報を構成生成部212に提供する。
(構成生成部)
構成生成部212は、番組コンテンツ全体の構成を生成する機能構成である。上記のとおり、ユーザ端末200は、視聴者の要求及び配信装置100によって提供された各種情報を用いて番組コンテンツの生成を行うことができる。ここでは、原稿データ、その解析結果、原稿データに基づいて生成された音声データ等が配信装置100によって提供され、ユーザ端末200がこれらの情報を用いて番組コンテンツを生成する例について説明する。
構成生成部212は、番組コンテンツ全体の構成を生成する機能構成である。上記のとおり、ユーザ端末200は、視聴者の要求及び配信装置100によって提供された各種情報を用いて番組コンテンツの生成を行うことができる。ここでは、原稿データ、その解析結果、原稿データに基づいて生成された音声データ等が配信装置100によって提供され、ユーザ端末200がこれらの情報を用いて番組コンテンツを生成する例について説明する。
構成生成部212は、配信装置100の構成生成部115と同様に、人工知能技術によって実現される番組コンテンツの生成ロジックを有している。そして、構成生成部212は、配信装置100によって提供される各種情報(原稿データ、その解析結果、原稿データに基づいて生成された音声データ等)、要求管理部211から提供される視聴者の要求に関する情報、後述する記憶部250から取得する各種情報及び外部から取得する任意の情報等(放送時の日時、季節、天気、気温、放送される地域等の情報)を生成ロジックに入力することによって番組コンテンツの構成を出力する。
なお、図9には示していないが、ユーザ端末200が、配信装置100の原稿生成部111、原稿解析部112又は音声合成部113と同様の機能構成を備えることによって、構成生成部212は、必要に応じてこれらの機能構成を制御して、原稿データの生成、原稿データの解析及び音声データの生成等を実現しても良い。構成生成部212は、番組コンテンツの構成に関する情報、音データ(音声データを含む)、動画データ又は静止画データを動画生成部213に提供する。
(動画生成部)
動画生成部213は、構成生成部212から提供された、番組コンテンツの構成に関する情報、音データ(音声データを含む)、動画データ又は静止画データを用いて番組コンテンツデータを自動生成する機能構成である。より具体的には、動画生成部213は、番組コンテンツの構成に関する情報に基づいて、番組コンテンツデータのフォーマット、サイズ、セキュリティ設定(例えば、アクセス権等)等を決定し、音データ、動画データ又は静止画データの統合及びパッケージングを行うことで、番組コンテンツデータを生成する。
動画生成部213は、構成生成部212から提供された、番組コンテンツの構成に関する情報、音データ(音声データを含む)、動画データ又は静止画データを用いて番組コンテンツデータを自動生成する機能構成である。より具体的には、動画生成部213は、番組コンテンツの構成に関する情報に基づいて、番組コンテンツデータのフォーマット、サイズ、セキュリティ設定(例えば、アクセス権等)等を決定し、音データ、動画データ又は静止画データの統合及びパッケージングを行うことで、番組コンテンツデータを生成する。
(通信部)
通信部220は、外部装置との通信を行う機能構成である。例えば、ユーザ端末200が、配信装置100によって生成された番組コンテンツデータをダウンロードして再生する場合には、通信部220は、配信装置100を含む外部装置から番組コンテンツデータを受信する。また、ユーザ端末200が、配信装置100によって提供された各種情報を用いて番組コンテンツを生成する場合には、通信部220は、配信装置100を含む外部装置から当該各種情報を受信する。なお、これらの情報の受信は、視聴者による操作に基づいて行われても良いし、通信部220によって所定のタイミングで行われても良い。例えば、通信部220は、所定のタイミングで配信装置100を含む外部装置にアクセスし、新規情報が生成されている場合には当該情報を受信しても良い。
通信部220は、外部装置との通信を行う機能構成である。例えば、ユーザ端末200が、配信装置100によって生成された番組コンテンツデータをダウンロードして再生する場合には、通信部220は、配信装置100を含む外部装置から番組コンテンツデータを受信する。また、ユーザ端末200が、配信装置100によって提供された各種情報を用いて番組コンテンツを生成する場合には、通信部220は、配信装置100を含む外部装置から当該各種情報を受信する。なお、これらの情報の受信は、視聴者による操作に基づいて行われても良いし、通信部220によって所定のタイミングで行われても良い。例えば、通信部220は、所定のタイミングで配信装置100を含む外部装置にアクセスし、新規情報が生成されている場合には当該情報を受信しても良い。
なお、通信部220の通信方式は特に限定されない。例えば、通信部220の通信方式には、いかなる有線通信方式又は無線通信方式が用いられても良い。
(入力部)
入力部230は、視聴者による入力を受ける機能構成である。例えば、入力部230はタッチパネル又はボタン等の入力手段を備えており、作成者がこれらの入力手段を用いて各種操作を行うことによって、視聴する番組コンテンツの選択、番組コンテンツの視聴に伴う各種設定等を行う。
入力部230は、視聴者による入力を受ける機能構成である。例えば、入力部230はタッチパネル又はボタン等の入力手段を備えており、作成者がこれらの入力手段を用いて各種操作を行うことによって、視聴する番組コンテンツの選択、番組コンテンツの視聴に伴う各種設定等を行う。
(出力部)
出力部240は、各種情報を出力する機能構成である。例えば、出力部240は、ディスプレイ等の表示手段及びスピーカ等の音声出力手段を備えており、制御部210からの制御信号に基づいて各種視覚情報をディスプレイ等に表示させたり、各種音をスピーカ等によって発生させたりする。
出力部240は、各種情報を出力する機能構成である。例えば、出力部240は、ディスプレイ等の表示手段及びスピーカ等の音声出力手段を備えており、制御部210からの制御信号に基づいて各種視覚情報をディスプレイ等に表示させたり、各種音をスピーカ等によって発生させたりする。
(記憶部)
記憶部250は、各種情報を記憶する機能構成である。例えば、記憶部250は、番組コンテンツデータ等を記憶する。また、記憶部250は、視聴者の嗜好情報を記憶しても良い。例えば、記憶部250は、視聴者が番組コンテンツの視聴に伴い行った各種設定に関する情報、視聴者が視聴した番組コンテンツの特徴等を視聴者の嗜好情報として記憶しても良い。また、記憶部250は、ユーザ端末200による各種処理に使用されるプログラム、パラメータを記憶する。なお、記憶部250が記憶する情報は上記に限定されない。
記憶部250は、各種情報を記憶する機能構成である。例えば、記憶部250は、番組コンテンツデータ等を記憶する。また、記憶部250は、視聴者の嗜好情報を記憶しても良い。例えば、記憶部250は、視聴者が番組コンテンツの視聴に伴い行った各種設定に関する情報、視聴者が視聴した番組コンテンツの特徴等を視聴者の嗜好情報として記憶しても良い。また、記憶部250は、ユーザ端末200による各種処理に使用されるプログラム、パラメータを記憶する。なお、記憶部250が記憶する情報は上記に限定されない。
[動作]
上記では、本実施の形態に係る配信装置100及びユーザ端末200の機能構成について説明した。続いて、配信装置100及びユーザ端末200の動作について説明する。
上記では、本実施の形態に係る配信装置100及びユーザ端末200の機能構成について説明した。続いて、配信装置100及びユーザ端末200の動作について説明する。
(配信装置の動作)
まず、図10を参照して、配信装置100が番組コンテンツを生成する動作について説明する。ステップS1000では、番組コンテンツの作成者によって入力部130に文章データが入力される。ステップS1004では、原稿生成部111が入力された文章データを用いて原稿データを生成する。ステップS1008では、原稿解析部112が、生成された原稿データを解析する。また、ステップS1012では、音声合成部113が原稿データを用いて音声合成処理を行うことで、原稿データに対応する音声データを生成する。なお、ステップS1008の処理及びステップS1012の処理は、互いに並行して実行されることを想定しているが、これに限定されない。
まず、図10を参照して、配信装置100が番組コンテンツを生成する動作について説明する。ステップS1000では、番組コンテンツの作成者によって入力部130に文章データが入力される。ステップS1004では、原稿生成部111が入力された文章データを用いて原稿データを生成する。ステップS1008では、原稿解析部112が、生成された原稿データを解析する。また、ステップS1012では、音声合成部113が原稿データを用いて音声合成処理を行うことで、原稿データに対応する音声データを生成する。なお、ステップS1008の処理及びステップS1012の処理は、互いに並行して実行されることを想定しているが、これに限定されない。
ステップS1016では、要求管理部114が、番組コンテンツの生成に関する各種設定情報等の、作成者からの要求に関する情報を取得する。ステップS1016の処理は、ステップS1012までの処理と並行して実行されることを想定しているが、これに限定されない。
ステップS1020では、構成生成部115が、要求管理部114から提供される作成者の要求に関する情報、原稿解析部112から提供される解析結果、音声合成部113から提供される音声データ等を生成ロジックに入力することによって番組コンテンツの構成を生成する。
生成された番組コンテンツの構成に基づいて原稿データの再生成が必要である場合(ステップS1024/yes)、処理がステップS1004へ移動し、原稿生成部111が原稿データの再生成を行う。原稿データの再生成が必要でない場合(ステップS1024/no)、ステップS1028にて、動画生成部116が、番組コンテンツの構成に関する情報、音データ(音声データを含む)、動画データ又は静止画データを用いて番組コンテンツデータを生成することで処理が終了する。
(ユーザ端末の動作)
続いて、図11を参照して、ユーザ端末200が、配信装置100から提供された各種情報を用いて番組コンテンツを生成する動作について説明する。
続いて、図11を参照して、ユーザ端末200が、配信装置100から提供された各種情報を用いて番組コンテンツを生成する動作について説明する。
ステップS1100では、構成生成部212が、通信部220を介して配信装置100から提供される、番組コンテンツの生成に用いられる各種情報(原稿データ、その解析結果、原稿データに基づいて生成された音声データ等)を取得する。
ステップS1104では、要求管理部211が、番組コンテンツの生成に関する各種設定情報等の、視聴者からの要求に関する情報を取得する。ステップS1104の処理は、ステップS1100の処理と並行して実行されることを想定しているが、これに限定されない。
ステップS1112では、構成生成部212が、配信装置100から提供された各種情報(原稿データ、その解析結果、原稿データに基づいて生成された音声データ等)及び要求管理部211から提供される視聴者の要求に関する情報等を生成ロジックに入力することによって番組コンテンツの構成を生成する。
ステップS1116では、動画生成部213が、番組コンテンツの構成に関する情報等を用いて番組コンテンツデータを生成することで処理が終了する。
なお、図11には記載していないが、原稿データ又は音声データ等の再生成が必要な場合、ユーザ端末200は、適宜、配信装置100へこれらの各データの再生成の依頼を行っても良いし、配信装置100の原稿生成部111、原稿解析部112又は音声合成部113と同様の機能構成を備えることによって各データの再生成を行っても良い。
[ハードウェア構成]
上記では、本実施の形態に係る配信装置100及びユーザ端末200の動作について説明した。続いて、配信装置100及びユーザ端末200のハードウェア構成について説明する。
上記では、本実施の形態に係る配信装置100及びユーザ端末200の動作について説明した。続いて、配信装置100及びユーザ端末200のハードウェア構成について説明する。
上記の各種処理は、ソフトウェアと、以下に説明するハードウェアとの協働により実現される。図12は、配信装置100及びユーザ端末200を具現する情報処理装置900のハードウェア構成を示す図である。
情報処理装置900は、CPU(Central Processing Unit)901と、ROM(Read Only Memory)902と、RAM(Random Access Memory)903と、ホストバス904と、ブリッジ905と、外部バス906と、インタフェース907と、入力装置908と、出力装置909と、ストレージ装置(HDD)910と、ドライブ911と、通信装置912とを備える。
CPU901は、演算処理装置及び制御装置として機能し、各種プログラムに従って情報処理装置900内の動作全般を制御する。また、CPU901は、マイクロプロセッサであっても良い。ROM902は、CPU901が使用するプログラムや演算パラメータ等を記憶する。RAM903は、CPU901の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を一時記憶する。これらはCPUバスなどから構成されるホストバス904により相互に接続されている。当該CPU901、ROM902及びRAM903の協働により、配信装置100の制御部110及びユーザ端末200の制御部210の各機能が実現される。
ホストバス904は、ブリッジ905を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス906に接続されている。なお、必ずしもホストバス904、ブリッジ905及び外部バス906を分離構成する必要はなく、1つのバスにこれらの機能を実装しても良い。
入力装置908は、マウス、キーボード、タッチパネル、ボタン、マイクロフォン、スイッチ及びレバーなどユーザが情報を入力するための入力手段と、ユーザによる入力に基づいて入力信号を生成し、CPU901に出力する入力制御回路などから構成されている。情報処理装置900を使用するユーザは、該入力装置908を操作することにより、各装置に対して各種のデータを入力したり処理動作を指示したりすることができる。該入力装置908により、配信装置100の入力部130及びユーザ端末200の入力部230の各機能が実現される。
出力装置909は、例えば、CRT(Cathode Ray Tube)ディスプレイ装置、液晶ディスプレイ(LCD)装置、OLED(Organic Light Emitting Diode)装置及びランプなどの表示装置を含む。さらに、出力装置909は、スピーカ及びヘッドホンなどの音声出力装置を含む。出力装置909は、例えば、再生されたコンテンツを出力する。具体的には、表示装置は再生された映像データ等の各種情報をテキスト又はイメージで表示する。一方、音声出力装置は、再生された音声データ等を音声に変換して出力する。該出力装置909により、配信装置100の出力部140及びユーザ端末200の出力部240の各機能が実現される。
ストレージ装置910はデータ格納用の装置である。ストレージ装置910は、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出し装置及び記憶媒体に記録されたデータを削除する削除装置などを含んでも良い。ストレージ装置910は、例えば、HDD(Hard Disk Drive)で構成される。このストレージ装置910は、ハードディスクを駆動し、CPU901が実行するプログラムや各種データを格納する。該ストレージ装置910により、配信装置100の記憶部150及びユーザ端末200の記憶部250の各機能が実現される。
ドライブ911は、記憶媒体用リーダライタであり、情報処理装置900に内蔵、あるいは外付けされる。ドライブ911は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記憶媒体913に記録されている情報を読み出して、RAM903に出力する。また、ドライブ911は、リムーバブル記憶媒体913に情報を書き込むこともできる。
通信装置912は、例えば、通信網914に接続するための通信デバイス等で構成された通信インタフェースである。該通信装置912により、配信装置100の通信部120及びユーザ端末200の通信部220の各機能が実現される。
[むすび]
以上で説明してきたように、本開示に係る番組提供システムは、放送される原稿データを自動生成する機能、番組コンテンツの音又は視覚情報を自動生成する機能、伝達される情報又は再生日時等に音又は視覚情報を適応させる機能、キャラクターの動作を自動的に付加する機能、番組コンテンツの自動生成に用いられる情報を要求する機能、番組コンテンツの再生状況に応じて原稿を自動生成する機能、再生中の番組コンテンツに別内容の情報を挿入する機能、未再生の番組コンテンツをユーザに対して提供する機能、スキップ等に伴う番組コンテンツの編集機能等を実現することができる。これによって、本開示に係る番組提供システムは、音又は視覚情報を含む番組コンテンツの品質を高く維持しつつ、番組コンテンツの生成コストを削減することができる。
以上で説明してきたように、本開示に係る番組提供システムは、放送される原稿データを自動生成する機能、番組コンテンツの音又は視覚情報を自動生成する機能、伝達される情報又は再生日時等に音又は視覚情報を適応させる機能、キャラクターの動作を自動的に付加する機能、番組コンテンツの自動生成に用いられる情報を要求する機能、番組コンテンツの再生状況に応じて原稿を自動生成する機能、再生中の番組コンテンツに別内容の情報を挿入する機能、未再生の番組コンテンツをユーザに対して提供する機能、スキップ等に伴う番組コンテンツの編集機能等を実現することができる。これによって、本開示に係る番組提供システムは、音又は視覚情報を含む番組コンテンツの品質を高く維持しつつ、番組コンテンツの生成コストを削減することができる。
<第2の実施の形態>
次に、第2の実施の形態について説明する。なお、上述した第1の実施の形態で説明した事項(例えば、番組提供システムの構成、配信装置100の構成及び機能、ユーザ端末200の構成及び機能等)は、特に断らない限り、第2の実施の形態にも適用することができる。
次に、第2の実施の形態について説明する。なお、上述した第1の実施の形態で説明した事項(例えば、番組提供システムの構成、配信装置100の構成及び機能、ユーザ端末200の構成及び機能等)は、特に断らない限り、第2の実施の形態にも適用することができる。
[概要]
始めに、第2の実施の形態の概要について説明する。第2の実施の形態では、例えば、ユーザ端末200から配信装置100に対して、制御文字が含まれる文章データを含む素材データが送信される。素材データは、例えば、電子メールシステムを利用して送信される。メールデータを受信した配信装置100は、当該メールデータのアドレス情報が、予め設定されたアドレス情報である場合に、メールデータに含まれる素材データを解析し、素材データに基づく番組コンテンツデータを自動生成する。以下、第2の実施の形態について詳細に説明する。
始めに、第2の実施の形態の概要について説明する。第2の実施の形態では、例えば、ユーザ端末200から配信装置100に対して、制御文字が含まれる文章データを含む素材データが送信される。素材データは、例えば、電子メールシステムを利用して送信される。メールデータを受信した配信装置100は、当該メールデータのアドレス情報が、予め設定されたアドレス情報である場合に、メールデータに含まれる素材データを解析し、素材データに基づく番組コンテンツデータを自動生成する。以下、第2の実施の形態について詳細に説明する。
[設定例について]
始めに、番組コンテンツデータを自動生成する上での各種の設定がなされる。係る設定は、例えば、配信装置100で行われる。設定者は、例えば、番組コンテンツデータを提供するサービス提供者である。なお、番組コンテンツデータの自動生成は、ユーザ端末200でも行い得る。係る場合は、以下に説明する設定がユーザ端末200で行われ、設定者は、ユーザ端末200の所有者等になる。また、ユーザ端末200で各種の設定がなされ、設定内容が配信装置100に送信されるようにし、送信された設定内容に応じた番組コンテンツデータを配信装置100が自動生成するようにしても良い。
始めに、番組コンテンツデータを自動生成する上での各種の設定がなされる。係る設定は、例えば、配信装置100で行われる。設定者は、例えば、番組コンテンツデータを提供するサービス提供者である。なお、番組コンテンツデータの自動生成は、ユーザ端末200でも行い得る。係る場合は、以下に説明する設定がユーザ端末200で行われ、設定者は、ユーザ端末200の所有者等になる。また、ユーザ端末200で各種の設定がなされ、設定内容が配信装置100に送信されるようにし、送信された設定内容に応じた番組コンテンツデータを配信装置100が自動生成するようにしても良い。
図13は、番組コンテンツデータを自動生成する上での各種の設定を行うための設定画面(設定画面400)の一例を示している。設定画面400は、例えば、配信装置100の出力部140(具体的には、ディスプレイ)に表示される。以下、設定画面400における設定項目及び当該設定項目にて設定可能な内容の一例について説明する。
設定項目401は、番組コンテンツを表示するディスプレイのアスペクト比に関する設定を行うための項目である。図示の例では「横(16:9)」が設定されている。設定項目402は、効果音を再生するか否かに関する設定を行うための項目である。設定項目402におけるチェックボックスにチェックが付された場合には効果音が再生され、チェックが付されていない場合には効果音は再生されない。なお、本実施の形態に係る効果音は、プリセットされているデータである。設定項目403は、字幕を表示するか否かに関する設定を行うための項目である。設定項目403におけるチェックボックスにチェックが付された場合にはキャラクターが発する音声に対応する字幕が表示され、チェックが付されていない場合には字幕は表示されない。
設定項目404は、キャラクターの種類及びキャラクターの衣装に関する設定を行うための項目である。図示の例では、キャラクターの種類として「AA」(例えば、女性のキャラクター)、キャラクターの衣装として「夏服」が設定されている。設定項目405は、背景テーマ(背景色)に関する設定を行うための項目である。図示の例では、背景テーマとして「ブルー」が設定されている。設定項目406は、背景モード(例えば、背景の変化パターン)に関する設定を行うための項目である。図示の例では、背景モードとして「通常」が設定されている。なお、背景モードとしては、所定の背景モードである「通常」とは異なる複数のパターンの選択が可能とされている。設定項目407は、動画出力形式に関する設定を行うための項目である。詳細は後述するが、配信装置100で自動生成された番組コンテンツデータは、配信装置100が有する記憶装置等に出力される。出力する際のファイル形式を、設定項目407を使用して設定することができる。図示の例では、動画出力形式として「mp4」が設定されている。設定項目407を操作することにより他の動画出力形式(avi等)を選択することが可能とされる。
設定項目408~410は、配信装置100が有するメール連携機能に関する設定を行うための項目である。メール連携機能とは、メールの内容を番組コンテンツの自動生成に反映させる機能である(詳細は、後述する。)。各項目の具体的内容について説明する。
設定項目408は、メールアドレスに関する設定を行うための項目である。図示の例では、設定項目408に1つのメールアドレスが示されているが、複数のメールアドレスが設定されていても構わない。配信装置100は、設定項目408で設定されたメールアドレスを有するメールデータを受信した場合に、番組コンテンツデータを自動生成する。他のメールアドレスを有するメールデータを受信した場合には、配信装置100は、番組コンテンツデータを自動生成しない。図示の例では、メールアドレスとして「AAA@.co.jp」が設定されている。
設定項目409は、メールデータを受信(送受信でも良い)する周期(ポーリングする周期)に関する設定を行うための項目である。図示の例では、確認周期として「10分」が設定されているが、確認周期として任意の時間を設定することができる。設定項目410は、配信装置100が自動生成した番組コンテンツデータを書き出す記憶装置、より具体的な例としては、共有フォルダのアドレスに関する設定を行うための項目である。設定項目410で設定された共有フォルダに、自動生成された番組コンテンツデータが記憶される。なお、設定項目410で設定された共有フォルダは、所定のユーザ端末200がアクセス可能とされており、当該所定のユーザ端末200は、共有フォルダに格納された番組コンテンツデータに対応する番組コンテンツを視聴することができる。
設定項目411は、TTS(Text to Speech)の抑揚に関する設定を行うための項目である。ここでは、TTSの抑揚に関してユーザによる定義がなされたユーザ辞書を取り込むことが可能とされている。なお、図示の例では、TTSの抑揚に関するユーザ辞書が「なし」として設定されている。
設定画面400において、保存アイコン412は、設定画面400を使用した設定が完了した場合に選択される。戻るアイコン413は、表示内容を設定画面400から他の画面に遷移させる際に選択される。
なお、上述した各設定を行うための表示は、例えば、設定画面400における右側に表示される。設定画面400の左側には、例えば、確認画面415が表示される。確認画面415は、各設定内容を確認することができる画面である。例えば、確認画面415には、キャラクター等が表示され、キャラクターの種類や服装に関する設定がなされると、確認画面415におけるキャラクターの種類や服装が変化する。背景テーマ等についても同様である。係る確認画面415を表示することにより、設定者は、設定内容に応じた具体的な表示を確認することができる。
[メールの内容例について]
次に、ユーザ端末200で作成されるメッセージ情報に含まれる文章データの一例について説明する。本実施の形態では、メッセージ情報の一例としてメールデータを使用して説明し、文章データがメールに記述される例について説明する。また、アカウント情報の一例として、個々のメールデータを識別するメールアドレスを使用して説明する。なお、以下に説明するメールデータは、配信装置100で作成され、配信装置100自身に送信するようにされても良い。
次に、ユーザ端末200で作成されるメッセージ情報に含まれる文章データの一例について説明する。本実施の形態では、メッセージ情報の一例としてメールデータを使用して説明し、文章データがメールに記述される例について説明する。また、アカウント情報の一例として、個々のメールデータを識別するメールアドレスを使用して説明する。なお、以下に説明するメールデータは、配信装置100で作成され、配信装置100自身に送信するようにされても良い。
図14は、ユーザ端末200で作成されるメールの画面例(メール画面420)を示している。メール画面420は、ユーザ端末200の出力部240(具体的には、ディスプレイ)に表示される。メールの入力は、例えば、入力部230を使用してなされる。
メール画面420の上段側には、送信アドレス(メール作成者のユーザ端末200が有するメールアドレス)421が表示される。図示の例では、送信アドレス421は、例えば、「AAA@co.jp」であり、上述したメール連携機能に関する項目で設定されたメールアドレスを想定している。
送信アドレス421の下側には、メールの送信先である受信アドレス422が表示される。図示の例では、受信アドレス422として「BBB@co.jp」が表示されている。受信アドレス422「BBB@co.jp」は、例えば、配信装置100が有するメールアドレスである。
受信アドレス422の下側には、ユーザによって入力された文章(メッセージ)423が表示される。図示の例では、文章423は、件名424と、本文425とを含む。なお、件名424は、空欄でも良い。本文425は、例えば、第1本文425a、第2本文425b及び第1本文425aと第2本文425bとの間に入力された制御文字425cを含む。
第1本文425aは、例えば「関東地方の今晩は晴れで、最高気温は25度、明け方まで気温が下がりにくい、熱帯夜になりそうです。」という文章である。第2本文425bは、例えば「ところで、この暑い中、街ではかき氷の売れ行きが順調のようです。」という、第1本文425aとは文章内容が変わる文章である。なお、図示の例では、第1、第2本文425a、425bが共に1センテンスの文章となっているが、これに限定されるものではなく任意の数のセンテンスの文章で良い。また、図示の例では、制御文字425cの後に空白の1行が挿入されているが、当該1行は必ずしも必要ではなく、第1本文425a、制御文字425c及び第2本文425bが連続的に入力されても良い。
制御文字425cは、例えば、「@@」という2文字であり、第1本文425aの末尾に入力される。制御文字425cは「@@」とは異なる文字列でも良いが、入力の利便性の観点から、比較的よく用いられる文字であり、文字数が比較的少ない(例えば、1文字以上16文字以下)ことが好ましい。制御文字425cは、文字でも良いし、記号でも良いし、数字でも良いし、これらの組み合わせでも良い。配信装置100で自動生成された番組コンテンツでは、制御文字425cが規定された位置に対応するタイミングで、所定の制御がなされる。本実施の形態では、制御文字425cが規定された位置に対応するタイミングで画像が切り替えられる。制御文字425cに対応する制御内容は、制御部110に予めプログラミングされている。なお、例えば設定画面400を使用して、複数の制御内容の中から制御文字425cに対応する制御内容を選択できるようにしても良い。
図14に示すように、本実施の形態に係るメールデータには、例えば、2つの画像データ(画像データ431及び画像データ432)が添付されている。即ち、本実施の形態に係る素材データは、制御文字425cが含まれる文章データ(第1、第2本文425a、425bに対応する文章データ)及び画像データを含む。図15は、添付されている画像の一例を示している。図15Aは、画像データ431の一例を示している。画像データ431は、関東地方の天気概況及び関東地方の都道府県別の最高/最低気温等を示す画像であり、第1本文425aの内容に対応する画像である。画像データ432は、複数のかき氷を示す画像であり、第2本文425bの内容に対応する画像である。
ユーザ端末200のユーザ、図14に例示された内容のメールを作成した後、当該メールを配信装置100に送信する。メールは汎用的に使用されているツールであるため、ユーザ端末200は、図14に例示されたメールを容易に作成することができる。
[動作]
メールを受信した配信装置100は、メールに含まれる素材データを解析し、番組コンテンツデータを自動生成する。以下、配信装置100が番組コンテンツデータを自動生成する処理について、図16に示すフローチャートを参照して説明する。
メールを受信した配信装置100は、メールに含まれる素材データを解析し、番組コンテンツデータを自動生成する。以下、配信装置100が番組コンテンツデータを自動生成する処理について、図16に示すフローチャートを参照して説明する。
ステップS1201では、メール連携機能等に関する設定が、上述した設定画面400を使用して行われる。そして、処理がステップS1202に進む。
ステップS1202では、配信装置100が通信部120を介して、ユーザ端末200から送信されたメールを受信する。そして、処理がステップS1203に進む。
ステップS1203では、配信装置100の制御部110が、受信したメールが有するメールアドレスが設定画面400(より具体的には、設定画面400におけるメール連携機能に関する設定項目408)で登録したメールアドレスで否かが判断される。ここで、受信したメールのメールアドレスが登録したメールアドレスと異なる場合(ステップS1203の否定判断)には、処理がステップS1202に戻る。受信したメールのメールアドレスが登録したメールアドレスと一致する場合(ステップS1203の肯定判断)には、処理がステップS1204に進む。
ステップS1204では、配信装置100の制御部110、具体的には、音声合成部113が、メールデータに含まれる本文の文章データに対応する音声データを生成する。このとき、音声合成部113は、制御文字425c(「@@」との文字)を除いた文章データに対応する音声データを生成する。そして、処理がステップS1205に進む。
ステップS1205では、番組コンテンツデータが生成される。番組コンテンツデータは、構成生成部115によって生成された番組コンテンツの構成に基づいて、動画生成部116により自動生成される。構成生成部115は、設定画面400により設定された内容に基づいて、番組コンテンツデータの構成を生成する。具体的には、構成生成部115は、設定画面400で設定されたキャラクターやキャラクターの衣装、背景に関する設定、効果音等のプリセットされている画像や音データが番組コンテンツデータに反映されるように構成を生成する。更に、構成生成部115は、制御文字425cが規定された位置において、メールデータに添付された画像データに対応する画像が切り替わるような構成を生成し、番組コンテンツの構成に関する情報として出力する。構成生成部115は、番組コンテンツの構成に関する情報、メールの文章データに対応する音声データ、メールに添付された画像データ、設定画面400にて表示等の出力をすることが設定されたプリセットされているデータ等を動画生成部116に出力する。
そして、動画生成部116は、構成生成部115から供給された情報、データに基づいて番組コンテンツデータを自動生成する。このように、動画生成部116は、制御文字が含まれる文章データを含む素材データを取得し、素材データを解析し、文章データに基づく出力がなされ、且つ、制御文字に基づく制御が反映された番組コンテンツデータを自動生成する。なお、文章データに基づく出力とは、本例では音声出力を想定しているが、表示、番組コンテンツの視聴者への振動等のフィードバックであっても良い。そして、処理がステップS1206に進む。
ステップS1206では、動画生成部116は、自動生成した番組コンテンツデータを例えば記憶部150に書き出して記憶する。ここで、番組コンテンツデータが記憶される記憶部150は、例えば、NAS(Network Attached Storage)等のネットワーク上に接続することができる記憶装置である。配信装置100にメールを送信した送信者は、当該記憶装置に接続し、格納されている番組コンテンツデータを再生することにより、自身が作成したメールによりどのような番組コンテンツが作成されたのかを確認することができる。なお、自動作成された番組コンテンツデータが格納される記憶装置は、記憶部150に限らず、クラウド上の機器が有する記憶装置であっても良い。
[番組コンテンツの具体例]
図17A及び図17Bを参照して、自動生成された番組コンテンツの具体例について説明する。自動生成された番組コンテンツに対する再生指示がなされ、番組コンテンツが再生される。図17Aに示すように、画面に向かって右側にキャラクター450が表示される。キャラクター450の種類、衣装等は、設定画面400で設定された通りとなっている。背景等についても同様である。また、画面に向かって左側には、メールデータに添付された画像データ431に対応する画像(天気画像)が表示される。画面の左上側には、メールの件名に記載されている内容が、番組コンテンツのタイトルとして表示される。このように、本実施の形態では、メールの件名に対応する文章データが表示されるようにしており、係る設定内容が、動画生成部116が実行するプログラムに記述されている。なお、メールの件名がない場合は、何も表示されないようにしても良い。
図17A及び図17Bを参照して、自動生成された番組コンテンツの具体例について説明する。自動生成された番組コンテンツに対する再生指示がなされ、番組コンテンツが再生される。図17Aに示すように、画面に向かって右側にキャラクター450が表示される。キャラクター450の種類、衣装等は、設定画面400で設定された通りとなっている。背景等についても同様である。また、画面に向かって左側には、メールデータに添付された画像データ431に対応する画像(天気画像)が表示される。画面の左上側には、メールの件名に記載されている内容が、番組コンテンツのタイトルとして表示される。このように、本実施の形態では、メールの件名に対応する文章データが表示されるようにしており、係る設定内容が、動画生成部116が実行するプログラムに記述されている。なお、メールの件名がない場合は、何も表示されないようにしても良い。
図17Aに示す画像が表示されると、例えば、オープニングテーマが再生される。オープニングテーマの再生は、例えば、設定画面400で効果音ありが設定されている場合に、プリセットされている音声データを再生することにより行われる。オープニングテーマの再生が終了すると、キャラクター450が話す。話の内容は、メールの本文に記載された第1本文425aの内容である。キャラクター450は、話している間、口元が動くように表示される。第1の実施の形態で説明したように、キャラクター450の表情が変化したり、声の抑揚が変化するようにしても良い。
第1本文425aに対応する音声の再生が終了すると、キャラクター450が話す内容が第2本文425bの内容に遷移する。上述したように、メールの第1本文425aと第2本文425bとの間には、画像の切り替わりを示す制御文字425cが入力されている。従って、番組コンテンツでは、当該制御文字425cに基づく制御が反映される。具体的には、第1本文425aに対応する音声の再生が終了すると、図17Bに示すように、表示画像が画像データ432に対応する画像(かき氷の画像)に変化する。そして、キャラクター450が、第2本文425bに対応する内容を話す。以上のように、メールに記載した内容(制御の内容を含む)が反映された番組コンテンツが再生される。
[むすび]
第2の実施の形態では、文章データに制御文字を含ませるだけで、当該制御文字に基づく制御が反映された番組コンテンツデータを自動生成することができる。
第2の実施の形態では、文章データに制御文字を含ませるだけで、当該制御文字に基づく制御が反映された番組コンテンツデータを自動生成することができる。
また、汎用性のあるメールを使用することにより、特別なスキルを有しないユーザであっても制御文字を含む文章データを容易に作成できる。また、番組コンテンツを制作するための特別なツールを作成する必要も無く、誰もが番組コンテンツの制作に携わることができる。
また、ユーザは、番組コンテンツデータを自動生成する装置にメールを送信するだけで、自身が所望する制御が反映された番組コンテンツデータを得ることができる。
また、自動生成された番組コンテンツデータがNAS等に出力され、番組コンテンツデータに対してアクセス可能とすることにより、ユーザは、自身が所望する制御が反映された番組コンテンツを視聴することができる。番組コンテンツを視聴したユーザは、その出来(例えば、画像の切り替わりタイミング)に不満があれば、再度、メール内容を編集して配信装置に送信するだけで番組コンテンツの内容を容易に編集、修正することができる。
また、番組コンテンツデータでユーザが使用したい音声、画像等があれば、それらをメールに添付するだけで良い。更に、制御文字を入力するだけで、メールに添付した音声や画像を再生するタイミングを規定することができる。
[第2の実施の形態の変形例]
第2の実施の形態の内容は、例えば、以下のようにその内容を変形することができる。
第2の実施の形態の内容は、例えば、以下のようにその内容を変形することができる。
上述した説明では、制御文字に対応する制御の内容が画像の切り替わりであったが、これに限定されるものではない。制御文字に対応する制御の内容は適宜、設定することができる。制御文字に対応する制御の内容は、例えば、番組コンテンツにおけるキャラクターに所定の動作を行わせるものでも良い。この場合は、メールの文章で制御文字が規定された位置に対応するタイミングで、キャラクターが所定の動作を行うような番組コンテンツが自動生成される。制御文字に対応する制御の内容が、設定画面400を使用等して定義可能とされても良い。また、制御文字に対応する制御の内容が、送信されるメールの中で定義されるようにしても良い。
上述した説明では、制御文字を「@@」として説明したが、これに限定されるものではなく、他の文字や数字でも良い。但し、簡易な入力を可能とし、ユーザにとって覚えやすい文字数(例えば、16文字以下)や文字種であることが好ましい。なお、制御文字としてどのような文字が使いやすく且つ覚えやすいはユーザによって異なる。従って、制御文字そのものをユーザが定義できるようにしても良い。
上述した説明では、メールに画像データが添付されていたが、画像データが添付されていなくても良く、素材データが文章データのみであっても良い。なお、画像データ等の添付データの有無に応じて、異なる番組コンテンツが自動生成されるようにしても良い。例えば、上述した説明では、メールに添付されていた画像データに対応する画像を表示するために、キャラクターが画面に向かって右側に表示される番組コンテンツが自動生成されるようにした。しかしながら、メールに例えば画像データが添付されていない場合は、キャラクターの表示位置を右側にする必要がない。そこで、メールに例えば画像データが添付されていない場合には、例えば、キャラクターの立ち位置が正面となるような番組コンテンツが自動生成されるようにしても良い。また、画像データの添付の有無に応じて、配信装置の制御部が、制御文字に対応する制御の内容を変更するようにしても良い。
上述した説明では、自動生成された番組コンテンツデータが記憶部に記憶されるようにした。記憶された番組コンテンツデータに対するアクセスが制限されるようにしても良い。例えば、記憶された番組コンテンツデータに対して、メール送信者や特定のユーザのみしかアクセスできないような制限が設定されても良い。また、自動生成された番組コンテンツデータが不特定多数のユーザに対して公開されても良い。この場合には、番組コンテンツの閲覧期間等に関する制限が設定されても良い。番組コンテンツの公開が有償でなされても良い。また、番組コンテンツを閲覧したユーザからのフィードバック(例えば、感想、評価等)がなされても良い。作成された番組コンテンツデータが特定のユーザ端末に自動で配信されるようにしても良い。
上述した説明の処理を行う場合に、制御文字の挿入し忘れも想定される。従って、制御文字がない場合であっても画像が適切に切り替わるようにするための処理が行われても良い。例えば、制御部が話題の切り替わりを示す用語(例えば「ここからは」)があるにも関わらずその前に制御文字が挿入されていない場合には、制御文字の有無に関わらず画像を切り替える処理が行われるようにしても良い。また、画像の内容を解析し、解析結果と文章データとのマッチングを行い、マッチング度が一定以上である場合に、制御文字がない場合であっても画像を切り替える処理が行われるようにしても良い。
自動生成された番組コンテンツデータが、所定の時刻に自動的に配信されても良い。所定の時刻は、設定画面400等を使用して設定することもできる。
上述したメールに含まれる文章データは、複数のユーザによって入力されたものであっても良い。例えば、所定の制御が反映された1つの番組コンテンツデータを、複数のユーザにより分担して作成することも可能となる。
上述した説明では、メッセージ情報の一例として電子メールシステムを利用して送信されるメールデータを説明し、文章データ(メッセージ)がメールに記述される例について説明したが、これに限定されるものではない。メッセージ情報としては、SMS(Short Message Service)、MMS(Multimedia Messaging Service)、チャット、コメント、ネットワークを介して提供される掲示板等であっても良く、文章データはそれらに対して入力されたものであっても良い。例えば、配信装置側で書き込み可能なネットワーク上の掲示板が用意され、ユーザは、当該掲示板にログイン等した上で掲示板に制御文字を含む文章データを入力するようにしても良い。掲示板に入力された文章データ等に応じて、配信装置が番組コンテンツデータを自動生成する。また、上述した説明では、アカウント情報の一例としてメールアドレスを用いて説明したが、電話番号、パスワード、ユーザID(Identification)等、送信者を識別することが可能な情報であれば何でも良い。
上述した配信装置で行われる処理がユーザ端末で行われても良い。また、上述した処理は、方法、プログラムによっても実現することが可能である。ユーザは、プログラムをダウンロードしインストールすることにより、自身が有する端末で番組コンテンツデータを自動生成することが可能となる。
例えば、上記の各フローチャートに示した各ステップは、必ずしもフローチャートとして記載された順序に沿って時系列に処理される必要はない。すなわち、各ステップは、フローチャートとして記載した順序と異なる順序で処理されても、並列的に処理されても良い。
また、配信装置又はユーザ端末の機能構成は適宜変更されても良い。例えば、配信装置又はユーザ端末の機能構成の一部は、適宜外部装置に備えられても良い。また、配信装置の制御部が、通信部、入力部、出力部の一部の機能を実現しても良い。また、ユーザ端末の制御部が、通信部、入力部、出力部の一部の機能を実現しても良い。
なお、本開示は、以下の構成をとることも可能である。
(1)
制御文字が含まれる文章データを含む素材データを取得し、前記素材データを解析し、前記文章データに基づく出力がなされ、且つ、前記制御文字に基づく制御が反映された番組コンテンツデータを自動生成する制御部を備える
情報処理装置。
(2)
前記制御部は、所定のアカウント情報を有するメッセージ情報を受信した場合に、当該メッセージ情報に含まれる前記素材データを解析する
(1)に記載の情報処理装置。
(3)
前記メッセージ情報は、件名に対応する第1の文章データと本文に対応する第2の文章データとを含み、
前記制御部は、少なくとも、前記第1の文章データが表示され、前記第2の文章データに対応する音声出力がなされる番組コンテンツデータを自動生成する
(2)に記載の情報処理装置。
(4)
前記第2の文章データに前記制御文字が含まれる場合に、前記制御部は、制御文字を除いた前記第2の文章データに対応する音声出力がなされる番組コンテンツデータを自動生成する
(3)に記載の情報処理装置。
(5)
前記制御部は、前記制御文字が規定された位置に対応するタイミングで画像が切り替えられる番組コンテンツデータを自動生成する
(2)から(4)までの何れかに記載の情報処理装置。
(6)
前記画像は、前記メッセージ情報に添付された複数の画像である
(5)に記載の情報処理装置。
(7)
前記制御部は、前記制御文字が規定された位置に対応するタイミングでキャラクターが所定の動作を行う番組コンテンツデータを自動生成する
(2)から(6)までの何れかに記載の情報処理装置。
(8)
前記制御部は、前記メッセージ情報の添付データの有無に応じて、異なる番組コンテンツデータを自動生成する
(2)から(7)までの何れかに記載の情報処理装置。
(9)
前記制御部は、自動生成した前記番組コンテンツデータを記憶装置に記憶する
(1)から(8)までの何れかに記載の情報処理装置。
(10)
前記記憶装置を有する
(9)に記載の情報処理装置。
(11)
前記記憶装置に記憶された番組コンテンツデータに対して、ユーザ端末からのアクセスが可能とされている
(9)に記載の情報処理装置。
(12)
前記ユーザ端末からのアクセスに対する制限が設定される
(11)に記載の情報処理装置。
(13)
前記制限は、前記番組コンテンツデータの閲覧者に関する制限及び前記番組コンテンツデータの閲覧期間に関する制限の少なくとも一つである
(12)に記載の情報処理装置。
(14)
前記制御部は、プリセットされているコンテンツデータを含む前記番組コンテンツデータを自動生成する
(1)から(13)までの何れかに記載の情報処理装置。
(15)
前記制御文字は、1文字以上16文字以下の文字、記号、数字又はこれらの組み合わせである
(1)から(14)までの何れかに記載の情報処理装置。
(16)
任意の端末から送信された、制御文字が含まれる文章データを含むメッセージ情報を受信する通信部と、
前記受信したメッセージ情報のアカウント情報が所定のアカウント情報である場合に、前記文章データを解析し、前記文章データに基づく出力がなされ、且つ、前記制御文字に基づく制御が反映された番組コンテンツデータを自動生成する制御部と
を備える情報処理システム。
(17)
制御部が、制御文字が含まれる文章データを含む素材データを取得し、前記素材データを解析し、前記文章データに基づく出力がなされ、且つ、前記制御文字に基づく制御が反映された番組コンテンツデータを自動生成する
情報処理方法。
(18)
制御部が、制御文字が含まれる文章データを含む素材データを取得し、前記素材データを解析し、前記文章データに基づく出力がなされ、且つ、前記制御文字に基づく制御が反映された番組コンテンツデータを自動生成する
情報処理方法をコンピュータに実行させるプログラム。
(1)
制御文字が含まれる文章データを含む素材データを取得し、前記素材データを解析し、前記文章データに基づく出力がなされ、且つ、前記制御文字に基づく制御が反映された番組コンテンツデータを自動生成する制御部を備える
情報処理装置。
(2)
前記制御部は、所定のアカウント情報を有するメッセージ情報を受信した場合に、当該メッセージ情報に含まれる前記素材データを解析する
(1)に記載の情報処理装置。
(3)
前記メッセージ情報は、件名に対応する第1の文章データと本文に対応する第2の文章データとを含み、
前記制御部は、少なくとも、前記第1の文章データが表示され、前記第2の文章データに対応する音声出力がなされる番組コンテンツデータを自動生成する
(2)に記載の情報処理装置。
(4)
前記第2の文章データに前記制御文字が含まれる場合に、前記制御部は、制御文字を除いた前記第2の文章データに対応する音声出力がなされる番組コンテンツデータを自動生成する
(3)に記載の情報処理装置。
(5)
前記制御部は、前記制御文字が規定された位置に対応するタイミングで画像が切り替えられる番組コンテンツデータを自動生成する
(2)から(4)までの何れかに記載の情報処理装置。
(6)
前記画像は、前記メッセージ情報に添付された複数の画像である
(5)に記載の情報処理装置。
(7)
前記制御部は、前記制御文字が規定された位置に対応するタイミングでキャラクターが所定の動作を行う番組コンテンツデータを自動生成する
(2)から(6)までの何れかに記載の情報処理装置。
(8)
前記制御部は、前記メッセージ情報の添付データの有無に応じて、異なる番組コンテンツデータを自動生成する
(2)から(7)までの何れかに記載の情報処理装置。
(9)
前記制御部は、自動生成した前記番組コンテンツデータを記憶装置に記憶する
(1)から(8)までの何れかに記載の情報処理装置。
(10)
前記記憶装置を有する
(9)に記載の情報処理装置。
(11)
前記記憶装置に記憶された番組コンテンツデータに対して、ユーザ端末からのアクセスが可能とされている
(9)に記載の情報処理装置。
(12)
前記ユーザ端末からのアクセスに対する制限が設定される
(11)に記載の情報処理装置。
(13)
前記制限は、前記番組コンテンツデータの閲覧者に関する制限及び前記番組コンテンツデータの閲覧期間に関する制限の少なくとも一つである
(12)に記載の情報処理装置。
(14)
前記制御部は、プリセットされているコンテンツデータを含む前記番組コンテンツデータを自動生成する
(1)から(13)までの何れかに記載の情報処理装置。
(15)
前記制御文字は、1文字以上16文字以下の文字、記号、数字又はこれらの組み合わせである
(1)から(14)までの何れかに記載の情報処理装置。
(16)
任意の端末から送信された、制御文字が含まれる文章データを含むメッセージ情報を受信する通信部と、
前記受信したメッセージ情報のアカウント情報が所定のアカウント情報である場合に、前記文章データを解析し、前記文章データに基づく出力がなされ、且つ、前記制御文字に基づく制御が反映された番組コンテンツデータを自動生成する制御部と
を備える情報処理システム。
(17)
制御部が、制御文字が含まれる文章データを含む素材データを取得し、前記素材データを解析し、前記文章データに基づく出力がなされ、且つ、前記制御文字に基づく制御が反映された番組コンテンツデータを自動生成する
情報処理方法。
(18)
制御部が、制御文字が含まれる文章データを含む素材データを取得し、前記素材データを解析し、前記文章データに基づく出力がなされ、且つ、前記制御文字に基づく制御が反映された番組コンテンツデータを自動生成する
情報処理方法をコンピュータに実行させるプログラム。
100 配信装置
110 制御部
111 原稿生成部
112 原稿解析部
113 音声合成部
114 要求管理部
115 構成生成部
116 動画生成部
120 通信部
130 入力部
140 出力部
150 記憶部
200 ユーザ端末
210 制御部
211 要求管理部
212 構成生成部
213 動画生成部
220 通信部
230 入力部
240 出力部
250 記憶部
300 ネットワーク
110 制御部
111 原稿生成部
112 原稿解析部
113 音声合成部
114 要求管理部
115 構成生成部
116 動画生成部
120 通信部
130 入力部
140 出力部
150 記憶部
200 ユーザ端末
210 制御部
211 要求管理部
212 構成生成部
213 動画生成部
220 通信部
230 入力部
240 出力部
250 記憶部
300 ネットワーク
Claims (18)
- 制御文字が含まれる文章データを含む素材データを取得し、前記素材データを解析し、前記文章データに基づく出力がなされ、且つ、前記制御文字に基づく制御が反映された番組コンテンツデータを自動生成する制御部を備える
情報処理装置。 - 前記制御部は、所定のアカウント情報を有するメッセージ情報を受信した場合に、当該メッセージ情報に含まれる前記素材データを解析する
請求項1に記載の情報処理装置。 - 前記メッセージ情報は、件名に対応する第1の文章データと本文に対応する第2の文章データとを含み、
前記制御部は、少なくとも、前記第1の文章データが表示され、前記第2の文章データに対応する音声出力がなされる番組コンテンツデータを自動生成する
請求項2に記載の情報処理装置。 - 前記第2の文章データに前記制御文字が含まれる場合に、前記制御部は、制御文字を除いた前記第2の文章データに対応する音声出力がなされる番組コンテンツデータを自動生成する
請求項3に記載の情報処理装置。 - 前記制御部は、前記制御文字が規定された位置に対応するタイミングで画像が切り替えられる番組コンテンツデータを自動生成する
請求項2に記載の情報処理装置。 - 前記画像は、前記メッセージ情報に添付された複数の画像である
請求項5に記載の情報処理装置。 - 前記制御部は、前記制御文字が規定された位置に対応するタイミングでキャラクターが所定の動作を行う番組コンテンツデータを自動生成する
請求項2に記載の情報処理装置。 - 前記制御部は、前記メッセージ情報の添付データの有無に応じて、異なる番組コンテンツデータを自動生成する
請求項2に記載の情報処理装置。 - 前記制御部は、自動生成した前記番組コンテンツデータを記憶装置に記憶する
請求項1に記載の情報処理装置。 - 前記記憶装置を有する
請求項9に記載の情報処理装置。 - 前記記憶装置に記憶された番組コンテンツデータに対して、ユーザ端末からのアクセスが可能とされている
請求項9に記載の情報処理装置。 - 前記ユーザ端末からのアクセスに対する制限が設定される
請求項11に記載の情報処理装置。 - 前記制限は、前記番組コンテンツデータの閲覧者に関する制限及び前記番組コンテンツデータの閲覧期間に関する制限の少なくとも一つである
請求項12に記載の情報処理装置。 - 前記制御部は、プリセットされているコンテンツデータを含む前記番組コンテンツデータを自動生成する
請求項1に記載の情報処理装置。 - 前記制御文字は、1文字以上16文字以下の文字、記号、数字又はこれらの組み合わせである
請求項1に記載の情報処理装置。 - 任意の端末から送信された、制御文字が含まれる文章データを含むメッセージ情報を受信する通信部と、
前記受信したメッセージ情報のアカウント情報が所定のアカウント情報である場合に、前記文章データを解析し、前記文章データに基づく出力がなされ、且つ、前記制御文字に基づく制御が反映された番組コンテンツデータを自動生成する制御部と
を備える情報処理システム。 - 制御部が、制御文字が含まれる文章データを含む素材データを取得し、前記素材データを解析し、前記文章データに基づく出力がなされ、且つ、前記制御文字に基づく制御が反映された番組コンテンツデータを自動生成する
情報処理方法。 - 制御部が、制御文字が含まれる文章データを含む素材データを取得し、前記素材データを解析し、前記文章データに基づく出力がなされ、且つ、前記制御文字に基づく制御が反映された番組コンテンツデータを自動生成する
情報処理方法をコンピュータに実行させるプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US17/250,616 US20210176539A1 (en) | 2018-08-21 | 2019-06-11 | Information processing device, information processing system, information processing method, and program |
CN201980053369.XA CN112567761A (zh) | 2018-08-21 | 2019-06-11 | 信息处理设备、信息处理系统、信息处理方法和程序 |
JP2020538191A JPWO2020039702A1 (ja) | 2018-08-21 | 2019-06-11 | 情報処理装置、情報処理システム、情報処理方法及びプログラム |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018-154623 | 2018-08-21 | ||
JP2018154623 | 2018-08-21 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2020039702A1 true WO2020039702A1 (ja) | 2020-02-27 |
Family
ID=69592534
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2019/023004 WO2020039702A1 (ja) | 2018-08-21 | 2019-06-11 | 情報処理装置、情報処理システム、情報処理方法及びプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20210176539A1 (ja) |
JP (1) | JPWO2020039702A1 (ja) |
CN (1) | CN112567761A (ja) |
WO (1) | WO2020039702A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022102186A1 (ja) * | 2020-11-13 | 2022-05-19 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、情報処理プログラム |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
USD988358S1 (en) * | 2021-01-19 | 2023-06-06 | Fujitsu Limited | Display screen with animated graphical user interface |
CN114154491A (zh) * | 2021-11-17 | 2022-03-08 | 阿波罗智联(北京)科技有限公司 | 界面皮肤更新方法、装置、设备、介质及程序产品 |
CN117274006B (zh) * | 2023-11-21 | 2024-03-12 | 山东山大鸥玛软件股份有限公司 | 一种命题方法、系统、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0869520A (ja) * | 1994-08-30 | 1996-03-12 | Fuji Photo Film Co Ltd | 合体型画像ファイルを利用した分岐方法およびシステム,ならびに分岐画面作成方法 |
JP2003348525A (ja) * | 2002-05-27 | 2003-12-05 | Hitachi Kokusai Electric Inc | 番組蓄積送出装置及びその装置を用いた送受信システム |
JP2004318292A (ja) * | 2003-04-11 | 2004-11-11 | Toshiaki Ueno | 携帯通信端末装置の通信データの管理方法および電子メールサーバ装置、携帯通信端末装置の自動操作装置、着信情報管理装置、記録媒体並びに通信端末装置 |
JP2007529055A (ja) * | 2003-10-27 | 2007-10-18 | 松下電器産業株式会社 | データ受信端末及びメール作成方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3580481B2 (ja) * | 1999-10-06 | 2004-10-20 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声読み上げ範囲の指定方法および装置 |
JP4012047B2 (ja) * | 2002-11-11 | 2007-11-21 | 株式会社ジャストシステム | 電子文書作成装置、電子文書作成方法およびその方法をコンピュータに実行させるプログラム |
KR100720133B1 (ko) * | 2003-12-27 | 2007-05-18 | 삼성전자주식회사 | 휴대단말기의 문자 메시지 처리 방법 |
JP2006120016A (ja) * | 2004-10-22 | 2006-05-11 | Starboard Kk | データ引用システム |
JP4585382B2 (ja) * | 2005-06-09 | 2010-11-24 | 日本放送協会 | クライアント端末、管理サーバ、利用プログラム、及び管理プログラム |
US8443390B2 (en) * | 2008-12-05 | 2013-05-14 | Qualcomm Incorporated | Enhanced method and apparatus for enhancing support for service delivery |
US11062497B2 (en) * | 2017-07-17 | 2021-07-13 | At&T Intellectual Property I, L.P. | Structuralized creation and transmission of personalized audiovisual data |
-
2019
- 2019-06-11 JP JP2020538191A patent/JPWO2020039702A1/ja active Pending
- 2019-06-11 WO PCT/JP2019/023004 patent/WO2020039702A1/ja active Application Filing
- 2019-06-11 CN CN201980053369.XA patent/CN112567761A/zh not_active Withdrawn
- 2019-06-11 US US17/250,616 patent/US20210176539A1/en not_active Abandoned
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0869520A (ja) * | 1994-08-30 | 1996-03-12 | Fuji Photo Film Co Ltd | 合体型画像ファイルを利用した分岐方法およびシステム,ならびに分岐画面作成方法 |
JP2003348525A (ja) * | 2002-05-27 | 2003-12-05 | Hitachi Kokusai Electric Inc | 番組蓄積送出装置及びその装置を用いた送受信システム |
JP2004318292A (ja) * | 2003-04-11 | 2004-11-11 | Toshiaki Ueno | 携帯通信端末装置の通信データの管理方法および電子メールサーバ装置、携帯通信端末装置の自動操作装置、着信情報管理装置、記録媒体並びに通信端末装置 |
JP2007529055A (ja) * | 2003-10-27 | 2007-10-18 | 松下電器産業株式会社 | データ受信端末及びメール作成方法 |
Non-Patent Citations (2)
Title |
---|
TANAKA, NORIAKI ET AL.: "Automatic Production and Transmission of News Programs for Internet Broadcasting Station Intebro", PROCEEDINGS OF THE 2003 IEICE GENERAL CONFERENCE (ENGINEERING, 3 March 2003 (2003-03-03) * |
YOKOYAMA, KEI ET AL.: "Video Generation from Simple Text Scripts. Proceedings of the 2009 IEICE General Conference (Information/Systems 2", 4 March 2009 (2009-03-04), pages 181 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022102186A1 (ja) * | 2020-11-13 | 2022-05-19 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、情報処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
CN112567761A (zh) | 2021-03-26 |
US20210176539A1 (en) | 2021-06-10 |
JPWO2020039702A1 (ja) | 2021-08-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020039702A1 (ja) | 情報処理装置、情報処理システム、情報処理方法及びプログラム | |
US10360716B1 (en) | Enhanced avatar animation | |
US7949109B2 (en) | System and method of controlling sound in a multi-media communication application | |
TWI436808B (zh) | Input support device, input support method and recording medium | |
JP2006520053A (ja) | 通信するためにアバターを使用する方法 | |
KR100856786B1 (ko) | 3d 버추얼 에이전트를 사용한 멀티미디어 나레이션 저작시스템 및 그 제공 방법 | |
KR20100007702A (ko) | 애니메이션 제작 방법 및 장치 | |
US20220246135A1 (en) | Information processing system, information processing method, and recording medium | |
JP2018078402A (ja) | コンテンツ制作装置、及び音声付コンテンツ制作システム | |
TW201621883A (zh) | 個人化音訊及/或視訊展示 | |
US20230027035A1 (en) | Automated narrative production system and script production method with real-time interactive characters | |
US20240205515A1 (en) | Information processing system, information processing method, and storage medium | |
JP4917920B2 (ja) | コンテンツ生成装置及びコンテンツ生成プログラム | |
JP2023506364A (ja) | メッセージングプラットフォーム上のオーディオメッセージングインターフェース | |
JP2010140278A (ja) | 音声情報可視化装置及び音声情報可視化プログラム | |
WO2020026799A1 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP2008523759A (ja) | 映像メッセージを合成する方法及びシステム | |
US12010161B1 (en) | Browser-based video production | |
JP7176519B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
CN117008794A (zh) | 视频生成方法、装置、设备以及介质 | |
JP2005228297A (ja) | 実物キャラクター型動画像情報物の制作方法,実物キャラクター型動画像情報物の再生方法,記録媒体 | |
CN115315960A (zh) | 内容修正装置、内容发布服务器、内容修正方法以及记录介质 | |
US12015865B2 (en) | System and methods for evoking authentic emotions from live photographic and video subjects | |
WO2021111906A1 (ja) | コンテンツ提供システム、コンテンツ提供方法、及び記憶媒体 | |
CN118338090A (zh) | 多媒体资源生成方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 19852962 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2020538191 Country of ref document: JP Kind code of ref document: A |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 19852962 Country of ref document: EP Kind code of ref document: A1 |