WO2022014295A1 - 情報処理装置、情報処理方法、プログラム - Google Patents

情報処理装置、情報処理方法、プログラム Download PDF

Info

Publication number
WO2022014295A1
WO2022014295A1 PCT/JP2021/024018 JP2021024018W WO2022014295A1 WO 2022014295 A1 WO2022014295 A1 WO 2022014295A1 JP 2021024018 W JP2021024018 W JP 2021024018W WO 2022014295 A1 WO2022014295 A1 WO 2022014295A1
Authority
WO
WIPO (PCT)
Prior art keywords
content
material content
user
story
information processing
Prior art date
Application number
PCT/JP2021/024018
Other languages
English (en)
French (fr)
Inventor
優太 中尾
聡 石井
靖二郎 稲葉
禎 山口
雅史 若月
Original Assignee
ソニーグループ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニーグループ株式会社 filed Critical ソニーグループ株式会社
Priority to JP2022536217A priority Critical patent/JPWO2022014295A1/ja
Priority to US18/004,289 priority patent/US20230260549A1/en
Publication of WO2022014295A1 publication Critical patent/WO2022014295A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/232Content retrieval operation locally within server, e.g. reading video streams from disk arrays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2665Gathering content from different sources, e.g. Internet and satellite
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor

Definitions

  • This technology is related to information processing equipment, information processing methods, and programs, especially in the technical field of automatic content production using images and sounds.
  • Patent Document 1 discloses a technique for creating video content by connecting unit images as materials.
  • the server device that provides the service automatically produces the content and provides it to the customer
  • the purpose of this technology is to enable the evaluation and selection of materials to be performed relatively easily and appropriately when the content to be provided to the user is automatically produced.
  • the information processing device selects the material content that composes the story set in the story setting process based on the plurality of material contents recorded in an accessible state, and edits the selected material content. It has a story generation unit that creates automatic content.
  • the material content is an image (video or still image) or sound that constitutes each scene that constitutes the story. Select and edit such material content to generate a story.
  • the story generation unit selects a plurality of material contents using a learning model by machine learning, and automatically creates the contents by an editing process using the selected material contents. By using the learning model, more desirable material content selection is realized.
  • the story generation unit is provided with an evaluation unit that performs a process of setting an evaluation value for the material content, and the story generation unit selects the material content constituting the story set in the story setting process with reference to the evaluation value, and selects the selected material. It is conceivable to perform automatic content production by editing processing using content.
  • the material content is stored so that the information processing device can access it, but the evaluation value is set for this material content, and the material content is selected by referring to the evaluation value at the time of automatic content production. To.
  • the story generation unit collects material contents as candidates for use according to the set story, and uses the evaluation value among the material contents collected as candidates. It is conceivable to perform a process of selecting the material content to be used for automatic content production. Since the evaluation value is set for the material content, it is possible to select the material content to be adopted by using the evaluation value when collecting the material content according to the candidate scenes constituting the story.
  • the evaluation unit sets an evaluation value indicating the relationship between the material content and other material content. For example, when the material content has a causal relationship with other material content, an evaluation value indicating the relationship with other material content is set.
  • the evaluation unit sets an evaluation value of the material content by itself. For example, for material content, set an evaluation value that shows the value as a scene, such as emotions and emotions appearing or being tracked.
  • the evaluation unit sets the relevance presentation information that presents the relevance of the material content to other material contents. For example, when the material content has a causal relationship with other material content, the relevance presentation information for presenting the relevance to the user is set.
  • the relevance presentation information is updated according to the user operation.
  • the user's operation is accepted and the relationship presentation information is updated according to the operation.
  • the relevance presentation information indicates the relationship between the material contents by linking one material content with another material content. ..
  • the relationship between the contents is presented on the user interface by an image that directly connects the material contents.
  • the relevance presentation information indicates the relevance of the material content in a form in which the material content is linked to the key element.
  • a word indicating an emotion or an event is used as a key element, and the relevance of the content is presented on the user interface in the form of a material content corresponding to a certain emotion, a material content related to a certain event, and the like.
  • the relevance presentation information indicates the relevance of the material content in a form in which the material content is linked to the human relationship of the user. For example, for a certain user, human relationships such as family and friends and material contents related to them are presented.
  • the information processing apparatus includes a learning unit that inputs a user operation for the relevance presentation information and performs learning processing. For example, in a user interface that presents the relationship between material contents, a user's operation is accepted and learning processing is performed as information to be reflected in story settings and the like.
  • the learning content by the learning unit is reflected in the story correction.
  • the learning result of the feedback information by the user is reflected, for example, as a story correction of the current automatically produced content.
  • the learning content by the learning unit is reflected in the selection of the material content.
  • the learning result of the feedback information by the user is reflected, for example, as the selection of the material content (reselection of the material content) to be adopted for the story of the current automated production content.
  • the learning contents by the learning unit will be reflected in the future automatic content production. Perform necessary processing so that the learning result of the feedback information by the user is reflected in the future production of the automated production content for the user.
  • the information processing apparatus includes a learning unit that inputs feedback information and performs a learning process for updating the learning model. It is assumed that the learning model by machine learning is used to select material contents and edit for story generation.
  • the information processing apparatus includes a learning unit that inputs feedback information and performs a learning process of updating the evaluation function for selecting the material content used for story generation. It is assumed that the material content to be used for each scene constituting the story is selected by using an evaluation function including elements such as individual evaluation value, relevance evaluation value, time length, and order.
  • the information processing method related to this technology selects the material content that composes the story set in the story setting process based on multiple material contents recorded in an accessible state, and edits using the selected material content.
  • This is an information processing method in which an information processing device executes a story generation process for automatically producing content. This facilitates the selection of material content.
  • the program according to the present technology is a program that causes an information processing apparatus to execute such an information processing method. This facilitates the realization of the information processing device of this technology.
  • “content” is distinguished by using the following terms.
  • -Automatically produced content content provided to a user as a customer is automatically produced by an information processing device.
  • Content that is automatically produced and will be viewed by users is called “automatically produced content”, but in the embodiment, it is automatically produced as “automatically produced content” for the purpose of impressing customer users and the like.
  • impressive content it is mainly referred to as “impressive content”.
  • “Impressive content” is one specific example of "automated content”.
  • the forms of automatically produced content include video / audio content, still image slide show-like content, still image and audio content, audio-only content, video and still image and audio content, and text data. There are various contents such as contents including.
  • -Material content Automatic production content is produced by combining multiple video materials, still image materials, audio materials, text materials, etc.
  • Content data such as moving images, still images, sounds, texts, etc., which are the respective materials, are called "material contents". Any content can be material content.
  • -Candidate content Among the material content it refers to the material content that is a candidate to be used as the image or sound of a certain scene when creating the automatically produced content. For example, from a large amount of material content, some candidate contents that are likely to be adapted to a certain scene are extracted, and from the candidate contents, the material content to be used for the scene is selected.
  • the "image” may be either a moving image or a still image, and is a term used as a general term for them.
  • FIG. 1 shows an example of a system configuration including the server device 10.
  • the information processing device constituting the server device 10 automatically creates moving content about the customer user using a large number of image materials of a large number of users, and provides the moving content to the user. It will be explained by the example to be performed. Further, the material content will be described mainly by an example of moving image data (including audio). In other words, it is assumed that the emotional content that is automatically produced is an example of a movie that is produced by editing multiple videos.
  • the server device 10 in FIG. 1 is an information processing device capable of communicating with various devices via a network 11 such as the Internet, and functions as a so-called cloud server, for example.
  • the server device 10 can store a large amount of material content and produced moving content in the storage 10a under its control.
  • the storage 10a represents storage accessible to the server device 10, and may be a storage device mounted inside the information processing device as the server device 10, or may be connected by a LAN (Local Area Network) or the like. It may be a storage device that has been processed. Further, a storage located away from the server device 10 or a storage device on the user side may be used as the storage 10a referred to here. That is, if the server device 10 is a target storage from which material contents can be collected for automatic generation of moving contents, it may correspond to the storage 10a shown here.
  • the server device 10 can also store material contents and the like in the remote storage 12.
  • the remote storage 12 is shown as a storage device having lower accessibility than the storage 10a.
  • the remote storage 12 may also be a storage device inside the server device 10 or an external storage device. A detailed example will be described later.
  • the remote storage 12 may be a storage device that cannot be accessed physically from the user-side device, for example, the computer device 3, the tablet terminal 4, the mobile terminal 5, or the like shown in the figure, or by managing the access authority.
  • Such a server device 10 may be a server that provides a cloud storage service on a network, a server that provides an SNS (Social Networking Service), or a platform server that provides a comprehensive service. May be good.
  • SNS Social Networking Service
  • the network 11 is assumed to be, for example, the Internet, a home network, a LAN, a satellite communication network, or various other networks.
  • Various devices can upload image data and the like to the server device 10 via the network 11 and download various information from the server device 10.
  • communication by FTP File Transfer Protocol
  • short-range wireless communication such as Bluetooth (Bluetooth: registered trademark), WI-FI (Wireless Fidelity: registered trademark), NFC (Near Field Communication: registered trademark), infrared communication and the like may be adopted.
  • any network capable of data communication can be assumed as the network 11.
  • FIG. 1 as devices capable of shooting and recording on the user side, a camera 2, a computer device 3, a tablet terminal 4, a mobile terminal 5, a camera-equipped flying object 6, a camera-equipped vehicle 7, an agent device 8, and a surveillance camera 9 Is shown. These are just examples of devices that can shoot and record, and there may be devices other than these.
  • the camera 2 is an imaging device capable of capturing still images and moving images, recording them as image data, and outputting them for transfer.
  • the camera 2 is used by a large number of users, and the captured image data (moving image or still image) is stored in the storage 10a or the like, so that the server device 10 can use the image data as material content. is assumed.
  • the computer device 3 exemplifies, for example, a notebook personal computer, a desktop personal computer, and the like.
  • a tablet terminal 4 and a mobile terminal 5 such as a smartphone can also be said to be an aspect of a computer device.
  • tablet terminals 4, mobile terminals 5, etc. for example, image data captured by the built-in camera, image data transferred from other devices such as camera 2, synthetic images, computer graphics (CG), etc. It is assumed that the image data generated as, the image data as a video chat image, the image data shared with family and friends, and the like are stored in the storage 10a and the like, and can be accessed by the server device 10.
  • the camera-mounted flying object 6 is assumed to be an flying object equipped with a camera such as a drone. It is assumed that the image data obtained by the image taken by the camera-mounted flying object 6 is stored in the storage 10a or the like and can be accessed by the server device 10. It is assumed that the drone etc. is owned by the user, is a public property, is owned by the operator of the moving content providing service, and is used to photograph the customer's user for collecting material content. Will be done.
  • the camera-equipped vehicle 7 is, for example, a vehicle such as a general automobile and is a vehicle equipped with a camera such as a drive recorder.
  • a vehicle such as a general automobile and is a vehicle equipped with a camera such as a drive recorder.
  • the image data obtained by the shooting by the camera-equipped vehicle 7 is stored in the storage 10a or the like and becomes accessible by the server device 10. Is assumed.
  • the agent device 8 is an interface device for providing services such as information provision and home appliance control at home, for example, and it is assumed that shooting can be performed by mounting a camera. It is assumed that the image data obtained by the shooting of the agent device 8 is stored in the storage 10a or the like and can be accessed by the server device 10.
  • the example is given as the agent device 8, but for example, a housework support robot or a pet-type robot used at home also has a shooting function, so that the image data obtained by the shooting is stored in the storage 10a or the like and is stored by the server device 10. It is expected that it will be accessible.
  • the surveillance camera 9 may be, for example, one installed in a public place or one installed in a private space by a general user. It is assumed that the image data taken by the surveillance camera 9 is stored in the storage 10a or the like and can be accessed by the server device 10.
  • the various devices as described above may be devices capable of obtaining material contents used by the server device 10 or devices capable of a user interface.
  • FIG. 2 illustrates the relationship between the server device 10 and various devices.
  • the various devices shown in FIG. 1 may function as the material content providing unit 20 in FIG. 2, or may function as the UI (user interface) unit 22.
  • each of the above-mentioned devices such as a camera 2, a computer device 3, and a surveillance camera 9 can shoot or generate content as moving image data, and thus can be a source of material content that can be used by the server device 10. That is, the images obtained by various devices can be the material contents for producing the moving contents as the personal movie of the customer user. This is just an example, and other than the following can be considered, but the following is an example of an image that can be used as material content.
  • These images are stored, for example, in the storage 10a or the remote storage 12 in a state where they can be managed as images corresponding to individual users.
  • the image associated with the user A becomes usable material content.
  • Each image data may be stored together in association with the identification information of an individual user, or a plurality of user identification information may be assigned to one image and one image may be used for a plurality of users. It may be possible.
  • the camera 2, the computer device 3, the mobile terminal 5, and the like are devices having UI functions such as display and operation input. Therefore, these devices can function as the UI unit 22 when displaying the moving contents and various images provided by the server device 10 to the user, or when accepting the user operation.
  • FIG. 2 shows an example of a functional configuration included in the server device 10.
  • the server device 10 includes an evaluation unit 15, a story generation unit 16, a learning unit 17, and a storage management unit 18 as functions related to automatic production processing of moving contents.
  • the evaluation unit 15 is a processing function for setting an evaluation value for each material content stored in, for example, a storage 10a and accessible to the server device 10.
  • the story generation unit 16 is a function for automatically producing emotional content by performing story setting processing of emotional content for a customer user, selection processing of material content corresponding to the story setting processing, editing processing of the selected material content, and the like.
  • the learning unit 17 is a function that receives feedback from the user and performs learning processing adapted to the individual user.
  • the memory management unit 18 manages the storage of the material content, particularly the storage management of the negative content and the positive content. Specific processing examples of these functions will be described later, but high-quality processing is realized by performing, for example, AI processing as each function.
  • FIG. 2 also shows the function as the user information providing unit 21.
  • the user information providing unit 21 may be a function built into the camera 2, the computer device 3, the tablet terminal 4, the mobile terminal 5, or the like, or may be a separate device or sensor device.
  • As a wearable device it may be a device that can acquire user information (position information indicating the user's whereabouts, vital information, etc.) at each time point.
  • the user information includes, for example, attribute information such as the user's age and gender, hobbies, user's face, family structure, family age, friend information, schedule information, event information (schedule, participation history, SNS information, etc.). , Various information such as user's camera history, vital information, location information, etc. are assumed.
  • Some of these user information are related to individual users and managed, and some are related to material contents such as image data. For example, there is metadata that is added to and associated with image data. For example, attribute information such as the user's age and gender, hobbies, user's face, family structure, family age, information such as friends, schedule information, event information, camera history, etc. may be associated with the individual user.
  • the server device 10 manages such user information for each user as information for producing an appropriate moving content for the user. In terms of information at the time of shooting, the user's age at the time of shooting, family composition at the time of shooting, information on friends, etc., schedule information and event information corresponding to the shooting content (information on what kind of event the image is in).
  • Vital information at the time of shooting, position information at the time of shooting, and the like can be user information associated with the image. These user information is stored as metadata for each material content, or is managed separately as an information file or the like corresponding to the material content. As a result, the server device 10 can use the user information corresponding to each material content.
  • the user information by the user information providing unit 21 not only the information directly detected but also the information obtained by, for example, the result of image analysis or the analysis of a plurality of sensing data may be included.
  • the captured image data there are information on the user's physical features, facial expressions, complexion, and emotions estimated from them.
  • the heart rate, brain sensing information, blood pressure value, sweating amount, etc. are measured as a vital sensor, the user's emotion can be estimated from them and used as user information.
  • Information on human relationships at the time of shooting is also useful.
  • information of the type such as an image taken by the customer user himself / herself to be processed, an image taken by a friend of the customer user, an image taken by a family member of the customer user, and an image objectively taken by a surveillance camera.
  • information of the type such as an image taken by the customer user himself / herself to be processed, an image taken by a friend of the customer user, an image taken by a family member of the customer user, and an image objectively taken by a surveillance camera.
  • these user information obtained by the user information providing unit 21 are provided to the device serving as the material content providing unit 20 and added to the image data as metadata, or provided to the server device 10 to be an individual user or. It is managed in relation to the material content.
  • FIG. 3 shows an example of the hardware configuration of the information processing device 70 that can be configured as the server device 10, the computer device 3, the tablet terminal 4, the mobile terminal 5, and the like.
  • the CPU (Central Processing Unit) 71 of the information processing apparatus 70 performs various processes according to the program stored in the ROM (Read Only Memory) 72 or the program loaded from the storage unit 79 into the RAM (Random Access Memory) 73. Run.
  • the RAM 73 also appropriately stores data and the like necessary for the CPU 71 to execute various processes.
  • the CPU 71, ROM 72, and RAM 73 are connected to each other via a bus 74.
  • An input / output interface 75 is also connected to the bus 74.
  • An input unit 76 including an operator and an operation device is connected to the input / output interface 75.
  • various controls and operation devices such as a keyboard, a mouse, a key, a dial, a touch panel, a touch pad, and a remote controller are assumed.
  • the user's operation is detected by the input unit 76, and the signal corresponding to the input operation is interpreted by the CPU 71.
  • a display unit 77 composed of a liquid crystal panel (LCD: Liquid Crystal Display), an organic EL (Electro-Luminescence) display, etc., and an audio output unit 78 composed of a speaker, etc. are connected to the input / output interface 75 as one or as a separate body.
  • LCD Liquid Crystal Display
  • organic EL Electro-Luminescence
  • audio output unit 78 composed of a speaker, etc.
  • the display unit 77 is a display unit that performs various displays, and is composed of, for example, a display device provided in the housing of the information processing device 70, a separate display device connected to the information processing device 70, and the like.
  • the display unit 77 executes the display of various images for image processing, moving images to be processed, and the like on the display screen based on the instruction of the CPU 71. Further, the display unit 77 displays various operation menus, icons, messages, etc., that is, as a GUI (Graphical User Interface) based on the instruction of the CPU 71.
  • GUI Graphic User Interface
  • the input / output interface 75 may be connected to a storage unit 79 composed of a hard disk, a solid-state memory, or the like, or a communication unit 80 that communicates with various communication methods.
  • the communication unit 80 performs communication processing via a transmission line such as the Internet, wire / wireless communication with various devices, bus communication, and the like.
  • a transmission line such as the Internet
  • wire / wireless communication with various devices, bus communication, and the like.
  • the communication unit 80 has at least a function of performing communication via the network 11.
  • a drive 82 is also connected to the input / output interface 75, if necessary, and a removable recording medium 81 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory is appropriately mounted.
  • the drive 82 can read data files such as image files and various computer programs from the removable recording medium 81.
  • the read data file is stored in the storage unit 79, and the image and sound included in the data file are output by the display unit 77 and the sound output unit 78. Further, the computer program or the like read from the removable recording medium 81 is installed in the storage unit 79 as needed.
  • software for processing the present disclosure can be installed via network communication by the communication unit 80 or a removable recording medium 81.
  • the software may be stored in the ROM 72, the storage unit 79, or the like in advance.
  • the server device 10 When the server device 10 is assumed as the information processing device 70, in the information processing device 70, the functional configuration described in FIG. 2 is constructed in the CPU 71 by software (application program).
  • the server device 10 targets a certain customer user as the automatically produced content, and produces a moving content as a personal movie of the customer user.
  • the outline of the story structure as this moving content will be explained.
  • FIG. 4 shows an example of the story structure of the moving content and the corresponding variation.
  • a story structure an example having the following chapters CH1, CH2, CH3, CH4, CH5 while including the origination and transfer is given.
  • Chapter CH1 Past daily life
  • a scene showing what the user was doing on a daily basis is arranged. For example, baseball practice, piano practice, company commuting, friendships, etc.
  • Chapter CH4 Current daily life Place a scene showing the current daily life that has escaped from the negative state. For example, returning to baseball practice, devoting yourself to piano practice, re-transferring, reuniting with friends, etc.
  • Chapter CH5 Main scene Place exciting scenes (impressive scenes) in the story. For example, the scene of returning to the game and playing an active part, the piano recital, the achievements achieved at work, the development of friendships, etc.
  • FIG. 5 shows an outline of the processing flow of the evaluation unit 15, the learning unit 17, and the story generation unit 16 as the functions of the server device 10. It also shows the relationship with the material content providing unit 20, the user information providing unit 21, and the UI unit 22.
  • the material content providing unit 20 provides the server device 10 with images and sounds that can be material content, and metadata associated with these (including user information associated with the material content). Further, user information is provided from the user information providing unit 21.
  • the evaluation unit 15 sets an evaluation value indicating the relationship between the material contents for each material content, and also sets an individual evaluation value for the material content alone.
  • the relevance evaluation value in a certain material content is a value indicating the relevance between the material content and other material contents, and is a value obtained by quantifying the magnitude of the relevance such as causal relationship and time series relationship.
  • the individual evaluation value is a value for evaluating the value of the image itself, the value of the scene, the importance of the content, etc. of the material content itself. For example, if the image content expresses any emotion of emotions, a high evaluation value is set. In addition, a subject taken with the subject as a tracking target is given a high evaluation value as material content for the user of the subject. In addition, if it is an image of a sudden event or an event that does not occur in daily life, it is given a high evaluation value as useful material content in story composition. An image having a positive element or an image having a negative element is given a high evaluation value because it is a material content useful for story composition as positive content or negative content. As for the information of the user's viewing history, whether the user likes it and has watched it many times or does not play it at all indicates the importance, favorite, etc. for the individual user, so it is included in the viewing history. You can set the evaluation value according to it.
  • the evaluation unit 15 sets the relevance evaluation value and the individual evaluation value for each material content associated with the user for each user who becomes a customer, for example, as described above. These settings can be made by comprehensively reflecting the judgment result of the scene content by the image analysis, the image quality, the user information, and the like.
  • the story generation unit 16 performs a process of generating personal emotional content for a certain user based on some trigger. For example, the story generation unit 16 sets a story in which the customer user himself / herself or his / her family plays a leading role, and collects material contents that can be used as each scene constituting the story as candidate contents. Then, for each candidate content, an operation using the evaluation value (evaluation function operation) is performed, and the material content to be actually used as the moving content is selected. Then, editing processing is performed using the selected material content, and for example, a moving content such as a movie in which a customer user or his / her family plays a leading role is generated.
  • the moving content produced in this way is provided to the user side and can be viewed by the user by the UI unit 22.
  • Step ST1 Shooting of moving images and still images as material content
  • Step ST2 Transfer of material content from the user side to the server device 10 (enabled by the server device 10)
  • Step ST3 Saving and managing the material content on the server device 10 side
  • Step ST10 Concept of the story of the moving content
  • Step ST20 Selection of the material content according to the set story-Step ST30: Image quality processing of the material content Post-processing such as cutting out and scenes, and editing such as joining the processed material contents.
  • Step ST40 Providing moving content to the user side (viewing on the user side)
  • steps ST10, ST20, and ST30 are the processes for automatic content production by the story generation unit 16.
  • FIG. 6 shows various workflow examples. Workflows WF1 and WF2 show up to the collection of material contents.
  • a user takes a moving image using a camera 2 or the like, the moving image data is transferred to the server device 10, and a database for the user (hereinafter, the database is referred to as “DB”) is generated.
  • DB database for the user
  • the material content for the user can be used.
  • Workflow WF2 is a state in which images of a user are collected by a method other than shooting by the user and managed in a DB of the user in the server device 10, so that the image can be used as material content for the user.
  • This is an example. In this case, it is assumed that the image collection is taken by another user or collected as public data. This is an example of collecting material content in a wider range, not just the material content taken by the user himself.
  • Workflow WF3 to Workflow WF8 show an example of automatic content production by the story generation unit 16.
  • the workflow WF3 is started by a user's request for production of moving content or the status of predetermined material content as a trigger. First, a story is conceived for a certain user, and then the material content is extracted according to the structure of the story by referring to the DB of the user. Then, the material content to be used is selected, and the editing process is performed to generate the moving content.
  • a production request from the user is assumed.
  • the user presents information indicating what kind of content is desired, such as specifying the theme, title, specific material content, etc. of the moving content, and the server device 10 automatically generates the moving content based on the information.
  • the server device 10 sets the story accordingly, and the material content of the scenes before and after is selected to create the moving content.
  • a trigger for the automatic production of moving content for example, a message from the server device 10 side to the user "Would you like to produce content like XX?" It is also possible to recommend, and start production when requested accordingly. For example, depending on the collection status of the material content, it is possible to send a message "How about making a movie of the child's athletic meet?" When the material content of the user's athletic meet is collected. Further, when there is a certain negative content, in the situation where the corresponding positive content can be acquired, the story as shown in FIG. 4 above can be constructed. Therefore, in such a situation, the content is created. It is also conceivable to recommend to the user and start automatic production according to the user's response.
  • the user when there is material content that the user has forgotten, for example, an image that was shot old or an image that the user rarely watches, the user is asked to create content according to the content of the image. It is also possible to recommend and start automatic production according to the user's response. Similarly, if there is an image when the user starts a new activity, a place where he went for the first time, an image taken at a place where he went for the first time in a long time, etc., he recommends the user to create content according to the content of the image. It is also conceivable to start automatic production in response to the user's response.
  • these messages are transmitted by e-mails, SNS messages, etc. to users registered in the service, and terminal devices of users who have installed applications for providing services (computer devices 3, tablet terminals 4, mobile terminals 5, etc.). It is conceivable that this is done by displaying on the application screen in the above, push notification, or the like.
  • a trigger for the automatic production of moving content for example, it is possible to automatically set the theme and title from the content of the material content and automatically start the production of moving content without waiting for the user's request. Will be.
  • Workflow WF4 also conceives a story about a certain user in response to a trigger such as a request from the user, and then refers to the DB of the user and extracts material content according to the structure of the story. This is an example when the material content is insufficient.
  • a shooting instruction to the user some kind of automatic shooting, or the like is executed to collect images of the missing scenes.
  • the editing process is performed to generate the moving contents.
  • the shooting instruction to the user may be, for example, a message to the user to notify the user such as "Please shoot a scene like XX".
  • the instruction for automatic shooting may be an instruction to shoot a predetermined scene to a robot owned by a user, a household device, or the like, or an instruction to a device of a photographer.
  • Workflow WF5 is an example of automatic production of moving content based on event information. It checks user attribute information, schedule data, SNS information, etc., detects that a specific event has occurred, and plans a story. Then, referring to the DB of the user, the material content is extracted according to the composition of the story, the material content to be used is selected, and the editing process is performed to generate the moving content.
  • Judgment of start of automatic production based on event information is to detect expected events such as birthday party, Mother's Day, date of event of interest, etc. from birthday, gender, preference, etc. as user attribute information, for example. Is possible.
  • expected events such as birthday party, Mother's Day, date of event of interest, etc. from birthday, gender, preference, etc.
  • user attribute information for example.
  • it is possible to detect the occurrence of a specific event for example, an event such as homecoming, travel, or date.
  • an event for example, an athletic meet, etc. by image analysis of an image provided as material content.
  • Workflow WF6 is an example of automatically producing moving content based on event information, but it shows the case where the material content is insufficient. It checks the user's schedule data, SNS information, etc., detects that a specific event has occurred, and plans a story. Next, the material content is extracted according to the story structure by referring to the user's DB, but when the material content is insufficient, a shooting instruction to the user or some automatic shooting is executed as the material content complementing process. By doing so, collect images of the missing scenes. After that, when the necessary material contents are prepared, the editing process is performed to generate the moving contents.
  • the workflow WF7 shows another example of the material content complement processing when the material content is insufficient as in the workflow WF4 (or WF6). This is an example of collecting from other DBs or creating necessary images instead of instructing new shooting when the material content corresponding to the set story is insufficient. For example, the material content is searched by referring to the family DB, friend's DB, public DB, etc. of the target user, or the image of the scene required for image composition / fake image is generated.
  • the workflow WF8 is an example in which, for example, the workflow WF3 is added with a process of feeding back the user's evaluation at the time of viewing.
  • the user can perform some kind of evaluation operation when the content is actually delivered as a work, or when the user is allowed to try and view the content before the final delivery.
  • the feedback information according to the operation is reflected in the content automatic production process such as story concept, material content selection, and editing (scene order, etc.).
  • FIG. 5 shows that the learning unit 17 learns about the feedback information dFB and reflects the learning result in the processing of the story generation unit 16. This may be reflected in the work of modifying the moving content this time, or may be reflected in the subsequent production of the moving content after learning the preference of the user. In other words, it is an example of using feedback from the user to make the story concept, material content selection, and editing method specialized for the user.
  • the workflow WF8 it is explained that the user evaluation when viewing the moving content is fed back, but it is also possible to feed back the evaluation and the relationship of the material content.
  • the relevance evaluation value and the individual evaluation value are set for each material content, and further, the evaluation unit 15 relates the individual material content to other material content.
  • the relevance presentation information for presenting the evaluation value it is conceivable to set the relevance presentation information for presenting the evaluation value to the user.
  • FIGS. 7, 8, 9, and 10 show examples of display contents based on the relevance presentation information. These are cases where, when there are material contents (CT1, CT2 7) as material contents registered in the DB for a certain user, the relevance and evaluation values of those material contents are shown to the user. This is a display mode.
  • each material content is indicated by "CT1" and "CT2" in a circle, but in reality, it is conceivable to arrange a thumbnail image showing the image content of each material content. Further, for example, the moving image may be played in response to a mouse over or a click. In any case, it is desirable to display the image contents of each material content so that the user can easily recognize them.
  • Each material content is displayed so that the individual evaluation value can be recognized, for example, in a numerical value of 10 steps.
  • a numerical value such as “10” is attached to the material content CT1 and “7” is attached to the material content CT2, and the individual evaluation value set for each material content can be recognized.
  • the high or low of the individual evaluation value for each material content may be recognized by the difference in the size, form, color, brightness, arrangement position, etc. of the image expressing the material content.
  • the relevance evaluation value is shown by the difference in the display mode such as the number of lines, the color of the line, the thickness of the line, and the type of the line. It is conceivable that the more closely related the material contents are, the stronger the connection is expressed. In the example of FIG. 7, the material contents CT1 and CT2 are highly related, the material contents CT4 and CT8 are relatively lowly related, the material content CT9 is not related to other material contents, and the like. Is expressed by the number and type of lines indicating the connection, or the presence or absence of lines. Of course, the relevance evaluation value may be expressed by adding a numerical value to a line indicating the perspective, direction, or connection of the arrangement position of each material content.
  • the evaluation unit 15 generates relevance presentation information for displaying such an image and provides it to the story generation unit 16.
  • the story generation unit 16 can provide such relevance presentation information to the user side and have the user present it by the UI unit 22.
  • the user can confirm the display content as shown in FIG. 7 by the UI unit 22 and correct the evaluation by the operation.
  • the individual evaluation value of the material content that the user himself / herself is an image of an important scene or a favorite image is corrected to a high value, or the material content that is related but is evaluated to be less relevant. It is possible to operate the interval so that it has a higher relevance evaluation value, or to cut a line that is evaluated to be related even though it is not related.
  • Such operation information is fed back to the server device 10 side as the feedback information dFB shown in FIG. 5, so that the evaluation information by the evaluation unit 15 can be corrected. Further, such feedback information dFB is also input to the learning unit 17 and learned, and is reflected in, for example, a function for selecting material content by the story generation unit 16.
  • the individual evaluation value and the relevance evaluation value are expressed for each material content, but only the relevance based on the relevance evaluation value may be expressed, and each individual evaluation value is presented. It may be something to do. That is, the relevance presentation information may be any information that can present some information such as evaluation and relevance regarding the material content to the user. Further, it is desirable that a user interface is formed so that the user can perform an operation for providing the feedback information dFB for all or a part of the presented contents.
  • FIG. 7 above is an example showing the relationship between the material contents
  • various display modes of the relationship can be considered.
  • FIG. 8 is an example of presenting a key element and showing the material content related thereto.
  • “joy”, “anger”, “sorrow”, and “comfort” are used as key elements, and the material contents CT1 and CT2 corresponding to "joy”, and the material contents CT7, CT8, and “sorrow” corresponding to “anger” are used.
  • FIG. 9 is also an example of presenting a key element.
  • a certain event for example, a piano presentation
  • the material contents CT1, CT2, CT3, CT4, CT5 related to the event are presented.
  • the material contents CT6, CT7, CT8 and the like related to the event-related material contents CT4 and CT5 are also presented.
  • FIG. 10 is an example of using a complex key element.
  • key elements "family”, “friends”, etc. in human relationships with user A are presented, and “soccer” as a hobby of user A is also presented, and material contents and materials related to these human relationships and key elements are presented. This is an example of presenting the relationship between contents.
  • FIG. 11 shows an automatic production process of moving contents by an information processing device as a server device 10.
  • the server device 10 determines the production start according to the trigger.
  • This trigger is the process of determining the start in response to the request reception from the user described in the workflow WF3 of FIG. 6, and the process of determining the start in response to the event or the like described in the workflow WF5.
  • step S102 the server device 10 performs story setting processing of the moving content to be produced this time.
  • a detailed example of the story setting process is shown in FIG.
  • step S120 of FIG. 12 the server device 10 performs a story assembly process as illustrated in FIG. 4, for example, and also performs a material content selection process to be applied to each scene constituting the story.
  • the story assembly is a process of setting the origination and transfer of an event of a certain theme and assembling the settings such as those from chapter CH1 to chapter CH5 in FIG. Also, select one or more material contents to be used for each chapter. For example, among the material contents stored in the DB corresponding to the user who is the target of moving content production, candidate contents that are likely to be applicable to the scenes of each chapter (for example, one chapter is composed of one or a plurality of scenes). To extract.
  • step S120 when the hobbies and tastes of the user and his / her family can be determined from the user information, it is effective to extract the material content as an image that matches the hobbies of the user and the like. Then, the material content to be used for each scene is selected from the candidate contents. Of course, it is desirable to reflect the tastes of users and the like in this selection as well. A more specific processing example of such step S120 will be described later with reference to FIG.
  • step S121 After setting the story and selecting the material content accordingly in the process of step S120, the server device 10 determines in step S121 whether or not there is a shortage of the material content. If it is determined that the story can be set in the process of step S120 and that all the necessary material contents have been prepared, the process proceeds to step S124 to determine that content completion is unnecessary (for example, the completion flag is turned off), and the process of FIG. To finish. That is, the process proceeds from step S102 in FIG. 11 to step S103.
  • the server device 10 determines in step S103 that material content completion is unnecessary, proceeds to step S105, and performs editing processing.
  • the server device 10 uses the chapter configuration set in the story setting process and the selected material content to generate moving content that constitutes a series of stories. For example, after cutting out the necessary scenes, adjusting the image quality, and adding image effects from the video as each selected material content, the material content is stitched together as the chapter progresses.
  • the server device 10 When the moving content is completed by such an editing process, the server device 10 performs a process of providing the moving content to the user side in step S106.
  • the user can watch the movie by downloading it as moving content or by streaming it.
  • the above is the processing procedure in the case as illustrated in the workflows WF3 and WF5 of FIG.
  • step S121 of FIG. 12 it may be determined that the material content is insufficient. For example, there is no material content to be applied to a certain scene. Alternatively, although there is material content that fits a certain scene as the content, it is appropriate because the evaluation value (individual evaluation value or relevance evaluation value) is low and it is not suitable for use, or the image quality is low. In some cases, it may be determined that there is no material content.
  • the server device 10 determines that the material content shortage is within an acceptable range, the process proceeds from step S122 to step S124, and similarly to step S105 in FIG. 11.
  • the server device 10 will proceed to step S123 in FIG. Determine if the story can be changed. For example, the server device 10 evaluates the importance of a scene lacking material content in the story, the possibility of partial change of the story in a chapter, and the like, and whether or not the story can be changed. Is determined. The user's preference based on learning may be added to the determination factor. For example, if the user this time can evaluate that such a scene is not important, the story can be changed.
  • step S123 If the story can be changed, return from step S123 to step S120 to assemble the story and select the material content again.
  • step S123 determines that material content complement processing is necessary. (For example, turn on the completion flag) to finish the process of FIG. That is, the process ends in step S102 in FIG. 11 and proceeds to step S103.
  • step S104 executes the material content completion process. That is, such a case is the situation described in the workflows WF4 and WF6 of FIG.
  • FIG. 13 is an example of performing a process of requesting an external device to record the material content constituting the story as the material content complement process.
  • the server device 10 performs a process of requesting an external device to record the material content, that is, to record an image or the like by shooting.
  • the external device is various devices shown in FIG. 1, and is a device corresponding to the material content providing unit 20 of FIG.
  • the server device 10 transmits, as a message to the user, a request content such as "Please shoot a moving image of the scene of XX" to the mobile terminal 5 or the like which is an external device. It is also conceivable to send a request message "Please shoot a video of Mr. A's XX scene" to the mobile terminal 5 of the user's family or friends.
  • the server device 10 may transmit control information instructing the application of the mobile terminal 5, the agent device 8, the robot, the surveillance camera 9, and the like to capture or provide a target scene.
  • the material content of the necessary scene is recorded for some external device and transferred to the server device 10 (so that it can be used as the material content for producing the moving content). It is a process to request or instruct.
  • the server device 10 After performing the request processing in step S140, the server device 10 waits for the input of the material content in step S141. While waiting for the input of the material content, the server device 10 checks for a timeout or input of the material content in step S142, and waits for the timing of re-request in step S143. For example, one week has passed since the request, and the time-out is set, and the request is re-requested at a predetermined timing before the time-out is reached.
  • the server device 10 If it is time to re-request before the time-out deadline, the server device 10 returns to step S140 and performs the material content request process again.
  • the request processing may be the same as the previous one, or the external device of the request destination may be changed or the content of the request may be changed.
  • the server device 10 ends the material content complement processing from step S142.
  • step S104 of FIG. 11 After performing the material content complementing process as shown in FIG. 13, for example, in step S104 of FIG. 11, the process returns to the story setting process of step S102.
  • the process described with reference to FIG. 12 is re-executed, but if the necessary material content can be acquired, the server device 10 newly acquires the scene in which the material content is insufficient in step S120. It suffices to perform the process of satisfying the material content.
  • the material content complement processing has timed out, if the input material content cannot be applied in terms of quality, or if it is determined that the scene content is not appropriate, it is conceivable to start over from the story assembly.
  • step S121 or step S122 to step S124 as a result of performing the process of step S120 of FIG. 12 through the material content complement process as shown in FIG. 13, the process of FIG. 11 is the editing process of step S105. It will proceed and emotional content will be generated.
  • FIG. 14 shows another example of the material content complement processing. This is an example of expanding the target for extracting the material content prior to requesting the material content from an external device.
  • the server device 10 refers to a DB associated with another person suitable for the user to be produced this time or a public DB based on the user information, and is a material that can be applied to a scene in which the material content is insufficient. Performs the process of searching for content. For example, basically, in step S120 of FIG. 12, the material content is extracted from the DB associated with the user to be produced. When the material content is insufficient, the target for searching the material content is expanded to a DB about another person or a public DB.
  • the other person is a family member, a friend, a colleague, etc. of the target user based on the user information.
  • the DB associated with another person is a DB that manages images taken by a person corresponding to these "others" in the service.
  • step S151 the server device 10 determines whether or not the material content required this time can be found from the DB associated with another person or the public DB, and if it can find it, ends the material content complementation process, and the figure shows the figure. The process proceeds to step S102 of 11.
  • step S151 of FIG. 14 If it is determined in step S151 of FIG. 14 that the necessary material content could not be found, the server device 10 proceeds to step S152 and performs material content request processing for the external device. Then, the process of waiting for input in step S153, inputting or timing out the material content in step S154, and waiting for re-request in step S155 is performed.
  • the processing of steps S152 to S155 is basically the same as the processing of steps S140 to S143 of FIG.
  • step S152 it is conceivable to request the material content in consideration of the hobbies / preferences of the user and his / her family, for example, what kind of image the user prefers. ..
  • the hobbies and tastes of the user and his / her family can be determined from the user information, it is requested to shoot an image content that matches the user's hobby, or a scene or image content that is determined or presumed to be preferred by the user. do.
  • Send a recommendation message like this This makes it easier to obtain material content that the user likes.
  • the range of the DB for searching the material content before performing the material content request processing for the external device it is possible to increase the possibility that the material content can be satisfied quickly.
  • an image captured by another person it can be expected that the range of the content will be expanded, for example, an image having an angle of view that the user does not intend may be inserted into the moving content.
  • FIG. 15 is another example of the material content complement processing.
  • the server device 10 refers to a DB or a public DB associated with another person suitable for the user to be produced this time based on the user information, and is a material that can be applied to a scene in which the material content is insufficient. Performs the process of searching for content. This is the same process as step S150 in FIG.
  • step S161 the server device 10 determines whether or not the material content required this time can be found from the DB associated with another person or the public DB, and if it can find it, ends the material content complementation process, and the figure shows the figure. The process proceeds to step S102 of 11.
  • the server device 10 proceeds from step S161 to step S162 to perform fake image and cutout image acquisition processing.
  • the fake image here means that it is not an image in which the subject is actually photographed, and refers to a composite image, a CG image, an animation image, or the like.
  • the server device 10 generates an image necessary for the scene by image composition processing, CG processing, or the like.
  • the server device 10 instructs an external device to execute such image generation, and acquires the generated image.
  • the server device 10 cuts out a part of the image of the other material content to obtain the material content adapted to the scene. For example, it is assumed that a scene in which the corresponding user is shown is cut out from an image of a surveillance camera or an image captured by another person.
  • the server device 10 By performing these processes, the server device 10 generates the missing material content and uses it for the corresponding scene.
  • the server device 10 ends the material content complementation process through the process of step S162, and proceeds to step S102 of FIG.
  • step S162 of FIG. 15 may be executed when a time-out occurs, for example, when the material content request process for the external device is performed in FIG. 13 or FIG. 14.
  • FIGS. 11 to 15 The processing of FIGS. 11 to 15 described above has been described as processing after starting the production of the moving content, but it is also possible for the server side to seize the production opportunity of the moving content and recommend the image imaging or the like to the user. .. An example of processing in such a case will be described.
  • FIG. 16 is an example in which the server device 10 determines the recommendation time for the user based on the user information and performs the material content complement processing.
  • step S201 the server device 10 determines the recommendation time for acquiring the material for the moving content according to the event that occurs in the future. For example, as in the case of the production trigger described in the workflows WF5 and WF6 of FIG. 6, the event that becomes the production opportunity of the moving content is checked based on the event information, the schedule information, and the like. Then, it is determined whether or not it is a recommendation opportunity for shooting an image or the like used for producing such moving contents. Further, even if it is not an event or the like, the recommendation opportunity may be determined according to the life stage of the user. For example, we check information such as age progress, changes in family structure, marriage and childbirth, make life stage milestones an opportunity to create moving content that commemorates it, and judge timing close to that as a recommendation opportunity. ..
  • the server device 10 determines that the recommendation time is a time before an event that can be a material, such as one week before a child's athletic meet or three days before the wedding of the target user for a certain target user.
  • step S202 the server device 10 proceeds from step S202 to step S203, and performs material content complement processing for future impression content production.
  • This material content complementation process is basically a process of requesting the user to "take a picture of such a scene" at an event or the like in which the user will participate.
  • FIG. 17 shows an example of the material content complement processing in step S203.
  • the server device 10 refers to the recommended user information, and searches for matching content (material content or moving content) by referring to another person or a public DB. For example, for the target user, when next week is a children's athletic meet, the contents of another person's athletic meet are extracted. In this case, the "other person" does not have to be a person related to the user, and may be a target for widely referencing the DB of a completely unrelated person.
  • the server device 10 analyzes highly evaluated scenes, image contents, and the like in the extracted contents of another person, and identifies an emotional element.
  • the evaluation can use feedback information dFB for moving content, evaluation value of material content, etc., and is a general standard for high scenes, angles of view, etc. that are often used in similar events (for example, athletic meet). It may be an evaluation.
  • the target user when next week is a children's athletic meet, the contents of another person's athletic meet are referred to, and highly evaluated scenes and image contents are specified and used as moving elements.
  • step S222 the server device 10 generates shooting recommendation data based on the analysis of step S221.
  • shooting recommendation data is generated using text or image data as information including shooting methods, advice, etc., according to highly evaluated scenes, angles, and the like.
  • the server device 10 performs the material content request process.
  • it is a process of transmitting the shooting recommendation data together with the recommendation content to the user's mobile terminal 5 or the like. For example, along with the recommendation message "Next week, it's a children's athletic meet. Would you like to create content?", We will send the shooting recommendation data generated by referring to the contents of others as a shooting method at the athletic meet.
  • FIG. 18 also shows an example of the process of step S203 of FIG.
  • the server device 10 performs a process of assembling a tentative story based on the event information for recommending. Then, in step S231, the server device 10 sets what kind of material content is required as a scene according to the set provisional story, and generates shooting recommendation data indicating the content of such a scene.
  • step S232 the server device 10 performs the material content request process.
  • information that presents the content of the scene is transmitted to the user's mobile terminal 5 or the like as shooting recommendation data. For example, along with the recommendation message "Next week, it's your live stage. Would you like to create content?" To present.
  • evaluation and feedback of material content > Subsequently, the evaluation of the material content and the feedback processing in the server device 10 will be described. As described above with reference to FIG. 5, the evaluation unit 15 sets the relevance evaluation value and the individual evaluation value for the material content. Further, the corresponding processing, that is, the evaluation value updating processing is performed according to the feedback information dFB from the user.
  • FIG. 19 shows a material content evaluation process performed by the server device 10 by the function of the evaluation unit 15.
  • step S300 the server device 10 confirms the input of the feedback information dFB regarding the material content. If there is feedback information dFB, feedback handling processing is performed in step S320. This will be described later.
  • step S301 the server device 10 proceeds to step S301 to specify the material content to be processed.
  • material content that has been saved but has not been evaluated, such as newly uploaded material content, is specified as the target of this evaluation process.
  • the material content for which the evaluation value has already been set may be subject to processing in order to perform the evaluation process again according to the passage of time or the like.
  • the server device 10 calculates an individual evaluation value for the material content targeted for evaluation processing.
  • the individual evaluation value is a value for evaluating the value of the image itself or the scene of the material content itself, the importance of the content, and the like. For this reason, the server device 10 performs image analysis, analysis of user information, etc., and whether it is applicable to emotions, whether or not it is a tracking target (focus target) at the time of imaging, and whether the image content is a sudden event. Whether or not the image has a positive element, whether or not the image has a negative element, the number of views as the user's viewing history, etc. are used as indicators to calculate the individual evaluation value by a predetermined calculation. do.
  • the hobbies / preferences of the user or his / her family can be determined from the user information, it is desirable to reflect the hobbies / preferences of the user or his / her family in the evaluation value. For example, a high individual evaluation value is set for an image that matches a hobby, or an image that is determined or estimated to be a scene or image content preferred by the user.
  • step S303 the server device 10 sets a key element for the material content.
  • set key elements such as specific emotions, different parties, and event titles. These can be set by referring to the analysis result of the image content, the user information, the metadata added to the image, and the like.
  • step S304 the server device 10 extracts the related material content using the key element. For example, other material contents taken at the same event as the material contents to be evaluated, and other material contents taken about the same specific related person (for example, a child) as the material contents to be evaluated are extracted.
  • the server device 10 calculates the relevance evaluation value for the material content to be evaluated.
  • the degree of relevance between key elements and common material contents is quantified to calculate the relevance evaluation value.
  • the degree of relevance can be determined or estimated from the image contents such as the causal relationship of the event, the time series relationship, and the existence of a person or an article related to the event. If the hobbies / preferences of the user or his / her family can be determined from the user information, it is desirable to reflect the hobbies / preferences of the user or his / her family in the evaluation value.
  • a high relevance evaluation value is set between the images related to the user's hobby, or the material contents that are determined or estimated to include the scene or image content that the user likes. To do so.
  • step S306 the server device 10 generates or updates the relevance presentation information. This involves, for example, a process of newly generating the relevance presentation information as described with reference to FIGS. 7 to 10, a process of incorporating the material content to be evaluated this time into the existing relevance presentation information, and the like.
  • step S307 the server device 10 saves the calculated individual evaluation value, relevance evaluation value, and key element for the material content to be processed. This ends the evaluation process.
  • the server device 10 When the feedback information dFB regarding the material content is input, the server device 10 performs, for example, the process shown in FIG. 20 as the feedback response process in step S320.
  • step S321 the server device 10 identifies the material content to be fed back.
  • step S322 the server device 10 determines whether or not the individual evaluation value needs to be corrected based on the feedback information dFB for the material content identified as the feedback pair. If necessary, the server device 10 proceeds to step S323 and updates the individual evaluation value.
  • step S324 the server device 10 determines whether or not the individual evaluation value needs to be corrected based on the feedback information dFB for the material content specified as the feedback target. If necessary, the server device 10 proceeds to step S325 to update the key element set for the material content.
  • step S326 the server device 10 determines whether or not the relevance evaluation value needs to be corrected based on the feedback information dFB for the material content specified as the feedback target. If necessary, the server device 10 proceeds to step S327 and resets the related material content for the material content. That is, it is other material content whose relevance is presented by the relevance presentation information. In step S328, the server device 10 calculates and updates the relevance evaluation value with other newly set related material contents. In step S329, the server device 10 updates the relevance presentation information in response to the renewal of other related material contents and the relevance evaluation value between them.
  • the evaluation value set by the evaluation unit 15 of the server device 10 is sequentially updated according to the feedback information dFB from the user.
  • the feedback information dFB from the user is not only reflected in the evaluation value of the material content, but also reflected in the production of the moving content. 21 and 22, the process of step S120 in the story setting process described above with reference to FIG. 12 will be described in detail, and an example of reflecting the feedback information dFB will be described.
  • the server device 10 specifically performs the processing as shown in FIG.
  • step S401 the server device 10 assembles the story.
  • the story is supposed to be assembled as shown in the example of FIG.
  • a story is assembled by arranging the composition corresponding to Kish ⁇ tenketsu.
  • a provisional story is assembled in step S230 of FIG. 18 for a certain event, it is advisable to assemble the story based on that. This is because it is assumed that the user may provide material content suitable for the scene of the event.
  • step S402 the server device 10 collects candidate contents. That is, for each chapter constituting the story, one or a plurality of candidate contents to be used are collected from the DB or the like of the user to be produced. At this point, a plurality of material contents may be used as candidate contents as candidates to be used for one scene. For example, regardless of the evaluation value, candidate contents are collected based on the scene contents, user information, metadata, and the like.
  • step S403 the material content to be used for each scene constituting the story is selected.
  • a method of selecting material content having a high individual evaluation value from a large number of candidate contents for one scene may be used, but it is desirable to reflect the relevance in a more multifaceted manner.
  • the relevance evaluation value between the selected material contents is also reflected, and a plurality of material contents as the selection result are optimized.
  • the combination of material contents, order, time length, etc. are also factors for selection.
  • the material content to be used for each scene constituting the story is selected by using the evaluation function including the elements such as the individual evaluation value, the relevance evaluation value, the time length, and the order.
  • the evaluation reflects the user's family preference (what kind of image, scene, etc.) that can be judged or estimated from the user information. By setting the value, the user's preference can be easily reflected as the material content applied to the scene.
  • step S404 the server device 10 generates edit data based on the selection result of the material content in step S403.
  • the edited data includes information on the selected material content, information on the order in which the material content is joined, information on processing (image quality adjustment, cutting out, effects, etc.) for each material content, and the like. That is, it is design information for producing moving contents.
  • step S120 such a process is performed as step S120 in FIG. 12, and later, an edit process based on the edit information is executed in step S105 in FIG.
  • the processing of FIG. 22 can be performed by the functions of the learning unit 17 and the story generation unit 16.
  • the server device 10 advances the process of FIG. 22 from step S420 to step S421. If the feedback information dFB requests a change in the story of the moving content currently being produced, the process proceeds from step S421 to step S401 in FIG. 21 to reassemble the story. For example, it is assumed that some scenes are cut or replaced based on the feedback information dFB. It should be noted that the feedback information dFB for the moving content being produced is assumed to be transmitted according to the user operation, for example, when the server device 10 temporarily displays the moving content to the user before the main delivery of the moving content. Will be done. When the feedback information dFB is the content requiring the change of the material content this time, the server device 10 proceeds from step S422 in FIG. 22 to step S403 in FIG. 21. As a result, the selection of the material content in step S403 is redone.
  • the feedback information dFB is not always reflected in the moving content being produced.
  • it may be feedback information dFB for presentation by relevance presentation information.
  • the server device 10 proceeds from step S423 to step S424 to learn / update the evaluation function.
  • some coefficients and variable elements of the evaluation function used when creating moving contents are updated for the user.
  • the direction of material content selection in step S403 of FIG. 21 and the elements to be emphasized are corrected. That is, the material content selection process is also adapted according to the user's preference.
  • the story generation unit 16 includes a function of substituting for the evaluation unit 15, and generates moving contents while evaluating, classifying, and extracting material contents.
  • the story generation unit 16 performs deep learning based on various information about the user, and generates a learning model suitable for the user. Then, a learning model is applied to each material content to classify and extract it, and it is determined whether or not the material content can be applied to the story, and then the material content determined to be related is used to generate moving content.
  • the learning model generation function and the content generation function using the learning model are provided as the evaluation unit and the story generation unit 16. Further, as the learning unit 17, re-learning is performed based on the feedback information dFB of the user, and the learning model is updated, which is suitable for generating more desirable moving content.
  • Negative / Positive Content Management Some material content can be classified as negative content or positive content. Negative content is usually assumed to be less content that the user wants to watch. However, as described in FIG. 4, considering that the story is composed as personal content or the like, the negative content can be useful material content for enhancing the impression at the time of viewing. On the other hand, considering, for example, a form in which the server device 10 functions as a cloud storage and provides a storage area for an individual user in the storage 10a, the user can easily view the negative content as well as other material content. It may be undesirable.
  • the negative content is separated from other material content and stored and managed by the function of the storage management unit 18.
  • a remote storage 12 whose accessibility is not ensured from the user or which is inferior in accessibility to the storage 10a even from the server device 10 is prepared, and negative contents are stored there.
  • FIG. 23 shows the material content management process performed by the server device 10 by the function of the storage management unit 18.
  • the server device 10 specifies the material content to be processed.
  • the server device 10 determines whether or not the material content to be processed is negative content. Whether or not it is negative content may be determined by some processing. For example, if there is user vital information at the time of shooting as metadata accompanying the image, it may be determined whether or not negative emotions are generated based on the metadata, and the user's facial expression, behavior, gesture, etc. by image analysis may be determined. It can also be estimated from. The fact that the user does not browse may be regarded as a negative factor and added to the judgment factor. Further, a feature different from other everyday images may be regarded as a negative element and added to the judgment element. It is also possible to presume that some kind of negative event has occurred when there is an interval between the daily image and the daily image, and add it to the estimation element as it is likely that a negative element is likely to exist in the image at such an interval time. Conceivable.
  • step S502 If it is determined in step S502 that the content is not negative, the server device 10 proceeds to step S503 and normally saves the material content. For example, it is stored in the storage 10a so as to be managed by the DB associated with the corresponding user.
  • step S502 If it is determined in step S502 that the content is negative, the server device 10 proceeds to step S504 and performs a storage process corresponding to the negative content for the material content. For example, in the remote storage 12, it is saved so as to be managed by the DB associated with the corresponding user.
  • the storage in the remote storage 12 is taken as an example, and the following storage can be considered as the remote storage 12.
  • the storage device / storage 10a connected to the storage device / standalone device accessible via a low-rate communication path is connected from the server device 10 via the first network, whereas the remote storage 12 is connected to the first from the server device.
  • Storage device connected by a second network whose communication speed is slower than that of
  • step S504 is not necessarily limited to recording in the remote storage 12.
  • the negative content may be stored in the storage 10a as in the case of other material content.
  • accessibility is distinguished by performing hierarchical management that makes access difficult, encryption, or setting access permission only for specific authorized persons.
  • the above process of FIG. 23 is an example of storing and managing the negative content separately from other material contents, but the negative content, the positive content, and other material contents may be managed separately.
  • the accessibility of the negative content is lowered by dividing the storage, but the accessibility of the positive content and other material contents may be the same.
  • the positive content and other material content are similarly stored in the DB of the corresponding user in the storage 10a, but in the case of the positive content, a flag indicating that the content is positive may be set.
  • all the material contents may be divided into negative contents and positive contents. For example, content that does not correspond to negative content may be managed as positive content.
  • negative content is managed separately, but since negative content is useful when it is desired to be used as a material for producing moving content, it is desirable to change the management state according to the situation. Therefore, it is conceivable to perform the processing as shown in FIG.
  • the sequential storage process in step S520 indicates, for example, a process in which the server device 10 sequentially stores the material content in the process of FIG. 23, for example, in response to the upload of the material content.
  • step S521 the server device 10 confirms whether or not the material content saved this time is positive content. If it is not positive content, that is, if it is negative content, or if it is material content that is neither negative content nor positive content, the process of FIG. 24 ends.
  • step S522 search for negative content related to the positive content this time. For example, if the positive content this time is such that the user played an active part in a baseball game, a process is performed to search for negative content of a scene in which the user was injured during practice in the past.
  • step S523 If the corresponding negative content cannot be found, the process is completed from step S523, but if the corresponding negative content is found, the server device 10 performs a process of changing the management state of the negative content in step S524. For example, a process for improving accessibility for the server device 10 is performed, such as moving the storage device from the remote storage 12 to the storage 10a.
  • the negative content managed as the storage corresponding to the negative content in step S504 of FIG. 23 may not be entered as the candidate content in the process of the story generation unit 16.
  • negative content is not unconditionally used for creating moving content.
  • step S524 when the corresponding positive content exists, it is conceivable to change the management state of the negative content so that the qualification that can be regarded as the candidate content is given. In other words, it is possible to use it for moving content production for the first time because it became important in the story to complement the positive content.
  • step S525 the server device 10 updates the evaluation value of the negative content according to the relationship between the negative content and the positive content saved this time. That is, the relevance evaluation value and the individual evaluation value are recalculated and updated.
  • the negative content corresponding to the positive content can create or increase the possibility of being applied to a certain scene in the production of moving content. This can be expected to enhance the story of emotional content that is automatically produced using appropriate negative content.
  • FIG. 25 is also a processing example to the same effect.
  • the sequential storage process in step S530 indicates, for example, a process in which the server device 10 sequentially stores the material content in the process of FIG. 23, for example, in response to the upload of the material content.
  • step S531 the server device 10 confirms whether or not the material content saved this time is negative content. If the content is negative, the process of registering the negative event is performed in step S532. For example, information about when and what kind of negative event occurred for a certain user is registered as one of the user information.
  • step S531 determines in step S531 whether or not the material content saved this time is positive content corresponding to the negative event registered in the past. If the material content saved this time is positive content related to a negative event registered in the process of step S532 in the past, the server device 10 proceeds to step S534 to the registered negative event. Performs the process of changing the management status of related negative content. For example, a process for improving accessibility for the server device 10 is performed, such as moving the storage device from the remote storage 12 to the storage 10a. In this case as well, it is conceivable that the server device 10 is changed to the management state so that the negative content is given the qualification that can be regarded as the candidate content.
  • step S535 the server device 10 updates the evaluation value of the negative content according to the relationship between the negative content and the positive content saved this time. That is, the relevance evaluation value and the individual evaluation value are recalculated and updated.
  • the negative content corresponding to the positive content can be applied to a certain scene in the production of the moving content, or can be enhanced.
  • the server device 10 as the information processing device of the embodiment includes a story generation unit 16 that performs a process of requesting an external device to record the material contents constituting the story for the emotional contents to be automatically produced (from FIG. 11). See FIG. 18). This process is useful for collecting materials for emotional content that features the personal behavior, experience, etc. of the customer's user in the story. In particular, by making a specific request such as what kind of scene you want to shoot, it becomes suitable for collecting material contents.
  • the story generation unit 16 sets the story of the moving content, selects the material content to be used, performs the story setting process for determining the shortage of the material content, and determines that the material content is insufficient.
  • An example of performing a process of requesting the recording of material contents from an external device is given (see FIGS. 11, 12, 13, and 14).
  • the story generation unit 16 performs a recommendation time determination process for a user who is a customer, and requests an external device to record material content according to the recommendation time determination process.
  • the opportunity for automatic content production for the user who is the customer of the automatic content production service is determined based on the user's event schedule, life stage, and the like.
  • a process of requesting the recording of the material content is performed according to the determined time.
  • recommendations such as image recording by shooting to users and requesting recording from various devices in response to upcoming events and changes in life, etc. It will be easier to obtain material content at the opportunity to contribute to the memories and impressions of.
  • the time related to the user who is regarded as a customer includes not only the user himself / herself but also various events related to family and friends and the time based on the life stage.
  • the story generation unit 16 determines a user's preference based on the user information, and performs a process of requesting recording of the material content based on the determined preference information.
  • the preference is determined based on the user information about the user himself / herself as a customer, his / her family, and friends, and the recording request of the material content is made based on this (see FIG. 14).
  • the story generation unit 16 determines a user's preference based on the user information, and performs a process of selecting the material content using the determined preference information as a selection element.
  • the preference is determined or estimated based on the user information about the user himself / herself as a customer, his / her family, and friends.
  • a process of selecting the material content using the preference information as a selection element is performed (see step S403 in FIGS. 19 and 21).
  • the story generation unit 16 determines a user's preference based on the user information, and performs a process of selecting the material content using the determined preference information as a selection element.
  • the story generation unit 16 performs a process of requesting recording of material content based on event information about a user (see FIGS. 16 and 18). For example, an appropriate scene or the like according to the type of event information of a user who is a customer is determined, and a recording request of matching material content is performed. There are various types of events, such as sports games, recitals, weddings, children's athletic meet, performance and drama stages, and desirable scenes can be considered according to the event. By requesting the shooting of such a scene, it is possible to increase the possibility of realizing highly complete automated production content.
  • the story generation unit 16 may perform a process of selecting material content based on event information about the user.
  • the material content selected in step S403 is selected based on the event information. It will be. That is, the material content suitable for an appropriate scene or the like is selected according to the type of event information of the user who is a customer. This makes it possible to increase the possibility of realizing highly complete automated production content according to the event.
  • a recommendation timing determination process an example of performing timing determination based on the user's life stage is given (see FIG. 16). For example, as a user's life stage, birth, admission, graduation, employment, marriage, child birth, child growth, retirement age, etc. are determined, and suitable material content is selected and recording is requested accordingly.
  • the progress and changes of the user's life stage have a narrative nature, and are suitable as an opportunity to produce automatically produced content. Therefore, by determining the time according to the life stage, it is possible to request shooting or the like at a timing suitable for collecting material content suitable for the automatically produced content. This makes it easier to collect material content that is desirable for automatic production.
  • An example of generating recommendation data showing the above is given (see FIG. 17).
  • the events of the factors that are determined to be the time for requesting recording in the timing determination process are, for example, events on the user's life stage (admission, graduation, employment, marriage, etc.), various events, and the like.
  • data for recommending the scene contents to be shot is generated based on the contents in the case of the same event by another person.
  • the server device 10 generates shooting recommendation data indicating recommended contents at a user's event or life stage with reference to the contents (material contents or automatically produced contents) of another person at the same event or life stage. Then, it is transmitted to the user's terminal device and presented to the user. As a result, the user can know what kind of shooting should be performed in this event, and as a result, it becomes easier to obtain material content suitable for the automatically produced content, and the automatically produced content with high user satisfaction. Is easy to realize.
  • the story generation unit 16 sets the story of the content to be automatically produced for the user as a customer, selects the material content to be used from the DB corresponding to the user, and determines the lack of the material content. Perform story setting processing. Then, when it is determined that the material content is insufficient, the material content is searched from another DB (for example, a DB corresponding to another user, a public DB, etc.), and further, when the material content is determined to be insufficient. , An example of processing for requesting the recording of material contents from an external device is given (see FIG. 14).
  • the server device 10 as the information processing device of the embodiment has an evaluation unit 15 that performs a process of setting an evaluation value for the material content recorded in an accessible state, and a material content that constitutes a story set in the story setting process.
  • the story generation unit 16 collects the material content as a candidate for use according to the set story, and uses the evaluation value among the material content collected as the candidate to be used for automatic content production.
  • An example of performing a process of selecting the material content to be used is given (see FIG. 21).
  • the material content suitable for this automatic production can be easily and appropriately selected from the candidate contents. For example, candidate content corresponding to a certain scene that has been set can be collected based on the scene content, but among them, the most suitable material content for this automated production content or the material content that impresses the user this time is selected. It is difficult to select only the image content. Therefore, the selection is made in consideration of the evaluation value that reflects the relationship of the material content and the importance of the material content itself. This will enable more desirable content production.
  • the evaluation unit 15 sets a relevance evaluation value indicating the relevance of the material content to other material contents (see FIG. 19). For example, when the material content has a causal relationship with other material content, an evaluation value indicating the relationship with other material content is set.
  • the evaluation unit 15 sets an individual evaluation value for the material content by itself (see FIG. 19). Even if there is a huge amount of content as each material content, the importance of each is different. The importance as a general scene quality and the importance depending on the scene where the user's emotions appear are different. Then, determining such importance from each candidate content at the time of automatic production is a heavy processing load. Therefore, the evaluation value of the content itself is set in advance, and the evaluation value can be used for selection. As a result, it is considered that the selection of the material content to be used in the automatically produced content can be easily and appropriately made, and the content automatic production that gives more impression is possible.
  • the evaluation unit 15 sets the relevance presentation information that presents the relevance of the material content to other material contents (see FIGS. 19 and 7 to 10). For example, as illustrated in FIGS. 7 to 10, by generating the relevance presentation information indicating the relevance of each material content, the existence of the material content and its relationship can be presented to the user. The user can easily recognize the type and lack of material content.
  • the relevance presentation information and the relevance evaluation value are updated according to the user operation (see FIG. 20).
  • the user can confirm the appropriateness of the relevance between the material contents.
  • the relevance information can be corrected by performing the update process according to the feedback information dFB.
  • the relevance evaluation value and the relevance presentation information can be converged to an appropriate one that is more suitable for the user.
  • the individual evaluation value can be converged to a state that reflects the user's hobbies and tastes.
  • the relevance presentation information of the embodiment shows the relevance between the material contents by directly linking one material content and the other material contents.
  • the relationship between the contents is presented on the user interface by an image connecting the material contents (see FIGS. 7 to 10).
  • the user can easily confirm the appropriateness of the relationship between the material contents.
  • the relevance presentation information an example showing the relevance of the material content in a form in which the material content is linked to the key element is given (see FIGS. 8 and 9).
  • a word indicating an emotion or an event is used as a key element, and the relevance of the content is presented on the user interface in the form of a material content corresponding to a certain emotion, a material content related to a certain event, and the like.
  • FIG. 8 the relationship between the material contents is shown by using emotions of emotions as a key element, and as shown in FIG. 9, an image showing the relationship of the material contents by using a certain event as a key element is provided.
  • the user can easily confirm the relevance of the material contents according to his / her feelings, events, etc., and their suitability.
  • various key elements can be considered, such as by life stage, by a specific keyword, by action type, time, season, place, user age, and the like.
  • the relevance presentation information indicates the relevance of the material content in a form in which the material content is linked to the human relationship of the user (see FIG. 10).
  • the material content related to the family, the material content related to the friend, and the like are presented to the user A.
  • the user can easily confirm the relevance of the material contents according to his / her personal relationship and their suitability.
  • there are various other elements of human relationships that present related material content such as parents, children, members of a certain circle, classmates, people at work, hobby friends, and neighbors. Conceivable.
  • the server device 10 of the embodiment includes a learning unit 17 that inputs a user operation for the relevance presentation information and performs a learning process.
  • the learning unit 17 performs a learning process in order to reflect the feedback information dFB from the user regarding the relevance presentation information in the story setting.
  • step S421 in FIG. 22 the story of the automatically produced content currently being produced is corrected according to the learning result. This makes it possible to increase the possibility of producing content suitable for the user.
  • step S422 in FIG. 22 the material content to be adopted is reselected according to the story of the moving content currently being produced based on the learning result. This makes it possible for the user to increase the possibility of producing automatically produced content using more suitable material content.
  • step S324 and S329 of FIG. 20 it was shown that the individual evaluation value and the relevance evaluation value are updated.
  • step S424 of FIG. 22 it was shown that the evaluation function is updated so that the learning content is reflected in the future automatic production.
  • the learning content will be reflected in the future automatic content production. It is possible to evolve the automated production system for moving content so that users can produce more desirable automated content.
  • the server device 10 as the information processing device of the embodiment is in a state where the negative content determined to be a negative scene content can be distinguished from other material contents among the material contents constituting the story of the automatically produced contents.
  • a storage management unit 18 for saving is provided (see FIGS. 23 to 25).
  • Material content is selected according to the set scene during the production process of moving content, but by appropriately selecting negative content and arranging it on the story structure, it is possible to generate more moving content. Conceivable. Since the negative content is stored and managed separately from other material contents, the negative contents can be easily and appropriately selected at the time of producing such an automatically produced content.
  • the negative content and the positive content are managed separately, but the negative content may be determined and the negative content and the other material content may be managed separately.
  • the storage management unit 18 performs a process of distinguishing and storing the negative content and the positive content determined to be the positive scene content for the material content (see FIGS. 23 to 25). It is desirable that positive content and negative content are appropriately selected in the scene set during the production process of moving content. By storing and managing the negative content and the positive content separately, the negative content and the positive content can be easily and appropriately selected when the automatically produced content is produced.
  • the storage management unit 18 stores the material content determined to be negative content in a remote storage 12 (second storage device) different from the storage 10a (first storage device) that stores and manages the material content other than the negative content. I gave an example of making it stored in the storage device).
  • a remote storage 12 second storage device
  • the negative content and the other (positive content) in another storage device, it is possible to appropriately distinguish the negative content and make it difficult for the negative content to be normally shown to the user or the like.
  • the material content managed by the cloud server can be viewed simply as a video or still image saved by the user, in addition to being used for the automatically produced content, but for the user, the negative content is usually It's not something you want to look back on, and in some cases you may want to forget it.
  • the storage 10a is a storage device managed in a state where user access to the material content is permitted, and the remote storage 12 is managed in a state where access to the material content is permitted only by a specific administrator. It is supposed to be a storage device. For example, the storage 10a and the remote storage 12 have different access rights. By doing so, the negative content can usually be hidden from the user.
  • the remote storage 12 is an example of a storage device in which the access speed from the storage management unit 18 is slower than that of the storage 10a.
  • the storage 10a and the remote storage 12 have different access speeds due to differences in the inside and outside of the network, the communication method, and the like. By doing so, it is possible to make the negative content difficult to show to general users.
  • the storage 10a is remotely used, for example, when the storage device in the device of the server device 10, the storage device connected to the LAN, or the storage device connected by the network normally used is used.
  • the storage 12 is a storage device connected to a network that communicates at a low transfer rate, a storage device located outside the earth such as a desert area other than an urban area, or the surface of the moon, a storage device connected to a stand-alone computer, and the like. Is assumed. In any case, a storage device that is inconvenient for normal browsing can be assumed.
  • the storage 10a is accessible to the storage management unit 18 via the first network
  • the remote storage 12 is accessible to the storage management unit 18 via the second network. is assumed. By distinguishing networks, accessibility to negative content can be made different from other material content.
  • the storage management unit 18 has described an example in which the material content determined to be negative content and the material content other than the negative content are stored in the storage device in different hierarchical management states. For example, using the storage device of the server that manages the material content, the negative content and the other material content are managed in folders of different layers. Alternatively, even when different storages are used, the state of tier management is made different. Hierarchical management can also make the accessibility to negative content lower than other (positive content).
  • an example is given in which the storage management unit 18 performs a process for facilitating access by the storage management unit 18 in response to the determination that the negative content is related to the positive content (FIG. 24). , See Figure 25).
  • negative content is normally stored and managed in a state where accessibility is reduced, but it is managed in a state where accessibility is improved by confirming the existence of related positive content.
  • Negative content which has related positive content, is considered to have the possibility of being selected as one of the scenes constituting the moving content, and facilitates access to the server device 10 when producing automatically produced content. , It should be easy to provide as candidate content. As a result, negative content that is normally managed to be difficult to browse can be made easy to use in emotional content.
  • the storage management unit 18 makes the negative content a material content that can be used as a candidate content for use in the content automatic production process according to the determination that the negative content is related to the positive content.
  • negative content is not a candidate for use in automated production content, but it can be made a candidate content by confirming the existence of related positive content. This makes it possible to prevent negative content from being unnecessarily used for moving content. Also, by making it possible to use it for automatic content production for the first time with the existence of positive content corresponding to negative content, it should be used as content for stories that lead to subsequent positive events, not just negative scenes. become. This makes it possible to effectively use negative content.
  • the program of the embodiment is a program for causing, for example, a CPU, a DSP, or a device including these to execute the process described in the embodiment.
  • the program of the embodiment is a program for causing an information processing apparatus to execute a process of requesting an external device to record the material content constituting the story for the automatically produced content. Further, in the program of the embodiment, the process of setting the evaluation value for the material content recorded in the accessible state and the material content constituting the story set in the story setting process are selected with reference to the evaluation value. It is a program that causes an information processing device to execute story generation processing that automatically creates content by editing processing using selected material content. Further, the program of the embodiment performs a storage management process for storing the negative content determined to be the negative scene content among the material contents constituting the story of the automatically produced content in a state that can be distinguished from other material contents. It is a program to be executed by an information processing device.
  • the above-mentioned server device 10 can be realized in a computer device or other device capable of executing information processing.
  • a program that realizes such a server device 10 can be recorded in advance in an HDD as a recording medium built in a device such as a computer device, a ROM in a microcomputer having a CPU, or the like.
  • a device such as a computer device, a ROM in a microcomputer having a CPU, or the like.
  • flexible discs CD-ROMs (Compact Disc Read Only Memory), MO (Magneto Optical) discs, DVDs (Digital Versatile Discs), Blu-ray discs (Blu-ray Disc (registered trademark)), magnetic discs, semiconductor memories, It can be temporarily or permanently stored (recorded) on a removable recording medium such as a memory card.
  • Such removable recording media can be provided as so-called package software.
  • it can also be downloaded from a download site via a network such as a LAN (Local Area Network) or the Internet.
  • LAN Local Area Network
  • the server device 10 of the embodiment it is suitable for a wide range of provision of the server device 10 of the embodiment.
  • a mobile terminal device such as a smartphone or tablet, a mobile phone, a personal computer, a game device, a video device, a PDA (Personal Digital Assistant), or the like
  • the smartphone or the like functions as the server device 10 of the present disclosure. Can be made to.
  • the present technology can also adopt the following configurations.
  • (1) Based on multiple material contents recorded in an accessible state, select the material content that composes the story set in the story setting process, and create a story generation unit that automatically creates content by editing processing using the selected material content.
  • (2) The information processing device according to (1) above, wherein the story generation unit selects a plurality of material contents using a learning model by machine learning, and automatically creates contents by an editing process using the selected material contents.
  • (3) Equipped with an evaluation unit that performs processing to set evaluation values for material content The story generation unit selects the material content that constitutes the story set in the story setting process with reference to the evaluation value, and automatically creates the content by the editing process using the selected material content.
  • the story generation unit collects material contents that are candidates for use according to the set story, and selects the material contents to be used for automatic content production from the material contents collected as candidates by using the evaluation value.
  • the evaluation unit sets an evaluation value of a single material content.
  • the evaluation unit sets relevance presentation information that presents the relevance of the material content to other material contents.
  • the relevance presentation information is updated according to a user operation.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Theoretical Computer Science (AREA)
  • Astronomy & Astrophysics (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

情報処理装置が、アクセス可能な状態に記録された複数の素材コンテンツに基づき、ストーリー設定処理で設定したストーリーを構成する素材コンテンツを選択し、選択した素材コンテンツを用いた編集処理により自動コンテンツ制作を行うストーリー生成部を備えるようにする。

Description

情報処理装置、情報処理方法、プログラム
 本技術は情報処理装置、情報処理方法、プログラムに係り、特に画像や音声を用いたコンテンツの自動制作についての技術分野に関する。
 下記特許文献1には、素材となる単位映像をつなぎ合わせて動画コンテンツを制作するための技術が開示されている。
特開2009-130597号公報
 近年では撮像装置、録音装置などの記録装置の小型化や携帯機器への搭載、或いは多様な装置の普及等により、画像(画像とは動画や静止画の総称とする)の撮像や音声の収録が容易化、一般化している。またメモリカード等の記録媒体の多様化や、ネットワーク通信を利用したクラウドストレージの普及などもあり、写真、動画、音声等のデータの保存態様も多様化している。このような環境では、例えばサーバ装置が、顧客ユーザの画像などを取得することも比較的容易となり、サービスとして、顧客ユーザを主役にした短篇映画のようなコンテンツを制作することが考えられる。さらには近年のAI(artificial intelligence)処理等の進歩により、素材となる画像等を的確に収集し、顧客ユーザにとって望ましいコンテンツを自動制作することも考えられる。
 ここで、サービスを行うサーバ装置がコンテンツ自動制作を行って顧客に提供することを考えると、サーバ装置が、例えば顧客のユーザの画像素材等を適切に収集する必要がある。特に、当該ユーザをメインキャストとしたコンテンツを自動制作する場合に、ストーリーを適切に組み立てることや、各シーンに適切な画像素材を選択することなどが重要と考えられる。ところが、制作時に各素材画像について画像解析等を行い、画像内容を逐次判定していくことは処理負担が大きく困難であり、また効率的とはいえない。
 そこで本技術では、ユーザに提供するコンテンツを自動制作する場合に、素材の評価や選択が比較的容易かつ適切に実行できるようにすることを目的とする。
 本技術に係る情報処理装置は、アクセス可能な状態に記録された複数の素材コンテンツに基づき、ストーリー設定処理で設定したストーリーを構成する素材コンテンツを選択し、選択した素材コンテンツを用いた編集処理により自動コンテンツ制作を行うストーリー生成部を備える。
 複数の素材コンテンツを用いて、あるストーリーを持ったコンテンツを自動制作することを考える。素材コンテンツとは、ストーリーを構成する各シーンを構成する画像(動画や静止画)や音声などである。このような素材コンテンツを選択、編集してストーリー生成を行う。
 この場合に、ストーリー生成部は、機械学習による学習モデルを用いて複数の素材コンテンツを選択し、選択した素材コンテンツを用いた編集処理により自動コンテンツ制作を行うことが考えられる。
 学習モデルを用いることで、より望ましい素材コンテンツの選択を実現する。
 また素材コンテンツについて評価値を設定する処理を行う評価部を備え、前記ストーリー生成部は、ストーリー設定処理で設定したストーリーを構成する素材コンテンツを、前記評価値を参照して選択し、選択した素材コンテンツを用いた編集処理により自動コンテンツ制作を行うことが考えられる。
 素材コンテンツは情報処理装置がアクセス可能に保存されているが、この素材コンテンツについては評価値が設定されるようにし、コンテンツ自動制作の際には評価値を参照して素材コンテンツが選択されるようにする。
 上記した本技術に係る情報処理装置においては、前記ストーリー生成部は、設定したストーリーに応じて使用の候補とする素材コンテンツの収集処理を行い、候補として収集した素材コンテンツのうちで評価値を使用して自動コンテンツ制作に使用する素材コンテンツを選択する処理を行うことが考えられる。
 素材コンテンツに評価値が設定されていることで、ストーリーを構成する候補となるシーンに合わせた素材コンテンツを収集した際に、評価値を用いて採用する素材コンテンツを選択することができる。
 上記した本技術に係る情報処理装置においては、前記評価部は、素材コンテンツについて、他の素材コンテンツとの関連性を示す評価値を設定することが考えられる。
 例えば素材コンテンツについて、他の素材コンテンツとの因果関係などの関連性があるような場合に、その他の素材コンテンツとの関連性を示す評価値を設定する。
 上記した本技術に係る情報処理装置においては、前記評価部は、素材コンテンツについて単体での評価値を設定することが考えられる。
 例えば素材コンテンツについて、喜怒哀楽が表れていたり、追尾対象であったりするなど、シーンとしての価値を示すような評価値を設定する。
  上記した本技術に係る情報処理装置においては、前記評価部は、素材コンテンツについて、他の素材コンテンツとの関連性を提示する関連性提示情報を設定することが考えられる。
 例えば素材コンテンツについて、他の素材コンテンツとの因果関係などの関連性があるような場合に、その関連性をユーザに提示するための関連性提示情報を設定する。
  上記した本技術に係る情報処理装置においては、前記関連性提示情報はユーザ操作に応じて更新されることが考えられる。
 例えば素材コンテンツ同士の関連性を提示したユーザインタフェースにおいて、ユーザの操作を受け付け、操作に応じて関連性提示情報を更新する。
  上記した本技術に係る情報処理装置においては、前記関連性提示情報は、一の素材コンテンツと他の素材コンテンツを結びつけて示すことで素材コンテンツ同士の関連性を示すものとされることが考えられる。
 例えば素材コンテンツ同士を直接結ぶような画像によりコンテンツ同士の関連性をユーザインタフェース上で提示する。
  上記した本技術に係る情報処理装置においては、前記関連性提示情報は、キー要素に対して素材コンテンツが結びつく形態で素材コンテンツの関連性を示すものとされることが考えられる。
 例えば感情を示す言葉やイベントなどをキー要素とし、或る感情に対応する素材コンテンツ、或るイベントに関連する素材コンテンツ、などというような形態でコンテンツの関連性をユーザインタフェース上で提示する。
  上記した本技術に係る情報処理装置においては、前記関連性提示情報は、ユーザの人間関係に対して素材コンテンツが結びつく形態で素材コンテンツの関連性を示すものとされることが考えられる。
 例えば或るユーザについて、家族や友人などの人間関係と、それらに関連する素材コンテンツが提示されるようにする。
  上記した本技術に係る情報処理装置においては、前記関連性提示情報に対するユーザ操作を入力し、学習処理を行う学習部を備えることが考えられる。
 例えば素材コンテンツ同士の関連性を提示したユーザインタフェースにおいて、ユーザの操作を受け付け、ストーリー設定等に反映させる情報として学習処理を行う。
 上記した本技術に係る情報処理装置においては、前記学習部による学習内容はストーリー修正に反映されることが考えられる。
 ユーザによるフィードバック情報の学習結果を、例えば現在の自動制作コンテンツのストーリー修正として反映させる。
 上記した本技術に係る情報処理装置においては、前記学習部による学習内容は素材コンテンツの選択に反映されることが考えられる。
 ユーザによるフィードバック情報の学習結果を、例えば現在の自動制作コンテンツのストーリーに対して採用する素材コンテンツの選択(素材コンテンツの選択し直し)として反映させる。
 上記した本技術に係る情報処理装置においては、前記学習部による学習内容は将来のコンテンツ自動制作に反映されることが考えられる。
 ユーザによるフィードバック情報の学習結果が、当該ユーザについての将来の自動制作コンテンツの制作に反映されるように必要な処理を行う。
 上記した本技術に係る情報処理装置においては、フィードバック情報を入力し、前記学習モデルを更新する学習処理を行う学習部を備えることが考えられる。
 機械学習による学習モデルを用いて素材コンテンツの選択やストーリー生成のための編集を行う場合が想定される。
 上記した本技術に係る情報処理装置においては、フィードバック情報を入力し、ストーリー生成に用いる素材コンテンツ選択のための評価関数を更新する学習処理を行う学習部を備えることが考えられる。
 個別評価値、関連性評価値、時間長、順序などの要素を含む評価関数を用いてストーリーを構成する各シーンに使用する素材コンテンツの選択処理を行う場合が想定される。
 本技術に係る情報処理方法は、アクセス可能な状態に記録された複数の素材コンテンツに基づき、ストーリー設定処理で設定したストーリーを構成する素材コンテンツを選択し、選択した素材コンテンツを用いた編集処理により自動コンテンツ制作を行うストーリー生成処理を情報処理装置が実行する情報処理方法である。これにより素材コンテンツの選択を容易化する。
 本技術に係るプログラムは、このような情報処理方法を情報処理装置に実行させるプログラムである。これにより本技術の情報処理装置の実現を容易化する。
本技術の実施の形態のシステム構成の説明図である。 実施の形態のコンテンツ自動制作に関する機能構成の説明図である。 実施の形態の情報処理装置の構成のブロック図である。 実施の形態の自動制作コンテンツのストーリー構成例の説明図である。 実施の形態のサーバ装置におけるコンテンツ自動制作に関する機能の動作の説明図である。 実施の形態のシステムを実行されるワークフローの例の説明図である。 実施の形態の関連性提示情報の一例の説明図である。 実施の形態の関連性提示情報の一例の説明図である。 実施の形態の関連性提示情報の一例の説明図である。 実施の形態の関連性提示情報の一例の説明図である。 実施の形態の自動制作処理のフローチャートである。 実施の形態のストーリー設定処理のフローチャートである。 実施の形態の素材コンテンツ補完処理のフローチャートである。 実施の形態の素材コンテンツ補完処理のフローチャートである。 実施の形態の素材コンテンツ補完処理のフローチャートである。 実施の形態の事前に行う素材コンテンツ要請処理のフローチャートである。 実施の形態の素材コンテンツ補完処理のフローチャートである。 実施の形態の素材コンテンツ補完処理のフローチャートである。 実施の形態の素材コンテンツ評価処理のフローチャートである。 実施の形態のフィードバック処理のフローチャートである。 実施の形態のストーリー設定の際の処理のフローチャートである。 実施の形態のフィードバック対応処理のフローチャートである。 実施の形態の素材コンテンツ管理処理のフローチャートである。 実施の形態の素材コンテンツ管理処理のフローチャートである。 実施の形態の素材コンテンツ管理処理のフローチャートである。
 以下、実施の形態を次の順序で説明する。
<1.システム構成>
<2.自動制作コンテンツの概要>
<3.コンテンツ制作の流れ>
<4.コンテンツ補完を含む自動制作処理>
<5.制作前のレコメンド/補完処理>
<6.素材コンテンツの評価とフィードバック>
<7.ネガティブ/ポジティブコンテンツの管理>
<8.まとめ及び変形例>
 なお、本開示では「コンテンツ」について次のような用語を用いて区別する。
・自動制作コンテンツ
 本開示では、例えば顧客としてのユーザに対して提供するコンテンツを情報処理装置により自動制作する。自動制作されてユーザが視聴することになるコンテンツを「自動制作コンテンツ」と呼ぶこととするが、実施の形態では「自動制作コンテンツ」として顧客のユーザ等を対象として感動を与えること目的として自動制作する例を挙げるため、説明の便宜上、主に「感動コンテンツ」と呼ぶ。「感動コンテンツ」は「自動制作コンテンツ」の1つの具体例である。
 自動制作コンテンツの形態としては、動画/音声を含むコンテンツ、静止画によるスライドショウのようなコンテンツ、静止画と音声を含むコンテンツ、音声のみのコンテンツ、動画と静止画と音声を含むコンテンツ、テキストデータを含むコンテンツなど、多様である。
・素材コンテンツ
 自動制作コンテンツは、複数の動画素材、静止画素材、音声素材、テキスト素材等を組み合わせて制作する。それぞれの素材となる動画、静止画、音声、テキスト等としてのコンテンツデータを「素材コンテンツ」と呼ぶ。どのようなコンテンツであっても素材コンテンツとなり得る。
・候補コンテンツ
 素材コンテンツのうちで、自動制作コンテンツの制作の際に或るシーンの画像や音声として使用する候補とされた素材コンテンツを指す。例えば大量の素材コンテンツのうちで、或るシーンに適応できそうないくつかの候補コンテンツが抽出され、その候補コンテンツの中で、当該シーンにしようされる素材コンテンツが選択される。
・ネガティブコンテンツとポジティブコンテンツ
 素材コンテンツのうちで、例えば楽観的、肯定的、前進的などのシーン内容を持つと判定されたものを「ポジティブコンテンツ」とする。
 素材コンテンツのうちで、例えば悲観的、否定的、後退的などのシーン内容を持つと判定されたものを「ネガティブコンテンツ」とする。
 但し、この「ポジティブコンテンツ」「ネガティブコンテンツ」は絶対的な区分ではなく、シーン内容種別に応じて、あるいは顧客ユーザに応じて、あるいは時期/時代に応じて、あるいは常識や社会情勢等に応じて、何らかの判定基準が決められて判定されればよい。本技術では少なくとも「ネガティブコンテンツ」と判定された素材コンテンツを、他の素材コンテンツとは区別して管理することを行う。
 また本開示において「画像」とは動画と静止画のいずれであってもよく、それらの総称として用いる用語とする。
<1.システム構成>
 図1にサーバ装置10を含むシステム構成例を示している。
 実施の形態では、サーバ装置10を構成する情報処理装置が、多数のユーザの多数の画像素材等を用いて自動的に顧客ユーザについての感動コンテンツを制作し、感動コンテンツをユーザに提供するサービスを行う例で説明する。
 また素材コンテンツは、主に動画データ(音声を含む)である例で説明する。つまり自動制作される感動コンテンツは、複数の動画を編集して制作されるムービーのような例とされることを想定する。
 図1のサーバ装置10は、例えばインターネット等のネットワーク11を介して各種の機器と通信が可能な情報処理装置であり、例えば、いわゆるクラウドサーバとして機能するものである。
 サーバ装置10は、その管理下のストレージ10aにおいて、大量の素材コンテンツや制作した感動コンテンツを格納できる。
 なおストレージ10aは、サーバ装置10がアクセス可能なストレージを表すもので、サーバ装置10としての情報処理装置の内部に搭載されたストレージデバイスであってもよいし、LAN(Local Area Network)等で接続されたストレージデバイスであってもよい。またサーバ装置10から離れた場所にあるストレージ、あるいはユーザサイドのストレージデバイスが、ここでいうストレージ10aとして用いられる場合もある。
 すなわちサーバ装置10が、感動コンテンツの自動生成のために素材コンテンツを収集することのできる対象となるストレージであれば、ここに示すストレージ10aに該当する可能性がある。
 またサーバ装置10は、遠隔ストレージ12に素材コンテンツ等を格納することも可能である。
 この遠隔ストレージ12は、ストレージ10aと比較して、アクセス性が低下するストレージデバイスとして示している。遠隔ストレージ12も、サーバ装置10内のストレージデバイスである場合もあるし、外部のストレージデバイスである場合もある。詳しい例は後述する。
 遠隔ストレージ12は、ユーザサイドの機器、例えば図示するコンピュータ装置3、タブレット端末4、携帯端末5等からは物理的に、或いはアクセス権限の管理等により、アクセスできないストレージデバイスとされていてもよい。
 このようなサーバ装置10はネットワーク上でクラウドストレージサービスを提供するサーバであってもよいし、SNS(Social Networking Service)を提供するサーバでもよいし、総合的なサービスを提供するプラットフォームサーバであってもよい。
 ネットワーク11は、例えばインターネット、ホームネットワーク、LAN、衛星通信網、その他の各種のネットワークが想定される。
 各種の機器がネットワーク11を介して画像データ等をサーバ装置10にアップロードしたり、サーバ装置10から各種情報をダウンロードしたりすることができる。
 またネットワーク11の一部又は全部として、例えばFTP(File Transfer Protocol)による通信などが採用されてもよい。またブルートゥース(Bluetooth:登録商標)、WI-FI(Wireless Fidelity:登録商標)、NFC(Near Field Communication:登録商標)等の近距離無線通信や、赤外線通信などが採用されてもよい。
 いずれにしてもネットワーク11としてはデータ通信が可能なあらゆるネットワークが想定されうる。
 図1ではユーザサイドで撮影や録音を行うことができる機器として、カメラ2、コンピュータ装置3、タブレット端末4、携帯端末5、カメラ搭載飛行体6、カメラ搭載車両7、エージェント装置8、監視カメラ9を示している。これらはあくまでも撮影や録音を行うことができる機器の一例であり、これら以外の機器もあり得る。
 カメラ2は、静止画や動画を撮像し、画像データとして記録や転送出力をすることができる撮像装置である。多数のユーザにカメラ2が使用され、撮影された画像データ(動画や静止画)がストレージ10a等に保存されることで、サーバ装置10がそれらの画像データを素材コンテンツとして使用可能となることが想定される。
  コンピュータ装置3は、例えばノート型パーソナルコンピュータ、デスクトップ型パーソナルコンピュータなどを例示するものである。タブレット端末4や、スマートフォン等の携帯端末5も、コンピュータ装置の一態様といえる。
 これらのコンピュータ装置3、タブレット端末4、携帯端末5などの場合、例えば内蔵カメラで撮像した画像データ、カメラ2等の他の機器から転送された画像データ、合成画像やコンピュータグラフィックス(CG)等として生成した画像データ、ビデオチャットの画像としての画像データ、家族や友人と共有した画像データなどが、ストレージ10a等に保存され、サーバ装置10によるアクセスが可能となることが想定される。
 カメラ搭載飛行体6は、例えばドローン等のカメラを搭載した飛行体を想定する。カメラ搭載飛行体6による撮影で得られた画像データがストレージ10a等に保存され、サーバ装置10によるアクセスが可能となることが想定される。
 ドローン等はユーザが所有するものであったり、公共物であったり、感動コンテンツ提供サービスの事業者が所有し、素材コンテンツ収集のために顧客のユーザを撮影するために使用されたりするものが想定される。
 カメラ搭載車両7は、例えば一般の自動車等の車両であって、ドライブレコーダー等のカメラが搭載された車両である。例えばユーザが所有する車両のドライブレコーダーの画像をサーバ装置10に提供することで、カメラ搭載車両7による撮影で得られた画像データがストレージ10a等に保存され、サーバ装置10によってアクセス可能となることが想定される。
 エージェント装置8は、例えば家庭などにおいて情報提供や家電制御などのサービスを行うためのインタフェース装置であり、カメラを搭載することで、撮影可能となることも想定される。エージェント装置8の撮影で得られた画像データがストレージ10a等に保存され、サーバ装置10によりアクセス可能となることが想定される。
 ここではエージェント装置8として例示したが、例えば家庭で使用される家事支援ロボットやペット型ロボットなども撮影機能を有することで、それらの撮影による画像データがストレージ10a等に保存され、サーバ装置10によってアクセス可能となることが想定される。
 監視カメラ9は、例えば公共の場所に設置されたもの、あるいは一般ユーザが私的空間に設置したものなどがある。このような監視カメラ9の撮影による画像データがストレージ10a等に保存され、サーバ装置10によってアクセス可能となることが想定される。
 以上のような各種機器は、サーバ装置10が使用する素材コンテンツを得ることのできる機器となったり、ユーザインタフェースが可能な機器となったりする。
 図2にサーバ装置10と各種機器の関係を例示している。
 図1に示した各種機器は、図2における素材コンテンツ提供部20として機能する場合もあるし、UI(ユーザインタフェース)部22として機能する場合もある。
 例えばカメラ2,コンピュータ装置3、監視カメラ9等、上述した各機器は、例えば動画データとしてのコンテンツを撮影あるいは生成できるため、サーバ装置10が使用できる素材コンテンツの提供元となり得る。
 つまり各種機器で得られる画像が、顧客ユーザのパーソナルなムービーとしての感動コンテンツを制作するための素材コンテンツとなり得る。
 あくまで一例であり、下記以外にも考えられるが、素材コンテンツとなり得る画像を例示すると次のようになる。
・顧客ユーザが自分で撮影、録音してクラウドにアップロードした画像
・サービス依頼により業者によって撮像された画像
・顧客ユーザのローカルデータの開放により提供される画像
・顧客ユーザの友人、家族等が撮影してアップロードした画像
・ロボット/ドローン/車載カメラ等が撮影した画像
・地域カメラ、監視カメラ等の画像
・自分/友人/フォロワー等のSNSの画像
・ビデオチャットなど通信時の画像
・CG画像、フェイク画像など、画像処理により制作された画像
・自由使用が認められるパブリックな画像、イメージ画像
 これらの画像は、例えばストレージ10aや遠隔ストレージ12において、ユーザ個人に対応した画像として管理できる状態で保存される。
 或るユーザAが顧客となって感動コンテンツの制作を行う場合、そのユーザAに関連づけられた画像が、使用可能な素材コンテンツとなる。
 各画像データは、ユーザ個人の識別情報に関連づけられてまとめて保存されてもよいし、1つの画像に複数のユーザ識別情報が付与されて、1つの画像を複数のユーザについて使用されることが可能としてもよい。
 また、カメラ2,コンピュータ装置3、携帯端末5等は、表示や操作入力などのUI機能を備える機器である。従って、これらの機器は、サーバ装置10が提供する感動コンテンツや各種画像をユーザに表示させる場合、あるいはユーザ操作を受け付ける場合のUI部22として機能できることになる。
 また図2には、サーバ装置10が備える機能構成例を示している。
 サーバ装置10は感動コンテンツの自動制作処理に関する機能として、評価部15、ストーリー生成部16、学習部17、記憶管理部18を備える。
 評価部15は、例えばストレージ10a等に記憶され、サーバ装置10がアクセス可能とされた各素材コンテンツについて評価値を設定する処理機能である。
 ストーリー生成部16は、顧客ユーザに対する感動コンテンツのストーリー設定処理や、それに応じた素材コンテンツの選択処理、選択された素材コンテンツの編集処理等を行って感動コンテンツの自動制作を行う機能である。
 学習部17は、ユーザからのフィードバックを受けてユーザ個人に適応する学習処理を行う機能である。
 記憶管理部18は、素材コンテンツの記憶管理、特にネガティブコンテンツとポジティブコンテンツの記憶管理を行う。
 これらの機能の具体的な処理例については後述するが、各機能として例えばAI処理が行われることで、品質の高い処理が実現される。
 また図2にはユーザ情報提供部21としての機能も示している。
 このユーザ情報提供部21は、カメラ2、コンピュータ装置3、タブレット端末4、携帯端末5などに内蔵される機能である場合もあるし、別体の機器やセンサ機器である場合もある。ウェアラブル機器として各時点のユーザ情報(ユーザの居場所を示す位置情報やバイタル情報等)を取得できる機器であってもよい。
 そしてユーザ情報とは、例えばユーザの年齢、性別等の属性情報、趣味、ユーザの顔、家族構成、家族の年齢、友人等の情報、スケジュール情報、イベント情報(予定、参加履歴、SNS情報など)、ユーザのカメラ歴、バイタル情報、位置情報など各種の情報が想定される。
 これらのユーザ情報は、ユーザ個人に関連づけられて管理されるものや、画像データ等の素材コンテンツに関連づけられるものがある。例えばメタデータとして画像データに付加され関連づけられるものがある。
 例えばユーザの年齢、性別等の属性情報、趣味、ユーザの顔、家族構成、家族の年齢、友人等の情報、スケジュール情報、イベント情報、カメラ歴などは、ユーザ個人に関連づけられる場合がある。サーバ装置10は、ユーザにとって適切な感動コンテンツ制作を行うための情報として、ユーザ毎に、このようなユーザ情報を管理する。
 また撮影時の情報という意味では、ユーザの撮影時の年齢、撮影時の家族構成、友人等の情報、撮影内容に該当するスケジュール情報やイベント情報(どのようなイベントでの画像であるかの情報)、撮影時のバイタル情報、撮影時の位置情報などは、画像に関連づけられるユーザ情報とすることができる。これらのユーザ情報は、例えば素材コンテンツ毎に、メタデータとして記憶されたり、素材コンテンツに対応して別途情報ファイル等として管理されたりする。これによりサーバ装置10は素材コンテンツ毎に対応するユーザ情報を使用できる
 またユーザ情報提供部21によるユーザ情報としては、直接的に検出される情報だけでなく、例えば画像解析の結果や、複数のセンシングデータの分析などにより得られる情報が有ってもよい。
 例えば撮影された画像データの解析により、ユーザの容姿上の特徴、表情、顔色、それらから推定される感情の情報などもある。
 またバイタルセンサとして心拍数、脳センシング情報、血圧値、発汗量などが計測される場合、それらからユーザの感情を推定してユーザ情報とすることもできる。
 また撮影時における人間関係の情報も有用である。例えば処理対象の顧客ユーザ本人がとっている画像、顧客ユーザを友人が撮影している画像、顧客ユーザを家族が撮影している画像、監視カメラで客観的に撮影された画像などの種別の情報も画像に関連づけられるユーザ情報となり得る。
 以上のようにユーザ情報提供部21によって得られるこれらのユーザ情報は、素材コンテンツ提供部20となる機器に提供されてメタデータとして画像データに付加されたり、サーバ装置10に提供されてユーザ個人あるいは素材コンテンツに関連づけられて管理されたりする。
 次に、サーバ装置10や、コンピュータ装置3、タブレット端末4、携帯端末5などとして構成できる情報処理装置70のハードウェア構成の例を図3に示す。
 情報処理装置70のCPU(Central Processing Unit)71は、ROM(Read Only Memory)72に記憶されているプログラム、または記憶部79からRAM(Random Access Memory)73にロードされたプログラムに従って各種の処理を実行する。RAM73にはまた、CPU71が各種の処理を実行する上において必要なデータなども適宜記憶される。
 CPU71、ROM72、およびRAM73は、バス74を介して相互に接続されている。このバス74にはまた、入出力インタフェース75も接続されている。
 入出力インタフェース75には、操作子や操作デバイスよりなる入力部76が接続される。
 例えば入力部76としては、キーボード、マウス、キー、ダイヤル、タッチパネル、タッチパッド、リモートコントローラ等の各種の操作子や操作デバイスが想定される。
 入力部76によりユーザの操作が検知され、入力された操作に応じた信号はCPU71によって解釈される。
 また入出力インタフェース75には、液晶パネル(LCD:Liquid Crystal Display)や有機EL(Electro-Luminescence)ディスプレイ等よりなる表示部77や、スピーカなどよりなる音声出力部78が一体又は別体として接続される。
 表示部77は各種表示を行う表示部であり、例えば情報処理装置70の筐体に設けられるディスプレイデバイスや、情報処理装置70に接続される別体のディスプレイデバイス等により構成される。
 表示部77は、CPU71の指示に基づいて表示画面上に各種の画像処理のための画像や処理対象の動画等の表示を実行する。また表示部77はCPU71の指示に基づいて、各種操作メニュー、アイコン、メッセージ等、即ちGUI(Graphical User Interface)としての表示を行う。
 入出力インタフェース75には、ハードディスクや固体メモリなどより構成される記憶部79や、各種の通信方式の通信を行う通信部80が接続される場合もある。
 通信部80は、インターネット等の伝送路を介しての通信処理や、各種機器との有線/無線通信、バス通信などによる通信を行う。
 この情報処理装置70をサーバ装置10として考えた場合、通信部80は、ネットワーク11を介した通信を行う機能を少なくとも備える。
 入出力インタフェース75にはまた、必要に応じてドライブ82が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブル記録媒体81が適宜装着される。
 ドライブ82により、リムーバブル記録媒体81からは画像ファイル等のデータファイルや、各種のコンピュータプログラムなどを読み出すことができる。読み出されたデータファイルは記憶部79に記憶されたり、データファイルに含まれる画像や音声が表示部77や音声出力部78で出力されたりする。またリムーバブル記録媒体81から読み出されたコンピュータプログラム等は必要に応じて記憶部79にインストールされる。
 この情報処理装置70では、例えば本開示の処理のためのソフトウエアを、通信部80によるネットワーク通信やリムーバブル記録媒体81を介してインストールすることができる。或いは当該ソフトウエアは予めROM72や記憶部79等に記憶されていてもよい。
 情報処理装置70としてサーバ装置10を想定した場合、情報処理装置70ではソフトウエア(アプリケーションプログラム)によって、図2で述べた機能構成がCPU71において構築される。
<2.自動制作コンテンツの概要>
 サーバ装置10は、自動制作コンテンツとして或る顧客ユーザを対象とし、顧客ユーザのパーソナルなムービーとしての感動コンテンツを制作する。
 この感動コンテンツとしてのストーリー構成の概要を説明する。
 図4は、感動コンテンツのストーリー構成の一例と、それに応じたバリエーションを示している。
 ここではストーリー構成として、内容的に起承転結を含みつつ、次のようなチャプターCH1,CH2,CH3,CH4,CH5を有する例を挙げている。
 チャプターCH1:過去の日常
 ここでは、ユーザが毎日のようにやっていたことを示すシーンを配置する。例えば野球の練習、ピアノの練習、会社通勤、友人関係、などである。
 チャプターCH2:事件発生
 日常やっていたことをやらなくなった(もしくはできなくなった)きっかけや変化が発生したイベントなどを示すシーンを配置する。
 例えば怪我、新たな友人関係、異動、卒業などのイベント、などがある。
 チャプターCH3:日常が戻るまでのダイジェスト
 例えばネガティブコンテンツを配置する。
 怪我からのリハビリの際の苦悩、悪い遊び、つらいこと、孤独な日々、などを示すシーンが該当する。
 チャプターCH4:現在の日常
 ネガティブな状態から脱却した現在の日常を示すシーンを配置する。
 例えば野球の練習への復帰、ピアノ練習への打ち込み、再異動、友人との再会、などである。
 チャプターCH5:メインの場面
 ストーリー上の盛り上がる場面(感動する場面)を配置する。
 例えば試合に復帰して活躍するシーン、ピアノの発表会、仕事で達成した業績、友人関係の発展、などである。
 以上は一例であるが、このように起承転結を含みつつ、感動的な場面をフィーチャーして顧客ユーザのパーソナルな感動コンテンツを生成することが考えられる。
<3.コンテンツ制作の流れ>
 例えばこのようなストーリー構成を有する感動コンテンツの自動制作の流れについて説明する。
 図5はサーバ装置10の機能として、評価部15、学習部17、ストーリー生成部16の処理の流れの概要を示している。また素材コンテンツ提供部20、ユーザ情報提供部21、UI部22との関連も示している。
 サーバ装置10に対しては上述のように素材コンテンツ提供部20から素材コンテンツとなり得る画像、音声、これらに付随するメタデータ(素材コンテンツに関連づけられるユーザ情報を含む)が提供される。
 またユーザ情報提供部21からユーザ情報が提供される。
 これらの素材コンテンツやユーザ情報は、サーバ装置10において図2に示した記憶管理部18の機能により、例えばユーザ個人毎に関連づけられて保存管理されるが、保存された素材コンテンツについては、評価部15による評価値設定処理が行われることになる。
 評価部15は、各素材コンテンツについて素材コンテンツ同士の関連性を示す評価値を設定し、また素材コンテンツ単体での個別評価値を設定する。
 或る素材コンテンツにおける関連性評価値とは、その素材コンテンツと他の素材コンテンツとの関連性を示す値とし、例えば因果関係、時系列関係などの関連性の大小を数値化した値とする。
 個別評価値とは、その素材コンテンツ自体の単体での画像自体やシーンの価値、内容の重要性などを評価する値とする。
 例えば喜怒哀楽のいずれかの感情を表現する画像内容であれば高い評価値を設定する。
 また被写体が追尾対象とされて撮影されたものは、その被写体のユーザにとっての素材コンテンツとして高い評価値とする。
 また突発的な事象、日常には無い事象の画像などであればストーリー構成上で有用な素材コンテンツとして高い評価値とする。
 ポジティブな要素を持つ画像や、ネガティブな要素を持つ画像は、ポジティブコンテンツ又はネガティブコンテンツとしてストーリー構成上で有用な素材コンテンツであるため高い評価値とする。
 ユーザの視聴履歴の情報も、ユーザが気に入って何回も視聴したものであるとか、全く再生しないものであるとかは、ユーザ個人にとっての重要度、お気に入りなどを表すことになるため、視聴履歴に応じた評価値を設定できる。
 評価部15は、顧客となるユーザ毎に、そのユーザに関連づけられた各素材コンテンツについて、例えば上記のように関連性評価値と個別評価値を設定する。
 これらの設定は、画像解析によるシーン内容の判定結果や画像品質、ユーザ情報などを総合的に反映させて行うことができる。
 このような評価値は、ストーリー生成部16に提供される。
 ストーリー生成部16は何らかのトリガに基づいて、或るユーザに対するパーソナルな感動コンテンツを生成する処理を行う。
 例えばストーリー生成部16は、顧客ユーザの本人又は家族などを主役としたストーリー設定を行い、ストーリーを構成する各場面として使用できそうな素材コンテンツを候補コンテンツとして収集する。そして各候補コンテンツについて、評価値を用いた演算(評価関数演算)を行い、実際に感動コンテンツとして使用する素材コンテンツを選択する。
 そして選択した素材コンテンツを用いて編集処理を行い、例えば顧客ユーザやその家族などを主役としたムービーのような感動コンテンツを生成する。
 このように制作された感動コンテンツは、ユーザ側に提供され、UI部22によりユーザが視聴できるようになる。
 以上が基本的なコンテンツ自動制作の流れとなるが、この自動制作のタイムラインの例を図6に示している。
 時系列的な手順としては次のようになる。
・ステップST1:素材コンテンツとしての動画や静止画などの撮影
・ステップST2:ユーザサイドからサーバ装置10への素材コンテンツの転送(サーバ装置10による使用可能化)
・ステップST3:サーバ装置10側での素材コンテンツの保存や管理
・ステップST10:感動コンテンツのストーリーの構想
・ステップST20:設定したストーリーに応じた素材コンテンツの選択
・ステップST30:素材コンテンツについての画質処理やシーン切り出しなどの後処理と、それらの処理を施した素材コンテンツをつなぎ合わせるなどの編集
・ステップST40:ユーザサイドに感動コンテンツの提供(ユーザサイドでの視聴)
 ここでステップST10,ST20,ST30が、ストーリー生成部16によるコンテンツ自動制作の処理となる。
 この図6において各種のワークフロー例を示している。
 ワークフローWF1、WF2は、素材コンテンツの収集までを示している。
 ワークフローWF1は、例えばユーザによりカメラ2等を用いた動画撮影などが行われ、その動画データがサーバ装置10に転送され、当該ユーザについてのデータベース(以下、データベースを「DB」と表記する)の生成又はDBへの記録が行われることで、当該ユーザについての素材コンテンツが使用できる状態となる例である。
 ワークフローWF2は、或るユーザの撮影以外の手法で、そのユーザについての画像が収集され、サーバ装置10において当該ユーザについてのDBで管理されることで、当該ユーザについての素材コンテンツとして使用できる状態となる例である。
 この場合、画像収集は、他のユーザにより撮影されたものであったり、パブリックデータとして収集されたものであったりすることが想定される。単にユーザ自身の撮影による素材コンテンツのみではなく、より広い範囲で素材コンテンツを収集する例である。
 ワークフローWF3からワークフローWF8は、ストーリー生成部16によるコンテンツ自動制作の例を示している。
 ワークフローWF3は、ユーザによる感動コンテンツの制作の依頼や所定の素材コンテンツの状況などをトリガとして開始する。
 まず或るユーザについてのストーリーの構想を行い、次に当該ユーザのDBを参照して、ストーリーの構成に応じて素材コンテンツを抽出する。そして使用する素材コンテンツを選択し、編集処理を行って感動コンテンツを生成する。
 感動コンテンツの自動制作のトリガとしては、ユーザからの制作依頼が想定される。例えばユーザから感動コンテンツのテーマ、タイトル、特定の素材コンテンツなどを指定するなど、どのようなコンテンツが欲しいかということを示す情報が提示され、それに基づいてサーバ装置10が感動コンテンツを自動生成するという形態である。
 例えばユーザが感動コンテンツに使いたい素材コンテンツを一部のみ指定し、それに応じてサーバ装置10がストーリー設定し、前後のシーンの素材コンテンツを選択して感動コンテンツを制作するということも考えられる。
 また感動コンテンツの自動制作のトリガとしては、以上のようなユーザサイドからの能動的な指示だけで無く、例えばサーバ装置10側からのユーザに対するメッセージで「○○のようなコンテンツを制作しませんか?」と勧め、それに応じて依頼があった場合に制作を開始することも考えられる。
 例えば素材コンテンツの収集状況から、そのユーザの子供の運動会の素材コンテンツが集まっている場合に「お子様の運動会のムービー制作はいかがですか?」とメッセージを送信するようなことも考えられる。
 また、或るネガティブコンテンツがあった場合に、それに対応するポジティブコンテンツが取得できた状況では、上述の図4で示したようなストーリーが構成できるものとなるため、そのような状況で、コンテンツ制作をユーザに勧め、ユーザの応答に応じて自動制作を開始するようなことも考えられる。
 また、ユーザが忘れているような素材コンテンツ、例えば撮影された日が古い画像や、ユーザがほとんど視聴していないような画像があった場合に、その画像の内容に応じたコンテンツ制作をユーザに勧め、ユーザの応答に応じて自動制作を開始するようなことも考えられる。
 同様に、ユーザが新しいアクティビティを始めたときの画像や、初めて行った場所、久しぶりに行った場所で撮った画像などがあった場合に、その画像の内容に応じたコンテンツ制作をユーザに勧め、ユーザの応答に応じて自動制作を開始するようなことも考えられる。
 なお、これらのメッセージの送信は、サービスに登録したユーザに対する電子メール、SNSメッセージなどや、サービス提供のためのアプリケーションをインストールしたユーザの端末装置(コンピュータ装置3,タブレット端末4、携帯端末5等)におけるアプリケーション画面での表示や、プッシュ通知などにより行われることが考えられる。
 さらに感動コンテンツの自動制作のトリガとしては、ユーザの依頼を待たずに、例えば素材コンテンツの内容から自動的にテーマやタイトルを設定して、自動的に感動コンテンツ制作を開始するようなことも考えられる。
 ワークフローWF4は、同じくユーザからの依頼等のトリガに応じて或るユーザについてのストーリーの構想を行い、次に当該ユーザのDBを参照して、ストーリーの構成に応じて素材コンテンツを抽出するが、素材コンテンツが足りない場合の例である。
 このような場合、素材コンテンツ補完処理として、ユーザに対する撮影指示や、何らかの自動撮影等を実行することで、不足するシーンの画像を収集する。その後、必要な素材コンテンツがそろったら編集処理を行って感動コンテンツを生成する。ユーザに対する撮影指示とは、例えばユーザに対するメッセージにより、「○○のような場面の撮影を行ってください」というように通知することが考えられる。また自動撮影の指示とは、ユーザの所有するロボットや家庭用機器などに、所定の場面の撮影を指示したり、撮影業者の機器に指示したりすることが考えられる。
 ワークフローWF5は、イベント情報を元に、感動コンテンツの自動制作を行う例である。ユーザの属性情報、スケジュールデータ、SNSの情報などをチェックし、特定のイベントがあったことを検知して、ストーリーの構想を行う。そして当該ユーザのDBを参照して、ストーリーの構成に応じて素材コンテンツを抽出し、使用する素材コンテンツを選択し、編集処理を行って感動コンテンツを生成する。
 イベント情報に基づく自動制作の開始の判断は、例えばユーザの属性情報として誕生日、性別、嗜好などから、想定されるイベント、例えば誕生会、母の日、興味のあるイベントの開催日などの検出により可能である。
 またユーザのスケジュールデータにもとづき、特定のイベントの発生、例えば帰省、旅行、デートなどのイベントが検知できる。
 またユーザに関するSNS情報から、ユーザの行動に基づいてイベント発生の判定が可能である。
 さらに素材コンテンツとして提供された画像の画像解析でイベント判定、例えば運動会などの判定が可能である。
 ワークフローWF6は、イベント情報を元に、感動コンテンツの自動制作を行う例であるが、素材コンテンツが不足する場合を示している。ユーザのスケジュールデータやSNSの情報などをチェックし、特定のイベントがあったことを検知して、ストーリーの構想を行う。次に当該ユーザのDBを参照して、ストーリーの構成に応じて素材コンテンツを抽出するが、素材コンテンツが足りない場合に、素材コンテンツ補完処理として、ユーザに対する撮影指示や、何らかの自動撮影を実行することで、不足するシーンの画像を収集する。その後、必要な素材コンテンツがそろったら編集処理を行って感動コンテンツを生成する。
 ワークフローWF7は、ワークフローWF4(あるいはWF6)と同様に素材コンテンツが足りない場合の素材コンテンツ補完処理の他の例を示している。
 設定したストーリーに応じた素材コンテンツが不足している場合、新たな撮影を指示するのでは無く、他のDB等から収集したり、必要な画像を制作したりする例である。例えば対象のユーザの家族のDB、友人のDB、パブリックのDB等を参照して素材コンテンツを探索したり、画像合成/フェイク画などとして必要なシーンの画像を生成したりする。
 ワークフローWF8は、例えばワークフローWF3に、視聴の際のユーザの評価をフィードバックする処理を加えた例である。
 感動コンテンツの視聴として、実際に作品として納品した場合、あるいはその最終的な納品の前に仮にユーザに試し視聴させるような場合において、ユーザが何らかの評価の操作を行うことができるようにする。その操作に応じたフィードバック情報を、ストーリー構想、素材コンテンツの選択、編集(シーン順序など)などのコンテンツ自動制作処理に反映する。
 図5では、フィードバック情報dFBについて学習部17が学習を行い、その学習結果をストーリー生成部16の処理に反映させることを示している。
 これは、今回の感動コンテンツの修正という作業に反映されてもよいし、当該ユーザの嗜好を学習し、その後の感動コンテンツの制作の際に反映されるようにしてもよい。つまりユーザからのフィードバックを用いて、ストーリー構想、素材コンテンツ選択、編集手法が、当該ユーザに特化していくようにする例である。
 以上のワークフローは、それぞれ一例に過ぎず、他にも多様な例が想定される。もちろん状況に応じて、あるいはユーザに応じて、ワークフローが使い分けられることも考えられる。
 ところでワークフローWF8としては、感動コンテンツを視聴した場合のユーザ評価をフィードバックすると説明したが、素材コンテンツの評価や関係性をフィードバックすることも考えられる。
 上述のように評価部15の処理で、各素材コンテンツについて関連性評価値や個別評価値が設定されるが、さらに、評価部15は、個別の素材コンテンツを、他の素材コンテンツとの関連性や、評価値をユーザに提示するための関連性提示情報を設定するようにすることが考えられる。
 図7,図8,図9,図10に関連性提示情報による表示内容の例を示している。
 これらは、或るユーザについてのDBに登録された素材コンテンツとして、素材コンテンツ(CT1,CT2・・・)があるとしたときに、それらの素材コンテンツについて関連性や評価値をユーザに示す場合の一表示態様である。
 図7では、まず素材コンテンツCT1,CT2・・・が表示される。図では円内に「CT1」「CT2」と表記して各素材コンテンツを示しているが、実際には各素材コンテンツの画像内容を示すサムネイル画像を配置することが考えられる。また例えばマウスオーバーやクリックに応じて動画が再生されるようにするなどしてもよい。いずれにしても各素材コンテンツについての画像内容をユーザが認識しやすい表示とすることが望ましい。
 各素材コンテンツについては、例えば10段階の数値で、個別評価値が認識できるように表示される。例えば図7の例では素材コンテンツCT1について「10」、素材コンテンツCT2について「7」などの数値が付されて、各素材コンテンツについて設定された個別評価値が認識可能とされる。
 もちろん数値に限らず、素材コンテンツを表現する画像のサイズ、形態、色、輝度、配置位置の違いなどにより、各素材コンテンツについての個別評価値の高低が認識できるようにしてもよい。
 また各素材コンテンツ間は、線の本数、線の色、線の太さ、線の種類などの表示態様の違いにより、関連性評価値が示される。関連性が大きい素材コンテンツ間ほど、結びつきが強いように表現されることが考えられる。
 図7の例では、素材コンテンツCT1とCT2は関連性が高いこと、素材コンテンツCT4,CT8間は関連性が比較的低いこと、素材コンテンツCT9は他の素材コンテンツとの関連性が無いこと、などが結びつきを示す線の本数や種類、あるいは線の有無などにより表現されている。
 もちろん、各素材コンテンツの配置位置の遠近、方向、あるいは結びつきを示す線に数値を付記するなどにより関連性評価値が表現されるものでもよい。
 例えば評価部15は、このような画像を表示させる関連性提示情報を生成し、ストーリー生成部16に提供する。
 ストーリー生成部16は、このような関連性提示情報をユーザサイドに提供し、UI部22によりユーザに提示させることができる。
 ユーザはUI部22により、図7のような表示内容を確認するとともに、操作により評価を修正することも可能である。
 例えばユーザ自身が重要なシーンの画像であったり、好きな画像であったりする素材コンテンツの個別評価値を高い値に修正したり、関連性があるのに関連性が小さく評価されている素材コンテンツ間について、より高い関連性評価値となるように操作したり、関連性が無いのに関連性があると評価されている線を切断したり、といったような操作を可能とする。
 このような操作情報は、図5に示すフィードバック情報dFBとしてサーバ装置10側にフィードバックされ、評価部15による評価情報を修正できるようにする。またこのようなフィードバック情報dFBは、学習部17にも入力されて学習され、例えばストーリー生成部16による素材コンテンツの選択のための関数に反映されたりする。
 なお図7の例では、各素材コンテンツについて個別評価値と関連性評価値を表現するものとしたが、関連性評価値に基づく関連性のみを表現するものでもよいし、各個別評価値を提示するものでもよい。
 すなわち関連性提示情報は、素材コンテンツに関する評価や関連性などの何らかの情報をユーザに提示できるものであればよい。またその提示内容の全部又は一部についてユーザがフィードバック情報dFBを提供するための操作を行うことができるようなユーザインタフェースが形成されることが望ましい。
 以上の図7は、素材コンテンツ同士の間の関連性を示す例としたが、関連性の表示態様は各種考えられる。
 図8は、キー要素を提示して、それに関連する素材コンテンツを示す例である。
 図8の場合、「喜」「怒」「哀」「楽」をそれぞれキー要素とし、「喜」に該当する素材コンテンツCT1,CT2、「怒」に該当する素材コンテンツCT7,CT8、「哀」に該当する素材コンテンツCT3、「楽」に該当する素材コンテンツCT4,CT5,CT6を提示する例としている。
 図9もキー要素を提示する例であり、この場合は或るイベント(例えばピアノ発表会)をキー要素とし、当該イベントについて関連する素材コンテンツCT1,CT2,CT3,CT4,CT5を提示する。またこの例では、直接イベントに対応しないが、イベントに関連する素材コンテンツCT4,CT5に関連する素材コンテンツCT6,CT7,CT8なども提示されるようにしている。
 図10は複合的なキー要素を用いる例である。キー要素として、ユーザAと人間関係における「家族」「友人」等を提示し、またユーザAの趣味としての「サッカー」も提示し、これらの人間関係やキー要素に関連する素材コンテンツや、素材コンテンツ同士の関連性を提示する例である。
 以上のように関連性提示情報による提示例は多様に考えられるが、ユーザにとって各素材コンテンツの関連性を認識しやすくできることが望ましい。もちろん図8、図9、図10のような例でも、図7で述べたように個別評価値を表示したち、関連性を異なる態様で表現してもよい
<4.コンテンツ補完を含む自動制作処理>
 サーバ装置10において特にストーリー生成部16の機能によって行われるコンテンツ自動制作処理の具体例を説明する。
 図11はサーバ装置10としての情報処理装置よる感動コンテンツの自動制作処理を示している。
 ステップS101でサーバ装置10は、トリガに応じて制作開始判定を行う。このトリガとは、図6のワークフローWF3で説明したユーザからの依頼受信に応じての開始判定の処理や、ワークフローWF5で説明したイベント等に応じての開始判定の処理となる。
 ステップS102でサーバ装置10は、今回制作する感動コンテンツのストーリー設定処理を行う。
 ストーリー設定処理の詳細な例を図12に示す。
 図12のステップS120でサーバ装置10は、例えば図4で例示したようなストーリーの組み立て処理を行い、またそのストーリーを構成する各シーンに適用する素材コンテンツの選択処理を行う。
 ストーリーの組み立てとは、或るテーマとする出来事について、起承転結を設定し、図4のチャプターCH1からチャプターCH5のような設定を組み立てる処理となる。
 また各チャプターに用いる1又は複数の素材コンテンツを選択する。
 例えば感動コンテンツ制作対象のユーザに対応するDBに記憶された素材コンテンツのうちで、各チャプターのシーン(例えば1つのチャプターは1又は複数のシーンで構成されるとする)に適用できそうな候補コンテンツを抽出する。この場合には、例えばユーザ情報からユーザやその家族などの趣味、嗜好が判定できる場合、そのユーザ等の趣味に合致する画像とされた素材コンテンツを抽出することが有効である。
 そして各シーンについて使用する素材コンテンツを、候補コンテンツの中から選択する。もちろんこの選択にもユーザ等の嗜好を反映させることが望ましい。
 このようなステップS120のより具体的な処理例については図21で後述する。
 ステップS120の処理でストーリーの設定とそれに応じた素材コンテンツの選択を行ったら、サーバ装置10はステップS121で、素材コンテンツの不足があるか否かを判定する。
 ステップS120の処理でストーリー設定もでき、しかも必要な素材コンテンツも全て用意できたと判定した場合は、ステップS124に進んでコンテンツ補完は不要と判定し(例えば補完フラグをオフし)、図12の処理を終える。つまり図11のステップS102からステップS103に進む。
 この場合、補完フラグがオフであることで、サーバ装置10はステップS103で素材コンテンツ補完は不要であると判定してステップS105に進み、編集処理を行うことになる。
 この編集処理では、サーバ装置10は、ストーリー設定処理で設定したチャプター構成と、選択した素材コンテンツを使用して、一連のストーリーを構成する感動コンテンツを生成する。例えば選択した各素材コンテンツとしての動画から、必要なシーンを切り出したり、画質調整を行ったり、画像エフェクトを加えたりした上で、チャプターの進行に合わせて素材コンテンツをつなぎ合わせていく。
 このような編集処理で感動コンテンツを完成させたら、サーバ装置10はステップS106として、ユーザサイドへの感動コンテンツの提供処理を行う。
 例えば感動コンテンツとしてのムービーのダウンロード、あるいはストリーミングなどによりユーザが視聴できるようにする。
 以上が図6のワークフローWF3、WF5で例示したような場合の処理手順となる。
 一方、図12のステップS121で素材コンテンツが不足していると判定される場合がある。
 例えば或るシーンに適用する素材コンテンツが存在しない場合である。あるいは、内容としては或るシーンに適合する素材コンテンツがあるが、評価値(個別評価値や関連性評価値)が低くて使用に適さないとされたり、画質的が低かったりすることにより、適切な素材コンテンツが存在しないと判定する場合もある。
 但し、素材コンテンツが一部不足していても、例えばそのシーンを削除してもストーリー構成上、大きな変化は無いとか、さほど重要なシーンでもないような場合、素材コンテンツ不足を許容できる場合もある。また、ユーザによって意図的にそのシーンの素材コンテンツは不要と判断する情報が入力される場合もある。その場合も不足は許容される。言い換えればそのような場合は、不足を許容すること、つまり或るシーンをわざと含まないようにすることが、よりユーザの意図に沿ったものとなると考えられる。
 サーバ装置10は素材コンテンツ不足が許容できる範囲と判定した場合は、ステップS122からステップS124に進み、上記同様に図11のステップS105に進む。
 ところが重要な素材コンテンツが不足している場合、あるいはシーン構成に必要とした素材コンテンツの不足は許容しないようなロジックを採用する場合は、サーバ装置10は図12のステップS123に進むことになり、ストーリー変更が可能であるか否かを判定する。
 例えばサーバ装置10は、素材コンテンツが不足しているシーンのストーリー上の重要性や、チャプター内でのストーリーの部分的変更の可能性、などの評価を行って、ストーリー変更が可能であるか否かを判定する。学習に基づくユーザの嗜好を判定要素に加えてもよい。例えば今回のユーザであれば、このようなシーンは重要ではない、といったような評価が可能であれば、ストーリー変更を可能とするなどである。
 ストーリー変更が可能である場合は、ステップS123からステップS120に戻ってストーリーの組み立て及び素材コンテンツの選択をやり直すこととする。
 素材コンテンツが不足しており、その不足は現状のストーリーでは許容できず、ストーリー変更も適切ではないと判定した場合、サーバ装置10はステップS123からステップS125に進み、素材コンテンツ補完処理が必要と判定し(例えば補完フラグをオンとし)して図12の処理を終える。つまり図11のステップS102を終了してステップS103に進む。
 この場合、補完フラグがオンであることで、サーバ装置10はステップS103で素材コンテンツ補完が必要と判定してステップS104に進み、素材コンテンツ補完処理を実行する。
 つまりこのような場合が、図6のワークフローWF4,WF6で説明した状況となる。
 図11のステップS104で行われる素材コンテンツ補完処理の例を説明する。
 図13は素材コンテンツ補完処理として、ストーリーを構成する素材コンテンツの記録を外部機器に対して要請する処理を行う例である。
 ステップS140でサーバ装置10は、外部機器に対して、素材コンテンツの記録、すなわち撮影による画像等の記録を要請する処理を行う。
 外部機器とは、図1に示した各種機器であり、図2の素材コンテンツ提供部20に該当する機器である。
 例えばサーバ装置10は、ユーザに対するメッセージとして、外部機器である携帯端末5等に対して「○○のシーンの動画を撮影してください」というような要請内容を送信する。
 ユーザの家族や友人の携帯端末5等に対して、「Aさんの○○のシーンの動画を撮影してください」という要請メッセージを送信することも考えられる。
 あるいはサーバ装置10は、携帯端末5のアプリケーション、エージェント装置8やロボット、監視カメラ9などに対して目的のシーンの撮像あるいは提供を指示する制御情報を送信するようにしてもよい。
 すなわちステップS140の素材コンテンツ要請処理は、何らかの外部機器に対して、必要なシーンの素材コンテンツを記録し、サーバ装置10に転送する(感動コンテンツ制作のための素材コンテンツとして使用できるようにする)ことを依頼又は指示する処理となる。
 ステップS140で要請処理を行った後、サーバ装置10はステップS141で素材コンテンツの入力を待機する。
 素材コンテンツの入力待機中は、サーバ装置10はステップS142でタイムアウト又は素材コンテンツの入力をチェックし、またステップS143で再要請のタイミングを待機する。
 例えば要請から1週間経過などをタイムアウトとし、またタイムアウトに至る前に、所定のタイミングで再要請を行うこととする。
 タイムアウトの期限に至るまでにおいて、再要請のタイミングとなった場合、サーバ装置10はステップS140に戻って、再度、素材コンテンツ要請処理を行う。この場合、前回と同じ要請処理としてもよいし、要請先の外部機器を変更したり、要請する内容を変更したりすることも考えられる。
 素材コンテンツの要請に応じて素材コンテンツが入力された場合、あるいはタイムアウト期限に至っても素材コンテンツが入力されない場合、サーバ装置10はステップS142から素材コンテンツ補完処理を終える。
 図11のステップS104として例えば図13のような素材コンテンツ補完処理を行ったら、ステップS102のストーリー設定処理に戻る。
 この場合、図12で説明した処理を再実行するのであるが、もし必要な素材コンテンツが取得できた場合、サーバ装置10は、ステップS120では、素材コンテンツが不足していたシーンについて、新たに取得した素材コンテンツを充足する処理を行えばよい。
 また、素材コンテンツ補完処理がタイムアウト終了した場合や、あるいは入力した素材コンテンツが品質的に適用できない場合、さらにはシーン内容として適切でないと判定した場合などは、ストーリーの組み立てからやり直すことが考えられる。
 例えば図13のような素材コンテンツ補完処理を経て、図12のステップS120の処理が行われた結果、ステップS121又はステップS122からステップS124に進んだ場合、図11の処理としてステップS105の編集処理に進み、感動コンテンツが生成されることになる。
 図14は素材コンテンツ補完処理の他の例を示している。
 これは、素材コンテンツを外部機器に要請することに先立って、素材コンテンツを抽出する対象を広げる例である。
 ステップS150でサーバ装置10は、ユーザ情報に基づいて、今回の制作対象のユーザに適した他人に関連づけられたDBやパブリックなDBを参照して、素材コンテンツが不足しているシーンに適用できる素材コンテンツを探索する処理を行う。
 例えば基本的には図12のステップS120で、制作対象のユーザに関連づけられたDBから素材コンテンツを抽出するものとする。そして素材コンテンツが不足したときは、素材コンテンツを探索する対象を他人についてのDBやパブリックなDBに広げるものとする。
 他人とは、ユーザ情報に基づき、当該対象のユーザの家族、友人、同僚などとする。他人に関連づけられたDBとは、当該サービスにおいて、これらの「他人」に該当する人が撮像した画像などを管理しているDBである。
 またユーザの趣味・嗜好、例えばユーザやその家族などがどのような画像を好むか、というような観点を加味して素材コンテンツの探索を行うことが考えられる。
 例えばユーザ情報からユーザやその家族などの趣味、嗜好が判定できる場合、そのユーザの趣味に合致する画像であるとか、ユーザが好むシーンや画像内容と判定又は推定される素材コンテンツを探索する。
 ステップS151でサーバ装置10は、他人に関連づけられたDBやパブリックなDBから、今回必要な素材コンテンツを発見できたか否かを判定し、発見できた場合は素材コンテンツ補完処理を終了して、図11のステップS102に進む。
 図14のステップS151で、必要な素材コンテンツを発見できなかったと判定した場合は、サーバ装置10はステップS152に進み、外部機器に対する素材コンテンツ要請処理を行う。
 そしてステップS153の入力待機、ステップS154の素材コンテンツの入力又はタイムアウト、ステップS155の再要請待機の処理を行う。これらステップS152からステップS155の処理は図13のステップS140からステップS143の処理と基本的には同様である。
 但し、ステップS152での素材コンテンツ要請処理でも、ユーザやその家族の趣味・嗜好、例えばユーザがどのような画像を好むか、というような観点を加味して素材コンテンツの要請を行うことが考えられる。
 例えばユーザ情報からユーザやその家族などの趣味、嗜好が判定できる場合、そのユーザの趣味に合致する画像内容であるとか、ユーザが好むと判定又は推定されるようなシーンや画像内容の撮影を要請する。
 例えばジョギングを趣味とし、走ることが好きと判定又は推定されるユーザに対して、子供の運動会でも「是非リレーの撮影をして下さい」とか、「ゴールの近くで撮影をお勧めします」というような推奨メッセージを送る。
 これによりユーザが好む内容の素材コンテンツを得やすくできる。
 以上のように外部機器に対する素材コンテンツ要請処理を行う前に、素材コンテンツを探索するDBの範囲を広げることで、迅速に素材コンテンツを充足できる可能性を高めることができる。
 他人が撮像した画像なども使用することで、例えば感動コンテンツ内に、ユーザ本人が意図していないような画角の画像が挿入されることが生じるなど、コンテンツの幅が広がることも期待できる。
 図15も素材コンテンツ補完処理の他の例である。
 ステップS160でサーバ装置10は、ユーザ情報に基づいて、今回の制作対象のユーザに適合する他人に関連づけられたDBやパブリックなDBを参照して、素材コンテンツが不足しているシーンに適用できる素材コンテンツを探索する処理を行う。図14のステップS150と同様の処理である。
 ステップS161でサーバ装置10は、他人に関連づけられたDBやパブリックなDBから、今回必要な素材コンテンツを発見できたか否かを判定し、発見できた場合は素材コンテンツ補完処理を終了して、図11のステップS102に進む。
 必要な素材コンテンツを発見できなかったと判定した場合は、サーバ装置10はステップS161からステップS162に進み、フェイク画、切り出し画の取得処理を行う。
 ここでいうフェイク画とは、実際に被写体を撮影した画像ではないという意味であり、合成画像、CG画像、アニメーション画像などを指す。
 サーバ装置10は画像合成処理、CG処理などにより、シーンに必要な画像を生成する。あるいはサーバ装置10は、そのような画像生成を外部機器に指示して実行させ、生成された画像を取得する。
 あるいはサーバ装置10は、他の素材コンテンツの一部の画像を切り出すなどして、シーンに適応させる素材コンテンツとする。例えば監視カメラの映像や他人の撮像画像などから該当のユーザが写っているシーンを切り出すことも想定される。
 サーバ装置10は、これらの処理を行うことで、不足していた素材コンテンツを生成して、該当のシーンに用いるようにする。
 サーバ装置10は、このステップS162の処理を経て素材コンテンツ補完処理を終了し、図11のステップS102に進む。
 なお、この図15のステップS162の処理は、例えば図13あるいは図14において外部機器に対する素材コンテンツ要請処理を行った場合に、タイムアウトとなった際に実行されるようにしてもよい。
<5.制作前のレコメンド/補完処理>
 以上の図11から図15の処理は、感動コンテンツの制作を開始した後の処理として説明したが、サーバ側が感動コンテンツの制作機会をとらえてユーザに画像撮像等をレコメンドするということも可能である。このような場合の処理例を説明する。
 図16は、サーバ装置10がユーザ情報に基づいて、ユーザに対するレコメンド時期を判定し、素材コンテンツ補完処理を行う例である。
 ステップS201でサーバ装置10は、今後発生する出来事に応じた感動コンテンツのための素材取得のレコメンド時期判定を行う。
 例えば図6のワークフローWF5、WF6で説明した制作のトリガと同様に、イベント情報、スケジュール情報等を元に、感動コンテンツの制作機会となるような出来事をチェックする。そして、そのような感動コンテンツの制作に用いる画像等の撮影のレコメンド機会となったか否かを判定する。
 またイベント等でなくても、ユーザのライフステージに合わせてレコメンド機会を判定してもよい。例えば年齢の進行、家族構成の変化、あるいは結婚や出産などの情報をチェックし、ライフステージの節目などを、その記念となるような感動コンテンツの制作機会とし、それに近いタイミングをレコメンド機会と判定する。
 例えばサーバ装置10は、或る対象ユーザについて、子供の運動会の一週間前、対象ユーザの結婚式の3日前など、素材となり得る出来事の前の時点をレコメンド時期と判定する。
 レコメンド時期と判定したら、サーバ装置10はステップS202からステップS203に進み、将来的な感動コンテンツ制作のための素材コンテンツ補完処理を行う。
 この素材コンテンツ補完処理は、基本的にはユーザに対して、これからユーザが参加するイベント等において、「このようなシーンの撮影を行って欲しい」というようなことを要請する処理となる。
 ステップS203の素材コンテンツ補完処理の例を図17に示す。
 サーバ装置10はステップS220で、レコメンド対象のユーザ情報を参照して、適合するコンテンツ(素材コンテンツや感動コンテンツ)を他人やパブリックのDBを参照して検索する。
 例えば対象のユーザにとって、来週が子供の運動会であるといった場合に、他人の運動会のコンテンツを抽出する。この場合の「他人」とは、ユーザの関係者である必要は無く、全く無関係の人のDBを広く参照する対象とするとよい。
 ステップS221でサーバ装置10は、抽出した他人のコンテンツにおいて、評価の高いシーンや画像内容などを分析し、感動要素を特定する。評価とは、例えば感動コンテンツに対するフィードバック情報dFBや、素材コンテンツの評価値などを用いることもできるし、一般的な基準で、同様のイベント(例えば運動会)でよく用いられるシーン、画角などを高評価なものとしてもよい。
 例えば対象のユーザにとって、来週が子供の運動会であるといった場合に、他人の運動会のコンテンツを参照し、評価の高いシーンや画像内容などを特定し、感動要素とする。
 ステップS222でサーバ装置10は、ステップS221の分析に基づいて撮影推薦データを生成する。例えば、評価の高いシーン、アングルなどに応じて、撮影手法、アドバイス等を含む情報として、テキストや画像データを用いて撮影推薦データを生成する。
 そしてステップS223でサーバ装置10は、素材コンテンツ要請処理を行う。この場合、レコメンド内容とともに、撮影推薦データをユーザの携帯端末5等に対して送信する処理となる。
 例えば「来週、お子様の運動会です。コンテンツ制作しませんか」というレコメンドメッセージとともに、運動会での撮影手法などとして、他人のコンテンツ等を参考にして生成した撮影推薦データを送信する。
 このようなレコメンドをイベントに先だって行うことで、ユーザがより望ましい素材コンテンツを提供しやすいものとなり、またその後に制作する感動コンテンツの内容も満足度の高いものとなることが期待される。
 特に他人の撮り方を参考にできるといった要素が入ることになるため、普段、撮影等に慣れていないユーザにとっても有用な情報を提供できることになる。
 図18は、同じく図16のステップS203の処理の例を示している。
 ステップS230でサーバ装置10は、レコメンドを行うイベント情報に基づいて、仮ストーリーを組み立てる処理を行う。
 そしてステップS231でサーバ装置10は、設定した仮ストーリーに応じたシーンとして、どのような素材コンテンツが必要かを設定し、そのようなシーンの内容を示す撮影推薦データを生成する。
 そしてステップS232でサーバ装置10は、素材コンテンツ要請処理を行う。この場合、レコメンド内容とともに、撮影推薦データとして、シーンの内容を提示するような情報をユーザの携帯端末5等に対して送信する処理となる。
 例えば「来週、あなたのライブステージです。コンテンツ制作しませんか」というレコメンドメッセージとともに、設定したストーリーに応じて「会場風景」「ステージショット」「楽屋風景」「打ち上げの様子」など、望ましいシーンの内容を提示するようにする。
 このようなレコメンドをイベントに先だって行うことで、ユーザがストーリーに応じた素材コンテンツを提供しやすいものとなり、結果としてその後に制作する感動コンテンツの内容も満足度の高いものとなることが期待される。
<6.素材コンテンツの評価とフィードバック>
 続いて、サーバ装置10における素材コンテンツの評価とフィードバック処理について説明する。
 先に図5を用いて説明したように、評価部15は素材コンテンツについて関連性評価値や個別評価値を設定する。またユーザからのフィードバック情報dFBに応じて対応処理、すなわち評価値の更新処理をおこなう。
 このように評価値の設定や更新を行うのは、サーバ装置10が多数のユーザについての多数の素材コンテンツとして膨大なコンテンツ(想い出の動画や写真)を保存管理することを考えたときに適切にコンテンツ制作に使用できるようにすることが一つの理由となる。例えばそれぞれの素材コンテンツは断片的でストーリー性を持たないため、単に保存しているのみでは埋没してしまう可能性が高い。
 そこでAI処理で、視点の異なる分析結果をマイニングマップ化することで、重要度や関連度からストーリー性の高いコンテンツの明示や結合の度合いを評価値として表現できるようにする。これにより感動コンテンツ生成の際に価値ある素材コンテンツを選択しやすくし、自動制作される感動コンテンツの品質向上を図る。
 また評価値を設定するだけでなく、関連性提示情報として可視化し、ユーザによるフィードバックを可能とすることで、よりユーザ個人に適するように、関連性評価値や個別評価値の修正や、感動コンテンツ制作のための評価関数の更新などを行うこととする。
 まず図19は、サーバ装置10が評価部15の機能により行う素材コンテンツ評価処理を示している。
 ステップS300でサーバ装置10は、素材コンテンツに関するフィードバック情報dFBの入力を確認する。フィードバック情報dFBがあった場合はステップS320でフィードバック対応処理を行う。これについては後述する。
 フィードバック情報dFBが入力されていない場合は、サーバ装置10はステップS301に進み、処理対象とする素材コンテンツの特定を行う。これは、例えば新たにアップロードされた素材コンテンツなど、保存しているが評価処理を行っていない素材コンテンツを今回の評価処理の対象として特定することになる。但し、すでに評価値が設定された素材コンテンツについて、時間経過などに応じて再度評価処理を行うために、処理対象とすることもある。
 ステップS302でサーバ装置10は、評価処理の対象とした素材コンテンツについて個別評価値を算出する。上述したように個別評価値とは、その素材コンテンツ自体の単体での画像自体やシーンの価値、内容の重要性などを評価する値である。このためサーバ装置10は、画像解析やユーザ情報の分析などをおこない、喜怒哀楽等の該当性、撮像時に追尾対象(フォーカス対象)とされたか否か、画像内容が突発的な事象であるか否か、ポジティブな要素を持つ画像であるか否か、ネガティブな要素を持つ画像であるか否か、ユーザの視聴履歴として再生回数の多寡、などを指標として所定の演算で個別評価値を算出する。
 またユーザ情報からユーザやその家族等の趣味、嗜好が判定できる場合、そのユーザやその家族等の趣味・嗜好を評価値に反映させることが望ましい。例えば趣味に合致する画像であるとか、ユーザが好むシーンや画像内容と判定又は推定されるものに、高い個別評価値が設定されるようにする。
 ステップS303でサーバ装置10は、当該素材コンテンツについてキー要素を設定する。例えば特定感情、関係者の別、イベントタイトルなどのキー要素を設定する。これらは画像内容の解析結果やユーザ情報、画像に付加されたメタデータ等を参照して設定することができる。
 ステップS304でサーバ装置10は、キー要素を用いて関連する素材コンテンツを抽出する。例えば評価処理対象の素材コンテンツと同じイベントで撮影された他の素材コンテンツや、評価処理対象の素材コンテンツと同じ特定の関係者(例えば子供)について撮影された他の素材コンテンツなどを抽出する。
 ステップS305でサーバ装置10は、評価処理対象の素材コンテンツについて関連性評価値を算出する。
 例えばキー要素が共通の素材コンテンツとの間の関連性の度合いを数値化して関連性評価値を算出する。
 関連性の度合いとは、例えば出来事の因果関係、時系列関係、出来事に関連する人物や物品の存在などの画像内容から判定又は推定できる。
 またユーザ情報からユーザやその家族等の趣味、嗜好が判定できる場合、そのユーザや家族等の趣味・嗜好を評価値に反映させることが望ましい。因果関係のある素材コンテンツ同士についても、ユーザの趣味に関する画像であるとか、ユーザが好むシーンや画像内容を含むと判定又は推定される素材コンテンツ同士の間に、高い関連性評価値が設定されるようにする。
 ステップS306でサーバ装置10は、関連性提示情報を生成又は更新する。これは、例えば図7から図10で説明したような関連性提示情報を新たに生成する処理や、既存の関連性提示情報に今回評価対象とした素材コンテンツを組み込む処理などを行うこととなる。
 ステップS307でサーバ装置10は、処理対象の素材コンテンツについて、算出した個別評価値、関連性評価値、キー要素を保存する。これにより評価処理を終える。
 素材コンテンツに関するフィードバック情報dFBが入力された場合、サーバ装置10はステップS320のフィードバック対応処理として、例えば図20の処理を行う。
 ステップS321でサーバ装置10は、フィードバック対象の素材コンテンツを特定する。
 ステップS322でサーバ装置10は、フィードバック対として象特定した素材コンテンツについて、フィードバック情報dFBに基づいて個別評価値の修正が必要か否かを判定する。
 必要である場合はサーバ装置10はステップS323に進み、個別評価値の更新処理を行う。
 ステップS324でサーバ装置10は、フィードバック対象として特定した素材コンテンツについて、フィードバック情報dFBに基づいて個別評価値の修正が必要か否かを判定する。
 必要である場合は、サーバ装置10はステップS325に進み、その素材コンテンツについて設定したキー要素の更新処理を行う。
 ステップS326でサーバ装置10は、フィードバック対象として特定した素材コンテンツについて、フィードバック情報dFBに基づいて関連性評価値の修正が必要か否かを判定する。
 必要である場合は、サーバ装置10はステップS327に進み、その素材コンテンツについて関連する素材コンテンツを再設定する。すなわち関連性提示情報で関連性が提示される他の素材コンテンツである。
 ステップS328でサーバ装置10は、新たに設定した他の関連する素材コンテンツとの間における関連性評価値を算出し、更新する。
 ステップS329でサーバ装置10は、関連する他の素材コンテンツや、それらとの間の関連性評価値の更新に応じて、関連性提示情報を更新する。
 この図20のような処理を行うことで、サーバ装置10の評価部15で設定した評価値は、逐次ユーザからのフィードバック情報dFBに応じて更新されていくことになる。
 ところで、先にも説明したように、ユーザからのフィードバック情報dFBは、素材コンテンツの評価値に反映されるだけでなく、感動コンテンツ制作にも反映される。
 図21,図22により、先に図12で説明したストーリー設定処理におけるステップS120の処理を詳しく述べるとともに、フィードバック情報dFBが反映されるようにする例を説明する。
 図12のステップS120としてストーリーの組み立て及びストーリーに応じた素材コンテンツの選択を行うと説明したが、例えばサーバ装置10は具体的には図21のような処理を行う。
 ステップS401でサーバ装置10はストーリー組み立てを行う。
 ストーリーは図4の例のように組み立てることが想定される。例えば起承転結に該当する構成を配置するストーリー組み立てを行う。
 また、例えば或るイベントに関して図18のステップS230で仮ストーリーを組み立てた場合、それを基本にしてストーリーの組み立てを行うとよい。特にそのイベントのシーンに適した素材コンテンツがユーザから提供されている可能性が想定されるためである。
 ステップS402でサーバ装置10は候補コンテンツの収集を行う。つまりストーリーを構成する各チャプターについて、使用する1又は複数の候補コンテンツを、制作の対象のユーザのDB等から収集する。この時点では、1つのシーンに使用する候補として、複数の素材コンテンツを候補コンテンツとしてもよい。例えば評価値にかかわらず、シーン内容やユーザ情報、メタデータ等に基づいて候補コンテンツを収集する。
 ステップS403で、ストーリーを構成する各シーンに使用する素材コンテンツの選択を行う。例えば1つのシーンにつき、多数の候補コンテンツのうちで個別評価値の高い素材コンテンツを選択するという手法でもよいが、より多面的に関連性などを反映することが望ましい。例えば各シーンについて個別評価値の高い素材コンテンツを選択することに加えて、選択される各素材コンテンツ同士の関連性評価値も反映させ、選択結果としての複数の素材コンテンツを最適化する。また素材コンテンツの組み合わせ、順序、時間長なども選択の要素とする。
 このような個別評価値、関連性評価値、時間長、順序などの要素を含む評価関数を用いてストーリーを構成する各シーンに使用する素材コンテンツの選択処理を行う。
 なお、基本的には個別評価値や関連性評価値が高い素材コンテンツが選択されやすくなるが、これらの評価値に対して、図19、図20で説明したようにユーザ操作に基づくフィードバック情報dFBに応じた更新が加えられていることで、ユーザの嗜好に適った素材コンテンツが選択されやすい傾向となる。
 また、そもそも図19の個別評価値や関連性評価値の設定の際に、ユーザ情報から判定或いは推定できるユーザその家族等の嗜好(どのような画像、シーンを好むか等)を反映させた評価値設定を行うことで、シーンに適用する素材コンテンツとしては、ユーザの嗜好が反映されやすくなる。
 ステップS404でサーバ装置10は、ステップS403での素材コンテンツの選択結果を元に、編集データを生成する。
 編集データとは、選択された素材コンテンツの情報、素材コンテンツのつなぎ合わせる順序の情報、各素材コンテンツに対する処理(画質調整、切り出し、エフェクト等)の情報などを含むものとする。すなわち感動コンテンツ制作の設計情報である。
 例えばこのような処理が図12のステップS120として行われ、後に、図11のステップS105で編集情報に基づく編集処理が実行される。
 ここで、ユーザ操作に基づくフィードバック情報dFBが入力された場合、学習部17及びストーリー生成部16の機能により図22の処理が行われるようにすることができる。
 サーバ装置10はフィードバック情報dFBが入力された場合、図22の処理をステップS420からステップS421に進める。
 もしフィードバック情報dFBが、現在制作中の感動コンテンツについてのストーリーの変更を求めるものであった場合、ステップS421から図21のステップS401に進み、ストーリーの組み立てをやり直すことになる。例えばフィードバック情報dFBに基づいて、一部のシーンをカットしたり、入れ替えたりするようなことが想定される。
 なお、制作中の感動コンテンツに対するフィードバック情報dFBとは、例えばサーバ装置10が感動コンテンツの本納品の前にユーザに仮視聴させたような場合に、ユーザ操作に応じて送信されてくることが想定される。
 フィードバック情報dFBが今回の素材コンテンツの変更を要する内容であった場合は、サーバ装置10は図22のステップS422から図21のステップS403に進む。
 これによりステップS403の素材コンテンツの選択をやり直す。
 フィードバック情報dFBは必ずしも制作中の感動コンテンツに反映させるものとは限らない。例えば関連性提示情報による提示に対するフィードバック情報dFBの場合もある。但し、ユーザによる操作は、ストーリー構成にも影響するため、将来のストーリー生成に対して学習させることが望ましい。例えば将来のコンテンツ制作に反映させるような内容であった場合、サーバ装置10はステップS423からステップS424に進み、評価関数の学習/更新処理を行う。
 例えば当該ユーザに対して感動コンテンツ制作の際に用いる評価関数の一部の係数や変数要素を更新する。これにより例えば図21のステップS403での素材コンテンツ選択の方向性や、重視すべき要素が修正される。つまり、そのユーザの好みに応じて、素材コンテンツの選択処理も適応化されていくことになる。
 なお、以上では主に評価部15、学習部17の機能として評価関数の生成、学習/更新処理を行うことで、生成する感動コンテンツをユーザに適応化する例を説明してきたが、以上のような処理に代えて、機械学習、ディープラーニングを用いて学習された学習モデルを用いて、生成する感動コンテンツがユーザに適応されるようにすることも考えられる。
 例えばストーリー生成部16が評価部15に代替する機能を含み、素材コンテンツについての評価、分類、抽出を行いながら感動コンテンツ生成を行うようにする。
 具体的にはストーリー生成部16が、ユーザに関する各種の情報に基づくディープラーニングを行い、そのユーザに適合する学習モデルを生成する。
 そして各素材コンテンツについて学習モデルを適用して分類や抽出、さらにはストーリーに適用できる素材コンテンツであるか否かが判定されたうえ、関連すると判定された素材コンテンツを用いて感動コンテンツ生成を行うようにする。
 このように学習モデルの生成機能や、学習モデルを用いたコンテンツ生成機能を、評価部やストーリー生成部16として備えるようにする。
 また学習部17として、ユーザのフィードバック情報dFBに基づいて再学習を行い、学習モデルを更新していくことで、より望ましい感動コンテンツ生成に好適となる。
<7.ネガティブ/ポジティブコンテンツの管理>
 素材コンテンツとしてネガティブコンテンツやポジティブコンテンツとして分類できるものがある。
 ネガティブコンテンツは、通常、ユーザにとっては、あまり視聴したい内容ではないことが想定される。但し図4で説明したように、パーソナルなコンテンツなどとしてストーリー構成すること考えると、ネガティブコンテンツは視聴時の感動を高めるために有用な素材コンテンツとなり得る。
 一方で、例えばサーバ装置10がクラウドストレージとして機能し、ストレージ10aにおいてユーザ個人の記憶領域を提供するような形態を考えると、ユーザにとって、ネガティブコンテンツも他の素材コンテンツと同様に容易に視聴でき、望ましくないとされることもある。
 そこでサーバ装置10では、記憶管理部18の機能により、ネガティブコンテンツは他の素材コンテンツと区分されて保存管理されるようにしている。
 例えばユーザからのアクセス性が確保されない、あるいはサーバ装置10からしても、ストレージ10aに比較してアクセス性の悪い遠隔ストレージ12を用意し、ネガティブコンテンツはそこに保存されるようにする。
 図23は記憶管理部18の機能によりサーバ装置10が行う素材コンテンツ管理処理を示している。
 ステップS501でサーバ装置10は処理対象の素材コンテンツを特定する。
 ステップS502でサーバ装置10は、処理対象とした素材コンテンツがネガティブコンテンツであるか否かを判定する。
 ネガティブコンテンツであるか否かは、何らかの処理で判定されていればよい。例えば画像に付随するメタデータとして撮影時のユーザのバイタル情報があれば、それに基づいてネガティブな感情が生じているか否かを判定してもよいし、画像解析によるユーザの表情、行動、仕草などから推定することもできる。
 ユーザが閲覧しないことをネガティブな要素ととらえて判定要素に加えてもよい。
 また他の日常的な画像とは異なる特徴をネガティブな要素ととらえて判定要素に加えてもよい。
 また日常画像と日常画像にインターバルがある場合などに、何らかのネガティブな出来事が発生していると推定し、そのようなインターバルな時期の画像にネガティブな要素が存在しやすいとして推定要素に加えることも考えられる。
 なお、このようなネガティブコンテンツの判定と同様の手法でポジティブコンテンツの判定も可能である。
 ステップS502でネガティブコンテンツではないと判定した場合、サーバ装置10はステップS503に進み、当該素材コンテンツについて通常保存を行う。例えばストレージ10aにおいて該当ユーザに関連づけられたDBで管理されるように保存する。
 ステップS502でネガティブコンテンツと判定した場合、サーバ装置10はステップS504に進み、当該素材コンテンツについてネガティブコンテンツに対応した保存処理を行う。例えば遠隔ストレージ12において該当ユーザに関連づけられたDBで管理されるように保存する。
 このようにネガティブコンテンツの場合は、他の素材コンテンツと区別して保存する。
 なおステップS504のネガティブコンテンツ対応保存として遠隔ストレージ12への保存を例に挙げたが、この遠隔ストレージ12とは次のようなストレージが考えられる。
・ストレージ10aとは別体で遠隔地に配置されたストレージデバイス
・サーバ装置10からのアクセス性がストレージ10aよりも低いストレージデバイス
・ユーザからのアクセスが制限されるように管理されたストレージデバイス
・転送レートの低い通信路でアクセス可能なストレージデバイス
・スタンドアロン機器に接続されるストレージデバイス
・ストレージ10aがサーバ装置10から第1のネットワークで接続されることに対し、遠隔ストレージ12はサーバ装置から、第1のネットワークより通信速度の遅い第2のネットワークで接続されるストレージデバイス
 以上は一例であるが、遠隔ストレージ12としては、通常はアクセスが行われないことを想定したものとすることが考えられる。
 またステップS504の処理は、必ずしも遠隔ストレージ12に記録することに限定されない。例えば他の素材コンテンツと同様にネガティブコンテンツがストレージ10aに保存されてもよい。但し、そのアクセスが困難になるような階層化管理を行ったり、暗号化、あるいは特定権限者のみのアクセス許可設定を行ったりするなどして、アクセス性を区別する。
 以上の図23の処理は、ネガティブコンテンツを他の素材コンテンツと区別して保存管理する例としたが、ネガティブコンテンツ、ポジティブコンテンツ、その他の素材コンテンツを区別して管理してもよい。
 その場合、ネガティブコンテンツはストレージを分けるなどしてアクセス性を低くするが、ポジティブコンテンツとその他の素材コンテンツについては、アクセス性は同等でもよい。例えばポジティブコンテンツとその他の素材コンテンツは、ストレージ10aにおいて該当するユーザのDBに同様に保存されるが、ポジティブコンテンツの場合はポジティブコンテンツであることを示すフラグが設定されるなどすればよい。
 また、全ての素材コンテンツをネガティブコンテンツとポジティブコンテンツに分けてもよい。例えばネガティブコンテンツに該当しないものはポジティブコンテンツとして管理してもよい。
 以上のようにネガティブコンテンツが区別して管理されるが、ネガティブコンテンツは、感動コンテンツ制作の素材として用いたい場合に有用になるため、状況に応じて管理状態を変化させることが望ましい。
 そこで図24のような処理を行うことが考えられる。
 ステップS520の逐次保存処理とは、例えば素材コンテンツがアップロードされることに応じて、サーバ装置10が逐次、例えば図23の処理でその素材コンテンツを保存する処理を示している。
 ここで、ステップS521でサーバ装置10は、今回保存した素材コンテンツがポジティブコンテンツであったか否かを確認する。
 ポジティブコンテンツでない場合、つまりネガティブコンテンツ、もしくはネガティブコンテンツでもポジティブコンテンツでもない素材コンテンツであった場合は、図24の処理を終了する。
 ポジティブコンテンツであった場合は、サーバ装置10は処理をステップS522に進め、今回のポジティブコンテンツに関連するネガティブコンテンツの探索を行う。
 例えば今回のポジティブコンテンツが、ユーザが野球の試合で活躍したような内容であった場合は、過去に当該ユーザが練習中に怪我をしたようなシーンのネガティブコンテンツを探索するような処理を行う。
 該当するネガティブコンテンツが発見できなければステップS523から処理を終えるが、該当するネガティブコンテンツが発見された場合は、サーバ装置10はステップS524で、そのネガティブコンテンツの管理状態を変更する処理をおこなう。例えばストレージデバイスを遠隔ストレージ12からストレージ10aに移動させるなど、サーバ装置10にとってのアクセス性を向上させる処理を行う。
 なおサーバ装置10は、図23のステップS504でネガティブコンテンツ対応保存として管理されたネガティブコンテンツは、ストーリー生成部16の処理で候補コンテンツとしてエントリされないものとしてもよい。
 つまりネガティブコンテンツは、無条件では感動コンテンツ制作に使用されないものとする。ただし、ステップS524の処理として、対応するポジティブコンテンツが存在することになった場合に、そのネガティブコンテンツは、候補コンテンツとされうる資格が与えられるように管理状態を変更することが考えられる。つまり、ポジティブコンテンツを引き立たせるというストーリー上で重要性が生じたことで、初めて感動コンテンツ制作に使用可能とするものである。
 ステップS525でサーバ装置10は、ネガティブコンテンツについて今回保存したポジティブコンテンツとの関連性が生じることに応じて、ネガティブコンテンツの評価値を更新する。すなわち関連性評価値、個別評価値を再計算して更新する。
 以上の処理により、ポジティブコンテンツに対応するネガティブコンテンツは、感動コンテンツ制作において或るシーンに適用される可能性を生じさせ、あるいは高めることができる。これにより適切なネガティブコンテンツを使用して自動制作される感動コンテンツのストーリー性を高めることが期待できる。
 図25も同様の趣旨の処理例である。
 ステップS530の逐次保存処理とは、例えば素材コンテンツがアップロードされることに応じて、サーバ装置10が逐次、例えば図23の処理でその素材コンテンツを保存する処理を示している。
 ここで、ステップS531でサーバ装置10は、今回保存した素材コンテンツがネガティブコンテンツであったか否かを確認する。
 ネガティブコンテンツであった場合は、ステップS532でネガティブな事象を登録する処理を行う。例えば或るユーザについて、いつ、どのようなネガティブな出来事があったか、という情報をユーザ情報の一つとして登録しておく。
 ステップS531でネガティブコンテンツではないと判定された場合は、サーバ装置10はステップS533で、今回保存した素材コンテンツが、過去に登録されたネガティブ事象に対応するポジティブコンテンツであるか否かを判定する。
 もし今回保存した素材コンテンツが、過去にステップS532の処理で登録されたネガティブな事象に関連するポジティブコンテンツであった場合は、サーバ装置10はステップS534に進んで、その登録されたネガティブな事象に関連するネガティブコンテンツの管理状態を変更する処理を行う。
 例えばストレージデバイスを遠隔ストレージ12からストレージ10aに移動させるなど、サーバ装置10にとってのアクセス性を向上させる処理を行う。
 この場合もサーバ装置10は、そのネガティブコンテンツについて候補コンテンツとされうる資格が与えられるように管理状態に変更することも考えられる。
 ステップS535でサーバ装置10は、当該ネガティブコンテンツについて今回保存したポジティブコンテンツとの関連性が生じることに応じて、ネガティブコンテンツの評価値を更新する。すなわち関連性評価値、個別評価値を再計算して更新する。
 以上の処理によっても、ポジティブコンテンツに対応するネガティブコンテンツは、感動コンテンツ制作において或るシーンに適用される可能性を生じさせ、あるいは高めることができる。
<8.まとめ及び変形例>
 以上の実施の形態によれば次のような効果が得られる。
 実施の形態の情報処理装置としてのサーバ装置10は、自動制作する感動コンテンツについて、ストーリーを構成する素材コンテンツの記録を外部機器に対して要請する処理を行うストーリー生成部16を備える(図11から図18参照)。
 この処理は、顧客のユーザの個人的な行動、経験等をストーリー上でフィーチャーした感動コンテンツの素材集めに有用な処理となる。特に、どのようなシーンを撮影してほしいか、というような具体的な要請を行うことで、素材コンテンツの収集に好適となる。
 実施の形態では、ストーリー生成部16が感動コンテンツのストーリー設定を行い、使用する素材コンテンツを選択するとともに、素材コンテンツの不足を判定するストーリー設定処理を行い、素材コンテンツの不足と判定することに応じて、外部機器に対して素材コンテンツの記録を要請する処理を行う例を挙げた(図11,図12,図13,図14参照)。
 ストーリーに応じた素材コンテンツの収集を行い、不足の場合に外部機器に記録を要請することで、自動制作コンテンツの制作上、効率良く素材コンテンツ補完処理が実行できる。
 実施の形態では、ストーリー生成部16が顧客とされるユーザに関するレコメンド時期判定処理を行い、レコメンド時期判定処理に応じて、外部機器に対して素材コンテンツの記録を要請する処理を行う例を挙げた(図16参照)。
 即ちコンテンツ自動制作サービスの顧客とされるユーザに関するコンテンツ自動制作の機会を、ユーザのイベントスケジュールやライフステージなどにより判定する。そして判定した時期に応じて素材コンテンツの記録を要請する処理を行う。
 顧客とされるユーザに対して、これから発生するイベントや生活の変化などに応じて、ユーザに対して撮影による画像記録等のレコメンドを行ったり各種機器に記録要請を行ったりすることで、ユーザにとっての思い出や感動に寄与する機会における素材コンテンツを得やすいことになる。このような素材コンテンツを用いることで、ユーザの満足度の高い自動制作コンテンツを提供する可能性を高めることができる。
 なお、顧客とされるユーザに関する時期とは、ユーザ本人だけでなく、家族、友人に関する各種イベントやライフステージに基づく時期も含まれる。
 実施の形態では、ストーリー生成部16がユーザ情報に基づいてユーザの嗜好を判定し、判定した嗜好情報に基づいて、素材コンテンツの記録を要請する処理を行う例を挙げた。例えば顧客とされるユーザ本人やその家族、友人に関するユーザ情報に基づいて嗜好判定を行い、これに基づいて素材コンテンツの記録要請を行う(図14参照)。
 顧客とされるユーザの本人、家族、親戚、友人などについてのユーザ情報に基づいて記録要請を行うことで、視聴者側のユーザの好みに合った素材コンテンツを収集しやすくなり、好みに応じた自動制作コンテンツを実現できる可能性を高めることができる。
 実施の形態では、ストーリー生成部16が、ユーザ情報に基づいてユーザの嗜好を判定し、判定した嗜好情報を選択要素として素材コンテンツを選択する処理を行う例を挙げた。例えば顧客とされるユーザ本人やその家族、友人に関するユーザ情報に基づいて嗜好の判定又は推定を行う。このような嗜好が反映された評価値が設定されることで、嗜好情報を選択要素として素材コンテンツを選択する処理が行われる(図19、図21のステップS403参照)。
 顧客とされるユーザの本人、家族、親戚、友人などについてのユーザ情報に基づくことで、視聴者側のユーザの好みに合った素材コンテンツを、ストーリーに合わせて選択できる。これによりユーザの好みに合った自動制作コンテンツを実現できる可能性を高めることができる。
 実施の形態では、ストーリー生成部16が、ユーザに関するイベント情報に基づいて、素材コンテンツの記録を要請する処理を行う例を挙げた(図16,図18参照)。例えば顧客とされるユーザのイベント情報の種別に応じた適切なシーン等を判定し、適合する素材コンテンツの記録要請を行う。
 イベントとしては、例えばスポーツの試合、発表会、結婚式、子供の運動会、演奏や劇のステージなど、多様な種類があるが、そのイベントに応じて望ましいシーン等が考えられる。そのようなシーンの撮影などを要請することで、より完成度の高い自動制作コンテンツを実現できる可能性を高めることができる。
 実施の形態では、ストーリー生成部16が、ユーザに関するイベント情報に基づいて、素材コンテンツを選択する処理を行う場合がある。
 図18のステップS230でイベントに応じたストーリーが仮に組み立てられ、図21のステップS201でそれを基本にストーリー組み立てが行われる場合、ステップS403で選択される素材コンテンツは、イベント情報に基づいて選択されたものとなる。つまり顧客とされるユーザのイベント情報の種別に応じた適切なシーン等に適合する素材コンテンツの選択が行われる。
 これによりイベントに応じた完成度の高い自動制作コンテンツを実現できる可能性を高めることができる。
 実施の形態では、レコメンド時期判定処理として、ユーザのライフステージに基づく時期判定を行う例を挙げた(図16参照)。例えばユーザのライフステージとして、出生、入学、卒業、就職、結婚、子供の誕生、子供の成長、定年などの時期判定を行い、それに応じて適合する素材コンテンツの選択や記録要請を行う。
 ユーザのライフステージの進行や変化には物語性があり、自動制作コンテンツの制作機会として適している。そこで、ライフステージに応じた時期判定を行うことで、自動制作コンテンツのために好適な素材コンテンツの収集に適したタイミングで撮影等を要請できる。これにより自動制作に望ましい素材コンテンツを収集しやすくすることができる。
 実施の形態では、ストーリー生成部16が、時期判定処理で記録を要請する時期と判定した要因の出来事と、同一の出来事についての他のユーザのコンテンツに基づいて、記録を要請する素材コンテンツの内容を示す推薦データを生成する例を挙げた(図17参照)。
 例えば時期判定処理で記録を要請する時期と判定した要因の出来事とは、例えばユーザのライフステージ上の出来事(入学、卒業、就職、結婚等)や、各種イベントなどである。これらの出来事により、記録を要請する時期と判定した場合、他人で同じ出来事の場合のコンテンツに基づいて、撮影するシーン内容等を推薦するデータを生成する。
 サーバ装置10は、ユーザのイベントやライフステージなどにおいて、同じイベントやライフステージでの他人のコンテンツ(素材コンテンツや自動制作コンテンツ)を参考にして、お勧めの内容を示す撮影推薦データを生成する。そしてユーザの端末装置に送信してユーザに提示させる。これにより、今回の出来事でどのような撮影を行ったらよいか、ユーザは知ることができ、結果として自動制作コンテンツに適した素材コンテンツが得られやすくなるとともに、ユーザの満足度の高い自動制作コンテンツを実現しやすい。
 実施の形態では、ストーリー生成部16が、顧客とされるユーザに関して自動制作するコンテンツのストーリー設定を行い、使用する素材コンテンツを、当該ユーザに対応するDBら選択するとともに、素材コンテンツの不足を判定するストーリー設定処理を行う。そして素材コンテンツの不足と判定されることに応じて、他のDB(例えば他のユーザに対応するDBやパブリックなDB等)から素材コンテンツを探索し、さらに素材コンテンツの不足と判定される場合に、外部機器に対して素材コンテンツの記録を要請する処理を行う例を挙げた(図14参照)。
 これにより、単に顧客ユーザがアップロードした静止画や動画等だけでなく、他の人、例えば友人、家族など近しい人や、全くの他人が撮像した画像、さらにはパブリックな画像など、広く素材コンテンツを探索できる。これにより、より多様な画像ストックを用いてコンテンツ自動制作ができる。また記録要請をなるべく行わないことで、ユーザに手間をかけずに迅速にコンテンツ制作が可能となる可能性を高めることができる。即ち素材コンテンツ補完処理の効率を向上できる。
 実施の形態の情報処理装置としてのサーバ装置10は、アクセス可能な状態に記録された素材コンテンツについて評価値を設定する処理を行う評価部15と、ストーリー設定処理で設定したストーリーを構成する素材コンテンツを、評価値を参照して選択し、選択した素材コンテンツを用いた編集処理により自動コンテンツ制作を行うストーリー生成部16とを備える(図19から図22参照)。
 自動制作コンテンツの制作処理の際に、評価値(個別評価値や関連性評価値)を参照して素材コンテンツが選択されるようにすることで、よりユーザにとって望ましい素材コンテンツを使用する可能性を高めることができ、ユーザの満足度の高い自動制作コンテンツを提供できるようになる。
 実施の形態では、ストーリー生成部16が、設定したストーリーに応じて使用の候補とする素材コンテンツの収集処理を行い、候補として収集した素材コンテンツのうちで評価値を使用して自動コンテンツ制作に使用する素材コンテンツを選択する処理を行う例を挙げた(図21参照)。
 各素材コンテンツに与えられた評価値により、候補コンテンツのうちで今回の自動制作に適した素材コンテンツを容易かつ適切に選択できる。
 例えば、設定した或るシーンに相当する候補コンテンツはシーン内容を基準に収集できるが、その中で、今回の自動制作コンテンツにとって最適な素材コンテンツ、又は今回のユーザに感動を与えるような素材コンテンツを選択するのは画像内容だけでは困難である。そこで、素材コンテンツの関係性や、素材コンテンツ自体の重要性などが反映されている評価値を考慮して選択する。これにより、より望ましいコンテンツ制作が可能となると考えられる。
 実施の形態では、評価部15が素材コンテンツについて、他の素材コンテンツとの関連性を示す関連性評価値を設定する例を挙げた(図19参照)。
 例えば素材コンテンツについて、他の素材コンテンツとの因果関係などの関連性があるような場合に、その他の素材コンテンツとの関連性を示す評価値を設定する。
 各素材コンテンツは単体のみで評価せず、他のコンテンツとの関連性を評価することで、1つの自動制作コンテンツ内で使用されるコンテンツ同士としてのマッチングを適切化し、より感動を与えるようなコンテンツ自動制作が可能となると考えられる。
 実施の形態では、評価部15が素材コンテンツについて単体での個別評価値を設定する例を挙げた(図19参照)。
 各素材コンテンツとして膨大なコンテンツは存在しても、それぞれ重要性は異なる。一般的なシーン品質としての重要性や、ユーザの感情が表れる場面などによる重要性が異なる。そして、自動制作時にそれぞれの候補コンテンツからそのような重要性を判定することは処理負担が大きい。そこでコンテンツ自体の評価値をあらかじめ設定しておき、その評価値を用いて選択できるようにする。これにより自動制作コンテンツ内で使用する素材コンテンツの選択が容易且つ適切化でき、より感動を与えるようなコンテンツ自動制作が可能となると考えられる。
  実施の形態では、評価部15が、素材コンテンツについて、他の素材コンテンツとの関連性を提示する関連性提示情報を設定する例を挙げた(図19、図7から図10参照)。
 例えば図7から図10に例示したように、各素材コンテンツの関連性を示す関連性提示情報を生成することで、ユーザに素材コンテンツの存在やその関係性を提示することができる。ユーザは素材コンテンツの種別や不足などを認識しやすいものとなる。
 実施の形態では、関連性提示情報、関連性評価値はユーザ操作に応じて更新される例を挙げた(図20参照)。
 例えば図7から図10に例示したような形態で関連性提示情報を提示することで、ユーザは素材コンテンツ同士の関連性の適否を確認できる。そして実際には関連性が薄い素材コンテンツ同士の関連性を低くすることなどの操作を可能とし、フィードバック情報dFBに応じた更新処理を行うことで関連性の情報を修正できる。これにより関連性評価値や関連性提示情報をよりユーザに適した適切なものに収束させていくことができる。
 なお個別評価値についてもフィードバック情報dFBに応じて更新させることで、ユーザの趣味、嗜好を反映させる状態に収束させることとなる。
  実施の形態の関連性提示情報は、一の素材コンテンツと他の素材コンテンツを直接結びつけて示すことで素材コンテンツ同士の関連性を示すものとした。
 例えば素材コンテンツ同士を結ぶような画像によりコンテンツ同士の関連性をユーザインタフェース上で提示する(図7から図10参照)。これによりユーザは素材コンテンツ同士の関連性の適否を容易に確認できる。
  実施の形態では、関連性提示情報は、キー要素に対して素材コンテンツが結びつく形態で素材コンテンツの関連性を示す例を挙げた(図8、図9参照)。例えば感情を示す言葉やイベントなどをキー要素とし、或る感情に対応する素材コンテンツ、或るイベントに関連する素材コンテンツ、などというような形態でコンテンツの関連性をユーザインタフェース上で提示する。
 図8のように、喜怒哀楽の感情をキー要素として素材コンテンツの関係性を示したり、図9のように或るイベントをキー要素として素材コンテンツの関係性を示した画像を提供したりすることで、ユーザは、自分の感情、出来事などに応じた素材コンテンツの関連性や、それらの適否を容易に確認できる。
 キー要素としては、他にも、ライフステージ別であったり、特定のキーワードであったり、行動種別であったり、時期、季節、場所、ユーザ年齢など、多様に考えられる。
 実施の形態では、関連性提示情報は、ユーザの人間関係に対して素材コンテンツが結びつく形態で素材コンテンツの関連性を示すものとする例を挙げた(図10参照)。
 例えば図10のように、ユーザAに対して家族に関連する素材コンテンツや、友人に関連する素材コンテンツなどが提示されるようにする。これによりユーザは、自分の人間関係に応じた素材コンテンツの関連性や、それらの適否を容易に確認できる。
 関連する素材コンテンツを提示する人間関係の要素としては、他にも、ユーザAからみて、親、子供、或るサークルのメンバー、同級生、職場の人、趣味の友人、近所の人など、多様に考えられる。
 実施の形態のサーバ装置10は、関連性提示情報に対するユーザ操作を入力し、学習処理を行う学習部17を備えるものとした。
 学習部17は、関連性提示情報に対するユーザからのフィードバック情報dFBを、ストーリー設定に反映させるために学習処理を行う。これにより、ユーザの意思、素材コンテンツの重要性や関連性などを反映したストーリー設定が将来的にできるようになったり、現在制作中の自動制作コンテンツのストーリー修正が可能となったりする。
 実施の形態では、学習部17による学習内容がストーリー修正に反映される例を挙げた。
 図22のステップS421から図21のステップS401に進む場合、学習結果により現在制作中の自動制作コンテンツのストーリー修正が行われることになる。これにより、ユーザにとって好適なコンテンツが制作できる可能性を高めることができる。
 実施の形態では、学習部17による学習内容が素材コンテンツの選択に反映される例を挙げた。
 図22のステップS422から図21のステップS403に進む場合、学習結果により現在制作中の感動コンテンツのストーリーに応じて採用される素材コンテンツの選択のし直しが行われることになる。これによりユーザにとって、より好適な素材コンテンツを用いた自動制作コンテンツを制作できる可能性を高めることができる。
 実施の形態では、学習部17による学習内容が将来のコンテンツ自動制作に反映される例を挙げた。
 例えば図20のステップS324、S329では個別評価値や関連性評価値が更新されることを示した。また図22のステップS424では、将来の自動制作に学習内容が反映されるように評価関数を更新することを示した。これらにより将来的なコンテンツ自動制作の際に、学習内容が反映されることになる。ユーザにとって、より望ましい自動制作コンテンツを制作できるように感動コンテンツの自動制作システムを進化させることができる。
 実施の形態の情報処理装置としてのサーバ装置10は、自動制作するコンテンツのストーリーを構成する素材コンテンツのうちで、ネガティブなシーン内容と判定されたネガティブコンテンツを、他の素材コンテンツと区別できる状態で保存する記憶管理部18を備える(図23から図25参照)
 感動コンテンツの制作処理の際に、設定したシーンに応じて素材コンテンツが選択されるが、ネガティブコンテンツも適切に選択してストーリー構成上に配置されることで、より感動的なコンテンツを生成できると考えられる。ネガティブコンテンツが他の素材コンテンツと区別されて記憶管理されていることで、このような自動制作コンテンツの制作時に、容易且つ適切にネガティブコンテンツを選択できる。
 なお実施の形態ではネガティブコンテンツとポジティブコンテンツを区別して管理する例で説明したが、ネガティブコンテンツを判定し、ネガティブコンテンツとそれ以外の素材コンテンツを区分して管理するものとしてもよい。
  実施の形態では、記憶管理部18が素材コンテンツについて、ネガティブコンテンツと、ポジティブなシーン内容と判定されたポジティブコンテンツとを区別して保存する処理を行う例を挙げた(図23から図25参照)。
 感動コンテンツの制作処理の際に設定したシーンでは、ポジティブコンテンツとネガティブコンテンツが適切に選択されることが望ましい。ネガティブコンテンツとポジティブコンテンツと区別されて記憶管理されていることで、このような自動制作コンテンツの制作時に、容易且つ適切にネガティブコンテンツとポジティブコンテンツを選択できる。
 実施の形態では、記憶管理部18が、ネガティブコンテンツと判定された素材コンテンツを、ネガティブコンテンツ以外の素材コンテンツを記憶管理するストレージ10a(第1のストレージデバイス)とは異なる遠隔ストレージ12(第2のストレージデバイス)に記憶されるようにする例を挙げた。
 ネガティブコンテンツとそれ以外(ポジティブコンテンツ)を別のストレージデバイスに記憶することで、適切に区別されるとともに、ネガティブコンテンツを、通常はユーザ等に見せにくいようにすることなどが可能となる。
 例えばクラウドサーバに管理される素材コンテンツは、自動制作コンテンツに用いる以外に、単にユーザが保存する動画や静止画等として閲覧することができることが想定されるが、ユーザにとっては通常、ネガティブコンテンツは、あまり見返したいものではないし、場合によっては忘れてしまいたいものであることも想定される。また閲覧するユーザ以外(ロボット等)が撮影した当該ユーザの画像である場合もある。そのような場合、当該ユーザは自分でも、また他人にも見られたくないと思う可能性もある。そこで、別ストレージに保存することとし、通常は閲覧されないような管理も可能となるようにする。
 実施の形態では、ストレージ10aは、素材コンテンツに対するユーザアクセスが許可される状態で管理されるストレージデバイスで、遠隔ストレージ12は、素材コンテンツに対するアクセスが特定の管理者のみ許可される状態で管理されるストレージデバイスとすることが想定される。
 例えばストレージ10aと遠隔ストレージ12は、アクセス権限が異なるものとする。
 このようにすることで、ネガティブコンテンツを通常、ユーザに見せない状態とすることができる。
 実施の形態では、遠隔ストレージ12は、記憶管理部18からのアクセス速度がストレージ10aよりも遅くなるストレージデバイスである例を述べた。
 例えばストレージ10aと遠隔ストレージ12は、ネットワーク内外、通信方式などの差などによりアクセス速度が異なるものとする。このようにすることで、ネガティブコンテンツを一般ユーザに見せにくいものとすることができる。
 通信速度を遅くするためには、ストレージ10aは、例えばサーバ装置10の装置内のストレージデバイス、あるいはLAN接続されたストレージデバイス、あるいは通常使用するネットワークで接続されたストレージデバイスなどとした場合に、遠隔ストレージ12は、低速な転送レートの通信を行うネットワークに接続されたストレージデバイス、都市部以外の砂漠地帯、あるいは月面などの地球外に配置されたストレージデバイス、スタンドアロンコンピュータに接続されたストレージデバイスなどが想定される。いずれにしても、通常の閲覧には不便なストレージデバイスが想定できる。
 実施の形態では、ストレージ10aは、記憶管理部18が第1のネットワークを介してアクセス可能とされ、遠隔ストレージ12は、記憶管理部18が第2のネットワークを介してアクセス可能とされる例が想定される。
 ネットワークの区別により、ネガティブコンテンツに対するアクセス性を、他の素材コンテンツと異なるようにすることができる。
 実施の形態では、記憶管理部18が、ネガティブコンテンツと判定された素材コンテンツと、ネガティブコンテンツ以外の素材コンテンツとを、異なる階層管理の状態でストレージデバイスに記憶されるようにする例を述べた。
 例えば素材コンテンツを管理するサーバのストレージデバイスを用いて、ネガティブコンテンツとそれ以外の素材コンテンツを、別の階層のフォルダで管理する。あるいは異なるストレージを用いる場合も、階層管理の状態を異なるようにする。
 階層管理によっても、ネガティブコンテンツに対するアクセス性を、それ以外(ポジティブコンテンツ)よりも低くすることができる。
 実施の形態では、記憶管理部18が、ネガティブコンテンツについて、ポジティブコンテンツに関連することが判定されることに応じて、記憶管理部18によるアクセスを容易化する処理を行う例を挙げた(図24,図25参照)。
 例えばネガティブコンテンツについては通常はアクセス性が低下する状態で保存管理するが、関連するポジティブコンテンツの存在を確認することに応じて、アクセス性を向上させた状態で管理されるようにする。
 関連するポジティブコンテンツが存在するネガティブコンテンツは、感動コンテンツを構成するシーンの1つとして選択される可能性が生じたものとして、サーバ装置10にとってのアクセスを容易化し、自動制作コンテンツの制作の際に、候補コンテンツとして提供しやすいものとする。これにより、通常は閲覧しにくい状態に管理されるネガティブコンテンツを、感動コンテンツでは利用しやすいものとすることができる。
 実施の形態では、記憶管理部18が、ネガティブコンテンツを、ポジティブコンテンツに関連することが判定されることに応じて、コンテンツ自動制作処理での使用の候補コンテンツとすることが可能な素材コンテンツとすることを述べた。
 つまり、通常は、ネガティブコンテンツは自動制作コンテンツでの使用候補とはしないが、関連するポジティブコンテンツの存在を確認することに応じて、候補コンテンツとできるようにする。これによりネガティブコンテンツがむやみに感動コンテンツに使用されないようにすることができる。
 また、あくまでネガティブコンテンツに対応するポジティブコンテンツの存在をもって、はじめてコンテンツ自動制作に使用できるようにすることで、単なるネガティブなシーンではなく、その後のポジティブな出来事へ導くストーリーのためのコンテンツとして使用することになる。これによりネガティブコンテンツを有効に使用できる。
 実施の形態では主に動画としての素材コンテンツを用いてムービーのような感動コンテンツを自動制作する例で述べたが、もちろん静止画データ、音声データ、テキストデータ等を素材コンテンツとして用いたり、これらのデータを複合的に用いたりすることも想定される。自動制作コンテンツの例をして、顧客ユーザのパーソナルなムービーを「感動コンテンツ」と呼んで説明したが、必ずしもこのようなパーソナルな感動コンテンツに限らず、グループや組織についての内容であるとか、資料映像、学術映像のような内容など、多様な内容のコンテンツを、広く本開示でいう「自動制作コンテンツ」として考えることができる。
 実施の形態のプログラムは、実施の形態で説明した処理を、例えばCPU、DSP等、或いはこれらを含むデバイスに実行させるプログラムである。
 実施の形態のプログラムは、自動制作するコンテンツについて、ストーリーを構成する素材コンテンツの記録を外部機器に対して要請する処理を情報処理装置に実行させるプログラムである。
 また実施の形態のプログラムは、アクセス可能な状態に記録された素材コンテンツについて評価値を設定する処理と、ストーリー設定処理で設定したストーリーを構成する素材コンテンツを、評価値を参照して選択し、選択した素材コンテンツを用いた編集処理により自動コンテンツ制作を行うストーリー生成処理と、を情報処理装置に実行させるプログラムである。
 また実施の形態のプログラムは、自動制作するコンテンツのストーリーを構成する素材コンテンツのうちで、ネガティブなシーン内容と判定されたネガティブコンテンツを、他の素材コンテンツと区別できる状態で保存する記憶管理処理を情報処理装置に実行させるプログラムである。
 このようなプログラムにより、上述したサーバ装置10を、コンピュータ装置その他の情報処理が実行できる機器において実現できる。
 このようなサーバ装置10を実現するプログラムはコンピュータ装置等の機器に内蔵されている記録媒体としてのHDDや、CPUを有するマイクロコンピュータ内のROM等に予め記録しておくことができる。
 あるいはまた、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory)、MO(Magneto Optical)ディスク、DVD(Digital Versatile Disc)、ブルーレイディスク(Blu-ray Disc(登録商標))、磁気ディスク、半導体メモリ、メモリカードなどのリムーバブル記録媒体に、一時的あるいは永続的に格納(記録)しておくことができる。このようなリムーバブル記録媒体は、いわゆるパッケージソフトウェアとして提供することができる。
 また、このようなプログラムは、リムーバブル記録媒体からパーソナルコンピュータ等にインストールする他、ダウンロードサイトから、LAN(Local Area Network)、インターネットなどのネットワークを介してダウンロードすることもできる。
 またこのようなプログラムによれば、実施の形態のサーバ装置10の広範な提供に適している。例えばスマートフォンやタブレット等の携帯端末装置、携帯電話機、パーソナルコンピュータ、ゲーム機器、ビデオ機器、PDA(Personal Digital Assistant)等にプログラムをダウンロードすることで、当該スマートフォン等を、本開示のサーバ装置10として機能させることができる。
 なお、本明細書に記載された効果はあくまでも例示であって限定されるものではなく、また他の効果があってもよい。
 なお本技術は以下のような構成も採ることができる。
 (1)
 アクセス可能な状態に記録された複数の素材コンテンツに基づき、ストーリー設定処理で設定したストーリーを構成する素材コンテンツを選択し、選択した素材コンテンツを用いた編集処理により自動コンテンツ制作を行うストーリー生成部を備えた
 情報処理装置。
 (2)
 前記ストーリー生成部は、機械学習による学習モデルを用いて複数の素材コンテンツを選択し、選択した素材コンテンツを用いた編集処理により自動コンテンツ制作を行う
 上記(1)に記載の情報処理装置。
 (3)
 素材コンテンツについて評価値を設定する処理を行う評価部を備え、
 前記ストーリー生成部は、ストーリー設定処理で設定したストーリーを構成する素材コンテンツを、前記評価値を参照して選択し、選択した素材コンテンツを用いた編集処理により自動コンテンツ制作を行う
 上記(1)に記載の情報処理装置。
 (4)
 前記ストーリー生成部は、設定したストーリーに応じて使用の候補とする素材コンテンツの収集処理を行い、候補として収集した素材コンテンツのうちで評価値を使用して自動コンテンツ制作に使用する素材コンテンツを選択する処理を行う
 上記(3)に記載の情報処理装置。
 (5)
 前記評価部は、素材コンテンツについて、他の素材コンテンツとの関連性を示す評価値を設定する
 上記(3)又は(4)に記載の情報処理装置。
 (6)
 前記評価部は、素材コンテンツについて単体での評価値を設定する
 上記(3)から(5)のいずれかに記載の情報処理装置。
 (7)
  前記評価部は、素材コンテンツについて、他の素材コンテンツとの関連性を提示する関連性提示情報を設定する
 上記(3)から(6)のいずれかに記載の情報処理装置。
 (8)
  前記関連性提示情報はユーザ操作に応じて更新される
 上記(7)に記載の情報処理装置。
 (9)
  前記関連性提示情報は、一の素材コンテンツと他の素材コンテンツを結びつけて示すことで素材コンテンツ同士の関連性を示すものとされる
 上記(7)又は(8)に記載の情報処理装置。
 (10)
  前記関連性提示情報は、キー要素に対して素材コンテンツが結びつく形態で素材コンテンツの関連性を示すものとされる
 上記(7)又は(8)に記載の情報処理装置。
 (11)
  前記関連性提示情報は、ユーザの人間関係に対して素材コンテンツが結びつく形態で素材コンテンツの関連性を示すものとされる
 上記(7)又は(8)に記載の情報処理装置。
 (12)
  前記関連性提示情報に対するユーザ操作を入力し、学習処理を行う学習部を備える
 上記(7)から(11)のいずれかに記載の情報処理装置。
 (13)
 前記学習部による学習内容はストーリー修正に反映される
 上記(12)に記載の情報処理装置。
 (14)
 前記学習部による学習内容は素材コンテンツの選択に反映される
 上記(12)又は(13)に記載の情報処理装置。
 (15)
 前記学習部による学習内容は将来のコンテンツ自動制作に反映される
 上記(12)から(14)のいずれかに記載の情報処理装置。
 (16)
  フィードバック情報を入力し、前記学習モデルを更新する学習処理を行う学習部を備える
 上記(2)に記載の情報処理装置。
 (17)
 フィードバック情報を入力し、ストーリー生成に用いる素材コンテンツ選択のための評価関数を更新する学習処理を行う学習部を備える
 上記(3)から(11)のいずれかに記載の情報処理装置。
 (18)
 アクセス可能な状態に記録された複数の素材コンテンツに基づき、ストーリー設定処理で設定したストーリーを構成する素材コンテンツを選択し、選択した素材コンテンツを用いた編集処理により自動コンテンツ制作を行うストーリー生成処理を、
 情報処理装置が実行する情報処理方法。
 (19)
 アクセス可能な状態に記録された複数の素材コンテンツに基づき、ストーリー設定処理で設定したストーリーを構成する素材コンテンツを選択し、選択した素材コンテンツを用いた編集処理により自動コンテンツ制作を行うストーリー生成処理を、
 情報処理装置に実行させるプログラム。
2 カメラ
3 コンピュータ装置
4 タブレット端末
5 携帯端末
6 カメラ搭載飛行体
7 カメラ搭載車両
8 エージェント装置
9 監視カメラ
10 サーバ装置
10a ストレージ
11 ネットワーク
12 遠隔ストレージ
15 評価部
16 ストーリー生成部
17 学習部
18 記憶管理部
20 素材コンテンツ提供部
21 ユーザ情報提供部
22 UI部

Claims (19)

  1.  アクセス可能な状態に記録された複数の素材コンテンツに基づき、ストーリー設定処理で設定したストーリーを構成する素材コンテンツを選択し、選択した素材コンテンツを用いた編集処理により自動コンテンツ制作を行うストーリー生成部を備えた
     情報処理装置。
  2.  前記ストーリー生成部は、機械学習による学習モデルを用いて複数の素材コンテンツを選択し、選択した素材コンテンツを用いた編集処理により自動コンテンツ制作を行う
     請求項1に記載の情報処理装置。
  3.  素材コンテンツについて評価値を設定する処理を行う評価部を備え、
     前記ストーリー生成部は、ストーリー設定処理で設定したストーリーを構成する素材コンテンツを、前記評価値を参照して選択し、選択した素材コンテンツを用いた編集処理により自動コンテンツ制作を行う
     請求項1に記載の情報処理装置。
  4.  前記ストーリー生成部は、設定したストーリーに応じて使用の候補とする素材コンテンツの収集処理を行い、候補として収集した素材コンテンツのうちで評価値を使用して自動コンテンツ制作に使用する素材コンテンツを選択する処理を行う
     請求項3に記載の情報処理装置。
  5.  前記評価部は、素材コンテンツについて、他の素材コンテンツとの関連性を示す評価値を設定する
     請求項3に記載の情報処理装置。
  6.  前記評価部は、素材コンテンツについて単体での評価値を設定する
     請求項3に記載の情報処理装置。
  7.   前記評価部は、素材コンテンツについて、他の素材コンテンツとの関連性を提示する関連性提示情報を設定する
     請求項3に記載の情報処理装置。
  8.   前記関連性提示情報はユーザ操作に応じて更新される
     請求項7に記載の情報処理装置。
  9.   前記関連性提示情報は、一の素材コンテンツと他の素材コンテンツを結びつけて示すことで素材コンテンツ同士の関連性を示すものとされる
     請求項7に記載の情報処理装置。
  10.   前記関連性提示情報は、キー要素に対して素材コンテンツが結びつく形態で素材コンテンツの関連性を示すものとされる
     請求項7に記載の情報処理装置。
  11.   前記関連性提示情報は、ユーザの人間関係に対して素材コンテンツが結びつく形態で素材コンテンツの関連性を示すものとされる
     請求項7に記載の情報処理装置。
  12.   前記関連性提示情報に対するユーザ操作を入力し、学習処理を行う学習部を備える
     請求項7に記載の情報処理装置。
  13.  前記学習部による学習内容はストーリー修正に反映される
     請求項12に記載の情報処理装置。
  14.  前記学習部による学習内容は素材コンテンツの選択に反映される
     請求項12に記載の情報処理装置。
  15.  前記学習部による学習内容は将来のコンテンツ自動制作に反映される
     請求項12に記載の情報処理装置。
  16.   フィードバック情報を入力し、前記学習モデルを更新する学習処理を行う学習部を備える
     請求項2に記載の情報処理装置。
  17.  フィードバック情報を入力し、ストーリー生成に用いる素材コンテンツ選択のための評価関数を更新する学習処理を行う学習部を備える
     請求項3に記載の情報処理装置。
  18.  アクセス可能な状態に記録された複数の素材コンテンツに基づき、ストーリー設定処理で設定したストーリーを構成する素材コンテンツを選択し、選択した素材コンテンツを用いた編集処理により自動コンテンツ制作を行うストーリー生成処理を、
     情報処理装置が実行する情報処理方法。
  19.  アクセス可能な状態に記録された複数の素材コンテンツに基づき、ストーリー設定処理で設定したストーリーを構成する素材コンテンツを選択し、選択した素材コンテンツを用いた編集処理により自動コンテンツ制作を行うストーリー生成処理を、
     情報処理装置に実行させるプログラム。
PCT/JP2021/024018 2020-07-15 2021-06-24 情報処理装置、情報処理方法、プログラム WO2022014295A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2022536217A JPWO2022014295A1 (ja) 2020-07-15 2021-06-24
US18/004,289 US20230260549A1 (en) 2020-07-15 2021-06-24 Information processing apparatus, information processing method, and program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020121153 2020-07-15
JP2020-121153 2020-07-15

Publications (1)

Publication Number Publication Date
WO2022014295A1 true WO2022014295A1 (ja) 2022-01-20

Family

ID=79555201

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/024018 WO2022014295A1 (ja) 2020-07-15 2021-06-24 情報処理装置、情報処理方法、プログラム

Country Status (3)

Country Link
US (1) US20230260549A1 (ja)
JP (1) JPWO2022014295A1 (ja)
WO (1) WO2022014295A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7266356B1 (ja) 2022-03-29 2023-04-28 株式会社オプティム プログラム、情報処理装置、情報処理システム及び情報処理方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008136466A1 (ja) * 2007-05-01 2008-11-13 Dep Co., Ltd. 動画編集装置
JP2011171782A (ja) * 2008-05-30 2011-09-01 Access Co Ltd コンテンツ自動再生方法、コンテンツ自動再生プログラム、コンテンツ自動再生システム、およびコンテンツ自動再生サーバ
JP2014017779A (ja) * 2012-07-11 2014-01-30 Sony Corp 編集装置、編集方法、プログラム、および記録媒体
JP2019195156A (ja) * 2018-04-05 2019-11-07 ティ・ヴイ・ユー・ネットワークス・コーポレイションTVU Networks Corporation Ai支援型または自動ビデオ制作のための方法、装置、およびシステム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10769446B2 (en) * 2014-02-28 2020-09-08 Second Spectrum, Inc. Methods and systems of combining video content with one or more augmentations
US11507859B2 (en) * 2019-01-08 2022-11-22 Colorado State University Research Foundation Trackable reasoning and analysis for crowdsourcing and evaluation

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008136466A1 (ja) * 2007-05-01 2008-11-13 Dep Co., Ltd. 動画編集装置
JP2011171782A (ja) * 2008-05-30 2011-09-01 Access Co Ltd コンテンツ自動再生方法、コンテンツ自動再生プログラム、コンテンツ自動再生システム、およびコンテンツ自動再生サーバ
JP2014017779A (ja) * 2012-07-11 2014-01-30 Sony Corp 編集装置、編集方法、プログラム、および記録媒体
JP2019195156A (ja) * 2018-04-05 2019-11-07 ティ・ヴイ・ユー・ネットワークス・コーポレイションTVU Networks Corporation Ai支援型または自動ビデオ制作のための方法、装置、およびシステム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7266356B1 (ja) 2022-03-29 2023-04-28 株式会社オプティム プログラム、情報処理装置、情報処理システム及び情報処理方法
JP2023145963A (ja) * 2022-03-29 2023-10-12 株式会社オプティム プログラム、情報処理装置、情報処理システム及び情報処理方法

Also Published As

Publication number Publication date
US20230260549A1 (en) 2023-08-17
JPWO2022014295A1 (ja) 2022-01-20

Similar Documents

Publication Publication Date Title
US11159861B2 (en) User interface elements for content selection in media narrative presentation
KR101796005B1 (ko) 미디어 처리 방법 및 절차
JP5570079B2 (ja) データ処理装置およびデータ処理方法
US20180070141A1 (en) Interactive Media Display Across Devices
US7886072B2 (en) Network-assisted remote media listening
CN102945276B (zh) 生成和更新基于事件的回放体验
US20170127128A1 (en) Social Post Roll Up and Management System and Method of Use
US11520807B2 (en) Multi-application state navigation
CN103827913B (zh) 用于在便携式终端中剪辑和共享内容的装置和方法
US20140067981A1 (en) Classification and Status of Users of Networking and Social Activity Systems
US9357243B2 (en) Movie compilation system with integrated advertising
KR101924978B1 (ko) 타임라인 기반의 소셜 네트워크 서비스 제공시스템
KR20150132074A (ko) 콘텐트를 구성하는 방법
CN104756514A (zh) 通过社交网络共享电视和视频节目
US20150294634A1 (en) Life Experience Memorialization with Alternative Observational Opportunity Provisioning
JP5870742B2 (ja) 情報処理装置、システムおよび情報処理方法
WO2022014295A1 (ja) 情報処理装置、情報処理方法、プログラム
US11210336B2 (en) Methods, systems, and products for recalling and retrieving documentary evidence
US20140198027A1 (en) Media Distribution System
US20140013193A1 (en) Methods and systems for capturing information-enhanced images
WO2022014294A1 (ja) 情報処理装置、情報処理方法、プログラム
WO2022014296A1 (ja) 情報処理装置、情報処理方法、プログラム
US20200351528A1 (en) Systems and Methods for Operating a Streaming Service to Provide Community Spaces for Media Content Items
WO2023021759A1 (ja) 情報処理装置、情報処理方法
WO2024161868A1 (ja) 情報処理装置、情報処理方法、プログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21842052

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2022536217

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21842052

Country of ref document: EP

Kind code of ref document: A1