WO2022239117A1 - 情報処理装置、コンテンツ表示システム、コンテンツ表示方法 - Google Patents

情報処理装置、コンテンツ表示システム、コンテンツ表示方法 Download PDF

Info

Publication number
WO2022239117A1
WO2022239117A1 PCT/JP2021/017906 JP2021017906W WO2022239117A1 WO 2022239117 A1 WO2022239117 A1 WO 2022239117A1 JP 2021017906 W JP2021017906 W JP 2021017906W WO 2022239117 A1 WO2022239117 A1 WO 2022239117A1
Authority
WO
WIPO (PCT)
Prior art keywords
content
person
display
unit
reliability
Prior art date
Application number
PCT/JP2021/017906
Other languages
English (en)
French (fr)
Inventor
涼一 荒木
Original Assignee
シャープNecディスプレイソリューションズ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by シャープNecディスプレイソリューションズ株式会社 filed Critical シャープNecディスプレイソリューションズ株式会社
Priority to PCT/JP2021/017906 priority Critical patent/WO2022239117A1/ja
Publication of WO2022239117A1 publication Critical patent/WO2022239117A1/ja
Priority to US18/377,153 priority patent/US20240054532A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • G06F3/1423Digital output to display device ; Cooperation and interconnection of the display device with other functional units controlling a plurality of local displays, e.g. CRT and flat panel display
    • G06F3/1446Digital output to display device ; Cooperation and interconnection of the display device with other functional units controlling a plurality of local displays, e.g. CRT and flat panel display display composed of modules, e.g. video walls
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/36Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the display of a graphic pattern, e.g. using an all-points-addressable [APA] memory
    • G09G5/37Details of the operation on graphic patterns
    • G09G5/377Details of the operation on graphic patterns for mixing or overlaying two or more graphic patterns

Definitions

  • the present invention relates to an information processing device, a content display system, and a content display method.
  • the classifier estimates attributes such as age and gender based on the viewer's face image recognized from the captured frame.
  • the advertisement delivery device specifies one attribute (for example, male in his twenties) with the highest confidence of the estimated attribute, and reproduces the advertisement corresponding to the specified attribute.
  • Patent Document 1 A system has also been proposed that, when multiple viewers are detected from captured frames, estimates the attributes of each of the multiple viewers and reproduces multiple pieces of content according to the estimated attributes of each.
  • the estimated attribute and the actual attribute may differ depending on the facial features, imaging conditions, accuracy of the classifier, etc. If the estimated attribute and the actual attribute are different, a targeted advertisement that does not correspond to the viewer's attribute is displayed. If it does so, the effect of a target advertisement will not be expected.
  • the present invention provides an information processing device, a content display system, and a content display method that can reduce the output of content that does not correspond to the viewer's attributes.
  • a detection unit detects a person from a captured image in which the person is captured, an estimation unit estimates an attribute according to the detected person, and a plurality of attributes are estimated from one person.
  • an extraction unit for extracting a plurality of contents to be displayed based on the reliability of each attribute obtained from the one person, and a processing unit for displaying each selected content in a display area. It is an information processing device including
  • a detection unit detects a person from a captured image in which the person is captured, an estimation unit estimates an attribute according to the detected person, and a plurality of attributes are estimated from one person.
  • an extraction unit for extracting the number of contents determined based on the reliability of each attribute obtained from the one person, and displaying the contents according to the number of the extracted contents in the display area. and a processing unit.
  • one aspect of the present invention includes a detection unit that detects a person from a captured image in which the person is captured, an estimation unit that estimates an attribute according to the detected person, and a plurality of the attributes from one person.
  • An extraction unit for extracting a plurality of contents to be displayed based on the reliability of each attribute obtained from the one person when the estimation is made, and a reproduction instruction for displaying each selected content in the display area.
  • the content display system includes a processing unit for outputting, and a reproducing unit for reproducing each content according to the reproduction instruction and displaying the content in a display area.
  • a person is detected from a captured image in which a person is captured, attributes corresponding to the detected person are estimated, and when a plurality of attributes are estimated from one person,
  • a plurality of content items to be displayed are extracted based on the reliability of each attribute obtained from the one person, and each selected content item is displayed in a display area.
  • a person is detected from a captured image in which a person is captured, attributes corresponding to the detected person are estimated, and when a plurality of attributes are estimated from one person,
  • This content display method extracts a number of contents determined based on the reliability of each attribute obtained from the one person, and displays the contents corresponding to the number of extracted contents in a display area.
  • FIG. 1 is a system configuration diagram illustrating a schematic configuration of a display system 1;
  • FIG. 4 is a conceptual diagram illustrating the relationship between the display device 10 and imaging regions;
  • FIG. 3 is a functional block diagram for explaining the general functions of an information processing device 40;
  • FIG. 10 is a diagram showing an example of an estimation result estimated by an estimation unit 405;
  • FIG. 4 is a flowchart for explaining the operation of the imaging device 30.
  • FIG. 4 is a flowchart for explaining the operation of the information processing device 40; 4 is a flowchart for explaining the operation of the video signal output device 20; 4 is a flowchart for explaining the operation of the display device 10;
  • FIG. 10 is a diagram showing a case where content is displayed on a multi-display system;
  • FIG. 4 is a conceptual diagram illustrating a case where multiple contents are reproduced in chronological order; 4 is a diagram showing the configuration of an information processing device 40A, which is another embodiment of the information processing device 40.
  • FIG. 4 is a diagram showing a configuration of an information processing device 40B, which is another embodiment of the information processing device 40.
  • FIG. 4 is a conceptual diagram illustrating a case where multiple contents are reproduced in chronological order; 4 is a diagram showing the configuration of an information processing device 40A, which is another embodiment of the information processing device 40.
  • FIG. 4 is a diagram showing a configuration of an information processing device 40B, which is another embodiment of the information processing device 40.
  • FIG. 1 is a system configuration diagram illustrating a schematic configuration of a display system 1.
  • the display system 1 includes a display device 10 , a video signal output device 20 , an imaging device 30 , an information processing device 40 and a network 50 .
  • the video signal output device 20, the imaging device 30, and the information processing device 40 are communicably connected via a network 50.
  • FIG. The display device 10 is electrically connected to the video signal output device 20 via a video cable.
  • the imaging device 30 has a function of continuously capturing video at an arbitrary frame rate and a function of transmitting the captured image, which is the result of capturing, to the information processing device 40 via the network 50 .
  • the imaging device 30 may be, for example, a network camera with an image sensor.
  • the information processing device 40 is, for example, a computer, and realizes various functions by having a CPU (Central Processing Unit) read and execute programs stored in a storage device.
  • a CPU Central Processing Unit
  • the video signal output device 20 receives and stores the default content or the target content from the information processing device 40, the reception section receives the instruction to reproduce the default content or the target content from the information processing device 40, and the storage section stores the received content.
  • a content extracting unit for extracting content to be output based on a reproduction instruction received from the information processing apparatus 40 from the default content or the target content; and a video output unit for outputting video to a display device connected via a video cable.
  • the output means of the video signal output device may be an output means for outputting a plurality of contents to one display area in chronological order when the reproduction instruction indicates to reproduce a plurality of contents. good too.
  • the video signal output device 20 may be, for example, a signage player, a computer, a video playback device, or the like.
  • the display device 10 displays the video signal supplied from the video signal output device 20 on the display area.
  • the display device 10 may be a liquid crystal display device or a projector.
  • the display device 10 is a liquid crystal display device
  • the video signal is displayed on the display area of the liquid crystal panel.
  • the display device 10 is a projector
  • the display device 10 displays a video signal on the display area of the screen by projecting the video signal on the display area.
  • the display device 10 may be a single display device or a plurality of display devices.
  • the display device 10 is a liquid crystal display device, it is possible to construct a multi-display system in which a plurality of liquid crystal display devices are installed adjacently.
  • a multi-display system can be constructed by projecting video signals projected from a plurality of projectors so that they are adjacent to each other.
  • FIG. 2 is a conceptual diagram explaining the relationship between the display device 10 and the imaging area.
  • the installed display device is one display device 10
  • one display area on the display screen of the display device 10 is divided into a plurality of display areas
  • one display region HR0 of the display device 10 is divided into a divided region HR1 and a divided region HR2.
  • the divided region HR1 and the divided region HR2 are arranged in the horizontal direction.
  • the divided regions may be arranged in the horizontal direction, or may be divided so as to be arranged in the vertical direction.
  • it may be divided so that it is arranged in a plurality of columns in the vertical direction and in a plurality of rows in the horizontal direction.
  • all of the divided areas may have the same size, or some of the divided areas may have different sizes from the other divided areas. Also, the divided regions may have the same shape or may have different shapes.
  • a case of obtaining a plurality of divided regions by dividing one display region into a plurality of regions will be described. may be the case.
  • m is a natural number of 2 or more
  • n where 1 ⁇ n ⁇ m
  • the regions may be displayed by the remaining display devices.
  • the display region of the display device 10 is set as one divided region, and the display region of the other display device is set as another divided region.
  • Content can also be displayed as a single split region.
  • Such a display device 10 is installed in places where a plurality of people can visit, such as station premises, squares in front of stations, public facilities, and event venues.
  • the display device 10 is used as a public display when installed in a public place.
  • the display device 10 can also output audio.
  • the display device 10 may output either one or both of the sounds of the contents of the divided areas.
  • the imaging device 30 is provided near the display device.
  • the imaging device 30 captures an image of the imaging region SR, which is a region where content displayed on the display device 10 can be viewed.
  • the imaging area SR is an area through which the user can pass, and may be able to stop. This figure shows a case where a user PS1, who is a viewer, exists in the imaging region SR at a certain moment.
  • FIG. 3 is a functional block diagram for explaining the general functions of the information processing device 40.
  • the storage unit 401 stores various data.
  • the storage unit 401 stores various contents.
  • the content may include an image that can be visually recognized by the user, and may be a still image or a moving image. Also, the content may include not only images but also sounds. The user can view (visually recognize) the image if the content is only an image, and can view the image and sound if the content includes an image and sound.
  • the content may be advertisements, notices, guidance, or the like.
  • the content has a predetermined playback time.
  • the reproduction time is the time from the start of reproduction to the end of reproduction. For example, there is content with a playback time of 15 seconds and content with a playback time of 30 seconds.
  • the playback time of the default content may be set shorter than the playback time of the target content. By ending the default content at an earlier cycle than the target content, the timing for ending the default content comes earlier, so that the chances of displaying the target content can be increased.
  • Content includes target content and default content.
  • Target content is content corresponding to the attributes of a person included in an image captured by the imaging device 30 .
  • the target content is stored in the storage unit 401 in association with attribute data indicating the attribute of the target.
  • Default content is content that is not associated with a specific person.
  • the default content may be content other than the targeted content.
  • At least one content to be output is selected as the default content, for example, according to the date and time period.
  • the input unit 402 acquires an operation input from an input device such as a mouse or keyboard.
  • the setting unit 403 performs setting processing of necessary data in the display system 1 .
  • a setting unit 403 acquires an operation input input by an operator from an input device via the input unit 402, and sets target content and default content according to this operation input.
  • the receiving unit 404 receives the captured image transmitted from the imaging device 30 .
  • the receiving unit 404 continuously receives image data (captured images) sequentially generated according to the frame rate from the images captured by the imaging device 30 .
  • the captured image received by the receiving unit 404 is a captured image in which the visible region SR is captured.
  • the estimating unit 405 detects a person by performing image recognition processing from the captured image received by the receiving unit 404 from the imaging device 30, and estimates attributes corresponding to the person based on the detection result. When one person is detected from the captured image, the estimation unit 405 estimates attributes of the one person. The estimation unit 405 can also estimate attributes of each person when a plurality of persons are detected from the captured image. Attributes include, for example, age, sex, occupation, and clothing. The attribute estimated by the estimation unit 405 may be one of a plurality of attributes such as age, gender, occupation, and clothing, or may be estimated for a plurality of types. Any attribute may be estimated. The estimation unit 405 estimates the attribute according to the person and obtains the reliability.
  • Confidence represents the probability that the estimated attribute is correct. Reliability may also be called “certainty” or "confidence".
  • the reliability may differ depending on the state in which the image of the person is captured by the imaging device 30 . For example, the reliability is determined when the person's face is oriented horizontally or vertically with respect to the imaging device 30, when the person is wearing a mask that covers the nose and mouth, and when the person is wearing a hat.
  • the estimated value varies depending on, for example, when the distance from the imaging device 30 to the person is long.
  • the estimating unit 405 uses a trained model that has undergone pre-learning using a large number of images including people of various ages and genders, for example, by deep learning, etc. By inputting the data into the model, the person detection process and the attribute estimation process may be performed. A classifier that estimates attributes from a person can be used for the estimation unit 405 .
  • the determination unit 406 determines the magnitude relationship between the reliability of each attribute and the reference value.
  • the reference value is determined in advance and may be stored in the storage unit 401 .
  • the extraction unit 407 extracts the target content from the attribute estimated by the estimation unit 405.
  • the extraction unit 407 determines the number of contents based on the reliability corresponding to the attributes obtained from the estimation unit 405 . For example, when one attribute is estimated and one reliability corresponding to the attribute is obtained, the extraction unit 407 determines the number of contents to be one because the reliability is one.
  • the extraction unit 407 extracts a plurality of contents corresponding to those attributes. When extracting a plurality of contents, the extraction unit 407 determines the number of contents to be extracted. When determining the number of contents, if multiple attributes are estimated from one person, the extraction unit 407 determines the number of contents to be extracted based on the reliability of each attribute obtained from the one person. can decide. When determining the number of contents based on reliability, the number of contents may be determined by determining the reliability using a reference value. In this case, if the highest reliability is less than the reference value based on the determination result determined by the determination unit 406, the extraction unit 407 determines the reliability of each attribute obtained from one person. Based on this, multiple contents to be displayed are extracted.
  • the number of contents is determined as 2, and contents corresponding to the respective attributes corresponding to the top two reliability levels are extracted from the one with the highest reliability level.
  • the magnitude relationship of the reliability with respect to the reference value is determined, and the number of contents is determined according to the determination result, it is judged that the estimated attribute and the actual attribute of the viewer are highly likely to be different.
  • the target content corresponding to the attribute with the highest reliability and the target content corresponding to at least one of the attributes having the second and subsequent highest reliability can be displayed.
  • the number of attributes with values close to reliability for example, if the difference is within a predetermined value
  • the number of contents may be determined accordingly. For example, multiple pieces of content to be displayed may be extracted when the difference between the highest reliability degrees among the respective reliability degrees for a plurality of attributes is within a predetermined value. More specifically, when the top two reliability levels are close values, the number of contents is determined as 2, and when the top three reliability levels are close values, the content number is determined as 3. For example, if the highest reliability is 50%, the second highest reliability is 40%, and the third highest reliability is 5%, the number of contents is determined as two.
  • the determination unit 406 may determine whether the reliability values are close to each other. In this case, the determination unit 406 stores a reference value of the difference in reliability in advance, and can determine that the reliability is close if the difference is within the range of the difference, which is the higher reliability. When some of the highest reliability values of the obtained attributes are close to some extent, it is difficult to determine which of the estimated attributes corresponds to the actual attributes of the person.
  • the extraction unit 407 refers to the obtained difference in reliability, and if it can be determined that the difference in reliability is within a predetermined value (a value close to some extent), the extraction unit 407 preliminarily
  • the number of pieces of content to be displayed can be determined based on the number of confidences within a predetermined value.
  • the extraction unit 407 determines the number of contents based on the reliability according to the attributes obtained from one viewer, there are multiple attributes estimated for a given viewer. In this case, not only the content corresponding to the first candidate, but also the content corresponding to the second candidate (or third candidate) can be selected and displayed.
  • a transmission unit 408 transmits various data.
  • the transmission unit 408 reads default content or target content stored in the storage unit 401 and distributes the read default content or target content to the video signal output device 20 connected via the network 50 .
  • the processing unit 409 causes the transmission unit 408 to transmit a reproduction instruction to reproduce the content to the video signal output device 20 .
  • the reproduction instruction includes a reproduction instruction to reproduce the default content and a reproduction instruction to reproduce the target content.
  • the processing section 409 causes the transmission section 408 to transmit a reproduction instruction to reproduce the plurality of extracted contents to the video signal output device 20 .
  • the processing unit 409 can cause the transmission unit 408 to transmit a reproduction instruction to the video signal output device 20 to allocate and display the plurality of contents one by one in different display areas. Further, when reproducing a plurality of contents, the processing unit 409 can cause the transmission unit 408 to transmit a reproduction instruction for displaying the plurality of contents in chronological order to the video signal output device 20 .
  • the processing unit 409 can also assign and display one content to each of the divided areas obtained by dividing the display area into a plurality of areas.
  • a plurality of contents can be displayed together on one display device 10 .
  • the processing unit 409 can also display them in a display area in a multi-display system.
  • an area including a plurality of display screens of the multi-display system can be treated as one display area, and one content can be assigned to each of the divided areas obtained by dividing this display area.
  • the processing unit 409 can cause the transmission unit 408 to transmit a reproduction instruction to display the plurality of contents in a single display area in chronological order to the video signal output device 20. In this case, even if only one display area is used, a plurality of contents can be displayed in order.
  • FIG. 4 is a diagram showing an example of an estimation result estimated by the estimation unit 405.
  • the estimation result estimated by the estimation unit 405 includes estimated attributes and reliability.
  • the estimation results are a combination of the attribute "male in his 20s" with a reliability of "50%” and a combination of the attribute "male in his 30s” with a reliability of "40%”. and a combination whose attribute is "other" and whose confidence is "10%”.
  • the attributes include age and gender, but one attribute may be obtained, or the obtained attribute combination may be another combination.
  • the power of each of the display device 10, the video signal output device 20, the imaging device 30, and the information processing device 40 is turned on.
  • the video signal output device 20, the imaging device 30, and the information processing device 40 are communicably connected via the same network 50.
  • the video signal output device 20 is connected to the display device 10 via a video cable.
  • the imaging device 30 continues to transmit captured images obtained by imaging the imaging region SR at an arbitrary frame rate to the information processing device 40 via the network 50 .
  • the information processing apparatus 40 designates a plurality of default contents to be default advertisements from among the content files stored in the storage unit 401 based on the operation input by the operator through the input device, and selects each default content. is distributed to the video signal output device 20 . Further, the information processing device 40 sets the relationship between the attribute of the target to be displayed and the identification information for identifying the target content for each of the plurality of target content based on the operation input from the operator, and Distribute to the signal output device 20 . In addition, the information processing apparatus 40 stores a reliability reference value in the storage unit 401 based on an operation input input by an operator via an input device. For example, when 60% is designated as the reference value, a value indicating 60% is stored in the storage unit 401 .
  • the video signal output device 20 When the video signal output device 20 receives the default content and the target content from the information processing device 40, the video signal output device 20 stores the default content in a storage device within the video signal output device 20, starts reproducing the default content, and displays the content on the display device 10 according to the content. output the video signal.
  • the display device 10 displays the video signal received from the video signal output device 20 on the display area.
  • FIG. 5 is a flowchart for explaining the operation of the imaging device 30.
  • the imaging device 30 When the imaging device 30 is powered on (step S101), it captures an image of a region including the imaging region SR according to a predetermined frame rate (step S102), and transmits the captured image to the information processing device 40 (step S103). .
  • the imaging device 30 determines whether or not an instruction to turn off the power is input (step S104), and when it is determined that an instruction to turn off the power is not input (step S104-NO), the process proceeds to step S102. If it is determined that an instruction to turn off the power has been input (step S104-YES), the process is terminated. In this manner, the imaging device 30 transmits a captured image to the information processing device 40 each time it captures an image according to the frame rate.
  • FIG. 6 is a flowchart for explaining the operation of the information processing device 40.
  • the receiving unit 404 receives a captured image from the imaging device 30 (step S201)
  • the estimating unit 405 performs image recognition processing on the received captured image to determine whether a viewer has been detected from the imaging region SR. is determined (step S202). If the viewer is not detected, the information processing device 40 advances the process to step S206. On the other hand, if the viewer is detected in the imaging region SR (step S202-YES), the estimation unit 405 estimates the attribute of the viewer based on the detected image of the viewer. (Step S203), the reliability of the attribute is obtained.
  • multiple attributes may be estimated from the one viewer.
  • the determining unit 406 determines whether or not the highest reliability among the reliability obtained by the estimating unit 405 is equal to or higher than a reference value (step S204). This determination may be made by determining whether the highest reliability is equal to or higher than a reference value, or by determining whether the highest reliability is less than the reference value. If the determination result of the determination unit 406 indicates that the highest reliability is equal to or higher than the reference value (step S204-YES), the extraction unit 407 extracts one target content corresponding to the attribute with the highest reliability. When one content is extracted, the processing unit 409 transmits a reproduction instruction to the video signal output device 20 together with the identification information of the extracted content through the transmission unit 408 (step S205).
  • the video signal output device 20 when the video signal output device 20 receives a target content reproduction instruction immediately before the reproduction of the currently displayed content is completed, the video signal output device 20 outputs one target content corresponding to the reproduction instruction to the display device 10. display in the display area. A viewer can view this one piece of content.
  • the extraction unit 407 selects the target content corresponding to the attribute with the highest reliability and the attribute with the second highest reliability. Extract the targeted content you want.
  • the processing unit 409 transmits a reproduction instruction to the video signal output device 20 together with the identification information of each of the extracted contents through the transmission unit 408 (step S207).
  • the video signal output device 20 divides the display area of the display device 10 into two when receiving a reproduction instruction to reproduce two target contents immediately before the reproduction of the currently displayed content ends.
  • the video signal output device 20 outputs to the display device 10 video signals corresponding to the two contents whose reproduction is started.
  • the display device 10 displays two target contents in one display area. This allows the viewer to view two contents.
  • the information processing device 40 determines whether or not an instruction to turn off the power has been input (step S206), and if the instruction to turn off the power has not been input (step S206-NO), the process proceeds to step S201.
  • the information processing apparatus 40 turns off the power if an instruction to turn off the power is input.
  • step S202 when a plurality of viewers are detected, the information processing device 40 performs processing corresponding to the detection of a plurality of viewers, and advances the processing to step S206.
  • the information processing device 40 may identify one viewer among the plurality of detected viewers and display content on the display device 10 according to the attribute of the viewer.
  • FIG. 7 is a flowchart for explaining the operation of the video signal output device 20.
  • the video signal output device 20 receives the default content and the target content from the information processing device 40, stores them in the storage device in the video signal output device 20, and reproduces the default content. to start.
  • a video signal corresponding to the default content whose playback is started is output to the display device 10 (step S302).
  • the video signal output device 20 determines whether or not an instruction to turn off the power has been input (step S303). If it is determined that an instruction to turn off the power has been input (step S303-YES), the process ends and the power is turned off.
  • step S304 it is determined whether or not the reproduction of the content has ended.
  • the playback time is determined for the content.
  • the video signal output device 20 may determine whether or not the reproduction has ended by determining whether or not the elapsed time from the start of reproduction has reached the reproduction end time indicated by the reproduction time. .
  • this step S304 regardless of whether the content being reproduced is the default content or the target content, it is possible to similarly make a determination based on whether or not the reproduction end time of the content being reproduced has come. .
  • Step S304—NO If the video signal output device 20 is in the middle of reproducing the default content and before the reproduction end time in the reproduction time set for the default content arrives, the video signal output device 20 determines that the reproduction has not ended ( Step S304—NO), the process proceeds to step S303. If it is determined that the playback end time in the playback time set for the default content has arrived (step S304-YES), the video signal output device 20 has received a target content playback instruction from the information processing device 40. It is determined whether or not (step S305). Here, it may be determined whether or not the reproduction end time has come, or whether it is immediately before the reproduction end time. Whether or not it is immediately before may be determined based on whether or not a predetermined time (for example, one second) before the reproduction end time has arrived.
  • a predetermined time for example, one second
  • step S305-NO If it is determined that the instruction to reproduce the target content has not been received (step S305-NO), the video signal output device 20 proceeds to step S302.
  • the video signal output device 20 transmits a video signal for displaying the target content corresponding to the received reproduction instruction to the display device 10 and causes the display device 10 to display the target content (step S306). After that, the video signal output device 20 shifts the processing to step S303.
  • the video signal output device 20 divides the display area into two, arranges one target content in each divided area, and starts reproduction at the same time. do. Then, the video signal output device 20 outputs to the display device 10 video signals corresponding to the two contents whose reproduction is started. Accordingly, two target contents are displayed in one display area on the display device 10 . A viewer can view these two contents.
  • FIG. 8 is a flowchart for explaining the operation of the display device 10.
  • the display device 10 When the display device 10 is powered on (step S401), it determines whether or not a video signal is being supplied from the video signal output device 20 (step S402). (Step S402-YES), the video signal supplied from the video signal output device 20 is displayed in the display area (step S403).
  • the display device 10 determines whether or not an instruction to turn off the power is input (step S404), and when it is determined that an instruction to turn off the power is not input (step S404-NO), the process proceeds to step S402. If it is determined that an instruction to turn off the power has been input (step S404-YES), the process ends. In step S402, when there is no video signal, the display device 10 shifts the process to step S404.
  • FIG. 9 is a diagram showing a case where content is displayed on a multi-display system.
  • the video signal output device 20 receives a reproduction instruction to display a plurality of target contents from the information processing device 40, divides the multi-screen display area in the multi-display system 10A, and divides the display area. Make the regions display their content.
  • the multi-display system 10A includes six display devices (display device 10A1, display device 10A2, display device 10A3, display device 10A4, display device 10A5, display device 10A6), two in the vertical direction and two in the horizontal direction. The display devices are arranged so that there are three in each.
  • the video signal output device 20 When receiving a reproduction instruction to reproduce two target contents from the information processing device 40, the video signal output device 20 sets the display areas in the multi-display system 10A to the display device 10A1, the display device 10A2, the display device 10A4, and the display device 10A4. It is divided into a divided area HY1a including four display screens 10A5 and a divided area HY1b including two display screens 10A3 and 10A6. Then, the video signal output device 20 displays one of the two target contents instructed to be reproduced in the display area HY1a, and displays the other target content in the display area HY1b.
  • the size ratio of each divided area may be determined according to the reliability. For example, when displaying target content with a reliability of 50% and 40%, the video signal output device 20 divides the divided area for displaying the target content with a reliability of 50% into the target content with a reliability of 40%. may be divided so as to have a wider area than the divided area for displaying . For example, target content with a reliability of 50% can be displayed in the divided area HY1a, and target content with a reliability of 40% can be displayed in the divided area HY1b.
  • two pieces of content based on multiple attributes estimated from one viewer can be displayed together.
  • a viewer can view both of these two contents.
  • the attribute given the highest reliability among the attributes estimated from that one viewer is "male in his 20s”
  • the target content corresponding to "male in his 20s” and the targeted content corresponding to "male in his 30s” are different.
  • targeted content corresponding to the viewer's actual attributes can also be displayed.
  • two contents can be displayed so that the viewer can view them, so there is an advantage that the viewer can view both.
  • a plurality of target contents are displayed at the same time, the viewer can select and view the target content that interests him or her.
  • FIG. 10 is a conceptual diagram illustrating a case where multiple pieces of content are reproduced in chronological order.
  • the video signal output apparatus 20 displays the target contents corresponding to the reproduction instruction in chronological order in one display area.
  • a reproduction instruction to reproduce two of the first target content target content corresponding to the attribute "male in his 30s" and the second target content (target content corresponding to the attribute "male in his 20s) is received.
  • the video signal output device 20 reproduces the target content in descending order of reliability.
  • the video signal output device 20 causes the display device 10 to display the first target content at time t1.
  • the video signal output device 20 displays the second target content.
  • the video signal output device 20 can display the two contents so that the viewer can view them in order, so the viewer can view both of the target contents.
  • the target content is displayed in chronological order, it is not necessary to divide the display area, so the target content can be displayed using the entire display area.
  • FIG. 11 is a diagram showing the configuration of an information processing device 40A, which is another embodiment of the information processing device 40.
  • the information processing device 40A includes a detection unit 451 , an estimation unit 452 , an extraction unit 453 and a processing unit 454 .
  • the detection unit 451 detects a person from a captured image in which a person is captured.
  • the estimating unit 452 estimates attributes according to the detected person.
  • the extraction unit 453 extracts a plurality of contents to be displayed based on the reliability of each attribute obtained from the one person.
  • the processing unit 454 displays each selected content in the display area.
  • the information processing apparatus when a plurality of attributes and degrees of reliability are estimated from one viewer detected from an image captured by an imaging device, the information processing apparatus It is possible to determine a plurality of contents by using the display, automatically select an effective reproduction pattern, and display the contents according to the reproduction pattern. As a result, it is possible to enhance the effect of having the content viewed.
  • FIG. 12 is a diagram showing the configuration of an information processing device 40B, which is another embodiment of the information processing device 40.
  • Information processing device 40 ⁇ /b>B includes detection unit 461 , estimation unit 462 , extraction unit 463 , and processing unit 464 .
  • the detection unit 461 detects a person from a captured image in which a person is captured.
  • the estimating unit 462 estimates attributes according to the detected person.
  • the extraction unit 463 extracts the number of contents determined based on the reliability of each attribute obtained from the one person.
  • the processing unit 464 causes the display area to display the contents corresponding to the number of extracted contents.
  • the information processing apparatus when a plurality of attributes and degrees of reliability are estimated from one viewer detected from an image captured by an imaging device, the information processing apparatus can be used to determine the number of targets to be displayed, and content corresponding to the determined number can be displayed. As a result, it is possible to enhance the effect of having the content viewed.
  • the determination unit 406 compares the reliability with the reference value, but it may be compared with another value other than the reliability.
  • a program for realizing the functions of the processing unit in FIG. 1 is recorded in a computer-readable recording medium, and the program recorded in this recording medium is read into a computer system and executed to perform construction management.
  • the "computer system” referred to here includes hardware such as an OS and peripheral devices.
  • the "computer system” also includes the home page providing environment (or display environment) if the WWW system is used.
  • the term "computer-readable recording medium” refers to portable media such as flexible discs, magneto-optical discs, ROMs and CD-ROMs, and storage devices such as hard discs incorporated in computer systems.
  • the term “computer-readable recording medium” includes media that retain programs for a certain period of time, such as volatile memory inside computer systems that serve as servers and clients.
  • the program may be for realizing part of the functions described above, or may be capable of realizing the functions described above in combination with a program already recorded in the computer system.
  • the above program may be stored in a predetermined server, and distributed (downloaded, etc.) via a communication line in response to a request from another device.
  • Video signal output device 30 Imaging device 40, 40A... information processing apparatus, 50... network, 401... storage unit, 402... input unit, 403... setting unit, 404... receiving unit, 405, 452, 462.

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Hardware Design (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

人物が撮像された撮像画像から人物を検出する検出部(451)と、前記検出された人物に応じた属性を推定する推定部(452)と、1人の人物から前記属性が複数推定された場合に、当該1人の人物から得られたそれぞれの属性に対する信頼度に基づいて、表示するコンテンツを1つ又は複数抽出する抽出部(453)と、抽出された各コンテンツを表示領域に表示させる処理部(454)と、を含む。

Description

情報処理装置、コンテンツ表示システム、コンテンツ表示方法
 本発明は、情報処理装置、コンテンツ表示システム、コンテンツ表示方法に関する。
 従来のターゲット広告システムでは、識別器は、撮像されたフレームから認識された視聴者の顔画像に基づいて、年齢や性別等の属性を推定する。広告配信装置は、推定された属性のコンフィデンス(信頼度)がもっとも高いひとつの属性(例えば20代男性)を特定し、その特定された属性に対応する広告を再生していた。
 撮像されたフレームから複数の視聴者が検出された場合には、複数の視聴者のそれぞれの属性を推定し、推定されたそれぞれの属性に応じて、複数のコンテンツを再生するシステムも提案されている(特許文献1)。
特開2012-134836号公報
 上述の方法では、顔の特徴、撮像条件や識別器の精度等によっては、推定された属性と実際の属性が異なってしまうことがある。推定された属性と実際の属性が異なっている場合には、視聴者の属性に対応しないターゲット広告が表示される。そうすると、ターゲット広告の効果が期待されない。
 本発明は、視聴者の属性に対応しないコンテンツが出力されてしまうことを低減することができる情報処理装置、コンテンツ表示システム、コンテンツ表示方法を提供する。
 本発明の一態様は、人物が撮像された撮像画像から人物を検出する検出部と、前記検出された人物に応じた属性を推定する推定部と、1人の人物から前記属性が複数推定された場合に、当該1人の人物から得られたそれぞれの属性に対する信頼度に基づいて、表示するコンテンツを複数抽出する抽出部と、選ばれた各コンテンツを表示領域に表示させる処理部と、を含む情報処理装置である。
 本発明の一態様は、人物が撮像された撮像画像から人物を検出する検出部と、前記検出された人物に応じた属性を推定する推定部と、1人の人物から前記属性が複数推定された場合に、当該1人の人物から得られたそれぞれの属性に対する信頼度に基づいて決定した数のコンテンツを抽出する抽出部と、抽出されたコンテンツの数に応じたコンテンツを表示領域に表示させる処理部と、を含む情報処理装置である。
 また、本発明の一態様は、人物が撮像された撮像画像から人物を検出する検出部と、前記検出された人物に応じた属性を推定する推定部と、1人の人物から前記属性が複数推定された場合に、当該1人の人物から得られたそれぞれの属性に対する信頼度に基づいて、表示するコンテンツを複数抽出する抽出部と、選ばれた各コンテンツを表示領域に表示させる再生指示を出力する処理部と、前記再生指示に応じた各コンテンツを再生し、表示領域に表示させる再生部と、を含むコンテンツ表示システムである。
 また、本発明の一態様は、人物が撮像された撮像画像から人物を検出し、前記検出された人物に応じた属性を推定し、1人の人物から前記属性が複数推定された場合に、当該1人の人物から得られたそれぞれの属性に対する信頼度に基づいて、表示するコンテンツを複数抽出し、選ばれた各コンテンツを表示領域に表示させるコンテンツ表示方法である。
 また、本発明の一態様は、人物が撮像された撮像画像から人物を検出し、前記検出された人物に応じた属性を推定し、1人の人物から前記属性が複数推定された場合に、当該1人の人物から得られたそれぞれの属性に対する信頼度に基づいて決定した数のコンテンツを抽出し、抽出されたコンテンツの数に応じたコンテンツを表示領域に表示させるコンテンツ表示方法である。
 本発明によれば、視聴者の属性に対応しないコンテンツが出力されてしまうことを低減することができる。
表示システム1の概略の構成を説明するシステム構成図である。 表示装置10と撮像領域との関係を説明する概念図である。 情報処理装置40の概略の機能を説明する機能ブロック図である。 推定部405によって推定された推定結果の一例を示す図である。 撮像装置30の動作を説明するフローチャートである。 情報処理装置40の動作を説明するフローチャートである。 映像信号出力装置20の動作を説明するフローチャートである。 表示装置10の動作を説明するフローチャートである。 マルチ表示システムにコンテンツが表示される場合を示す図である。 時系列順に複数のコンテンツを再生させる場合について説明する概念図である。 情報処理装置40の他の実施形態である情報処理装置40Aの構成を示す図である。 情報処理装置40の他の実施形態である情報処理装置40Bの構成を示す図である。
 図1は、表示システム1の概略の構成を説明するシステム構成図である。
 表示システム1は、表示装置10、映像信号出力装置20、撮像装置30、情報処理装置40、ネットワーク50を含む。
 映像信号出力装置20、撮像装置30及び情報処理装置40は、ネットワーク50を介して通信可能に接続される。表示装置10は、映像信号出力装置20に対して映像ケーブルを介して電気的に接続される。
 撮像装置30は、任意のフレームレートで継続的に映像を撮像する機能と、撮像された結果である撮像画像を、ネットワーク50を介して、情報処理装置40に対して送信する機能とを有する。撮像装置30は、例えば、イメージセンサーを備えたネットワークカメラであってもよい。
 情報処理装置40は、例えばコンピュータであり、記憶装置に記憶されたプログラムをCPU(中央処理装置)が読み出して実行することによって、各種機能を実現する。
 映像信号出力装置20は、情報処理装置40からデフォルトコンテンツまたはターゲットコンテンツを受信して記憶する記憶部、情報処理装置40からデフォルトコンテンツまたはターゲットコンテンツの再生指示を受信する受信部、記憶部に記憶されたデフォルトコンテンツまたはターゲットコンテンツのうち情報処理装置40から受信した再生指示に基づいて出力するコンテンツを抽出するコンテンツ抽出部と、再生指示が複数のコンテンツを再生することを示す場合に表示領域を分割させて複数のコンテンツをともに出力する出力手段と、映像ケーブルを介して接続されている表示装置に映像を出力する映像出力部の機能を含む。また、映像信号出力装置の出力手段は、再生指示が複数のコンテンツを再生することを示す場合に、複数のコンテンツを1つの表示領域に時系列順に出力する出力手段であっても有していてもよい。
 映像信号出力装置20は、例えば、サイネージプレーヤー、コンピュータ、映像再生装置等のうちいずれかを用いてもよい。
 表示装置10は、映像信号出力装置20から供給される映像信号を表示領域に表示する。例えば表示装置10は、液晶ディスプレイ装置であってもよいし、プロジェクタであってもよい。表示装置10が液晶ディスプレイ装置である場合、映像信号を液晶パネルの表示領域に表示する。表示装置10がプロジェクタである場合、表示装置10は、スクリーンの表示領域に映像信号を投射することで表示領域に映像信号を表示する。
 また、表示装置10は、1台の表示装置であってもよいし、複数の表示装置であってもよい。表示装置10が液晶ディスプレイ装置である場合、複数の液晶ディスプレイ装置を隣接して設置されたマルチ表示システムを構築することができる。また、表示装置10がプロジェクタである場合、複数のプロジェクタから投射された映像信号が隣接するように投射することにとってマルチ表示システムを構築することができる。
 図2は、表示装置10と撮像領域との関係を説明する概念図である。
 ここでは、設置される表示装置は、1台の表示装置10である場合について説明する。また、表示装置10の表示画面における1つの表示領域が、複数の表示領域に分割される場合について説明する。
 ここでは、表示装置10の1つの表示領域HR0は、分割領域HR1と分割領域HR2とに分割されている。分割領域HR1と分割領域HR2は、横方向に並ぶ。ここでは、分割数が2である場合について説明するが、3以上のいずれかの分割数であってもよい。また、分割領域は、横方向に並んでいてもよいし、縦方向に並ぶように分割されていてもよい。また、縦方向に複数列及び横方向に複数行並ぶように分割されていてもよい。
 また、分割領域は、いずれも同じ大きさであってもよいし、一部の分割領域が他の分割領域と異なる大きさであってもよい。また、分割領域は、同じ形状であってもよいし、異なる形状であってもよい。
 この実施形態においては、1つの表示領域を複数の領域に分割することで、複数の分割領域を得る場合について説明するが、1つの表示領域を分割する場合の他に、複数の表示領域を用いる場合であってもよい。例えば、m(mは2以上の自然数)台の表示装置が並べられたマルチ表示システムにおいては、1つの表示領域をn(ただし1≦n<m)台の表示装置によって表示し、他の表示領域を残りの表示装置によって表示するようにしてもよい。
 マルチ表示システムではなくても、表示装置10の近傍に別の表示装置が設置されている場合には、表示装置10の表示領域を1つの分割領域とし、別の表示装置の表示領域をもう1つの分割領域として、コンテンツを表示することもできる。
 このような表示装置10は、駅構内、駅前の広場、公共施設、イベント会場等の複数の人が来場しうる場所に設置される。表示装置10は、公共の場所に設置された場合には、パブリックディスプレイとして利用される。
 表示装置10は、音声を出力することもできる。この場合、表示装置10は、分割領域のそれぞれのコンテンツの音声のうちいずれか一方を出力するようにしてもよいし、両方を出力するようにしてもよい。
 撮像装置30は、表示装置の近傍に設けられる。ここでは、撮像装置30は、表示装置10に表示されたコンテンツを視聴可能な領域である撮像領域SRを撮像する場合について説明する。撮像領域SRは、ユーザが通行可能な領域であり、立ち止まることも可能であってもよい。
 この図においては、ある瞬間において、視聴者であるユーザPS1が撮像領域SRに存在している場合が示されている。
 図3は、情報処理装置40の概略の機能を説明する機能ブロック図である。
 記憶部401は、各種データを記憶する。
 例えば、記憶部401は、各種コンテンツを記憶する。コンテンツは、ユーザが視認可能な画像を含むものであればよく、静止画であってもよいし、動画であってもよい。また、コンテンツは画像だけではなく音が含まれていてもよい。ユーザは、コンテンツが画像のみである場合には、画像を視聴(視認)することができ、コンテンツが画像と音とを含む場合には、画像と音を視聴することができる。
 コンテンツは、広告、お知らせ、案内等のいずれであってもよい。コンテンツは再生時間が予め定められている。再生時間は、再生開始から再生終了までの時間である。例えば、再生時間が15秒であるコンテンツや、再生時間が30秒であるコンテンツがある。また、コンテンツが静止画である場合には、再生を開始した後、再生終了時間が到来する前であっても、優先して表示するターゲットコンテンツがある場合には、再生を途中で終了するようにしてもよい。
 また、デフォルトコンテンツの再生時間は、ターゲットコンテンツの再生時間よりも短く設定されていてもよい。デフォルトコンテンツがターゲットコンテンツよりも早い周期で終了することで、デフォルトコンテンツが終了するタイミングが早めに到来するため、ターゲットコンテンツを表示する機会を増やすことができる。
 この実施形態では、コンテンツが広告である場合を一例として説明する。
 コンテンツには、ターゲットコンテンツとデフォルトコンテンツとがある。
 ターゲットコンテンツは、撮像装置30によって撮像された画像に含まれる人物の属性に応じたコンテンツである。ターゲットコンテンツは、ターゲットする対象の属性を示す属性データが対応付けされて記憶部401に記憶される。
 デフォルトコンテンツは、特定の人物とは関係することがないコンテンツである。デフォルトコンテンツは、ターゲットコンテンツ以外のコンテンツであってもよい。デフォルトコンテンツは、例えば、日付や時間帯に応じて出力する対象のコンテンツが少なくとも1つ選ばれる。
 入力部402は、マウスやキーボード等の入力装置から入力される操作入力を取得する。
 設定部403は、表示システム1において必要なデータの設定処理を行う。設定部403は、入力装置からオペレータによって入力される操作入力を入力部402を介して取得し、この操作入力に応じて、ターゲットコンテンツやデフォルトコンテンツの設定を行う。
 受信部404は、撮像装置30から送信される撮像画像を受信する。受信部404は、撮像装置30において撮像された画像からフレームレートに従って順次生成される画像データ(撮像画像)を、継続的に受信する。受信部404が受信する撮像画像は、視認領域SRが撮像された撮像画像である。
 推定部405は、受信部404が撮像装置30から受信した撮像画像から、画像認識処理を行うことによって人物を検出し、検出された結果に基づいて、その人物に応じた属性を推定する。推定部405は、撮像画像から1人の人物が検出された場合には、その1人の人物について属性を推定する。推定部405は、撮像画像から複数の人物が検出された場合には、各人物について属性を推定することもできる。
 属性は、例えば、年齢、性別、職業、服装等がある。推定部405が推定する属性は、年齢、性別、職業、服装等の複数の属性のうち1つの属性について推定してもよいし、複数の種類について推定してもよい。推定する属性は、いずれであってもよい。
 推定部405は、人物に応じた属性を推定するとともに、信頼度を求める。信頼度は、推定された属性が正しいと思われる確率を表す。信頼度は、「確度」や「コンフィデンス」とも呼ばれることがある。
 信頼度は、撮像装置30に対して人物が撮像された状態によっては異なる場合がある。例えば、信頼度は、撮像装置30に対して人物の顔の向きが横方向や上下方向に向いている場合や、鼻と口を覆うマスクを着用している場合、人物が深く帽子をかぶっている場合、撮像装置30から人物までの距離が遠い場合等によっては、推定される値が異なる。
 推定部405は、例えばディープラーニング等によって、様々な年齢・性別の人が含まれる多量の画像を用いて事前学習をされた学習済みモデルを用い、撮像装置30から得られる撮像画像をこの学習済みモデルに入力することで、人物の検出処理や、属性の推定処理を行うようにしてもよい。人物から属性を推定する識別器を推定部405に用いることができる。
 判定部406は、属性に対するそれぞれの信頼度と基準値との大小関係を判定する。基準値は、予め決められており、記憶部401に記憶されていてもよい。
 抽出部407は、推定部405によって推定された属性からターゲットコンテンツを抽出する。抽出部407は、推定部405から得られた属性に対応する信頼度に基づいて、コンテンツ数を決定する。例えば、抽出部407は、推定された属性が1つであり、その属性に対応する信頼度が1つ得られた場合には、信頼度が1つであるためコンテンツ数を1と決定する。
 抽出部407は、推定された属性が複数である場合には、それらの属性に対応する複数のコンテンツを抽出する。複数のコンテンツを抽出するにあたり、抽出部407は、抽出するコンテンツの数を決定する。コンテンツの数を決める場合、抽出部407は、1人の人物から属性が複数推定されていれば、当該1人の人物から得られたそれぞれの属性に対する信頼度に基づいて、抽出するコンテンツの数を決めることができる。
 信頼度に基づいてコンテンツの数を決める場合、基準値を用いて信頼度を判定することによって、コンテンツ数を決定するようにしてもよい。この場合、抽出部407は、判定部406によって判定された判定結果に基づいて、最も高い信頼度が基準値未満である場合には、1人の人物から得られたそれぞれの属性に対する信頼度に基づいて、表示するコンテンツを複数抽出する。最も高い信頼度が基準値未満である場合、コンテンツ数を2として決定し、信頼度が高い方から上位2つの信頼度に対応するそれぞれの属性に応じたコンテンツを抽出する。
 基準値に対する信頼度の大小関係を判定し、判定結果に応じてコンテンツ数を決めるようにした場合には、推定された属性と視聴者の実際の属性とが異なる可能性が高いと判断することができ、最も高い信頼度の属性に対応するターゲットコンテンツと、二番目以降に高い信頼度の属性のうち少なくともいずれか1つの属性に対応するターゲットコンテンツと、を表示することができる。
 また、信頼度に基づいてコンテンツの数を決める場合、信頼度が高い方から上位のいくつかについて、信頼度が近い値(例えば、差が予め決められた値以内の場合)の属性の個数に応じてコンテンツの数を決めるようにしてもよい。例えば、複数の属性に対するそれぞれの信頼度のうち上位の信頼度の差が予め決められた値以内である場合に、表示するコンテンツを複数抽出するようにしてもよい。より具体的には、上位2つの信頼度が近い値である場合には、コンテンツ数を2として決定し、上位3つの信頼度が近い値である場合には、コンテンツ数を3として決定する。例えば、最も高い信頼度が50%であり、2番目に高い信頼度が40%であり、3番目に高い信頼度が5%である場合、コンテンツ数を2として決定する。また、例えば、最も高い信頼度が40%であり、2番目に高い信頼度が30%であり、3番目に高い信頼度が25%であり、4番目に高い信頼度が5%である場合、コンテンツ数を3として決定する。
 信頼度が近い値であるか否かの判定は、判定部406が行うようにしてもよい。この場合、判定部406は、信頼度の差の基準値を予め記憶しておき、上位の信頼度であるその差の範囲内であれば信頼度が近い値であると判定することができる。
 得られた属性の信頼度の上位のいくつかについて、ある程度近い値である場合には、人物の実際の属性に対して、推定された属性のうちどちらが対応しているか判断がつきにくい。抽出部407は、得られた信頼度の差を参照し、この信頼度の差が予め決められた値以内(ある程度近い値)であると判定できた場合には、判定結果に応じて、予め決められた値以内となった信頼度の個数に基づいて、表示するコンテンツの数を決めることができる。
 このように、抽出部407は、1人の視聴者から得られた属性に応じた信頼度に基づいてコンテンツの数を決めるようにしたので、ある視聴者に対して推定される属性が複数ある場合に、第一候補に対応するコンテンツだけでなく、第二候補(あるいは第三候補)に対応するコンテンツも選択し、それらをそれぞれ表示することが可能となる。
 送信部408は、各種データを送信する。
 例えば、送信部408は、記憶部401に記憶されたデフォルトコンテンツまたはターゲットコンテンツを読み出し、読み出したデフォルトコンテンツまたはターゲットコンテンツを、ネットワーク50を介して接続されている映像信号出力装置20に配信する。
 処理部409は、コンテンツを再生させる再生指示を映像信号出力装置20に対して送信部408から送信させる。再生指示には、デフォルトコンテンツを再生させる再生指示と、ターゲットコンテンツを再生させる再生指示とがある。
 処理部409は、抽出部407によってコンテンツが複数抽出された場合には、抽出された複数のコンテンツを再生させる再生指示を映像信号出力装置20に対して送信部408から送信させる。処理部409は、複数のコンテンツを再生させる場合、複数のコンテンツを1つずつ異なる表示領域に割り当てて表示させる再生指示を映像信号出力装置20に対して送信部408から送信させることもできる。また、処理部409は、複数のコンテンツを再生させる場合、複数のコンテンツを時系列順に表示させる再生指示を映像信号出力装置20に対して送信部408から送信させることもできる。
 処理部409は、1つの表示領域に複数のコンテンツを表示させる場合、表示領域が複数の領域に分割された分割領域のそれぞれに、コンテンツを1つずつ割り当てて表示させることもできる。この場合、1台の表示装置10において複数のコンテンツを一緒に表示することができる。
 処理部409は、1つの表示領域に複数のコンテンツを表示させる場合、マルチ表示システムにおける表示領域に表示させることもできる。この場合、マルチ表示システムの複数の表示画面を含む領域を1つの表示領域とし、この表示領域が分割された分割領域のそれぞれに、コンテンツを1つずつ割り当てて表示させることもできる。
 また、処理部409は、複数のコンテンツを再生させる場合、複数のコンテンツを1つの表示領域に時系列順に表示させる再生指示を映像信号出力装置20に対して送信部408から送信させることもできる。この場合、利用する表示領域が1つであっても、複数のコンテンツを順に表示することができる。
 図4は、推定部405によって推定された推定結果の一例を示す図である。
 推定部405によって推定された推定結果には、推定された属性と信頼度とが含まれる。また推定結果には、属性と信頼度の組み合わせが複数得られる場合がある。例えば、推定結果は、属性が「20代男性」であり、その信頼度が「50%」である組み合わせと、属性が「30代男性」であり、その信頼度が「40%」である組み合わせと、属性が「その他」であり、その信頼度が「10%」である組み合わせ、のような複数の組が得られる場合がある。
 ここでは、属性は、年代と性別とを含む場合について例示されているが、1つの属性を得るようにしてもよいし、得られる属性の組み合わせが別の組み合わせであってもよい。
 次に、上述した構成における表示システム1の動作を説明する。
[準備]
 表示装置10、映像信号出力装置20、撮像装置30、情報処理装置40のそれぞれの電源がONの状態にされる。映像信号出力装置20、撮像装置30、情報処理装置40は、同一のネットワーク50を介して通信可能に接続される。映像信号出力装置20は、表示装置10に対して映像ケーブルを介して接続される。撮像装置30は、任意のフレームレートで撮像領域SRを撮像した撮像画像を、ネットワーク50を介して情報処理装置40に送信し続ける。
 情報処理装置40は、入力装置を介してオペレータによって入力される操作入力に基づいて、記憶部401に記憶されたコンテンツファイルの中から、デフォルト広告とするデフォルトコンテンツを複数指定し、それぞれのデフォルトコンテンツを映像信号出力装置20に配信する。また、情報処理装置40は、オペレータからの操作入力に基づいて、複数のターゲットコンテンツのそれぞれに対して、表示する対象の属性と、ターゲットコンテンツを識別する識別情報との関係性を設定し、映像信号出力装置20に配信する。
 また、情報処理装置40は、入力装置を介してオペレータによって入力される操作入力に基づいて、信頼度の基準値を記憶部401に記憶する。例えば基準値として60%が指定された場合には、60%を示す値が記憶部401に記憶される。
 映像信号出力装置20は、情報処理装置40からデフォルトコンテンツとターゲットコンテンツとを受信すると、映像信号出力装置20内の記憶装置に記憶し、デフォルトコンテンツの再生を開始し、表示装置10にコンテンツに応じた映像信号を出力する。表示装置10は、映像信号出力装置20から受信した映像信号を表示領域に表示する。
 図5は、撮像装置30の動作を説明するフローチャートである。
 撮像装置30は、電源がONにされると(ステップS101)、所定のフレームレートに従って撮像領域SRを含む領域を撮像し(ステップS102)、撮像画像を情報処理装置40に送信する(ステップS103)。
 撮像装置30は、電源OFFの指示が入力されたか否かを判定し(ステップS104)、電源OFFの指示が入力されていないと判定した場合(ステップS104-NO)には、ステップS102に移行し、電源OFFの指示が入力されたと判定した場合(ステップS104-YES)には、処理を終了する。
 このように、撮像装置30は、フレームレートに従って撮像する毎に、撮像画像を情報処理装置40に送信する。
 図6は、情報処理装置40の動作を説明するフローチャートである。
 受信部404が撮像装置30から撮像画像を受信すると(ステップS201)、推定部405は、受信した撮像画像に対して画像認識処理を行うことによって、撮像領域SRから視聴者が検出されたか否かを判定する(ステップS202)。
 視聴者が検出されなかった場合には、情報処理装置40は、処理をステップS206に進める。
 一方、推定部405は、撮像領域SRにおいて視聴者が検出された場合(ステップS202-YES)、推定部405は、検出された視聴者の画像に基づいて、この視聴者の属性を推定するとともに(ステップS203)、属性に対する信頼度を求める。ここでは、1人の視聴者が検出された場合に、その1人の視聴者から複数の属性が推定される場合がある。
 判定部406は、推定部405によって得られた信頼度のうち、最も高い信頼度が基準値以上であるか否かを判定する(ステップS204)。この判定は、最も高い信頼度が基準値以上であるか否かを判定するようにしてもよいし、最も高い信頼度が基準値未満であるか否かを判定するようにしてもよい。
 抽出部407は、判定部406の判定結果において、最も高い信頼度が基準値以上である場合には(ステップS204-YES)、最も信頼度が高い属性に対応する1つのターゲットコンテンツを抽出する。1つのコンテンツが抽出された場合、処理部409は、その抽出されたコンテンツの識別情報とともに再生指示を映像信号出力装置20に送信部408によって送信する(ステップS205)。
 これにより、映像信号出力装置20は、現在表示させているコンテンツの再生が終了する直前にターゲットコンテンツの再生指示を受信した場合には、この再生指示に対応する1つのターゲットコンテンツを表示装置10の表示領域に表示させる。視聴者は、この1つのコンテンツを視聴することができる。
 一方、抽出部407は、最も高い信頼度が基準値以上ではない場合には(ステップS204-NO)、最も信頼度が高い属性に対応するターゲットコンテンツと、2番目に信頼度が高い属性に対応するターゲットコンテンツを抽出する。ここでは、コンテンツを抽出する数が2であるとして予め指定されている場合について説明する。処理部409は、2つのコンテンツが抽出された場合には、抽出されたそれぞれのコンテンツの識別情報とともに再生指示を映像信号出力装置20に送信部408によって送信する(ステップS207)。
 これにより、映像信号出力装置20は、現在表示させているコンテンツの再生が終了する直前に2つのターゲットコンテンツを再生させる再生指示を受信した場合には、表示装置10の表示領域を2つに分割し、分割領域にそれぞれ1つずつターゲットコンテンツを配置し、同時に再生を開始する。映像信号出力装置20は、再生が開始された2つのコンテンツに対応する映像信号を表示装置10に出力する。表示装置10は、1つの表示領域に2つのターゲットコンテンツを表示する。これにより、視聴者は、2つのコンテンツを視聴することが可能となる。
 情報処理装置40は、電源OFFの指示が入力されているか否かを判定し(ステップS206)、電源OFFの指示が入力されていなければ(ステップS206-NO)、処理をステップS201に移行する。情報処理装置40は、電源OFFの指示が入力されていれば、電源をOFFにする。
 なお、ステップS202において、複数の視聴者が検出された場合には、情報処理装置40は、複数の視聴者が検出されたことに応じた処理を行うようにし、処理をステップS206に進めるようにしてもよい。例えば、情報処理装置40は、検出された複数の視聴者のうち、1人の視聴者を特定し、その視聴者の属性に応じたコンテンツを表示装置10に表示するようにしてもよい。
 図7は、映像信号出力装置20の動作を説明するフローチャートである。
 映像信号出力装置20は、電源がONにされると(ステップS301)、情報処理装置40からデフォルトコンテンツとターゲットコンテンツを受信し、映像信号出力装置20内の記憶装置に記憶し、デフォルトコンテンツの再生を開始する。デフォルトコンテンツの再生を開始すると、表示装置10に対し、再生が開始されたデフォルトコンテンツに応じた映像信号を出力する(ステップS302)。
 映像信号出力装置20は、電源OFFの指示が入力されたか否かを判定し(ステップS303)、電源OFFの指示が入力されたと判定した場合(ステップS303-YES)には処理を終了し、電源OFFの指示が入力されていないと判定した場合(ステップS303-NO)には、コンテンツの再生が終了したか否かを判定する(ステップS304)。ここで、コンテンツには、再生時間が決められている。映像信号出力装置20は、再生を開始してからの経過時間が、再生時間が示す再生終了時間に到達したか否かを判定することで、再生が終了したか否かを判定してもよい。このステップS304では、再生しているコンテンツがデフォルトコンテンツであってもターゲットコンテンツであっても同様に、再生されているコンテンツの再生終了時間が到来したか否かに基づいて判定を行うことができる。
 映像信号出力装置20は、デフォルトコンテンツを再生している途中であり、当該デフォルトコンテンツに設定されている再生時間における再生終了時間が到来する前であれば、再生が終了していないと判定し(ステップS304-NO)、処理をステップS303に移行する。デフォルトコンテンツに設定されている再生時間における再生終了時間が到来したと判定した場合には(ステップS304-YES)、映像信号出力装置20は、ターゲットコンテンツの再生指示を情報処理装置40から受信したか否かを判定する(ステップS305)。ここでは、再生終了時間が到来したか否かを判定してもよし、再生終了時間が到来する直前であるか否かを判定するようにしてもよい。直前であるか否かについては、再生終了時間よりも所定の時間だけ前(例えば1秒等)の時間が到来したか否かに基づいて判定するようにしてもよい。
 ターゲットコンテンツの再生指示を受信していないと判定した場合(ステップS305-NO)、映像信号出力装置20は、ステップS302に処理を移行する。
 ターゲットコンテンツの再生指示を受信したと判定した場合、映像信号出力装置20は、受信した再生指示に応じたターゲットコンテンツを表示する映像信号を表示装置10に送信し、表示させる(ステップS306)。その後、映像信号出力装置20は、処理をステップS303に移行する。
 ここで、2つのターゲットコンテンツを再生する再生指示を受信した場合、映像信号出力装置20は、表示領域を2つに分割し、分割領域にそれぞれ1つずつターゲットコンテンツを配置し、同時に再生を開始する。そして映像信号出力装置20は、再生が開始された2つのコンテンツに対応する映像信号を表示装置10に出力する。これにより、表示装置10には、1つの表示領域において2つのターゲットコンテンツが表示される。視聴者は、この2つのコンテンツを視聴することが可能となる。
 図8は、表示装置10の動作を説明するフローチャートである。
 表示装置10は、電源がONにされると(ステップS401)、映像信号出力装置20から映像信号が供給されているか否かを判定し(ステップS402)、映像信号が供給されている場合には(ステップS402-YES)、映像信号出力装置20から供給される映像信号を表示領域に表示する(ステップS403)。
 表示装置10は、電源OFFの指示が入力されたか否かを判定し(ステップS404)、電源OFFの指示が入力されていないと判定した場合(ステップS404-NO)には、ステップS402に移行し、電源OFFの指示が入力されたと判定した場合(ステップS404-YES)には、処理を終了する。
 ステップS402において、映像信号がない場合、表示装置10は、処理をステップS404に移行する。
 図9は、マルチ表示システムにコンテンツが表示される場合を示す図である。
 マルチ表示システムにコンテンツを表示する場合、映像信号出力装置20は、情報処理装置40から複数のターゲットコンテンツを表示させる再生指示を受信すると、マルチ表示システム10Aにおけるマルチ画面の表示領域を分割し、分割領域にそれぞれのコンテンツを表示させる。ここでは、6台の表示装置(表示装置10A1、表示装置10A2、表示装置10A3、表示装置10A4、表示装置10A5、表示装置10A6)を含むマルチ表示システム10Aであり、縦方向に2台、横方向に3台となるように表示装置が配列されている。情報処理装置40から2つのターゲットコンテンツを再生するよう再生指示を受信した場合、映像信号出力装置20は、マルチ表示システム10Aにおける表示領域を、表示装置10A1、表示装置10A2、表示装置10A4、表示装置10A5の4台の表示画面を含む分割領域HY1aと、表示装置10A3、表示装置10A6の2台の表示画面を含む分割領域HY1bとに分割する。そして映像信号出力装置20は、再生指示がなされた2つのターゲットコンテンツのうち1つのコンテンツを表示領域HY1aに表示し、もう1つターゲットコンテンツを表示領域HY1bに表示する。
 1台の表示装置10または、マルチ表示システムにおいて、1つの表示領域から複数の分割領域を得る場合、各分割領域の大きさの割合は、信頼度に応じて決めるようにしてもよい。例えば、信頼度が50%と40%のターゲットコンテンツを表示する場合、映像信号出力装置20は、信頼度が50%であるターゲットコンテンツを表示する分割領域を、信頼度が40%であるターゲットコンテンツを表示する分割領域よりも広い領域となるように分割してもよい。例えば、信頼度が50%であるターゲットコンテンツは、分割領域HY1aに表示し、信頼度が40%であるターゲットコンテンツは、分割領域HY1bに表示することができる。
 これにより、1人の視聴者から推定された複数の属性に基づく2つのコンテンツをともに表示することができる。視聴者は、この2つのコンテンツを両方とも視聴することができる。例えば、視聴者の実際の属性が30代男性である場合において、その1人の視聴者から推定された属性のうち、最も高い信頼度が付与されている属性が「20代男性」であり、2番目に高い信頼度が付与された属性が「30代男性」であったとしても、「20代男性」に対応するターゲットコンテンツと、「30代男性」に対応するターゲットコンテンツとのターゲットコンテンツが表示されるため、視聴者の実際の属性に対応するターゲットコンテンツも表示することができる。また、視聴者の実際の属性が「30代男性」であったとしても、「20代男性」の属性に応じたターゲットコンテンツに対して興味がある可能性もある。そのため、視聴者に対して2つのコンテンツを視聴できるように表示することができるため、視聴者は、両方を視聴することができるメリットがある。また、同じ時間においてターゲットコンテンツが複数表示されているため、視聴者は、自分の興味がある方のターゲットコンテンツを選択して視聴することもできる。
 図10は、時系列順に複数のコンテンツを再生させる場合について説明する概念図である。
 情報処理装置40から、時系列順に複数のコンテンツを再生する再生指示を受信した場合、映像信号出力装置20は、1つの表示領域において、再生指示に応じたターゲットコンテンツを時系列順に表示する。ここでは、第1ターゲットコンテンツ(属性「30代男性」に対応するターゲットコンテンツ)と第2ターゲットコンテンツ(属性「20代男性」に対応するターゲットコンテンツ)との2つを再生する再生指示を受信した場合、映像信号出力装置20は、信頼度が高い方から順にターゲットコンテンツを再生する。例えば、映像信号出力装置20は、第1ターゲットコンテンツを時刻t1において表示装置10に表示させる。そして、映像信号出力装置20は、第1ターゲットコンテンツの再生終了時間が到来すると、第2ターゲットコンテンツを表示させる。これにより、映像信号出力装置20は、視聴者に対して2つのコンテンツを順に視聴できるように表示することができるため、視聴者は、両方のターゲットコンテンツを視聴することができる。
 また、ターゲットコンテンツを時系列順に表示する場合、表示領域を分割しなくてもよいため、表示領域を全体的に利用してターゲットコンテンツを表示することができる。
 図11は、情報処理装置40の他の実施形態である情報処理装置40Aの構成を示す図である。情報処理装置40Aは、検出部451、推定部452、抽出部453、処理部454を含む。
 検出部451は、人物が撮像された撮像画像から人物を検出する。推定部452は、検出された人物に応じた属性を推定する。抽出部453は、1人の人物から前記属性が複数推定された場合に、当該1人の人物から得られたそれぞれの属性に対する信頼度に基づいて、表示するコンテンツを複数抽出する。処理部454は、選ばれた各コンテンツを表示領域に表示させる。
 上述した実施形態によれば、情報処理装置は、撮像装置によって撮像された撮像画像から検出された1人の視聴者から、複数の属性と信頼度が推定された場合には、信頼度に応じて複数のコンテンツを決定し、効果的な再生パターンを自動選択して、再生パターンに応じてコンテンツを表示させることができる。これにより、コンテンツを視聴してもらう効果を高めることができる。
 図12は、情報処理装置40の他の実施形態である情報処理装置40Bの構成を示す図である。情報処理装置40Bは、検出部461、推定部462、抽出部463、処理部464を含む。
 検出部461は、人物が撮像された撮像画像から人物を検出する。推定部462は、検出された人物に応じた属性を推定する。抽出部463は、1人の人物から属性が複数推定された場合に、当該1人の人物から得られたそれぞれの属性に対する信頼度に基づいて決定した数のコンテンツを抽出する。処理部464は、抽出されたコンテンツの数に応じたコンテンツを表示領域に表示させる。
 上述した実施形態によれば、情報処理装置は、撮像装置によって撮像された撮像画像から検出された1人の視聴者から、複数の属性と信頼度が推定された場合には、信頼度に応じて、表示するターゲットの数を決定し、決定された数に応じたコンテンツを表示させることができる。これにより、コンテンツを視聴してもらう効果を高めることができる。
 上述した実施形態において、判定部406は、信頼度と基準値とを比較するようにしたが、信頼度ではない別の値と比較するようにしてもよい。
 また、上述した実施形態によれば、複数の表示装置を用いて、ターゲットコンテンツをはじめとする、再生コンテンツを動的に制御することが可能なデジタルサイネージシステムを提供することができる。
 また、図1における処理部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより施工管理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
 また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
 また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、サーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものを含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。また、上記のプログラムを所定のサーバに記憶させておき、他の装置からの要求に応じて、当該プログラムを通信回線を介して配信(ダウンロード等)させるようにしてもよい。
 以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
1・・・表示システム、10,10A1,10A2,10A3,10A4,10A5,10A6・・・表示装置、10A・・・マルチ表示システム、20・・・映像信号出力装置、30・・・撮像装置、40,40A・・・情報処理装置、50・・・ネットワーク、401・・・記憶部、402・・・入力部、403・・・設定部、404・・・受信部、405,452,462・・・推定部、406・・・判定部、407,453,463・・・抽出部、408・・・送信部、409,454・・・処理部、451,461・・・検出部、464・・・処理部

Claims (12)

  1.  人物が撮像された撮像画像から人物を検出する検出部と、
     前記検出された人物に応じた属性を推定する推定部と、
     1人の人物から前記属性が複数推定された場合に、当該1人の人物から得られたそれぞれの属性に対する信頼度に基づいて、表示するコンテンツを1つまたは複数抽出する抽出部と、
     抽出されたコンテンツを表示領域に表示させる処理部と、
     を含む情報処理装置。
  2.  人物が撮像された撮像画像から人物を検出する検出部と、
     前記検出された人物に応じた属性を推定する推定部と、
     1人の人物から前記属性が複数推定された場合に、当該1人の人物から得られたそれぞれの属性に対する信頼度に基づいて決定した数のコンテンツを抽出する抽出部と、
     抽出されたコンテンツの数に応じたコンテンツを表示領域に表示させる処理部と、
     を含む情報処理装置。
  3.  前記抽出部は、
     前記属性に対するそれぞれの信頼度に基づいて、表示コンテンツ数を決める
     請求項1に記載の情報処理装置。
  4.  前記属性に対するそれぞれの信頼度と基準値との大小関係を判定する判定部を有し、
     前記抽出部は、複数の属性に対する信頼度のうち、最も高い信頼度が前記基準値未満である場合に、表示するコンテンツを複数抽出する
     請求項1から請求項3のうちいずれか1項に記載の情報処理装置。
  5.  前記抽出部は、複数の属性に対するそれぞれの信頼度のうち上位の信頼度の差が予め決められた値以内である場合に、表示するコンテンツを複数抽出する
     請求項1から請求項3のうちいずれか1項に記載の情報処理装置。
  6.  前記処理部は、
     前記抽出されたコンテンツが複数である場合に、各コンテンツを1つずつ異なる表示領域に表示させる
     請求項1から請求項5のうちいずれか1項に記載の情報処理装置。
  7.  前記処理部は、
     前記抽出されたコンテンツが複数である場合に、各コンテンツを1つの表示領域に時系列順に表示させる
     請求項1から請求項5のうちいずれか1項に記載の情報処理装置。
  8.  前記表示領域は、1台の表示装置における表示画面における表示領域であり、
     前記処理部は、前記抽出されたコンテンツが複数である場合に、前記表示領域が複数の領域に分割された分割領域のそれぞれに、前記複数のコンテンツを1つずつ表示させる
     請求項1から請求項6のうちいずれか1項に記載の情報処理装置。
  9.  前記表示領域は、複数の表示領域が配置されてマルチ表示システムが構築されており、
     前記処理部は、前記抽出されたコンテンツが複数である場合に、前記マルチ表示システムにおけるマルチ表示画面が分割された分割領域のそれぞれに、前記複数のコンテンツを1つずつ割り当てて表示させる
     請求項1から請求項6のうちいずれか1項に記載の情報処理装置。
  10.  人物が撮像された撮像画像から人物を検出する検出部と、
     前記検出された人物に応じた属性を推定する推定部と、
     1人の人物から前記属性が複数推定された場合に、当該1人の人物から得られたそれぞれの属性に対する信頼度に基づいて、表示するコンテンツを1つ又は複数抽出する抽出部と、
     抽出されたコンテンツを表示領域に表示させる再生指示を出力する処理部と、
     前記再生指示に応じたコンテンツを再生し、表示領域に表示させる再生部と、
     を含むコンテンツ表示システム。
  11.  人物が撮像された撮像画像から人物を検出し、
     前記検出された人物に応じた属性を推定し、
     1人の人物から前記属性が複数推定された場合に、当該1人の人物から得られたそれぞれの属性に対する信頼度に基づいて、表示するコンテンツを1つ又は複数抽出し、
     抽出されたコンテンツを表示領域に表示させる
     コンテンツ表示方法。
  12.  人物が撮像された撮像画像から人物を検出し、
     前記検出された人物に応じた属性を推定し、
     1人の人物から前記属性が複数推定された場合に、当該1人の人物から得られたそれぞれの属性に対する信頼度に基づいて決定した数のコンテンツを抽出し、
     抽出されたコンテンツの数に応じたコンテンツを表示領域に表示させる
     コンテンツ表示方法。
PCT/JP2021/017906 2021-05-11 2021-05-11 情報処理装置、コンテンツ表示システム、コンテンツ表示方法 WO2022239117A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/JP2021/017906 WO2022239117A1 (ja) 2021-05-11 2021-05-11 情報処理装置、コンテンツ表示システム、コンテンツ表示方法
US18/377,153 US20240054532A1 (en) 2021-05-11 2023-10-05 Information processing device, content display system, and content display method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/017906 WO2022239117A1 (ja) 2021-05-11 2021-05-11 情報処理装置、コンテンツ表示システム、コンテンツ表示方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US18/377,153 Continuation US20240054532A1 (en) 2021-05-11 2023-10-05 Information processing device, content display system, and content display method

Publications (1)

Publication Number Publication Date
WO2022239117A1 true WO2022239117A1 (ja) 2022-11-17

Family

ID=84028932

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/017906 WO2022239117A1 (ja) 2021-05-11 2021-05-11 情報処理装置、コンテンツ表示システム、コンテンツ表示方法

Country Status (2)

Country Link
US (1) US20240054532A1 (ja)
WO (1) WO2022239117A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012134836A (ja) * 2010-12-22 2012-07-12 Canon Marketing Japan Inc コンテンツ表示装置、その制御方法及びプログラム
US20170083778A1 (en) * 2015-09-17 2017-03-23 Samsung Electronics Co., Ltd. Display device, controlling method thereof and computer-readable recording medium
JP2017204134A (ja) * 2016-05-11 2017-11-16 日本電信電話株式会社 属性推定装置、属性推定方法およびプログラム
JP2020167646A (ja) * 2019-03-29 2020-10-08 株式会社ビデオリサーチ テレビ番組用広告の提供方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012134836A (ja) * 2010-12-22 2012-07-12 Canon Marketing Japan Inc コンテンツ表示装置、その制御方法及びプログラム
US20170083778A1 (en) * 2015-09-17 2017-03-23 Samsung Electronics Co., Ltd. Display device, controlling method thereof and computer-readable recording medium
JP2017204134A (ja) * 2016-05-11 2017-11-16 日本電信電話株式会社 属性推定装置、属性推定方法およびプログラム
JP2020167646A (ja) * 2019-03-29 2020-10-08 株式会社ビデオリサーチ テレビ番組用広告の提供方法

Also Published As

Publication number Publication date
US20240054532A1 (en) 2024-02-15

Similar Documents

Publication Publication Date Title
JP4794453B2 (ja) インタラクティブ・ビデオ・ディスプレイ・システムを管理する方法及びシステム
ES2719586T3 (es) Creación de puntos de referencia en un flujo multimedia con reconocimiento de contenido automatizado
CN102244807B (zh) 自适应视频变焦
JP4934861B2 (ja) 表示システム、表示方法、表示効果測定システム、及び、表示効果測定方法。
JP5224360B2 (ja) 電子広告装置、電子広告方法及びプログラム
JP7440020B2 (ja) 情報処理方法、端末装置、情報処理装置、及び情報処理システム
US20100253778A1 (en) Media displaying system and method
CN103167361A (zh) 处理视听内容的方法及对应设备
CN113490004B (zh) 一种直播互动方法及相关装置
CN111242704B (zh) 用于在现实场景中叠加直播人物影像的方法和电子设备
US20130018735A1 (en) System and Method for interaction specific advertising media distribution
WO2018235595A1 (ja) 情報提供装置、情報提供方法及びプログラム
KR20140068634A (ko) 지능형 광고를 위한 얼굴 영상 분석시스템
JP2011077965A (ja) 視聴者識別に基づく映像配信サービス実現装置、映像配信サービス実現方法、映像配信サービス実現プログラムおよびそのプログラムを記録した記録媒体
US10664513B2 (en) Automatic environmental presentation content selection
WO2021187529A1 (ja) 情報処理装置、表示システム、表示制御方法
WO2022239117A1 (ja) 情報処理装置、コンテンツ表示システム、コンテンツ表示方法
CN112528050B (zh) 一种多媒体互动系统及方法
WO2022201315A1 (ja) 情報処理装置、コンテンツ表示システム、コンテンツ表示方法
US11711328B2 (en) Message output apparatus, learning apparatus, message output method, learning method, and program
CN110764676B (zh) 一种信息资源显示方法、装置、电子设备以及存储介质
JP7185892B2 (ja) データ処理装置、データ処理システム、データ処理方法、及びプログラム
US20200226379A1 (en) Computer system, pavilion content changing method and program
CN114501127A (zh) 在多画面视频中插入数字内容
JP7069550B2 (ja) 講義映像分析装置、講義映像分析システム、方法およびプログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21941851

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21941851

Country of ref document: EP

Kind code of ref document: A1