WO2020054193A1 - 情報処理装置、情報処理方法及びプログラム - Google Patents
情報処理装置、情報処理方法及びプログラム Download PDFInfo
- Publication number
- WO2020054193A1 WO2020054193A1 PCT/JP2019/026985 JP2019026985W WO2020054193A1 WO 2020054193 A1 WO2020054193 A1 WO 2020054193A1 JP 2019026985 W JP2019026985 W JP 2019026985W WO 2020054193 A1 WO2020054193 A1 WO 2020054193A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- information
- unit
- face detection
- viewpoint position
- reference point
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/30—Image reproducers
- H04N13/366—Image reproducers using viewer tracking
- H04N13/383—Image reproducers using viewer tracking for tracking with gaze detection, i.e. detecting the lines of sight of the viewer's eyes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/30—Image reproducers
- H04N13/302—Image reproducers for viewing without the aid of special glasses, i.e. using autostereoscopic displays
- H04N13/305—Image reproducers for viewing without the aid of special glasses, i.e. using autostereoscopic displays using lenticular lenses, e.g. arrangements of cylindrical lenses
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/30—Image reproducers
- H04N13/366—Image reproducers using viewer tracking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
- G06T2207/30201—Face
Definitions
- the present disclosure relates to an information processing device, an information processing method, and a program.
- a lenticular method using a lenticular lens is known as one of the naked-eye stereoscopic displays.
- the left and right viewpoint positions of a user are detected, light rays optimal for the viewpoint positions are collected, and an image for the right eye and Generate an image for the left eye.
- Non-Patent Document 1 As a technique for detecting the viewpoint position of the user, a method of predicting a viewing position in accordance with the movement of the user (for example, Patent Document 1 below), a feature point is detected from an image, and the viewpoint is tracked by tracking the feature point. (For example, Non-Patent Document 1 below) has been proposed.
- the method of predicting the viewpoint position has a problem that an error occurs in the detection result of the viewpoint position when switching according to the movement amount. Further, in the case of the method using the Lucas-Kanade algorithm described in Non-Patent Document 1, there is a problem that processing time is required.
- One object of the present disclosure is to provide, for example, an information processing device, an information processing method, and a program that perform quick and stable tracking of a viewpoint position.
- An acquisition unit that performs face detection based on the captured image, and acquires face detection information including face frame information and viewpoint position information based on the face detection result;
- a reference point calculation unit that calculates a reference point in the face frame indicated by the face frame information;
- a correction unit that corrects viewpoint position information in accordance with the movement amount of the reference point.
- the acquisition unit performs face detection based on the captured image, and acquires face detection information including face frame information and viewpoint position information based on the face detection result.
- a reference point calculation unit calculates a reference point in the face frame indicated by the face frame information, This is an information processing method in which a correction unit corrects viewpoint position information according to a movement amount of a reference point.
- the acquisition unit performs face detection based on the captured image, and acquires face detection information including face frame information and viewpoint position information based on the face detection result.
- a reference point calculation unit calculates a reference point in the face frame indicated by the face frame information,
- a program that causes a computer to execute an information processing method in which a correction unit corrects viewpoint position information according to a movement amount of a reference point.
- FIG. 1 is a diagram illustrating an example of an external appearance of an information processing apparatus according to an embodiment.
- FIG. 2 is a block diagram illustrating a system configuration example of the information processing apparatus according to the embodiment.
- FIG. 3 is a block diagram illustrating a configuration example of the viewpoint detection unit according to the first embodiment.
- 4A to 4C are diagrams referred to when describing an operation example of the face detection unit and the center-of-gravity calculation unit according to the first embodiment.
- FIGS. 5A and 5B are diagrams referred to when describing an outline of an operation example of the correction unit according to the first embodiment.
- FIG. 6 is a timing chart referred to when describing an operation example of the correction unit according to the first embodiment.
- FIG. 1 is a diagram illustrating an example of an external appearance of an information processing apparatus according to an embodiment.
- FIG. 2 is a block diagram illustrating a system configuration example of the information processing apparatus according to the embodiment.
- FIG. 3 is a block diagram illustrating a configuration example of
- FIG. 7 is a flowchart illustrating a flow of a process performed by the viewpoint detection unit according to the first embodiment.
- FIG. 8 is a diagram for describing an example of an effect obtained in the first embodiment.
- FIG. 9A and FIG. 9B are diagrams referred to for describing a modification of the first embodiment.
- FIG. 10 is a block diagram illustrating a configuration example of a viewpoint detection unit according to the second embodiment.
- FIG. 11 is a flowchart illustrating a flow of a process performed by the viewpoint detection unit according to the second embodiment.
- FIG. 12 is a block diagram illustrating a configuration example of a viewpoint detection unit according to the second embodiment.
- FIG. 13 is a flowchart illustrating a flow of a process performed by the distance measuring unit according to the third embodiment.
- FIG. 14 is a flowchart illustrating a flow of a process performed by the viewpoint detection unit according to the third embodiment.
- FIG. 15 is a diagram schematically showing the overall configuration of the operating room system.
- FIG. 16 is a diagram illustrating a display example of the operation screen on the centralized operation panel.
- FIG. 17 is a diagram illustrating an example of a state of an operation to which the operating room system is applied.
- FIG. 18 is a block diagram illustrating an example of a functional configuration of the camera head and the CCU illustrated in FIG.
- FIG. 1 is a diagram illustrating an example of an appearance of an information processing apparatus (information processing apparatus 1) according to an embodiment.
- the information processing apparatus 1 is, for example, about the same size as a notebook personal computer, but can be made smaller or larger.
- the information processing apparatus 1 has a base 2 and a display 3 standing upward from the base 2.
- the information processing apparatus 1 has a camera 4 above the display 3, and is configured so that the camera 4 can image a user located in front of the display 3.
- the information processing apparatus 1 is capable of displaying a lenticular stereoscopic image on the display 3, for example.
- the viewpoint position of a naked-eyed user who does not use glasses for stereoscopic display is detected using an image (captured image) captured by the camera 4.
- the right-eye and left-eye images are generated by the light beams condensed at the respective left and right viewpoint positions, and the generated images are displayed on the display 3 on which the lenticular lens is mounted. It is possible to view a stereoscopic image without using a HUD (Head Up Display) or the like.
- HUD Head Up Display
- FIG. 2 is a block diagram illustrating a system configuration example of the information processing apparatus 1 according to the first embodiment.
- the information processing device 1 generally has a viewpoint detection unit 10 and a parallax image processing unit 20.
- the viewpoint detection unit 10 outputs information indicating the viewpoint position of the user, for example, two-dimensional coordinates of the viewpoint position to the parallax image processing unit 20 at the subsequent stage.
- the configuration, operation example, and the like of the viewpoint detection unit 10 will be described later in detail.
- the parallax image processing unit 20 includes a spatial viewpoint coordinate acquisition unit 21, a parallax image acquisition unit 22, and a parallax image display unit 23.
- the space viewpoint coordinate acquisition unit 21 converts the two-dimensional coordinates indicating the viewpoint position output from the viewpoint detection unit 10 into the viewpoint coordinates at the space position by applying a known method, and generates space viewpoint coordinates.
- the parallax image acquisition unit 22 generates a stereoscopic image by generating light rays (images) corresponding to the viewpoint coordinates in space.
- a configuration including the spatial viewpoint coordinate acquisition unit 21 and the parallax image acquisition unit 22 corresponds to the stereoscopic image acquisition unit in the claims.
- the parallax image display unit 23 is a device that presents a stereoscopic image by continuously displaying the parallax images generated by the parallax image acquisition unit 22, and corresponds to the display 3 described above.
- FIG. 3 is a block diagram illustrating a configuration example of the viewpoint detection unit 10 according to the first embodiment.
- the viewpoint detection unit 10 includes, for example, an image sensor 11, a face detection unit 12, a center of gravity calculation unit 13, and a correction unit 14.
- the correction unit 14 has a movement amount calculation unit 15 and an addition unit 16.
- the image sensor 11 as an example of the imaging unit is, for example, a CMOS (Complementary Metal Oxide Semiconductor) sensor. As the image sensor 11, another sensor such as a CCD (Charge Coupled Device) may be applied.
- the image sensor 11 captures an image of a user located in front of the display 3, more specifically, a periphery of the user's face, and acquires a captured image.
- the captured image acquired by the image sensor 11 is output after being subjected to A / D (Analog to Digital) conversion.
- a / D converter or the like may be mounted on the image sensor 11, or may be provided between the image sensor 11 and the face detection unit 12.
- the image sensor 11 is configured to be capable of capturing an image at a high frame rate.
- the image sensor 11 is capable of capturing images at 1000 fps (frame per second) or more.
- the description will be made on the assumption that the image sensor 11 can capture an image at 1000 fps.
- a face detection unit 12 as an example of an acquisition unit performs face detection based on the captured image acquired by the image sensor 11, and based on the face detection result, face frame information and coordinates of a user's viewpoint position in the captured image. Is generated and obtained, including face position information indicating the position. Then, the face detection unit 12 outputs the face detection information to each of the center-of-gravity calculation unit 13 and the addition unit 16.
- the center-of-gravity calculating unit 13 which is an example of the reference point calculating unit calculates a center-of-gravity point (an example of a reference point) in the face frame indicated by the face frame information output from the face detecting unit 12.
- the image sensor 11 has the center-of-gravity calculator 13.
- the image sensor 11 and a chip that performs the function of the center-of-gravity calculator 13 are stacked. Although this can reduce the size of the apparatus, a configuration in which the center-of-gravity calculation unit 13 and the image sensor 11 are separate may be used.
- the correction unit 14 corrects the viewpoint position information according to the amount of movement of the center of gravity.
- the movement amount calculation unit 15 of the correction unit 14 calculates the movement amount of the center of gravity point calculated by the center of gravity calculation unit 13 between frames, in other words, the displacement of the coordinates of the center of gravity point.
- the adder 16 adds the amount of movement of the center of gravity to the viewpoint position information output from the face detector 12 to correct the viewpoint position information.
- FIG. 4A shows a captured image IM1 which is an example of an image captured by the image sensor 11.
- the captured image IM1 includes the user U.
- the face detection unit 12 detects the face of the user U using the captured image IM1. As a result of the face detection, the face frame 31 is set in the area including the face as shown in FIG. 4B, and the face frame information indicating the area of the face frame 31 is obtained. In addition, as a method of detecting a face, a known method such as a method using an image feature can be applied. The face detector 12 outputs the face frame information to the center-of-gravity calculator 13.
- the face detection unit 12 detects the right eye E1 and the left eye E2 of the user U using the captured image IM1.
- the face detection unit 12 detects the right eye E1 and the left eye E2 of the user U by applying a known method such as a method using template matching or a feature point.
- the face detection unit 12 generates viewpoint position information including position information 32A that is the coordinates of the right eye E1 in the screen and position information 32B that is the coordinates of the left eye E2 in the screen based on the detection result.
- the face detection unit 12 outputs viewpoint position information to the addition unit 16. As described above, by the processing performed by the face detection unit 12, face detection information including face frame information and viewpoint position information is obtained.
- the center-of-gravity calculating unit 13 calculates a center of gravity point in the face frame using a predetermined face frame (for example, the face frame 31) corresponding to the face frame information supplied from the face detecting unit 12 as an initial value.
- the calculation range of the center of gravity is set, for example, in the area of the skin color component in the face frame. Thereby, as shown schematically in FIG. 4C, the center of gravity 35 of the face of the user U is detected.
- the search frame for the center of gravity follows the distribution of the skin color area in the face frame. Therefore, when the face moves to the right, the search frame also moves to the right with the movement.
- the center-of-gravity calculating unit 13 only needs to calculate the center-of-gravity point for a predetermined color component (a skin color component in this example) in the preset search.
- the time required to perform the operation is shorter than the time required for the face detection unit 12 to acquire the face detection information.
- the process of calculating the center of gravity performed by the center of gravity calculation unit 13 can be executed with almost no delay for an input because the processing load is light.
- FIG. 5A For example, consider a case where a captured image of the user U at an x1 point on the X axis is supplied to the face detection unit 12.
- the face detection unit 12 detects the face frame and the viewpoint position of the user U located at the point x1, and generates and acquires face detection information based on the detection result.
- the time (detection time) required until the face detection unit 12 acquires the face detection information is defined as t. After the detection time t has elapsed, the face detection unit 12 outputs the acquired face detection information.
- the user U may move during the detection time t, and a difference may occur between the viewpoint position indicated by the viewpoint position information included in the output face detection information and the current viewpoint position.
- the viewpoint positions of the both eyes detected by the face detection unit 12 are t hours ago. It becomes a past viewpoint position and deviates from the actual viewpoint position (the viewpoint position of the user U at the point x2).
- the viewpoint position information output by the face detection unit 12 includes a delay.
- the subsequent parallax image processing unit 20 generates a parallax image based only on the viewpoint position of the viewpoint position information output by the face detection unit 12, a parallax image corresponding to a past viewpoint position is generated.
- the stereoscopic image presented to the user U becomes unnatural.
- the process of calculating the center of gravity can be performed in real time at a speed corresponding to a high frame rate (1000 fps in this example). Therefore, as shown in FIG. 5B, for example, the movement amount ⁇ A of the center of gravity when the user U moves from the point x1 to the point x2 is calculated. By adding ⁇ A to the viewpoint position information at the point x1, the viewpoint position information at the point x2 can be acquired in real time.
- the center of gravity is schematically indicated by an asterisk.
- the image sensor 11 acquires a captured image at 1000 fps.
- the time required for the face detection unit 12 to detect the face detection information is, for example, 16 ms (millisecond). Sixteen frames are input within a period required to detect face detection information. It is assumed that the center-of-gravity calculating unit 13 can calculate the center of gravity every 1 ms.
- imaging is started at a predetermined timing TA, and a captured image including the face of the user U is input to the face detection unit 12.
- the face detection information is detected by the processing of the face detection unit 12, and the viewpoint position of the user at the timing TA at which the face frame is detected is detected.
- the face frame information detected by the face detection unit 12 is supplied to the center-of-gravity calculation unit 13.
- the center-of-gravity calculator 13 calculates the center of gravity in the face frame detected at the timing TB in real time until the next face detection information is detected by the face detector 12. Then, the center-of-gravity calculator 13 supplies the coordinates of the center of gravity calculated in real time to the movement amount calculator 15.
- the movement amount calculation unit 15 calculates and accumulates a center-of-gravity difference, which is the movement amount of the center of gravity, every 1 ms.
- the movement amount calculation unit 15 calculates, for example, the displacement of the center of gravity in the X-axis direction and the displacement in the Y-axis direction. Also, for example, when the distance from the coordinates of the center of gravity at the timing TB is farther, the movement amount is added, and when the distance is closer to the coordinates of the center of gravity at the timing TB, the movement amount is subtracted.
- the center-of-gravity difference is shown as increasing linearly. However, if there is no movement of the user U within 16 ms, the center-of-gravity difference becomes zero.
- the movement amount calculation unit 15 calculates the center-of-gravity difference d0 between frames (between frames 16 and 17). In addition, the movement amount calculation unit 15 calculates a center-of-gravity difference d1 between frames (between frames 17 and 18). Similarly, the movement amount calculator 15 calculates d2, d3... D9, da, db. The movement amount calculation unit 15 supplies the final center-of-gravity difference df to the addition unit 16.
- the face detection information is detected by the face detection unit 12 and the viewpoint position information p0 corresponding to the binocular coordinates is detected.
- This viewpoint position information p0 is the viewpoint position of the user U at the timing TB 16 frames before. That is, it is viewpoint position information including a delay. Therefore, the adding unit 16 corrects the viewpoint position information p0 by adding the center-of-gravity difference df to the viewpoint position information p0, and acquires viewpoint position information corresponding to the current viewpoint position.
- the corrected viewpoint position information is supplied from the adding unit 16 to the parallax image processing unit 20.
- the parallax image processing unit 20 uses the supplied viewpoint position information as tracking data, generates and displays a stereoscopic image corresponding to the viewpoint position indicated by the viewpoint position information.
- the following processing is performed continuously. For example, from the timing TC to a timing TD at which the next face detection information is detected (timing at which the frame 48 is input), the barycentric coordinates of each frame are calculated, and the barycentric difference between the frames is accumulated.
- the viewpoint position information p1 detected at the timing TD is information indicating the viewpoint position at the timing TC. Therefore, the correction unit 14 obtains viewpoint position information corresponding to the current viewpoint position in which the delay has been eliminated by adding the centroid differences df and ef to the viewpoint position information p0 at the timing TC.
- a reset flag (for example, a logical value “1”) is set at each timing when the face detection information is detected, and the accumulated center-of-gravity difference is reset. Then, the viewpoint position information at the timing when the reset flag is set is used as viewpoint position information to be corrected.
- a captured image is obtained via the image sensor 11, and the obtained captured image is supplied to the face detection unit 12 (step ST11).
- the face detection unit 12 generates face detection information including face frame information and viewpoint position information based on the captured image.
- the face frame information is supplied to the center-of-gravity calculator 13.
- the center-of-gravity calculator 13 calculates the center of gravity of the skin color component in the face frame corresponding to the face frame information (step ST12).
- the movement amount calculation unit 15 calculates a centroid difference which is a difference value between the centroid point calculated by the centroid calculation unit 13 and the centroid point calculated by the centroid calculation unit 13 in the previous frame. (Step ST13). As a result, the movement amount of the center of gravity is accumulated.
- step ST14 It is determined whether or not the reset flag is 1 (step ST14).
- the reset flag is not 1 but the reset flag is 0, the final value of the center-of-gravity difference is transferred to the adder 16 (step ST16).
- a reset flag 1 is set (step ST19). Then, the face frame information and the viewpoint position information included in the face detection information are updated so that the new detected face detection information is used in the subsequent processing (step ST20). Then, the updated viewpoint position information is transferred to the adding unit 16 (step ST21).
- the addition unit 16 corrects the viewpoint position information by adding the final value of the center-of-gravity difference to the viewpoint position information.
- the corrected viewpoint position information is output (step ST22).
- the subsequent parallax image processing unit 20 generates a stereoscopic image corresponding to the viewpoint position indicated by the corrected viewpoint position information.
- FIG. 8 is a diagram for explaining an example of the effect of the first embodiment.
- the horizontal axis in the graph of FIG. 8 indicates the number of frames, and the vertical axis indicates coordinates (for example, X coordinates).
- a dotted line L1 in the graph of FIG. 8 indicates viewpoint coordinates indicated by viewpoint position information of the face detection information.
- the dashed-dotted line L2 indicates the viewpoint coordinates obtained by adding the movement amount of the center of gravity, that is, the corrected viewpoint position information.
- the solid line L3 indicates the barycentric coordinates in the face frame.
- the distance moved by the barycenter coordinates is added to the face detection viewpoint coordinates.
- the current viewpoint coordinates indicating a smooth change similarly to the change in the barycenter coordinates.
- the center of gravity point calculated by the center of gravity calculation unit 13 needs to coincide with the center point of the face.
- the skin color area in the face frame may be separated from the face frame of the input image. Therefore, when the difference between the center point and the center of gravity of the face frame becomes equal to or more than a certain value, the face frame may be reset. Further, the face frame may be updated periodically.
- the coordinates of the face center 42 in the face frame 41 are set to ⁇ (x 1 , y 1 ).
- the coordinates ⁇ are calculated by the face detection unit 12, for example.
- the coordinates of the center of gravity 43 calculated by the center of gravity calculation unit 13 are set to ⁇ (x 2 , y 2 ).
- the Euclidean distance d between the two points is obtained by the following equation (1).
- the face frame is re- The setting may be made. By resetting the search frame, the center of gravity can be calculated in conjunction with the face detection.
- FIG. 10 is a block diagram illustrating a configuration example of a viewpoint detection unit (viewpoint detection unit 10A) according to the second embodiment.
- the viewpoint detection unit 10A includes, for example, an image sensor 11, a face detection unit 12, a center of gravity calculation unit 13, an acceleration detection unit 51, and a coordinate ratio determination unit 52. Since the image sensor 11, the face detection unit 12, and the center-of-gravity calculation unit 13 have been described in the first embodiment, duplicate description will be appropriately omitted.
- the image sensor 11 and the center-of-gravity calculating unit 13 are different from each other. However, similarly to the first embodiment, the image sensor 11 has the center-of-gravity calculating unit 13. There may be.
- the face detection unit 12 generates face detection information based on the captured image, and outputs the face frame information to the center of gravity calculation unit 13 and the viewpoint position information to the coordinate ratio determination unit 52.
- the center-of-gravity calculating unit 13 calculates the center-of-gravity point in the face frame, and outputs the coordinates of the calculated center-of-gravity point to the acceleration detecting unit 51 and the coordinate ratio determining unit 52.
- the acceleration detector 51 holds, for example, the coordinates of the center of gravity of the previous image, and calculates the difference from the coordinates of the center of gravity of the input current image. This difference corresponds to the acceleration.
- the difference value obtained as a result of the calculation is output to the coordinate ratio determining unit 52.
- the coordinate ratio determining unit 52 calculates a ratio for weight-adding the coordinates of the viewpoint position indicated by the viewpoint position information and the coordinates of the center of gravity in accordance with the difference value supplied from the acceleration detection unit 51 (for each coordinate, Weights set for the two).
- the coordinate ratio determination unit 52 generates viewpoint position information output to the parallax image processing unit 20 by performing weighted addition using the determined ratio.
- the coordinate ratio determination unit 52 sets the ratio so as to increase the ratio of the barycentric coordinates with excellent responsiveness.
- the difference value is small, it can be determined that the movement is small, so that the ratio of the viewpoint position information included in the highly stable face detection information is increased.
- the stability is high means that the viewpoint position information included in the face detection information is the viewpoint position itself, and is higher in accuracy than the viewpoint position information when the amount of movement of the center of gravity is added as the predicted value. Meaning.
- a captured image obtained via the image sensor 11 is input to the face detection unit 12 (step ST31). Then, the face detection unit 12 acquires face detection information based on the captured image, and outputs the acquired face detection information (step ST32).
- the captured image obtained via the image sensor 11 is input to the center-of-gravity calculator 13 (step ST33). Then, the center-of-gravity calculating unit 13 determines whether or not the face frame information is updated (step ST34). The center-of-gravity calculation unit 13 determines whether or not there is an update of the face frame information based on, for example, whether new face frame information is input from the face detection unit 12.
- the center-of-gravity calculation unit 13 sets the coordinates indicated by the updated face frame information as a search frame for the center-of-gravity point (step ST35). Then, the center-of-gravity calculator 13 calculates the center of gravity in the set face frame. If there is no update of the face frame information, the center-of-gravity calculating unit 13 calculates the center of gravity using the face frame information up to that time as a search frame for the center of gravity (step ST36). The center-of-gravity calculation unit 13 outputs the calculated coordinates of the center-of-gravity point to each of the acceleration detection unit 51 and the coordinate ratio determination unit 52.
- the acceleration detection unit 51 calculates, for example, a difference value between the coordinates of the center of gravity of the previous frame and the coordinates of the center of gravity of the current frame. Then, the acceleration detection unit 51 outputs the calculated difference value to the coordinate ratio determination unit 52 (Step ST37).
- the coordinate ratio determination unit 52 determines a weighting ratio according to the difference value supplied from the acceleration detection unit 51 (step ST38). Then, the coordinate ratio determination unit 52 performs weighted addition on the viewpoint coordinates and the coordinates of the center of gravity point indicated by the viewpoint position information using the weighting ratio, and generates viewpoint position information of the output target (step ST39). Although not shown, the parallax image processing unit 20 at the subsequent stage generates a stereoscopic image corresponding to the viewpoint position indicated by the viewpoint position information output from the coordinate ratio determination unit 52.
- the following effects can be obtained.
- the motion with respect to the current frame can be captured instead of the prediction, so that a system with a small response error can be constructed. Further, it is possible to obtain a highly accurate current viewpoint position.
- FIG. 12 is a block diagram illustrating a configuration example of a viewpoint detection unit (viewpoint detection unit 10B) according to the third embodiment.
- the viewpoint detection unit 10B includes, for example, an image sensor 11, a face detection unit 12, a center of gravity calculation unit 13, a correction unit 14, a distance measurement unit 61, and a switching unit 62.
- the correction unit 14 has a movement amount calculation unit 15 and an addition unit 16.
- the image sensor 11 and the center-of-gravity calculator 13 are different from each other.
- the image sensor 11 has the center-of-gravity calculator 13. May be.
- the viewpoint detection unit 10B uses face detection information generated by the face detection unit 12 according to the distance measurement result of the distance measurement unit 61 that measures the distance to the user whose face is to be detected. , And one of the viewpoint position information corrected by the correction unit 14 is selectively output from the switching unit 62. More specifically, when the distance measurement result by the distance measurement unit 61 is smaller than the threshold, the viewpoint position information corrected by the correction unit 14 is output from the switching unit 62, and when the distance measurement result is larger than the threshold, Is configured to output viewpoint position information generated by the face detection unit 12.
- the face detection unit 12 outputs face detection information including viewpoint position information.
- the face detection information (at least viewpoint position information) output from the face detection unit 12 is supplied to each of the distance measurement unit 61 and the switching unit 62.
- the corrected viewpoint position information output from the adding unit 16 is supplied to the switching unit 62.
- the distance measurement unit 61 measures the distance to the user U using, for example, viewpoint position information supplied from the face detection unit 12. For example, the distance measurement unit 61 derives an estimated distance when the interocular distance between the right eye and the left eye is 6.5 cm using the viewpoint position information, and outputs distance measurement data indicating the estimated distance to the switching unit 62.
- the distance measuring unit 61 may measure the distance using another method. Further, the distance measuring unit 61 may be a sensor such as ToF (Time of Flight) or Lidar (Light of Detection and Range).
- the switching unit 62 selects and outputs the viewpoint position information corrected by the correction unit 14.
- the switching unit 62 selects the viewpoint position information generated by the face detection unit 12 and Output.
- the distance measuring unit 61 generates distance measuring data based on the face detection information supplied from the face detecting unit 12. Then, the generated distance measurement data is output to the switching unit 62 (step ST41). Switching section 62 reads the distance measurement data supplied from distance measurement section 61 (step ST42). These processes are performed each time face detection information is supplied from the face detection unit 12 to the distance measurement unit 61.
- a captured image obtained via the image sensor 11 is input to the face detection unit 12 (step ST51). Then, the face detection unit 12 acquires face detection information based on the captured image, and outputs the acquired face detection information (step ST52).
- the face detection information generated by the face detection unit 12 is supplied to the distance measurement unit 61.
- the distance measuring section 61 performs the above-described distance measuring process (step ST53).
- the distance measurement data obtained by the distance measurement processing is supplied to the switching unit 62, and is read by the switching unit 62 (step ST54).
- the captured image obtained via the image sensor 11 is input to the center-of-gravity calculator 13 (step ST55). Then, the center-of-gravity calculation unit 13 determines whether or not the face frame information is updated (step ST56). The center-of-gravity calculation unit 13 determines whether or not there is an update of the face frame information based on, for example, whether new face frame information is input from the face detection unit 12.
- the center-of-gravity calculation unit 13 sets the coordinates indicated by the updated face frame information as a search frame for the center-of-gravity point (step ST57). Then, the center-of-gravity calculator 13 calculates the center of gravity in the set face frame. If there is no update of the face frame information, the center-of-gravity calculation unit 13 calculates the center-of-gravity point using the face frame information up to that time as a search frame for the center-of-gravity point (step ST58).
- the movement amount calculation unit 15 calculates and accumulates a centroid difference that is a difference between centroid points (step ST59). Then, the adding unit 16 adds the final difference in the center of gravity to the viewpoint position information supplied from the face detecting unit 12 (step ST60). Note that the processing of steps ST55 to ST60 described above is the same as the processing described in the first embodiment.
- the switching unit 62 determines whether the read distance measurement data is larger than a set value (for example, equal to or larger than the set value) (step ST61). If the distance measurement data is equal to or larger than the set value, the switching unit 62 outputs uncorrected viewpoint position information, that is, viewpoint position information supplied from the face detection unit 12 (step ST62). On the other hand, if the distance measurement data is smaller than the set value, the switching unit 62 outputs the corrected viewpoint position information, that is, the viewpoint position information supplied from the movement amount calculation unit 15 (step ST63).
- a set value for example, equal to or larger than the set value
- the subsequent parallax image processing unit 20 generates a stereoscopic image corresponding to the viewpoint position indicated by the viewpoint position information output from the switching unit 62.
- the viewpoint position information excellent in responsiveness output from the adding unit can be selected and output.
- the viewpoint position information having a sense of stability which is output from the face detection unit 12 can be selected and output. The farther the user is from the information processing apparatus, the smaller the change in the viewpoint position on the screen becomes, and the less the user can feel the effect on the stereoscopic image due to the latency until the face detection information is detected.
- chattering may occur as the number of input images increases, that is, as the frame rate increases, and noise or the like may occur.
- the third embodiment when the user is at a position close to the information processing device, it is possible to output tracking data with excellent transient response, , It is possible to output tracking data in which fine movement due to noise is suppressed. This enables quick and stable tracking of the viewpoint position.
- centroid point has been described as an example of the reference point.
- present invention is not limited to this, and an appropriate portion other than the centroid point may be set as the reference point.
- the movement amount of the center of gravity between adjacent frames is calculated.
- the present invention is not limited to this.
- the movement amount of the center of gravity between a predetermined number of frames and distant frames may be calculated. This makes it possible to reduce the processing load when an image is input at a high frame rate.
- the information processing apparatus includes the viewpoint detection unit and the parallax image processing unit.
- the information processing apparatus may include another apparatus including the parallax image processing unit.
- the configuration described in the above-described embodiment is merely an example, and the present invention is not limited to this. It goes without saying that additions and deletions of the configuration may be made without departing from the spirit of the present disclosure.
- the contents described in each of the embodiments and the modified examples can be appropriately combined.
- the present disclosure can be realized in any form such as an apparatus, a method, a program, and a system.
- the program can be stored and executed in, for example, a memory included in the viewpoint detection unit or an appropriate recording medium.
- the present disclosure may have the following configurations.
- An acquisition unit that performs face detection based on the captured image, and acquires face detection information including face frame information and viewpoint position information based on the face detection result;
- a reference point calculation unit that calculates a reference point in the face frame indicated by the face frame information,
- a correction unit configured to correct the viewpoint position information according to a movement amount of the reference point.
- the correction unit accumulates the movement amount of the reference point during a period required until the face detection information is acquired, and corrects the viewpoint position information according to the accumulated movement amount of the reference point.
- the correction unit may be configured to obtain the first face detection information and obtain the second face detection information, which is the next face detection information subsequent to the first face detection information, for a period required for obtaining the second face detection information.
- the reference point calculation unit calculates, as the reference point, a center of gravity existing in a region of a predetermined color component in the face frame.
- the information processing device according to (5), wherein the predetermined color component is a skin color component.
- the correction unit sets weighting according to the movement amount of the reference point, and weights the viewpoint position information and the reference point position information included in the face detection information using the set weighting.
- the information processing apparatus according to (1).
- It has a distance measurement unit that measures the distance to the user who is the target of face detection, In accordance with the distance measurement result of the distance measurement unit, one of the viewpoint position information generated by the acquisition unit and the viewpoint position information corrected by the correction unit is selectively output.
- the information processing apparatus according to any one of (1) to (6).
- viewpoint position information corrected by the correction unit is output, The information processing apparatus according to (8), wherein the viewpoint position information generated by the acquisition unit is output when the distance measurement result is larger than the threshold.
- the information processing device further including a display on which the stereoscopic image is displayed.
- the acquisition unit performs face detection based on the captured image, and acquires face detection information including face frame information and viewpoint position information based on the face detection result.
- a reference point calculation unit calculates a reference point in the face frame indicated by the face frame information, An information processing method, wherein a correction unit corrects the viewpoint position information according to a movement amount of the reference point.
- the acquisition unit performs face detection based on the captured image, and acquires face detection information including face frame information and viewpoint position information based on the face detection result.
- a reference point calculation unit calculates a reference point in the face frame indicated by the face frame information,
- the technology according to the present disclosure can be applied to various products.
- the technology according to the present disclosure may be applied to an operating room system.
- FIG. 15 is a diagram schematically showing an overall configuration of an operating room system 5100 to which the technology according to the present disclosure can be applied.
- an operating room system 5100 is configured such that a group of devices installed in an operating room are connected to each other via an audiovisual controller (AV controller) 5107 and an operating room control device 5109 so as to be able to cooperate with each other.
- AV controller audiovisual controller
- FIG. 15 a group of various devices 5101 for an operation under an endoscope, a ceiling camera 5187 provided on the ceiling of an operating room to capture an image of an operator, and an operating room provided on the ceiling of the operating room
- An operation site camera 5189 for capturing an image of the entire situation a plurality of display devices 5103A to 5103D, a recorder 5105, a patient bed 5183, and a light 5191 are illustrated.
- the device group 5101 belongs to an endoscope operation system 5113 described below, and includes an endoscope, a display device that displays an image captured by the endoscope, and the like.
- Each device belonging to the endoscopic surgery system 5113 is also called a medical device.
- the display devices 5103A to 5103D, the recorder 5105, the patient bed 5183, and the lighting 5191 are devices provided separately from the endoscopic surgery system 5113, for example, in an operating room.
- Each device that does not belong to the endoscopic surgery system 5113 is also called a non-medical device.
- the audiovisual controller 5107 and / or the operating room control device 5109 control the operation of these medical devices and non-medical devices in cooperation with each other.
- the audiovisual controller 5107 controls processing related to image display in the medical device and the non-medical device as a whole.
- the device group 5101, the ceiling camera 5187, and the operation site camera 5189 have a function of transmitting information to be displayed during the operation (hereinafter, also referred to as display information).
- It may be a device (hereinafter, also referred to as a source device).
- the display devices 5103A to 5103D may be devices to which display information is output (hereinafter, also referred to as output destination devices).
- the recorder 5105 may be a device corresponding to both the source device and the output destination device.
- the audiovisual controller 5107 has a function of controlling the operation of the transmission source device and the output destination device, acquiring display information from the transmission source device, transmitting the display information to the output destination device, and displaying or recording the display information.
- the display information includes various images captured during the operation, various information related to the operation (for example, patient's physical information, past test results, information on a surgical procedure, and the like).
- information about an image of an operation part in a patient's body cavity captured by an endoscope can be transmitted from the device group 5101 as display information.
- information about an image at hand of the operator captured by the ceiling camera 5187 may be transmitted as display information from the ceiling camera 5187.
- information on an image indicating a state of the entire operation room captured by the operation site camera 5189 can be transmitted as display information. Note that in the case where another device having an imaging function is present in the operating room system 5100, the audiovisual controller 5107 acquires information about an image captured by the other device from the other device as display information. May be.
- the recorder 5105 information about these images captured in the past is recorded by the audiovisual controller 5107.
- the audiovisual controller 5107 can acquire information on the previously captured image from the recorder 5105 as display information. It should be noted that the recorder 5105 may also record in advance various information related to the operation.
- the audiovisual controller 5107 causes at least one of the display devices 5103A to 5103D, which is an output destination device, to display the acquired display information (that is, images captured during the operation and various information related to the operation).
- the display device 5103A is a display device suspended from the ceiling of the operating room
- the display device 5103B is a display device installed on the wall of the operating room
- the display device 5103C is a display device in the operating room.
- the display device is a display device installed on a desk
- the display device 5103D is a mobile device having a display function (for example, a tablet PC (Personal Computer)).
- the operating room system 5100 may include a device outside the operating room.
- the device outside the operating room may be, for example, a server connected to a network established inside or outside the hospital, a PC used by medical staff, a projector installed in a conference room of the hospital, and the like.
- the audiovisual controller 5107 can display the display information on a display device of another hospital via a video conference system or the like for remote medical care.
- the operating room control device 5109 controls the processes other than the process related to the image display in the non-medical device in an integrated manner.
- the operating room control device 5109 controls driving of the patient bed 5183, the ceiling camera 5187, the operation site camera 5189, and the lighting 5191.
- the operating room system 5100 is provided with a centralized operation panel 5111, and the user gives an instruction about image display to the audiovisual controller 5107 via the centralized operation panel 5111, and the operating room control device 5109. Instructions on the operation of the non-medical device can be given to the user.
- the centralized operation panel 5111 includes a touch panel provided on a display surface of a display device.
- FIG. 16 is a diagram showing a display example of an operation screen on the centralized operation panel 5111.
- FIG. 16 illustrates, as an example, an operation screen corresponding to a case where two display devices are provided as output destination devices in the operating room system 5100.
- operation screen 5193 is provided with a source selection area 5195, a preview area 5197, and a control area 5201.
- the transmission source selection area 5195 displays a transmission source device provided in the operating room system 5100 and a thumbnail screen representing display information of the transmission source device in association with each other. The user can select display information to be displayed on the display device from any of the transmission source devices displayed in the transmission source selection area 5195.
- the preview area 5197 displays a preview of a screen displayed on two display devices (Monitor 1 and Monitor 2) which are output destination devices.
- four images are displayed on one display device as PinP.
- the four images correspond to display information transmitted from the transmission source device selected in the transmission source selection area 5195. Of the four images, one is displayed relatively large as a main image, and the remaining three are displayed relatively small as sub-images. The user can switch the main image and the sub image by appropriately selecting the area where the four images are displayed.
- a status display area 5199 is provided below the area where the four images are displayed, and the status related to the operation (for example, the elapsed time of the operation, the patient's physical information, etc.) is appropriately displayed in the area. obtain.
- the control area 5201 includes a source operation area 5203 in which a GUI (Graphical User Interface) part for operating the source apparatus is displayed, and a GUI part for operating the output destination apparatus. And an output destination operation area 5205 in which is displayed.
- the source operation area 5203 is provided with a GUI component for performing various operations (pan, tilt, and zoom) on the camera of the source apparatus having an imaging function. The user can operate the operation of the camera in the transmission source device by appropriately selecting these GUI components.
- the transmission source device selected in the transmission source selection area 5195 is a recorder (ie, in the preview area 5197, an image previously recorded on the recorder is displayed).
- the source operation area 5203 may be provided with a GUI component for performing operations such as reproduction, reproduction stop, rewind, and fast forward of the image.
- a GUI component for performing various operations (swap, flip, color adjustment, contrast adjustment, switching between 2D display and 3D display) on display on the display device that is the output destination device is provided. Is provided. The user can operate the display on the display device by appropriately selecting these GUI parts.
- the operation screen displayed on the centralized operation panel 5111 is not limited to the illustrated example, and the user can use the audiovisual controller 5107 and the operating room control device 5109 provided in the operating room system 5100 via the centralized operation panel 5111. Operation input to each device that can be controlled may be possible.
- FIG. 17 is a diagram showing an example of a state of an operation to which the operating room system described above is applied.
- the ceiling camera 5187 and the operation site camera 5189 are provided on the ceiling of the operation room, and can photograph an operator (doctor) 5181 who performs a treatment on an affected part of the patient 5185 on the patient bed 5183 and an image of the entire operation room. It is.
- the ceiling camera 5187 and the operation site camera 5189 may be provided with a magnification adjustment function, a focal length adjustment function, an imaging direction adjustment function, and the like.
- the lighting 5191 is provided on the ceiling of the operating room and irradiates at least the operator 5181 at hand.
- the illumination 5191 may be capable of appropriately adjusting the irradiation light amount, the wavelength (color) of the irradiation light, the irradiation direction of the light, and the like.
- the endoscopic surgery system 5113, the patient bed 5183, the ceiling camera 5187, the operation site camera 5189, and the lighting 5191 are provided via an audiovisual controller 5107 and an operating room control device 5109 (not shown in FIG. 17). Are connected so that they can cooperate with each other.
- a centralized operation panel 5111 is provided in the operating room. As described above, the user can appropriately operate these devices existing in the operating room via the centralized operation panel 5111.
- the endoscope operation system 5113 includes an endoscope 5115, other surgical tools 5131, a support arm device 5141 supporting the endoscope 5115, and various devices for endoscopic surgery. And a cart 5151 on which is mounted.
- trocars 5139a to 5139d are punctured into the abdominal wall instead of cutting the abdominal wall and opening the abdomen. Then, the lens barrel 5117 of the endoscope 5115 and other surgical tools 5131 are inserted into the body cavity of the patient 5185 from the trocars 5139a to 5139d.
- an insufflation tube 5133, an energy treatment tool 5135, and forceps 5137 are inserted into the body cavity of the patient 5185 as other surgical tools 5131.
- the energy treatment device 5135 is a treatment device that performs incision and exfoliation of tissue, sealing of blood vessels, and the like by high-frequency current and ultrasonic vibration.
- the illustrated surgical tool 5131 is merely an example, and various surgical tools generally used in endoscopic surgery, such as, for example, a retractor and a retractor, may be used.
- the image of the operative site in the body cavity of the patient 5185 taken by the endoscope 5115 is displayed on the display device 5155.
- the operator 5181 performs a treatment such as excision of the affected part using the energy treatment tool 5135 and the forceps 5137 while viewing the image of the operation part displayed on the display device 5155 in real time.
- the insufflation tube 5133, the energy treatment tool 5135, and the forceps 5137 are supported by an operator 5181 or an assistant during the operation.
- the support arm device 5141 includes an arm portion 5145 extending from the base portion 5143.
- the arm portion 5145 includes joint portions 5147a, 5147b, 5147c, and links 5149a, 5149b, and is driven by the control of the arm control device 5159.
- the endoscope 5115 is supported by the arm portion 5145, and its position and posture are controlled. Thereby, stable fixing of the position of the endoscope 5115 can be realized.
- the endoscope 5115 includes a lens barrel 5117 having a region of a predetermined length from the distal end inserted into the body cavity of the patient 5185, and a camera head 5119 connected to the proximal end of the lens barrel 5117.
- the endoscope 5115 configured as a so-called rigid endoscope having a hard lens barrel 5117 is illustrated.
- the endoscope 5115 is configured as a so-called flexible endoscope having a soft lens barrel 5117. Is also good.
- An opening in which the objective lens is fitted is provided at the tip of the lens barrel 5117.
- a light source device 5157 is connected to the endoscope 5115, and the light generated by the light source device 5157 is guided to the tip of the lens barrel by a light guide extending inside the lens barrel 5117, and the objective The light is radiated toward the observation target in the body cavity of the patient 5185 via the lens.
- the endoscope 5115 may be a direct view, a perspective view, or a side view.
- An optical system and an image sensor are provided inside the camera head 5119, and the reflected light (observation light) from the observation target is focused on the image sensor by the optical system.
- the observation light is photoelectrically converted by the imaging element, and an electric signal corresponding to the observation light, that is, an image signal corresponding to the observation image is generated.
- the image signal is transmitted to a camera control unit (CCU: Camera Control Unit) 5153 as RAW data.
- the camera head 5119 has a function of adjusting the magnification and the focal length by appropriately driving the optical system.
- a plurality of image pickup devices may be provided in the camera head 5119 in order to support, for example, stereoscopic viewing (3D display).
- a plurality of relay optical systems are provided inside the lens barrel 5117 to guide observation light to each of the plurality of imaging elements.
- the CCU 5153 includes a CPU (Central Processing Unit), a GPU (Graphics Processing Unit), and the like, and comprehensively controls operations of the endoscope 5115 and the display device 5155. Specifically, the CCU 5153 performs various image processing for displaying an image based on the image signal, such as a developing process (demosaicing process), for example, on the image signal received from the camera head 5119. The CCU 5153 provides the image signal subjected to the image processing to the display device 5155.
- the audiovisual controller 5107 shown in FIG. 15 is connected to the CCU 5153. The CCU 5153 also provides the image signal subjected to the image processing to the audiovisual controller 5107.
- the CCU 5153 sends a control signal to the camera head 5119 and controls its driving.
- the control signal may include information on imaging conditions such as a magnification and a focal length.
- the information on the imaging condition may be input via the input device 5161 or may be input via the above-described centralized operation panel 5111.
- the display device 5155 displays an image based on the image signal processed by the CCU 5153 under the control of the CCU 5153.
- the endoscope 5115 is compatible with high-resolution shooting such as 4K (3840 horizontal pixels ⁇ 2160 vertical pixels) or 8K (7680 horizontal pixels ⁇ 4320 vertical pixels), and / or 3D display
- a display device that can display a high-resolution image and / or a device that can display a 3D image may be used as the display device 5155.
- a display device 5155 having a size of 55 inches or more a more immersive feeling can be obtained.
- a plurality of display devices 5155 having different resolutions and sizes may be provided according to applications.
- the light source device 5157 includes a light source such as an LED (light emitting diode), for example, and supplies the endoscope 5115 with irradiation light at the time of imaging the operation site.
- a light source such as an LED (light emitting diode), for example, and supplies the endoscope 5115 with irradiation light at the time of imaging the operation site.
- the arm control device 5159 is configured by a processor such as a CPU, for example, and operates according to a predetermined program to control the driving of the arm portion 5145 of the support arm device 5141 according to a predetermined control method.
- the input device 5161 is an input interface to the endoscopic surgery system 5113.
- the user can input various kinds of information and input instructions to the endoscopic surgery system 5113 via the input device 5161.
- the user inputs, via the input device 5161, various types of information related to surgery, such as physical information of a patient and information about a surgical technique.
- the user issues an instruction to drive the arm unit 5145 via the input device 5161 or an instruction to change imaging conditions (the type of irradiation light, magnification, focal length, and the like) by the endoscope 5115.
- an instruction to drive the energy treatment tool 5135 is input.
- the type of the input device 5161 is not limited, and the input device 5161 may be various known input devices.
- the input device 5161 for example, a mouse, a keyboard, a touch panel, a switch, a foot switch 5171, and / or a lever can be applied.
- the touch panel may be provided on a display surface of the display device 5155.
- the input device 5161 is a device worn by a user such as a glasses-type wearable device or an HMD (Head Mounted Display), and various inputs are performed according to a user's gesture or line of sight detected by these devices. Is performed. Further, the input device 5161 includes a camera capable of detecting the movement of the user, and various inputs are performed according to the user's gesture and the line of sight detected from the video imaged by the camera. Further, the input device 5161 includes a microphone capable of collecting a user's voice, and various inputs are performed by voice via the microphone.
- a user's gesture or line of sight detected by these devices Is performed.
- the input device 5161 includes a camera capable of detecting the movement of the user, and various inputs are performed according to the user's gesture and the line of sight detected from the video imaged by the camera.
- the input device 5161 includes a microphone capable of collecting a user's voice, and various inputs are performed by voice via the microphone.
- the input device 5161 is configured to be capable of inputting various kinds of information in a non-contact manner, a user (eg, an operator 5181) belonging to a clean area can operate a device belonging to a dirty area in a non-contact manner. Becomes possible. In addition, since the user can operate the device without releasing his / her hand from the surgical tool, the convenience for the user is improved.
- the treatment instrument control device 5163 controls the driving of the energy treatment instrument 5135 for cauterizing, incising a tissue, sealing a blood vessel, and the like.
- the insufflation device 5165 is provided with an insufflation tube 5133 to inflate the body cavity of the patient 5185 for the purpose of securing the visual field by the endoscope 5115 and securing the working space of the operator.
- the recorder 5167 is a device that can record various types of information related to surgery.
- the printer 5169 is a device capable of printing various types of information on surgery in various formats such as text, images, and graphs.
- the support arm device 5141 includes a base portion 5143 that is a base, and an arm portion 5145 extending from the base portion 5143.
- the arm portion 5145 includes a plurality of joint portions 5147a, 5147b, 5147c, and a plurality of links 5149a, 5149b connected by the joint portions 5147b.
- FIG. The configuration of the arm portion 5145 is simplified. Actually, the shape, number and arrangement of the joints 5147a to 5147c and the links 5149a and 5149b, the direction of the rotation axis of the joints 5147a to 5147c, and the like are appropriately set so that the arm 5145 has a desired degree of freedom. obtain.
- the arm portion 5145 can be preferably configured to have six or more degrees of freedom.
- the lens barrel 5117 of the endoscope 5115 can be inserted into the body cavity of the patient 5185 from a desired direction. Will be possible.
- the joints 5147a to 5147c are provided with actuators, and the joints 5147a to 5147c are configured to be rotatable around a predetermined rotation axis by driving the actuators.
- the drive of the actuator is controlled by the arm control device 5159
- the rotation angles of the joints 5147a to 5147c are controlled, and the drive of the arm 5145 is controlled.
- the arm control device 5159 can control the driving of the arm portion 5145 by various known control methods such as force control or position control.
- the drive of the arm unit 5145 is appropriately controlled by the arm control device 5159 in accordance with the operation input.
- the position and orientation of the endoscope 5115 may be controlled.
- the endoscope 5115 at the distal end of the arm 5145 can be moved from an arbitrary position to an arbitrary position, and can be fixedly supported at the position after the movement.
- the arm 5145 may be operated by a so-called master slave method.
- the arm unit 5145 can be remotely controlled by the user via the input device 5161 installed at a location away from the operating room.
- the arm control device 5159 When force control is applied, the arm control device 5159 receives the external force from the user and operates the actuators of the joints 5147a to 5147c so that the arm 5145 moves smoothly in accordance with the external force. Driving, so-called power assist control may be performed.
- the arm 5145 when the user moves the arm 5145 while directly touching the arm 5145, the arm 5145 can be moved with a relatively light force. Therefore, the endoscope 5115 can be moved more intuitively and with a simpler operation, and the convenience for the user can be improved.
- the endoscope 5115 was supported by a doctor called a scopist.
- the position of the endoscope 5115 can be fixed more reliably without manual operation, so that an image of the operation site can be obtained stably.
- the operation can be performed smoothly.
- the arm control device 5159 may not necessarily be provided on the cart 5151. Further, the arm control device 5159 need not necessarily be one device. For example, the arm control device 5159 may be provided in each of the joints 5147a to 5147c of the arm portion 5145 of the support arm device 5141, and the plurality of arm control devices 5159 cooperate with each other to drive the arm portion 5145. Control may be implemented.
- the light source device 5157 supplies the endoscope 5115 with irradiation light at the time of imaging the operation site.
- the light source device 5157 includes, for example, a white light source including an LED, a laser light source, or a combination thereof.
- a white light source including an LED, a laser light source, or a combination thereof.
- the output intensity and output timing of each color can be controlled with high accuracy. Can be adjusted.
- laser light from each of the RGB laser light sources is radiated to the observation target in a time-division manner, and the driving of the image pickup device of the camera head 5119 is controlled in synchronization with the irradiation timing, thereby supporting each of the RGB. It is also possible to capture the image obtained in a time-division manner. According to this method, a color image can be obtained without providing a color filter in the image sensor.
- the driving of the light source device 5157 may be controlled so as to change the intensity of the output light every predetermined time.
- the driving of the image pickup device of the camera head 5119 in synchronization with the timing of the change of the light intensity, an image is acquired in a time-division manner, and the image is synthesized, so that high dynamics without so-called blackout and whiteout are obtained. An image of the range can be generated.
- the light source device 5157 may be configured to be able to supply light in a predetermined wavelength band corresponding to special light observation.
- special light observation for example, by utilizing the wavelength dependence of the absorption of light in the body tissue, by irradiating light in a narrower band than the irradiation light (ie, white light) during normal observation, the surface of the mucous membrane A so-called narrow-band light observation (Narrow Band Imaging) for photographing a predetermined tissue such as a blood vessel with high contrast is performed.
- narrow-band light observation Narrow Band Imaging
- fluorescence observation in which an image is obtained by fluorescence generated by irradiating excitation light may be performed.
- a body tissue is irradiated with excitation light to observe the fluorescence from the body tissue (autofluorescence observation), or a reagent such as indocyanine green (ICG) is locally injected into the body tissue and Irradiation with excitation light corresponding to the fluorescence wavelength of the reagent to obtain a fluorescent image may be performed.
- the light source device 5157 can be configured to be able to supply narrowband light and / or excitation light corresponding to such special light observation.
- FIG. 18 is a block diagram showing an example of a functional configuration of the camera head 5119 and the CCU 5153 shown in FIG.
- the camera head 5119 has, as its functions, a lens unit 5121, an imaging unit 5123, a driving unit 5125, a communication unit 5127, and a camera head control unit 5129.
- the CCU 5153 has a communication unit 5173, an image processing unit 5175, and a control unit 5177 as its functions.
- the camera head 5119 and the CCU 5153 are communicably connected by a transmission cable 5179.
- the lens unit 5121 is an optical system provided at a connection with the lens barrel 5117. Observation light taken in from the tip of the barrel 5117 is guided to the camera head 5119 and enters the lens unit 5121.
- the lens unit 5121 is configured by combining a plurality of lenses including a zoom lens and a focus lens. The optical characteristics of the lens unit 5121 are adjusted so that the observation light is condensed on the light receiving surface of the imaging element of the imaging unit 5123. Further, the zoom lens and the focus lens are configured such that their positions on the optical axis are movable for adjusting the magnification and the focus of the captured image.
- the imaging unit 5123 is constituted by an imaging element, and is arranged at the subsequent stage of the lens unit 5121.
- the observation light that has passed through the lens unit 5121 is condensed on the light receiving surface of the image sensor, and an image signal corresponding to the observation image is generated by photoelectric conversion.
- the image signal generated by the imaging unit 5123 is provided to the communication unit 5127.
- CMOS Complementary Metal Oxide Semiconductor
- the imaging element constituting the imaging unit 5123 for example, a CMOS (Complementary Metal Oxide Semiconductor) type image sensor that has a Bayer array and can perform color imaging is used.
- the image pickup device an image pickup device capable of capturing a high-resolution image of, for example, 4K or more may be used.
- the image pickup device constituting the image pickup unit 5123 is configured to have a pair of image pickup devices for acquiring right-eye image signals and left-eye image signals corresponding to 3D display. By performing the 3D display, the operator 5181 can more accurately grasp the depth of the living tissue at the operation site.
- the imaging unit 5123 is configured as a multi-plate system, a plurality of lens units 5121 are provided corresponding to the respective imaging elements.
- the imaging unit 5123 may not necessarily be provided in the camera head 5119.
- the imaging unit 5123 may be provided inside the lens barrel 5117 immediately after the objective lens.
- the drive unit 5125 is configured by an actuator, and moves the zoom lens and the focus lens of the lens unit 5121 by a predetermined distance along the optical axis under the control of the camera head control unit 5129. Thereby, the magnification and the focus of the image captured by the imaging unit 5123 can be appropriately adjusted.
- the communication unit 5127 is configured by a communication device for transmitting and receiving various information to and from the CCU 5153.
- the communication unit 5127 transmits the image signal obtained from the imaging unit 5123 to the CCU 5153 via the transmission cable 5179 as RAW data.
- the image signal be transmitted by optical communication in order to display a captured image of the operation section with low latency.
- the operator 5181 performs the operation while observing the state of the affected part with the captured image. For a safer and more reliable operation, a moving image of the operation part is displayed in real time as much as possible. Is required.
- the communication unit 5127 includes a photoelectric conversion module that converts an electric signal into an optical signal.
- the image signal is converted into an optical signal by the photoelectric conversion module, and then transmitted to the CCU 5153 via the transmission cable 5179.
- the communication unit 5127 receives a control signal for controlling driving of the camera head 5119 from the CCU 5153.
- the control signal includes, for example, information indicating that the frame rate of the captured image is specified, information that specifies the exposure value at the time of imaging, and / or information that specifies the magnification and focus of the captured image. Contains information about the condition.
- the communication unit 5127 provides the received control signal to the camera head control unit 5129.
- the control signal from the CCU 5153 may also be transmitted by optical communication.
- the communication unit 5127 is provided with a photoelectric conversion module that converts an optical signal into an electric signal.
- the control signal is converted into an electric signal by the photoelectric conversion module, and is provided to the camera head control unit 5129.
- imaging conditions such as the frame rate, the exposure value, the magnification, and the focus are automatically set by the control unit 5177 of the CCU 5153 based on the acquired image signal. That is, a so-called AE (Auto Exposure) function, an AF (Auto Focus) function, and an AWB (Auto White Balance) function are mounted on the endoscope 5115.
- AE Auto Exposure
- AF Automatic Focus
- AWB Automatic White Balance
- the camera head controller 5129 controls the driving of the camera head 5119 based on a control signal from the CCU 5153 received via the communication unit 5127.
- the camera head control unit 5129 controls the driving of the imaging element of the imaging unit 5123 based on the information for specifying the frame rate of the captured image and / or the information for specifying the exposure at the time of imaging.
- the camera head control unit 5129 appropriately moves the zoom lens and the focus lens of the lens unit 5121 via the driving unit 5125 based on information indicating designation of the magnification and the focus of the captured image.
- the camera head control unit 5129 may further have a function of storing information for identifying the lens barrel 5117 and the camera head 5119.
- the camera head 5119 can have resistance to autoclave sterilization.
- the communication unit 5173 is configured by a communication device for transmitting and receiving various information to and from the camera head 5119.
- the communication unit 5173 receives an image signal transmitted from the camera head 5119 via the transmission cable 5179.
- the image signal can be suitably transmitted by optical communication.
- the communication unit 5173 is provided with a photoelectric conversion module that converts an optical signal into an electric signal in response to optical communication.
- the communication unit 5173 provides the image signal converted to the electric signal to the image processing unit 5175.
- the communication unit 5173 transmits a control signal for controlling the driving of the camera head 5119 to the camera head 5119.
- the control signal may also be transmitted by optical communication.
- the image processing unit 5175 performs various types of image processing on an image signal that is RAW data transmitted from the camera head 5119.
- the image processing includes, for example, development processing, image quality improvement processing (band enhancement processing, super-resolution processing, NR (Noise reduction) processing, and / or camera shake correction processing, etc.), and / or enlargement processing (electronic zoom processing). And various other known signal processing.
- the image processing unit 5175 performs a detection process on the image signal for performing AE, AF, and AWB.
- the image processing unit 5175 is configured by a processor such as a CPU and a GPU, and the above-described image processing and detection processing can be performed by the processor operating according to a predetermined program.
- the image processing unit 5175 includes a plurality of GPUs, the image processing unit 5175 appropriately divides information related to the image signal and performs image processing in parallel by the plurality of GPUs.
- the control unit 5177 performs various controls related to imaging of the operation site by the endoscope 5115 and display of the captured image. For example, the control unit 5177 generates a control signal for controlling driving of the camera head 5119. At this time, when the imaging condition has been input by the user, the control unit 5177 generates a control signal based on the input by the user. Alternatively, when the AE function, the AF function, and the AWB function are mounted on the endoscope 5115, the control unit 5177 controls the optimal exposure value, the focal length, and the distance in accordance with the result of the detection processing by the image processing unit 5175. The white balance is appropriately calculated and a control signal is generated.
- the control unit 5177 causes the display device 5155 to display an image of the surgical site based on the image signal on which the image processing is performed by the image processing unit 5175. At this time, the control unit 5177 recognizes various objects in the operative image using various image recognition techniques. For example, the control unit 5177 detects a shape, a color, or the like of an edge of an object included in the operation part image, and detects a surgical tool such as forceps, a specific living body part, bleeding, a mist when using the energy treatment tool 5135, and the like. Can be recognized. When displaying the image of the operative site on the display device 5155, the control unit 5177 superimposes and displays various types of surgery support information on the image of the operative site using the recognition result. By superimposing the operation support information and presenting it to the operator 5181, it is possible to proceed with the operation more safely and reliably.
- the transmission cable 5179 connecting the camera head 5119 and the CCU 5153 is an electric signal cable corresponding to electric signal communication, an optical fiber corresponding to optical communication, or a composite cable thereof.
- the communication is performed by wire using the transmission cable 5179, but the communication between the camera head 5119 and the CCU 5153 may be performed wirelessly.
- the transmission cable 5179 does not need to be laid in the operating room, and the situation in which the movement of the medical staff in the operating room is prevented by the transmission cable 5179 can be solved.
- the operating room system 5100 As described above, an example of the operating room system 5100 to which the technology according to the present disclosure can be applied has been described.
- the case where the medical system to which the operating room system 5100 is applied is the endoscope operating system 5113 has been described, but the configuration of the operating room system 5100 is not limited to this example.
- the operating room system 5100 may be applied to a flexible endoscope system for examination or a microscopic surgery system instead of the endoscopic surgery system 5113.
- the technology according to the present disclosure can be suitably applied to a configuration for generating a video, for example, the audiovisual controller 5107 among the configurations described above.
- the technology according to the present disclosure to the audiovisual controller 5107, it is possible to generate an appropriate stereoscopic image according to the viewpoint position of the doctor in a medical operation performed by the doctor while viewing the display device 5103B.
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
撮像画像に基づいて顔検出を行い、顔検出結果に基づいて、顔枠情報及び視点位置情報を含む顔検出情報を取得する取得部と、顔枠情報により示される顔枠内における基準点を算出する基準点算出部と、基準点の移動量に応じて視点位置情報を補正する補正部とを有する情報処理装置である。
Description
本開示は、情報処理装置、情報処理方法及びプログラムに関する。
近年、ディスプレイに立体画像を表示させる様々な技術が提案されている。その中で眼鏡等のツールを使用しない、所謂、裸眼立体表示に関する提案もなされている。裸眼立体表示の一つとしてレンチキュラレンズを使用したレンチキュラ方式が知られている。レンチキュラ方式では、レンチキュラレンズを有するディスプレイに立体画像を表示する際に、ユーザ(視聴者)の左右それぞれの視点位置を検出し、当該視点位置に最適な光線を集光し、右目用の画像及び左目用の画像を生成する。ユーザの視点位置を検出する技術として、ユーザの動きに合わせ視聴位置を予測する手法(例えば、下記特許文献1)や、画像から特徴点を検出し、この特徴点を追跡することにより視点をトラッキングする手法(例えば、下記非特許文献1)が提案されている。
Jean-Yves Bouguet「Pyramidal Implementation of the Lucas Kanade Feature Tracker Description of the algorithm」Intel Corporation Microprocessor Research Labs (2000) OpenCV Documents
しかしながら、視点位置を予測する手法では、移動量に応じた切り替え時に視点位置の検出結果に誤差が生じてしまうという問題がある。また、非特許文献1に記載のLucas-Kanadeアルゴリズムを利用した手法の場合は、処理時間がかかってしまうという問題がある。
本開示は、例えば、視点位置の迅速且つ安定したトラッキングを行う情報処理装置、情報処理方法及びプログラムを提供することを目的の一つとする。
本開示は、例えば、
撮像画像に基づいて顔検出を行い、顔検出結果に基づいて、顔枠情報及び視点位置情報を含む顔検出情報を取得する取得部と、
顔枠情報により示される顔枠内における基準点を算出する基準点算出部と、
基準点の移動量に応じて視点位置情報を補正する補正部と
を有する情報処理装置である。
撮像画像に基づいて顔検出を行い、顔検出結果に基づいて、顔枠情報及び視点位置情報を含む顔検出情報を取得する取得部と、
顔枠情報により示される顔枠内における基準点を算出する基準点算出部と、
基準点の移動量に応じて視点位置情報を補正する補正部と
を有する情報処理装置である。
本開示は、例えば、
取得部が、撮像画像に基づいて顔検出を行い、顔検出結果に基づいて、顔枠情報及び視点位置情報を含む顔検出情報を取得し、
基準点算出部が、顔枠情報により示される顔枠内における基準点を算出し、
補正部が、基準点の移動量に応じて視点位置情報を補正する
情報処理方法である。
取得部が、撮像画像に基づいて顔検出を行い、顔検出結果に基づいて、顔枠情報及び視点位置情報を含む顔検出情報を取得し、
基準点算出部が、顔枠情報により示される顔枠内における基準点を算出し、
補正部が、基準点の移動量に応じて視点位置情報を補正する
情報処理方法である。
本開示は、例えば、
取得部が、撮像画像に基づいて顔検出を行い、顔検出結果に基づいて、顔枠情報及び視点位置情報を含む顔検出情報を取得し、
基準点算出部が、顔枠情報により示される顔枠内における基準点を算出し、
補正部が、基準点の移動量に応じて視点位置情報を補正する
情報処理方法をコンピュータに実行させるプログラムである。
取得部が、撮像画像に基づいて顔検出を行い、顔検出結果に基づいて、顔枠情報及び視点位置情報を含む顔検出情報を取得し、
基準点算出部が、顔枠情報により示される顔枠内における基準点を算出し、
補正部が、基準点の移動量に応じて視点位置情報を補正する
情報処理方法をコンピュータに実行させるプログラムである。
以下、本開示の実施の形態等について図面を参照しながら説明する。なお、説明は以下の順序で行う。
<第1の実施の形態>
<第2の実施の形態>
<第3の実施の形態>
<変形例>
<応用例>
以下に説明する実施の形態等は本開示の好適な具体例であり、本開示の内容がこれらの実施の形態等に限定されるものではない。
<第1の実施の形態>
<第2の実施の形態>
<第3の実施の形態>
<変形例>
<応用例>
以下に説明する実施の形態等は本開示の好適な具体例であり、本開示の内容がこれらの実施の形態等に限定されるものではない。
<第1の実施の形態>
[情報処理装置の外観例]
図1は、実施の形態に係る情報処理装置(情報処理装置1)の外観例を示す図である。情報処理装置1は、例えば、ノート型パーソナルコンピュータと同程度の大きさとされているが、より小型化若しくは大型化することも可能である。
[情報処理装置の外観例]
図1は、実施の形態に係る情報処理装置(情報処理装置1)の外観例を示す図である。情報処理装置1は、例えば、ノート型パーソナルコンピュータと同程度の大きさとされているが、より小型化若しくは大型化することも可能である。
情報処理装置1は、ベース2と、ベース2から上方に向かって立設するディスプレイ3とを有している。情報処理装置1は、ディスプレイ3の上側にカメラ4を有しており、カメラ4によりディスプレイ3の前方に位置するユーザを撮像できるように構成されている。
情報処理装置1は、例えば、レンチキュラ方式による立体画像をディスプレイ3に表示可能とされている。概略的には、立体表示用の眼鏡等を使用していない裸眼のユーザの視点位置を、カメラ4により撮像された画像(撮像画像)を使用して検出する。左右それぞれの視点位置に集光する光線で右目用及び左目用の画像(視差画像)を生成し、生成した画像をレンチキュラレンズが実装されたディスプレイ3に表示する、これにより、ユーザは、眼鏡やHUD(Head Up Display)等を用いることなく、立体画像を視聴することが可能となる。
[情報処理装置のシステム構成例]
図2は、第1の実施の形態に係る情報処理装置1のシステム構成例を示すブロック図である。情報処理装置1は、概略的には、視点検出ユニット10と、視差画像処理ユニット20とを有している。視点検出ユニット10は、ユーザの視点位置を示す情報、例えば、視点位置の2次元的な座標を、後段の視差画像処理ユニット20に出力する。なお、視点検出ユニット10の構成、動作例等の詳細については後述する。
図2は、第1の実施の形態に係る情報処理装置1のシステム構成例を示すブロック図である。情報処理装置1は、概略的には、視点検出ユニット10と、視差画像処理ユニット20とを有している。視点検出ユニット10は、ユーザの視点位置を示す情報、例えば、視点位置の2次元的な座標を、後段の視差画像処理ユニット20に出力する。なお、視点検出ユニット10の構成、動作例等の詳細については後述する。
視差画像処理ユニット20は、空間視点座標取得部21、視差画像取得部22及び視差画像表示部23を有している。空間視点座標取得部21は、視点検出ユニット10から出力される視点位置を示す2次元座標を、公知の手法を適用して空間位置における視点座標に変換し、空間上の視点座標を生成する。視差画像取得部22は、空間上の視点座標に対応する光線(画像)を生成することにより、立体画像を生成する。例えば、空間視点座標取得部21及び視差画像取得部22を含む構成が、特許請求の範囲における立体画像取得部に対応している。視差画像表示部23は、視差画像取得部22により生成された視差画像を連続的に表示することで立体映像を提示するデバイスであり、上述したディスプレイ3に対応する。
[視点検出ユニットの構成例]
図3は、第1の実施の形態に係る視点検出ユニット10の構成例を示すブロック図である。視点検出ユニット10は、例えば、イメージセンサ11、顔検出部12、重心算出部13及び補正部14を有している。補正部14は、移動量算出部15及び加算部16を有している。
図3は、第1の実施の形態に係る視点検出ユニット10の構成例を示すブロック図である。視点検出ユニット10は、例えば、イメージセンサ11、顔検出部12、重心算出部13及び補正部14を有している。補正部14は、移動量算出部15及び加算部16を有している。
撮像部の一例であるイメージセンサ11は、例えば、CMOS(Complementary Metal Oxide Semiconductor)センサである。イメージセンサ11として、CCD(Charge Coupled Device)等の他のセンサが適用されても良い。イメージセンサ11は、ディスプレイ3の前方に位置するユーザ、より具体的には、ユーザの顔の周囲を撮像し、撮像画像を取得する。イメージセンサ11で取得された撮像画像はA/D(Analog to Digital)変換された後、出力される。なお、図示は省略しているが、A/D変換器等がイメージセンサ11上に実装されていても構わないし、イメージセンサ11と顔検出部12との間に設けられていても良い。なお、実施の形態に係るイメージセンサ11は、ハイフレームレートの撮像が可能なように構成されている。一例として、イメージセンサ11により1000fps(frame per second)以上の撮像が可能とされている。実施の形態では、イメージセンサ11により1000fpsの撮像が可能とされているものとして説明する。
取得部の一例である顔検出部12は、イメージセンサ11により取得された撮像画像に基づいて顔検出を行い、顔検出結果に基づいて、顔枠情報と、撮像画像におけるユーザの視点位置の座標を示す視点位置情報とを含む顔検出情報を生成、取得する。そして、顔検出部12は、顔検出情報を重心算出部13及び加算部16のそれぞれに出力する。
基準点算出部の一例である重心算出部13は、顔検出部12から出力された顔枠情報により示される顔枠内における重心点(基準点の一例)を算出する。本実施の形態では、イメージセンサ11が重心算出部13を有している。例えば、イメージセンサ11と重心算出部13の機能を実行するチップとが積層されている。これにより装置の小型化を図ることができるものの、重心算出部13とイメージセンサ11とが別々とされた構成であっても良い。
補正部14は、重心点の移動量に応じて視点位置情報を補正する。例えば、補正部14の移動量算出部15が、重心算出部13により算出された重心点のフレーム間における移動量、換言すれば、重心点の座標の変位を算出する。そして、加算部16が、顔検出部12から出力される視点位置情報に重心点の移動量を加算することにより、視点位置情報が補正される。
[情報処理装置の動作例]
(顔検出部及び重心算出部の動作例)
次に、第1の実施の形態に係る情報処理装置1の動作例について説明する。始めに、図4A~図4Cを参照して、顔検出部12及び重心算出部13の動作例について説明する。図4Aは、イメージセンサ11により撮像された画像の一例である撮像画像IM1を示している。撮像画像IM1には、ユーザUが含まれている。
(顔検出部及び重心算出部の動作例)
次に、第1の実施の形態に係る情報処理装置1の動作例について説明する。始めに、図4A~図4Cを参照して、顔検出部12及び重心算出部13の動作例について説明する。図4Aは、イメージセンサ11により撮像された画像の一例である撮像画像IM1を示している。撮像画像IM1には、ユーザUが含まれている。
顔検出部12は、撮像画像IM1を使用してユーザUの顔を検出する。顔検出の結果、図4Bに示すように顔を含む領域に顔枠31が設定され、顔枠31の領域を示す顔枠情報が得られる。なお、顔を検出する方法は、画像の特徴を利用して行う方法等、公知の方法を適用することができる。顔検出部12は、顔枠情報を重心算出部13に出力する。
また、顔検出部12は、撮像画像IM1を使用してユーザUの右目E1及び左目E2を検出する。顔検出部12は、テンプレートマッチングや特徴点を用いた方法等、公知の方法を適用することによりユーザUの右目E1及び左目E2を検出する。顔検出部12は、検出結果に基づいて、右目E1の画面内における座標である位置情報32Aと、左目E2の画面内における座標である位置情報32Bとを含む視点位置情報を生成する。顔検出部12は、視点位置情報を加算部16に出力する。このように、顔検出部12が行う処理により、顔枠情報及び視点位置情報を含む顔検出情報が得られる。
重心算出部13は、顔検出部12から供給された顔枠情報に対応する所定の顔枠(例えば、顔枠31)を初期値として、顔枠内の重心点を算出する。重心点の算出範囲は、例えば、顔枠内における肌色成分の領域に設定される。これにより、図4Cに模式的に示すように、ユーザUの顔の重心点35が検出される。重心点の探索枠は、顔枠内の肌色領域の分布に追従する。従って、顔が右側に移動した場合、その動きに伴って探索枠も右に移動する。
なお、顔検出部12が顔検出情報を取得するためには、一定の処理時間が必要とされる。それに対して、重心算出部13は、予め設定された探索内における所定の色成分(本例では、肌色成分)を対象に重心点を算出すれば良いので、重心算出部13が重心点を取得するために要する時間は、顔検出部12が顔検出情報を取得するために要する時間に比べて短くなる。即ち、重心算出部13により行われる重心点を算出する処理は、処理的な負荷が軽いため入力に対してほぼ遅延なく実行することができる。
(補正部の動作例)
次に、補正部14の動作例について説明する。補正部14の動作例の概略について、図5A及び図5Bを参照して説明する。図5Aに示すように、例えば、X軸上のx1地点でユーザUが撮像された撮像画像が顔検出部12に供給された場合を考える。顔検出部12は、x1地点に存在するユーザUの顔枠や視点位置を検出し、検出結果に基づいて顔検出情報を生成、取得する。ここで、顔検出部12が顔検出情報を取得するまでに要する時間(検出時間)をtとする。検出時間t経過後、顔検出部12は、取得した顔検出情報を出力する。
次に、補正部14の動作例について説明する。補正部14の動作例の概略について、図5A及び図5Bを参照して説明する。図5Aに示すように、例えば、X軸上のx1地点でユーザUが撮像された撮像画像が顔検出部12に供給された場合を考える。顔検出部12は、x1地点に存在するユーザUの顔枠や視点位置を検出し、検出結果に基づいて顔検出情報を生成、取得する。ここで、顔検出部12が顔検出情報を取得するまでに要する時間(検出時間)をtとする。検出時間t経過後、顔検出部12は、取得した顔検出情報を出力する。
しかしながら、検出時間tの間にユーザUが移動し、出力された顔検出情報に含まれる視点位置情報により示される視点位置と、現在における視点位置との間に乖離が生じる場合もあり得る。例えば、図5Bに模式的に示すように、検出時間tの間に、ユーザUがx1地点からx2地点まで移動した場合、顔検出部12により検出された両眼の視点位置はt時間前の過去の視点位置になってしまい実際の視点位置(x2地点に居るユーザUの視点位置)とずれてしまう。このように、顔検出部12が出力する視点位置情報は、遅延を含んでいる。従って、顔検出部12が出力する視点位置情報の視点位置のみに基づいて後段の視差画像処理ユニット20が視差画像を生成してしまうと、過去の視点位置に対応する視差画像が生成されるため、ユーザUに対して提示される立体画像が不自然になる虞がある。
一方で、上述したように、重心点を算出する処理は、ハイフレームレート(本例では、1000fps)に対応する速さでリアルタイムに行うことができる。そこで、図5Bに示すように、例えば、x1地点からx2地点にユーザUが移動した際の重心点の移動量ΔAを算出する。このΔAを、x1地点における視点位置情報に加算することにより、x2地点における視点位置情報をリアルタイムに取得することができる。なお、図5Bでは、重心点が星印により模式的に示されている。
図6のタイミングチャートを参照して、より具体的な例について説明する。以下に説明する例では、イメージセンサ11が1000fpsで撮像画像を取得する。また、顔検出部12が顔検出情報を検出するためまでに要する時間は、例えば16ms(ミリ秒)とする。顔検出情報を検出するためまでに要する期間内に16枚のフレームが入力される。なお、重心算出部13は、1ms毎に重心点を算出できるものとする。
図6に示すように、所定のタイミングTAにおいて撮像が開始され、ユーザUの顔を含む撮像画像が顔検出部12に入力される。タイミングTAから16ms後のタイミングTBで、顔検出部12の処理により顔検出情報が検出され、顔枠が検出されたタイミングTAにおけるユーザの視点位置が検出される。
顔検出部12により検出された顔枠情報が重心算出部13に供給される。重心算出部13は、顔検出部12により次の顔検出情報が検出されるまでの間、タイミングTBで検出された顔枠内における重心点をリアルタイムに算出する。そして、重心算出部13は、リアルタイムに算出した重心点の座標を移動量算出部15に供給する。移動量算出部15は、重心点の移動量である重心差分を1ms毎に算出し、蓄積する。
移動量算出部15は、例えば、重心点のX軸方向の変位及びY軸方向の変位をそれぞれ算出する。また、例えば、タイミングTBにおける重心点の座標から遠くなる場合は移動量が加算され、反対に、タイミングTBにおける重心点の座標に近づく場合は移動量が減算される。なお、図6では、重心差分がリニアに増えているように示されているが、16msの間にユーザUの動きがない場合は、重心差分が0になる。
具体的には、移動量算出部15は、フレーム間(フレーム16と17の間)の重心差分d0を算出する。また、移動量算出部15は、フレーム間(フレーム17と18の間)の重心差分d1を算出する。同様にして、移動量算出部15は、重心差分であるd2、d3・・d9、da、db・・dfを算出する。移動量算出部15は、最終的な重心差分dfを加算部16に供給する。
フレーム32が入力されるタイミングであるタイミングTCにおいて、顔検出部12により顔検出情報が検出され、両眼座標に対応する視点位置情報p0が検出される。この視点位置情報p0は、16フレーム前のタイミングTBにおけるユーザUの視点位置である。即ち、遅延を含む視点位置情報である。そこで、加算部16は、視点位置情報p0に重心差分dfを加算することにより視点位置情報p0を補正し、現在の視点位置に対応する視点位置情報を取得する。補正後の視点位置情報が加算部16から視差画像処理ユニット20に供給される。視差画像処理ユニット20は、供給された視点位置情報をトラッキングデータとして使用し、当該視点位置情報が示す視点位置に対応する立体画像を生成し、表示する。
以下の処理が連続的に行われる。例えば、タイミングTCから、次の顔検出情報が検出されるタイミングTD(フレーム48が入力されるタイミング)までの間、フレーム毎の重心座標が算出され、フレーム間の重心差分が蓄積される。タイミングTDで検出された視点位置情報p1は、タイミングTCの視点位置を示す情報である。そこで、補正部14は、タイミングTCにおける視点位置情報p0に重心差分df、efを加算することにより、遅延が解消された、現在の視点位置に対応する視点位置情報を取得する。
なお、顔検出情報が検出されたタイミング毎にリセットフラグ(例えば、論理的な値「1」)が設定され、蓄積された重心差分がリセットされる。そして、リセットフラグが設定されたタイミングにおける視点位置情報が、補正対象の視点位置情報として用いられる。
[処理の流れ]
次に、図7のフローチャートを参照して、第1の実施の形態に係る視点検出ユニット10で行われる処理の流れについて説明する。
次に、図7のフローチャートを参照して、第1の実施の形態に係る視点検出ユニット10で行われる処理の流れについて説明する。
処理が始まると、イメージセンサ11を介して撮像画像が取得され、取得された撮像画像が顔検出部12に供給される(ステップST11)。顔検出部12は、撮像画像に基づいて、顔枠情報及び視点位置情報を含む顔検出情報を生成する。顔枠情報が重心算出部13に供給される。重心算出部13は、顔枠情報に対応する顔枠内における肌色成分の重心点を算出する(ステップST12)。
そして、移動量算出部15が、重心算出部13により算出された重心点と、前フレームにおいて重心算出部13により算出された重心点との位置の差分値である重心差分を算出し、重心点の総移動量に加算する(ステップST13)。これにより、重心点の移動量が蓄積されていく。
そして、リセットフラグ=1であるか否かが判断される(ステップST14)。ここでリセットフラグ=1であれば、新たな顔検出情報が検出され、処理に使用される顔検出情報が検出された顔検出情報に更新される。リセットフラグ=1が設定されている場合には、蓄積された最終的な重心差分の値、換言すれば、顔検出情報の検出周期における最終的な重心差分の値がリセットされる(ステップST15)。
リセットフラグ=1でなくリセットフラグ=0である場合は、最終的な重心差分の値が加算部16に転送される(ステップST16)。
また、撮像画像の入力タイミングから例えば16ms経過して新たな顔検出情報が検出され、顔検出情報が更新された否かが判断される(ステップST17)。係る判断は、例えば、1ms毎に行われる。新たな顔検出情報が検出されない場合には、リセットフラグ=0が設定される(ステップST18)。
顔検出部12により新たな顔検出情報が検出された場合は、リセットフラグ=1が設定される(ステップST19)。そして、検出された新たな顔検出情報が以降の処理で使用されるように、顔検出情報に含まれる顔枠情報及び視点位置情報を更新する(ステップST20)。そして、更新後の視点位置情報が加算部16に転送される(ステップST21)。
加算部16では、視点位置情報に最終的な重心差分の値が加算されることにより、視点位置情報が補正される。補正後の視点位置情報が出力される(ステップST22)。なお、図示はしていないが、後段の視差画像処理ユニット20では、補正後の視点位置情報により示される視点位置に対応する立体画像が生成される。
[第1の実施の形態の効果例]
第1の実施の形態によれば、ユーザの現時点の視点をリアルタイムに且つ安定的に取得ことが可能になる。
また、非特許文献1に記載された複雑なアルゴリズムを用いないため、ユーザの現時点の視点を迅速に取得することができる。
また、眼鏡等を使用することなく立体画像を視聴可能なシステムにおいて、視点位置を適切にトラッキングすることが可能となる。
また、視聴位置を予測する手法では、外乱要因としてノイズに影響を受けやすく、また、線形移動の場合には効果を奏し得るものの、ユーザの動きは非線形で複雑であり、表示する画像も定常的な更新周期でない場合もあるなど予測が困難になってしまうという問題がある。しかしながら、本実施の形態によれば、視聴位置を予測する処理をしていないため係る問題が生じることはない。
第1の実施の形態によれば、ユーザの現時点の視点をリアルタイムに且つ安定的に取得ことが可能になる。
また、非特許文献1に記載された複雑なアルゴリズムを用いないため、ユーザの現時点の視点を迅速に取得することができる。
また、眼鏡等を使用することなく立体画像を視聴可能なシステムにおいて、視点位置を適切にトラッキングすることが可能となる。
また、視聴位置を予測する手法では、外乱要因としてノイズに影響を受けやすく、また、線形移動の場合には効果を奏し得るものの、ユーザの動きは非線形で複雑であり、表示する画像も定常的な更新周期でない場合もあるなど予測が困難になってしまうという問題がある。しかしながら、本実施の形態によれば、視聴位置を予測する処理をしていないため係る問題が生じることはない。
図8は、第1の実施の形態の効果例を説明するための図である。図8のグラフにおける横軸はフレーム数を示し、縦軸は座標(例えば、X座標)を示している。図8のグラフにおける点線L1は、顔検出情報の視点位置情報により示される視点座標を示している。また、一点鎖線L2は、重心点の移動量を加算した視点座標、即ち、補正後の視点位置情報を示している。また、実線L3は、顔枠内の重心座標を示している。
図8のグラフに示すように、顔検出情報を検出するのに要する時間の間、重心座標が移動した距離が顔検出の視点座標に加算される。これにより、重心座標の変化と同様になめらかな変化を示す現在の視点座標をトラッキングデータとして取得することができる。
なお、重心算出部13により算出される重心点は、顔の中心点と一致する必要がある。しかしながら、本実施の形態のように、一定周期毎に顔枠が更新される例では、顔枠内における肌色領域が入力画像の顔枠と乖離してしまう可能性がある。この為、顔枠の中心点と重心点との差異が一定以上となった場合に、顔枠の再設定がなされても良い。また、顔枠の定期的な更新がなされても良い。
例えば、図9Aに示すように、顔枠41内における顔中心42の座標をα(x1,y1)とする。座標αは、例えば、顔検出部12により算出される。また、図9Bに示すように、重心算出部13により算出される重心点43の座標をβ(x2,y2)とする。2点間のユークリッド距離dが下記の数式1により求められる。
ユーグリッド距離dが例えばd≦50となった場合、つまり、顔中心42の座標αと重心点43の座標βとの間の2次元空間距離が50ピクセル以下となった場合に顔枠の再設定がなされるようにしても良い。探索枠の再設定を実施することで顔検出と連動した重心算出が可能になる。
<第2の実施の形態>
次に、第2の実施の形態について説明する。なお、第1の実施の形態で説明した事項は、特に断らない限り、第2の実施の形態にも適用することができる。例えば、視差画像処理ユニット20の構成、動作については、第1の実施の形態で説明した内容を、第2の実施の形態にも適用することができる。また、第1の実施の形態で説明した構成と同一若しくは同質の構成については、同じ参照符号を付し、重複した説明を適宜、省略する。
次に、第2の実施の形態について説明する。なお、第1の実施の形態で説明した事項は、特に断らない限り、第2の実施の形態にも適用することができる。例えば、視差画像処理ユニット20の構成、動作については、第1の実施の形態で説明した内容を、第2の実施の形態にも適用することができる。また、第1の実施の形態で説明した構成と同一若しくは同質の構成については、同じ参照符号を付し、重複した説明を適宜、省略する。
[視点検出ユニットの構成例]
図10は、第2の実施の形態に係る視点検出ユニット(視点検出ユニット10A)の構成例を示すブロック図である。視点検出ユニット10Aは、例えば、イメージセンサ11、顔検出部12、重心算出部13、加速度検出部51及び座標比率決定部52を有している。イメージセンサ11、顔検出部12及び重心算出部13については、第1の実施の形態で説明しているため、重複した説明を適宜、省略する。なお、第2の実施の形態では、イメージセンサ11と重心算出部13とが別の構成とされているが、第1の実施の形態と同様、イメージセンサ11が重心算出部13を有する構成であっても良い。
図10は、第2の実施の形態に係る視点検出ユニット(視点検出ユニット10A)の構成例を示すブロック図である。視点検出ユニット10Aは、例えば、イメージセンサ11、顔検出部12、重心算出部13、加速度検出部51及び座標比率決定部52を有している。イメージセンサ11、顔検出部12及び重心算出部13については、第1の実施の形態で説明しているため、重複した説明を適宜、省略する。なお、第2の実施の形態では、イメージセンサ11と重心算出部13とが別の構成とされているが、第1の実施の形態と同様、イメージセンサ11が重心算出部13を有する構成であっても良い。
顔検出部12は、撮像画像に基づいて顔検出情報を生成し、顔枠情報を重心算出部13に、視点位置情報を座標比率決定部52にそれぞれ出力する。重心算出部13は、顔枠内における重心点を算出し、算出結果である重心点の座標を加速度検出部51と座標比率決定部52とに出力する。
加速度検出部51では、例えば前画像の重心点の座標を保持しておき、入力された現画像における重心点の座標との差分を計算する。この差分が加速度に対応する。計算の結果得られる差分値を座標比率決定部52に出力する。
座標比率決定部52は、加速度検出部51から供給される差分値に応じて、視点位置情報により示される視点位置の座標と、重心点の座標とを加重加算するための比率(それぞれの座標に対して設定される重み)を決定する。座標比率決定部52は、決定した比率を使用した重み付け加算を行うことにより、視差画像処理ユニット20に対して出力される視点位置情報を生成する。
例えば、座標比率決定部52は、加速度検出部51から供給される差分値が大きい場合、つまり早い動きを検出した時には、応答性に優れた重心座標の比率を増やすように比率を設定する。一方、差分値が少ない場合は動きが少ないと判断出来るので、安定性の高い顔検出情報に含まれる視点位置情報の比率を増やす。ここでの安定性が高いとは、顔検出情報に含まれる視点位置情報は視点位置そのものであり、予測値である、重心点の移動量を加算した場合の視点位置情報よりも精度が高いという意味である。
[処理の流れ]
次に、図11のフローチャートを参照して、第2の実施の形態に係る視点検出ユニット10Aが行う処理の流れについて説明する。
次に、図11のフローチャートを参照して、第2の実施の形態に係る視点検出ユニット10Aが行う処理の流れについて説明する。
処理が開始されると、イメージセンサ11を介して得られた撮像画像が、顔検出部12に入力される(ステップST31)。そして、顔検出部12が、撮像画像に基づいて顔検出情報を取得し、取得した顔検出情報を出力する(ステップST32)。
また、イメージセンサ11を介して得られた撮像画像が、重心算出部13に入力される(ステップST33)。そして、重心算出部13は、顔枠情報の更新があるか否かを判断する(ステップST34)。重心算出部13は、例えば、顔検出部12から新たな顔枠情報が入力された否かによって、顔枠情報の更新があるか否かを判断する。
顔枠情報の更新がある場合は、重心算出部13は、更新後の顔枠情報により示される座標を、重心点の探索枠として設定する(ステップST35)。そして、重心算出部13は、設定後の顔枠内における重心点を算出する。なお、顔枠情報の更新がない場合は、重心算出部13は、それまでの顔枠情報を重心点の探索枠として重心点を算出する(ステップST36)。重心算出部13は、算出した重心点の座標を、加速度検出部51及び座標比率決定部52のそれぞれに出力する。
加速度検出部51は、例えば、前フレームの重心点の座標と現フレームの重心点の座標との差分値を算出する。そして、加速度検出部51は、算出した差分値を座標比率決定部52に出力する(ステップST37)。
座標比率決定部52は、加速度検出部51から供給された差分値に応じた重み付け比率を決定する(ステップST38)。そして、座標比率決定部52は、重み付け比率を使用して、視点位置情報により示される視点座標及び重心点の座標に対する重み付け加算を行い、出力対象の視点位置情報を生成する(ステップST39)。なお、図示はしていないが、後段の視差画像処理ユニット20では、座標比率決定部52から出力された視点位置情報により示される視点位置に対応する立体画像が生成される。
以上説明した第2の実施の形態によれば、例えば、下記の効果が得られる。加速度を検出する際に使用される重心の差分値では、予測ではなく現在のフレームに対する動きを捉えることができるため、応答誤差の少ないシステムとして構築できる。また、精度の高い現在の視点位置を得ることが可能となる。
<第3の実施の形態>
次に、第3の実施の形態について説明する。なお、第1、第2の実施の形態で説明した事項は、特に断らない限り、第3の実施の形態にも適用することができる。また、第1、第2の実施の形態で説明した構成と同一若しくは同質の構成については、同じ参照符号を付し、重複した説明を適宜、省略する。
次に、第3の実施の形態について説明する。なお、第1、第2の実施の形態で説明した事項は、特に断らない限り、第3の実施の形態にも適用することができる。また、第1、第2の実施の形態で説明した構成と同一若しくは同質の構成については、同じ参照符号を付し、重複した説明を適宜、省略する。
[視点検出ユニットの構成例]
図12は、第3の実施の形態に係る視点検出ユニット(視点検出ユニット10B)の構成例を示すブロック図である。視点検出ユニット10Bは、例えば、イメージセンサ11、顔検出部12、重心算出部13、補正部14、測距部61及び切替部62を有している。第1の実施の形態と同様に、補正部14は、移動量算出部15及び加算部16を有している。なお、第3の実施の形態では、イメージセンサ11と重心算出部13が別の構成とされているが、第1の実施の形態と同様、イメージセンサ11が重心算出部13を有する構成であっても良い。
図12は、第3の実施の形態に係る視点検出ユニット(視点検出ユニット10B)の構成例を示すブロック図である。視点検出ユニット10Bは、例えば、イメージセンサ11、顔検出部12、重心算出部13、補正部14、測距部61及び切替部62を有している。第1の実施の形態と同様に、補正部14は、移動量算出部15及び加算部16を有している。なお、第3の実施の形態では、イメージセンサ11と重心算出部13が別の構成とされているが、第1の実施の形態と同様、イメージセンサ11が重心算出部13を有する構成であっても良い。
第3の実施の形態に係る視点検出ユニット10Bは、顔検出の対象であるユーザまでの距離を計測する測距部61の測距結果に応じて、顔検出部12により生成された顔検出情報に含まれる視点位置情報及び補正部14により補正された視点位置情報の何れかが、切替部62から選択的に出力されるように構成されている。より具体的には、測距部61による測距結果が閾値より小さい場合には、補正部14により補正された視点位置情報が切替部62から出力され、測距結果が前記閾値より大きい場合には、顔検出部12により生成された視点位置情報が出力されるように構成されている。
イメージセンサ11、顔検出部12、重心算出部13、補正部14については、第1の実施の形態で説明した動作をそれぞれ行う。これにより、顔検出部12からは、視点位置情報を含む顔検出情報が出力される。顔検出部12から出力された顔検出情報(少なくとも視点位置情報)は、測距部61及び切替部62のそれぞれに供給される。また、加算部16から出力される補正後の視点位置情報が、切替部62に供給される。
測距部61は、例えば、顔検出部12から供給される視点位置情報を使用して、ユーザUまでの距離を計測する。例えば、測距部61は、視点位置情報を用いて右目と左目との眼間距離が6.5cmとした場合の推定距離を導き出し、推定距離を示す測距データを切替部62に出力する。勿論、他の手法を用いて測距部61が測距を行うようにしても良い。また、測距部61は、ToF(Time of Flight)やLidar(Light Detection and Ranging)等のセンサであっても構わない。
切替部62は、測距結果が閾値より小さい場合、即ち、ユーザUが情報処理装置1に対して近い位置に居る場合は、補正部14により補正された視点位置情報を選択して出力する。また、切替部62は、測距結果が閾値より大きい場合、即ち、ユーザUが情報処理装置1に対して遠い位置に居る場合は、顔検出部12により生成された視点位置情報を選択して出力する。
[処理の流れ]
次に、第3の実施の形態に係る視点検出ユニット10Bが行う処理の流れについて説明する。始めに、図13に示すフローチャートを参照して、測距部61が行う処理(測距処理)の流れについて説明する。
次に、第3の実施の形態に係る視点検出ユニット10Bが行う処理の流れについて説明する。始めに、図13に示すフローチャートを参照して、測距部61が行う処理(測距処理)の流れについて説明する。
測距部61は、顔検出部12から供給される顔検出情報に基づいて、測距データを生成する。そして、生成した測距データを切替部62に出力する(ステップST41)。切替部62は、測距部61から供給された測距データを読み込む(ステップST42)。これらの処理が、測距部61に対して顔検出部12から顔検出情報が供給される度に行われる。
次に、図14のフローチャートを参照して、第3の実施の形態に係る視点検出ユニット10Bが行う処理の流れについて説明する。
処理が開始されると、イメージセンサ11を介して得られた撮像画像が、顔検出部12に入力される(ステップST51)。そして、顔検出部12が、撮像画像に基づいて顔検出情報を取得し、取得した顔検出情報を出力する(ステップST52)。
顔検出部12により生成された顔検出情報が測距部61に供給される。測距部61は、上述した測距処理を行う(ステップST53)。測距処理により得られた測距データが切替部62に供給され、切替部62に読み込まれる(ステップST54)。
また、イメージセンサ11を介して得られた撮像画像が、重心算出部13に入力される(ステップST55)。そして、重心算出部13は、顔枠情報の更新があるか否かを判断する(ステップST56)。重心算出部13は、例えば、顔検出部12から新たな顔枠情報が入力された否かによって、顔枠情報の更新があるか否かを判断する。
顔枠情報の更新がある場合は、重心算出部13は、更新後の顔枠情報により示される座標を、重心点の探索枠として設定する(ステップST57)。そして、重心算出部13は、設定後の顔枠内における重心点を算出する。なお、顔枠情報の更新がない場合は、重心算出部13は、それまでの顔枠情報を重心点の探索枠として重心点を算出する(ステップST58)。
そして、移動量算出部15が、重心点の差分である重心差分を算出し、蓄積する(ステップST59)。そして、加算部16は、最終的な重心差分を、顔検出部12から供給される視点位置情報に加算する(ステップST60)。なお、上述したステップST55~ST60までの処理は、第1の実施の形態で説明した処理と同様の処理である。
切替部62は、読み込んだ測距データが設定値より大きい(例えば、設定値以上)か否かを判断する(ステップST61)。そして、測距データが設定値以上である場合は、切替部62は、補正されていない視点位置情報、即ち、顔検出部12から供給される視点位置情報を出力する(ステップST62)。一方、測距データが設定値より小さい場合は、切替部62は、補正された視点位置情報、即ち、移動量算出部15から供給される視点位置情報を出力する(ステップST63)。
なお、図示はしていないが、後段の視差画像処理ユニット20では、切替部62から出力された視点位置情報により示される視点位置に対応する立体画像が生成される。
以上、説明した第3の実施の形態によれば、例えば、下記の効果が得られる。情報処理装置までのユーザの距離が閾値より小さい近接した距離の場合は、加算部から出力される、応答性に優れた視点位置情報を選択し、出力することができる。また、情報処理装置までのユーザの距離が閾値より大きい遠距離の場合は、顔検出部12から出力される、安定感のある視点位置情報を選択し、出力することができる。
情報処理装置までのユーザの距離が遠いほど、画面上における視点位置の変化は小さくなり、顔検出情報が検出されるまでのレイテンシによる立体画像への影響をユーザが感じづらくなる。一方、重心算出部や補正部が処理を行う場合に、入力される画像が多いほど、つまりハイフレームレートであるほどチャタリングが発生し、ノイズ等が発生する虞がある。第3の実施の形態によれば、ユーザが情報処理装置に対して近接した位置に居る時には、過渡応答に優れたトラッキングデータを出力することができ、ユーザが情報処理装置に対して遠距離置に居る時には、ノイズによる微動を抑えたトラッキングデータを出力することができる。これにより迅速かつ安定的な視点位置のトラッキングが可能になる。
情報処理装置までのユーザの距離が遠いほど、画面上における視点位置の変化は小さくなり、顔検出情報が検出されるまでのレイテンシによる立体画像への影響をユーザが感じづらくなる。一方、重心算出部や補正部が処理を行う場合に、入力される画像が多いほど、つまりハイフレームレートであるほどチャタリングが発生し、ノイズ等が発生する虞がある。第3の実施の形態によれば、ユーザが情報処理装置に対して近接した位置に居る時には、過渡応答に優れたトラッキングデータを出力することができ、ユーザが情報処理装置に対して遠距離置に居る時には、ノイズによる微動を抑えたトラッキングデータを出力することができる。これにより迅速かつ安定的な視点位置のトラッキングが可能になる。
<変形例>
以上、本開示の複数の実施の形態について具体的に説明したが、本開示の内容は上述した実施の形態に限定されるものではなく、本開示の技術的思想に基づく各種の変形が可能である。以下、変形例について説明する。
以上、本開示の複数の実施の形態について具体的に説明したが、本開示の内容は上述した実施の形態に限定されるものではなく、本開示の技術的思想に基づく各種の変形が可能である。以下、変形例について説明する。
上述した実施の形態では、基準点として重心点を例に説明したが、これに限定されるものではなく、重心点以外の適宜な箇所が基準点として設定されても良い。
上述した実施の形態では、隣接したフレーム間における重心点の移動量を算出するようにしたがこれに限定されるものではない。例えば、所定のフレーム数、離れたフレーム間における重心点の移動量を算出するようにしても良い。これにより、ハイフレームレートで画像が入力される場合に、処理の負荷を軽くすることができる。
上述した実施の形態では、情報処理装置が、視点検出ユニット及び視差画像処理ユニットを有する構成としてが、視差画像処理ユニットを別の装置が有する構成であっても良い。
上述した実施の形態で説明した構成は一例に過ぎず、これに限定されるものではない。本開示の趣旨を逸脱しない範囲で、構成の追加、削除等が行われて良いことは言うまでもない。各実施の形態及び変形例で説明した内容は、適宜、組み合わせることも可能である。本開示は、装置、方法、プログラム、システム等の任意の形態で実現することもできる。プログラムは、例えば、視点検出ユニットが有するメモリや適宜な記録媒体に記憶され、実行され得る。
本開示は、以下の構成も採ることができる。
(1)
撮像画像に基づいて顔検出を行い、顔検出結果に基づいて、顔枠情報及び視点位置情報を含む顔検出情報を取得する取得部と、
前記顔枠情報により示される顔枠内における基準点を算出する基準点算出部と、
前記基準点の移動量に応じて前記視点位置情報を補正する補正部と
を有する情報処理装置。
(2)
前記補正部は、前記顔検出情報を取得するまでに要する期間の間、前記基準点の移動量を蓄積し、蓄積した基準点の移動量に応じて、前記視点位置情報を補正する
(1)に記載の情報処理装置。
(3)
前記補正部は、第1の顔検出情報を取得してから、当該第1の顔検出情報の次の顔検出情報である第2の顔検出情報を取得するまでに要する期間の間、前記基準点の移動量を蓄積し、蓄積した前記基準点の移動量に応じて、前記第1の顔検出情報に含まれる視点位置情報を補正する
(1)又は(2)に記載の情報処理装置。
(4)
前記補正部は、フレーム間における前記基準点の移動量を蓄積する
(2)に記載の情報処理装置。
(5)
前記基準点算出部は、前記基準点として、前記顔枠内における所定の色成分の領域内に存在する重心点を算出する
(1)から(4)までの何れかに記載の情報処理装置。
(6)
前記所定の色成分は、肌色成分である
(5)に記載の情報処理装置。
(7)
前記補正部は、前記基準点の移動量に応じた重み付けを設定し、前記顔検出情報に含まれる前記視点位置情報と、前記基準点の位置情報とを、前記設定した重み付けを使用して重み付け加算する
(1)に記載の情報処理装置。
(8)
顔検出の対象であるユーザまでの距離を計測する測距部を有し、
前記測距部の測距結果に応じて、前記取得部により生成された視点位置情報及び前記補正部により補正された視点位置情報の何れかを選択的に出力するように構成されている
(1)から(6)までの何れかに記載の情報処理装置。
(9)
前記測距結果が閾値より小さい場合には、前記補正部により補正された視点位置情報が出力され、
前記測距結果が前記閾値より大きい場合には、前記取得部により生成された視点位置情報が出力されるように構成されている
(8)に記載の情報処理装置。
(10)
前記撮像画像を取得する撮像部を有する
(1)から(9)までの何れかに記載の情報処理装置。
(11)
前記撮像部が前記基準点算出部を有している
(10)に記載の情報処理装置。
(12)
前記撮像部は、1000fps以上の撮像が可能とされている
(10)又は(11)に記載の情報処理装置。
(13)
前記補正部により補正された視点位置を使用して立体画像を生成する立体画像取得部を有する
(1)から(12)までの何れかに記載の情報処理装置。
(14)
前記立体画像が表示されるディスプレイを有する
(13)に記載の情報処理装置。
(15)
取得部が、撮像画像に基づいて顔検出を行い、顔検出結果に基づいて、顔枠情報及び視点位置情報を含む顔検出情報を取得し、
基準点算出部が、前記顔枠情報により示される顔枠内における基準点を算出し、
補正部が、前記基準点の移動量に応じて前記視点位置情報を補正する
情報処理方法。
(16)
取得部が、撮像画像に基づいて顔検出を行い、顔検出結果に基づいて、顔枠情報及び視点位置情報を含む顔検出情報を取得し、
基準点算出部が、前記顔枠情報により示される顔枠内における基準点を算出し、
補正部が、前記基準点の移動量に応じて前記視点位置情報を補正する
情報処理方法をコンピュータに実行させるプログラム。
(1)
撮像画像に基づいて顔検出を行い、顔検出結果に基づいて、顔枠情報及び視点位置情報を含む顔検出情報を取得する取得部と、
前記顔枠情報により示される顔枠内における基準点を算出する基準点算出部と、
前記基準点の移動量に応じて前記視点位置情報を補正する補正部と
を有する情報処理装置。
(2)
前記補正部は、前記顔検出情報を取得するまでに要する期間の間、前記基準点の移動量を蓄積し、蓄積した基準点の移動量に応じて、前記視点位置情報を補正する
(1)に記載の情報処理装置。
(3)
前記補正部は、第1の顔検出情報を取得してから、当該第1の顔検出情報の次の顔検出情報である第2の顔検出情報を取得するまでに要する期間の間、前記基準点の移動量を蓄積し、蓄積した前記基準点の移動量に応じて、前記第1の顔検出情報に含まれる視点位置情報を補正する
(1)又は(2)に記載の情報処理装置。
(4)
前記補正部は、フレーム間における前記基準点の移動量を蓄積する
(2)に記載の情報処理装置。
(5)
前記基準点算出部は、前記基準点として、前記顔枠内における所定の色成分の領域内に存在する重心点を算出する
(1)から(4)までの何れかに記載の情報処理装置。
(6)
前記所定の色成分は、肌色成分である
(5)に記載の情報処理装置。
(7)
前記補正部は、前記基準点の移動量に応じた重み付けを設定し、前記顔検出情報に含まれる前記視点位置情報と、前記基準点の位置情報とを、前記設定した重み付けを使用して重み付け加算する
(1)に記載の情報処理装置。
(8)
顔検出の対象であるユーザまでの距離を計測する測距部を有し、
前記測距部の測距結果に応じて、前記取得部により生成された視点位置情報及び前記補正部により補正された視点位置情報の何れかを選択的に出力するように構成されている
(1)から(6)までの何れかに記載の情報処理装置。
(9)
前記測距結果が閾値より小さい場合には、前記補正部により補正された視点位置情報が出力され、
前記測距結果が前記閾値より大きい場合には、前記取得部により生成された視点位置情報が出力されるように構成されている
(8)に記載の情報処理装置。
(10)
前記撮像画像を取得する撮像部を有する
(1)から(9)までの何れかに記載の情報処理装置。
(11)
前記撮像部が前記基準点算出部を有している
(10)に記載の情報処理装置。
(12)
前記撮像部は、1000fps以上の撮像が可能とされている
(10)又は(11)に記載の情報処理装置。
(13)
前記補正部により補正された視点位置を使用して立体画像を生成する立体画像取得部を有する
(1)から(12)までの何れかに記載の情報処理装置。
(14)
前記立体画像が表示されるディスプレイを有する
(13)に記載の情報処理装置。
(15)
取得部が、撮像画像に基づいて顔検出を行い、顔検出結果に基づいて、顔枠情報及び視点位置情報を含む顔検出情報を取得し、
基準点算出部が、前記顔枠情報により示される顔枠内における基準点を算出し、
補正部が、前記基準点の移動量に応じて前記視点位置情報を補正する
情報処理方法。
(16)
取得部が、撮像画像に基づいて顔検出を行い、顔検出結果に基づいて、顔枠情報及び視点位置情報を含む顔検出情報を取得し、
基準点算出部が、前記顔枠情報により示される顔枠内における基準点を算出し、
補正部が、前記基準点の移動量に応じて前記視点位置情報を補正する
情報処理方法をコンピュータに実行させるプログラム。
<応用例>
本開示に係る技術は、様々な製品へ応用することができる。例えば、本開示に係る技術は、手術室システムに適用されてもよい。
本開示に係る技術は、様々な製品へ応用することができる。例えば、本開示に係る技術は、手術室システムに適用されてもよい。
図15は、本開示に係る技術が適用され得る手術室システム5100の全体構成を概略的に示す図である。図15を参照すると、手術室システム5100は、手術室内に設置される装置群が視聴覚コントローラ(AV Controller)5107及び手術室制御装置5109を介して互いに連携可能に接続されることにより構成される。
手術室には、様々な装置が設置され得る。図15では、一例として、内視鏡下手術のための各種の装置群5101と、手術室の天井に設けられ術者の手元を撮像するシーリングカメラ5187と、手術室の天井に設けられ手術室全体の様子を撮像する術場カメラ5189と、複数の表示装置5103A~5103Dと、レコーダ5105と、患者ベッド5183と、照明5191と、を図示している。
ここで、これらの装置のうち、装置群5101は、後述する内視鏡手術システム5113に属するものであり、内視鏡や当該内視鏡によって撮像された画像を表示する表示装置等からなる。内視鏡手術システム5113に属する各装置は医療用機器とも呼称される。一方、表示装置5103A~5103D、レコーダ5105、患者ベッド5183及び照明5191は、内視鏡手術システム5113とは別個に、例えば手術室に備え付けられている装置である。これらの内視鏡手術システム5113に属さない各装置は非医療用機器とも呼称される。視聴覚コントローラ5107及び/又は手術室制御装置5109は、これら医療機器及び非医療機器の動作を互いに連携して制御する。
視聴覚コントローラ5107は、医療機器及び非医療機器における画像表示に関する処理を、統括的に制御する。具体的には、手術室システム5100が備える装置のうち、装置群5101、シーリングカメラ5187及び術場カメラ5189は、手術中に表示すべき情報(以下、表示情報ともいう)を発信する機能を有する装置(以下、発信元の装置とも呼称する)であり得る。また、表示装置5103A~5103Dは、表示情報が出力される装置(以下、出力先の装置とも呼称する)であり得る。また、レコーダ5105は、発信元の装置及び出力先の装置の双方に該当する装置であり得る。視聴覚コントローラ5107は、発信元の装置及び出力先の装置の動作を制御し、発信元の装置から表示情報を取得するとともに、当該表示情報を出力先の装置に送信し、表示又は記録させる機能を有する。なお、表示情報とは、手術中に撮像された各種の画像や、手術に関する各種の情報(例えば、患者の身体情報や、過去の検査結果、術式についての情報等)等である。
具体的には、視聴覚コントローラ5107には、装置群5101から、表示情報として、内視鏡によって撮像された患者の体腔内の術部の画像についての情報が送信され得る。また、シーリングカメラ5187から、表示情報として、当該シーリングカメラ5187によって撮像された術者の手元の画像についての情報が送信され得る。また、術場カメラ5189から、表示情報として、当該術場カメラ5189によって撮像された手術室全体の様子を示す画像についての情報が送信され得る。なお、手術室システム5100に撮像機能を有する他の装置が存在する場合には、視聴覚コントローラ5107は、表示情報として、当該他の装置からも当該他の装置によって撮像された画像についての情報を取得してもよい。
あるいは、例えば、レコーダ5105には、過去に撮像されたこれらの画像についての情報が視聴覚コントローラ5107によって記録されている。視聴覚コントローラ5107は、表示情報として、レコーダ5105から当該過去に撮像された画像についての情報を取得することができる。なお、レコーダ5105には、手術に関する各種の情報も事前に記録されていてもよい。
視聴覚コントローラ5107は、出力先の装置である表示装置5103A~5103Dの少なくともいずれかに、取得した表示情報(すなわち、手術中に撮影された画像や、手術に関する各種の情報)を表示させる。図示する例では、表示装置5103Aは手術室の天井から吊り下げられて設置される表示装置であり、表示装置5103Bは手術室の壁面に設置される表示装置であり、表示装置5103Cは手術室内の机上に設置される表示装置であり、表示装置5103Dは表示機能を有するモバイル機器(例えば、タブレットPC(Personal Computer))である。
また、図15では図示を省略しているが、手術室システム5100には、手術室の外部の装置が含まれてもよい。手術室の外部の装置は、例えば、病院内外に構築されたネットワークに接続されるサーバや、医療スタッフが用いるPC、病院の会議室に設置されるプロジェクタ等であり得る。このような外部装置が病院外にある場合には、視聴覚コントローラ5107は、遠隔医療のために、テレビ会議システム等を介して、他の病院の表示装置に表示情報を表示させることもできる。
手術室制御装置5109は、非医療機器における画像表示に関する処理以外の処理を、統括的に制御する。例えば、手術室制御装置5109は、患者ベッド5183、シーリングカメラ5187、術場カメラ5189及び照明5191の駆動を制御する。
手術室システム5100には、集中操作パネル5111が設けられており、ユーザは、当該集中操作パネル5111を介して、視聴覚コントローラ5107に対して画像表示についての指示を与えたり、手術室制御装置5109に対して非医療機器の動作についての指示を与えることができる。集中操作パネル5111は、表示装置の表示面上にタッチパネルが設けられて構成される。
図16は、集中操作パネル5111における操作画面の表示例を示す図である。図16では、一例として、手術室システム5100に、出力先の装置として、2つの表示装置が設けられている場合に対応する操作画面を示している。図16を参照すると、操作画面5193には、発信元選択領域5195と、プレビュー領域5197と、コントロール領域5201と、が設けられる。
発信元選択領域5195には、手術室システム5100に備えられる発信元装置と、当該発信元装置が有する表示情報を表すサムネイル画面と、が紐付けられて表示される。ユーザは、表示装置に表示させたい表示情報を、発信元選択領域5195に表示されているいずれかの発信元装置から選択することができる。
プレビュー領域5197には、出力先の装置である2つの表示装置(Monitor1、Monitor2)に表示される画面のプレビューが表示される。図示する例では、1つの表示装置において4つの画像がPinP表示されている。当該4つの画像は、発信元選択領域5195において選択された発信元装置から発信された表示情報に対応するものである。4つの画像のうち、1つはメイン画像として比較的大きく表示され、残りの3つはサブ画像として比較的小さく表示される。ユーザは、4つの画像が表示された領域を適宜選択することにより、メイン画像とサブ画像を入れ替えることができる。また、4つの画像が表示される領域の下部には、ステータス表示領域5199が設けられており、当該領域に手術に関するステータス(例えば、手術の経過時間や、患者の身体情報等)が適宜表示され得る。
コントロール領域5201には、発信元の装置に対して操作を行うためのGUI(Graphical User Interface)部品が表示される発信元操作領域5203と、出力先の装置に対して操作を行うためのGUI部品が表示される出力先操作領域5205と、が設けられる。図示する例では、発信元操作領域5203には、撮像機能を有する発信元の装置におけるカメラに対して各種の操作(パン、チルト及びズーム)を行うためのGUI部品が設けられている。ユーザは、これらのGUI部品を適宜選択することにより、発信元の装置におけるカメラの動作を操作することができる。なお、図示は省略しているが、発信元選択領域5195において選択されている発信元の装置がレコーダである場合(すなわち、プレビュー領域5197において、レコーダに過去に記録された画像が表示されている場合)には、発信元操作領域5203には、当該画像の再生、再生停止、巻き戻し、早送り等の操作を行うためのGUI部品が設けられ得る。
また、出力先操作領域5205には、出力先の装置である表示装置における表示に対する各種の操作(スワップ、フリップ、色調整、コントラスト調整、2D表示と3D表示の切り替え)を行うためのGUI部品が設けられている。ユーザは、これらのGUI部品を適宜選択することにより、表示装置における表示を操作することができる。
なお、集中操作パネル5111に表示される操作画面は図示する例に限定されず、ユーザは、集中操作パネル5111を介して、手術室システム5100に備えられる、視聴覚コントローラ5107及び手術室制御装置5109によって制御され得る各装置に対する操作入力が可能であってよい。
図17は、以上説明した手術室システムが適用された手術の様子の一例を示す図である。シーリングカメラ5187及び術場カメラ5189は、手術室の天井に設けられ、患者ベッド5183上の患者5185の患部に対して処置を行う術者(医者)5181の手元及び手術室全体の様子を撮影可能である。シーリングカメラ5187及び術場カメラ5189には、倍率調整機能、焦点距離調整機能、撮影方向調整機能等が設けられ得る。照明5191は、手術室の天井に設けられ、少なくとも術者5181の手元を照射する。照明5191は、その照射光量、照射光の波長(色)及び光の照射方向等を適宜調整可能であってよい。
内視鏡手術システム5113、患者ベッド5183、シーリングカメラ5187、術場カメラ5189及び照明5191は、図15に示すように、視聴覚コントローラ5107及び手術室制御装置5109(図17では図示せず)を介して互いに連携可能に接続されている。手術室内には、集中操作パネル5111が設けられており、上述したように、ユーザは、当該集中操作パネル5111を介して、手術室内に存在するこれらの装置を適宜操作することが可能である。
以下、内視鏡手術システム5113の構成について詳細に説明する。図示するように、内視鏡手術システム5113は、内視鏡5115と、その他の術具5131と、内視鏡5115を支持する支持アーム装置5141と、内視鏡下手術のための各種の装置が搭載されたカート5151と、から構成される。
内視鏡手術では、腹壁を切って開腹する代わりに、トロッカ5139a~5139dと呼ばれる筒状の開孔器具が腹壁に複数穿刺される。そして、トロッカ5139a~5139dから、内視鏡5115の鏡筒5117や、その他の術具5131が患者5185の体腔内に挿入される。図示する例では、その他の術具5131として、気腹チューブ5133、エネルギー処置具5135及び鉗子5137が、患者5185の体腔内に挿入されている。また、エネルギー処置具5135は、高周波電流や超音波振動により、組織の切開及び剥離、又は血管の封止等を行う処置具である。ただし、図示する術具5131はあくまで一例であり、術具5131としては、例えば攝子、レトラクタ等、一般的に内視鏡下手術において用いられる各種の術具が用いられてよい。
内視鏡5115によって撮影された患者5185の体腔内の術部の画像が、表示装置5155に表示される。術者5181は、表示装置5155に表示された術部の画像をリアルタイムで見ながら、エネルギー処置具5135や鉗子5137を用いて、例えば患部を切除する等の処置を行う。なお、図示は省略しているが、気腹チューブ5133、エネルギー処置具5135及び鉗子5137は、手術中に、術者5181又は助手等によって支持される。
(支持アーム装置)
支持アーム装置5141は、ベース部5143から延伸するアーム部5145を備える。図示する例では、アーム部5145は、関節部5147a、5147b、5147c、及びリンク5149a、5149bから構成されており、アーム制御装置5159からの制御により駆動される。アーム部5145によって内視鏡5115が支持され、その位置及び姿勢が制御される。これにより、内視鏡5115の安定的な位置の固定が実現され得る。
支持アーム装置5141は、ベース部5143から延伸するアーム部5145を備える。図示する例では、アーム部5145は、関節部5147a、5147b、5147c、及びリンク5149a、5149bから構成されており、アーム制御装置5159からの制御により駆動される。アーム部5145によって内視鏡5115が支持され、その位置及び姿勢が制御される。これにより、内視鏡5115の安定的な位置の固定が実現され得る。
(内視鏡)
内視鏡5115は、先端から所定の長さの領域が患者5185の体腔内に挿入される鏡筒5117と、鏡筒5117の基端に接続されるカメラヘッド5119と、から構成される。図示する例では、硬性の鏡筒5117を有するいわゆる硬性鏡として構成される内視鏡5115を図示しているが、内視鏡5115は、軟性の鏡筒5117を有するいわゆる軟性鏡として構成されてもよい。
内視鏡5115は、先端から所定の長さの領域が患者5185の体腔内に挿入される鏡筒5117と、鏡筒5117の基端に接続されるカメラヘッド5119と、から構成される。図示する例では、硬性の鏡筒5117を有するいわゆる硬性鏡として構成される内視鏡5115を図示しているが、内視鏡5115は、軟性の鏡筒5117を有するいわゆる軟性鏡として構成されてもよい。
鏡筒5117の先端には、対物レンズが嵌め込まれた開口部が設けられている。内視鏡5115には光源装置5157が接続されており、当該光源装置5157によって生成された光が、鏡筒5117の内部に延設されるライトガイドによって当該鏡筒の先端まで導光され、対物レンズを介して患者5185の体腔内の観察対象に向かって照射される。なお、内視鏡5115は、直視鏡であってもよいし、斜視鏡又は側視鏡であってもよい。
カメラヘッド5119の内部には光学系及び撮像素子が設けられており、観察対象からの反射光(観察光)は当該光学系によって当該撮像素子に集光される。当該撮像素子によって観察光が光電変換され、観察光に対応する電気信号、すなわち観察像に対応する画像信号が生成される。当該画像信号は、RAWデータとしてカメラコントロールユニット(CCU:Camera Control Unit)5153に送信される。なお、カメラヘッド5119には、その光学系を適宜駆動させることにより、倍率及び焦点距離を調整する機能が搭載される。
なお、例えば立体視(3D表示)等に対応するために、カメラヘッド5119には撮像素子が複数設けられてもよい。この場合、鏡筒5117の内部には、当該複数の撮像素子のそれぞれに観察光を導光するために、リレー光学系が複数系統設けられる。
(カートに搭載される各種の装置)
CCU5153は、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)等によって構成され、内視鏡5115及び表示装置5155の動作を統括的に制御する。具体的には、CCU5153は、カメラヘッド5119から受け取った画像信号に対して、例えば現像処理(デモザイク処理)等の、当該画像信号に基づく画像を表示するための各種の画像処理を施す。CCU5153は、当該画像処理を施した画像信号を表示装置5155に提供する。また、CCU5153には、図15に示す視聴覚コントローラ5107が接続される。CCU5153は、画像処理を施した画像信号を視聴覚コントローラ5107にも提供する。また、CCU5153は、カメラヘッド5119に対して制御信号を送信し、その駆動を制御する。当該制御信号には、倍率や焦点距離等、撮像条件に関する情報が含まれ得る。当該撮像条件に関する情報は、入力装置5161を介して入力されてもよいし、上述した集中操作パネル5111を介して入力されてもよい。
CCU5153は、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)等によって構成され、内視鏡5115及び表示装置5155の動作を統括的に制御する。具体的には、CCU5153は、カメラヘッド5119から受け取った画像信号に対して、例えば現像処理(デモザイク処理)等の、当該画像信号に基づく画像を表示するための各種の画像処理を施す。CCU5153は、当該画像処理を施した画像信号を表示装置5155に提供する。また、CCU5153には、図15に示す視聴覚コントローラ5107が接続される。CCU5153は、画像処理を施した画像信号を視聴覚コントローラ5107にも提供する。また、CCU5153は、カメラヘッド5119に対して制御信号を送信し、その駆動を制御する。当該制御信号には、倍率や焦点距離等、撮像条件に関する情報が含まれ得る。当該撮像条件に関する情報は、入力装置5161を介して入力されてもよいし、上述した集中操作パネル5111を介して入力されてもよい。
表示装置5155は、CCU5153からの制御により、当該CCU5153によって画像処理が施された画像信号に基づく画像を表示する。内視鏡5115が例えば4K(水平画素数3840×垂直画素数2160)又は8K(水平画素数7680×垂直画素数4320)等の高解像度の撮影に対応したものである場合、及び/又は3D表示に対応したものである場合には、表示装置5155としては、それぞれに対応して、高解像度の表示が可能なもの、及び/又は3D表示可能なものが用いられ得る。4K又は8K等の高解像度の撮影に対応したものである場合、表示装置5155として55インチ以上のサイズのものを用いることで一層の没入感が得られる。また、用途に応じて、解像度、サイズが異なる複数の表示装置5155が設けられてもよい。
光源装置5157は、例えばLED(light emitting diode)等の光源から構成され、術部を撮影する際の照射光を内視鏡5115に供給する。
アーム制御装置5159は、例えばCPU等のプロセッサによって構成され、所定のプログラムに従って動作することにより、所定の制御方式に従って支持アーム装置5141のアーム部5145の駆動を制御する。
入力装置5161は、内視鏡手術システム5113に対する入力インタフェースである。ユーザは、入力装置5161を介して、内視鏡手術システム5113に対して各種の情報の入力や指示入力を行うことができる。例えば、ユーザは、入力装置5161を介して、患者の身体情報や、手術の術式についての情報等、手術に関する各種の情報を入力する。また、例えば、ユーザは、入力装置5161を介して、アーム部5145を駆動させる旨の指示や、内視鏡5115による撮像条件(照射光の種類、倍率及び焦点距離等)を変更する旨の指示、エネルギー処置具5135を駆動させる旨の指示等を入力する。
入力装置5161の種類は限定されず、入力装置5161は各種の公知の入力装置であってよい。入力装置5161としては、例えば、マウス、キーボード、タッチパネル、スイッチ、フットスイッチ5171及び/又はレバー等が適用され得る。入力装置5161としてタッチパネルが用いられる場合には、当該タッチパネルは表示装置5155の表示面上に設けられてもよい。
あるいは、入力装置5161は、例えばメガネ型のウェアラブルデバイスやHMD(Head Mounted Display)等の、ユーザによって装着されるデバイスであり、これらのデバイスによって検出されるユーザのジェスチャや視線に応じて各種の入力が行われる。また、入力装置5161は、ユーザの動きを検出可能なカメラを含み、当該カメラによって撮像された映像から検出されるユーザのジェスチャや視線に応じて各種の入力が行われる。更に、入力装置5161は、ユーザの声を収音可能なマイクロフォンを含み、当該マイクロフォンを介して音声によって各種の入力が行われる。このように、入力装置5161が非接触で各種の情報を入力可能に構成されることにより、特に清潔域に属するユーザ(例えば術者5181)が、不潔域に属する機器を非接触で操作することが可能となる。また、ユーザは、所持している術具から手を離すことなく機器を操作することが可能となるため、ユーザの利便性が向上する。
処置具制御装置5163は、組織の焼灼、切開又は血管の封止等のためのエネルギー処置具5135の駆動を制御する。気腹装置5165は、内視鏡5115による視野の確保及び術者の作業空間の確保の目的で、患者5185の体腔を膨らめるために、気腹チューブ5133を介して当該体腔内にガスを送り込む。レコーダ5167は、手術に関する各種の情報を記録可能な装置である。プリンタ5169は、手術に関する各種の情報を、テキスト、画像又はグラフ等各種の形式で印刷可能な装置である。
以下、内視鏡手術システム5113において特に特徴的な構成について、更に詳細に説明する。
(支持アーム装置)
支持アーム装置5141は、基台であるベース部5143と、ベース部5143から延伸するアーム部5145と、を備える。図示する例では、アーム部5145は、複数の関節部5147a、5147b、5147cと、関節部5147bによって連結される複数のリンク5149a、5149bと、から構成されているが、図17では、簡単のため、アーム部5145の構成を簡略化して図示している。実際には、アーム部5145が所望の自由度を有するように、関節部5147a~5147c及びリンク5149a、5149bの形状、数及び配置、並びに関節部5147a~5147cの回転軸の方向等が適宜設定され得る。例えば、アーム部5145は、好適に、6自由度以上の自由度を有するように構成され得る。これにより、アーム部5145の可動範囲内において内視鏡5115を自由に移動させることが可能になるため、所望の方向から内視鏡5115の鏡筒5117を患者5185の体腔内に挿入することが可能になる。
支持アーム装置5141は、基台であるベース部5143と、ベース部5143から延伸するアーム部5145と、を備える。図示する例では、アーム部5145は、複数の関節部5147a、5147b、5147cと、関節部5147bによって連結される複数のリンク5149a、5149bと、から構成されているが、図17では、簡単のため、アーム部5145の構成を簡略化して図示している。実際には、アーム部5145が所望の自由度を有するように、関節部5147a~5147c及びリンク5149a、5149bの形状、数及び配置、並びに関節部5147a~5147cの回転軸の方向等が適宜設定され得る。例えば、アーム部5145は、好適に、6自由度以上の自由度を有するように構成され得る。これにより、アーム部5145の可動範囲内において内視鏡5115を自由に移動させることが可能になるため、所望の方向から内視鏡5115の鏡筒5117を患者5185の体腔内に挿入することが可能になる。
関節部5147a~5147cにはアクチュエータが設けられており、関節部5147a~5147cは当該アクチュエータの駆動により所定の回転軸まわりに回転可能に構成されている。当該アクチュエータの駆動がアーム制御装置5159によって制御されることにより、各関節部5147a~5147cの回転角度が制御され、アーム部5145の駆動が制御される。これにより、内視鏡5115の位置及び姿勢の制御が実現され得る。この際、アーム制御装置5159は、力制御又は位置制御等、各種の公知の制御方式によってアーム部5145の駆動を制御することができる。
例えば、術者5181が、入力装置5161(フットスイッチ5171を含む)を介して適宜操作入力を行うことにより、当該操作入力に応じてアーム制御装置5159によってアーム部5145の駆動が適宜制御され、内視鏡5115の位置及び姿勢が制御されてよい。当該制御により、アーム部5145の先端の内視鏡5115を任意の位置から任意の位置まで移動させた後、その移動後の位置で固定的に支持することができる。なお、アーム部5145は、いわゆるマスタースレイブ方式で操作されてもよい。この場合、アーム部5145は、手術室から離れた場所に設置される入力装置5161を介してユーザによって遠隔操作され得る。
また、力制御が適用される場合には、アーム制御装置5159は、ユーザからの外力を受け、その外力にならってスムーズにアーム部5145が移動するように、各関節部5147a~5147cのアクチュエータを駆動させる、いわゆるパワーアシスト制御を行ってもよい。これにより、ユーザが直接アーム部5145に触れながらアーム部5145を移動させる際に、比較的軽い力で当該アーム部5145を移動させることができる。従って、より直感的に、より簡易な操作で内視鏡5115を移動させることが可能となり、ユーザの利便性を向上させることができる。
ここで、一般的に、内視鏡下手術では、スコピストと呼ばれる医師によって内視鏡5115が支持されていた。これに対して、支持アーム装置5141を用いることにより、人手によらずに内視鏡5115の位置をより確実に固定することが可能になるため、術部の画像を安定的に得ることができ、手術を円滑に行うことが可能になる。
なお、アーム制御装置5159は必ずしもカート5151に設けられなくてもよい。また、アーム制御装置5159は必ずしも1つの装置でなくてもよい。例えば、アーム制御装置5159は、支持アーム装置5141のアーム部5145の各関節部5147a~5147cにそれぞれ設けられてもよく、複数のアーム制御装置5159が互いに協働することにより、アーム部5145の駆動制御が実現されてもよい。
(光源装置)
光源装置5157は、内視鏡5115に術部を撮影する際の照射光を供給する。光源装置5157は、例えばLED、レーザ光源又はこれらの組み合わせによって構成される白色光源から構成される。このとき、RGBレーザ光源の組み合わせにより白色光源が構成される場合には、各色(各波長)の出力強度及び出力タイミングを高精度に制御することができるため、光源装置5157において撮像画像のホワイトバランスの調整を行うことができる。また、この場合には、RGBレーザ光源それぞれからのレーザ光を時分割で観察対象に照射し、その照射タイミングに同期してカメラヘッド5119の撮像素子の駆動を制御することにより、RGBそれぞれに対応した画像を時分割で撮像することも可能である。当該方法によれば、当該撮像素子にカラーフィルタを設けなくても、カラー画像を得ることができる。
光源装置5157は、内視鏡5115に術部を撮影する際の照射光を供給する。光源装置5157は、例えばLED、レーザ光源又はこれらの組み合わせによって構成される白色光源から構成される。このとき、RGBレーザ光源の組み合わせにより白色光源が構成される場合には、各色(各波長)の出力強度及び出力タイミングを高精度に制御することができるため、光源装置5157において撮像画像のホワイトバランスの調整を行うことができる。また、この場合には、RGBレーザ光源それぞれからのレーザ光を時分割で観察対象に照射し、その照射タイミングに同期してカメラヘッド5119の撮像素子の駆動を制御することにより、RGBそれぞれに対応した画像を時分割で撮像することも可能である。当該方法によれば、当該撮像素子にカラーフィルタを設けなくても、カラー画像を得ることができる。
また、光源装置5157は、出力する光の強度を所定の時間ごとに変更するようにその駆動が制御されてもよい。その光の強度の変更のタイミングに同期してカメラヘッド5119の撮像素子の駆動を制御して時分割で画像を取得し、その画像を合成することにより、いわゆる黒つぶれ及び白とびのない高ダイナミックレンジの画像を生成することができる。
また、光源装置5157は、特殊光観察に対応した所定の波長帯域の光を供給可能に構成されてもよい。特殊光観察では、例えば、体組織における光の吸収の波長依存性を利用して、通常の観察時における照射光(すなわち、白色光)に比べて狭帯域の光を照射することにより、粘膜表層の血管等の所定の組織を高コントラストで撮影する、いわゆる狭帯域光観察(Narrow Band Imaging)が行われる。あるいは、特殊光観察では、励起光を照射することにより発生する蛍光により画像を得る蛍光観察が行われてもよい。蛍光観察では、体組織に励起光を照射し当該体組織からの蛍光を観察するもの(自家蛍光観察)、又はインドシアニングリーン(ICG)等の試薬を体組織に局注するとともに当該体組織にその試薬の蛍光波長に対応した励起光を照射し蛍光像を得るもの等が行われ得る。光源装置5157は、このような特殊光観察に対応した狭帯域光及び/又は励起光を供給可能に構成され得る。
(カメラヘッド及びCCU)
図18を参照して、内視鏡5115のカメラヘッド5119及びCCU5153の機能についてより詳細に説明する。図18は、図17に示すカメラヘッド5119及びCCU5153の機能構成の一例を示すブロック図である。
図18を参照して、内視鏡5115のカメラヘッド5119及びCCU5153の機能についてより詳細に説明する。図18は、図17に示すカメラヘッド5119及びCCU5153の機能構成の一例を示すブロック図である。
図18を参照すると、カメラヘッド5119は、その機能として、レンズユニット5121と、撮像部5123と、駆動部5125と、通信部5127と、カメラヘッド制御部5129と、を有する。また、CCU5153は、その機能として、通信部5173と、画像処理部5175と、制御部5177と、を有する。カメラヘッド5119とCCU5153とは、伝送ケーブル5179によって双方向に通信可能に接続されている。
まず、カメラヘッド5119の機能構成について説明する。レンズユニット5121は、鏡筒5117との接続部に設けられる光学系である。鏡筒5117の先端から取り込まれた観察光は、カメラヘッド5119まで導光され、当該レンズユニット5121に入射する。レンズユニット5121は、ズームレンズ及びフォーカスレンズを含む複数のレンズが組み合わされて構成される。レンズユニット5121は、撮像部5123の撮像素子の受光面上に観察光を集光するように、その光学特性が調整されている。また、ズームレンズ及びフォーカスレンズは、撮像画像の倍率及び焦点の調整のため、その光軸上の位置が移動可能に構成される。
撮像部5123は撮像素子によって構成され、レンズユニット5121の後段に配置される。レンズユニット5121を通過した観察光は、当該撮像素子の受光面に集光され、光電変換によって、観察像に対応した画像信号が生成される。撮像部5123によって生成された画像信号は、通信部5127に提供される。
撮像部5123を構成する撮像素子としては、例えばCMOS(Complementary Metal Oxide Semiconductor)タイプのイメージセンサであり、Bayer配列を有するカラー撮影可能なものが用いられる。なお、当該撮像素子としては、例えば4K以上の高解像度の画像の撮影に対応可能なものが用いられてもよい。術部の画像が高解像度で得られることにより、術者5181は、当該術部の様子をより詳細に把握することができ、手術をより円滑に進行することが可能となる。
また、撮像部5123を構成する撮像素子は、3D表示に対応する右目用及び左目用の画像信号をそれぞれ取得するための1対の撮像素子を有するように構成される。3D表示が行われることにより、術者5181は術部における生体組織の奥行きをより正確に把握することが可能になる。なお、撮像部5123が多板式で構成される場合には、各撮像素子に対応して、レンズユニット5121も複数系統設けられる。
また、撮像部5123は、必ずしもカメラヘッド5119に設けられなくてもよい。例えば、撮像部5123は、鏡筒5117の内部に、対物レンズの直後に設けられてもよい。
駆動部5125は、アクチュエータによって構成され、カメラヘッド制御部5129からの制御により、レンズユニット5121のズームレンズ及びフォーカスレンズを光軸に沿って所定の距離だけ移動させる。これにより、撮像部5123による撮像画像の倍率及び焦点が適宜調整され得る。
通信部5127は、CCU5153との間で各種の情報を送受信するための通信装置によって構成される。通信部5127は、撮像部5123から得た画像信号をRAWデータとして伝送ケーブル5179を介してCCU5153に送信する。この際、術部の撮像画像を低レイテンシで表示するために、当該画像信号は光通信によって送信されることが好ましい。手術の際には、術者5181が撮像画像によって患部の状態を観察しながら手術を行うため、より安全で確実な手術のためには、術部の動画像が可能な限りリアルタイムに表示されることが求められるからである。光通信が行われる場合には、通信部5127には、電気信号を光信号に変換する光電変換モジュールが設けられる。画像信号は当該光電変換モジュールによって光信号に変換された後、伝送ケーブル5179を介してCCU5153に送信される。
また、通信部5127は、CCU5153から、カメラヘッド5119の駆動を制御するための制御信号を受信する。当該制御信号には、例えば、撮像画像のフレームレートを指定する旨の情報、撮像時の露出値を指定する旨の情報、並びに/又は撮像画像の倍率及び焦点を指定する旨の情報等、撮像条件に関する情報が含まれる。通信部5127は、受信した制御信号をカメラヘッド制御部5129に提供する。なお、CCU5153からの制御信号も、光通信によって伝送されてもよい。この場合、通信部5127には、光信号を電気信号に変換する光電変換モジュールが設けられ、制御信号は当該光電変換モジュールによって電気信号に変換された後、カメラヘッド制御部5129に提供される。
なお、上記のフレームレートや露出値、倍率、焦点等の撮像条件は、取得された画像信号に基づいてCCU5153の制御部5177によって自動的に設定される。つまり、いわゆるAE(Auto Exposure)機能、AF(Auto Focus)機能及びAWB(Auto White Balance)機能が内視鏡5115に搭載される。
カメラヘッド制御部5129は、通信部5127を介して受信したCCU5153からの制御信号に基づいて、カメラヘッド5119の駆動を制御する。例えば、カメラヘッド制御部5129は、撮像画像のフレームレートを指定する旨の情報及び/又は撮像時の露光を指定する旨の情報に基づいて、撮像部5123の撮像素子の駆動を制御する。また、例えば、カメラヘッド制御部5129は、撮像画像の倍率及び焦点を指定する旨の情報に基づいて、駆動部5125を介してレンズユニット5121のズームレンズ及びフォーカスレンズを適宜移動させる。カメラヘッド制御部5129は、更に、鏡筒5117やカメラヘッド5119を識別するための情報を記憶する機能を備えてもよい。
なお、レンズユニット5121や撮像部5123等の構成を、気密性及び防水性が高い密閉構造内に配置することで、カメラヘッド5119について、オートクレーブ滅菌処理に対する耐性を持たせることができる。
次に、CCU5153の機能構成について説明する。通信部5173は、カメラヘッド5119との間で各種の情報を送受信するための通信装置によって構成される。通信部5173は、カメラヘッド5119から、伝送ケーブル5179を介して送信される画像信号を受信する。この際、上記のように、当該画像信号は好適に光通信によって送信され得る。この場合、光通信に対応して、通信部5173には、光信号を電気信号に変換する光電変換モジュールが設けられる。通信部5173は、電気信号に変換した画像信号を画像処理部5175に提供する。
また、通信部5173は、カメラヘッド5119に対して、カメラヘッド5119の駆動を制御するための制御信号を送信する。当該制御信号も光通信によって送信されてよい。
画像処理部5175は、カメラヘッド5119から送信されたRAWデータである画像信号に対して各種の画像処理を施す。当該画像処理としては、例えば現像処理、高画質化処理(帯域強調処理、超解像処理、NR(Noise reduction)処理及び/又は手ブレ補正処理等)、並びに/又は拡大処理(電子ズーム処理)等、各種の公知の信号処理が含まれる。また、画像処理部5175は、AE、AF及びAWBを行うための、画像信号に対する検波処理を行う。
画像処理部5175は、CPUやGPU等のプロセッサによって構成され、当該プロセッサが所定のプログラムに従って動作することにより、上述した画像処理や検波処理が行われ得る。なお、画像処理部5175が複数のGPUによって構成される場合には、画像処理部5175は、画像信号に係る情報を適宜分割し、これら複数のGPUによって並列的に画像処理を行う。
制御部5177は、内視鏡5115による術部の撮像、及びその撮像画像の表示に関する各種の制御を行う。例えば、制御部5177は、カメラヘッド5119の駆動を制御するための制御信号を生成する。この際、撮像条件がユーザによって入力されている場合には、制御部5177は、当該ユーザによる入力に基づいて制御信号を生成する。あるいは、内視鏡5115にAE機能、AF機能及びAWB機能が搭載されている場合には、制御部5177は、画像処理部5175による検波処理の結果に応じて、最適な露出値、焦点距離及びホワイトバランスを適宜算出し、制御信号を生成する。
また、制御部5177は、画像処理部5175によって画像処理が施された画像信号に基づいて、術部の画像を表示装置5155に表示させる。この際、制御部5177は、各種の画像認識技術を用いて術部画像内における各種の物体を認識する。例えば、制御部5177は、術部画像に含まれる物体のエッジの形状や色等を検出することにより、鉗子等の術具、特定の生体部位、出血、エネルギー処置具5135使用時のミスト等を認識することができる。制御部5177は、表示装置5155に術部の画像を表示させる際に、その認識結果を用いて、各種の手術支援情報を当該術部の画像に重畳表示させる。手術支援情報が重畳表示され、術者5181に提示されることにより、より安全かつ確実に手術を進めることが可能になる。
カメラヘッド5119及びCCU5153を接続する伝送ケーブル5179は、電気信号の通信に対応した電気信号ケーブル、光通信に対応した光ファイバ、又はこれらの複合ケーブルである。
ここで、図示する例では、伝送ケーブル5179を用いて有線で通信が行われていたが、カメラヘッド5119とCCU5153との間の通信は無線で行われてもよい。両者の間の通信が無線で行われる場合には、伝送ケーブル5179を手術室内に敷設する必要がなくなるため、手術室内における医療スタッフの移動が当該伝送ケーブル5179によって妨げられる事態が解消され得る。
以上、本開示に係る技術が適用され得る手術室システム5100の一例について説明した。なお、ここでは、一例として手術室システム5100が適用される医療用システムが内視鏡手術システム5113である場合について説明したが、手術室システム5100の構成はかかる例に限定されない。例えば、手術室システム5100は、内視鏡手術システム5113に代えて、検査用軟性内視鏡システムや顕微鏡手術システムに適用されてもよい。
本開示に係る技術は、以上説明した構成のうち、映像を生成する構成、例えば視聴覚コントローラ5107に好適に適用され得る。視聴覚コントローラ5107に本開示に係る技術を適用することにより、表示装置5103Bを医師が見ながら行う医療手術において、医師の視点位置に応じた適切な立体画像を生成することができる。
1・・・情報処理装置、11・・・イメージセンサ、12・・・顔検出部、13・・・重心算出部、14・・・補正部、15・・・移動量算出部、16・・・加算部、21・・・空間視点座標取得部、22・・・視差画像取得部、23・・・視差画像表示部、51・・・加速度検出部、52・・・座標比率決定部、61・・・測距部、62・・・切替部
Claims (16)
- 撮像画像に基づいて顔検出を行い、顔検出結果に基づいて、顔枠情報及び視点位置情報を含む顔検出情報を取得する取得部と、
前記顔枠情報により示される顔枠内における基準点を算出する基準点算出部と、
前記基準点の移動量に応じて前記視点位置情報を補正する補正部と
を有する情報処理装置。 - 前記補正部は、前記顔検出情報を取得するまでに要する期間の間、前記基準点の移動量を蓄積し、蓄積した基準点の移動量に応じて、前記視点位置情報を補正する
請求項1に記載の情報処理装置。 - 前記補正部は、第1の顔検出情報を取得してから、当該第1の顔検出情報の次の顔検出情報である第2の顔検出情報を取得するまでに要する期間の間、前記基準点の移動量を蓄積し、蓄積した前記基準点の移動量に応じて、前記第1の顔検出情報に含まれる視点位置情報を補正する
請求項1に記載の情報処理装置。 - 前記補正部は、フレーム間における前記基準点の移動量を蓄積する
請求項2に記載の情報処理装置。 - 前記基準点算出部は、前記基準点として、前記顔枠内における所定の色成分の領域内に存在する重心点を算出する
請求項1に記載の情報処理装置。 - 前記所定の色成分は、肌色成分である
請求項5に記載の情報処理装置。 - 前記補正部は、前記基準点の移動量に応じた重み付けを設定し、前記顔検出情報に含まれる前記視点位置情報と、前記基準点の位置情報とを、前記設定した重み付けを使用して重み付け加算する
請求項1に記載の情報処理装置。 - 顔検出の対象であるユーザまでの距離を計測する測距部を有し、
前記測距部の測距結果に応じて、前記取得部により生成された視点位置情報及び前記補正部により補正された視点位置情報の何れかを選択的に出力するように構成されている
請求項1に記載の情報処理装置。 - 前記測距結果が閾値より小さい場合には、前記補正部により補正された視点位置情報が出力され、
前記測距結果が前記閾値より大きい場合には、前記取得部により生成された視点位置情報が出力されるように構成されている
請求項8に記載の情報処理装置。 - 前記撮像画像を取得する撮像部を有する
請求項1に記載の情報処理装置。 - 前記撮像部が前記基準点算出部を有している
請求項10に記載の情報処理装置。 - 前記撮像部は、1000fps以上の撮像が可能とされている
請求項10に記載の情報処理装置。 - 前記補正部により補正された視点位置を使用して立体画像を生成する立体画像取得部を有する
請求項1に記載の情報処理装置。 - 前記立体画像が表示されるディスプレイを有する
請求項13に記載の情報処理装置。 - 取得部が、撮像画像に基づいて顔検出を行い、顔検出結果に基づいて、顔枠情報及び視点位置情報を含む顔検出情報を取得し、
基準点算出部が、前記顔枠情報により示される顔枠内における基準点を算出し、
補正部が、前記基準点の移動量に応じて前記視点位置情報を補正する
情報処理方法。 - 取得部が、撮像画像に基づいて顔検出を行い、顔検出結果に基づいて、顔枠情報及び視点位置情報を含む顔検出情報を取得し、
基準点算出部が、前記顔枠情報により示される顔枠内における基準点を算出し、
補正部が、前記基準点の移動量に応じて前記視点位置情報を補正する
情報処理方法をコンピュータに実行させるプログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP19859228.9A EP3852052A4 (en) | 2018-09-11 | 2019-07-08 | INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING METHOD AND PROGRAM |
CN201980057867.1A CN112655016A (zh) | 2018-09-11 | 2019-07-08 | 信息处理设备、信息处理方法和程序 |
US17/250,760 US20210321082A1 (en) | 2018-09-11 | 2019-07-08 | Information processing apparatus, information processing method, and program |
JP2020546715A JP7230923B2 (ja) | 2018-09-11 | 2019-07-08 | 情報処理装置、情報処理方法及びプログラム |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018169863 | 2018-09-11 | ||
JP2018-169863 | 2018-09-11 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2020054193A1 true WO2020054193A1 (ja) | 2020-03-19 |
Family
ID=69778580
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2019/026985 WO2020054193A1 (ja) | 2018-09-11 | 2019-07-08 | 情報処理装置、情報処理方法及びプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US20210321082A1 (ja) |
EP (1) | EP3852052A4 (ja) |
JP (1) | JP7230923B2 (ja) |
CN (1) | CN112655016A (ja) |
WO (1) | WO2020054193A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022094223A (ja) * | 2020-12-14 | 2022-06-24 | 京セラ株式会社 | 立体表示用コントローラ |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014195141A (ja) | 2013-03-28 | 2014-10-09 | Japan Display Inc | 表示装置 |
JP2016116221A (ja) * | 2014-12-10 | 2016-06-23 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 3d表示のための装置及び方法 |
JP2017054503A (ja) * | 2015-09-07 | 2017-03-16 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 視点追跡方法及び装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8315443B2 (en) * | 2010-04-22 | 2012-11-20 | Qualcomm Incorporated | Viewpoint detector based on skin color area and face area |
-
2019
- 2019-07-08 CN CN201980057867.1A patent/CN112655016A/zh not_active Withdrawn
- 2019-07-08 US US17/250,760 patent/US20210321082A1/en not_active Abandoned
- 2019-07-08 JP JP2020546715A patent/JP7230923B2/ja active Active
- 2019-07-08 WO PCT/JP2019/026985 patent/WO2020054193A1/ja unknown
- 2019-07-08 EP EP19859228.9A patent/EP3852052A4/en not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014195141A (ja) | 2013-03-28 | 2014-10-09 | Japan Display Inc | 表示装置 |
JP2016116221A (ja) * | 2014-12-10 | 2016-06-23 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 3d表示のための装置及び方法 |
JP2017054503A (ja) * | 2015-09-07 | 2017-03-16 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 視点追跡方法及び装置 |
Non-Patent Citations (2)
Title |
---|
JEAN-YVES BOUGUET: "Microprocessor Research Labs", 2000, INTEL CORPORATION, article "Pyramidal Implementation of the Lucas Kanade Feature Tracker Description of the algorithm" |
See also references of EP3852052A4 |
Also Published As
Publication number | Publication date |
---|---|
CN112655016A (zh) | 2021-04-13 |
EP3852052A4 (en) | 2022-02-09 |
JP7230923B2 (ja) | 2023-03-01 |
EP3852052A1 (en) | 2021-07-21 |
JPWO2020054193A1 (ja) | 2021-08-30 |
US20210321082A1 (en) | 2021-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2903551B1 (en) | Digital system for surgical video capturing and display | |
WO2017145475A1 (ja) | 医療用情報処理装置、情報処理方法、医療用情報処理システム | |
WO2020045015A1 (ja) | 医療システム、情報処理装置及び情報処理方法 | |
WO2018096987A1 (ja) | 情報処理装置および方法、並びにプログラム | |
JP7544034B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
US11403741B2 (en) | Video signal processing apparatus, video signal processing method, and program | |
JP7095693B2 (ja) | 医療用観察システム | |
JP7363767B2 (ja) | 画像処理装置と画像処理方法およびプログラム | |
WO2018221068A1 (ja) | 情報処理装置、情報処理方法および情報処理プログラム | |
US11503980B2 (en) | Surgical system and surgical imaging device | |
US11022859B2 (en) | Light emission control apparatus, light emission control method, light emission apparatus, and imaging apparatus | |
JP7230923B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
US11394942B2 (en) | Video signal processing apparatus, video signal processing method, and image-capturing apparatus | |
JP7092111B2 (ja) | 撮像装置、映像信号処理装置および映像信号処理方法 | |
JP7456385B2 (ja) | 画像処理装置、および画像処理方法、並びにプログラム | |
JP7207296B2 (ja) | 撮像装置とフォーカス制御方法およびフォーカス判定方法 | |
WO2021230001A1 (ja) | 情報処理装置及び情報処理方法 | |
WO2018043205A1 (ja) | 医療用画像処理装置、医療用画像処理方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 19859228 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2020546715 Country of ref document: JP Kind code of ref document: A |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
ENP | Entry into the national phase |
Ref document number: 2019859228 Country of ref document: EP Effective date: 20210412 |