WO2018030168A1 - 画像処理装置および画像処理方法 - Google Patents

画像処理装置および画像処理方法 Download PDF

Info

Publication number
WO2018030168A1
WO2018030168A1 PCT/JP2017/027263 JP2017027263W WO2018030168A1 WO 2018030168 A1 WO2018030168 A1 WO 2018030168A1 JP 2017027263 W JP2017027263 W JP 2017027263W WO 2018030168 A1 WO2018030168 A1 WO 2018030168A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
viewpoint
polygon
quantization
depth
Prior art date
Application number
PCT/JP2017/027263
Other languages
English (en)
French (fr)
Inventor
宏 押領司
Original Assignee
ソニー株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー株式会社 filed Critical ソニー株式会社
Priority to CN201780048142.7A priority Critical patent/CN109564696B/zh
Priority to US16/319,411 priority patent/US11069120B2/en
Priority to JP2018532930A priority patent/JP6743893B2/ja
Publication of WO2018030168A1 publication Critical patent/WO2018030168A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/04Texture mapping
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/08Volume rendering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/529Depth or shape recovery from texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/55Depth or shape recovery from multiple images
    • G06T7/593Depth or shape recovery from multiple images from stereo images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/001Model-based coding, e.g. wire frame
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/111Transformation of image signals corresponding to virtual viewpoints, e.g. spatial image interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/275Image signal generators from 3D object models, e.g. computer-generated stereoscopic image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/90Arrangement of cameras or camera modules, e.g. multiple cameras in TV studios or sports stadiums
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • G06T2207/10021Stereoscopic video; Stereoscopic image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10028Range image; Depth image; 3D point clouds

Definitions

  • the present disclosure relates to an image processing device and an image processing method, and in particular, an image processing device and an image processing capable of expressing a three-dimensional structure of a larger number of regions using a two-view texture image and a depth image. Regarding the method.
  • a technique for expressing the three-dimensional structure of an object mainly, a technique for expressing the object using a polygon (3D mesh) of the object and a texture attached to the polygon, and a perspective projection of the object from a plurality of viewpoints are performed.
  • the former method is a method used in a general CG (Computer Graphics) technology.
  • the latter method (hereinafter referred to as 2D depth method) has high affinity with a captured image that is an image obtained by perspective projection of a subject.
  • a 3D structure of an object is expressed by a 2D depth method
  • data expressing the 3D structure is encoded using an encoding method such as MPEGMMVD (Moving Picture Experts Group phase Multi-view + depth). (For example, refer nonpatent literature 1).
  • the 2D depth method uses a texture image (two-dimensional image) obtained by perspective projection of an object with respect to a plurality of viewpoints, and a depth image corresponding to the texture image, to obtain a 3D object. It is a technique for expressing a dimensional structure. Therefore, the three-dimensional structure of the region where the object is not perspectively projected cannot be expressed.
  • a three-dimensional structure of a larger number of regions can be expressed by increasing the number of perspectives to be perspectively projected and increasing the perspective projection regions.
  • the number of perspectives to be projected in perspective increases, the amount of data necessary for expressing the three-dimensional structure increases.
  • the present disclosure has been made in view of such a situation, and is intended to be able to express a three-dimensional structure of a larger number of regions using a two-viewpoint texture image and a depth image.
  • the image processing apparatus projects the back surface of the polygon on each of two viewpoints facing the center of the polygon onto a projection plane perpendicular to the line-of-sight direction from each viewpoint toward the center of the polygon.
  • An image generation unit that generates a texture image of a predetermined viewpoint using the texture image obtained by the above and a depth image corresponding to the texture image of each viewpoint, and a viewpoint corresponding to the depth image and the two viewpoints. It is an image processing apparatus provided with the quantization part which quantizes the reciprocal number of the distance with the other viewpoint to comprise and the said polygon in each pixel.
  • the image processing method according to the first aspect of the present disclosure corresponds to the image processing apparatus according to the first aspect of the present disclosure.
  • each of two viewpoints opposed to the center of the polygon is obtained by projecting the back surface of the polygon onto a projection plane perpendicular to the line-of-sight direction from each viewpoint toward the center of the polygon.
  • the texture image of a predetermined viewpoint is generated using the texture image to be generated and the depth image corresponding to the texture image of each viewpoint.
  • the depth image quantization method for each viewpoint includes a quantization method for quantizing a reciprocal of a distance between a viewpoint corresponding to the depth image, another viewpoint constituting the two viewpoints, and the polygon at each pixel. Is done.
  • the image processing apparatus projects the back surface of the polygon onto a projection surface perpendicular to the line-of-sight direction from each viewpoint toward the center of the polygon for each of two viewpoints facing the center of the polygon.
  • a texture image generating unit that generates a texture image, a depth image corresponding to the texture image of each viewpoint, a viewpoint corresponding to the depth image, another viewpoint constituting the two viewpoints, and the polygon in each pixel
  • a depth image generation unit that generates a pixel value by using a quantization value quantized by a quantization method that quantizes the reciprocal of the distance.
  • the image processing method according to the second aspect of the present disclosure corresponds to the image processing apparatus according to the second aspect of the present disclosure.
  • the back surface of the polygon is projected onto a projection plane perpendicular to the line-of-sight direction from each viewpoint toward the center of the polygon.
  • An image is generated, and the depth image corresponding to the texture image at each viewpoint quantizes the reciprocal of the distance between the viewpoint corresponding to the depth image, the other viewpoints constituting the two viewpoints, and the polygon at each pixel.
  • the quantization value quantized by the quantization method is generated as a pixel value.
  • image processing apparatuses according to the first aspect and the second aspect of the present disclosure can be realized by causing a computer to execute a program.
  • a program to be executed by a computer is transmitted via a transmission medium or recorded on a recording medium. Can be provided.
  • an image can be generated.
  • an image can be generated using a two-viewpoint texture image and a depth image that represent a three-dimensional structure of a larger number of regions.
  • an image can be generated.
  • it is possible to represent a three-dimensional structure of a larger number of regions using a two-viewpoint texture image and a depth image.
  • FIG. 1 is a block diagram illustrating a configuration example of a first embodiment of a generation apparatus as an image processing apparatus to which the present disclosure is applied.
  • the generation device 12 in FIG. 1 uses the captured images and depth images acquired by the imaging devices 11-1 to 11-N (N is 2 or more) to use the texture image and the depth image of the main subject in the captured image. And a texture image and a depth image of the omnidirectional image are generated.
  • the imaging devices 11-1 to 11-N are arranged around the main subject and include at least a part of the main subject in the imaging range.
  • the photographing devices 11-1 to 11-N are configured by a photographing image camera 21 and a depth image camera 22, respectively.
  • the captured image camera 21 captures a subject, acquires a captured image for each frame, and supplies the captured image to the generation device 12.
  • the depth image camera 22 acquires the position in the depth direction of the subject in each pixel of the captured image in units of frames, generates a depth image having information representing the position as a pixel value, and supplies the generated depth image to the generation device 12.
  • the photographing apparatus 11 when there is no need to particularly distinguish the photographing apparatuses 11-1 to 11-N, they are collectively referred to as the photographing apparatus 11.
  • the generation device 12 includes an area extraction unit 31, a position information generation unit 32, a color information generation unit 33, a polygon generation unit 34, a drawing unit 35, an omnidirectional image generation unit 36, a resolution reduction unit 37, an encoder 38, and a storage unit. 39 and the transmission unit 40.
  • the region extraction unit 31 of the generation device 12 extracts main subject regions from the N captured images and depth images supplied from the N imaging devices 11 and supplies the extracted regions to the position information generation unit 32.
  • the region extraction unit 31 extracts a region other than the main subject region from the N photographed images and the depth image as a background region, and supplies the background region to the omnidirectional image generation unit 36.
  • the position information generation unit 32 generates position information of one or more polygons corresponding to the main subject using the N depth images of the main subject region supplied from the region extraction unit 31.
  • the polygon position information is the three-dimensional coordinates of each vertex of the polygon in the 3D model coordinate system, which is a three-dimensional coordinate system with the center of the main subject as the origin.
  • the position information generation unit 32 supplies the position information of each polygon to the color information generation unit 33 and the polygon generation unit 34.
  • the position information generation unit 32 supplies the N captured images of the main subject area to the color information generation unit 33.
  • the color information generation unit 33 generates color information such as RGB values of the front and back surfaces of each polygon by using the position information of each polygon supplied from the position information generation unit 32 and N photographed images of main subjects. To do. Specifically, the color information generation unit 33 generates color information of the surface of the polygon using the pixel value of the captured image corresponding to each polygon. The color information generation unit 33 also generates the color information of the front surface of each polygon as the color information of the back surface of the polygon. The color information generation unit 33 supplies color information of the front and back surfaces of each polygon to the polygon generation unit 34.
  • the color information on the surface of the polygon describes the three-dimensional coordinates in the 3D model coordinate system of each vertex of the polygon clockwise with the normal vector of the surface as the axis, and color information corresponding to the three-dimensional coordinates. Expressed by writing.
  • the color information on the back side of the polygon is also expressed in the same manner as the color information on the front side.
  • the polygon generation unit 34 generates each polygon based on the position information of each polygon supplied from the position information generation unit 32, and based on the color information on the front and back surfaces of each polygon supplied from the color information generation unit 33. Paste the texture on the front and back of each polygon.
  • the polygon generation unit 34 supplies each rendering unit 35 with each of the textures attached to the front and back surfaces.
  • the drawing unit 35 perspectively projects the back surface of each polygon for each of two predetermined viewpoints facing the origin of the 3D model coordinate system that is the center of one or more polygons of the main subject.
  • a perspective image of two viewpoints is generated by perspective projection on the surface.
  • the drawing unit 35 perspectively projects the back surface of each polygon onto a perspective projection plane that is a normal line passing through the center of the line of sight direction from each viewpoint toward the origin.
  • a two-view texture image is generated.
  • the “opposing position” includes not only the opposing position itself but also the vicinity of the opposing position within the range where the technical effect of the present disclosure is achieved.
  • the “normal line” includes not only the normal line itself but also a line whose angle to the surface is near the vertical.
  • the drawing unit 35 generates depth images corresponding to the texture images of the two viewpoints based on the polygons using the first to third quantization methods.
  • the drawing unit 35 supplies the encoder 38 with the two-view texture image and the depth image generated by the first to third quantization methods.
  • the omnidirectional image generation unit 36 perspectively projects the N captured images of the background region supplied from the region extraction unit 31 onto a regular octahedron centered on the origin of the 3D model coordinate system.
  • a texture image of a celestial sphere image of 180 degrees around the angle and the vertical direction is generated. Note that the omnidirectional image is not an image of the entire space of the sphere having 360 degrees in the horizontal direction and 180 degrees in the vertical direction, but may be a partial space image if the technical effect of the present disclosure is achieved.
  • the omnidirectional image generation unit 36 generates a depth image of the omnidirectional image by perspectively projecting the N depth images of the background region supplied from the region extraction unit 31 onto a regular octahedron in the same manner as the captured image. To do.
  • the omnidirectional image generation unit 36 supplies the texture image and depth image of the omnidirectional image to the resolution reduction unit 37.
  • the resolution reduction unit 37 lowers the resolution of the texture image and the depth image of the omnidirectional image supplied from the omnidirectional image generation unit 36 and supplies them to the encoder 38.
  • the encoder 38 encodes the texture image of the two viewpoints supplied from the drawing unit 35 and the depth image generated by the first to third quantization methods, and the omnidirectional image supplied from the resolution reduction unit 37 is encoded. Encode texture and depth images.
  • an encoding method for these encodings an AVC (Advanced Video Coding) method, HEVC method, MVD method, or the like can be used.
  • the AVC method is used.
  • the encoder 38 encodes a texture image encoded stream of each viewpoint (hereinafter referred to as “viewpoint texture stream”) and a depth image encoded stream generated by each quantization method (hereinafter referred to as “viewpoint depth stream”). Is generated. Further, the encoder 38 encodes a texture image encoded stream (hereinafter referred to as an omnidirectional texture stream) and a depth image encoded stream (hereinafter referred to as an omnidirectional depth). A stream). The encoder 38 supplies the viewpoint texture stream of two viewpoints, the viewpoint depth streams of the first to third quantization methods, and the omnidirectional texture stream and omnidirectional depth stream to the storage unit 39.
  • the storage unit 39 stores the viewpoint texture streams of the two viewpoints supplied from the encoder 38, the viewpoint depth streams of the first to third quantization methods, the omnidirectional texture stream, and the omnidirectional depth stream.
  • the transmission unit 40 For each viewpoint, the transmission unit 40 includes a quantization method indicated by the quantization method information supplied from the reception unit 41 in the viewpoint depth streams of the first to third quantization methods stored in the storage unit 39.
  • the viewpoint depth stream is read and transmitted.
  • the transmission unit 40 reads and transmits the two viewpoint texture streams, the omnidirectional texture stream, and the omnidirectional depth stream stored in the storage unit 39.
  • the reception unit 41 receives, for each viewpoint, quantization method information indicating a quantization method corresponding to a display image among first to third quantization methods transmitted from a display device described later. 40.
  • the generation device 12 converts the polygon and color information representing the three-dimensional structure of the main subject into a two-view texture image and depth image. Therefore, the generation device 12 can encode the texture image and the depth image of two viewpoints using a general image encoding method, and can reduce the data amount. As a result, it is possible to reduce the transmission band of data representing the three-dimensional structure of the main subject.
  • the generation device 12 in FIG. 1 generates polygon and color information, but may generate other information such as a point cloud as long as the information expresses a three-dimensional structure used in the CG technology. .
  • the depth image camera 22 acquires a depth image having the same number of pixels as the captured image.
  • the depth image camera 22 A depth image interpolation unit that interpolates the pixel values of the depth image is provided between the position information generation unit 32.
  • the depth image interpolation unit interpolates the pixel values of the depth image, and makes the number of pixels of the depth image the same as the number of pixels of the captured image.
  • each imaging device 11 acquires a depth image, but the depth image is generated from the imaging device 11 corresponding to the depth image and a captured image acquired by another imaging device 11. You may be made to do.
  • the drawing unit 35 has generated the depth image by all the first to third quantization methods, but the depth is only obtained by the quantization method indicated by the quantization method information received by the reception unit 41.
  • An image may be generated.
  • FIG. 2 is a diagram illustrating an arrangement example of the imaging device 11 of FIG.
  • the nine photographing devices 11-1 to 11-9 are arranged so as to surround the main subject 61.
  • FIG. 3 is a block diagram illustrating a configuration example of the drawing unit 35 of FIG.
  • 3 includes a texture image generation unit 71, an r value acquisition unit 72, an inverse r value acquisition unit 73, a 1 / r quantization unit 74, an equal interval quantization unit 75, and an inverse 1 / r quantization unit. 76.
  • the texture image generation unit 71 of the drawing unit 35 performs perspective projection of the back surface of each polygon supplied from the polygon generation unit 34 of FIG. Is generated and supplied to the encoder 38 of FIG.
  • the r value acquisition unit 72 obtains a distance r of a straight line connecting the viewpoint and the polygon in each pixel of the texture image based on each polygon supplied from the polygon generation unit 34 for each of the two viewpoints.
  • the r value acquisition unit 72 supplies the distance r of each pixel at each viewpoint to the 1 / r quantization unit 74 and the equidistant quantization unit 75.
  • the inverse r value acquisition unit 73 connects the viewpoints, the other viewpoints constituting the two viewpoints, and the polygons in each pixel of the texture image, based on the polygons supplied from the polygon generation unit 34.
  • a straight line distance r ′ is obtained.
  • the relationship between the distance r ′ and the distance r is expressed by the following formula (1).
  • r max and r min are the maximum value and the minimum value of the distance r in all pixels of the texture image, respectively.
  • the inverse r value acquisition unit 73 supplies the distance r ′ of each pixel at each viewpoint to the inverse 1 / r quantization unit 76.
  • the 1 / r quantization unit 74 (depth image generation unit) is a first quantization method for quantizing the reciprocal of the distance r for each viewpoint, and is supplied from the r value acquisition unit 72 according to the following equation (2).
  • the reciprocal of the distance r of each pixel is quantized to obtain a quantized value I d1 (r).
  • the 1 / r quantization unit 74 For each viewpoint, the 1 / r quantization unit 74 generates a depth image having the pixel value of the value I d1 (r) after quantization of each pixel, and supplies the generated depth image to the encoder 38 in FIG.
  • the equal interval quantization unit 75 (depth image generation unit) is a second quantization method for quantizing the distance r for each viewpoint, and is supplied from the r value acquisition unit 72 according to the following equation (3).
  • the pixel distance r is quantized to obtain a quantized value I d2 (r).
  • the equidistant quantization unit 75 generates a depth image having the pixel value of the value I d2 (r) after quantization of each pixel for each viewpoint, and supplies the generated depth image to the encoder 38.
  • the inverse 1 / r quantization unit 76 (depth image generation unit) is a third quantization method for quantizing the reciprocal of the distance r ′ for each viewpoint.
  • the inverse r value acquisition unit is expressed by the following equation (4).
  • the inverse number of the distance r ′ of each pixel supplied from 73 is quantized to obtain a quantized value I d3 (r ′).
  • the inverse 1 / r quantization unit 76 generates a depth image having the pixel value of the value I d3 (r ′) after quantization of each pixel for each viewpoint, and supplies the generated depth image to the encoder 38.
  • FIG. 4 is a diagram for explaining the distance r.
  • a position distance is z ab between the viewpoint O1 in the depth direction z of the texture image of the view O1, a plane perpendicular 80 in the depth direction z is doing.
  • the polygon in the texture image of the view O1 is the distance r a is the distance r of the pixel is a point on the surface 80 that intersects with the depth direction z is the depth direction z connecting the viewpoint O1 and the point a of the straight line Distance, and distance z ab .
  • the polygon in the texture image of the view O1 is the distance r b is the distance r of the pixels is different from b and a point on the surface 80, different directions of the depth direction z connecting the viewpoint O1 and the point b A straight line distance, not a distance z ab .
  • the polygon of the main subject forms a sphere 81.
  • the texture image generated by perspectively projecting the surface of the sphere 81 on the perspective projection surface in the line-of-sight direction V1 with respect to one viewpoint O1 of the two viewpoints The texture pasted on the surface area 81A on the sphere 81 that first intersects each projection direction 82 is drawn.
  • the projection direction is a direction in which the absolute value of the angle formed with the line-of-sight direction extending from the viewpoint is within the range of half the angle of view ( ⁇ in the example of FIG. 3).
  • the depth image corresponding to the texture image is an image representing the position in the depth direction (line-of-sight direction V1) of the region 81A with respect to the viewpoint O1.
  • the texture image generated by perspectively projecting the surface of the sphere 81 on the perspective projection surface in the line-of-sight direction V2 with respect to the other viewpoint O2 of the two viewpoints The texture pasted on the surface area 81B on the sphere 81 that first intersects each projection direction 83 is drawn.
  • the depth image corresponding to the texture image is an image representing the position in the depth direction (line-of-sight direction V2) of the region 81B with respect to the viewpoint O2.
  • the texture image and the depth image of the viewpoint O1, and the texture image and the depth image of the viewpoint O2, the two areas 81A and 81B facing each other with respect to the center of the sphere 81 are displayed.
  • a three-dimensional structure can be expressed.
  • a region other than the region 81A and the region 81B exists on the surface of the sphere. That is, there are regions on the surface of the sphere 81 that cannot represent the three-dimensional structure in the texture image and depth image of the viewpoint O1, and the texture image and depth image of the viewpoint O2.
  • the viewpoint O2 is over the Pacific Ocean, and as shown on the left side of FIG. 6B, the texture image 102 of the viewpoint O2 draws a part of the Australian continent pasted as a texture on the surface of the region 81B. Is done. However, Antarctica etc. are not drawn in either the texture image 101 or the texture image 102.
  • the depth image 111 corresponding to the texture image 101 and the depth image 112 corresponding to the texture image 102 are the same.
  • the pixel value luminance value
  • the depth image 111 and the depth image 112 have the largest pixel value at the center, and become smaller as the distance from the center increases.
  • the three-dimensional structure 121 reconstructed using the texture image 101 and the depth image 111 and the texture image 102 and the depth image 112 is a sphere with a world map as a texture on the front and back surfaces. Only a part of 81.
  • the polygon shape is a relatively simple sphere 81.
  • the polygon area that cannot represent the three-dimensional structure increases with the two-view texture image. To do.
  • FIGS. 8 and 9 are diagrams for explaining a texture image generated by perspectively projecting the back surface of the sphere 81 on the perspective projection surface in the line-of-sight direction V1 with respect to the viewpoint O1, and a depth image corresponding to the texture image. It is.
  • each projection direction is shown in the texture image as shown in FIG.
  • the texture pasted at each point c1 on the surface of the sphere 81 that first intersects 82 is drawn.
  • the depth image corresponding to the texture image is an image representing the position of each point c1 in the depth direction (line-of-sight direction V1) with respect to the viewpoint O1.
  • the texture image when a texture image is generated by perspectively projecting the back surface of the sphere 81 onto the perspective projection surface in the line-of-sight direction V1 with respect to the viewpoint O1, the texture image includes each projection direction 82 and the first as shown in FIG.
  • the texture pasted at each point c2 on the back surface on the sphere 81 intersecting with is drawn.
  • the depth image corresponding to this texture image is an image representing the position of each point c2 in the depth direction (line-of-sight direction V1) with respect to the viewpoint O2.
  • the texture image 131 of the viewpoint O1 includes each point c2 as shown in FIG. North America continent, part of South America continent, Antarctica continent, part of Europe continent, Asia continent and Australia continent pasted as texture on the back are drawn. Further, the depth image 132 corresponding to the texture image 131 has the smallest pixel value at the center and becomes smaller as the distance from the center increases.
  • FIG. 10 to FIG. 12 correspond to the texture image generated by perspectively projecting the back surface of each polygon on the perspective projection surface for each of two viewpoints facing the origin of the 3D model coordinate system, and the texture image. It is a figure explaining the depth image to do.
  • the main subject polygon is a sphere 81.
  • the texture image generated by perspectively projecting the back surface of the sphere 81 onto the perspective projection surface in the line-of-sight direction V1 with respect to the viewpoint O1 The texture pasted on the area 153A on the back surface on the sphere 81 that intersects is drawn.
  • the depth image corresponding to the texture image is an image representing the position in the depth direction (line-of-sight direction V1) of the region 81A with respect to the viewpoint O1.
  • the texture image generated by perspectively projecting the back surface of the sphere 81 onto the perspective projection surface in the line-of-sight direction V2 with respect to the other viewpoint O2 of the two viewpoints The texture pasted on the back surface region 153B on the sphere 81 that first intersects each projection direction 83 is drawn.
  • the depth image corresponding to the texture image is an image representing the position in the depth direction (line-of-sight direction V2) of the region 81B with respect to the viewpoint O2.
  • the structure can be expressed.
  • the entire three-dimensional structure of the sphere 81 can be expressed by the texture image and depth image of the viewpoint O1, and the texture image and depth image of the viewpoint O2.
  • the viewpoint O2 is over the Pacific Ocean, and as shown on the left side of FIG. 11B, the texture image 162 of the viewpoint O2 includes an African continent, a North American continent, Portions of South America, Antarctica, and Europe are drawn. Accordingly, all of the seven continents are drawn on at least one of the texture image 161 and the texture image 162.
  • the depth image 163 corresponding to the texture image 161 and the depth image 164 corresponding to the texture image 162 are the same.
  • the depth image 163 and the depth image 164 have the smallest pixel value at the center and become larger as the distance from the center increases.
  • the three-dimensional structure 171 reconstructed using the texture image 161 and the depth image 163 is a larger portion than the half of the sphere 81 on the viewpoint O2 side (the right half in the figure).
  • the three-dimensional structure 172 reconstructed using the texture image 162 and the depth image 164 is a larger portion than the half of the sphere 81 on the viewpoint O1 side (the left half in the figure). . Therefore, the entire sphere 81 can be generated by reconstructing the three-dimensional structure using the texture image 161 and the depth image 163 and the texture image 162 and the depth image 164.
  • the overlapping region of the region 153A and the region 153B is generated using one of the texture image 161 and the depth image 163, and the texture image 162 and the depth image 164.
  • the texture image 161 and the depth image 163 cannot represent the three-dimensional structure of the region 154 with high accuracy.
  • the region 154 is perspective-projected with respect to the viewpoint O2
  • the angle with the projection direction 83 becomes larger than when the perspective projection is performed with respect to the viewpoint O1. Therefore, in the texture image 162 and the depth image 164, the three-dimensional structure of the region 154 can be expressed with higher accuracy than the texture image 161 and the depth image 163. Therefore, the region 154 is generated using the texture image 162 and the depth image 164.
  • the overlapping region between the region 153A and the region 153B is selected from the texture image 161 and the depth image 163, and the texture image 162 and the depth image 164, which corresponds to the projection direction in which the angle between the overlapping region is large.
  • the accuracy of reconstruction of the sphere 81 can be improved.
  • FIG. 13 is a flowchart illustrating the generation process of the generation device 12 of FIG. This generation process is performed for each frame of N captured images and depth images acquired by the N imaging devices 11.
  • the region extraction unit 31 of the generation device 12 extracts the main subject region and the background region from the N photographed images and the depth image supplied from the photographing device 11.
  • the region extraction unit 31 supplies N captured images and depth images of the main subject region to the position information generation unit 32, and the N captured images and depth images of the background region to the omnidirectional image generation unit 36. Supply.
  • step S12 the position information generation unit 32 generates position information of each polygon of the main subject using the N depth images of the main subject region supplied from the region extraction unit 31, and generates color information. To the unit 33 and the drawing unit 35. In addition, the position information generation unit 32 supplies the N captured images of the main subject area to the color information generation unit 33.
  • step S ⁇ b> 13 the color information generation unit 33 uses the position information of each polygon supplied from the position information generation unit 32 and N photographed images of the main subject area, and color information on the front and back surfaces of each polygon. Is generated.
  • the color information generation unit 33 supplies color information on the front and back surfaces of each polygon to the drawing unit 35.
  • step S ⁇ b> 14 the drawing unit 35 generates each polygon based on the position information of each polygon supplied from the position information generation unit 32, and color information on the front and back surfaces of each polygon supplied from the color information generation unit 33. Based on the above, textures are pasted on the front and back surfaces of each polygon.
  • step S15 the texture image generating unit 71 (FIG. 3) of the drawing unit 35 performs perspective projection of the back surface of each polygon on the perspective projection surface in the line-of-sight direction for each of the two predetermined viewpoints. Generate a texture image.
  • the drawing unit 35 supplies a texture image of two viewpoints to the encoder 38.
  • step S ⁇ b> 16 the r value acquisition unit 72 obtains the distance r of each pixel at each viewpoint based on the polygon supplied from the polygon generation unit 34, and sends it to the 1 / r quantization unit 74 and the equidistant quantization unit 75. Supply.
  • step S ⁇ b> 17 the inverse r value acquisition unit 73 obtains the distance r ′ of each pixel at each viewpoint based on the polygon supplied from the polygon generation unit 34 and supplies it to the inverse 1 / r quantization unit 76.
  • step S ⁇ b> 18 the 1 / r quantization unit 74 generates a depth image by obtaining the value I d1 (r) after quantization by the first quantization method for each viewpoint, and supplies the depth image to the encoder 38.
  • the equally-spaced quantization unit 75 generates a depth image by obtaining a value I d2 (r) after quantization by the second quantization method for each viewpoint, and supplies the depth image to the encoder 38.
  • the inverse 1 / r quantization unit 76 generates a depth image by obtaining the value I d3 (r ′) after quantization by the third quantization method, and supplies the depth image to the encoder 38.
  • step S19 the omnidirectional image generation unit 36 performs perspective projection of the N captured images of the background region supplied from the region extraction unit 31 onto a regular octahedron centered on the origin of the 3D model coordinate system.
  • a texture image of the celestial sphere image is generated and supplied to the resolution reduction unit 37.
  • step S20 the omnidirectional image generation unit 36 performs perspective projection of the N depth images of the background region supplied from the region extraction unit 31 on a regular octahedron in the same manner as the captured image.
  • a depth image is generated and supplied to the resolution reduction unit 37.
  • step S21 the resolution reduction unit 37 lowers the resolution of the texture image and the depth image of the omnidirectional image supplied from the omnidirectional image generation unit 36, and supplies them to the encoder 38.
  • step S22 the encoder 38 encodes the texture image of the two viewpoints, the depth image of the first to third quantization methods, and the texture image and the depth image of the omnidirectional image, and supplies them to the storage unit 39.
  • the encoder 38 encodes the texture image of the two viewpoints, the depth image of the first to third quantization methods, and the texture image and the depth image of the omnidirectional image, and supplies them to the storage unit 39.
  • step S23 the receiving unit 41 determines whether or not quantization information of each viewpoint has been transmitted from a display device described later.
  • the reception unit 41 receives the quantization information of each viewpoint and supplies it to the transmission unit 40.
  • step S24 the transmission unit 40 sets, for each viewpoint, the quantization method for the viewpoint depth stream to be transmitted to the quantization method indicated by the quantization information supplied from the reception unit 41, and performs the process in step S25. Proceed to
  • step S23 when it is determined in step S23 that the quantization information has not been transmitted, the transmission unit 40 uses the quantization method set when the frame prior to the current processing target frame is set as the processing target, The quantization method for the current processing target frame is used. Then, the process proceeds to step S25.
  • step S25 the transmission unit 40 reads the viewpoint texture stream of the two viewpoints stored in the storage unit 39, the viewpoint depth stream of the set quantization method, and the omnidirectional texture stream and omnidirectional depth stream. ,Send. Then, the process ends.
  • the generation device 12 performs the perspective projection of the back surface of the polygon on the perspective projection surface in the viewing direction of each viewpoint for each of the two viewpoints facing the origin of the 3D model coordinate system.
  • the generation device 12 generates a depth image by the first to third quantization methods. Therefore, the display device described later can generate a display image by selectively using the viewpoint depth stream of the quantization method suitable for the display image from the viewpoint depth streams of the first to third quantization methods.
  • FIG. 14 is a block diagram illustrating a configuration example of the first embodiment of the display device as the image treatment device to which the present disclosure is applied.
  • the display device 200 of FIG. 14 receives the two-viewpoint viewpoint texture stream, the viewpoint depth stream of a predetermined quantization method, and the omnidirectional texture stream and omnidirectional depth stream transmitted from the generation device 12 of FIG. Received and generates a texture image of a predetermined viewpoint as a display image.
  • the display device 200 includes a receiving unit 201, a storage unit 202, a decoder 203, an inverse quantization unit 204, a reconstruction unit 205, a drawing unit 206, a display unit 207, a selection unit 208, and a transmission unit 209. Is done.
  • the receiving unit 201 of the display apparatus 200 receives the two viewpoint texture streams and viewpoint depth streams, and the omnidirectional texture stream and omnidirectional depth stream transmitted from the generation apparatus 12 and supplies them to the storage unit 202. To do.
  • the storage unit 202 stores the two viewpoint texture streams and viewpoint depth streams supplied from the receiving unit 201, and the omnidirectional texture stream and omnidirectional depth stream.
  • the decoder 203 reads the two viewpoint texture streams and viewpoint depth streams, and the omnidirectional texture stream and omnidirectional depth stream from the storage unit 202 and decodes them.
  • the decoder 203 supplies the texture image and depth image of the two viewpoints obtained as a result of decoding, and the texture image and depth image of the omnidirectional image to the reconstruction unit 205.
  • the decoder 203 supplies the two-view depth image obtained as a result of decoding to the inverse quantization unit 204.
  • the inverse quantization unit 204 inversely quantizes the depth image of the two viewpoints supplied from the decoder 203 with an inverse quantization method corresponding to the quantization method indicated by the quantization information supplied from the selection unit 208 for each viewpoint.
  • the distance information of each pixel is generated.
  • the distance information is a reciprocal 1 / r of the distance r when the quantization information indicates the first quantization method, and is the distance r when the quantization information indicates the second quantization method.
  • the reciprocal 1 / r ′ of the distance r ′ When the quantization method of 3 is shown, the reciprocal 1 / r ′ of the distance r ′.
  • the inverse quantization unit 204 supplies distance information of each pixel of the two-view depth image to the reconstruction unit 205.
  • the reconstruction unit 205 reconstructs the three-dimensional structure of the main subject in the 3D model coordinate system using the distance information of each pixel of the two-view texture image and the depth image.
  • the two-viewpoint texture image and the depth image generated by the generation device 12 are larger than the case where the two-viewpoint texture image and depth image are generated by perspective projection of the polygon surface.
  • a three-dimensional structure can be expressed. Therefore, the area of the main subject whose 3D structure is reconstructed using the decoded 2-viewpoint texture image and depth image is generated by perspective-projecting the polygon surface with the 2-viewpoint texture image and depth image. More than if
  • the reconstruction unit 205 reconstructs the three-dimensional structure of the background region in the 3D model coordinate system using the texture image and depth image of the omnidirectional image supplied from the decoder 203.
  • the reconstruction unit 205 supplies the drawing unit 206 with position information and color information of the three-dimensional structure of the main subject and the background area.
  • the drawing unit 206 (image generation unit) is based on the position information and color information of the three-dimensional structure of the main subject and the background area supplied from the reconstruction unit 205 in the 3D model coordinate system specified by the viewer or the like.
  • a texture image having a viewpoint, a line-of-sight direction, and an angle of view is generated as a display image.
  • the drawing unit 206 supplies the generated display image to the display unit 207.
  • the display unit 207 displays the display image supplied from the drawing unit 206. Thereby, the viewer can see the main subject from an arbitrary position around the main subject, for example.
  • the selection unit 208 displays, for each viewpoint, an angle formed by the depth direction (gaze direction) of the texture image and the depth direction of the display image based on the viewpoint and the gaze direction in the 3D model coordinate system specified by the viewer or the like. Calculate as change angle.
  • the selection unit 208 selects a depth image quantization method from the first to third quantization methods based on the display change angle for each viewpoint.
  • the selection unit 208 generates quantization information of the selected quantization method and supplies it to the inverse quantization unit 204 and the transmission unit 209.
  • the selection unit 208 selects the depth image quantization method from the first to third quantization methods and continues the description assuming that the quantization is performed. However, the first to third quantization methods are continued. Any one of the quantization methods is set, and a quantization unit that performs quantization using the set quantization method may be used.
  • the quantization method is selected from the first to third quantization methods based on the display change angle for each viewpoint, but based on a predetermined condition other than the display change angle, A quantization method may be selected.
  • the transmission unit 209 transmits the quantization information supplied from the selection unit 208 to the generation device 12 in FIG.
  • the equi-pixel value line indicating the position of is a circular arc with the viewpoint O1 as the center. Further, in the first quantization method, since the reciprocal 1 / r of the distance r is quantized, the interval between the equal pixel value lines is narrower as it is closer to the viewpoint O1.
  • the display change angle formed by the depth direction Vz of the display image at the viewpoint VO1 and the depth direction z of the texture image at the viewpoint O1 is around 0 degrees as shown in FIG. 15 (0 degrees in the example of FIG. 15). That is, when the depth direction Vz and the depth direction z are close, the closer to the viewpoint VO1, the narrower the interval between the equal pixel value lines. That is, in the display image, the subject that stands out closer to the viewpoint VO1 has a finer quantization step for the depth image. As a result, the image quality of the display image can be improved.
  • the selection unit 208 has a display change angle of 0 degree or more and less than ⁇ 1 (0 ⁇ 1 ⁇ 90) (first threshold) degree, or ⁇ 4 (270 ⁇ 4 ⁇ 360). ) (Second threshold) degree or more and less than 360 degrees, the first quantization method is selected.
  • the equi-pixel value line is the viewpoint O2 facing the viewpoint O1 and the origin O as shown by the dotted line in FIG. This is a circular arc centered at.
  • the interval between the equal pixel value lines is narrower as it is closer to the viewpoint O2, that is, as it is farther from the viewpoint O1.
  • the display change angle formed by the depth direction Vz of the display image at the viewpoint VO1 and the depth direction z of the depth image at the viewpoint O1 is around 180 degrees as shown in FIG. 16 (180 degrees in the example of FIG. 15). That is, when the depth direction Vz and the reverse direction of the depth direction z are close, the closer to the viewpoint VO1, the narrower the interval between equal pixel value lines. That is, in the display image, the subject that stands out closer to the viewpoint VO1 has a finer quantization step for the depth image. As a result, the image quality of the display image can be improved.
  • the selection unit 208 has a display change angle of ⁇ 2 (90 ⁇ 2 ⁇ 180) (third threshold) degree or more and less than ⁇ 3 (180 ⁇ 3 ⁇ 270) (fourth threshold) degree. If so, the third quantization method is selected.
  • the equal pixel value line is a circular arc centered on the viewpoint O1, as indicated by a dotted line in FIG.
  • the intervals between the equal pixel value lines are equal.
  • the selection unit 208 selects the second quantization method. That is, when there is no superiority of the first or third quantization method, the selection unit 208 selects the second quantization method. Specifically, as illustrated in FIG. 18, the selection unit 208 performs the second quantization method when the display change angle is greater than or equal to ⁇ 1 degrees and less than ⁇ 2 degrees, or greater than or equal to ⁇ 3 degrees and less than ⁇ 4 degrees. select.
  • the selection unit 208 selects the first to third quantization methods, it is possible to prevent the quantization step from becoming rougher as the viewpoint VO1 is closer in the display image.
  • FIG. 19 is a diagram for explaining the first reconstruction method.
  • FIG. 19 illustrates a case where the three-dimensional structure of the main subject is reconstructed using the texture image and depth image of one viewpoint O1 of the two viewpoints.
  • the first reconstruction method is a method for reconstructing a three-dimensional structure using a point cloud.
  • the reconstruction unit 205 corresponds to each pixel 221 of the texture image 220 of the viewpoint O1, the line-of-sight direction V1, the angle of view 2 ⁇ , and the viewpoint O1.
  • the three-dimensional coordinates (3D coordinates in the 3D model coordinate system of the sampling point 231 ( X, Y, Z).
  • the reconstruction unit 205 converts the YCbCr value that is the pixel value of each pixel 221 of the texture image 220 into an RGB value, and sets the RGB value of the sampling point 231 corresponding to each pixel 221.
  • the reconstruction unit 205 reconstructs the three-dimensional structure of the main subject by drawing the RGB value of the sampling point 231 on the three-dimensional coordinates (X, Y, Z) of each sampling point 231.
  • the reconstruction unit 205 supplies the three-dimensional coordinates (X, Y, Z) of each sampling point 231 to the drawing unit 206 as the positional information of the three-dimensional structure of the main subject, and the RGB value of each sampling point 231 is the main. Is supplied to the drawing unit 206 as color information of a three-dimensional structure of the subject.
  • FIG. 20 is a diagram for explaining the second reconstruction method.
  • FIG. 20 illustrates a case where the three-dimensional structure of the main subject is reconstructed using the texture image and the depth image of one viewpoint O1 of the two viewpoints.
  • the second reconstruction method is a method of reconstructing a three-dimensional structure using a triangular patch. Specifically, as shown on the left side of FIG. 20, in the second reconstruction method, the reconstruction unit 205 generates a sampling point 251 corresponding to each pixel 241 on the texture image 240 of the viewpoint O1. The reconstructing unit 205 connects the three adjacent sampling points 251 among the sampling points 251 corresponding to all the pixels of the texture image 240 to thereby form a triangular patch having the three adjacent sampling points 251 as vertices. 252 is generated.
  • the reconstruction unit 205 then includes the viewpoint O1, the line-of-sight direction V1, the angle of view 2 ⁇ , the position (u, v) of each sampling point 251 on the texture image 240, and each pixel 241 of the depth image corresponding to the texture image 240.
  • the three-dimensional coordinates (X, Y, Z) of the 3D model coordinate system corresponding to each sampling point 251 are generated based on the pixel values.
  • the reconstruction unit 205 then converts each sampling point 261 corresponding to each sampling point 251 to a 3D model based on the three-dimensional coordinates (X, Y, Z) of each sampling point 251 as shown on the right side of FIG. Place in the coordinate system. Further, the reconstruction unit 205 generates a triangular patch 262 by connecting the sampling points 261 corresponding to the three sampling points 251 constituting the vertex of the triangular patch 252.
  • the reconstruction unit 205 converts the YCbCr value of the pixel 241 constituting the triangular patch 252 corresponding to the triangular patch 262 into an RGB value, and uses the RGB value to convert the RGB value of the triangular patch 262 into an RGB value. Is generated.
  • the reconstruction unit 205 pastes the RGB texture of the triangular patch 262 onto the triangular patch 262. Thereby, the reconstruction unit 205 reconstructs the three-dimensional structure of the main subject.
  • the reconstruction unit 205 supplies the drawing unit 206 with the three-dimensional coordinates (X, Y, Z) of the sampling point 261 that is the vertex of each triangular patch 262 as the positional information of the three-dimensional structure of the main subject. Also, the reconstruction unit 205 supplies the RGB value of each triangular patch 262 to the drawing unit 206 as color information of the three-dimensional structure of the main subject.
  • the method for reconstructing the three-dimensional structure of the main subject from the texture image and depth image of the viewpoint O1 has been described.
  • the three-dimensional structure of the main subject from the texture image and depth image of the viewpoint O2 is described.
  • FIG. 21 is a flowchart for explaining display processing of the display device 200 of FIG. This display processing is started, for example, when a display image display is requested by the viewer.
  • step S30 of FIG. 21 the selection unit 208 of the display device 200 performs quantization information generation processing for generating and transmitting quantization information. Details of this quantization information generation processing will be described with reference to FIG.
  • step S ⁇ b> 31 the reception unit 201 receives the two-viewpoint viewpoint texture stream and viewpoint depth stream, and the omnidirectional texture stream and omnidirectional depth stream transmitted from the generation device 12 of FIG. 1 according to the quantization information. Is supplied to the storage unit 202 for storage.
  • step S32 the decoder 203 reads out the two viewpoint texture streams and viewpoint depth streams, and the omnidirectional texture stream and omnidirectional depth stream from the storage unit 202 and decodes them.
  • the decoder 203 supplies the texture image and depth image of the two viewpoints obtained as a result of decoding, and the texture image and depth image of the omnidirectional image to the reconstruction unit 205.
  • the decoder 203 supplies the two-view depth image obtained as a result of decoding to the inverse quantization unit 204.
  • step S33 the inverse quantization unit 204 performs inverse quantization on the depth image supplied from the decoder 203 by the inverse quantization method corresponding to the quantization method indicated by the quantization information supplied from the selection unit 208 for each viewpoint. And distance information of each pixel is generated.
  • the inverse quantization unit 204 supplies distance information of each pixel of the depth image at each viewpoint to the reconstruction unit 205.
  • step S34 the reconstruction unit 205 reconstructs the three-dimensional structure of the main subject in the 3D model coordinate system using the distance information of each pixel of the two-viewpoint texture image and the depth image.
  • the reconstruction unit 205 supplies the position information and color information of the three-dimensional structure of the main subject to the drawing unit 206.
  • step S35 the reconstruction unit 205 reconstructs the three-dimensional structure of the background region in the 3D model coordinate system using the texture image and depth image of the omnidirectional image supplied from the decoder 203.
  • the reconstruction unit 205 supplies the drawing unit 206 with position information and color information of the three-dimensional structure of the background region.
  • step S36 the drawing unit 206 determines the viewpoint in the 3D model coordinate system specified by the viewer or the like based on the position information and color information of the three-dimensional structure of the main subject and the background area supplied from the reconstruction unit 205. Then, a texture image of the line-of-sight direction and the angle of view is generated as a display image. The drawing unit 206 supplies the generated display image to the display unit 207.
  • step S37 the display unit 207 displays the display image supplied from the drawing unit 206, and ends the process.
  • FIG. 22 is a flowchart illustrating the quantization information generation process in step S30 of FIG. This quantization information generation process is performed for each viewpoint.
  • step S51 the selection unit 208 obtains the display change angle based on the viewpoint and the line-of-sight direction in the 3D model coordinate system designated by the viewer or the like.
  • step S52 the selection unit 208 determines whether the display change angle is 0 ° or more and less than ⁇ 1 °, or whether it is ⁇ 4 ° or more and less than 360 °. If it is determined in step S52 that the display change angle is not less than 0 degrees and less than ⁇ 1 degree, or is not less than ⁇ 4 degrees and less than 360 degrees, the process proceeds to step S53.
  • step S53 the selection unit 208 selects the first quantization method, generates quantization information of the first quantization method, and supplies the quantization information to the transmission unit 209. Then, the process proceeds to step S57.
  • step S52 determines whether the display change angle is greater than or equal to 0 degrees and less than ⁇ 1 degree and is not greater than or equal to ⁇ 4 degrees and less than 360 degrees. If it is determined in step S52 that the display change angle is not greater than or equal to 0 degrees and less than ⁇ 1 degree and is not greater than or equal to ⁇ 4 degrees and less than 360 degrees, the process proceeds to step S54.
  • step S54 the selection unit 208 determines whether the display change angle is ⁇ 1 ° or more and less than ⁇ 2 °, or ⁇ 3 ° or more and less than ⁇ 4 °. If it is determined in step S54 that the display change angle is not less than ⁇ 1 degree and less than ⁇ 2 degrees, or is not less than ⁇ 3 degrees and less than ⁇ 4 degrees, the process proceeds to step S55.
  • step S55 the selection unit 208 selects the second quantization method, generates quantization information of the second quantization method, and supplies the quantization information to the transmission unit 209. Then, the process proceeds to step S57.
  • step S54 when it is determined in step S54 that the display change angle is not ⁇ 1 ° or more and less than ⁇ 2 ° and is not ⁇ 3 ° or more and less than ⁇ 4 °, that is, the display change angle is ⁇ 2 ° or more and less than ⁇ 3 °. If so, the process proceeds to step S56.
  • step S56 the selection unit 208 selects the third quantization method, generates quantization information of the third quantization method, and supplies the quantization information to the transmission unit 209. Then, the process proceeds to step S57.
  • step S57 the transmission unit 209 transmits the quantization information supplied from the selection unit 208 to the generation device 12 in FIG. And a process returns to step S30 of FIG. 21, and progresses to step S31.
  • the display device 200 generates a display image using the two-viewpoint texture image and the depth image generated by the generation device 12. Therefore, the three-dimensional structure of the main subject in a larger area is reconstructed compared to the case of using the two-viewpoint texture image and the depth image generated by perspectively projecting the surface of the polygon for each of the two viewpoints.
  • the display image can be generated from the three-dimensional structure. As a result, the image quality of the display image is improved.
  • the display device 200 selects a quantization method for the depth image of each viewpoint from the first to third quantization methods. Accordingly, the display device 200 can generate a display image using, for example, a depth image generated by a quantization method suitable for generating a display image among the first to third quantization methods. As a result, the image quality of the display image is improved.
  • FIG. 23 is a diagram illustrating another example of the texture image.
  • the texture image is a texture image of one viewpoint, but a texture image of the left eye viewpoint and the right eye viewpoint corresponding to the viewpoint may be synthesized.
  • the texture image includes, for example, a left-eye viewpoint texture image 421 and a right-eye viewpoint texture image 422 corresponding to one viewpoint in a horizontal direction (horizontal direction).
  • the packing image 420 packed in () may be used.
  • the texture image may be, for example, a packed image 440 in which the texture image 421 and the texture image 422 are packed in the vertical direction (vertical direction).
  • the texture image is a texture image obtained by packing the left-eye viewpoint image and the right-eye viewpoint image
  • the texture image obtained as a result of decoding is the left-eye viewpoint texture image and the right-eye viewpoint image. Separated into texture images. Then, a three-dimensional structure is generated for each eye.
  • a display image for the left eye is generated from the three-dimensional structure for the left eye based on the left eye viewpoint, line-of-sight direction, and angle of view corresponding to the viewpoint designated by the viewer or the like.
  • a display image for the right eye is generated from the three-dimensional structure for the right eye based on the viewpoint of the right eye, the line-of-sight direction, and the angle of view corresponding to the viewpoint specified by the viewer or the like.
  • the display unit 207 When the display unit 207 is capable of 3D display, the display unit 207 displays the display image for the left eye as the image for the left eye and the display image for the right eye as the image for the right eye, thereby displaying the display image in 3D. indicate. On the other hand, when the display unit 207 is not capable of 3D display, the display unit 207 displays the display image for the left eye or the display image for the right eye in 2D.
  • the number of viewpoints is two, but the number of viewpoints is not limited to two. Also, the two viewpoints do not have to face each other.
  • the line-of-sight direction may be a direction from the viewpoint toward a position other than the origin.
  • the display device 200 may not transmit the quantization information to the generation device 12 but may receive the viewpoint depth streams of the first to third quantization methods from the generation device 12 and store them in the storage unit 202. Good.
  • the display apparatus 200 uses the quantization method viewpoint indicated by the quantization information in the viewpoint depth streams of the first to third quantization methods stored in the storage unit 202 based on the quantization information. Read and decode only the depth stream.
  • the display device 200 has selected the quantization method based on the display change angle.
  • the second quantum is used regardless of the display change angle. You may make it select the conversion method.
  • the selection of the quantization method may be performed based on information other than the display change angle. For example, the quantization method may be selected based on the presence or absence of the movement of the main subject.
  • the viewpoint and the distance in the depth direction of the polygon in each pixel are used instead of the distance r
  • the viewpoint and the distance r ′ are used instead of the distance r ′. You may make it use the distance of the depth direction of the polygon in each pixel and the other viewpoint which comprises 2 viewpoints.
  • FIG. 24 is a diagram for explaining the coordinate system of the projection plane.
  • the projection surface is a two-dimensional plane on which the omnidirectional image mapped on the sphere is tan-axis projected, or the display device 200.
  • this is a visual field range in which a 3D model image is projected on the tan axis.
  • a projection plane 451 having z of ⁇ 1.0 is set in the three-dimensional xyz coordinate system of the 3D model.
  • the coordinate system of the projection plane 451 is a two-dimensional st coordinate system in which the center O ′ of the projection plane 451 is the origin, the horizontal direction of the projection plane 451 is the s direction, and the vertical direction is the t direction.
  • a vector 452 from the origin O of the xyz coordinate system to the coordinates (s, t) of the st coordinate system is represented by coordinates (s, t) and -1.0, which is the distance from the origin O to the projection plane 451. And is called a vector (s, t, -1.0).
  • FIG. 25 is a diagram for explaining tan axis projection (tangent axis projection).
  • FIG. 25 is a diagram of the projection plane 451 viewed in the negative z direction.
  • the minimum value of the s value and the t value of the projection plane 451 is ⁇ 1.0, and the maximum value is 1.0.
  • the projection point is set on the projection plane 451 so that the projection vector from the origin O to the projection point on the projection plane 451 becomes a vector (s ′, t′-1.0).
  • s ′ is a value for each predetermined interval provided in a range of s values from ⁇ 1.0 to 1.0
  • t ′ is a predetermined interval provided in a range of t values from ⁇ 1.0 to 1.0. Is the value of Accordingly, the projection points in the perspective projection are uniform on the projection plane 451.
  • the projection vector is a vector (tan (s ′ * ⁇ w / 2), tan (t ′) in the tan-axis projection.
  • Projection points are set on the projection plane 451 such that * ⁇ w / 2), ⁇ 1.0).
  • the vectors (tan (s ′ * ⁇ w / 2), tan (t ′ * ⁇ w / 2), ⁇ 1.0) are set such that s ′ * ⁇ w / 2 is ⁇ and t ′ * ⁇ w / 2 is ⁇ . Then, it becomes a vector (tan ⁇ , tan ⁇ , -1.0). At this time, when the angle of view ⁇ w approaches ⁇ , tan ⁇ and tan ⁇ diverge to infinity.
  • the vector (tan ⁇ , tan ⁇ , -1.0) is corrected to the vector (sin ⁇ * cos ⁇ , cos ⁇ * sin ⁇ , -cos ⁇ * cos ⁇ ) so that tan ⁇ and tan ⁇ do not diverge infinitely, and the projection vector becomes the vector (sin ⁇ Projection points are set on the projection plane 451 such that * cos ⁇ , cos ⁇ * sin ⁇ , -cos ⁇ * cos ⁇ ). Accordingly, in tan-axis projection, the angles formed by projection vectors corresponding to adjacent projection points are the same.
  • tan (s ′ * ⁇ w / 2) and tan (t ′ * ⁇ w / 2) are considered to be s ′, t ′ of the tan axis, similarly to the logarithmic axis (log scale). Therefore, in this specification, a projection whose projection vector is a vector (tan (s ′ * ⁇ w / 2), tan (t ′ * ⁇ w / 2), ⁇ 1.0) is referred to as a tan-axis projection.
  • ⁇ Third Embodiment> (Description of computer to which the present disclosure is applied)
  • the series of processes described above can be executed by hardware or can be executed by software.
  • a program constituting the software is installed in the computer.
  • the computer includes, for example, a general-purpose personal computer capable of executing various functions by installing various programs by installing a computer incorporated in dedicated hardware.
  • FIG. 26 is a block diagram showing an example of the hardware configuration of a computer that executes the above-described series of processing by a program.
  • a CPU Central Processing Unit
  • ROM Read Only Memory
  • RAM Random Access Memory
  • An input / output interface 505 is further connected to the bus 504.
  • An input unit 506, an output unit 507, a storage unit 508, a communication unit 509, and a drive 510 are connected to the input / output interface 505.
  • the input unit 506 includes a keyboard, a mouse, a microphone, and the like.
  • the output unit 507 includes a display, a speaker, and the like.
  • the storage unit 508 includes a hard disk, a nonvolatile memory, and the like.
  • the communication unit 509 includes a network interface or the like.
  • the drive 510 drives a removable medium 511 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory.
  • the CPU 501 loads the program stored in the storage unit 508 to the RAM 503 via the input / output interface 505 and the bus 504 and executes the program. A series of processing is performed.
  • the program executed by the computer 500 can be provided by being recorded on a removable medium 511 as a package medium, for example.
  • the program can be provided via a wired or wireless transmission medium such as a local area network, the Internet, or digital satellite broadcasting.
  • the program can be installed in the storage unit 508 via the input / output interface 505 by installing the removable medium 511 in the drive 510. Further, the program can be received by the communication unit 509 via a wired or wireless transmission medium and installed in the storage unit 508. In addition, the program can be installed in the ROM 502 or the storage unit 508 in advance.
  • the program executed by the computer 500 may be a program that is processed in time series in the order described in this specification, or a necessary timing such as in parallel or when a call is made. It may be a program in which processing is performed.
  • the technology according to the present disclosure can be applied to various products.
  • the technology according to the present disclosure may be any type of movement such as an automobile, an electric vehicle, a hybrid electric vehicle, a motorcycle, a bicycle, personal mobility, an airplane, a drone, a ship, a robot, a construction machine, and an agricultural machine (tractor). You may implement
  • FIG. 27 is a block diagram illustrating a schematic configuration example of a vehicle control system 7000 that is an example of a mobile control system to which the technology according to the present disclosure can be applied.
  • the vehicle control system 7000 includes a plurality of electronic control units connected via a communication network 7010.
  • the vehicle control system 7000 includes a drive system control unit 7100, a body system control unit 7200, a battery control unit 7300, a vehicle exterior information detection unit 7400, a vehicle interior information detection unit 7500, and an integrated control unit 7600. .
  • the communication network 7010 for connecting the plurality of control units conforms to an arbitrary standard such as CAN (Controller Area Network), LIN (Local Interconnect Network), LAN (Local Area Network), or FlexRay (registered trademark). It may be an in-vehicle communication network.
  • Each control unit includes a microcomputer that performs arithmetic processing according to various programs, a storage unit that stores programs executed by the microcomputer or parameters used for various calculations, and a drive circuit that drives various devices to be controlled. Is provided.
  • Each control unit includes a network I / F for communicating with other control units via a communication network 7010, and is connected to devices or sensors inside and outside the vehicle by wired communication or wireless communication. A communication I / F for performing communication is provided. In FIG.
  • a microcomputer 7610 As a functional configuration of the integrated control unit 7600, a microcomputer 7610, a general-purpose communication I / F 7620, a dedicated communication I / F 7630, a positioning unit 7640, a beacon receiving unit 7650, an in-vehicle device I / F 7660, an audio image output unit 7670, An in-vehicle network I / F 7680 and a storage unit 7690 are illustrated.
  • other control units include a microcomputer, a communication I / F, a storage unit, and the like.
  • the drive system control unit 7100 controls the operation of the device related to the drive system of the vehicle according to various programs.
  • the drive system control unit 7100 includes a driving force generator for generating a driving force of a vehicle such as an internal combustion engine or a driving motor, a driving force transmission mechanism for transmitting the driving force to wheels, and a steering angle of the vehicle. It functions as a control device such as a steering mechanism that adjusts and a braking device that generates a braking force of the vehicle.
  • the drive system control unit 7100 may have a function as a control device such as ABS (Antilock Brake System) or ESC (Electronic Stability Control).
  • a vehicle state detection unit 7110 is connected to the drive system control unit 7100.
  • the vehicle state detection unit 7110 includes, for example, a gyro sensor that detects the angular velocity of the rotational movement of the vehicle body, an acceleration sensor that detects the acceleration of the vehicle, an operation amount of an accelerator pedal, an operation amount of a brake pedal, and steering of a steering wheel. At least one of sensors for detecting an angle, an engine speed, a rotational speed of a wheel, or the like is included.
  • the drive system control unit 7100 performs arithmetic processing using a signal input from the vehicle state detection unit 7110, and controls an internal combustion engine, a drive motor, an electric power steering device, a brake device, or the like.
  • the body system control unit 7200 controls the operation of various devices mounted on the vehicle body according to various programs.
  • the body system control unit 7200 functions as a keyless entry system, a smart key system, a power window device, or a control device for various lamps such as a headlamp, a back lamp, a brake lamp, a blinker, or a fog lamp.
  • the body control unit 7200 can be input with radio waves or various switch signals transmitted from a portable device that substitutes for a key.
  • the body system control unit 7200 receives input of these radio waves or signals, and controls a door lock device, a power window device, a lamp, and the like of the vehicle.
  • the battery control unit 7300 controls the secondary battery 7310 that is a power supply source of the drive motor according to various programs. For example, information such as battery temperature, battery output voltage, or remaining battery capacity is input to the battery control unit 7300 from a battery device including the secondary battery 7310. The battery control unit 7300 performs arithmetic processing using these signals, and controls the temperature adjustment of the secondary battery 7310 or the cooling device provided in the battery device.
  • the outside information detection unit 7400 detects information outside the vehicle on which the vehicle control system 7000 is mounted.
  • the outside information detection unit 7400 is connected to at least one of the imaging unit 7410 and the outside information detection unit 7420.
  • the imaging unit 7410 includes at least one of a ToF (Time Of Flight) camera, a stereo camera, a monocular camera, an infrared camera, and other cameras.
  • the outside information detection unit 7420 detects, for example, current weather or an environmental sensor for detecting weather, or other vehicles, obstacles, pedestrians, etc. around the vehicle equipped with the vehicle control system 7000. At least one of the surrounding information detection sensors.
  • the environmental sensor may be, for example, at least one of a raindrop sensor that detects rainy weather, a fog sensor that detects fog, a sunshine sensor that detects sunlight intensity, and a snow sensor that detects snowfall.
  • the ambient information detection sensor may be at least one of an ultrasonic sensor, a radar device, and a LIDAR (Light Detection and Ranging, Laser Imaging Detection and Ranging) device.
  • the imaging unit 7410 and the outside information detection unit 7420 may be provided as independent sensors or devices, or may be provided as a device in which a plurality of sensors or devices are integrated.
  • FIG. 28 shows an example of installation positions of the imaging unit 7410 and the vehicle outside information detection unit 7420.
  • the imaging units 7910, 7912, 7914, 7916, and 7918 are provided at, for example, at least one of the front nose, the side mirror, the rear bumper, the back door, and the upper part of the windshield in the vehicle interior of the vehicle 7900.
  • An imaging unit 7910 provided in the front nose and an imaging unit 7918 provided in the upper part of the windshield in the vehicle interior mainly acquire an image in front of the vehicle 7900.
  • Imaging units 7912 and 7914 provided in the side mirror mainly acquire an image of the side of the vehicle 7900.
  • An imaging unit 7916 provided in the rear bumper or the back door mainly acquires an image behind the vehicle 7900.
  • the imaging unit 7918 provided on the upper part of the windshield in the passenger compartment is mainly used for detecting a preceding vehicle or a pedestrian, an obstacle, a traffic light, a traffic sign, a lane, or
  • FIG. 28 shows an example of the shooting range of each of the imaging units 7910, 7912, 7914, and 7916.
  • the imaging range a indicates the imaging range of the imaging unit 7910 provided in the front nose
  • the imaging ranges b and c indicate the imaging ranges of the imaging units 7912 and 7914 provided in the side mirrors, respectively
  • the imaging range d The imaging range of the imaging part 7916 provided in the rear bumper or the back door is shown. For example, by superimposing the image data captured by the imaging units 7910, 7912, 7914, and 7916, an overhead image when the vehicle 7900 is viewed from above is obtained.
  • the vehicle outside information detection units 7920, 7922, 7924, 7926, 7928, and 7930 provided on the front, rear, sides, corners of the vehicle 7900 and the upper part of the windshield in the vehicle interior may be, for example, an ultrasonic sensor or a radar device.
  • the vehicle outside information detection units 7920, 7926, and 7930 provided on the front nose, the rear bumper, the back door, and the windshield in the vehicle interior of the vehicle 7900 may be, for example, LIDAR devices.
  • These outside information detection units 7920 to 7930 are mainly used for detecting a preceding vehicle, a pedestrian, an obstacle, and the like.
  • the vehicle exterior information detection unit 7400 causes the imaging unit 7410 to capture an image outside the vehicle and receives the captured image data. Further, the vehicle exterior information detection unit 7400 receives detection information from the vehicle exterior information detection unit 7420 connected thereto. When the vehicle exterior information detection unit 7420 is an ultrasonic sensor, a radar device, or a LIDAR device, the vehicle exterior information detection unit 7400 transmits ultrasonic waves, electromagnetic waves, or the like, and receives received reflected wave information.
  • the outside information detection unit 7400 may perform an object detection process or a distance detection process such as a person, a car, an obstacle, a sign, or a character on a road surface based on the received information.
  • the vehicle exterior information detection unit 7400 may perform environment recognition processing for recognizing rainfall, fog, road surface conditions, or the like based on the received information.
  • the vehicle outside information detection unit 7400 may calculate a distance to an object outside the vehicle based on the received information.
  • the outside information detection unit 7400 may perform image recognition processing or distance detection processing for recognizing a person, a car, an obstacle, a sign, a character on a road surface, or the like based on the received image data.
  • the vehicle exterior information detection unit 7400 performs processing such as distortion correction or alignment on the received image data, and combines the image data captured by the different imaging units 7410 to generate an overhead image or a panoramic image. Also good.
  • the vehicle exterior information detection unit 7400 may perform viewpoint conversion processing using image data captured by different imaging units 7410.
  • the vehicle interior information detection unit 7500 detects vehicle interior information.
  • a driver state detection unit 7510 that detects the driver's state is connected to the in-vehicle information detection unit 7500.
  • Driver state detection unit 7510 may include a camera that captures an image of the driver, a biosensor that detects biometric information of the driver, a microphone that collects sound in the passenger compartment, and the like.
  • the biometric sensor is provided, for example, on a seat surface or a steering wheel, and detects biometric information of an occupant sitting on the seat or a driver holding the steering wheel.
  • the vehicle interior information detection unit 7500 may calculate the degree of fatigue or concentration of the driver based on the detection information input from the driver state detection unit 7510, and determines whether the driver is asleep. May be.
  • the vehicle interior information detection unit 7500 may perform a process such as a noise canceling process on the collected audio signal.
  • the integrated control unit 7600 controls the overall operation in the vehicle control system 7000 according to various programs.
  • An input unit 7800 is connected to the integrated control unit 7600.
  • the input unit 7800 is realized by a device that can be input by a passenger, such as a touch panel, a button, a microphone, a switch, or a lever.
  • the integrated control unit 7600 may be input with data obtained by recognizing voice input through a microphone.
  • the input unit 7800 may be, for example, a remote control device using infrared rays or other radio waves, or may be an external connection device such as a mobile phone or a PDA (Personal Digital Assistant) that supports the operation of the vehicle control system 7000. May be.
  • the input unit 7800 may be, for example, a camera.
  • the passenger can input information using a gesture.
  • data obtained by detecting the movement of the wearable device worn by the passenger may be input.
  • the input unit 7800 may include, for example, an input control circuit that generates an input signal based on information input by a passenger or the like using the input unit 7800 and outputs the input signal to the integrated control unit 7600.
  • a passenger or the like operates the input unit 7800 to input various data or instruct a processing operation to the vehicle control system 7000.
  • the storage unit 7690 may include a ROM (Read Only Memory) that stores various programs executed by the microcomputer, and a RAM (Random Access Memory) that stores various parameters, calculation results, sensor values, and the like.
  • the storage unit 7690 may be realized by a magnetic storage device such as an HDD (Hard Disc Drive), a semiconductor storage device, an optical storage device, a magneto-optical storage device, or the like.
  • General-purpose communication I / F 7620 is a general-purpose communication I / F that mediates communication with various devices existing in the external environment 7750.
  • General-purpose communication I / F7620 is a cellular communication protocol such as GSM (Global System of Mobile communications), WiMAX, LTE (Long Term Evolution) or LTE-A (LTE-Advanced), or wireless LAN (Wi-Fi (registered trademark)). Other wireless communication protocols such as Bluetooth (registered trademark) may also be implemented.
  • the general-purpose communication I / F 7620 is connected to a device (for example, an application server or a control server) existing on an external network (for example, the Internet, a cloud network, or an operator-specific network) via, for example, a base station or an access point.
  • the general-purpose communication I / F 7620 is a terminal (for example, a driver, a pedestrian or a store terminal, or an MTC (Machine Type Communication) terminal) that exists in the vicinity of the vehicle using, for example, P2P (Peer To Peer) technology. You may connect with.
  • a terminal for example, a driver, a pedestrian or a store terminal, or an MTC (Machine Type Communication) terminal
  • P2P Peer To Peer
  • the dedicated communication I / F 7630 is a communication I / F that supports a communication protocol formulated for use in vehicles.
  • the dedicated communication I / F 7630 is a standard protocol such as WAVE (Wireless Access in Vehicle Environment), DSRC (Dedicated Short Range Communications), or cellular communication protocol, which is a combination of the lower layer IEEE 802.11p and the upper layer IEEE 1609. May be implemented.
  • the dedicated communication I / F 7630 typically includes vehicle-to-vehicle communication, vehicle-to-infrastructure communication, vehicle-to-home communication, and vehicle-to-pedestrian communication. ) Perform V2X communication, which is a concept that includes one or more of the communications.
  • the positioning unit 7640 receives, for example, a GNSS signal from a GNSS (Global Navigation Satellite System) satellite (for example, a GPS signal from a GPS (Global Positioning System) satellite), performs positioning, and performs latitude, longitude, and altitude of the vehicle.
  • the position information including is generated.
  • the positioning unit 7640 may specify the current position by exchanging signals with the wireless access point, or may acquire position information from a terminal such as a mobile phone, PHS, or smartphone having a positioning function.
  • the beacon receiving unit 7650 receives, for example, radio waves or electromagnetic waves transmitted from a radio station installed on the road, and acquires information such as the current position, traffic jam, closed road, or required time. Note that the function of the beacon receiving unit 7650 may be included in the dedicated communication I / F 7630 described above.
  • the in-vehicle device I / F 7660 is a communication interface that mediates the connection between the microcomputer 7610 and various in-vehicle devices 7760 present in the vehicle.
  • the in-vehicle device I / F 7660 may establish a wireless connection using a wireless communication protocol such as a wireless LAN, Bluetooth (registered trademark), NFC (Near Field Communication), or WUSB (Wireless USB).
  • the in-vehicle device I / F 7660 is connected to a USB (Universal Serial Bus), HDMI (High-Definition Multimedia Interface), or MHL (Mobile High-definition Link) via a connection terminal (and a cable if necessary). ) Etc. may be established.
  • the in-vehicle device 7760 may include, for example, at least one of a mobile device or a wearable device that a passenger has, or an information device that is carried into or attached to the vehicle.
  • In-vehicle device 7760 may include a navigation device that searches for a route to an arbitrary destination.
  • In-vehicle device I / F 7660 exchanges control signals or data signals with these in-vehicle devices 7760.
  • the in-vehicle network I / F 7680 is an interface that mediates communication between the microcomputer 7610 and the communication network 7010.
  • the in-vehicle network I / F 7680 transmits and receives signals and the like in accordance with a predetermined protocol supported by the communication network 7010.
  • the microcomputer 7610 of the integrated control unit 7600 is connected via at least one of a general-purpose communication I / F 7620, a dedicated communication I / F 7630, a positioning unit 7640, a beacon receiving unit 7650, an in-vehicle device I / F 7660, and an in-vehicle network I / F 7680.
  • the vehicle control system 7000 is controlled according to various programs based on the acquired information. For example, the microcomputer 7610 calculates a control target value of the driving force generation device, the steering mechanism, or the braking device based on the acquired information inside and outside the vehicle, and outputs a control command to the drive system control unit 7100. Also good.
  • the microcomputer 7610 realizes ADAS (Advanced Driver Assistance System) functions including vehicle collision avoidance or impact mitigation, following traveling based on inter-vehicle distance, vehicle speed maintaining traveling, vehicle collision warning, or vehicle lane departure warning. You may perform the cooperative control for the purpose. Further, the microcomputer 7610 controls the driving force generator, the steering mechanism, the braking device, or the like based on the acquired information on the surroundings of the vehicle, so that the microcomputer 7610 automatically travels independently of the driver's operation. You may perform the cooperative control for the purpose of driving.
  • ADAS Advanced Driver Assistance System
  • the microcomputer 7610 is information acquired via at least one of the general-purpose communication I / F 7620, the dedicated communication I / F 7630, the positioning unit 7640, the beacon receiving unit 7650, the in-vehicle device I / F 7660, and the in-vehicle network I / F 7680.
  • the three-dimensional distance information between the vehicle and the surrounding structure or an object such as a person may be generated based on the above and local map information including the peripheral information of the current position of the vehicle may be created.
  • the microcomputer 7610 may generate a warning signal by predicting a danger such as a collision of a vehicle, approach of a pedestrian or the like or an approach to a closed road based on the acquired information.
  • the warning signal may be, for example, a signal for generating a warning sound or lighting a warning lamp.
  • the audio image output unit 7670 transmits an output signal of at least one of audio and image to an output device capable of visually or audibly notifying information to a vehicle occupant or the outside of the vehicle.
  • an audio speaker 7710, a display unit 7720, and an instrument panel 7730 are illustrated as output devices.
  • Display unit 7720 may include at least one of an on-board display and a head-up display, for example.
  • the display portion 7720 may have an AR (Augmented Reality) display function.
  • the output device may be other devices such as headphones, wearable devices such as glasses-type displays worn by passengers, projectors, and lamps.
  • the display device can display the results obtained by various processes performed by the microcomputer 7610 or information received from other control units in various formats such as text, images, tables, and graphs. Display visually. Further, when the output device is an audio output device, the audio output device converts an audio signal made up of reproduced audio data or acoustic data into an analog signal and outputs it aurally.
  • At least two control units connected via the communication network 7010 may be integrated as one control unit.
  • each control unit may be configured by a plurality of control units.
  • the vehicle control system 7000 may include another control unit not shown.
  • some or all of the functions of any of the control units may be given to other control units. That is, as long as information is transmitted and received via the communication network 7010, the predetermined arithmetic processing may be performed by any one of the control units.
  • a sensor or device connected to one of the control units may be connected to another control unit, and a plurality of control units may transmit / receive detection information to / from each other via the communication network 7010. .
  • the computer program for realizing the functions of the generation device 12 and the display device 200 according to the present embodiment described with reference to FIGS. 1 to 25 can be implemented in any control unit or the like. It is also possible to provide a computer-readable recording medium in which such a computer program is stored.
  • the recording medium is, for example, a magnetic disk, an optical disk, a magneto-optical disk, a flash memory, or the like. Further, the above computer program may be distributed via a network, for example, without using a recording medium.
  • the generation device 12 and the display device 200 according to this embodiment described with reference to FIGS. 1 to 25 can be applied.
  • the generation device 12 and the display device 200 are integrated and correspond to the microcomputer 7610, the storage unit 7690, and the display unit 7720.
  • the imaging device 11 corresponds to the imaging unit 7410.
  • the vehicle control system 7000 can represent a three-dimensional structure of a larger number of regions using the two viewpoints of the texture image and the depth image.
  • the components of the generation device 12 and the display device 200 described with reference to FIGS. 1 to 25 are modules (for example, one die) for the vehicle control system 7000 shown in FIG. Integrated circuit module).
  • the generation device 12 and the display device 200 described with reference to FIGS. 1 to 25 may be realized by a plurality of control units of the vehicle control system 7000 illustrated in FIG.
  • the present disclosure can take a cloud computing configuration in which one function is shared by a plurality of devices via a network and is processed jointly.
  • each step described in the above flowchart can be executed by one device or can be shared by a plurality of devices.
  • the plurality of processes included in the one step can be executed by being shared by a plurality of apparatuses in addition to being executed by one apparatus.
  • this indication can also take the following structures.
  • An image generation unit that generates a texture image of a predetermined viewpoint using a depth image corresponding to the image;
  • An image processing apparatus comprising: a viewpoint corresponding to the depth image; another viewpoint that constitutes the two viewpoints; and a quantization unit that quantizes a reciprocal of a distance between the polygon in each pixel.
  • the quantization unit also includes a quantization method other than a quantization method for quantizing a reciprocal of a distance between a viewpoint corresponding to the depth image, another viewpoint constituting the two viewpoints, and the polygon in each pixel. Switching the quantization method based on a predetermined condition, The image processing apparatus according to (1).
  • the quantization unit includes a quantization method for the depth image at each viewpoint, a first quantization method for quantizing a reciprocal of a distance between the viewpoint corresponding to the depth image and the polygon at each pixel, and the distance.
  • Second quantization method for quantizing, and third quantization method for quantizing the reciprocal of the distance between the viewpoint corresponding to the depth image, the other viewpoint constituting the two viewpoints, and the polygon in each pixel The image processing apparatus according to (1).
  • the distance corresponding to the first and second quantization methods is a distance of a straight line connecting the viewpoint corresponding to the depth image and the polygon in each pixel
  • the image processing apparatus according to (3), wherein the distance corresponding to the third quantization method is a distance of a straight line connecting the other viewpoint and the polygon in each pixel.
  • the quantization unit is configured to select, for each viewpoint, a quantization method for the depth image based on an angle formed by the depth direction of the texture image of the viewpoint and the depth direction of the texture image of the predetermined viewpoint.
  • the image processing apparatus according to (3) or (4).
  • (6) When the angle is greater than or equal to 0 degree and less than the first threshold, or when the angle is greater than or equal to the second threshold and less than 360 degrees, the quantization unit performs the first quantization as the depth image quantization method. Select a method and The first threshold is less than 90 degrees; The image processing apparatus according to (5), wherein the second threshold is configured to be greater than 270 degrees.
  • the quantization unit is configured to quantize the depth image. Selecting the second quantization method; The image processing apparatus according to (6), wherein the third threshold value is configured to be greater than 90 degrees and smaller than 180 degrees. The fourth threshold value may be larger than 180 degrees and smaller than 270 degrees.
  • the quantization unit is configured to select the third quantization method as the depth image quantization method when the angle is greater than or equal to the third threshold and less than the fourth threshold. The image processing apparatus according to 7).
  • the polygon is arranged around a subject corresponding to the polygon, and uses a captured image acquired by a plurality of imaging devices including at least a part of the subject in an imaging range and a depth image corresponding to the captured image.
  • the image processing device according to any one of (1) to (8), configured to be generated.
  • the image generation unit includes a texture image of an omnidirectional image generated using the captured images acquired by the plurality of imaging devices, and a depth image corresponding to the captured images acquired by the plurality of imaging devices.
  • the image processing apparatus according to (9), configured to generate the texture image of the predetermined viewpoint using the depth image of the omnidirectional image generated using the image.
  • the image processing device A texture image obtained by projecting the back surface of the polygon onto a projection plane perpendicular to the line-of-sight direction from each viewpoint toward the center of the polygon for each of two viewpoints facing the center of the polygon, and the texture at each viewpoint
  • An image processing method comprising: a quantization step for quantizing a reciprocal of a distance between a viewpoint corresponding to the depth image, another viewpoint constituting the two viewpoints, and the polygon in each pixel.
  • a texture image generating unit that generates a texture image by projecting the back surface of the polygon onto a projection plane perpendicular to the line-of-sight direction from each viewpoint toward the center of the polygon for each of two viewpoints facing the center of the polygon;
  • the depth image corresponding to the texture image of each viewpoint is quantized by a quantization method that quantizes the reciprocal of the distance between the viewpoint corresponding to the depth image, the other viewpoint constituting the two viewpoints, and the polygon in each pixel.
  • An image processing apparatus comprising: a depth image generation unit that generates a converted quantization value as a pixel value.
  • the depth image generation unit also includes a quantization method other than a quantization method for quantizing a reciprocal of a distance between a viewpoint corresponding to the depth image, another viewpoint constituting the two viewpoints, and the polygon at each pixel. And switching the quantization method based on a predetermined condition, The image processing apparatus according to (12).
  • the depth image generation unit is configured to quantize the depth image at each viewpoint, a first quantization method for quantizing a reciprocal of a distance between the viewpoint corresponding to the depth image and the polygon at each pixel, and the distance. And a third quantization method for quantizing a reciprocal of a distance between a viewpoint corresponding to the depth image, another viewpoint constituting the two viewpoints, and the polygon at each pixel.
  • the image processing apparatus comprising a method.
  • the distance corresponding to the first and second quantization methods is a distance of a straight line connecting the viewpoint corresponding to the depth image and the polygon in each pixel
  • the image processing apparatus according to (14), wherein the distance corresponding to the third quantization method is a distance of a straight line connecting the other viewpoint and the polygon in each pixel.
  • the depth image generation unit generates the depth image of the two viewpoints in each of the first to third quantization methods;
  • the polygon Using the captured images obtained by a plurality of imaging devices arranged around the subject corresponding to the polygon and including at least a part of the subject in the imaging range, and the depth image corresponding to the captured image, the polygon
  • the image processing apparatus according to any one of (12) to (17), further including a polygon generation unit that generates (19) Using the captured images acquired by the plurality of imaging devices, a texture image of an omnidirectional image is generated, and using the depth images corresponding to the captured images acquired by the plurality of imaging devices, the total image
  • the image processing device A texture image generating step for generating a texture image by projecting the back surface of the polygon onto a projection plane perpendicular to the line-of-sight direction from each viewpoint toward the center of the polygon for each of two viewpoints facing the center of the polygon;
  • the depth image corresponding to the texture image of each viewpoint is quantized by a quantization method that quantizes the reciprocal of the distance between the viewpoint corresponding to the depth image, the other viewpoint constituting the two viewpoints, and the polygon in each pixel.
  • 11-1 to 11-N photographing device 12 generating device, 34 polygon generating unit, 36 omnidirectional image generating unit, 40 transmitting unit, 61 subject, 71 texture image generating unit, 74 1 / r quantizing unit, 75, etc.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Graphics (AREA)
  • Image Generation (AREA)
  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)

Abstract

本開示は、より多くの領域の3次元構造を表現する2視点のテクスチャ画像とデプス画像を用いて画像を生成することができるようにする画像処理装置および画像処理方法に関する。 選択部は、各視点のデプス画像の量子化方法を、デプス画像に対応する視点と各画素におけるポリゴンとの距離rの逆数1/rを量子化する第1の量子化方法、距離rを量子化する第2の量子化方法、および、デプス画像に対応する視点と2視点を構成する他の視点と各画素におけるポリゴンとの距離r´の逆数1/r´を量子化する第3の量子化方法から選択する。本開示は、例えば、表示装置等に適用することができる。

Description

画像処理装置および画像処理方法
 本開示は、画像処理装置および画像処理方法に関し、特に、2視点のテクスチャ画像とデプス画像を用いて、より多くの領域の3次元構造を表現することができるようにした画像処理装置および画像処理方法に関する。
 物体の3次元構造を表現する手法としては、主に、物体のポリゴン(3Dメッシュ)と、そのポリゴンに貼り付けるテクスチャとを用いて表現する手法と、複数の視点に対して物体を透視投影することにより得られるテクスチャ画像とデプス画像を用いて表現する手法が挙げられる。前者の手法は、一般的なCG(Computer Graphics)技術で用いられる手法である。後者の手法(以下、2Dデプス手法という)は、被写体を透視投影することにより得られる画像である撮影画像との親和性が高い。
 2Dデプス手法で物体の3次元構造が表現される場合、3次元構造を表現するデータは、MPEG MVD(Moving Picture Experts Group phase Multi-view+depth)等の符号化方式を用いて符号化される(例えば、非特許文献1参照)。
妹尾孝憲、山本健詞、大井隆太朗、栗田泰市郎「MPEG多視点映像符号化の標準化活動」情報通信研究機構季報Vol.56 Nos.1/2、2010年3月発行
 以上のように、2Dデプス手法は、複数の視点に対して物体を透視投影することにより得られるテクスチャ画像(2次元画像)と、そのテクスチャ画像に対応するデプス画像とを用いて、物体の3次元構造を表現する手法である。従って、物体の透視投影されない領域の3次元構造については表現することができない。
 よって、透視投影する視点の数を増加させ、透視投影される領域を増加させることにより、より多くの領域の3次元構造を表現することができる。しかしながら、透視投影する視点の数が多いほど、3次元構造を表現するために必要なデータ量は増加する。
 本開示は、このような状況に鑑みてなされたものであり、2視点のテクスチャ画像とデプス画像を用いて、より多くの領域の3次元構造を表現することができるようにするものである。
 本開示の第1の側面の画像処理装置は、ポリゴンの中心に対して対向する2視点のそれぞれについて各視点から前記ポリゴンの中心に向かう視線方向に垂直な投影面に前記ポリゴンの裏面を投影することにより得られるテクスチャ画像と、各視点の前記テクスチャ画像に対応するデプス画像とを用いて、所定の視点のテクスチャ画像を生成する画像生成部と、前記デプス画像に対応する視点と前記2視点を構成する他の視点と各画素における前記ポリゴンとの距離の逆数を量子化する量子化部とを備える画像処理装置である。
 本開示の第1の側面の画像処理方法は、本開示の第1の側面の画像処理装置に対応する。
 本開示の第1の側面においては、ポリゴンの中心に対して対向する2視点のそれぞれについて各視点から前記ポリゴンの中心に向かう視線方向に垂直な投影面に前記ポリゴンの裏面を投影することにより得られるテクスチャ画像と、各視点の前記テクスチャ画像に対応するデプス画像とを用いて、所定の視点のテクスチャ画像が生成される。なお、各視点の前記デプス画像の量子化方法は、前記デプス画像に対応する視点と前記2視点を構成する他の視点と各画素における前記ポリゴンとの距離の逆数を量子化する量子化方法とされる。
 本開示の第2の側面の画像処理装置は、ポリゴンの中心に対して対向する2視点のそれぞれについて各視点から前記ポリゴンの中心に向かう視線方向に垂直な投影面に前記ポリゴンの裏面を投影することによりテクスチャ画像を生成するテクスチャ画像生成部と、各視点の前記テクスチャ画像に対応するデプス画像を、前記デプス画像に対応する視点と前記2視点を構成する他の視点と各画素における前記ポリゴンとの距離の逆数を量子化する量子化方法で量子化された量子化値を画素値とすることにより生成するデプス画像生成部とを備える画像処理装置である。
 本開示の第2の側面の画像処理方法は、本開示の第2の側面の画像処理装置に対応する。
 本開示の第2の側面においては、ポリゴンの中心に対して対向する2視点のそれぞれについて各視点から前記ポリゴンの中心に向かう視線方向に垂直な投影面に前記ポリゴンの裏面を投影することによりテクスチャ画像が生成され、各視点の前記テクスチャ画像に対応するデプス画像が、前記デプス画像に対応する視点と前記2視点を構成する他の視点と各画素における前記ポリゴンとの距離の逆数を量子化する量子化方法で量子化された量子化値を画素値とすることにより生成される。
 なお、本開示の第1の側面および第2の側面の画像処理装置は、コンピュータにプログラムを実行させることにより実現することができる。
 また、本開示の第1の側面および第2の側面の画像処理装置を実現するために、コンピュータに実行させるプログラムは、伝送媒体を介して伝送することにより、又は、記録媒体に記録して、提供することができる。
 本開示の第1の側面によれば、画像を生成することができる。本開示の第1の側面によれば、より多くの領域の3次元構造を表現する2視点のテクスチャ画像とデプス画像を用いて画像を生成することができる。
 また、本開示の第2の側面によれば、画像を生成することができる。本開示の第2の側面によれば、2視点のテクスチャ画像とデプス画像を用いて、より多くの領域の3次元構造を表現することができる。
 なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。
本開示を適用した画像処理装置としての生成装置の第1実施の形態の構成例を示すブロック図である。 撮影装置の配置例を示す図である。 図1の描画部の構成例を示すブロック図である。 距離rを説明する図である。 各ポリゴンの表面を透視投影することにより生成されるテクスチャ画像と、そのテクスチャ画像に対応するデプス画像とを説明する図である。 各ポリゴンの表面を透視投影することにより生成されるテクスチャ画像と、そのテクスチャ画像に対応するデプス画像とを説明する図である。 各ポリゴンの表面を透視投影することにより生成されるテクスチャ画像と、そのテクスチャ画像に対応するデプス画像とを説明する図である。 球の裏面を透視投影することにより生成されるテクスチャ画像と、そのテクスチャ画像に対応するデプス画像とを説明する図である。 球の裏面を透視投影することにより生成されるテクスチャ画像と、そのテクスチャ画像に対応するデプス画像とを説明する図である。 各ポリゴンの裏面を透視投影することにより生成されるテクスチャ画像と、そのテクスチャ画像に対応するデプス画像とを説明する図である。 各ポリゴンの裏面を透視投影することにより生成されるテクスチャ画像と、そのテクスチャ画像に対応するデプス画像とを説明する図である。 各ポリゴンの裏面を透視投影することにより生成されるテクスチャ画像と、そのテクスチャ画像に対応するデプス画像とを説明する図である。 生成処理を説明するフローチャートである。 本開示を適用した画像処置装置としての表示装置の第1実施の形態の構成例を示すブロック図である。 量子化方法の選択を説明する図である。 量子化方法の選択を説明する図である。 量子化方法の選択を説明する図である。 量子化方法の選択を説明する図である。 第1の再構成方法を説明する図である。 第2の再構成方法を説明する図である。 表示処理を説明するフローチャートである。 量子化情報生成処理を説明するフローチャートである。 テクスチャ画像の他の例を示す図である。 投影面の座標系を説明する図である。 tan軸投影を説明する図である。 コンピュータのハードウエアの構成例を示すブロック図である。 車両制御システムの概略的な構成の一例を示すブロック図である。 車外情報検出部及び撮像部の設置位置の一例を示す説明図である。
 以下、本開示を実施するための形態(以下、実施の形態という)について説明する。なお、説明は以下の順序で行う。
 1.第1実施の形態:生成装置および表示装置(図1乃至図22)
 2.テクスチャ画像の他の例(図23)
 3.第2実施の形態:tan軸投影(図24,25)
 4.第3実施の形態:コンピュータ(図26)
 5.応用例(図27および図28)
 <第1実施の形態>
 (生成装置の構成例)
 図1は、本開示を適用した画像処理装置としての生成装置の第1実施の形態の構成例を示すブロック図である。
 図1の生成装置12は、撮影装置11-1乃至11-N(Nは2以上)により取得された撮影画像とデプス画像とを用いて、撮影画像内の主要な被写体のテクスチャ画像およびデプス画像、並びに、全天球画像のテクスチャ画像およびデプス画像を生成する。
 具体的には、撮影装置11-1乃至11-Nは、主要な被写体の周囲に配置され、主要な被写体の少なくとも一部を撮影範囲に含む。撮影装置11-1乃至11-Nは、それぞれ、撮影画像カメラ21とデプス画像カメラ22により構成される。撮影画像カメラ21は、被写体を撮影してフレーム単位で撮影画像を取得し、生成装置12に供給する。デプス画像カメラ22は、撮影画像の各画素における被写体の奥行き方向の位置をフレーム単位で取得して、その位置を表す情報を画素値とするデプス画像を生成し、生成装置12に供給する。なお、以下では、撮影装置11-1乃至11-Nを特に区別する必要がない場合、それらをまとめて撮影装置11という。
 生成装置12は、領域抽出部31、位置情報生成部32、カラー情報生成部33、ポリゴン生成部34、描画部35、全天球画像生成部36、低解像度化部37、エンコーダ38、記憶部39、および送信部40により構成される。
 生成装置12の領域抽出部31は、N個の撮影装置11から供給されるN個の撮影画像とデプス画像から、主要な被写体の領域を抽出し、位置情報生成部32に供給する。また、領域抽出部31は、N個の撮影画像とデプス画像から、主要な被写体の領域以外の領域を背景領域として抽出し、全天球画像生成部36に供給する。
 位置情報生成部32は、領域抽出部31から供給される主要な被写体の領域のN個のデプス画像を用いて、主要な被写体に対応する1以上のポリゴンの位置情報を生成する。ポリゴンの位置情報とは、主要な被写体の中心を原点とする3次元座標系である3Dモデル座標系のポリゴンの各頂点の3次元座標である。位置情報生成部32は、各ポリゴンの位置情報をカラー情報生成部33とポリゴン生成部34に供給する。また、位置情報生成部32は、主要な被写体の領域のN個の撮影画像をカラー情報生成部33に供給する。
 カラー情報生成部33は、位置情報生成部32から供給される各ポリゴンの位置情報と主要な被写体のN個の撮影画像を用いて、各ポリゴンの表面と裏面のRGB値などのカラー情報を生成する。具体的には、カラー情報生成部33は、各ポリゴンに対応する撮影画像の画素値を用いて、そのポリゴンの表面のカラー情報を生成する。また、カラー情報生成部33は、各ポリゴンの表面のカラー情報を、そのポリゴンの裏面のカラー情報としても生成する。カラー情報生成部33は、各ポリゴンの表面と裏面のカラー情報をポリゴン生成部34に供給する。
 なお、ポリゴンの表面のカラー情報は、ポリゴンの各頂点の3Dモデル座標系における3次元座標を、表面の法線ベクトルを軸として時計周りで記述し、その3次元座標に対応してカラー情報を記述することにより表現される。ポリゴンの裏面のカラー情報も、表面のカラー情報と同様に表現される。
 ポリゴン生成部34は、位置情報生成部32から供給される各ポリゴンの位置情報に基づいて各ポリゴンを生成し、カラー情報生成部33から供給される各ポリゴンの表面と裏面のカラー情報に基づいて、各ポリゴンの表面および裏面に対してテクスチャを貼り付ける。ポリゴン生成部34は、表面および裏面に対してテクスチャが貼り付けられた各ポリゴンを描画部35に供給する。
 描画部35(画像生成部)は、主要な被写体の1以上のポリゴンの中心である3Dモデル座標系の原点に対して対向する予め決められた2視点のそれぞれについて、各ポリゴンの裏面を透視投影面に透視投影することにより、2視点のテクスチャ画像を生成する。具体的には、描画部35は、2視点のそれぞれについて、各ポリゴンの裏面を、各視点から原点に向かう視線方向の直線が中心を通る法線である透視投影面に透視投影することにより、2視点のテクスチャ画像を生成する。本明細書において、「対向する位置」とは、対向する位置そのものだけでなく、本開示の技術的効果を奏する範囲で、対向する位置の付近も含むものである。同様に、「法線」とは、法線そのものだけでなく、面に対する角度が垂直付近である線も含むものである。
 なお、テクスチャ画像のフォーマットは、特に限定されないが、例えばYCbCr420フォーマットを採用することができる。描画部35は、ポリゴンに基づいて、第1乃至第3の量子化方法で、2視点のテクスチャ画像それぞれに対応するデプス画像を生成する。描画部35は、2視点のテクスチャ画像と第1乃至第3の量子化方法で生成されたデプス画像をエンコーダ38に供給する。
 全天球画像生成部36は、領域抽出部31から供給される背景領域のN個の撮影画像を3Dモデル座標系の原点を中心とする正八面体に透視投影することにより、水平方向の周囲360度および垂直方向の周囲180度の全天球画像のテクスチャ画像を生成する。なお、全天球画像は、水平方向の周囲360度および垂直方向の周囲180度の球体の全空間の画像ではなく、本開示の技術的効果を奏すれば部分空間の画像であってもよい。全天球画像生成部36は、領域抽出部31から供給される背景領域のN個のデプス画像を、撮影画像と同様に正八面体に透視投影することにより、全天球画像のデプス画像を生成する。全天球画像生成部36は、全天球画像のテクスチャ画像とデプス画像を低解像度化部37に供給する。
 低解像度化部37は、全天球画像生成部36から供給される全天球画像のテクスチャ画像とデプス画像を低解像度化し、エンコーダ38に供給する。
 エンコーダ38は、描画部35から供給される2視点のテクスチャ画像と第1乃至第3の量子化方法で生成されたデプス画像を符号化し、低解像度化部37から供給される全天球画像のテクスチャ画像とデプス画像を符号化する。これらの符号化の符号化方式としては、AVC(Advanced Video Coding)方式、HEVC方式、MVD方式等を用いることができるが、ここでは、AVC方式を用いるものとする。
 従って、エンコーダ38は、符号化により、各視点のテクスチャ画像の符号化ストリーム(以下、視点テクスチャストリームという)と各量子化方法で生成されたデプス画像の符号化ストリーム(以下、視点デプスストリームという)を生成する。また、エンコーダ38は、符号化により、低解像度化された全天球画像のテクスチャ画像の符号化ストリーム(以下、全天球テクスチャストリームという)とデプス画像の符号化ストリーム(以下、全天球デプスストリームという)を生成する。エンコーダ38は、2視点の視点テクスチャストリームおよび第1乃至第3の量子化方法の視点デプスストリーム、並びに、全天球テクスチャストリームおよび全天球デプスストリームを記憶部39に供給する。
 記憶部39は、エンコーダ38から供給される2視点の視点テクスチャストリームおよび第1乃至第3の量子化方法の視点デプスストリーム、並びに、全天球テクスチャストリームおよび全天球デプスストリームを記憶する。
 送信部40は、視点ごとに、記憶部39に記憶されている第1乃至第3の量子化方法の視点デプスストリームのうちの、受信部41から供給される量子化方法情報が示す量子化方法の視点デプスストリームを読み出し、送信する。また、送信部40は、記憶部39に記憶されている2視点の視点テクスチャストリーム、並びに、全天球テクスチャストリームおよび全天球デプスストリームを読み出し、送信する。
 受信部41は、後述する表示装置から送信されてくる、第1乃至第3の量子化方法のうちの表示画像に対応する量子化方法を示す量子化方法情報を視点ごとに受信し、送信部40に供給する。
 以上のように、生成装置12は、主要な被写体の3次元構造を表現するポリゴンとカラー情報を、2視点のテクスチャ画像とデプス画像に変換する。従って、生成装置12は、2視点のテクスチャ画像とデプス画像を、一般的な画像の符号化方式を用いて符号化し、データ量を削減することができる。その結果、主要な被写体の3次元構造を表現するデータの伝送帯域を削減することができる。
 なお、図1の生成装置12は、ポリゴンとカラー情報を生成したが、CG技術において用いられる3次元構造を表現する情報であれば、ポイントクラウドなどの他の情報を生成するようにしてもよい。
 また、図1の例では、デプス画像カメラ22が、撮影画像と同一の画素数のデプス画像を取得するが、撮影画像より少ない画素数のデプス画像を取得する場合には、領域抽出部31と位置情報生成部32の間に、デプス画像の画素値を補間するデプス画像補間部が設けられる。この場合、デプス画像補間部は、デプス画像の画素値を補間し、デプス画像の画素数を撮影画像の画素数と同一にする。
 さらに、図1の例では、各撮影装置11がデプス画像を取得するようにしたが、デプス画像は、そのデプス画像に対応する撮影装置11と他の撮影装置11により取得された撮影画像から生成されるようにしてもよい。
 また、図1の例では、描画部35が第1乃至第3の全ての量子化方法でデプス画像を生成したが、受信部41により受信された量子化方法情報が示す量子化方法でのみデプス画像を生成するようにしてもよい。
 (撮影装置の配置例)
 図2は、図1の撮影装置11の配置例を示す図である。
 図2の例では、Nは9である。
 図2に示すように、9個の撮影装置11-1乃至11-9は、主要な被写体61の周囲に取り囲むように配置される。
 (描画部の構成例)
 図3は、図1の描画部35の構成例を示すブロック図である。
 図3の描画部35は、テクスチャ画像生成部71、r値取得部72、逆r値取得部73、1/r量子化部74、等間隔量子化部75、および逆1/r量子化部76により構成される。
 描画部35のテクスチャ画像生成部71は、2視点のそれぞれに対して、図1のポリゴン生成部34から供給される各ポリゴンの裏面を透視投影面に透視投影することにより、2視点のテクスチャ画像を生成し、図1のエンコーダ38に供給する。
 r値取得部72は、2視点のそれぞれについて、ポリゴン生成部34から供給される各ポリゴンに基づいて、その視点とテクスチャ画像の各画素におけるポリゴンとを結ぶ直線の距離rを求める。r値取得部72は、各視点の各画素の距離rを1/r量子化部74と等間隔量子化部75に供給する。
 逆r値取得部73は、2視点のそれぞれについて、ポリゴン生成部34から供給される各ポリゴンに基づいて、その視点と2視点を構成する他の視点とテクスチャ画像の各画素におけるポリゴンとを結ぶ直線の距離r´を求める。距離r´と距離rの関係は、以下の式(1)で表される。
 r´=rmax+rmin-r   ・・・(1)
 なお、rmax,rminは、それぞれ、テクスチャ画像の全画素における距離rの最大値、最小値である。逆r値取得部73は、各視点の各画素の距離r´を逆1/r量子化部76に供給する。
 1/r量子化部74(デプス画像生成部)は、視点ごとに、距離rの逆数を量子化する第1の量子化方法で、以下の式(2)により、r値取得部72から供給される各画素の距離rの逆数を量子化し、量子化後の値Id1(r)を求める。
Figure JPOXMLDOC01-appb-M000001
 1/r量子化部74は、視点ごとに、各画素の量子化後の値Id1(r)を画素値とするデプス画像を生成し、図1のエンコーダ38に供給する。
 等間隔量子化部75(デプス画像生成部)は、視点ごとに、距離rを量子化する第2の量子化方法で、以下の式(3)により、r値取得部72から供給される各画素の距離rを量子化し、量子化後の値Id2(r)を求める。
Figure JPOXMLDOC01-appb-M000002
 等間隔量子化部75は、視点ごとに、各画素の量子化後の値Id2(r)を画素値とするデプス画像を生成し、エンコーダ38に供給する。
 逆1/r量子化部76(デプス画像生成部)は、視点ごとに、距離r´の逆数を量子化する第3の量子化方法で、以下の式(4)により、逆r値取得部73から供給される各画素の距離r´の逆数を量子化し、量子化後の値Id3(r´)を求める。
Figure JPOXMLDOC01-appb-M000003
 逆1/r量子化部76は、視点ごとに、各画素の量子化後の値Id3(r´)を画素値とするデプス画像を生成し、エンコーダ38に供給する。
 (距離rの説明)
 図4は、距離rを説明する図である。
 図4の例では、ポリゴン生成部34により生成されるポリゴンが、視点O1のテクスチャ画像の奥行き方向zの視点O1との距離がzabである位置に、奥行き方向zに垂直な面80を形成している。
 この場合、視点O1のテクスチャ画像におけるポリゴンが、奥行き方向zと交差する面80上の点aである画素の距離rである距離rは、視点O1と点aを結ぶ奥行き方向zの直線の距離であり、距離zabである。
 また、視点O1のテクスチャ画像におけるポリゴンが、面80上の点aとは異なる点bである画素の距離rである距離rは、視点O1と点bを結ぶ奥行き方向zとは異なる方向の直線の距離であり、距離zabではない。
 (本開示の効果の説明)
 図5乃至図7は、3Dモデル座標系の原点に対して対向する2視点のそれぞれについて、各ポリゴンの表面を透視投影面に透視投影することにより生成されるテクスチャ画像と、そのテクスチャ画像に対応するデプス画像とを説明する図である。
 図5乃至図7の例では、主要な被写体のポリゴンが球81を形成する。この場合、図5のAに示すように、2視点のうちの一方の視点O1に対して、球81の表面を視線方向V1の透視投影面に透視投影することにより生成されるテクスチャ画像には、各投影方向82と最初に交差する球81上の表面の領域81Aに貼られたテクスチャが描画される。投影方向とは、視点から延びる、視線方向とのなす角の絶対値が画角の半分の角度(図3の例ではθ)の範囲内である方向である。また、このテクスチャ画像に対応するデプス画像は、視点O1に対する領域81Aの奥行き方向(視線方向V1)の位置を表す画像である。
 また、図5のBに示すように、2視点のうちの他方の視点O2に対して、球81の表面を視線方向V2の透視投影面に透視投影することにより生成されるテクスチャ画像には、各投影方向83と最初に交差する球81上の表面の領域81Bに貼られたテクスチャが描画される。また、このテクスチャ画像に対応するデプス画像は、視点O2に対する領域81Bの奥行き方向(視線方向V2)の位置を表す画像である。
 従って、図5のCに示すように、視点O1のテクスチャ画像およびデプス画像、並びに、視点O2のテクスチャ画像およびデプス画像により、球81の中心に対して互いに対向する2つの領域81Aと領域81Bの3次元構造を表現することができる。しかしながら、球の表面には、領域81Aと領域81B以外の領域が存在する。即ち、視点O1のテクスチャ画像およびデプス画像、並びに、視点O2のテクスチャ画像およびデプス画像では3次元構造を表現できない球81の表面の領域が存在する。
 例えば、球81の表面および裏面に世界地図がテクスチャとして貼られており、アフリカ沖大西洋上空が視点O1である場合、図6のAの左側に示すように、視点O1のテクスチャ画像101には、領域81Aの表面にテクスチャとして貼られたアフリカ大陸と南アメリカ大陸の一部が描画される。
 また、この場合、視点O2は太平洋上空であり、図6のBの左側に示すように、視点O2のテクスチャ画像102には、領域81Bの表面にテクスチャとして貼られたオーストラリア大陸の一部が描画される。しかしながら、南極大陸等は、テクスチャ画像101とテクスチャ画像102のいずれにも描画されない。
 また、図6のAの右側および図6のBの右側に示すように、テクスチャ画像101に対応するデプス画像111と、テクスチャ画像102に対応するデプス画像112は、同一である。なお、デプス画像は、各画素における被写体の奥行き方向の位置が遠いほど、画素値(輝度値)が小さい。従って、デプス画像111とデプス画像112は、中心の画素値が最も大きく、中心から離れるほど小さくなっている。
 以上のように、テクスチャ画像101とテクスチャ画像102のいずれにも、南極大陸等は描画されない。従って、図7に示すように、テクスチャ画像101およびデプス画像111並びにテクスチャ画像102およびデプス画像112を用いて再構成された3次元構造121は、表面および裏面に世界地図がテクスチャとして貼られた球81の一部分のみである。
 図5乃至図7の例では、ポリゴンの形状が比較的単純な球81であったが、ポリゴンの形状が複雑である場合、2視点のテクスチャ画像では3次元構造を表現できないポリゴンの領域が増加する。
 図8および図9は、視点O1に対して球81の裏面を視線方向V1の透視投影面に透視投影することにより生成されるテクスチャ画像と、そのテクスチャ画像に対応するデプス画像とを説明する図である。
 上述したように、視点O1に対して球81の表面を視線方向V1の透視投影面に透視投影することによりテクスチャ画像を生成する場合、テクスチャ画像には、図8に示すように、各投影方向82と最初に交差する球81上の表面の各点c1に貼られたテクスチャが描画される。また、このテクスチャ画像に対応するデプス画像は、視点O1に対する各点c1の奥行き方向(視線方向V1)の位置を表す画像である。
 一方、視点O1に対して球81の裏面を視線方向V1の透視投影面に透視投影することによりテクスチャ画像を生成する場合、テクスチャ画像には、図8に示すように、各投影方向82と最初に交差する球81上の裏面の各点c2に貼られたテクスチャが描画される。また、このテクスチャ画像に対応するデプス画像は、視点O2に対する各点c2の奥行き方向(視線方向V1)の位置を表す画像である。
 例えば、球81の表面および裏面に世界地図がテクスチャとして貼られており、アフリカ沖大西洋上空が視点O1である場合、図9に示すように、視点O1のテクスチャ画像131には、各点c2の裏面にテクスチャとして貼られた北アメリカ大陸、南アメリカ大陸の一部、南極大陸、ヨーロッパ大陸の一部、アジア大陸、およびオーストラリア大陸が描画される。また、テクスチャ画像131に対応するデプス画像132は、中心の画素値が最も小さく、中心から離れるほど小さくなる。
 図10乃至図12は、3Dモデル座標系の原点に対して対向する2視点のそれぞれについて、各ポリゴンの裏面を透視投影面に透視投影することにより生成されるテクスチャ画像と、そのテクスチャ画像に対応するデプス画像とを説明する図である。
 図10乃至図12の例では、主要な被写体のポリゴンが球81である。この場合、図10のAに示すように、視点O1に対して、球81の裏面を視線方向V1の透視投影面に透視投影することにより生成されるテクスチャ画像には、各投影方向82と最初に交差する球81上の裏面の領域153Aに貼られたテクスチャが描画される。また、このテクスチャ画像に対応するデプス画像は、視点O1に対する領域81Aの奥行き方向(視線方向V1)の位置を表す画像である。
 また、図10のBに示すように、2視点のうちの他方の視点O2に対して、球81の裏面を視線方向V2の透視投影面に透視投影することにより生成されるテクスチャ画像には、各投影方向83と最初に交差する球81上の裏面の領域153Bに貼られたテクスチャが描画される。また、このテクスチャ画像に対応するデプス画像は、視点O2に対する領域81Bの奥行き方向(視線方向V2)の位置を表す画像である。
 従って、図8Cに示すように、視点O1のテクスチャ画像およびデプス画像、並びに、視点O2のテクスチャ画像およびデプス画像により、球81の中心に対して互いに対向する2つの領域153Aおよび領域153Bの3次元構造を表現することができる。
 なお、図10のCに示すように、領域153Aおよび領域153Bは重複する。従って、視点O1のテクスチャ画像およびデプス画像、並びに、視点O2のテクスチャ画像およびデプス画像により、球81の全ての3次元構造を表現することができることになる。
 例えば、球81の表面および面に世界地図がテクスチャとして貼られており、アフリカ沖大西洋上空が視点O1である場合、図11のAの左側に示すように、視点O1のテクスチャ画像161には、領域153Aの裏面にテクスチャとして貼られた北アメリカ大陸、南アメリカ大陸の一部、南極大陸、ヨーロッパ大陸の一部、アジア大陸、オーストラリア大陸が描画される。
 また、この場合、視点O2は太平洋上空であり、図11のBの左側に示すように、視点O2のテクスチャ画像162には、領域153Bの裏面にテクスチャとして貼られたアフリカ大陸、北アメリカ大陸、南アメリカ大陸、南極大陸、ヨーロッパ大陸の一部が描画される。従って、7大陸の全てが、テクスチャ画像161とテクスチャ画像162の少なくとも一方に描画される。
 また、図11のAおよび図11のBの右側に示すように、テクスチャ画像161に対応するデプス画像163と、テクスチャ画像162に対応するデプス画像164は、同一である。デプス画像163とデプス画像164は、中心の画素値が最も小さく、中心から離れるほど大きくなっている。
 以上のように、7大陸の全てが、テクスチャ画像161とテクスチャ画像162の少なくとも一方に描画される。従って、図12のAに示すように、テクスチャ画像161とデプス画像163を用いて再構成された3次元構造171は、球81の視点O2側の半分(図中右半分)より大きい部分である。また、図12のBに示すように、テクスチャ画像162とデプス画像164を用いて再構成された3次元構造172は、球81の視点O1側の半分(図中左半分)より大きい部分である。よって、テクスチャ画像161およびデプス画像163並びにテクスチャ画像162およびデプス画像164を用いて3次元構造を再構成することにより、球81全体を生成することができる。
 なお、領域153Aと領域153Bの重複領域は、テクスチャ画像161およびデプス画像163と、テクスチャ画像162およびデプス画像164のいずれか一方を用いて生成される。
 例えば、図10のAに示すように、領域153Aと領域153Bの重複領域のうちの領域153Aの端部の領域154は、視点O1に対して透視投影される場合、投影方向82との角度が小さい。従って、テクスチャ画像161とデプス画像163では、領域154の3次元構造を高精度で表現することはできない。
 しかしながら、図10のBに示すように、領域154は、視点O2に対して透視投影される場合、投影方向83との角度が、視点O1に対して透視投影される場合に比べて大きくなる。従って、テクスチャ画像162とデプス画像164では、テクスチャ画像161とデプス画像163に比べて、領域154の3次元構造を高精度で表現することができる。よって、領域154は、テクスチャ画像162とデプス画像164を用いて生成される。
 以上のように、領域153Aと領域153Bの重複領域を、テクスチャ画像161およびデプス画像163と、テクスチャ画像162およびデプス画像164のうちの、重複領域との角度が大きい投影方向に対応する方を用いて生成することにより、球81の再構成の精度を向上させることができる。
 (生成装置の処理の説明)
 図13は、図1の生成装置12の生成処理を説明するフローチャートである。この生成処理は、N個の撮影装置11により取得されるN個の撮影画像とデプス画像のフレームごとに行われる。
 図13のステップS11において、生成装置12の領域抽出部31は、撮影装置11から供給されるN個の撮影画像とデプス画像から、主要な被写体の領域と背景領域を抽出する。領域抽出部31は、主要な被写体の領域のN個の撮影画像とデプス画像を位置情報生成部32に供給し、背景領域のN個の撮影画像とデプス画像を全天球画像生成部36に供給する。
 ステップS12において、位置情報生成部32は、領域抽出部31から供給される主要な被写体の領域のN個のデプス画像を用いて、主要な被写体の各ポリゴンの位置情報を生成し、カラー情報生成部33と描画部35に供給する。また、位置情報生成部32は、主要な被写体の領域のN個の撮影画像をカラー情報生成部33に供給する。
 ステップS13において、カラー情報生成部33は、位置情報生成部32から供給される各ポリゴンの位置情報と主要な被写体の領域のN個の撮影画像を用いて、各ポリゴンの表面と裏面のカラー情報を生成する。カラー情報生成部33は、各ポリゴンの表面と裏面のカラー情報を描画部35に供給する。
 ステップS14において、描画部35は、位置情報生成部32から供給される各ポリゴンの位置情報に基づいて各ポリゴンを生成し、カラー情報生成部33から供給される各ポリゴンの表面と裏面のカラー情報に基づいて、各ポリゴンの表面および裏面に対してテクスチャを貼り付ける。
 ステップS15において、描画部35のテクスチャ画像生成部71(図3)は、予め決められた2視点のそれぞれに対して、各ポリゴンの裏面を視線方向の透視投影面に透視投影することにより2視点のテクスチャ画像を生成する。描画部35は、2視点のテクスチャ画像をエンコーダ38に供給する。
 ステップS16において、r値取得部72は、ポリゴン生成部34から供給されるポリゴンに基づいて、各視点の各画素の距離rを求め、1/r量子化部74と等間隔量子化部75に供給する。
 ステップS17において、逆r値取得部73は、ポリゴン生成部34から供給されるポリゴンに基づいて、各視点の各画素の距離r´を求め、逆1/r量子化部76に供給する。
 ステップS18において、1/r量子化部74は、視点ごとに、第1の量子化方法で量子化後の値Id1(r)を求めることによりデプス画像を生成し、エンコーダ38に供給する。また、等間隔量子化部75は、視点ごとに、第2の量子化方法で量子化後の値Id2(r)を求めることによりデプス画像を生成し、エンコーダ38に供給する。さらに、逆1/r量子化部76は、第3の量子化方法で量子化後の値Id3(r´)を求めることによりデプス画像を生成し、エンコーダ38に供給する。
 ステップS19において、全天球画像生成部36は、領域抽出部31から供給される背景領域のN個の撮影画像を3Dモデル座標系の原点を中心とする正八面体に透視投影することにより、全天球画像のテクスチャ画像を生成し、低解像度化部37に供給する。
 ステップS20において、全天球画像生成部36は、領域抽出部31から供給される背景領域のN個のデプス画像を、撮影画像と同様に正八面体に透視投影することにより、全天球画像のデプス画像を生成し、低解像度化部37に供給する。
 ステップS21において、低解像度化部37は、全天球画像生成部36から供給される全天球画像のテクスチャ画像とデプス画像を低解像度化し、エンコーダ38に供給する。
 ステップS22において、エンコーダ38は、2視点のテクスチャ画像および第1乃至第3の量子化方法のデプス画像、並びに、全天球画像のテクスチャ画像およびデプス画像を符号化して記憶部39に供給し、記憶させる。
 ステップS23において、受信部41は、後述する表示装置から各視点の量子化情報が送信されてきたかどうかを判定する。ステップS23で各視点の量子化情報が送信されてきたと判定された場合、受信部41は、各視点の量子化情報を受信し、送信部40に供給する。
 そして、ステップS24において、送信部40は、視点ごとに、送信対象の視点デプスストリームの量子化方法を、受信部41から供給される量子化情報が示す量子化方法に設定し、処理をステップS25に進める。
 一方、ステップS23で量子化情報が送信されてきていないと判定された場合、送信部40は、現在の処理対象のフレームより前のフレームを処理対象としたときに設定された量子化方法を、現在の処理対象のフレームの量子化方法とする。そして、処理はステップS25に進む。
 ステップS25において、送信部40は、記憶部39に記憶されている2視点の視点テクスチャストリームおよび設定された量子化方法の視点デプスストリーム、並びに、全天球テクスチャストリームおよび全天球デプスストリームを読み出し、送信する。そして、処理は終了する。
 以上のように、生成装置12は、3Dモデル座標系の原点に対して対向する2視点のそれぞれについて各視点の視線方向の透視投影面にポリゴンの裏面を透視投影することにより、2視点のテクスチャ画像とデプス画像を生成する。従って、生成された2視点のテクスチャ画像とデプス画像は、ポリゴンの表面を透視投影することにより生成される場合に比べて、より多くの領域の主要な被写体のポリゴンの3次元構造を表現することができる。
 また、生成装置12は、第1乃至第3の量子化方法でデプス画像を生成する。従って、後述する表示装置は、第1乃至第3の量子化方法の視点デプスストリームから、表示画像に適した量子化方法の視点デプスストリームを選択的に用いて表示画像を生成することができる。
 (表示装置の構成例)
 図14は、本開示を適用した画像処置装置としての表示装置の第1実施の形態の構成例を示すブロック図である。
 図14の表示装置200は、図1の生成装置12から送信されてくる2視点の視点テクスチャストリームおよび所定の量子化方法の視点デプスストリーム、並びに、全天球テクスチャストリームおよび全天球デプスストリームを受信し、所定の視点のテクスチャ画像を表示画像として生成する。
 具体的には、表示装置200は、受信部201、記憶部202、デコーダ203、逆量子化部204、再構成部205、描画部206、表示部207、選択部208、および送信部209により構成される。
 表示装置200の受信部201は、生成装置12から送信されてくる2視点の視点テクスチャストリームおよび視点デプスストリーム、並びに、全天球テクスチャストリームおよび全天球デプスストリームを受信し、記憶部202に供給する。
 記憶部202は、受信部201から供給される2視点の視点テクスチャストリームおよび視点デプスストリーム、並びに、全天球テクスチャストリームおよび全天球デプスストリームを記憶する。
 デコーダ203は、記憶部202から2視点の視点テクスチャストリームおよび視点デプスストリーム、並びに、全天球テクスチャストリームおよび全天球デプスストリームを読み出し、復号する。デコーダ203は、復号の結果得られる2視点のテクスチャ画像およびデプス画像、並びに、全天球画像のテクスチャ画像およびデプス画像を再構成部205に供給する。また、デコーダ203は、復号の結果得られる2視点のデプス画像を逆量子化部204に供給する。
 逆量子化部204は、視点ごとに、選択部208から供給される量子化情報が示す量子化方法に対応する逆量子化方法で、デコーダ203から供給される2視点のデプス画像を逆量子化し、各画素の距離情報を生成する。距離情報は、量子化情報が第1の量子化方法を示す場合距離rの逆数1/rであり、量子化情報が第2の量子化方法を示す場合距離rであり、量子化情報が第3の量子化方法を示す場合距離r´の逆数1/r´である。逆量子化部204は、2視点のデプス画像の各画素の距離情報を再構成部205に供給する。
 再構成部205は、2視点のテクスチャ画像およびデプス画像の各画素の距離情報を用いて、3Dモデル座標系に主要な被写体の3次元構造を再構成する。上述したように、生成装置12で生成される2視点のテクスチャ画像およびデプス画像は、ポリゴンの表面を透視投影することにより生成される場合に比べて、より多くの領域の主要な被写体のポリゴンの3次元構造を表現することができる。従って、復号された2視点のテクスチャ画像およびデプス画像を用いて3次元構造が再構成される主要な被写体の領域は、2視点のテクスチャ画像とデプス画像がポリゴンの表面を透視投影することにより生成される場合に比べて多い。
 また、再構成部205は、デコーダ203から供給される全天球画像のテクスチャ画像とデプス画像を用いて、3Dモデル座標系に背景領域の3次元構造を再構成する。再構成部205は、主要な被写体と背景領域の3次元構造の位置情報とカラー情報を描画部206に供給する。
 描画部206(画像生成部)は、再構成部205から供給される主要な被写体と背景領域の3次元構造の位置情報とカラー情報に基づいて、視聴者等により指定された3Dモデル座標系における視点、視線方向、および画角のテクスチャ画像を表示画像として生成する。描画部206は、生成された表示画像を表示部207に供給する。
 表示部207は、描画部206から供給される表示画像を表示する。これにより、視聴者は、例えば、主要な被写体の周囲の任意の位置から主要な被写体を見ることができる。
 選択部208には、視聴者等により指定された3Dモデル座標系における視点および視線方向に基づいて、視点ごとに、テクスチャ画像の奥行き方向(視線方向)と表示画像の奥行き方向のなす角度を表示変更角度として求める。選択部208は、視点ごとに、表示変更角度に基づいて、デプス画像の量子化方法を第1乃至第3の量子化方法から選択する。選択部208は、選択された量子化方法の量子化情報を生成し、逆量子化部204と送信部209に供給する。
 なお、ここでは、選択部208において、第1乃至第3の量子化方法から、デプス画像の量子化方法を選択し、量子化が行われるとして説明を続けるが、第1乃至第3の量子化方法のうちのいずれかの量子化方法が設定されており、その設定されている量子化方法で量子化を行う量子化部とした構成とすることも可能である。
また、ここでは、視点ごとに、表示変更角度に基づいて、第1乃至第3の量子化方法から量子化方法が選択されるとして説明を続けるが、表示変更角度以外の所定の条件に基づき、量子化方法が選択されるようにしても良い。
 送信部209は、選択部208から供給される量子化情報を図1の生成装置12に送信する。
 (量子化方法の選択の説明)
 図15乃至図18は、図14の選択部208による量子化方法の選択を説明する図である。
 視点O1のデプス画像が第1の量子化方法で生成される場合、図15の点線で示すように、デプス画像の画素値としてとり得る値のうちの所定の間隔の値に対応する画角内の位置を示す等画素値線は、視点O1を中心とした円の円弧である。また、第1の量子化方法では、距離rの逆数1/rが量子化されるため、等画素値線の間隔は、視点O1に近いほど狭い。
 従って、視点VO1の表示画像の奥行き方向Vzと、視点O1のテクスチャ画像の奥行き方向zのなす表示変更角度が、図15に示すように0度付近(図15の例では0度)である場合、即ち奥行き方向Vzと奥行き方向zが近い場合、視点VO1に近いほど等画素値線の間隔は狭くなる。即ち、表示画像において、視点VO1に近く目立つ被写体ほど、デプス画像の量子化ステップが細かくなる。その結果、表示画像の画質を向上させることができる。
 表示変更角度が360度付近である場合も、0度付近である場合と同様に、奥行き方向Vzと奥行き方向zが近いため、第1の量子化方法でデプス画像を生成することにより、表示画像の画質を向上させることができる。よって、選択部208は、図18に示すように、表示変更角度が0度以上φ1(0<φ1<90)(第1の閾値)度未満であるか、または、φ4(270<φ4<360)(第2の閾値)度以上360度未満である場合、第1の量子化方法を選択する。
 これに対して、視点O1のデプス画像が第3の量子化方法で生成される場合、図16の点線で示すように、等画素値線は、視点O1と原点Oに対して対向する視点O2を中心とした円の円弧である。また、第3の量子化方法では、距離r´の逆数1/r´が量子化されるため、等画素値線の間隔は、視点O2に近いほど、即ち視点O1から遠いほど狭い。
 従って、視点VO1の表示画像の奥行き方向Vzと、視点O1のデプス画像の奥行き方向zのなす表示変更角度が、図16に示すように180度付近(図15の例では180度)である場合、即ち奥行き方向Vzと奥行き方向zの逆方向が近い場合、視点VO1に近いほど等画素値線の間隔は狭くなる。即ち、表示画像において、視点VO1に近く目立つ被写体ほど、デプス画像の量子化ステップが細かくなる。その結果、表示画像の画質を向上させることができる。
 従って、選択部208は、図18に示すように、表示変更角度がφ2(90<φ2<180)(第3の閾値)度以上φ3(180<φ3<270)(第4の閾値)度未満である場合、第3の量子化方法を選択する。
 視点O1のデプス画像が第2の量子化方法で生成される場合、図17の点線で示すように、等画素値線は、視点O1を中心とした円の円弧である。また、第2の量子化方法では、距離rが量子化されるため、等画素値線の間隔は等間隔である。
 従って、視点VO1の表示画像の奥行き方向Vzと、視点O1のデプス画像の奥行き方向zのなす表示変更角度が、図17に示すように270度付近である場合、または、90度付近である場合、即ち奥行き方向Vzが奥行き方向zの順方向および逆方向のいずれにも近くない場合、選択部208は第2の量子化方法を選択する。即ち、第1または第3の量子化方法の優位性がない場合、選択部208は、第2の量子化方法を選択する。具体的には、図18に示すように、選択部208は、表示変更角度がφ1度以上φ2度未満であるか、または、φ3度以上φ4度未満である場合、第2の量子化方法を選択する。
 以上のようにして選択部208が第1乃至第3の量子化方法を選択することにより、表示画像において、視点VO1に近いほど量子化ステップが荒くなることを防止することができる。
 (第1の再構成方法の説明)
 図19は、第1の再構成方法を説明する図である。
 なお、図19の例では、説明の便宜上、2視点のテクスチャ画像およびデプス画像の解像度が、4(横)×4(縦)画素であるものとする。また、図19では、2視点のうちの1つの視点O1のテクスチャ画像とデプス画像を用いて主要な被写体の3次元構造を再構成する場合について説明する。
 第1の再構成方法は、ポイントクラウドを用いて3次元構造を再構成する方法である。具体的には、図19に示すように、第1の再構成方法では、再構成部205は、視点O1、視線方向V1、画角2θ、視点O1のテクスチャ画像220の各画素221に対応するサンプリング点231のテクスチャ画像220上の位置(u,v)、および、テクスチャ画像220に対応するデプス画像の各画素221の画素値に基づいて、サンプリング点231の3Dモデル座標系における3次元座標(X,Y,Z)を生成する。
 また、再構成部205は、テクスチャ画像220の各画素221の画素値であるYCbCr値をRGB値に変換し、各画素221に対応するサンプリング点231のRGB値とする。再構成部205は、各サンプリング点231の3次元座標(X,Y,Z)に、そのサンプリング点231のRGB値の点を描画することにより、主要な被写体の3次元構造を再構成する。再構成部205は、各サンプリング点231の3次元座標(X,Y,Z)を主要な被写体の3次元構造の位置情報として描画部206に供給するとともに、各サンプリング点231のRGB値を主要な被写体の3次元構造のカラー情報として描画部206に供給する。
 (第2の再構成方法の説明)
 図20は、第2の再構成方法を説明する図である。
 なお、図20の例では、説明の便宜上、2視点のテクスチャ画像およびデプス画像の解像度が、4(横)×3(縦)画素であるものとする。また、図20では、2視点のうちの1つの視点O1のテクスチャ画像とデプス画像を用いて主要な被写体の3次元構造を再構成する場合について説明する。
 第2の再構成方法は、三角形パッチを用いて3次元構造を再構成する方法である。具体的には、図20の左側に示すように、第2の再構成方法では、再構成部205は、視点O1のテクスチャ画像240上に各画素241に対応するサンプリング点251を生成する。再構成部205は、テクスチャ画像240の全ての画素に対応するサンプリング点251のうちの、隣接する3つのサンプリング点251どうしを接続することにより、隣接する3つのサンプリング点251を頂点とする三角形パッチ252を生成する。
 そして、再構成部205は、視点O1、視線方向V1、画角2θ、各サンプリング点251のテクスチャ画像240上の位置(u,v)、および、テクスチャ画像240に対応するデプス画像の各画素241の画素値に基づいて、各サンプリング点251に対応する3Dモデル座標系の3次元座標(X,Y,Z)を生成する。
 そして、再構成部205は、図20の右側に示すように、各サンプリング点251の3次元座標(X,Y,Z)に基づいて、各サンプリング点251に対応する各サンプリング点261を3Dモデル座標系に配置する。また、再構成部205は、三角形パッチ252の頂点を構成する3つのサンプリング点251に対応するサンプリング点261を接続することにより、三角形パッチ262を生成する。
 また、再構成部205は、三角形パッチ262ごとに、三角形パッチ262に対応する三角形パッチ252を構成する画素241のYCbCr値をRGB値に変換し、そのRGB値を用いて三角形パッチ262のRGB値を生成する。再構成部205は、三角形パッチ262ごとに、三角形パッチ262のRGB値のテクスチャを三角形パッチ262に貼り付ける。これにより、再構成部205は、主要な被写体の3次元構造を再構成する。再構成部205は、各三角形パッチ262の頂点となるサンプリング点261の3次元座標(X,Y,Z)を主要な被写体の3次元構造の位置情報として描画部206に供給する。また、再構成部205は、各三角形パッチ262のRGB値を主要な被写体の3次元構造のカラー情報として描画部206に供給する。
 図19および図20では、視点O1のテクスチャ画像とデプス画像から主要な被写体の3次元構造を再構成する方法について説明したが、視点O2のテクスチャ画像とデプス画像から主要な被写体の3次元構造を再構成する方法および全天球画像のテクスチャ画像とデプス画像から背景領域の3次元構造を再構成する方法についても同様である。
 (表示装置の処理の説明)
 図21は、図14の表示装置200の表示処理を説明するフローチャートである。この表示処理は、例えば、視聴者により表示画像の表示が要求されたとき、開始される。
 図21のステップS30において、表示装置200の選択部208は、量子化情報を生成し、送信する量子化情報生成処理を行う。この量子化情報生成処理の詳細は、後述する図22を参照して説明する。
 ステップS31において、受信部201は、量子化情報に応じて図1の生成装置12から送信されてくる2視点の視点テクスチャストリームおよび視点デプスストリーム、並びに、全天球テクスチャストリームおよび全天球デプスストリームを受信し、記憶部202に供給して記憶させる。
 ステップS32において、デコーダ203は、記憶部202から2視点の視点テクスチャストリームおよび視点デプスストリーム、並びに、全天球テクスチャストリームおよび全天球デプスストリームを読み出し、復号する。デコーダ203は、復号の結果得られる2視点のテクスチャ画像およびデプス画像、並びに、全天球画像のテクスチャ画像およびデプス画像を再構成部205に供給する。また、デコーダ203は、復号の結果得られる2視点のデプス画像を逆量子化部204に供給する。
 ステップS33において、逆量子化部204は、視点ごとに、選択部208から供給される量子化情報が示す量子化方法に対応する逆量子化方法で、デコーダ203から供給されるデプス画像を逆量子化し、各画素の距離情報を生成する。逆量子化部204は、各視点のデプス画像の各画素の距離情報を再構成部205に供給する。
 ステップS34において、再構成部205は、2視点のテクスチャ画像およびデプス画像の各画素の距離情報を用いて、3Dモデル座標系に主要な被写体の3次元構造を再構成する。再構成部205は、主要な被写体の3次元構造の位置情報とカラー情報を描画部206に供給する。
 ステップS35において、再構成部205は、デコーダ203から供給される全天球画像のテクスチャ画像とデプス画像を用いて、3Dモデル座標系に背景領域の3次元構造を再構成する。再構成部205は、背景領域の3次元構造の位置情報とカラー情報を描画部206に供給する。
 ステップS36において、描画部206は、再構成部205から供給される主要な被写体と背景領域の3次元構造の位置情報とカラー情報に基づいて、視聴者等により指定された3Dモデル座標系における視点、視線方向、および画角のテクスチャ画像を表示画像として生成する。描画部206は、生成された表示画像を表示部207に供給する。
 ステップS37において、表示部207は、描画部206から供給される表示画像を表示し、処理を終了する。
 図22は、図21のステップS30の量子化情報生成処理を説明するフローチャートである。この量子化情報生成処理は、視点ごとに行われる。
 図22のステップS51において、選択部208には、視聴者等により指定された3Dモデル座標系における視点および視線方向に基づいて、表示変更角度を求める。
 ステップS52において、選択部208は、表示変更角度が、0度以上φ1度未満であるか、または、φ4度以上360度未満であるかどうかを判定する。ステップS52で、表示変更角度が、0度以上φ1度未満であるか、または、φ4度以上360度未満であると判定された場合、処理はステップS53に進む。
 ステップS53において、選択部208は、第1の量子化方法を選択し、第1の量子化方法の量子化情報を生成して、送信部209に供給する。そして、処理はステップS57に進む。
 一方、ステップS52で、表示変更角度が、0度以上φ1度未満ではなく、かつ、φ4度以上360度未満ではないと判定された場合、処理は、ステップS54に進む。
 ステップS54において、選択部208は、表示変更角度が、φ1度以上φ2度未満であるか、または、φ3度以上φ4度未満であるかどうかを判定する。ステップS54で表示変更角度が、φ1度以上φ2度未満であるか、または、φ3度以上φ4度未満であると判定された場合、処理はステップS55に進む。
 ステップS55において、選択部208は、第2の量子化方法を選択し、第2の量子化方法の量子化情報を生成して、送信部209に供給する。そして、処理はステップS57に進む。
 一方、ステップS54で、表示変更角度が、φ1度以上φ2度未満ではなく、かつ、φ3度以上φ4度未満ではないと判定された場合、即ち、表示変更角度がφ2度以上φ3度未満である場合、処理はステップS56に進む。
 ステップS56において、選択部208は、第3の量子化方法を選択し、第3の量子化方法の量子化情報を生成して、送信部209に供給する。そして、処理はステップS57に進む。
 ステップS57において、送信部209は、選択部208から供給される量子化情報を図1の生成装置12に送信する。そして、処理は図21のステップS30に戻り、ステップS31に進む。
 以上のように、表示装置200は、生成装置12により生成された2視点のテクスチャ画像とデプス画像を用いて表示画像を生成する。従って、2視点のそれぞれに対してポリゴンの表面を透視投影することにより生成された2視点のテクスチャ画像とデプス画像を用いる場合に比べて、より多くの領域の主要な被写体の3次元構造を再構成し、その3次元構造から表示画像を生成することができる。その結果、表示画像の画質が向上する。
 また、表示装置200は、第1乃至第3の量子化方法から、各視点のデプス画像の量子化方法を選択する。従って、表示装置200は、例えば、第1乃至第3の量子化方法のうちの表示画像の生成に適した量子化方法で生成されたデプス画像を用いて表示画像を生成することができる。その結果、表示画像の画質が向上する。
 <テクスチャ画像の他の例>
 図23は、テクスチャ画像の他の例を示す図である。
 上述した説明では、テクスチャ画像は、1つの視点のテクスチャ画像であったが、その視点に対応する左目用の視点と右目用の視点のテクスチャ画像が合成されたものであってもよい。
 具体的には、図23のAに示すように、テクスチャ画像は、例えば、1つの視点に対応する左目用の視点のテクスチャ画像421と右目用の視点のテクスチャ画像422が、横方向(水平方向)にパッキングされたパッキング画像420であってもよい。
 また、図23のBに示すように、テクスチャ画像は、例えば、テクスチャ画像421とテクスチャ画像422が、縦方向(垂直方向)にパッキングされたパッキング画像440であってもよい。
 以上のように、テクスチャ画像が左目用の視点と右目用の視点の画像をパッキングしたテクスチャ画像である場合、復号の結果得られるテクスチャ画像が、左目用の視点のテクスチャ画像と右目用の視点のテクスチャ画像に分離される。そして、目ごとに3次元構造が生成される。
 そして、視聴者等により指定された視点に対応する左目の視点、視線方向、および画角に基づいて、左目用の3次元構造から左目用の表示画像が生成される。また、視聴者等により指定された視点に対応する右目の視点、視線方向、および画角に基づいて、右目用の3次元構造から右目用の表示画像が生成される。
 表示部207が3D表示可能である場合、表示部207は、左目用の表示画像を左目用の画像として表示し、右目用の表示画像を右目用の画像として表示することにより、表示画像を3D表示する。一方、表示部207が3D表示可能ではない場合、表示部207は、左目用の表示画像または右目用の表示画像を2D表示する。
 なお、第1実施の形態では、視点の数は2個であったが、視点の数は2個に限定されない。また、2視点は互いに対向していなくてもよい。視線方向は、視点から原点以外の位置に向かう方向であってもよい。
 また、表示装置200は、生成装置12に量子化情報を送信せず、第1乃至第3の量子化方法の視点デプスストリームを生成装置12から受信して記憶部202に記憶させるようにしてもよい。この場合、表示装置200は、量子化情報に基づいて、記憶部202に記憶されている第1乃至第3の量子化方法の視点デプスストリームのうちの、量子化情報が示す量子化方法の視点デプスストリームのみを読み出し、復号する。
 さらに、上述した説明では、表示装置200は、表示変更角度に基づいて量子化方法を選択したが、表示装置200の処理負荷を抑制する場合には、表示変更角度によらず、第2の量子化方法を選択するようにしてもよい。また、量子化方法の選択は、表示変更角度以外の情報に基づいて行われるようにしてもよい。例えば、主要な被写体の動きの有無に基づいて、量子化方法を選択するようにしてもよい。
 また、第1および第2の量子化方法において、距離rの代わりに、視点と各画素におけるポリゴンの奥行き方向の距離を用い、第3の量子化方法において、距離r´の代わりに、視点と2視点を構成する他の視点と各画素におけるポリゴンの奥行き方向の距離を用いるようにしてもよい。
 <第2実施の形態>
 本開示を適用した配信システムの第2実施の形態の構成は、透視投影の代わりにtan軸投影(詳細は後述する)が行われる点を除いて、上記した例えば、図1の生成装置12の構成や、図14に示した表示装置200と同一である。従って、以下では、tan軸投影についてのみ説明する。
 (投影面の座標系の説明)
 図24は、投影面の座標系を説明する図である。
 なお、第3実施の形態では、投影面は、生成装置12が、高解像度画像を生成する際、球にマッピングされた全天球画像をtan軸投影する2次元平面、または、表示装置200が、表示画像を生成する際、3Dモデル画像をtan軸投影する視野範囲である。
 図24の例では、3Dモデルの3次元のxyz座標系において、zが-1.0である投影面451が設定されている。この場合、投影面451の中心O´を原点とし、投影面451の水平方向をs方向とし、垂直方向をt方向とする2次元のst座標系が、投影面451の座標系となる。
 なお、以下では、xyz座標系の原点Oからst座標系の座標(s,t)に向かうベクトル452を、座標(s,t)と、原点Oから投影面451までの距離である-1.0とを用いて、ベクトル(s,t,-1.0)という。
 (tan軸投影の説明)
 図25は、tan軸投影(正接軸投影)を説明する図である。
 図25は、投影面451をzの負方向に見た図である。図25の例では、st座標系において、投影面451のs値およびt値の最小値は-1.0であり、最大値は1.0である。
 この場合、透視投影では、原点Oから投影面451上の投影点に向かう投影ベクトルがベクトル(s´,t´-1.0)となるように、投影面451上に投影点が設定される。なお、s´は、-1.0から1.0までのs値の範囲に設けられた所定の間隔ごとの値であり、t´は-1.0から1.0までのt値の範囲に設けられた所定の間隔ごとの値である。従って、透視投影における投影点は、投影面451上で均一である。
 これに対して、投影面451の画角をθw(図25の例ではπ/2)とすると、tan軸投影では、投影ベクトルがベクトル(tan(s´*θw/2), tan(t´*θw/2), -1.0)となるように、投影面451上に投影点が設定される。
 具体的には、ベクトル(tan(s´*θw/2), tan(t´*θw/2), -1.0)は、s´*θw/2をθとし、t´*θw/2をφとすると、ベクトル(tanθ,tanφ,-1.0)になる。このとき、画角θwがπに近付くと、tanθやtanφは無限大に発散する。従って、tanθやtanφが無限大に発散しないように、ベクトル(tanθ,tanφ,-1.0)が、ベクトル(sinθ*cosφ, cosθ*sinφ, -cosθ*cosφ)に補正され、投影ベクトルがベクトル(sinθ*cosφ, cosθ*sinφ, -cosθ*cosφ)となるように、投影面451上に投影点が設定される。従って、tan軸投影では、隣り合う投影点に対応する投影ベクトルどうしがなす角が同一になる。
 なお、対数軸(ログスケール)と同様に、tan(s´*θw/2), tan(t´*θw/2)は、tan軸のs´,t´であると捉えられる。従って、本明細書では、投影ベクトルがベクトル(tan(s´*θw/2), tan(t´*θw/2), -1.0)となる投影を、tan軸投影と称している。
 <第3実施の形態>
 (本開示を適用したコンピュータの説明)
 上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
 図26は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。
 コンピュータ500において、CPU(Central Processing Unit)501,ROM(Read Only Memory)502,RAM(Random Access Memory)503は、バス504により相互に接続されている。
 バス504には、さらに、入出力インタフェース505が接続されている。入出力インタフェース505には、入力部506、出力部507、記憶部508、通信部509、及びドライブ510が接続されている。
 入力部506は、キーボード、マウス、マイクロフォンなどよりなる。出力部507は、ディスプレイ、スピーカなどよりなる。記憶部508は、ハードディスクや不揮発性のメモリなどよりなる。通信部509は、ネットワークインタフェースなどよりなる。ドライブ510は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア511を駆動する。
 以上のように構成されるコンピュータ500では、CPU501が、例えば、記憶部508に記憶されているプログラムを、入出力インタフェース505及びバス504を介して、RAM503にロードして実行することにより、上述した一連の処理が行われる。
 コンピュータ500(CPU501)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア511に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
 コンピュータ500では、プログラムは、リムーバブルメディア511をドライブ510に装着することにより、入出力インタフェース505を介して、記憶部508にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部509で受信し、記憶部508にインストールすることができる。その他、プログラムは、ROM502や記憶部508に、あらかじめインストールしておくことができる。
 なお、コンピュータ500が実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
 <応用例>
 本開示に係る技術は、様々な製品へ応用することができる。例えば、本開示に係る技術は、自動車、電気自動車、ハイブリッド電気自動車、自動二輪車、自転車、パーソナルモビリティ、飛行機、ドローン、船舶、ロボット、建設機械、農業機械(トラクター)などのいずれかの種類の移動体に搭載される装置として実現されてもよい。
 図27は、本開示に係る技術が適用され得る移動体制御システムの一例である車両制御システム7000の概略的な構成例を示すブロック図である。車両制御システム7000は、通信ネットワーク7010を介して接続された複数の電子制御ユニットを備える。図27に示した例では、車両制御システム7000は、駆動系制御ユニット7100、ボディ系制御ユニット7200、バッテリ制御ユニット7300、車外情報検出ユニット7400、車内情報検出ユニット7500、及び統合制御ユニット7600を備える。これらの複数の制御ユニットを接続する通信ネットワーク7010は、例えば、CAN(Controller Area Network)、LIN(Local Interconnect Network)、LAN(Local Area Network)又はFlexRay(登録商標)等の任意の規格に準拠した車載通信ネットワークであってよい。
 各制御ユニットは、各種プログラムにしたがって演算処理を行うマイクロコンピュータと、マイクロコンピュータにより実行されるプログラム又は各種演算に用いられるパラメータ等を記憶する記憶部と、各種制御対象の装置を駆動する駆動回路とを備える。各制御ユニットは、通信ネットワーク7010を介して他の制御ユニットとの間で通信を行うためのネットワークI/Fを備えるとともに、車内外の装置又はセンサ等との間で、有線通信又は無線通信により通信を行うための通信I/Fを備える。図27では、統合制御ユニット7600の機能構成として、マイクロコンピュータ7610、汎用通信I/F7620、専用通信I/F7630、測位部7640、ビーコン受信部7650、車内機器I/F7660、音声画像出力部7670、車載ネットワークI/F7680及び記憶部7690が図示されている。他の制御ユニットも同様に、マイクロコンピュータ、通信I/F及び記憶部等を備える。
 駆動系制御ユニット7100は、各種プログラムにしたがって車両の駆動系に関連する装置の動作を制御する。例えば、駆動系制御ユニット7100は、内燃機関又は駆動用モータ等の車両の駆動力を発生させるための駆動力発生装置、駆動力を車輪に伝達するための駆動力伝達機構、車両の舵角を調節するステアリング機構、及び、車両の制動力を発生させる制動装置等の制御装置として機能する。駆動系制御ユニット7100は、ABS(Antilock Brake System)又はESC(Electronic Stability Control)等の制御装置としての機能を有してもよい。
 駆動系制御ユニット7100には、車両状態検出部7110が接続される。車両状態検出部7110には、例えば、車体の軸回転運動の角速度を検出するジャイロセンサ、車両の加速度を検出する加速度センサ、あるいは、アクセルペダルの操作量、ブレーキペダルの操作量、ステアリングホイールの操舵角、エンジン回転数又は車輪の回転速度等を検出するためのセンサのうちの少なくとも一つが含まれる。駆動系制御ユニット7100は、車両状態検出部7110から入力される信号を用いて演算処理を行い、内燃機関、駆動用モータ、電動パワーステアリング装置又はブレーキ装置等を制御する。
 ボディ系制御ユニット7200は、各種プログラムにしたがって車体に装備された各種装置の動作を制御する。例えば、ボディ系制御ユニット7200は、キーレスエントリシステム、スマートキーシステム、パワーウィンドウ装置、あるいは、ヘッドランプ、バックランプ、ブレーキランプ、ウィンカー又はフォグランプ等の各種ランプの制御装置として機能する。この場合、ボディ系制御ユニット7200には、鍵を代替する携帯機から発信される電波又は各種スイッチの信号が入力され得る。ボディ系制御ユニット7200は、これらの電波又は信号の入力を受け付け、車両のドアロック装置、パワーウィンドウ装置、ランプ等を制御する。
 バッテリ制御ユニット7300は、各種プログラムにしたがって駆動用モータの電力供給源である二次電池7310を制御する。例えば、バッテリ制御ユニット7300には、二次電池7310を備えたバッテリ装置から、バッテリ温度、バッテリ出力電圧又はバッテリの残存容量等の情報が入力される。バッテリ制御ユニット7300は、これらの信号を用いて演算処理を行い、二次電池7310の温度調節制御又はバッテリ装置に備えられた冷却装置等の制御を行う。
 車外情報検出ユニット7400は、車両制御システム7000を搭載した車両の外部の情報を検出する。例えば、車外情報検出ユニット7400には、撮像部7410及び車外情報検出部7420のうちの少なくとも一方が接続される。撮像部7410には、ToF(Time Of Flight)カメラ、ステレオカメラ、単眼カメラ、赤外線カメラ及びその他のカメラのうちの少なくとも一つが含まれる。車外情報検出部7420には、例えば、現在の天候又は気象を検出するための環境センサ、あるいは、車両制御システム7000を搭載した車両の周囲の他の車両、障害物又は歩行者等を検出するための周囲情報検出センサのうちの少なくとも一つが含まれる。
 環境センサは、例えば、雨天を検出する雨滴センサ、霧を検出する霧センサ、日照度合いを検出する日照センサ、及び降雪を検出する雪センサのうちの少なくとも一つであってよい。周囲情報検出センサは、超音波センサ、レーダ装置及びLIDAR(Light Detection and Ranging、Laser Imaging Detection and Ranging)装置のうちの少なくとも一つであってよい。これらの撮像部7410及び車外情報検出部7420は、それぞれ独立したセンサないし装置として備えられてもよいし、複数のセンサないし装置が統合された装置として備えられてもよい。
 ここで、図28は、撮像部7410及び車外情報検出部7420の設置位置の例を示す。撮像部7910,7912,7914,7916,7918は、例えば、車両7900のフロントノーズ、サイドミラー、リアバンパ、バックドア及び車室内のフロントガラスの上部のうちの少なくとも一つの位置に設けられる。フロントノーズに備えられる撮像部7910及び車室内のフロントガラスの上部に備えられる撮像部7918は、主として車両7900の前方の画像を取得する。サイドミラーに備えられる撮像部7912,7914は、主として車両7900の側方の画像を取得する。リアバンパ又はバックドアに備えられる撮像部7916は、主として車両7900の後方の画像を取得する。車室内のフロントガラスの上部に備えられる撮像部7918は、主として先行車両又は、歩行者、障害物、信号機、交通標識又は車線等の検出に用いられる。
 なお、図28には、それぞれの撮像部7910,7912,7914,7916の撮影範囲の一例が示されている。撮像範囲aは、フロントノーズに設けられた撮像部7910の撮像範囲を示し、撮像範囲b,cは、それぞれサイドミラーに設けられた撮像部7912,7914の撮像範囲を示し、撮像範囲dは、リアバンパ又はバックドアに設けられた撮像部7916の撮像範囲を示す。例えば、撮像部7910,7912,7914,7916で撮像された画像データが重ね合わせられることにより、車両7900を上方から見た俯瞰画像が得られる。
 車両7900のフロント、リア、サイド、コーナ及び車室内のフロントガラスの上部に設けられる車外情報検出部7920,7922,7924,7926,7928,7930は、例えば超音波センサ又はレーダ装置であってよい。車両7900のフロントノーズ、リアバンパ、バックドア及び車室内のフロントガラスの上部に設けられる車外情報検出部7920,7926,7930は、例えばLIDAR装置であってよい。これらの車外情報検出部7920~7930は、主として先行車両、歩行者又は障害物等の検出に用いられる。
 図27に戻って説明を続ける。車外情報検出ユニット7400は、撮像部7410に車外の画像を撮像させるとともに、撮像された画像データを受信する。また、車外情報検出ユニット7400は、接続されている車外情報検出部7420から検出情報を受信する。車外情報検出部7420が超音波センサ、レーダ装置又はLIDAR装置である場合には、車外情報検出ユニット7400は、超音波又は電磁波等を発信させるとともに、受信された反射波の情報を受信する。車外情報検出ユニット7400は、受信した情報に基づいて、人、車、障害物、標識又は路面上の文字等の物体検出処理又は距離検出処理を行ってもよい。車外情報検出ユニット7400は、受信した情報に基づいて、降雨、霧又は路面状況等を認識する環境認識処理を行ってもよい。車外情報検出ユニット7400は、受信した情報に基づいて、車外の物体までの距離を算出してもよい。
 また、車外情報検出ユニット7400は、受信した画像データに基づいて、人、車、障害物、標識又は路面上の文字等を認識する画像認識処理又は距離検出処理を行ってもよい。車外情報検出ユニット7400は、受信した画像データに対して歪補正又は位置合わせ等の処理を行うとともに、異なる撮像部7410により撮像された画像データを合成して、俯瞰画像又はパノラマ画像を生成してもよい。車外情報検出ユニット7400は、異なる撮像部7410により撮像された画像データを用いて、視点変換処理を行ってもよい。
 車内情報検出ユニット7500は、車内の情報を検出する。車内情報検出ユニット7500には、例えば、運転者の状態を検出する運転者状態検出部7510が接続される。運転者状態検出部7510は、運転者を撮像するカメラ、運転者の生体情報を検出する生体センサ又は車室内の音声を集音するマイク等を含んでもよい。生体センサは、例えば、座面又はステアリングホイール等に設けられ、座席に座った搭乗者又はステアリングホイールを握る運転者の生体情報を検出する。車内情報検出ユニット7500は、運転者状態検出部7510から入力される検出情報に基づいて、運転者の疲労度合い又は集中度合いを算出してもよいし、運転者が居眠りをしていないかを判別してもよい。車内情報検出ユニット7500は、集音された音声信号に対してノイズキャンセリング処理等の処理を行ってもよい。
 統合制御ユニット7600は、各種プログラムにしたがって車両制御システム7000内の動作全般を制御する。統合制御ユニット7600には、入力部7800が接続されている。入力部7800は、例えば、タッチパネル、ボタン、マイクロフォン、スイッチ又はレバー等、搭乗者によって入力操作され得る装置によって実現される。統合制御ユニット7600には、マイクロフォンにより入力される音声を音声認識することにより得たデータが入力されてもよい。入力部7800は、例えば、赤外線又はその他の電波を利用したリモートコントロール装置であってもよいし、車両制御システム7000の操作に対応した携帯電話又はPDA(Personal Digital Assistant)等の外部接続機器であってもよい。入力部7800は、例えばカメラであってもよく、その場合搭乗者はジェスチャにより情報を入力することができる。あるいは、搭乗者が装着したウェアラブル装置の動きを検出することで得られたデータが入力されてもよい。さらに、入力部7800は、例えば、上記の入力部7800を用いて搭乗者等により入力された情報に基づいて入力信号を生成し、統合制御ユニット7600に出力する入力制御回路などを含んでもよい。搭乗者等は、この入力部7800を操作することにより、車両制御システム7000に対して各種のデータを入力したり処理動作を指示したりする。
 記憶部7690は、マイクロコンピュータにより実行される各種プログラムを記憶するROM(Read Only Memory)、及び各種パラメータ、演算結果又はセンサ値等を記憶するRAM(Random Access Memory)を含んでいてもよい。また、記憶部7690は、HDD(Hard Disc Drive)等の磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス又は光磁気記憶デバイス等によって実現してもよい。
 汎用通信I/F7620は、外部環境7750に存在する様々な機器との間の通信を仲介する汎用的な通信I/Fである。汎用通信I/F7620は、GSM(Global System of Mobile communications)、WiMAX、LTE(Long Term Evolution)若しくはLTE-A(LTE-Advanced)などのセルラー通信プロトコル、又は無線LAN(Wi-Fi(登録商標)ともいう)、Bluetooth(登録商標)などのその他の無線通信プロトコルを実装してよい。汎用通信I/F7620は、例えば、基地局又はアクセスポイントを介して、外部ネットワーク(例えば、インターネット、クラウドネットワーク又は事業者固有のネットワーク)上に存在する機器(例えば、アプリケーションサーバ又は制御サーバ)へ接続してもよい。また、汎用通信I/F7620は、例えばP2P(Peer To Peer)技術を用いて、車両の近傍に存在する端末(例えば、運転者、歩行者若しくは店舗の端末、又はMTC(Machine Type Communication)端末)と接続してもよい。
 専用通信I/F7630は、車両における使用を目的として策定された通信プロトコルをサポートする通信I/Fである。専用通信I/F7630は、例えば、下位レイヤのIEEE802.11pと上位レイヤのIEEE1609との組合せであるWAVE(Wireless Access in Vehicle Environment)、DSRC(Dedicated Short Range Communications)、又はセルラー通信プロトコルといった標準プロトコルを実装してよい。専用通信I/F7630は、典型的には、車車間(Vehicle to Vehicle)通信、路車間(Vehicle to Infrastructure)通信、車両と家との間(Vehicle to Home)の通信及び歩車間(Vehicle to Pedestrian)通信のうちの1つ以上を含む概念であるV2X通信を遂行する。
 測位部7640は、例えば、GNSS(Global Navigation Satellite System)衛星からのGNSS信号(例えば、GPS(Global Positioning System)衛星からのGPS信号)を受信して測位を実行し、車両の緯度、経度及び高度を含む位置情報を生成する。なお、測位部7640は、無線アクセスポイントとの信号の交換により現在位置を特定してもよく、又は測位機能を有する携帯電話、PHS若しくはスマートフォンといった端末から位置情報を取得してもよい。
 ビーコン受信部7650は、例えば、道路上に設置された無線局等から発信される電波あるいは電磁波を受信し、現在位置、渋滞、通行止め又は所要時間等の情報を取得する。なお、ビーコン受信部7650の機能は、上述した専用通信I/F7630に含まれてもよい。
 車内機器I/F7660は、マイクロコンピュータ7610と車内に存在する様々な車内機器7760との間の接続を仲介する通信インタフェースである。車内機器I/F7660は、無線LAN、Bluetooth(登録商標)、NFC(Near Field Communication)又はWUSB(Wireless USB)といった無線通信プロトコルを用いて無線接続を確立してもよい。また、車内機器I/F7660は、図示しない接続端子(及び、必要であればケーブル)を介して、USB(Universal Serial Bus)、HDMI(High-Definition Multimedia Interface)、又はMHL(Mobile High-definition Link)等の有線接続を確立してもよい。車内機器7760は、例えば、搭乗者が有するモバイル機器若しくはウェアラブル機器、又は車両に搬入され若しくは取り付けられる情報機器のうちの少なくとも1つを含んでいてもよい。また、車内機器7760は、任意の目的地までの経路探索を行うナビゲーション装置を含んでいてもよい。車内機器I/F7660は、これらの車内機器7760との間で、制御信号又はデータ信号を交換する。
 車載ネットワークI/F7680は、マイクロコンピュータ7610と通信ネットワーク7010との間の通信を仲介するインタフェースである。車載ネットワークI/F7680は、通信ネットワーク7010によりサポートされる所定のプロトコルに則して、信号等を送受信する。
 統合制御ユニット7600のマイクロコンピュータ7610は、汎用通信I/F7620、専用通信I/F7630、測位部7640、ビーコン受信部7650、車内機器I/F7660及び車載ネットワークI/F7680のうちの少なくとも一つを介して取得される情報に基づき、各種プログラムにしたがって、車両制御システム7000を制御する。例えば、マイクロコンピュータ7610は、取得される車内外の情報に基づいて、駆動力発生装置、ステアリング機構又は制動装置の制御目標値を演算し、駆動系制御ユニット7100に対して制御指令を出力してもよい。例えば、マイクロコンピュータ7610は、車両の衝突回避あるいは衝撃緩和、車間距離に基づく追従走行、車速維持走行、車両の衝突警告、又は車両のレーン逸脱警告等を含むADAS(Advanced Driver Assistance System)の機能実現を目的とした協調制御を行ってもよい。また、マイクロコンピュータ7610は、取得される車両の周囲の情報に基づいて駆動力発生装置、ステアリング機構又は制動装置等を制御することにより、運転者の操作に拠らずに自律的に走行する自動運転等を目的とした協調制御を行ってもよい。
 マイクロコンピュータ7610は、汎用通信I/F7620、専用通信I/F7630、測位部7640、ビーコン受信部7650、車内機器I/F7660及び車載ネットワークI/F7680のうちの少なくとも一つを介して取得される情報に基づき、車両と周辺の構造物や人物等の物体との間の3次元距離情報を生成し、車両の現在位置の周辺情報を含むローカル地図情報を作成してもよい。また、マイクロコンピュータ7610は、取得される情報に基づき、車両の衝突、歩行者等の近接又は通行止めの道路への進入等の危険を予測し、警告用信号を生成してもよい。警告用信号は、例えば、警告音を発生させたり、警告ランプを点灯させたりするための信号であってよい。
 音声画像出力部7670は、車両の搭乗者又は車外に対して、視覚的又は聴覚的に情報を通知することが可能な出力装置へ音声及び画像のうちの少なくとも一方の出力信号を送信する。図27の例では、出力装置として、オーディオスピーカ7710、表示部7720及びインストルメントパネル7730が例示されている。表示部7720は、例えば、オンボードディスプレイ及びヘッドアップディスプレイの少なくとも一つを含んでいてもよい。表示部7720は、AR(Augmented Reality)表示機能を有していてもよい。出力装置は、これらの装置以外の、ヘッドホン、搭乗者が装着する眼鏡型ディスプレイ等のウェアラブルデバイス、プロジェクタ又はランプ等の他の装置であってもよい。出力装置が表示装置の場合、表示装置は、マイクロコンピュータ7610が行った各種処理により得られた結果又は他の制御ユニットから受信された情報を、テキスト、イメージ、表、グラフ等、様々な形式で視覚的に表示する。また、出力装置が音声出力装置の場合、音声出力装置は、再生された音声データ又は音響データ等からなるオーディオ信号をアナログ信号に変換して聴覚的に出力する。
 なお、図27に示した例において、通信ネットワーク7010を介して接続された少なくとも二つの制御ユニットが一つの制御ユニットとして一体化されてもよい。あるいは、個々の制御ユニットが、複数の制御ユニットにより構成されてもよい。さらに、車両制御システム7000が、図示されていない別の制御ユニットを備えてもよい。また、上記の説明において、いずれかの制御ユニットが担う機能の一部又は全部を、他の制御ユニットに持たせてもよい。つまり、通信ネットワーク7010を介して情報の送受信がされるようになっていれば、所定の演算処理が、いずれかの制御ユニットで行われるようになってもよい。同様に、いずれかの制御ユニットに接続されているセンサ又は装置が、他の制御ユニットに接続されるとともに、複数の制御ユニットが、通信ネットワーク7010を介して相互に検出情報を送受信してもよい。
 なお、図1乃至図25を用いて説明した本実施形態に係る生成装置12および表示装置200の各機能を実現するためのコンピュータプログラムを、いずれかの制御ユニット等に実装することができる。また、このようなコンピュータプログラムが格納された、コンピュータで読み取り可能な記録媒体を提供することもできる。記録媒体は、例えば、磁気ディスク、光ディスク、光磁気ディスク、フラッシュメモリ等である。また、上記のコンピュータプログラムは、記録媒体を用いずに、例えばネットワークを介して配信されてもよい。
 以上説明した車両制御システム7000において、図1乃至図25を用いて説明した本実施形態に係る生成装置12および表示装置200を適用することができる。この場合、例えば、生成装置12および表示装置200は一体化され、マイクロコンピュータ7610、記憶部7690、および表示部7720に相当する。また、撮影装置11は、撮像部7410に相当する。この場合、例えば、車両制御システム7000は、2視点のテクスチャ画像とデプス画像を用いて、より多くの領域の3次元構造を表現することができる。
 また、図1乃至図25を用いて説明した生成装置12および表示装置200の少なくとも一部の構成要素は、図27に示した車両制御システム7000のためのモジュール(例えば、一つのダイで構成される集積回路モジュール)において実現されてもよい。あるいは、図1乃至図25を用いて説明した生成装置12および表示装置200は、図27に示した車両制御システム7000の複数の制御ユニットによって実現されてもよい。
 なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。
 また、本開示の実施の形態は、上述した実施の形態に限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。
 例えば、本開示は、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
 また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
 さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
 なお、本開示は、以下のような構成もとることができる。
(1)
 ポリゴンの中心に対して対向する2視点のそれぞれについて各視点から前記ポリゴンの中心に向かう視線方向に垂直な投影面に前記ポリゴンの裏面を投影することにより得られるテクスチャ画像と、各視点の前記テクスチャ画像に対応するデプス画像とを用いて、所定の視点のテクスチャ画像を生成する画像生成部と、
 前記デプス画像に対応する視点と前記2視点を構成する他の視点と各画素における前記ポリゴンとの距離の逆数を量子化する量子化部と
 を備える画像処理装置。
(2)
 前記量子化部は、前記デプス画像に対応する視点と前記2視点を構成する他の視点と各画素における前記ポリゴンとの距離の逆数を量子化する量子化方法以外の量子化方法も備えており、所定の条件に基づいて量子化方法を切り換える、
 前記(1)に記載の画像処理装置。
(3)
 前記量子化部は、各視点の前記デプス画像の量子化方法を、前記デプス画像に対応する視点と各画素における前記ポリゴンとの距離の逆数を量子化する第1の量子化方法、前記距離を量子化する第2の量子化方法、および、前記デプス画像に対応する視点と前記2視点を構成する他の視点と各画素における前記ポリゴンとの距離の逆数を量子化する第3の量子化方法を備える
 前記(1)に記載の画像処理装置。
(4)
 前記第1および第2の量子化方法に対応する距離は、前記デプス画像に対応する視点と各画素における前記ポリゴンを結ぶ直線の距離であり、
 前記第3の量子化方法に対応する距離は、前記他の視点と各画素における前記ポリゴンとを結ぶ直線の距離である
 ように構成された
 前記(3)に記載の画像処理装置。
(5)
 前記量子化部は、前記視点ごとに、その視点のテクスチャ画像の奥行き方向と前記所定の視点のテクスチャ画像の奥行き方向のなす角度に基づいて、前記デプス画像の量子化方法を選択する
 ように構成された
 前記(3)または(4)に記載の画像処理装置。
(6)
 前記量子化部は、前記角度が、0度以上第1の閾値未満であるか、または、第2の閾値以上360度未満である場合、前記デプス画像の量子化方法として前記第1の量子化方法を選択し、
 前記第1の閾値は、90度より小さく、
 前記第2の閾値は、270度より大きい
 ように構成された
 前記(5)に記載の画像処理装置。
(7)
 前記量子化部は、前記角度が、前記第1の閾値以上第3の閾値未満であるか、または、第4の閾値以上前記第2の閾値未満である場合、前記デプス画像の量子化方法として前記第2の量子化方法を選択し、
 前記第3の閾値は、90度より大きく180度より小さい
 前記第4の閾値は、180度より大きく270度より小さい
 ように構成された
 前記(6)に記載の画像処理装置。
(8)
 前記量子化部は、前記角度が前記第3の閾値以上前記第4の閾値未満である場合、前記デプス画像の量子化方法として前記第3の量子化方法を選択する
 ように構成された
 前記(7)に記載の画像処理装置。
(9)
 前記ポリゴンは、前記ポリゴンに対応する被写体の周囲に配置され、前記被写体の少なくとも一部を撮影範囲に含む複数の撮影装置により取得された撮影画像と前記撮影画像に対応するデプス画像とを用いて生成される
 ように構成された
 前記(1)乃至(8)のいずれかに記載の画像処理装置。
(10)
 前記画像生成部は、前記複数の撮影装置により取得された前記撮影画像を用いて生成された全天球画像のテクスチャ画像と、前記複数の撮影装置により取得された前記撮影画像に対応するデプス画像を用いて生成された前記全天球画像のデプス画像とを用いて、前記所定の視点のテクスチャ画像を生成する
 ように構成された
 前記(9)に記載の画像処理装置。
(11)
 画像処理装置が、
 ポリゴンの中心に対して対向する2視点のそれぞれについて各視点から前記ポリゴンの中心に向かう視線方向に垂直な投影面に前記ポリゴンの裏面を投影することにより得られるテクスチャ画像と、各視点の前記テクスチャ画像に対応するデプス画像とを用いて、所定の視点のテクスチャ画像を生成する画像生成ステップと、
 前記デプス画像に対応する視点と前記2視点を構成する他の視点と各画素における前記ポリゴンとの距離の逆数を量子化する量子化ステップと
 を含む画像処理方法。
(12)
 ポリゴンの中心に対して対向する2視点のそれぞれについて各視点から前記ポリゴンの中心に向かう視線方向に垂直な投影面に前記ポリゴンの裏面を投影することによりテクスチャ画像を生成するテクスチャ画像生成部と、
 各視点の前記テクスチャ画像に対応するデプス画像を、前記デプス画像に対応する視点と前記2視点を構成する他の視点と各画素における前記ポリゴンとの距離の逆数を量子化する量子化方法で量子化された量子化値を画素値とすることにより生成するデプス画像生成部と
 を備える画像処理装置。
(13)
 前記デプス画像生成部は、前記デプス画像に対応する視点と前記2視点を構成する他の視点と各画素における前記ポリゴンとの距離の逆数を量子化する量子化方法以外の量子化方法も備えており、所定の条件に基づいて量子化方法を切り換える、
 前記(12)に記載の画像処理装置。
(14)
 前記デプス画像生成部は、各視点の前記デプス画像の量子化方法を、前記デプス画像に対応する視点と各画素における前記ポリゴンとの距離の逆数を量子化する第1の量子化方法、前記距離を量子化する第2の量子化方法、および、前記デプス画像に対応する視点と前記2視点を構成する他の視点と各画素における前記ポリゴンとの距離の逆数を量子化する第3の量子化方法を備える
 前記(12)に記載の画像処理装置。
(15)
 前記第1および第2の量子化方法に対応する距離は、前記デプス画像に対応する視点と各画素における前記ポリゴンを結ぶ直線の距離であり、
 前記第3の量子化方法に対応する距離は、前記他の視点と各画素における前記ポリゴンとを結ぶ直線の距離である
 ように構成された
 前記(14)に記載の画像処理装置。
(16)
 前記テクスチャ画像生成部により生成された前記2視点のテクスチャ画像と、前記デプス画像生成部により生成された前記2視点のデプス画像とを送信する送信部
 をさらに備える
 前記(14)または(15)に記載の画像処理装置。
(17)
 前記デプス画像生成部は、前記第1乃至第3の量子化方法のそれぞれで前記2視点のデプス画像を生成し、
 前記送信部は、前記デプス画像生成部により前記第1乃至第3の量子化方法のいずれかで生成された前記2視点のデプス画像を送信する
 ように構成された
 前記(16)に記載の画像処理装置。
(18)
 前記ポリゴンに対応する被写体の周囲に配置され、前記被写体の少なくとも一部を撮影範囲に含む複数の撮影装置により取得された撮影画像と、前記撮影画像に対応するデプス画像とを用いて、前記ポリゴンを生成するポリゴン生成部
 をさらに備える
 前記(12)乃至(17)のいずれかに記載の画像処理装置。
(19)
 前記複数の撮影装置により取得された前記撮影画像を用いて、全天球画像のテクスチャ画像を生成し、前記複数の撮影装置により取得された前記撮影画像に対応するデプス画像を用いて、前記全天球画像のデプス画像を生成する全天球画像生成部
 をさらに備える
 前記(18)に記載の画像処理装置。
(20)
 画像処理装置が、
 ポリゴンの中心に対して対向する2視点のそれぞれについて各視点から前記ポリゴンの中心に向かう視線方向に垂直な投影面に前記ポリゴンの裏面を投影することによりテクスチャ画像を生成するテクスチャ画像生成ステップと、
 各視点の前記テクスチャ画像に対応するデプス画像を、前記デプス画像に対応する視点と前記2視点を構成する他の視点と各画素における前記ポリゴンとの距離の逆数を量子化する量子化方法で量子化された量子化値を画素値とすることにより生成するデプス画像生成ステップと
 を含む画像処理方法。
 11-1乃至11-N 撮影装置, 12 生成装置, 34 ポリゴン生成部, 36 全天球画像生成部, 40 送信部, 61 被写体, 71 テクスチャ画像生成部, 74 1/r量子化部, 75 等間隔量子化部, 76 逆1/r量子化部, 81 球, 200 表示装置, 206 描画部, 208 選択部

Claims (20)

  1.  ポリゴンの中心に対して対向する2視点のそれぞれについて各視点から前記ポリゴンの中心に向かう視線方向に垂直な投影面に前記ポリゴンの裏面を投影することにより得られるテクスチャ画像と、各視点の前記テクスチャ画像に対応するデプス画像とを用いて、所定の視点のテクスチャ画像を生成する画像生成部と、
     前記デプス画像に対応する視点と前記2視点を構成する他の視点と各画素における前記ポリゴンとの距離の逆数を量子化する量子化部と
     を備える画像処理装置。
  2.  前記量子化部は、前記デプス画像に対応する視点と前記2視点を構成する他の視点と各画素における前記ポリゴンとの距離の逆数を量子化する量子化方法以外の量子化方法も備えており、所定の条件に基づいて量子化方法を切り換える、
     請求項1に記載の画像処理装置。
  3.  前記量子化部は、各視点の前記デプス画像の量子化方法を、前記デプス画像に対応する視点と各画素における前記ポリゴンとの距離の逆数を量子化する第1の量子化方法、前記距離を量子化する第2の量子化方法、および、前記デプス画像に対応する視点と前記2視点を構成する他の視点と各画素における前記ポリゴンとの距離の逆数を量子化する第3の量子化方法を備える
     請求項1に記載の画像処理装置。
  4.  前記第1および第2の量子化方法に対応する距離は、前記デプス画像に対応する視点と各画素における前記ポリゴンを結ぶ直線の距離であり、
     前記第3の量子化方法に対応する距離は、前記他の視点と各画素における前記ポリゴンとを結ぶ直線の距離である
     ように構成された
     請求項3に記載の画像処理装置。
  5.  前記量子化部は、前記視点ごとに、その視点のテクスチャ画像の奥行き方向と前記所定の視点のテクスチャ画像の奥行き方向のなす角度に基づいて、前記デプス画像の量子化方法を選択する
     ように構成された
     請求項3に記載の画像処理装置。
  6.  前記量子化部は、前記角度が、0度以上第1の閾値未満であるか、または、第2の閾値以上360度未満である場合、前記デプス画像の量子化方法として前記第1の量子化方法を選択し、
     前記第1の閾値は、90度より小さく、
     前記第2の閾値は、270度より大きい
     ように構成された
     請求項5に記載の画像処理装置。
  7.  前記量子化部は、前記角度が、前記第1の閾値以上第3の閾値未満であるか、または、第4の閾値以上前記第2の閾値未満である場合、前記デプス画像の量子化方法として前記第2の量子化方法を選択し、
     前記第3の閾値は、90度より大きく180度より小さい
     前記第4の閾値は、180度より大きく270度より小さい
     ように構成された
     請求項6に記載の画像処理装置。
  8.  前記量子化部は、前記角度が前記第3の閾値以上前記第4の閾値未満である場合、前記デプス画像の量子化方法として前記第3の量子化方法を選択する
     ように構成された
     請求項7に記載の画像処理装置。
  9.  前記ポリゴンは、前記ポリゴンに対応する被写体の周囲に配置され、前記被写体の少なくとも一部を撮影範囲に含む複数の撮影装置により取得された撮影画像と前記撮影画像に対応するデプス画像とを用いて生成される
     ように構成された
     請求項1に記載の画像処理装置。
  10.  前記画像生成部は、前記複数の撮影装置により取得された前記撮影画像を用いて生成された全天球画像のテクスチャ画像と、前記複数の撮影装置により取得された前記撮影画像に対応するデプス画像を用いて生成された前記全天球画像のデプス画像とを用いて、前記所定の視点のテクスチャ画像を生成する
     ように構成された
     請求項9に記載の画像処理装置。
  11.  画像処理装置が、
     ポリゴンの中心に対して対向する2視点のそれぞれについて各視点から前記ポリゴンの中心に向かう視線方向に垂直な投影面に前記ポリゴンの裏面を投影することにより得られるテクスチャ画像と、各視点の前記テクスチャ画像に対応するデプス画像とを用いて、所定の視点のテクスチャ画像を生成する画像生成ステップと、
     前記デプス画像に対応する視点と前記2視点を構成する他の視点と各画素における前記ポリゴンとの距離の逆数を量子化する量子化ステップと
     を含む画像処理方法。
  12.  ポリゴンの中心に対して対向する2視点のそれぞれについて各視点から前記ポリゴンの中心に向かう視線方向に垂直な投影面に前記ポリゴンの裏面を投影することによりテクスチャ画像を生成するテクスチャ画像生成部と、
     各視点の前記テクスチャ画像に対応するデプス画像を、前記デプス画像に対応する視点と前記2視点を構成する他の視点と各画素における前記ポリゴンとの距離の逆数を量子化する量子化方法で量子化された量子化値を画素値とすることにより生成するデプス画像生成部と
     を備える画像処理装置。
  13.  前記デプス画像生成部は、前記デプス画像に対応する視点と前記2視点を構成する他の視点と各画素における前記ポリゴンとの距離の逆数を量子化する量子化方法以外の量子化方法も備えており、所定の条件に基づいて量子化方法を切り換える、
     請求項12に記載の画像処理装置。
  14.  前記デプス画像生成部は、各視点の前記デプス画像の量子化方法を、前記デプス画像に対応する視点と各画素における前記ポリゴンとの距離の逆数を量子化する第1の量子化方法、前記距離を量子化する第2の量子化方法、および、前記デプス画像に対応する視点と前記2視点を構成する他の視点と各画素における前記ポリゴンとの距離の逆数を量子化する第3の量子化方法を備える
     請求項12に記載の画像処理装置。
  15.  前記第1および第2の量子化方法に対応する距離は、前記デプス画像に対応する視点と各画素における前記ポリゴンを結ぶ直線の距離であり、
     前記第3の量子化方法に対応する距離は、前記他の視点と各画素における前記ポリゴンとを結ぶ直線の距離である
     ように構成された
     請求項14に記載の画像処理装置。
  16.  前記テクスチャ画像生成部により生成された前記2視点のテクスチャ画像と、前記デプス画像生成部により生成された前記2視点のデプス画像とを送信する送信部
     をさらに備える
     請求項14に記載の画像処理装置。
  17.  前記デプス画像生成部は、前記第1乃至第3の量子化方法のそれぞれで前記2視点のデプス画像を生成し、
     前記送信部は、前記デプス画像生成部により前記第1乃至第3の量子化方法のいずれかで生成された前記2視点のデプス画像を送信する
     ように構成された
     請求項16に記載の画像処理装置。
  18.  前記ポリゴンに対応する被写体の周囲に配置され、前記被写体の少なくとも一部を撮影範囲に含む複数の撮影装置により取得された撮影画像と、前記撮影画像に対応するデプス画像とを用いて、前記ポリゴンを生成するポリゴン生成部
     をさらに備える
     請求項12に記載の画像処理装置。
  19.  前記複数の撮影装置により取得された前記撮影画像を用いて、全天球画像のテクスチャ画像を生成し、前記複数の撮影装置により取得された前記撮影画像に対応するデプス画像を用いて、前記全天球画像のデプス画像を生成する全天球画像生成部
     をさらに備える
     請求項18に記載の画像処理装置。
  20.  画像処理装置が、
     ポリゴンの中心に対して対向する2視点のそれぞれについて各視点から前記ポリゴンの中心に向かう視線方向に垂直な投影面に前記ポリゴンの裏面を投影することによりテクスチャ画像を生成するテクスチャ画像生成ステップと、
     各視点の前記テクスチャ画像に対応するデプス画像を、前記デプス画像に対応する視点と前記2視点を構成する他の視点と各画素における前記ポリゴンとの距離の逆数を量子化する量子化方法で量子化された量子化値を画素値とすることにより生成するデプス画像生成ステップと
     を含む画像処理方法。
PCT/JP2017/027263 2016-08-10 2017-07-27 画像処理装置および画像処理方法 WO2018030168A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201780048142.7A CN109564696B (zh) 2016-08-10 2017-07-27 图像处理设备和图像处理方法
US16/319,411 US11069120B2 (en) 2016-08-10 2017-07-27 Image processing apparatus and image processing method
JP2018532930A JP6743893B2 (ja) 2016-08-10 2017-07-27 画像処理装置および画像処理方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2016-157197 2016-08-10
JP2016157197 2016-08-10

Publications (1)

Publication Number Publication Date
WO2018030168A1 true WO2018030168A1 (ja) 2018-02-15

Family

ID=61162983

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/027263 WO2018030168A1 (ja) 2016-08-10 2017-07-27 画像処理装置および画像処理方法

Country Status (4)

Country Link
US (1) US11069120B2 (ja)
JP (1) JP6743893B2 (ja)
CN (1) CN109564696B (ja)
WO (1) WO2018030168A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111741286A (zh) * 2019-07-26 2020-10-02 谷歌有限责任公司 使用光线投射法的基于图像的多个深度图像的几何融合
RU2809661C2 (ru) * 2019-07-04 2023-12-14 Филип Моррис Продактс С.А. Способ работы индукционно нагреваемой системы, генерирующей аэрозоль

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180051288A (ko) * 2016-11-08 2018-05-16 삼성전자주식회사 디스플레이 장치 및 그 제어 방법
WO2019021302A1 (en) * 2017-07-24 2019-01-31 Karthikeyan THANGARAJ METHOD FOR REPRESENTING SHAPE DATA AND COLOR OF 3D OBJECTS
CN109697688B (zh) * 2017-10-20 2023-08-04 虹软科技股份有限公司 一种用于图像处理的方法和装置
US11166080B2 (en) 2017-12-21 2021-11-02 Facebook, Inc. Systems and methods for presenting content
WO2020027349A1 (ko) * 2018-07-31 2020-02-06 엘지전자 주식회사 다중 뷰포인트 기반 360 비디오 처리 방법 및 그 장치

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013156955A (ja) * 2012-01-31 2013-08-15 Jvc Kenwood Corp 画像処理装置、画像処理方法及び画像処理プログラム
JP2013225740A (ja) * 2012-04-20 2013-10-31 Nlt Technologies Ltd 画像生成装置、画像表示装置及び画像生成方法並びに画像生成プログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5798762A (en) * 1995-05-10 1998-08-25 Cagent Technologies, Inc. Controlling a real-time rendering engine using a list-based control mechanism
CN100573595C (zh) * 2003-06-20 2009-12-23 日本电信电话株式会社 虚拟视点图像生成方法和三维图像显示方法及装置
CN100520829C (zh) * 2007-06-22 2009-07-29 腾讯科技(深圳)有限公司 水刻蚀的实现方法及渲染装置
CN102055982B (zh) * 2011-01-13 2012-06-27 浙江大学 三维视频编解码方法及装置
JP2014140089A (ja) * 2011-05-10 2014-07-31 Sharp Corp 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム
US9208571B2 (en) * 2011-06-06 2015-12-08 Microsoft Technology Licensing, Llc Object digitization
US20140085415A1 (en) * 2012-09-27 2014-03-27 Nokia Corporation Method and apparatus for video coding

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013156955A (ja) * 2012-01-31 2013-08-15 Jvc Kenwood Corp 画像処理装置、画像処理方法及び画像処理プログラム
JP2013225740A (ja) * 2012-04-20 2013-10-31 Nlt Technologies Ltd 画像生成装置、画像表示装置及び画像生成方法並びに画像生成プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2809661C2 (ru) * 2019-07-04 2023-12-14 Филип Моррис Продактс С.А. Способ работы индукционно нагреваемой системы, генерирующей аэрозоль
CN111741286A (zh) * 2019-07-26 2020-10-02 谷歌有限责任公司 使用光线投射法的基于图像的多个深度图像的几何融合

Also Published As

Publication number Publication date
JPWO2018030168A1 (ja) 2019-06-06
CN109564696B (zh) 2022-11-29
US11069120B2 (en) 2021-07-20
CN109564696A (zh) 2019-04-02
JP6743893B2 (ja) 2020-08-19
US20190236795A1 (en) 2019-08-01

Similar Documents

Publication Publication Date Title
JP6977720B2 (ja) 生成装置および生成方法、並びに、再生装置および再生方法
JP6988815B2 (ja) 画像処理装置および画像処理方法
WO2018021069A1 (ja) 画像処理装置および画像処理方法
WO2018021067A1 (ja) 画像処理装置および画像処理方法
JP6743893B2 (ja) 画像処理装置および画像処理方法
WO2018147123A1 (ja) 画像処理装置および画像処理方法
WO2018021070A1 (ja) 画像処理装置および画像処理方法
JP6944138B2 (ja) 画像処理装置および画像処理方法
WO2018079260A1 (ja) 画像処理装置および画像処理方法
JP7095697B2 (ja) 生成装置および生成方法、並びに、再生装置および再生方法
WO2018070266A1 (ja) 画像処理装置および画像処理方法
WO2018021066A1 (ja) 画像処理装置および画像処理方法
WO2018021064A1 (ja) 画像処理装置および画像処理方法
WO2018021065A1 (ja) 画像処理装置および画像処理方法
JP6743894B2 (ja) 画像処理装置および画像処理方法
JP6930541B2 (ja) 画像処理装置および画像処理方法
JP6977725B2 (ja) 画像処理装置および画像処理方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17839241

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2018532930

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17839241

Country of ref document: EP

Kind code of ref document: A1