WO2019189199A1 - 生成装置、電子機器、生成プログラムおよびデータ構造 - Google Patents

生成装置、電子機器、生成プログラムおよびデータ構造 Download PDF

Info

Publication number
WO2019189199A1
WO2019189199A1 PCT/JP2019/012893 JP2019012893W WO2019189199A1 WO 2019189199 A1 WO2019189199 A1 WO 2019189199A1 JP 2019012893 W JP2019012893 W JP 2019012893W WO 2019189199 A1 WO2019189199 A1 WO 2019189199A1
Authority
WO
WIPO (PCT)
Prior art keywords
frame
imaging
unit
moving image
data
Prior art date
Application number
PCT/JP2019/012893
Other languages
English (en)
French (fr)
Inventor
昌也 ▲高▼橋
直樹 關口
Original Assignee
株式会社ニコン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ニコン filed Critical 株式会社ニコン
Publication of WO2019189199A1 publication Critical patent/WO2019189199A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N5/926Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback by pulse code modulation

Definitions

  • the present invention relates to a generation device, an electronic device, a generation program, and a data structure.
  • a generation apparatus is a generation apparatus that generates a moving image file obtained by compressing data output from an imaging element having a first imaging area for imaging a subject and a second imaging area for imaging a subject. , First compressed data obtained by compressing a plurality of first frames generated based on data output from the first imaging area in which the first frame rate is set, and a second frame faster than the first frame rate Second compressed data obtained by compressing a plurality of second frames generated based on the data output from the second imaging area in which the rate is set; and first position information indicating a storage position of the first compressed data; Generating a moving image file including second position information indicating a storage position of the second compressed data, and storing the moving image file generated by the generating unit in a storage device.
  • a generation device compresses data output from an imaging element having a first imaging area for imaging a subject and a second imaging area for imaging the subject.
  • a generation device that generates a moving image file, the first compressed data obtained by compressing a plurality of first frames generated based on data output from the first imaging area in which a first frame rate is set;
  • a moving image file including a second compressed data obtained by compressing a plurality of second frames generated based on data output from the second imaging area in which a second frame rate faster than the first frame rate is set.
  • a generating unit that generates the moving image file generated by the generating unit; and a storage unit that stores the moving image file in a storage device.
  • the electronic device is output from the first imaging region in which a first imaging region for imaging a subject and a second imaging region for imaging the subject, and the first imaging region in which a first frame rate is set.
  • first compressed data obtained by compressing a plurality of first frames generated based on the received data and data output from the second imaging region in which a second frame rate faster than the first frame rate is set.
  • Second compressed data obtained by compressing the plurality of second frames generated in the above, first position information indicating a storage position of the first compressed data, second position information indicating a storage position of the second compressed data, And a storage unit that stores the moving image file generated by the generating unit in a storage device.
  • an electronic device has an imaging element having a first imaging area for imaging a subject and a second imaging area for imaging the subject, and a first frame rate is set.
  • the first compressed data obtained by compressing a plurality of first frames generated based on the data output from the first imaging area, and the second frame rate faster than the first frame rate are set.
  • a generating unit that generates a moving image file including a second compressed data obtained by compressing a plurality of second frames generated based on data output from the two imaging areas; and storing the moving image file generated by the generating unit
  • a storage unit for storing in the device.
  • the generation program of the disclosed technology causes a processor to generate a moving image file obtained by compressing data output from an image sensor having a first imaging area for imaging a subject and a second imaging area for imaging a subject.
  • a first compressed data obtained by compressing a plurality of first frames generated based on data output from the first imaging area in which a first frame rate is set;
  • Second compressed data obtained by compressing a plurality of second frames generated based on data output from the second imaging area in which a second frame rate faster than a frame rate is set, and storage of the first compressed data
  • a storing process of storing the moving image file generated by the processing in the storage device is executed.
  • another generation program of the present disclosure provides a processor that generates a moving image file obtained by compressing data output from an imaging device having a first imaging area for imaging a subject and a second imaging area for imaging the subject.
  • a first compressed data obtained by compressing a plurality of first frames generated based on data output from the first imaging area in which a first frame rate is set;
  • a second compressed data obtained by compressing a plurality of second frames generated based on the data output from the second imaging area in which a second frame rate faster than the first frame rate is set.
  • a generation process for generating a file and a storage process for storing the moving image file generated by the generation process in a storage device are executed.
  • the data structure of the disclosed technology is a data structure of a moving image file obtained by compressing data output from an imaging device having a first imaging area for imaging a subject and a second imaging area for imaging a subject.
  • a first compressed data obtained by compressing a plurality of first frames generated based on data output from the first imaging area in which one frame rate is set, and a second frame rate faster than the first frame rate.
  • a data part for storing second compressed data obtained by compressing a plurality of second frames generated based on the data output from the set second imaging area, and a storage position of the first compressed data
  • a header section for storing first position information and second position information indicating a storage position of the second compressed data;
  • FIG. 1 is a cross-sectional view of a multilayer image sensor.
  • FIG. 2 is a diagram illustrating a pixel array of the imaging chip.
  • FIG. 3 is a circuit diagram of the imaging chip.
  • FIG. 4 is a block diagram illustrating a functional configuration example of the image sensor.
  • FIG. 5 is an explanatory diagram illustrating a block configuration example of an electronic device.
  • FIG. 6 is an explanatory diagram showing the relationship between the imaging surface and the subject image.
  • FIG. 7 is an explanatory diagram of a moving image compression / expansion example according to the first embodiment.
  • FIG. 8 is an explanatory diagram showing a file format example of a moving image file.
  • FIG. 9 is an explanatory diagram showing the relationship between frames and additional information.
  • FIG. 10 is an explanatory diagram illustrating a synthesis process example 1 in the synthesis unit illustrated in FIG. 7.
  • FIG. 11 is an explanatory diagram illustrating a synthesis process example 2 in the synthesis unit illustrated in FIG. 7.
  • 12 is a block diagram illustrating a configuration example of the control unit illustrated in FIG.
  • FIG. 13 is a block diagram illustrating a configuration example of the compression unit.
  • FIG. 14 is a sequence diagram illustrating an example of an operation processing procedure of the control unit.
  • FIG. 15 is a flowchart showing a detailed processing procedure example of the setting processing (steps S1404 and S1410) shown in FIG.
  • FIG. 16 is a flowchart showing a detailed processing procedure example of the frame rate setting process (step S1505) shown in FIG. FIG.
  • FIG. 17 is a flowchart illustrating an example of a complement processing procedure by the complement unit.
  • FIG. 18 is a flowchart showing a detailed processing procedure example of the moving image file generation processing (steps S1413 and S1415) shown in FIG.
  • FIG. 19 is a flowchart illustrating an example of a compression control processing procedure of the first compression control method by the compression control unit.
  • FIG. 20 is a flowchart illustrating an example of a motion detection processing procedure of the first compression control method by the motion detection unit.
  • FIG. 21 is a flowchart illustrating an example of a motion compensation processing procedure of the first compression control method by the motion compensation unit.
  • FIG. 22 is a flowchart illustrating an example of a compression control processing procedure of the second compression control method by the compression control unit.
  • FIG. 23 is a flowchart illustrating an example of a motion detection processing procedure of the second compression control method by the motion detection unit.
  • FIG. 24 is a flowchart illustrating an example of a motion compensation processing procedure of the second compression control method by the motion compensation unit.
  • FIG. 25 is a flowchart illustrating an example of a processing procedure from decompression to reproduction.
  • FIG. 26 is a flowchart illustrating a detailed processing procedure example of the synthesizing process (step S2507) illustrated in FIG.
  • FIG. 27 is an explanatory diagram showing a specific processing flow of the synthesis example shown in FIG.
  • FIG. 28 is an explanatory diagram of a synthesis example 1 of 60 [fps] frames according to the second embodiment.
  • FIG. 29 is an explanatory diagram of a frame synthesis example 2 of 60 [fps] according to the second embodiment.
  • FIG. 30 is an explanatory diagram of a frame synthesis example 4 of 60 [fps] according to the second embodiment.
  • FIG. 31 is a flowchart illustrating a first example of a synthesis process according to a first example of frame synthesis by the synthesis unit.
  • FIG. 32 is a flowchart illustrating a second example of the synthesis process according to the second example of frame synthesis by the synthesis unit.
  • FIG. 33 is a flowchart illustrating a synthesis processing procedure example 3 according to frame synthesis example 3 by the synthesis unit.
  • FIG. 34 is a flowchart of a synthesis processing procedure example 4 according to frame synthesis example 4 by the synthesis unit.
  • FIG. 35 is an explanatory diagram of a synthesis example of 60 [fps] frames according to the third embodiment.
  • FIG. 36 is an explanatory diagram showing a correspondence relationship between the setting of the imaging region and the image region of the second frame after complement.
  • the electronic device is, for example, an imaging device such as a digital camera or a digital video camera.
  • FIG. 1 is a cross-sectional view of the multilayer image sensor 100.
  • a stacked imaging device (hereinafter simply “imaging device”) 100 processes a pixel signal with a back-illuminated imaging chip (hereinafter simply “imaging chip”) 113 that outputs a pixel signal corresponding to incident light.
  • a signal processing chip 111 and a memory chip 112 that stores pixel signals are provided.
  • the imaging chip 113, the signal processing chip 111, and the memory chip 112 are stacked, and are electrically connected to each other by a conductive bump 109 such as Cu.
  • incident light is incident mainly in the positive direction of the Z-axis indicated by a white arrow.
  • the surface on the side where incident light is incident is referred to as a back surface.
  • the left direction on the paper orthogonal to the Z axis is the X axis plus direction
  • the front side of the paper orthogonal to the Z axis and the X axis is the Y axis plus direction.
  • the coordinate axes are displayed so that the orientation of each figure can be understood with reference to the coordinate axes of FIG.
  • the imaging chip 113 is a back-illuminated MOS (Metal Oxide Semiconductor) image sensor.
  • the PD (photodiode) layer 106 is disposed on the back side of the wiring layer 108.
  • the PD layer 106 includes a plurality of PDs 104 that are two-dimensionally arranged and accumulate electric charges corresponding to incident light, and transistors 105 that are provided corresponding to the PDs 104.
  • a color filter 102 is provided on the incident light incident side of the PD layer 106 via a passivation film 103.
  • the color filter 102 has a plurality of types that transmit different wavelength regions, and has a specific arrangement corresponding to each of the PDs 104. The arrangement of the color filter 102 will be described later.
  • a set of the color filter 102, the PD 104, and the transistor 105 forms one pixel.
  • a microlens 101 is provided on the incident light incident side of the color filter 102 corresponding to each pixel.
  • the microlens 101 condenses incident light toward the corresponding PD 104.
  • the wiring layer 108 includes a wiring 107 that transmits a pixel signal from the PD layer 106 to the signal processing chip 111.
  • the wiring 107 may be multilayer, and a passive element and an active element may be provided.
  • a plurality of bumps 109 are arranged on the surface of the wiring layer 108.
  • the plurality of bumps 109 are aligned with the plurality of bumps 109 provided on the opposing surface of the signal processing chip 111, and the imaging chip 113 and the signal processing chip 111 are pressed and aligned.
  • the bumps 109 are joined and electrically connected.
  • a plurality of bumps 109 are arranged on the mutually facing surfaces of the signal processing chip 111 and the memory chip 112. These bumps 109 are aligned with each other, and the signal processing chip 111 and the memory chip 112 are pressurized, whereby the aligned bumps 109 are joined and electrically connected.
  • the bonding between the bumps 109 is not limited to Cu bump bonding by solid phase diffusion, and micro bump bonding by solder melting may be employed. Further, for example, about one bump 109 may be provided for one block described later. Therefore, the size of the bump 109 may be larger than the pitch of the PD 104. Further, a bump larger than the bump 109 corresponding to the pixel region may be provided in a peripheral region other than the pixel region where the pixels are arranged.
  • the signal processing chip 111 has TSVs (silicon through electrodes) 110 that connect circuits provided on the front and back surfaces to each other.
  • the TSV 110 is preferably provided in the peripheral area.
  • the TSV 110 may also be provided in the peripheral area of the imaging chip 113 and the memory chip 112.
  • FIG. 2 is a diagram for explaining the pixel arrangement of the imaging chip 113.
  • (A) is a plan view schematically showing an imaging surface 200 that is the back surface of the imaging chip 113
  • (b) is an enlarged plan view of a partial region 200a of the imaging surface 200.
  • Each pixel 201 has a color filter (not shown).
  • the color filters include three types of red (R), green (G), and blue (B).
  • the notation “R”, “G”, and “B” in (b) is a color filter that the pixel 201 has. Represents the type.
  • pixels 201 having such color filters are arranged according to a so-called Bayer array.
  • the pixel 201 having a red filter photoelectrically converts light in the red wavelength band out of incident light and outputs a light reception signal (photoelectric conversion signal).
  • the pixel 201 having a green filter photoelectrically converts light in the green wavelength band out of incident light and outputs a light reception signal.
  • the pixel 201 having a blue filter photoelectrically converts light in the blue wavelength band out of incident light and outputs a light reception signal.
  • the image sensor 100 is configured to be individually controllable for each block 202 composed of a total of four pixels 201 of adjacent 2 pixels ⁇ 2 pixels. For example, when charge accumulation is started for two different blocks 202 at the same time, one block 202 reads out charges after 1/30 seconds from the start of charge accumulation, that is, reads a received light signal, and the other block 202 Charges can be read out 1/15 seconds after the start of charge accumulation. In other words, the image sensor 100 can set a different exposure time (charge accumulation time, so-called shutter speed) for each block 202 in one imaging.
  • the imaging device 100 can vary the amplification factor (so-called ISO sensitivity) of the imaging signal for each block 202 in addition to the exposure time described above.
  • the image sensor 100 can change the timing for starting charge accumulation and the timing for reading a light reception signal for each block 202. That is, the image sensor 100 can change the frame rate at the time of moving image capturing for each block 202.
  • the image sensor 100 is configured to be able to vary the imaging conditions such as exposure time, amplification factor, and frame rate for each block 202. For example, if a readout line (not shown) for reading an imaging signal from a photoelectric conversion unit (not shown) included in the pixel 201 is provided for each block 202 and the imaging signal can be read independently for each block 202, The exposure time (shutter speed) can be varied for each block 202.
  • an amplification circuit (not shown) that amplifies an imaging signal generated by photoelectrically converted charges is provided independently for each block 202, and the amplification factor of the amplification circuit can be controlled independently for each amplification circuit.
  • the signal amplification factor (ISO sensitivity) can be varied for each block 202.
  • the imaging conditions that can be varied for each block 202 include the frame rate, gain, resolution (decimation rate), the number of added rows or added columns to which pixel signals are added, and charge accumulation. For example, the number of times or the number of accumulation, the number of bits for digitization, and the like.
  • the control parameter may be a parameter in image processing after obtaining an image signal from a pixel.
  • the imaging conditions include a liquid crystal panel having a section that can be controlled independently for each block 202 (one section corresponds to one block 202) in the image sensor 100, and is used as a neutral density filter that can be turned on and off. Then, the brightness (aperture value) can be controlled for each block 202.
  • the number of the pixels 201 constituting the block 202 may not be the 2 ⁇ 2 four pixels described above.
  • the block 202 only needs to have at least one pixel 201, and conversely, may have more than four pixels 201.
  • FIG. 3 is a circuit diagram of the imaging chip 113.
  • a rectangle surrounded by a dotted line typically represents a circuit corresponding to one pixel 201.
  • a rectangle surrounded by a one-dot chain line corresponds to one block 202 (202-1 to 202-4). Note that at least some of the transistors described below correspond to the transistor 105 in FIG.
  • the reset transistor 303 of the pixel 201 is turned on / off in units of the block 202.
  • the transfer transistor 302 of the pixel 201 is also turned on / off in units of the block 202.
  • the reset wiring 300-1 for turning on / off the four reset transistors 303 corresponding to the upper left block 202-1 is provided, and the four transfer transistors corresponding to the block 202-1 are provided.
  • a TX wiring 307-1 for supplying a transfer pulse to 302 is also provided.
  • a reset wiring 300-3 for turning on / off the four reset transistors 303 corresponding to the lower left block 202-3 is provided separately from the reset wiring 300-1.
  • a TX wiring 307-3 for supplying a transfer pulse to the four transfer transistors 302 corresponding to the block 202-3 is provided separately from the TX wiring 307-1.
  • a reset wiring 300-2 and a TX wiring 307-2, and a reset wiring 300-4 and a TX wiring 307-4 are provided in each block 202, respectively. It has been.
  • the 16 PDs 104 corresponding to the respective pixels 201 are connected to the corresponding transfer transistors 302, respectively.
  • a transfer pulse is supplied to the gate of each transfer transistor 302 via the TX wiring for each block 202.
  • the drain of each transfer transistor 302 is connected to the source of the corresponding reset transistor 303, and a so-called floating diffusion FD between the drain of the transfer transistor 302 and the source of the reset transistor 303 is connected to the gate of the corresponding amplification transistor 304.
  • each reset transistor 303 is commonly connected to a Vdd wiring 310 to which a power supply voltage is supplied. A reset pulse is supplied to the gate of each reset transistor 303 via the reset wiring for each block 202.
  • each amplification transistor 304 is commonly connected to the Vdd wiring 310 to which the power supply voltage is supplied.
  • the source of each amplification transistor 304 is connected to the drain of the corresponding selection transistor 305.
  • the gate of each selection transistor 305 is connected to a decoder wiring 308 to which a selection pulse is supplied.
  • the decoder wiring 308 is provided independently for each of the 16 selection transistors 305.
  • each selection transistor 305 is connected to a common output wiring 309.
  • the load current source 311 supplies current to the output wiring 309. That is, the output wiring 309 for the selection transistor 305 is formed by a source follower. Note that the load current source 311 may be provided on the imaging chip 113 side or may be provided on the signal processing chip 111 side.
  • Each PD 104 converts received light into electric charge and stores it when the application of the transfer pulse is released. Thereafter, when the transfer pulse is applied again without the reset pulse being applied, the accumulated charge is transferred to the floating diffusion FD, and the potential of the floating diffusion FD changes from the reset potential to the signal potential after the charge accumulation. .
  • the reset wiring and the TX wiring are common to the four pixels forming the block 202. That is, the reset pulse and the transfer pulse are simultaneously applied to the four pixels in the block 202, respectively. Therefore, all the pixels 201 forming a certain block 202 start charge accumulation at the same timing and end charge accumulation at the same timing. However, the pixel signal corresponding to the accumulated charge is selectively output from the output wiring 309 by sequentially applying the selection pulse to each selection transistor 305.
  • the charge accumulation start timing can be controlled for each block 202. In other words, it is possible to capture images at different timings between different blocks 202.
  • FIG. 4 is a block diagram illustrating a functional configuration example of the image sensor 100.
  • the analog multiplexer 411 sequentially selects the 16 PDs 104 forming the block 202 and outputs each pixel signal to the output wiring 309 provided corresponding to the block 202.
  • the multiplexer 411 is formed on the imaging chip 113 together with the PD 104.
  • the pixel signal output via the multiplexer 411 is supplied to the signal processing chip 111 by a signal processing circuit 412 that performs correlated double sampling (CDS) / analog / digital (A / D) conversion. D conversion is performed.
  • CDS correlated double sampling
  • a / D converted pixel signal is transferred to the demultiplexer 413 and stored in the pixel memory 414 corresponding to each pixel.
  • the demultiplexer 413 and the pixel memory 414 are formed in the memory chip 112.
  • the arithmetic circuit 415 processes the pixel signal stored in the pixel memory 414 and delivers it to the subsequent stage.
  • the arithmetic circuit 415 may be provided in the signal processing chip 111 or may be provided in the memory chip 112. Note that FIG. 4 shows connections for four blocks 202, but actually these exist for each of the four blocks 202 and operate in parallel.
  • the arithmetic circuit 415 may not exist for each of the four blocks 202.
  • one arithmetic circuit 415 sequentially processes the values of the pixel memory 414 corresponding to each of the four blocks 202 while sequentially referring to the values. May be.
  • the output wiring 309 is provided corresponding to each of the blocks 202. Since the image pickup device 100 has the image pickup chip 113, the signal processing chip 111, and the memory chip 112 laminated, by using electrical connection between the chips using the bump 109 for the output wiring 309, each chip is arranged in the surface direction. Wiring can be routed without increasing the size.
  • FIG. 5 is an explanatory diagram illustrating a block configuration example of an electronic device.
  • Electronic device 500 is, for example, a lens-integrated camera.
  • the electronic device 500 includes an imaging optical system 501, an imaging device 100, a control unit 502, a liquid crystal monitor 503, a memory card 504, an operation unit 505, a DRAM 506, a flash memory 507, and a recording unit 508.
  • the control unit 502 includes a compression unit that compresses moving image data as will be described later. Therefore, a configuration including at least the control unit 502 in the electronic device 500 is a moving image compression device, a decompression device, and a playback device.
  • the memory card 504, the DRAM 506, and the flash memory 507 constitute a storage device 1202 to be described later.
  • the imaging optical system 501 is composed of a plurality of lenses, and forms a subject image on the imaging surface 200 of the imaging device 100.
  • the imaging optical system 501 is illustrated as a single lens for convenience.
  • the imaging element 100 is an imaging element such as a CMOS (Complementary Metal Oxide Semiconductor) or a CCD (Charge Coupled Device), and outputs an imaging signal by imaging a subject image formed by the imaging optical system 501.
  • the control unit 502 is an electronic circuit that controls each unit of the electronic device 500, and includes a processor and its peripheral circuits.
  • a predetermined control program is written in advance in the flash memory 507 which is a nonvolatile storage medium.
  • the processor of the control unit 502 controls each unit by reading a control program from the flash memory 507 and executing it.
  • This control program uses DRAM 506, which is a volatile storage medium, as a work area.
  • the liquid crystal monitor 503 is a display device using a liquid crystal panel.
  • the control unit 502 causes the image sensor 100 to repeatedly capture a subject image every predetermined cycle (for example, 1/60 second). Then, various image processes are performed on the imaging signal output from the imaging element 100 to create a so-called through image, which is displayed on the liquid crystal monitor 503. In addition to the above-described through image, for example, a setting screen for setting imaging conditions is displayed on the liquid crystal monitor 503.
  • the control unit 502 creates an image file to be described later based on the imaging signal output from the imaging device 100, and records the image file on a memory card 504 that is a portable recording medium.
  • the operation unit 505 includes various operation members such as push buttons, and outputs an operation signal to the control unit 502 in response to the operation members being operated.
  • the recording unit 508 is composed of, for example, a microphone, converts environmental sound into an audio signal, and inputs the sound signal to the control unit 502.
  • the control unit 502 does not record a moving image file on the memory card 504 that is a portable recording medium, but a recording medium (not illustrated) such as an SSD (Solid State Drive) or a hard disk built in the electronic device 500. May be recorded.
  • a recording medium such as an SSD (Solid State Drive) or a hard disk built in the electronic device 500. May be recorded.
  • FIG. 6 is an explanatory diagram showing the relationship between the imaging surface 200 and the subject image.
  • A schematically shows the imaging surface 200 (imaging range) and the subject image 601 of the imaging device 100.
  • the control unit 502 captures a subject image 601.
  • the imaging in (a) may also serve as imaging performed for creating a live view image (so-called through image), for example.
  • the control unit 502 performs a predetermined image analysis process on the subject image 601 obtained by the imaging of (a).
  • the image analysis processing is processing for detecting a main subject using, for example, a well-known subject detection technique (a technique for calculating a feature amount and detecting a range where a predetermined subject exists).
  • a well-known subject detection technique a technique for calculating a feature amount and detecting a range where a predetermined subject exists.
  • the background other than the main subject is used. Since the main subject is detected by the image analysis processing, the imaging surface 200 is divided into a main subject region 602 where the main subject exists and a background region 603 where the background exists.
  • a region roughly including the subject image 601 is illustrated as a main subject region 602, but the main subject region 602 may have a shape along the outer shape of the subject image 601.
  • the main subject area 602 may be set so as to contain as little as possible other than the subject image 601.
  • the control unit 502 sets different imaging conditions for each block 202 in the main subject area 602 and each block 202 in the background area 603. For example, a faster shutter speed is set for each of the former blocks 202 than for each of the latter blocks 202. In this way, image blurring is less likely to occur in the main subject region 602 in the imaging of (c) that is taken after the imaging of (a).
  • the control unit 502 applies a relatively high ISO sensitivity to each block 202. Or set a slow shutter speed.
  • the control unit 502 sets a relatively low ISO sensitivity or sets a high shutter speed for each of the latter blocks 202. In this way, in the imaging of (c), it is possible to prevent blackout of the main subject area 602 in the backlight state and whiteout of the background area 603 with a large amount of light.
  • the image analysis processing may be processing different from the processing for detecting the main subject region 602 and the background region 603 described above. For example, it may be a process of detecting a portion where the brightness is equal to or higher than a certain level (a portion that is too bright) or a portion where the brightness is less than a certain level (a portion that is too dark) in the entire imaging surface 200.
  • the control unit 502 controls the shutter so that the exposure value (Ev value) of the block 202 included in the former region is lower than that of the block 202 included in the other region.
  • Speed and ISO sensitivity may be set.
  • control unit 502 sets the shutter speed and the ISO sensitivity so that the exposure value (Ev value) of the block 202 included in the latter area is higher than that of the block 202 included in the other area. By doing in this way, the dynamic range of the image obtained by imaging of (c) can be expanded from the original dynamic range of the image sensor 100.
  • FIG. 6B shows an example of mask information 604 corresponding to the imaging surface 200 shown in FIG. “1” is stored in the position of the block 202 belonging to the main subject area 602, and “2” is stored in the position of the block 202 belonging to the background area 603.
  • the control unit 502 executes image analysis processing on the image data of the first frame, and detects the main subject region 602 and the background region 603. As a result, a frame obtained by imaging in (a) is divided into a main subject area 602 and a background area 603 as shown in (b). The control unit 502 sets different imaging conditions for each block 202 in the main subject area 602 and each block 202 in the background area 603, performs imaging in (c), and creates image data. An example of the mask information 604 at this time is shown in (d).
  • the mask information 604 of (b) corresponding to the imaging result of (a) and the mask information 604 of (d) corresponding to the imaging result of (c) are imaged at different times (the time difference is different). Therefore, for example, when the subject is moving or when the user moves the electronic device 500, the two pieces of mask information 604 have different contents. In other words, the mask information 604 is dynamic information that changes over time. Therefore, in a certain block 202, different imaging conditions are set for each frame.
  • FIG. 7 is an explanatory diagram of a moving image compression / expansion example according to the first embodiment.
  • the electronic device 500 includes the above-described image sensor 100 and the control unit 502.
  • the control unit 502 includes a first generation unit 701, a compression / decompression unit 702, a synthesis unit 703, and a playback unit 704.
  • the imaging element 100 has a plurality of imaging areas for imaging a subject.
  • the imaging region is a set of pixels of at least one pixel, for example, one or more blocks 202 described above. Imaging conditions (for example, frame rate, exposure time, ISO sensitivity) can be set for each block 202 in the imaging area.
  • an imaging area in which a first frame rate (for example, 30 [fps]) is set is referred to as a “first imaging area”, and a second frame rate (for example, faster than the first frame rate) , 60 [fps]) is referred to as a “second imaging area”.
  • first imaging area an imaging area in which a first frame rate (for example, 30 [fps]) is set
  • second frame rate for example, faster than the first frame rate
  • the second frame rate are examples, and other values may be used as long as the second frame rate is faster than the first frame rate. If the second frame rate is a multiple of the first frame rate, frames output from the first imaging region and the second imaging region can be obtained at the imaging timing of the first frame rate.
  • the image sensor 100 images the subject and outputs the input moving image data 710 to the first generation unit 701.
  • An area of image data output from an imaging area with the imaging element 100 is referred to as an image area (corresponding to the imaging area).
  • the first imaging area (imaging) is captured by imaging at the first frame rate (30 [fps]).
  • the image data of the first image area a1 (shaded) output from the entire surface 200) becomes one frame by image processing. This frame is referred to as a “first frame 711”.
  • the first frame 711 is generated as image data of the first image area a1 only for the landscape by imaging at the first frame rate (30 [fps]).
  • the entire imaging surface 200 is the first imaging area set to the first frame rate (30 [fps])
  • the imaging area where the specific subject is detected is the second imaging area from the first imaging area.
  • a combination of (shaded) image data and image data of the second image area a2 output from the second imaging area is also the first frame 711.
  • the first frame 711 is generated.
  • the image data of the second image area a2 output from the second imaging area output from the second imaging area of the imaging surface 200 by imaging at the second frame rate (60 [fps]) This will be referred to as “data 712”.
  • the image area in which the image data of the subject is not output from the first imaging area is referred to as “missing area 712x”.
  • the number of imaging areas in which different frame rates are set may be three or more.
  • a frame rate different from the first frame rate and the second frame rate can be set for the third imaging region and thereafter.
  • the first generation unit 701 complements the image data 712 in the input moving image data 710 input from the image sensor 100. Specifically, for example, the first generation unit 701 supplements the missing area 712x in which no image signal is output from the first imaging area of the imaging element 100 with a specific color.
  • the specific color is black, and black is also applied in FIG. Note that the specific color may be a color other than black or a specific pattern. Further, the specific color may be a plurality of colors instead of a single color.
  • the pixel area around the second image area a2 may be the same color as the boundary of the second image area a2.
  • the missing area 712x supplemented with the specific color is referred to as a “complement area 712y”.
  • Image data obtained by combining the image data 712 and the complementary region 712y by image processing is referred to as a second frame 713.
  • the moving image data constituted by the first frame 711 group is referred to as first moving image data 721
  • the moving image data constituted by the second frame 713 group is referred to as second moving image data 722.
  • the first generation unit 701 outputs the first moving image data 721 and the second moving image data 722 to the compression / decompression unit 702.
  • the compression / decompression unit 702 compresses the first moving image data 721 and the second moving image data 722 and stores them in a storage device (for example, the memory card 504 and the flash memory 507).
  • the compression / decompression unit 702 performs compression by hybrid encoding in which motion compensation inter-frame prediction (Motion Compensation: MC) and discrete cosine transform (Discrete Cosine Transform: DCT) are combined with entropy coding.
  • motion compensation inter-frame prediction Motion Compensation: MC
  • DCT discrete cosine Transform
  • the compression / decompression unit 702 executes a compression process that does not require motion detection or motion compensation for the first image area a1 indicated by shading in the first frame 711 constituting the first moving image data 721.
  • the compression / decompression unit 702 compresses the image data 712 of the second image area a2 in which the hatched specific subject image is output by the hybrid encoding described above. As described above, since motion detection and motion compensation are not executed for the first image region a1 other than the specific subject image, the processing load of moving image compression can be reduced.
  • the compression / decompression unit 702 may compress the first image area a1 by the hybrid encoding described above.
  • the compression / decompression unit 702 executes a compression process that does not require motion detection or motion compensation for the complementary region 712y shown in black in the second frame 713 constituting the second moving image data 722.
  • the compression / decompression unit 702 compresses the image data 712 of the second image area a2 in which the hatched specific subject image is output by the hybrid encoding described above.
  • the compression / decompression unit 702 may compress the complementary region 712y by the hybrid encoding described above.
  • the second frame 713 obtained at the second frame rate (60 [fps]) has the same size as the first frame 711 obtained at the first frame rate (30 [fps]). Accordingly, the second frame 713 is applied with the same compression processing as the compression processing of the first frame 711, so there is no need to apply another compression processing that matches the size of the image data 712.
  • the compression / decompression unit 702 decompresses the compressed first moving image data 721 and second moving image data 722 when a moving image reproduction instruction or expansion instruction is given, and the original first moving image data 721 and second moving image data 722 are expanded. Return to the video data 722.
  • the synthesizing unit 703 refers to the first frame 711 immediately before the second frame 713, and duplicates, that is, combines the first frame 711 with the second frame 713. Specifically, the synthesis unit 703 generates another first frame 711 to be synthesized with the second frame by duplication, and synthesizes the generated first frame and second frame.
  • the synthesized frame is referred to as a “third frame 730”.
  • the third frame 730 is a frame in which the subject image in the second frame 713 (second image region a2) is superimposed on the subject image in the first frame 711.
  • the synthesizing unit 703 outputs moving image data (hereinafter, fourth moving image data) 740 including the first frame 711 output by 30 [fps] imaging and the third frame 730 that is a combined frame to the reproducing unit 704. To do. Note that when there is no combination instruction, for example, when it is desired to reproduce a moving image at 30 fps, the combining unit 703 does not execute the combining process.
  • the reproduction unit 704 reproduces the fourth moving image data 740 and displays the moving image on the liquid crystal monitor 503.
  • the input moving image data 710 cannot be compressed by the compression / decompression unit 702 as it is. Therefore, the first generation unit 701 generates the second moving image data 722 including a plurality of second frames 713 by complementing the image data 712 with the complement region 712y.
  • the compression / decompression unit 702 compresses and decompresses the first moving image data 721 and the second moving image data 722 separately.
  • the general-purpose compression / decompression unit 702 can compress the second moving image data 722 in the compression / decompression unit 702 in the same manner as the normal moving image data (first moving image data 721). Note that if the compositing process is not executed by the compositing unit 703, the reproducing unit 704 reproduces the first moving image data 721 having a frame rate of 30 [fps] and displays the moving image on the liquid crystal monitor 503. .
  • the imaging area where the specific subject is detected is the first imaging area.
  • the setting of the imaging condition of the imaging area of the imaging surface 200 is not limited to this, but the case where the second imaging area is changed to the second imaging area set to the second frame rate (60 [fps]) has been described.
  • the staggered arrangement a plurality of first imaging regions set at the first frame rate (30 [fps]) and a plurality of frames installed at the second frame rate (60 [fps]) on the imaging surface 200.
  • the image data combined by the plurality of first image areas a1 corresponding to the plurality of first imaging areas is the first frame F711.
  • the image data combined by the plurality of second image areas a2 corresponding to the plurality of second imaging areas is the “second frame F712”.
  • the first imaging area and the second imaging area have the same frame rate, and other imaging conditions such as exposure time, ISO sensitivity, and thinning rate are set to be different between the first imaging area and the second imaging area. May be.
  • FIG. 8 is an explanatory diagram showing a file format example of a moving image file.
  • FIG. 8 for example, a case where a file format conforming to MPEG4 (Moving Picture Experts Group phase 4) is applied will be described as an example.
  • MPEG4 Motion Picture Experts Group phase 4
  • the moving image file 800 is a set of data called a box, and has a header portion 801 and a data portion 802, for example.
  • the header portion 801 includes ftyp 811, uuid 812, and moov 813 as boxes.
  • the data part 802 includes mdat 820 as a box.
  • Ftyp 811 is a box for storing information indicating the type of the moving image file 800, and is arranged at a position before the other boxes in the moving image file 800.
  • the uuid 812 is a box that stores a general-purpose unique identifier, and can be expanded by the user.
  • the uuid 812 includes moving image data in which the frame rate of the frame group in the moving image file 800 is only the first frame rate (for example, 30 [fps]), or the first frame rate and the second frame.
  • Frame rate identification information for identifying whether the video data includes the rate (60 [fps]) (first video data 721 and second video data 722) may be written. Thereby, it is possible to specify which moving image data has which frame rate at the time of expansion, composition, and reproduction.
  • the moov 813 is a box for storing metadata regarding various media such as moving images, sounds, and texts.
  • the mdat 820 is a box that stores data of various media such as moving images, sounds, and texts.
  • the moov 813 includes a uuid 831, an udta 832, an mvhd 833, trak 834 a and 834 b, and additional information 835.
  • trak 834a and 834b are simply expressed as trak834.
  • tkhd841a of data in trak834a and tkhd841b of data in trak834b are simply referred to as tkhd841.
  • the uuid 831 is a box that stores a general-purpose unique identifier, like the uuid 812, and can be expanded by the user.
  • the frame type identification that identifies whether each frame in the moving image file 800 is the first frame 711 or the second frame 713 is given to the uuid 831. Information is written in association with the frame number.
  • information indicating the storage position of the compressed data of the first moving image data 721 and the compressed data of the second moving image data 722 may be written. Specifically, for example, (SOM (Start Of Movie) 850a, EOM (End Of Movie) 854a) is written as information indicating the storage position of the compressed data of the first moving image data 721, and the second moving image data 722 is stored. (SOM850b, EOM854b) is written as information indicating the storage location of the compressed data. Thereby, it is possible to specify which moving image data is stored in which storage position at the time of expansion, composition, and reproduction.
  • the storage position of the compressed data can be specified by stsz 847a and 847b and stco 848a and 848b described later. Therefore, the information indicating the storage position is associated with the first frame rate information indicating the first frame rate by associating the compressed data address of the first moving image data 721 specified from stsz 847a, 847b and stco 848a, 848b instead of SOM 850a and EOM 854a. As stsz 847a and 847b and stco 848a and 848b.
  • the address of the compressed data of the second moving image data 722 specified from stsz 847a, 847b and stco 848a, 848b is associated with the second frame rate information indicating the second frame rate to indicate the storage position.
  • Information may be set to stsz 847a and 847b and stco 848a and 848b.
  • Udta832 is a box for storing user data.
  • the user data includes, for example, an electronic device identification code and electronic device position information.
  • Mvhd 833 is a box for storing a time scale and duration for each trak 834.
  • the time scale is a frame rate or a sampling frequency.
  • the duration is a length based on a time scale. When the duration is divided by the time scale, the time length of the media specified by the trak 834 is obtained.
  • Trak834 is a box set for each type of media (moving image, sound, text).
  • moov includes trak 834a and 834b.
  • the trak 834a is a box that stores metadata relating to the moving image, sound, and text of the first moving image data 721 output by imaging at 30 [fps], for example.
  • the trak 834a is set for each moving image, sound, and text of the first moving image data 721.
  • the trak834b is a box that stores, for example, metadata regarding the moving image, sound, and text of the second moving image data 722 output by imaging at 60 [fps].
  • the trak 834b is also set for each moving image, sound, and text of the second moving image data 722.
  • the additional information 835 is a box including imaging condition information and insertion position information.
  • the imaging condition information is information indicating a storage position of the medium in the moving image file 800 for each imaging condition (for example, a frame rate such as 30 [fps] or 60 [fps]).
  • the insertion position information is information indicating a position at which the media data of the faster frame rate (second moving image data 722) is inserted into the media data of the slower frame rate (first moving image data 721).
  • the trak 834a and 834b include tkhd 841a and 841b, edts 842a and 842b, tref 843a and 843b, stsc 844a and 844b, stts 845a and 845b, stss 846a and 846b, and stsz 847a, 847b, and 847b.
  • tkhd841a to stco848a and tkhd841b to stco848b are simply written as tkhd841 to stco848 when not distinguished from each other.
  • Edts 842 is a box that stores the playback start position of trak 834 and the playback time from the playback position as an edit list of trak 834.
  • Stsc 844 is a box for storing the number of samples in one chunk.
  • a chunk is a collection of media data for the number of samples, and is stored in mdat 820. For example, if the media is a video, the sample in the chunk is a frame. If the number of samples is “3”, it means that three frames are stored in one chunk.
  • Stts 845 is a box that stores the playback time for each chunk in the trak 834 or a sample in the chunk.
  • a stss 846 is a box for storing information related to the interval between key frames (I pictures). When the GOP (Group of Pictures) is “5”, “1, 6, 11,...” Is stored in the stss 846.
  • Stsz847 is a box that stores the data size of each sample in mdat820.
  • the stco 848 is a box that stores an offset from the head address of the moving image file 800 for each chunk in the mdat 820.
  • Mdat 820 is a box for storing a chunk for each medium.
  • SOM 850a and 850b are identifiers indicating the storage start position of a chunk group under a certain imaging condition.
  • EOMs 854a and 854b are identifiers indicating the storage end positions of chunk groups under a certain imaging condition.
  • mdat 820 includes a moving image chunk 851-1, an audio chunk 852-1, a text chunk 853-1,..., A moving image chunk 851-2, an audio chunk 852-2, a text chunk 853-2,. -3, voice chunk 852-3, and text chunk 853-3.
  • chunks are divided according to imaging conditions. Specifically, for example, chunk groups obtained at an imaging timing of 30 [fps] from SOM 850a to EOM 854a are stored, and chunk groups obtained at an imaging timing of 60 [fps] are stored from SOM 850b to EOM 854b.
  • the moving image chunk 851-1 stores compressed frames of the first frame 711 before detection of a specific subject, which are samples output by imaging at 30 [fps], that is, compressed frames 861-s1, 861-s2, and 861-s3. To do.
  • the moving image chunk 851-2 stores the compressed frames of the first frame 711 when the specific subject is detected, that is, the samples output by imaging at 30 [fps], that is, the compressed frames 862-s1, 862-s2, and 862-s3.
  • the frames 862-s1, 862-s2, and 862-s3 include a specific subject image (second image region a2) at 60 [fps] because the imaging timing overlaps with 60 [fps].
  • the moving image chunk 851-3 stores compressed frames of the second frame 713 at the time of detection of a specific subject, ie, compressed frames 863-s1, 863-s2, and 863-s3, which are samples output by imaging at 60 [fps]. To do.
  • FIG. 9 is an explanatory diagram showing the relationship between frames and additional information 835.
  • (A) shows an example of the data structure of frame F.
  • the frame F has a frame number 901 and frame data 902.
  • the frame data 902 is image data generated by imaging.
  • (B) indicates a compressed frame sequence.
  • compressed frames are arranged in time series from left (oldest) to right (latest).
  • # 1a to # 6a are the frame numbers of the compressed frames 861-s1, 861-s2, 861-s3, 862-s1, 862-s2, and 862-s3 output by imaging at 30 [fps].
  • # 1b to # 3b are the frame numbers of the compressed frames 863-s1, 863-s2, and 863-s3 that are output by imaging at 60 [fps].
  • the additional information 835 includes imaging condition information 910 and insertion position information 920.
  • the imaging condition information 910 is information indicating the storage position of the medium in the moving image file 800 for each imaging condition (for example, a frame rate such as 30 [fps] or 60 [fps]).
  • the imaging condition information 910 includes frame rate information 911 and position information 912.
  • the frame rate information 911 is a frame rate such as 30 [fps] or 60 [fps], for example.
  • the position information 912 is information indicating the storage position of the compressed frame in the moving image file 800, and is specified by referring to stsz847 and stco848. Specifically, for example, the value Pa of the position information 912 of the compressed frame whose frame rate information 911 is 30 [fps] indicates an address in the range of SOM850a to EOM854a. Similarly, the value Pb of the position information 912 of the compressed frame whose frame rate information 911 is 60 [fps] indicates an address in the range of SOM850b to EOM854b.
  • the insertion position information 920 includes media data (second moving image data 722) having a faster frame rate (60 [fps]) and media data (first moving image data 721) having a slower frame rate (30 [fps]). ) Is information indicating the insertion position.
  • the insertion position information 920 includes an insertion frame number 921 and an insertion destination 922.
  • the insertion frame number 921 indicates the frame number of the compressed frame to be inserted.
  • compressed frames 863-s1, 863-s2, and 863-s3 specified by frame numbers # 1b to # 3b are the compression frames to be inserted.
  • the insertion destination 922 indicates the insertion position of the compressed frame specified by the insertion frame number 921. Specifically, the insertion destination 922 is specified as, for example, between two frame numbers. For example, the compression frame 863-s1 with the insertion frame number # 1b is inserted between the compression frame 861-s3 and the compression frame 862-s1 specified by the two frame numbers (# 3a, # 4a) of the insertion destination 922. Is done. In FIG. 9, the insertion destination 922 is specified using the frame number, but may be specified using an address (specified by referring to stsz847 and stco848).
  • a moving image file in which the frame 711 is compressed and a moving image file in which the second frame 713 is compressed may be generated separately.
  • related information that associates one moving image file 800 with the other moving image file 800 is stored in the header portion 801 of both moving image files 800.
  • the related information is stored, for example, in uuid 812, 831 or mvhd 833 of the header part 801.
  • the additional information 835 may be stored in another box (831 to 834) as long as it is stored in the moov 813.
  • FIG. 10 is an explanatory diagram showing a synthesis processing example 1 in the synthesis unit 703 shown in FIG.
  • the electronic device 500 captures a traveling train as a specific subject during fixed-point imaging of a landscape including rice fields, mountains, and the sky.
  • the train that is the specific subject is identified by the known subject detection technique described above.
  • the captured frames F are assumed to be frames F1, F2-60, F3, F4-60, and F5 in chronological order. Here, it is assumed that the train travels from right to left in the frames F1, F2-60, F3, F4-60, and F5.
  • frames F1, F3, and F5 the image data of the first image area a1 output by imaging at the first frame rate of 30 [fps] in the first imaging area and the second of 60 [fps] in the second imaging area are output.
  • a first frame 711 including image data of the second image area a2 output by imaging at the frame rate.
  • the frames F2-60 and F4-60 include the image data of the second image area a2 output by the second imaging area having the second imaging rate of 60 [fps], and are supplemented with a black background.
  • the second frame 713 The second frame 713.
  • Frames F1, F3, and F5 a landscape including rice fields, mountains, and sky is captured in the first image area a1, and a train that is traveling as a specific subject is captured in the second image area a2.
  • This is the first frame 711.
  • Frames F2-60 and F4-60 are frames in which the train is imaged in the second image area a2.
  • the image data of the second image area a2 in which the train is imaged is output by imaging in the second imaging area (60 [fps]). It is data.
  • the image data of the first image area a1 in which the landscape is imaged is image data output by imaging of the first imaging area (30 [fps]). Since the first image area a1 is output by imaging at the first frame rate (30 [fps]), the frames F2-60 and F4-60 output by imaging at the second frame rate (60 [fps]) are output.
  • the complement region 712y is filled with a specific color (black).
  • Frames F1, F2-60, F3, F4-60, F5 Correspond to the first moving image data 721 and the second moving image data 722 described above. Since the second moving image data 722 includes the second frame 713 in which the complement region 712y is black, the combining unit 703 combines the first moving image data 721 and the second moving image data 722.
  • the combining unit 703 adds the image data of the frame F2-60 to the image data (scenery excluding the train) of the first image area a1 of the frame F1 that is temporally previous to the frame F2-60.
  • the image data (train) in the second image area a2 is duplicated.
  • the synthesizing unit 703 generates a frame F2, which is the third frame 730.
  • the synthesizing unit 703 adds the frame F4-60 to the image data (the scenery excluding the train) of the first image area a1 of the frame F3 that is temporally previous to the frame F4-60.
  • the image data (train) of the second image area a2 is duplicated. Accordingly, the synthesis unit 703 generates a frame F4 that is the third frame 730. Then, the synthesizing unit 703 outputs the fourth moving image data 740 including the frames F1 to F5.
  • the first image area a1 of the frames F1 and F3 having the first frame rate immediately before in the complementary area 712y of the frames F2-60 and F4-60 the first image For the region a1
  • the difference between the frames F1 and F2 can be made substantially zero
  • the difference between the frames F3 and F4 can be made almost zero.
  • the fourth moving image data 740 that is a frame sequence in which the first frame 711 and the third frame 730 are mixed.
  • the first moving image data 721 and the second moving image data 722 can be expanded by the conventional compression / decompression unit 702, respectively, and the processing load of the expansion processing can be reduced.
  • the compression / decompression unit 702 when reproducing at 30 [fps], only decompresses the first moving image data 721 and does not require synthesis by the synthesizing unit 703, so that the efficiency of the reproduction process can be improved. .
  • the image data (scenery excluding the train) of the first image area a1 of the frame F1 is duplicated. Therefore, the portion (the end of the train) that originally was the second image area a2 of the frame F1 is not copied to the frame F2. For this reason, the frame F2 has a complementary image portion Da1 in which nothing is output.
  • the frame F4 has a complementary image portion Da3 to which nothing is output.
  • Example 1 for the complementary image portions Da1 and Da3, the synthesis unit 703 may keep the filled specific color or may perform interpolation processing using surrounding pixels. As a result, it is possible to reproduce the frames F2, F4,.
  • FIG. 11 is an explanatory diagram showing a synthesis processing example 2 in the synthesis unit 703 shown in FIG.
  • the electronic device 500 is, for example, a drive recorder, and takes a picture of a car traveling ahead (a preceding car) and a landscape.
  • the preceding vehicle is a specific subject to be tracked, and the landscape changes due to self-running.
  • Frames F generated by photographing are frames F6, F7-60, F8, F9-60, and F10 in time series order.
  • frames F6, F8, and F10 the image data of the first image area a1 output by imaging at the first frame rate of 30 [fps] for the first imaging area and the second of 60 [fps] for the second imaging area are output.
  • This is a first frame 711 including image data 712 of the second image region a2 output by imaging at the frame rate.
  • Frames F7-60 and F9-60 are the image data 712 of the second image area a2 output by the second imaging area at the second frame rate of 60 [fps].
  • the frames F6, F8, and F10 are the first frame 711 in which the preceding vehicle is imaged in the first image area a1 and the landscape changing to the second image area a2 is imaged.
  • Frames F7-60 and F9-60 are frames in which a landscape is captured in the second image area a2.
  • the image data of the second image area a2 in which the landscape is imaged is output by imaging in the second imaging area (60 [fps]). There is data. Further, in frames F6, F8, and F10, the image data of the first image area a1 in which the preceding vehicle has been imaged is the moving image data output by the imaging of the first imaging area (30 [fps]). Since the first imaging area is output by imaging at the first frame rate (30 [fps]), the first of the frames F7-60 and F9-60 output by imaging at the second frame rate (60 [fps]). One image area a1 is blackened by the first generation unit 701 during compression.
  • the synthesizer 703 adds the image data of the second image area a2 of the frame F7-60 to the image data of the first image area a1 of the frame F6 one temporally before the frame F7-60 (the preceding vehicle excluding the scenery). Duplicate image data (landscape). Accordingly, the synthesis unit 703 generates a frame F7 that is the third frame 730.
  • the synthesizing unit 703 also adds the image data of the frame F9-60 to the image data (the preceding vehicle excluding the scenery) of the first image area a1 of the frame F8 that is one time earlier than the frame F9-60.
  • the image data (landscape) in the second image area a2 is duplicated. Accordingly, the synthesis unit 703 generates a frame F9 that is the third frame 730. Then, the synthesizing unit 703 outputs the fourth moving image data 740 including the frames F6 to F10.
  • the difference between the frames F6 and F7 can be set to 0, and the difference between the frames F8 and F9 can be set to 0.
  • the fourth moving image data 740 that is a frame sequence in which the first frame 711 and the image data 712 are mixed.
  • the first moving image data 721 and the second moving image data 722 can be expanded by the conventional compression / decompression unit 702, respectively, and the processing load of the expansion processing can be reduced.
  • the compression / decompression unit 702 when reproducing at 30 [fps], only decompresses the first moving image data 721 and does not require synthesis by the synthesizing unit 703, so that the efficiency of the reproduction process can be improved. .
  • Control Unit 502 is a block diagram illustrating a configuration example of the control unit 502 illustrated in FIG.
  • the control unit 502 includes a preprocessing unit 1210, a first generation unit 701, an acquisition unit 1220, a compression / decompression unit 702, a specifying unit 1240, a synthesis unit 703, and a playback unit 704.
  • the control unit 502 includes a processor 1201, a storage device 1202, an integrated circuit 1203, and a bus 1204 that connects them. Note that the storage device 1202, the decompressing unit 1234, the specifying unit 1240, the combining unit 703, and the reproducing unit 704 may be mounted on other devices accessible to the electronic device 500.
  • the preprocessing unit 1210, the first generation unit 701, the acquisition unit 1220, the compression / decompression unit 702, the identification unit 1240, the synthesis unit 703, and the playback unit 704 cause the processor 1201 to execute a program stored in the storage device 1202. It may be realized by an integrated circuit 1203 such as ASIC (Application Specific Integrated Circuit) or FPGA (Field-Programmable Gate Array). Further, the processor 1201 may use the storage device 1202 as a work area. Further, the integrated circuit 1203 may use the storage device 1202 as a buffer that temporarily holds various data including image data.
  • ASIC Application Specific Integrated Circuit
  • FPGA Field-Programmable Gate Array
  • a device including at least the compression unit 1231 in the compression / expansion unit 702 is a moving image compression device.
  • An apparatus including at least the second generation unit 1232 in the compression / decompression unit 702 is a generation apparatus.
  • An apparatus including at least the expansion unit 1234 in the compression / expansion unit 702 is an expansion device.
  • a device including at least the playback unit 704 is a playback device.
  • the pre-processing unit 1210 performs pre-processing for generating the moving image file 800 for the input moving image data 710 from the image sensor 100.
  • the preprocessing unit 1210 includes a detection unit 1211 and a setting unit 1212.
  • the detection unit 1211 detects a specific subject by the known subject detection technique described above.
  • the setting unit 1212 changes the imaging area where the specific subject is detected on the imaging surface 200 of the imaging device 100 from the first frame rate (for example, 30 [fps]) to the second frame rate (for example, 60 [fps]). change.
  • the setting unit 1212 detects the motion vector of the specific subject from the difference between the imaging region where the specific subject in the input frame is detected and the imaging region where the specific subject in the input frame is detected.
  • the imaging area of the specific subject in the next input frame is predicted.
  • the setting unit 1212 changes the predicted imaging area to the second frame rate.
  • the setting unit 1212 gives information indicating the image area of the first frame rate (for example, 30 [fps]) and the image area of the second frame rate (for example, 60 [fps]) to the frame F.
  • the first generation unit 701 complements a missing area 712x that is not output by imaging at the second frame rate with a specific color for the image data 712 that is an image area at the second frame rate in which the specific subject is imaged, and complements it.
  • Region 712y is set. Specifically, for example, in frames F2-60 and F4-60 in FIG. 10, there is an image area (corresponding to the background) other than the second image area a2 that is a specific subject image output by imaging at 60 [fps]. This is a complementary region 712y.
  • the image area (corresponding to the preceding vehicle) other than the second image area a2 which is a changing landscape imaged at 60 [fps] is the complementary area 712y.
  • the first generation unit 701 sets the missing area 712x to a specific color and eliminates the missing area 712x.
  • the image data of the complementary region 712y that is a specific color is data that is not based on the output from the second imaging region, and is configured as predetermined data that is unrelated to the output data from the second imaging region.
  • the acquisition unit 1220 acquires the input moving image data 710 or the first moving image data 721 and the second moving image data 722 output from the preprocessing unit 1210, holds them in the storage device 1202, and stores a plurality of frames at a predetermined timing. Are output to the compression / decompression unit 702 frame by frame in chronological order. Specifically, for example, the acquisition unit 1220 acquires the input moving image data 710 from the preprocessing unit when the specific subject is not detected, and the first moving image data 721 and the second moving image data 721 when the specific subject is detected. Movie data 722 is acquired.
  • the compression / decompression unit 702 includes a compression unit 1231, a second generation unit 1232, a selection unit 1233, an expansion unit 1234, and a storage unit 1235.
  • the compression unit 1231 compresses the moving image data from the acquisition unit 1220. Specifically, for example, when the compression unit 1231 acquires moving image data in which a specific subject is not detected, each frame is the first image region a1, and therefore, compression processing that does not require motion detection or motion compensation is performed. Execute.
  • the compression unit 1231 compresses the first moving image data 721 and the second moving image data 722, respectively. Specifically, for example, in the case of the first moving image data 721, the compression unit 1231 performs a compression process that does not require motion detection or motion compensation on the image data of the first image area a1, and the specific subject is imaged.
  • the image data of the second image area a2 is compressed by the above-described hybrid encoding. As described above, since motion detection and motion compensation are not executed for regions other than the specific subject image, the processing load of moving image compression is reduced.
  • the compression unit 1231 performs compression processing that does not require motion detection or motion compensation on the image data in the complement region 712y (black), and the first subject in which the specific subject is imaged.
  • the image data in the two-image area a2 is compressed by the hybrid encoding described above.
  • the processing load of moving image compression is reduced.
  • the second frame 713 can be applied with a normal moving image compression process in the same manner as the first frame 711.
  • the second frame 713 obtained at the second frame rate has the same size as the first frame 711 obtained at the first frame rate (30 [fps]). Accordingly, the second frame 713 is applied with the same compression processing as the compression processing of the first frame 711, so there is no need to apply another compression processing that matches the size of the image data 712. That is, the compression unit 1231 can apply the compression process applied in the first frame 711 to the second frame 713 as it is. For this reason, it is not necessary to implement another compression process for the image data 712.
  • the second generation unit 1232 generates a moving image file 800 including the moving image data (compressed data) compressed by the compression unit 1231. Specifically, for example, the second generation unit 1232 generates the moving image file 800 according to the file format as shown in FIG.
  • the storage unit 1235 stores the generated moving image file 800 in the storage device 1202.
  • the compression unit 1231 may store the compressed data in a buffer memory, for example, and the second generation unit 1232 may read the compressed data stored in the buffer memory and generate the moving image file 800.
  • the selection unit 1233 receives an instruction to reproduce the moving image file 800 from the operation unit 505, reads out the moving image file 800 to be decompressed from the storage device 1202, and passes it to the decompressing unit 1234.
  • the decompression unit 1234 decompresses the moving image file 800 passed from the selection unit 1233 according to the file format.
  • the decompression unit 1234 executes general-purpose decompression processing. Specifically, for example, the decompression unit 1234 performs variable-length decoding processing, inverse quantization, and inverse transform on the input compressed frame, applies intra-frame prediction or inter-frame prediction, and converts the compressed frame to the original Stretch to frame.
  • the moving image file 800 includes a moving image file 800 in which moving image data in which a specific subject is not detected is compressed, and a moving image file 800 in which the first moving image data 721 and the second moving image data 722 are compressed.
  • the former moving image file 800 is moving image data that is output at a frame rate of 30 [fps] and is, for example, fixed-point imaged only for a landscape where a train is not passing. Therefore, when the selection unit 1233 accepts selection of a reproduction instruction for the moving image file 800, the expanding unit 1234 expands the moving image file 800 according to the file format.
  • the moving image file 800 obtained by compressing the first moving image data 721 and the second moving image data 722 includes the compressed moving image data of the first moving image data 721 and the second moving image data 722. Therefore, when the selection unit 1233 receives selection of a playback instruction for the video file 800 obtained by compressing the first video data 721 and the second video data 722, the frame rate (for example, 30) selected by the playback instruction is received. [Fps], 60 [fps]).
  • the selection unit 1233 passes the chunk group existing between the SOM 850a to EOM 854a in the mdat 820 of the moving image file 800 to the decompression unit 1234 as the compressed data of the first moving image data 721. . Thereby, the decompression unit 1234 can decompress the compressed data of the first moving image data 721 into the first moving image data 721.
  • the selection unit 1233 passes the chunk group existing between the SOM 850a to the EOM 854a in the mdat 820 of the moving image file 800 to the decompression unit 1234 as the compressed data of the first moving image data 721.
  • the chunk group existing between SOM 850b to EOM 854b in the mdat 820 of the moving image file 800 is transferred to the decompression unit 1234 as the compressed data of the second moving image data 722.
  • the decompressing unit 1234 can decompress the compressed data of the first moving image data 721 to the first moving image data 721 and can decompress the compressed data of the second moving image data 722 to the second moving image data 722.
  • the decompression unit 1234 decompresses the compressed data of the first moving image data 721 and the compressed data of the second moving image data 722 in order (which may be reversed).
  • the compressed data of the first moving image data 721 and the compressed data of the second moving image data 722 may be expanded in parallel.
  • the specifying unit 1240 includes the first frame 711 (for example, the frame F1 in FIG. 10) in the first moving image data 721, and the second Based on the second frame 713 in the moving image data 722 (for example, the frame F2-60 in FIG. 10), the difference area is specified.
  • the difference area is an area indicating a difference between the second image area a2 corresponding to the second imaging area in the first frame 711 and the second image area a2 corresponding to the second imaging area in the second frame 713.
  • a difference area between the frame F1 and the frame F2-60 is a white dotted line rectangular area Da1 behind the train in the frame F2-60.
  • a difference area between the frame F3 and the frame F4-60 is a white dotted line rectangular area Da3 behind the train in the frame F4-60.
  • the combining unit 703 includes the image data of the first image area a1 immediately before in the second frame 713 (for example, the frame F2-60 in FIG. 10).
  • the first frame 711 (for example, the frame F1 in FIG. 10) is duplicated and combined to generate the third frame 730 (for example, the frame F2 in FIG. 10).
  • the combining unit 703 adds the image data (the end portion of the train) of the second image region a2 at the same position as the difference region in the first frame 711 to the difference region (Da1, Da3) specified by the specifying unit 1240. You may duplicate.
  • the difference between the first frame 711 and the third frame 730 that are temporally continuous can be made substantially zero. Accordingly, it is possible to reproduce a moving image that does not feel uncomfortable.
  • the insertion position of the frame F2-60 in the first moving image data 721 is specified by the insertion position information 920 of the additional information 835. For example, if the frame numbers of the frames F1 and F3 are # 4a and # 5a and the frame number of the frame F2-60 is # 2b, the insertion position 922 of the value # 2b of the insertion frame number 921 is (# 4a and # 5a). It becomes. Therefore, the insertion position of the frame F2-60 is specified between the frames F1 and F3.
  • FIG. 13 is a block diagram illustrating a configuration example of the compression unit 1231.
  • the compression unit 1231 compresses each frame F from the acquisition unit 1220 by hybrid coding in which motion compensated interframe prediction (MC) and discrete cosine transform (DCT) are combined with entropy coding. .
  • MC motion compensated interframe prediction
  • DCT discrete cosine transform
  • the compression unit 1231 includes a subtraction unit 1301, a DCT unit 1302, a quantization unit 1303, an entropy coding unit 1304, a code amount control unit 1305, an inverse quantization unit 1306, an inverse DCT unit 1307, and a generation unit. 1308, a frame memory 1309, a motion detection unit 1310, a motion compensation unit 1311, and a compression control unit 1312.
  • the subtraction unit 1301 to the motion compensation unit 1311 have the same configuration as that of the existing compressor.
  • the subtraction unit 1301 subtracts the prediction frame from the motion compensation unit 1311 that predicts the input frame from the input frame and outputs difference data.
  • the DCT unit 1302 performs a discrete cosine transform on the difference data from the subtraction unit 1301.
  • the quantization unit 1303 quantizes the differential data subjected to discrete cosine transform.
  • the entropy encoding unit 1304 entropy encodes the quantized difference data, and also entropy encodes the motion vector from the motion detection unit 1310.
  • the code amount control unit 1305 controls the quantization performed by the quantization unit 1303.
  • the inverse quantization unit 1306 inversely quantizes the difference data quantized by the quantization unit 1303 to obtain discrete cosine transformed difference data.
  • the inverse DCT unit 1307 performs inverse discrete cosine transform on the inversely quantized difference data.
  • the generation unit 1308 adds the difference data that has been subjected to inverse discrete cosine transform and the prediction frame from the motion compensation unit 1311 to generate a reference frame that is referenced by a frame that is input temporally after the input frame. .
  • the frame memory 1309 holds the reference frame obtained from the generation unit 1308.
  • the motion detection unit 1310 detects a motion vector using the input frame and the reference frame.
  • the motion compensation unit 1311 generates a prediction frame using the reference frame and the motion vector.
  • the motion compensation unit 1311 uses, for example, a specific reference frame and a motion vector among a plurality of reference frames held in the frame memory 1309 to output a frame output by imaging at the second frame rate. Perform motion compensation.
  • a specific reference frame By setting the reference frame as a specific reference frame, it is possible to suppress high-load motion compensation using a reference frame other than the specific reference frame. Also, by making a specific reference frame one reference frame obtained from a frame immediately before the input frame, high-load motion compensation can be avoided and motion compensation processing load can be reduced. Can be achieved.
  • the compression control unit 1312 controls the motion detection unit 1310 and the motion compensation unit 1311. Specifically, for example, the compression control unit 1312 uses a first compression control method for setting a specific motion vector indicating that there is no motion in the motion detection unit 1310 and a second compression control method for skipping motion detection itself. Execute.
  • the first compression control method will be described.
  • the compression control unit 1312 controls the motion detection unit 1310, and the first image area a1 output by imaging at the first frame rate (for example, 30 [fps]) Instead of detecting a vector, a specific motion vector indicating no motion is set and output to the motion compensation unit 1311.
  • the compression control unit 1312 controls the motion detection unit 1310 to detect a motion vector for the second image area a2 output by imaging at the second frame rate (for example, 60 [fps]), The result is output to the motion compensation unit 1311.
  • the specific motion vector is a motion vector whose direction is not defined and whose motion amount is zero. As described above, the motion vector is not detected for the first image area a1 output by imaging at the first frame rate (for example, 30 [fps]).
  • the compression control unit 1312 controls the motion compensation unit 1311 to perform motion compensation on the image data of the first image region a1 based on the specific motion vector and the reference frame.
  • the compression control unit 1312 performs motion compensation on the image data of the second image region a2 based on the motion vector detected by the motion detection unit 1310.
  • the first image area a1 output by imaging at the first frame rate (for example, 30 [fps]) may be replaced with an area filled with a specific color.
  • the compression control unit 1312 controls the motion detection unit 1310, and does not execute motion vector detection for the image data in the complementary region 712y.
  • the compression control unit 1312 controls the motion detection unit 1310 to detect a motion vector for the second image region a2 output by imaging at the second frame rate (for example, 60 [fps]). .
  • the compression control unit 1312 controls the motion compensation unit 1311 to perform motion compensation on the image data of the first image region a1 based on the reference frame. That is, since there is no motion vector, the compression control unit 1312 controls the motion compensation unit 1311 to predict a reference frame and a frame immediately after the input frame for the image data in the complementary region 712y. Decide on a prediction frame.
  • the compression control unit 1312 controls the motion compensation unit 1311 to perform motion compensation for the image data of the second image region a2 based on the reference frame and the motion vector detected by the motion detection unit 1310.
  • the first image area a1 output by imaging at the first frame rate (for example, 30 [fps]) may be replaced with the complementary area 712y.
  • the motion vector is a specific motion vector
  • motion detection in the first image region a1 and the complement region 712y is simplified. Therefore, the processing load of moving image compression is reduced.
  • the second compression control method since motion detection itself is not executed for the first image region a1 and the complement region 712y, the processing load of moving image compression is reduced compared to the first compression control method.
  • FIG. 14 is a sequence diagram illustrating an example of an operation processing procedure of the control unit 502.
  • the acquisition unit 1220 is omitted for convenience of explanation.
  • the pre-processing unit 1210 automatically operates, for example, when the user operates the operation unit 505 or when the specific subject is not detected in step S1412 (step S1412: Yes), over the entire imaging surface 200 of the image sensor 100.
  • the imaging condition is set to a first frame rate (for example, 30 [fps]) (step S1401).
  • the imaging condition of the entire imaging surface 200 is set to the first frame rate (step S1402), and the imaging device 100 captures the subject at the first frame rate and displays the input moving image data 710 in front.
  • the data is output to the processing unit 1210 (step S1403).
  • the preprocessing unit 1210 executes a setting process (step S1404).
  • the setting process sets a frame rate for each frame of the input moving image data 710. For example, an image area to which a first frame rate (for example, 30 [fps]) is added is recognized as a first image area a1, and an image area to which a second frame rate (for example, 60 [fps]) is added is Are recognized as the second image area a2.
  • the preprocessing unit 1210 outputs the input moving image data 710 to the first generation unit 701 (step S1405). Also, the pre-processing unit 1210 receives the input moving image data 710 in step S1403 when the setting process (step S1404) does not detect the image area at the second frame rate of the next input frame (step S1406: No). I wait. On the other hand, when the image area having the second frame rate of the next input frame is detected in the setting process (step S1404) (step S1406: Yes), the preprocessing unit 1210 sets the second image area a2 including the specific subject to the second. The setting is changed to 2 frame rate (for example, 60 [fps]) (step S1407).
  • 2 frame rate for example, 60 [fps]
  • the imaging condition of the second imaging area in the entire imaging surface 200 is set to the second frame rate according to the setting change content in step S1407 (step S1408).
  • the image sensor 100 captures the subject at the first frame rate in the first image area and the second frame rate in the second image area, and the input moving image data 710 is pre-processed. It outputs to 1210 (step S1409).
  • step S1410 When the input moving image data 710 is input (step S1409), the preprocessing unit 1210 executes a setting process (step S1410).
  • the setting process (step S1410) is the same process as the setting process (step S1404). Details of the setting process (step S1410) will be described later with reference to FIG.
  • the preprocessing unit 1210 outputs the input moving image data 710 to the first generation unit 701 (step S1411).
  • step S1412: Yes the preprocessing unit 1210 returns to step S1401, and changes the setting of the entire imaging surface 200 to the first frame rate (step S1401).
  • step S1412: No the process returns to step S1407, and the second image area a2 corresponding to the detection position of the specific subject is changed to the second frame rate (step S1407).
  • the pre-processing unit 1210 changes the setting to the first frame rate for the image area in which the specific subject is no longer detected.
  • the first generation unit 701 executes a complementing process (step S1413).
  • the first generation unit 701 specifies that each frame of the input moving image data 710 is only the first frame 711 with reference to the frame rate of each frame.
  • the image data 712 does not exist because the specific subject is not imaged. Therefore, the first generation unit 701 does not complement the image data 712. Details of the complement process (step S1413) will be described later with reference to FIG.
  • the first generation unit 701 outputs the input moving image data 710 to the compression unit 1231 (step S1414).
  • the first generation unit 701 executes a complementing process (step S1415).
  • the first generation unit 701 refers to the frame rate of each frame and determines that each frame of the input moving image data 710 includes the first frame 711 and the image data 712.
  • the first generation unit 701 since the specific subject is captured in the first frame 711 and the image data 712, the first generation unit 701 generates the second frame 713. Details of the complement process (step S1415) will be described later with reference to FIG.
  • the first generation unit 701 outputs the first frame 711 and the second frame 713 to the compression unit 1231 (step S1416).
  • Step S1414 When the input moving image data 710 is input (Step S1414), the compression unit 1231 and the second generation unit 1232 execute a moving image file generation process for the input moving image data 710 (Step S1417). Since the input moving image data 710 includes only the first frame 711, the compression unit 1231 performs compression encoding that does not require motion detection or motion compensation in the compression processing (step S1417). Details of the moving image file generation process (step S1417) will be described later with reference to FIGS.
  • the moving image file generation process of the first moving image data 721 and the second moving image data 722 is performed. Is executed (step S1418).
  • the first moving image data 721 includes a first frame 711
  • the second moving image data 722 includes a second frame 713.
  • the compression unit 1231 performs a compression process that does not require motion detection or motion compensation on the image data in the first image area a1. Then, the image data of the second image area a2 in which the specific subject is imaged is compressed by the hybrid encoding described above. As described above, since motion detection and motion compensation are not executed for regions other than the specific subject image, the processing load of moving image compression is reduced.
  • the compression unit 1231 performs compression processing that does not require motion detection or motion compensation on the image data in the complementary region 712y (black), and the specific subject is
  • the captured image data of the second image area a2 is compressed by the hybrid encoding described above.
  • the processing load of moving image compression is reduced. Details of the moving image file generation process (step S1418) will be described later with reference to FIGS.
  • FIG. 15 is a flowchart showing a detailed processing procedure example of the setting processing (steps S1404 and S1410) shown in FIG.
  • a first frame rate for example, 30 [fps]
  • the second frame rate for example, 60 [[fps]
  • the preprocessing unit 1210 waits for an input of a frame constituting the input moving image data 710 (step S1501). If a frame is input (step S1501: Yes), whether a specific subject such as a main subject is detected by the detection unit 1211 It is determined whether or not (step S1502). When the specific subject has not been detected (step S1502: No), the process proceeds to step S1504.
  • step S1502 when a specific subject is detected (step S1502: Yes), the preprocessing unit 1210 moves the detection unit 1211 by comparing a temporally previous frame (for example, a reference frame) with an input frame. The vector is detected, the image area of the second frame rate in the next input frame is predicted, output to the image sensor 100, and the process proceeds to step S1504 (step S1503). Thereby, the imaging device 100 sets the imaging condition of the block 202 constituting the imaging area corresponding to the predicted image area to the second frame rate, and sets the imaging condition of the remaining block 202 to the first frame rate. The subject can be imaged.
  • a temporally previous frame for example, a reference frame
  • the preprocessing unit 1210 executes frame rate setting processing for the input frame (step S1504), and returns to step S1501.
  • the frame rate setting process (step S1505) is a process for setting the above-described frame rate to the frame F, and will be described in detail with reference to FIG.
  • step S1501: No since the input of the input moving image data 710 is completed, the preprocessing unit 1210 ends the setting process (steps S1404 and S1410).
  • FIG. 16 is a flowchart showing a detailed processing procedure example of the frame rate setting process (step S1504) shown in FIG.
  • the preprocessing unit 1210 determines whether there is an unselected image area in the input frame (step S1602). When there is an unselected image area (step S1602: Yes), the preprocessing unit 1210 selects one unselected image area (step S1603) and determines whether or not the detection flag for the specific subject is ON (step S1603).
  • the detection flag is information indicating whether or not a specific subject is detected, and the default is OFF (non-detection).
  • step S1406 When the specific subject is detected in step S1406 in FIG. 14 (step S1406: Yes), the preprocessing unit 1210 changes the detection flag from OFF to ON (during detection). When the specific subject is not detected in step S1412 (step S1412: Yes), the preprocessing unit 1210 changes the detection flag from ON to OFF.
  • step S1604 If the detection flag is OFF (step S1604: No), information indicating the first frame rate for the selected image area is set in the input frame (step S1605), and the process returns to step S1602. On the other hand, when the detection flag is ON (step S1604: Yes), the preprocessing unit 1210 determines whether the selected image area is an image area where the specific subject image exists (step S1606).
  • step S1606 If the specific subject image does not exist (step S1606: No), the process returns to step S1602. On the other hand, when the specific subject image exists (step S1606: Yes), the preprocessing unit 1210 sets information indicating the second frame rate for the selected image area in the input frame (step S1607), and returns to step S1602.
  • step S1602 when there is no unselected image area (step S1602: No), the pre-processing unit 1210 ends the frame rate setting process. Thereafter, the preprocessing unit 1210 sets the frame rate to the image sensor 100 (steps S1401 and S1407).
  • the pre-processing unit 1210 specifies which frame area the imaging area of the imaging device 100 corresponding to which image area should be set to. be able to. Further, the first generation unit 701 and the compression unit 1231 can specify the frame rate of each image area of the input frame F.
  • FIG. 17 is a flowchart illustrating an example of a complementary processing procedure by the first generation unit 701.
  • the first generation unit 701 refers to the frame rate of the input frame (step S1702).
  • the first generation unit 701 ends without executing the complement processing.
  • the input frame is the image data 712, and thus the first generation unit 701 executes the complementing process to convert the input frame to the second frame.
  • Frame 713 is set (step S1704).
  • FIG. 18 is a flowchart showing a detailed processing procedure example of the moving image file generation processing (steps S1417 and S1418) shown in FIG.
  • the compression unit 1231 separately performs compression of the first moving image data 721 including the first frame 711 and compression of the second moving image data 722 including the second frame 713.
  • the compression unit 1231 performs compression encoding on the input frame (step S1802). Detailed control contents of the compression encoding will be described later with reference to FIGS.
  • the second generation unit 1232 generates metadata such as uuid 831, udta 832, mvhd 833, and trak 834 shown in FIG. 8 from the compressed and encoded data (step S1803).
  • the second generation unit 1232 may execute step S1803 before compression encoding (step S1802) for metadata that requires information before compression.
  • the second generation unit 1232 generates the imaging condition information 910 with reference to the information indicating the frame rate given to the frame F (step S1804), refers to the chunk position information (stsz847 and stco848),
  • the insertion position information is generated by specifying the insertion destination of the frame 713 (step S1805). Additional information 835 is generated in steps S1804 and S1805.
  • the second generation unit 1232 generates the moving image file 800 by combining the header unit 801 and the data unit 802 (step S1806), and stores them in the storage device 1202 (step S1807).
  • step S1802 compression encoding (step S1802) by the compression unit 1231 shown in FIG. 18 will be described separately for the first compression control method and the second compression control method.
  • FIG. 19 is a flowchart showing an example of a compression control processing procedure of the first compression control method by the compression control unit 1312.
  • the compression control unit 1312 acquires an input frame (first frame 711 or second frame 713) (step S1901), and selects an unselected image region from the acquired input frame (step S1902). Then, the compression control unit 1312 refers to the frame rate of the selected image area from the input frame (step S1903).
  • the selected image area is the first image area a1 output by imaging at the first frame rate or the second image area a2 output by imaging at the second frame rate.
  • the selected image area is output by the complementary area 712y corresponding to the first image area a1 output by the imaging at the first frame rate or the imaging at the second frame rate. This is the second image area a2.
  • the compression control unit 1312 When the frame rate of the selected image area is the second frame rate (step S1903: second FR), the compression control unit 1312 outputs the image data of the selected image area to the motion detection unit 1310 (step S1904). Accordingly, the motion detection unit 1310 detects a motion vector using the reference frame as usual for the selected image region of the second frame rate.
  • step S1903 when the frame rate of the selected image region is the first frame rate (step S1903: first FR), the compression control unit 1312 sets a skip flag in the selected image region of the first frame rate, and the motion detecting unit 1310. (Step S1905). Accordingly, the motion detection unit 1310 sets a specific motion vector indicating that there is no motion for the selected image region at the first frame rate.
  • step S1904 or S1905 the compression control unit 1312 determines whether there is an unselected image area in the acquired input frame (step S1906). If there is an unselected image area (step S1906: YES), the process returns to step S1902. On the other hand, when there is no unselected image area (step S1906: No), the compression control unit 1312 ends a series of processes.
  • FIG. 20 is a flowchart showing an example of a motion detection processing procedure of the first compression control method by the motion detection unit 1310.
  • the motion detection unit 1310 obtains a reference frame that is one time earlier than the input frame from the frame memory 1309 (step S2001), and waits for input of the selected image area output in step S1904 or S1905 in FIG. Step S2002: No).
  • step S2002 When the selected image area is input (step S2002: Yes), the motion detection unit 1310 acquires image data of the image area at the same location as the selected image area from the reference frame (step S2003). Then, the motion detection unit 1310 determines whether or not there is a skip flag in the selected image area (step S2004). When there is no skip flag (step S2004: No), the frame rate of the selected image area is the second frame rate. Therefore, the motion detection unit 1310 detects a motion vector using the image data of the selected image region and the image data of the image region of the reference frame acquired in step S2003 (step S2005).
  • step S2004 when there is a skip flag (step S2004: Yes), the motion detection unit 1310 sets a specific motion vector indicating that there is no motion (step S2006). Thereby, since the motion detection processing in the motion detection unit 1310 always uses a specific motion vector indicating that there is no motion, the processing load of motion detection is reduced for the selected image region of the first frame rate. Then, the motion detection unit 1310 outputs the motion vector obtained in step S2005 or S2006 to the motion compensation unit 1311 (step S2007), and ends the series of processes.
  • FIG. 21 is a flowchart showing an example of a motion compensation processing procedure of the first compression control method by the motion compensation unit 1311.
  • the motion compensation unit 1311 acquires a reference frame from the frame memory 1309 (step S2101).
  • the motion compensation unit 1311 acquires an image area at the same location as the selected image area from the reference frame (step S2102).
  • the motion compensation unit 1311 performs motion compensation using the motion vector for the selected image region from the motion detection unit 1310 and the image region of the reference frame acquired in step S2102 (step S2103). Accordingly, the motion compensation unit 1311 can generate predicted image data in the selected image region.
  • the motion compensation unit 1311 determines whether or not motion compensation has been completed for all the selected image regions (step S2104). Specifically, for example, when the compression control unit 1312 determines that there is an unselected image region in step S1906 (step S1906: Yes), the motion compensation unit 1311 has finished motion compensation for all the selected image regions. It is determined that there is not (Step S2104: No), and the process returns to Step S2102.
  • step S1906 determines that there is no unselected image region in step S1906 (step S1906: No).
  • the motion compensation unit 1311 determines that the motion compensation of all the selected image regions has been completed (step S2104). : Yes). Then, the motion compensation unit 1311 outputs a prediction frame obtained by combining the prediction image data for all the selected image regions to the subtraction unit 1301 and the generation unit 1308 (step S2105), and ends a series of processes.
  • FIG. 22 is a flowchart illustrating an example of a compression control processing procedure of the second compression control method by the compression control unit 1312.
  • the compression control unit 1312 acquires an input frame (step S2201), and selects an unselected image area from the acquired input frame (step S2202). Then, the compression control unit 1312 refers to the frame rate of the selected image area from the input frame (step S2203).
  • step S2203 When the frame rate of the selected image area is the second frame rate (step S2203: second FR), the compression controller 1312 outputs the selected image area to the motion detector 1310 (step S2204). Accordingly, the motion detection unit 1310 detects a motion vector using the reference frame as usual for the selected image region of the second frame rate.
  • step S2203 when the frame rate of the selected image region is the first frame rate (step S2203: first FR), the compression control unit 1312 sets a skip flag in the selected image region of the first frame rate, and the motion detection unit 1310 (Step S2205). As a result, the motion detection unit 1310 does not perform motion detection for the selected image region at the first frame rate. Then, the compression control unit 1312 issues a motion compensation stop instruction for the selected image region, and outputs it to the motion compensation unit 1311 (step S2206). Thereby, execution of motion compensation can be stopped for the selected image area.
  • step S2207 determines whether there is an unselected image area in the acquired input frame. If there is an unselected image area (step S2207: YES), the process returns to step S2202. On the other hand, when there is no unselected image area (step S2207: No), the compression control unit 1312 ends a series of processes.
  • FIG. 23 is a flowchart showing an example of a motion detection processing procedure of the second compression control method by the motion detection unit 1310.
  • the motion detection unit 1310 acquires a reference frame that is one time earlier than the input frame F from the frame memory 1309 (step S2301), and waits for input of the selected image area output in step S2204 or S2205 of FIG. (Step S2302: No).
  • step S2302 When the selected image area is input (step S2302: YES), the motion detection unit 1310 acquires the image data of the image area at the same location as the selected image area from the reference frame (step S2303). Then, the motion detection unit 1310 determines whether or not there is a skip flag in the selected image area (step S2304). When there is no skip flag (step S2304: No), the frame rate of the selected image area is the second frame rate. Therefore, the motion detection unit 1310 detects a motion vector using the image data of the selected image region and the image data of the image region of the reference frame acquired in step S2003 (step S2305).
  • the motion detection unit 1310 outputs the motion vector obtained in step S2305 to the motion compensation unit 1311 (step S2306), and ends a series of processing.
  • the motion detection unit 1310 ends the series of processes without performing motion detection.
  • FIG. 24 is a flowchart showing an example of a motion compensation processing procedure of the second compression control method by the motion compensation unit 1311.
  • the motion compensation unit 1311 acquires a reference frame from the frame memory 1309 (step S2401).
  • the motion compensation unit 1311 acquires an image area at the same location as the selected image area from the reference frame (step S2402).
  • the motion compensation unit 1311 determines whether the motion compensation trigger input for the selected image region is a motion vector or a motion compensation stop instruction (step S2403).
  • the trigger input is a motion vector (step S2403: motion vector)
  • the motion compensation unit 1311 calculates the motion vector for the selected image region from the motion detection unit 1310 and the image region of the reference frame acquired in step S2402. And motion compensation is executed (step S2404). Accordingly, the motion compensation unit 1311 can generate predicted image data in the selected image region.
  • step S2403 motion compensation stop instruction
  • the motion compensation unit 1311 determines the image data of the acquired image area as image data (predicted image data) of the predicted image area ( Step S2405).
  • step S2404 or S2405 the motion compensation unit 1311 determines whether or not motion compensation has been completed for all selected image regions (step S2406). Specifically, for example, when the compression control unit 1312 determines in step S2207 that there is an unselected image region (step S2007: Yes), the motion compensation unit 1311 has finished motion compensation for all the selected image regions. It is determined that there is not (step S2406: No), and the process returns to step S2402.
  • step S2207 determines that there is no unselected image region in step S2207 (step S2207: No).
  • the motion compensation unit 1311 determines that the motion compensation of all the selected image regions has been completed (step S2406). : Yes). Then, the motion compensation unit 1311 outputs the prediction frame obtained by combining the prediction image data for all the selected image regions to the subtraction unit 1301 and the generation unit 1308 (Step S2407), and ends the series of processes.
  • FIG. 25 is a flowchart illustrating an example of a processing procedure from decompression to reproduction.
  • the selection unit 1233 waits for selection of a reproduction instruction from the operation unit 505 (step S2501: No), and when the reproduction instruction is selected (step S2501: Yes), the selection unit 1233 selects the reproduction target moving image file 800. It is determined whether or not the frame rate can be selected (step S2502). When the selection is not possible (step S2502: No), the moving image file 800 is a moving image file 800 obtained by compressing a frame group of only the first frame rate (30 [fps]). In this case, the decompressing unit 1234 decompresses the moving image file 800 (step S2504), and proceeds to step S2508.
  • step S2502 determines whether or not the selected frame rate is the first frame rate (30 [fps]) (step S2503).
  • the first frame rate (30 [fps]) is selected (step S2503: Yes)
  • the moving image file 800 to be reproduced is a moving image file 800 obtained by compressing the first moving image data 721. Therefore, the decompressing unit 1234 decompresses the moving image file 800 (step S2504), and proceeds to step S2508.
  • the moving image file 800 to be reproduced is a moving image file 800 obtained by compressing the first moving image data 721 and the second moving image data 722. It is. Therefore, the decompressing unit 1234 decompresses the moving image file 800 and outputs the first moving image data 721 and the second moving image data 722 (step S2505).
  • the specifying unit 1240 specifies the difference area with reference to the first moving image data 721 and the second moving image data 722 expanded in step S2505 (step S2506).
  • the synthesizing unit 703 executes a synthesizing process of the first moving image data 721 and the second moving image data 722 (step S2507). Details of the synthesis process (step S2507) will be described later with reference to FIG.
  • the reproduction unit 704 reproduces the moving image data obtained in the synthesis process (step S2507) or step S2504 on the liquid crystal monitor (step S2508).
  • FIG. 26 is a flowchart illustrating a detailed processing procedure example of the synthesizing process (step S2507) illustrated in FIG.
  • the combining unit 703 sets the output order of the frame F according to the insertion position information 920 (step S2601).
  • the synthesis unit 703 determines whether there is a remaining frame that has not been output to the playback unit 704 (step S2602).
  • the synthesis unit 703 acquires frames in the output order (step S2603).
  • the synthesizing unit 703 refers to, for example, the frame type identification information written in the uuid 831, and determines whether or not the acquired frame is the second frame 713 (step S2604). If it is not the second frame 713 (step S2604: No), since the acquired frame is the first frame 711, the synthesizing unit 703 outputs the acquired frame to the reproduction unit 704 as a reproduction target and writes it in the buffer (step S2605). Then, the process returns to step S2602.
  • step S2604 if the acquired frame is the second frame 713 in step S2604 (step S2604: Yes), the combining unit 703 combines the frame in the buffer and the acquired frame to generate a third frame 730, The reproduction target is output to the reproduction unit 704 (step S2606). Then, the process returns to step S2602. In step S2602, if there is no remaining frame (step S2602: No), the synthesis unit 703 ends the synthesis process (step S2507).
  • the synthesis unit 703 uses the second frame 713 and the first frame 711 that is temporally previous to use the first image region a1 and the second image region a1. It can be combined with the third frame 730 including the image area a2. Therefore, the difference in frame rate within one frame can be absorbed.
  • the moving image compression apparatus generates a plurality of first frames based on the data output from the first imaging area, and the plurality of first frames based on the data output from the second imaging area. Two frames are generated, the plurality of first frames 711 are compressed, and the plurality of second frames 713 are compressed. Accordingly, when compressing moving image data having a different frame rate for each image region, the moving image data can be compressed separately.
  • the moving picture compression apparatus performs the first frame 711 based on the data output from the first imaging area and the data output from the second imaging area. Is generated. Thereby, a frame without a defect can be generated by outputs from a plurality of imaging regions.
  • the moving image compression apparatus performs the second frame based on the data output from the second imaging region and the data not based on the output from the imaging device 100. 713 is generated. Thereby, the data that is not based on the output from the image sensor 100 is not data from the first imaging area but data obtained by image processing for the missing area 712x, for example. Therefore, the second frame 713 can be compressed in the same manner as the first frame 711.
  • the moving image compression apparatus generates the second frame 713 based on the data output from the second imaging area and the predetermined data.
  • the predetermined data is, for example, data obtained by image processing for the missing area 712x. Therefore, the second frame 713 can be compressed in the same manner as the first frame 711.
  • the moving image compression apparatus performs an area in which no data is output from the first imaging area (missing area 712x) with respect to the data output from the second imaging area. To generate the second frame 713. As a result, the second frame 713 can be compressed in the same manner as the first frame 711 to compensate for the missing region 712x.
  • the moving image compression apparatus supplements the data output from the second imaging area with a specific color in the area where no data is output from the first imaging area. As a result, the second frame 713 is generated. Thereby, the compression efficiency can be improved.
  • the moving picture compression apparatus is generated based on the data output from the second imaging area in the second frame.
  • a motion vector is detected for the image data of the region.
  • the moving image compression apparatus does not detect a motion vector for image data in a region other than the region generated based on the data output from the second imaging region. . Thereby, for example, by not performing motion detection on the image data of the first image area a1 and the complement area 712y, it is possible to reduce the load of the compression process.
  • the moving picture compression apparatus performs motion compensation based on the motion vector detection result. Thereby, the load of compression processing can be reduced.
  • the first moving image data 721 including the first frame 711 and the second moving image data 722 including the second frame 713 after complementing can be separately compressed. That is, the input moving image data 710 in which different frame rates are mixed can be divided and compressed at the frame rate imaging timing.
  • the first moving image data 721 or both the first moving image data 721 and the second moving image data 722 as an object to be expanded or reproduced. For example, when it is desired to reproduce at 30 [fps], which is the imaging timing of the first frame 711, only the first moving image data 721 needs to be expanded and reproduced.
  • both the first moving image data 721 and the second moving image data 722 may be expanded and combined. As a result, the reproducibility of the subject moving image is improved as necessary, and it can be reproduced as a more realistic image.
  • the generation apparatus compresses the plurality of first frames 711 generated based on the data output from the first imaging area in which the first frame rate (for example, 30 [fps]) is set.
  • a plurality of second frames generated based on the first compressed data and data output from the second imaging area in which a second frame rate (for example, 60 [fps]) faster than the first frame rate is set.
  • the compressed moving image data of the first frame 711 and the second frame 713 having different imaging timings can be compressed into a single moving image file 800 by compressing them with a common compression method.
  • the first frame 711 is generated based on the data output from the first imaging area and the data output from the second imaging area. It may be a frame that has been made.
  • the compressed data of the first frame 711 captured at the imaging timing of the first frame rate and the compressed data of the second frame 713 captured at the imaging timing of the second frame rate are compressed by the common compression method. By doing so, it is possible to combine them into one moving image file 800.
  • the second frame 713 is based on the data output from the second imaging region and the data not based on the output from the imaging device 100. It may be a generated frame.
  • the data output from the second imaging area is handled as the second frame 713, so that the first frame 711 can be compressed by a common compression method.
  • the data not based on the output from the image sensor 100 may be predetermined data.
  • the second frame 713 can be configured by data irrelevant to the output from the image sensor 100 and can be compressed by a compression method common to the first frame 711.
  • the second frame 713 includes a missing area in which data is not output from the first imaging area with respect to data output from the second imaging area. It may be a frame generated by complementing 712x. As a result, the second frame 713 is set to the complementary region 712y by complementing the missing region 712x that has not been output at the imaging timing of the second frame rate, and is compressed by the same compression method as the first frame 711. be able to.
  • the generating unit sets the first compressed data and the second compressed data in the data unit 802, and the first position information and the second position information are set in the header.
  • a moving image file 800 including a data part 802 and a header part 801 is generated.
  • the compressed data of the data part 802 can be read with reference to the header part 801.
  • the generating unit adds the first frame rate information (“30 [fps]” of 911) indicating the first frame rate to the header unit 801.
  • the second position information is set in association with the first position information (Pa of 912), the second frame rate information indicating the second frame rate (“60 [fps]” of 911), the first position information (Pa of 912) and the second position information.
  • the moving image file 800 including the header portion 801 and the data portion 802 is generated by setting in association with the two position information (Pb of 912).
  • the compressed data of the first moving image data 721 specified by the first position information associated with the first frame rate information is read, or the first position information specified by the first position information associated with the first frame rate information.
  • the first compressed moving image data obtained by compressing the first moving image data 721 and the second compressed moving image data obtained by compressing the second moving image data 722 specified by the second position information associated with the second frame rate information are read out. it can.
  • the first frame rate when the first frame rate is selected, the first compressed moving image data obtained by reliably compressing the first moving image data 721 from the moving image file 800 can be called. Further, when the second frame rate is selected, the second compressed moving image data obtained by reliably compressing the second moving image data 722 from the moving image file 800 can be called. Furthermore, when the first frame rate is selected, it is possible to suppress the omission of the first compressed moving image data from the moving image file 800.
  • the second generating unit 1232 includes information indicating the insertion destination in the first frame 711 in which the second frame 713 is inserted into the header unit 801 ( By setting the insertion position information 920), the moving image file 800 including the header portion 801 and the data portion 802 is generated.
  • the composition of the first moving image data 721 and the second moving image data 722 can be improved in accuracy, the reproducibility of the subject moving image can be improved, and it can be reproduced as a more realistic image.
  • the generating unit In the generating device of (2-3), the generating unit generates a moving image file 800 for each of the first moving image data 721 and the second moving image data 722, and associates both moving image files 800 with each other. Also good. Thereby, the moving image file 800 of the first moving image data 721 can be distributed alone. If it is desired to play back at the second frame rate, the moving image file 800 of the second moving image data 722 may be acquired separately.
  • first moving image data 721 and the second moving image data 722 as separate moving image files 800
  • distribution for example, downloading
  • a user terminal that is not charged for the moving image distribution service can download only the moving image file 800 of the first moving image data 721, and the charged user terminal can download both moving image files 800.
  • the playback device compresses a plurality of first frames 711 generated based on the data output from the first imaging area in which the first frame rate is set, and the first compressed data A moving image file including a second compressed data obtained by compressing a plurality of second frames 713 generated based on data output from a second imaging area set with a second frame rate faster than one frame rate.
  • an expansion unit 1234 that expands at least the first compressed data of the first compressed data and the second compressed data, and a reproduction unit 704 that reproduces a plurality of frames expanded by the expansion unit 1234 are provided.
  • first moving image data 721 and the first moving image data 721 are reproduction targets. For example, if playback is desired at 30 [fps], which is the imaging timing of the first frame 711, only a plurality of first frames 711 need be played back.
  • the first frame 711 is generated based on the data output from the first imaging area and the data output from the second imaging area. It may be a frame that has been made.
  • the compressed data of the first frame 711 captured at the imaging timing of the first frame rate and the compressed data of the second frame 713 captured at the imaging timing of the second frame rate are compressed by the common compression method. Since the moving image file 800 is generated, it is possible to select the reproduction target such as the first moving image data 721 and both the first moving image data 721 and the second moving image data 722 by expanding the moving image file 800. .
  • the second frame 713 is based on the data output from the second imaging area and the data not based on the output from the imaging device 100. It may be a generated frame.
  • the moving image file 800 can be expanded to reproduce the moving image at either the first frame rate or the second frame rate.
  • the data not based on the output from the image sensor 100 may be predetermined data.
  • the moving image file 800 is generated by compressing the second frame 713 and the first frame 711 configured using data irrelevant to the output from the image sensor 100 with a common compression method. By expanding the file 800, when reproducing at the second frame rate, both the first moving image data 721 and the second moving image data 722 can be combined and reproduced.
  • the second frame 713 is a missing area in which no data is output from the first imaging area with respect to the data output from the second imaging area. It may be a frame generated by complementing 712x. Thereby, when reproducing
  • the playback device of (3-1) includes a selection unit 1233 that selects a frame rate to be played back, and the decompression unit 1234 is based on the frame rate selected by the selection unit 1233.
  • the first compressed data and the second compressed data are expanded. Thereby, it is possible to reproduce a reproduction target such as both the first moving image data 721 and the second moving image data 722 by selecting a frame rate to be reproduced.
  • the first compressed moving image data and both the first compressed moving image data and the second compressed moving image data as the expansion target. For example, when it is desired to reproduce at 30 [fps], which is the imaging timing of the first frame 711, only the first compressed moving image data is expanded and the first moving image data 721 is reproduced.
  • both the first moving image data 721 and the second moving image are expanded by expanding both the first compressed moving image data and the second compressed moving image data.
  • Data 722 may be reproduced.
  • the reproducibility of the subject moving image is improved as necessary, and it can be reproduced as a more realistic image.
  • Example 2 will be described.
  • Example 1 since complementary image portions Da1, Da3,... Exist in the frames F2, F4,... Shown in FIG.
  • the synthesis unit 703 generates frames F2, F4,... With less discomfort without executing such image processing.
  • the same reference numerals are used for the common parts with the first embodiment, and the description thereof is omitted.
  • FIG. 27 is an explanatory diagram showing a specific processing flow of the synthesis example shown in FIG.
  • the image sensor 100 outputs the frames F1, F2-60, F3,.
  • the train travels from right to left in the frames F1, F2-60, and F3.
  • the branch numbers of the frames F1 to F3 indicate the frame rates of the frames F1 to F3.
  • an odd-numbered frame F1-30 indicates the image data of the first image region r1-30 output by imaging at a frame rate of 30 [fps] in the frame F1
  • the frame F1-60 is the frame F1.
  • image data of the second image region r1-60 output by imaging at a frame rate of 60 [fps] is shown.
  • the second image area r1-60 output by imaging at a frame rate of 60 [fps] in the frame F1-60 has train image data, but the frame F1-30 does not have the second image area r1-60.
  • Such an area in the frame F1-30 is referred to as a non-image area n1-60.
  • the first image region r1-30 output by imaging at a frame rate of 30 [fps] of the frame F1-30 also includes landscape image data in the frame F1-60. Not in image area r1-60.
  • Such an area in the frame F1-60 is referred to as a non-image area n1-30.
  • the frame F3-30 includes a first image region r3-30 to which landscape image data is output and a non-image region n3-60 to which nothing is output.
  • Reference numeral 60 includes a second image region r3-60 where train image data is output and a non-image region n3-60 where nothing is output. The same applies to the odd-numbered frames (not shown) after the frames F3-30 and F3-60.
  • the even-numbered frame F2-60 is filled with the image data (train) of the second image area r2-60 output by imaging at a frame rate of 60 [fps] and a specific color (for example, black).
  • the second frame 713 is composed of a complementary region 712y. The same applies to even-numbered frames (not shown) thereafter.
  • the combining unit 703 combines the image data (train) of the second image area r2-60 of the frame F2-60 and the image data (landscape) of the first image area r1-30 of the frame F1-30.
  • a frame F2 which is composite image data, is generated.
  • the frame F2 overlaps the non-image region n1-60 of the frame F1-30 and the complement region 712y of the frame F2-60 supplemented from the non-image region n2-30. It has a complementary image portion Da1.
  • the combining unit 703 fills the complementary image portion Da1 with a specific color or executes a demosaic process.
  • the combining unit 703 does not perform such image processing.
  • the image data of the complementary image portion Da1 in the other image area is duplicated.
  • the synthesis unit 703 generates a frame F ⁇ b> 2 with less discomfort.
  • description will be given focusing on the complementary image portion Da1.
  • FIG. 28 is an explanatory diagram of a synthesis example 1 of a 60 [fps] frame F2 according to the second embodiment.
  • Synthesis Example 1 as another image region to be copied to the complementary image portion Da1, the complementary image portion Da1 in the first image region r3-30 of the frame F3 that is temporally one after the frame F2-60 This is an example using the complementary image portion Db1 at the same position.
  • the image data of the complementary image portion Db1 is a part of the landscape.
  • the synthesizing unit 703 selects a complementary image portion Da1 in which the non-image area n1-60 of the frame F1-30 and the complementary area 712y of the frame F2-60 complemented from the non-image area n2-30 overlap.
  • the complementary image portion Db1 that is identified and located at the same position as the identified complementary image portion Da1 is identified from the frame F3.
  • the synthesizing unit 703 copies the image data of the complementary image portion Db1 to the complementary image portion Da1 in the frame F2.
  • the synthesis unit 703 can generate the frame F2 with less discomfort.
  • FIG. 29 is an explanatory diagram of a synthesis example 2 of the 60 [fps] frame F2 according to the second embodiment.
  • the image data of the first image region r1-30 of the frame F1-30 is used as a copy source to the first image region of the frame F2, and the image data of the complementary image portion Db1 of the frame F3 is transferred to the complementary image portion Da1.
  • the image data of the first image region r3-30 of the frame F3-30 is used as the copy source of the frame F2 to the first image region, and the complementary image portion Db2 of the frame F1 is used. Is the copy source to the complementary image portion Da2.
  • the complementary image portion Da2 is a range where the non-image area n3-60 of the frame F3-30 and the complementary area 712y of the frame F2-60 complemented from the non-image area n2-30 overlap.
  • the complementary image portion Db2 of the frame F1 is in the same position range as the complementary image portion Da2.
  • the synthesizing unit 703 selects a complementary image portion Da2 in which the non-image area n3-60 of the frame F3-30 and the complementary area 712y of the frame F2-60 complemented from the non-image area n2-30 overlap.
  • the complementary image portion Db2 that is identified and located at the same position as the identified complementary image portion Da2 is identified from the frame F1.
  • the synthesis unit 703 copies the image data of the complementary image portion Db2 to the complementary image portion Da2 in the frame F2.
  • the synthesis unit 703 can generate the frame F2 with less discomfort.
  • Synthesis Example 3 is an example in which either one of Synthesis Example 1 or Synthesis Example 2 is selected and synthesized.
  • the synthesis unit 703 specifies the complementary image portion Da1 in the synthesis example 1 and the complementary image portion Da2 in the synthesis example 2.
  • the synthesizing unit 703 selects one of the complementary image portions Da1 and Da2 and applies a synthesis example in which the selected range is specified.
  • the synthesis unit 703 applies synthesis example 1 when the complementary image portion Da1 is selected, and applies synthesis example 2 when the complementary image portion Da2 is selected.
  • the synthesizing unit 703 uses, for example, the narrowness of the range as a selection criterion as a selection criterion for selecting one of the complementary image portions Da1 and Da2.
  • the narrowness of the range as a selection criterion
  • the synthesis example 1 is applied. By selecting the narrower range, the uncomfortable feeling due to duplication can be kept to a minimum.
  • FIG. 30 is an explanatory diagram of a synthesis example 4 of the 60 [fps] frame F2 according to the second embodiment.
  • the replication source of the complementary image portion Da1 in the synthesis example 1 is not the image data (part of the landscape) of the complementary image portion Db1 in the first image region r3-30 of the frame F3 but the first frame F1. It is assumed that the image data (the end of the train) of the complementary image portion Db3 in the two-image region r1-60.
  • the image data (train) in the second image region r2-60 is added to the image data of the complementary image portion Db3 in the frame F2, but the image data (train) in the second image region r2-60. Therefore, when the user views the video, the image data (train) in the second image area r2-60 is illusioned as an afterimage of the traveling train. Therefore, also in this case, frames F2, F4,... With less discomfort can be generated.
  • the second frame 713 is output by capturing only the second frame rate (for example, 60 [[fps]) to be synthesized, and the defective area 712x is filled with a specific color (black). It is a frame.
  • the frame F2-60 in FIGS. 27 to 30 is the second frame 713.
  • the first frame 711 is one time earlier than the second frame 713 and has at least the first frame rate out of the first frame rate (for example, 30 [[fps]) and the second frame rate. It is a frame including an image area output by imaging.
  • the frame F1 in FIGS. 27 to 30 is the first frame 711.
  • the third frame 730 is a frame synthesized from the second frame 713 and the first frame 711 or the third frame 730.
  • the frame F2 in FIGS. 27 to 30 is the third frame 730.
  • the fourth frame is a frame that includes an image region that is one temporally later than the second frame 713 and that is output by imaging at least the first frame rate out of the first frame rate and the second frame rate. It is.
  • the frame F3 in FIGS. 27 to 30 is the fourth frame.
  • FIG. 31 is a flowchart illustrating a synthesis processing procedure example 1 according to the synthesis example 1 of the frame F2 by the synthesis unit 703. The same steps as those in FIG. 26 are denoted by the same step numbers, and the description thereof is omitted.
  • step S2604 when the acquired frame is the second frame 713 (step S2604: Yes), the specifying unit 1240 specifies a range that is the non-image area of the first frame 711 and the complement area 712y of the second frame 713. (Step S3101). Specifically, for example, as illustrated in FIG. 28, the specifying unit 1240 performs the non-image area n1-60 of the frame F1-30 and the complement area 712y of the frame F2-60 complemented from the non-image area n2-30. The complementary image part Da1 where and overlap is specified.
  • the composition unit 703 duplicates the image data of the first image area a1 of the first frame 711 (step S3102). Specifically, for example, as illustrated in FIG. 28, the combining unit 703 duplicates the image data (landscape) of the first image region r1-30 of the frame F1.
  • the synthesis unit 703 duplicates the image data in the range specified in step S3101 from the fourth frame (step S3103). Specifically, for example, as illustrated in FIG. 28, the combining unit 703 copies the image data of the complementary image portion Da1 and the complementary image portion Db1 specified in step S3101 from the frame F3.
  • the synthesis unit 703 generates a third frame 730 by synthesis (step S3104). Specifically, for example, as shown in FIG. 28, the combining unit 703, the second image area r2-60 of the frame F2-60, and the image data (landscape) of the copied first image area r1-30 The frame F2-60 is updated to the frame F2 (third frame 730) by combining the image data of the copied complementary image portion Db1.
  • step S2602 If there is no remaining frame in the buffer (step S2602: NO), the synthesizing unit 703 ends the synthesizing process (step S2507). As a result, the synthesis unit 703 can generate the frame F2 with less discomfort as shown in FIG.
  • FIG. 32 is a flowchart illustrating a synthesis processing procedure example 2 according to the synthesis example 2 of the frame F2 by the synthesis unit 703. The same steps as those in FIG. 26 are denoted by the same step numbers, and the description thereof is omitted.
  • step S2604 when the acquired frame is the second frame 713 (step S2604: Yes), the specifying unit 1240 specifies a range that is a non-image area of the fourth frame and is a complementary area 712y of the second frame 713 (Ste S3201). Specifically, for example, as illustrated in FIG. 29, the specifying unit 1240 performs the non-image region n3-60 of the frame F3-30 and the complement region 712y of the frame F2-60 supplemented from the non-image region n2-30. A complementary image portion Da2 where and are overlapped is specified.
  • the synthesizing unit 703 duplicates the image data of the first image area a1 of the fourth frame (step S3202). Specifically, for example, as illustrated in FIG. 29, the synthesis unit 703 duplicates the image data (landscape) of the first image region r3-30 of the frame F3.
  • the synthesis unit 703 duplicates the image data in the range specified in step S3201 from the first frame 711 (step S3203). Specifically, for example, as illustrated in FIG. 29, the combining unit 703 copies the image data of the complementary image portion Da2 and the complementary image portion Db2 identified in step S3201 from the frame F1.
  • the synthesis unit 703 generates a third frame 730 by synthesis (step S3204). Specifically, for example, as shown in FIG. 29, the combining unit 703, the second image area r2-60 of the frame F2-60, and the image data (landscape) of the copied first image area r3-30 The frame F2-60 is updated to the frame F2 (third frame 730) by combining the image data of the copied complementary image portion Db2.
  • step S2602 If there is no remaining frame in the buffer (step S2602: NO), the synthesizing unit 703 ends the synthesizing process (step S2507). As a result, the synthesis unit 703 can generate the frame F2 with less discomfort as shown in FIG.
  • FIG. 33 is a flowchart illustrating a synthesis processing procedure example 3 according to the synthesis example 3 of the frame F2 by the synthesis unit 703. The same steps as those in FIG. 26 are denoted by the same step numbers, and the description thereof is omitted.
  • step S2604 when the acquisition frame is the second frame 713 (step S2604: Yes), the specifying unit 1240 selects a first range that is a non-image area of the first frame 711 and a complementary area 712y of the second frame 713. Specify (step S3301). Specifically, for example, as illustrated in FIG. 28, the specifying unit 1240 performs the non-image area n1-60 of the frame F1-30 and the complement area 712y of the frame F2-60 complemented from the non-image area n2-30. The complementary image part Da1 where and overlap is specified.
  • the identifying unit 1240 identifies the second range that is the non-image area of the fourth frame and the complement area 712y of the second frame 713 (step S3302). Specifically, for example, as illustrated in FIG. 29, the specifying unit 1240 performs the non-image region n3-60 of the frame F3-30 and the complement region 712y of the frame F2-60 supplemented from the non-image region n2-30. A complementary image portion Da2 where and are overlapped is specified.
  • the synthesizing unit 703 selects one of the identified first range and second range (step S3303). Specifically, for example, the combining unit 703 selects a narrower range (a smaller area) of the first range and the second range. The selected range is called a selection range. In the case of the complementary image portions Da1 and Da2, the synthesis unit 703 selects the complementary image portion Da1. Thereby, the range used for a synthesis
  • the composition unit 703 duplicates the image data of the first image area a1 of the selected frame (step S3304).
  • the selected frame is a frame from which the selection range is specified. For example, when the first range (complementary image portion Da1) is selected, the selected frame is the first frame 711 (frame F1). When two ranges (complementary image portion Da2) are selected, the selected frame is the fourth frame (frame F3).
  • the image data of the first image area a1 of the selected frame is the image data (landscape) of the first image area r1-30 of the frame F1 if the selected frame is the frame F1, and the selected frame is the frame F3. If there is, it is the image data (landscape) of the first image region r3-30 of the frame F3.
  • the synthesis unit 703 duplicates the image data in the selection range in step S3303 from the non-selected frame (step S3305).
  • the non-selected frame is a frame that is the identification source of the range that has not been selected.
  • the composition unit 703 duplicates the image data of the complementary image portion Db1 at the same position as the complementary image portion Da1 from the frame F3 if the selection range is the complementary image portion Da1, and if the selection range is the complementary image portion Da2.
  • the image data of the complementary image portion Db2 at the same position as the complementary image portion Da2 is duplicated from the frame F1.
  • the synthesis unit 703 generates a third frame 730 by synthesis (step S3306). Specifically, for example, when the selection range is the first range (complementary image portion Da1), the synthesizing unit 703 combines the second image region r2-60 of the frame F2-60 and the duplicated first image region r1- The frame F2-60 is updated to the frame F2 (third frame 730) by synthesizing the 30 image data (landscape) and the image data of the copied complementary image portion Db1.
  • the synthesizing unit 703 selects the second image area r2-60 of the frame F2-60 and the image data (the copied first image area r3-30).
  • the frame F2-60 is updated to the frame F2 (third frame 730) by synthesizing the landscape) and the image data of the copied complementary image portion Db2.
  • step S2507 the synthesizing unit 703 ends the synthesizing process.
  • the synthesis unit 703 can minimize the uncomfortable feeling due to duplication by selecting the narrower range.
  • FIG. 34 is a flowchart illustrating a synthesis processing procedure example 4 according to the synthesis example 4 of the frame F2 by the synthesis unit 703. The same steps as those in FIG. 26 are denoted by the same step numbers, and the description thereof is omitted.
  • step S2604 when the acquired frame is the second frame 713 (step S2604: Yes), the specifying unit 1240 specifies a range that is the non-image area of the first frame 711 and the complement area 712y of the second frame 713. (Step S3401). Specifically, for example, as illustrated in FIG. 30, the synthesis unit 703 performs the non-image region n1-60 of the frame F1-30 and the complement region 712y of the frame F2-60 complemented from the non-image region n2-30. The complementary image part Da1 where and overlap is specified.
  • the composition unit 703 duplicates the image data of the first image area a1 of the first frame 711 (step S3402). Specifically, for example, the synthesis unit 703 duplicates the image data (landscape) of the first image region r1-30 of the frame F1.
  • the synthesis unit 703 duplicates the image data in the range specified in step S3401 from the first frame 711 (step S3403). Specifically, for example, the synthesis unit 703 duplicates the image data of the complementary image portion Da1 and the complementary image portion Db3 specified in step S3401 from the frame F1.
  • the synthesis unit 703 generates a third frame 730 by synthesis (step S3404).
  • the combining unit 703 includes the second image area r2-60 of the frame F2-60, the image data (landscape) of the copied first image area r1-30, and the copied complementary image portion Db3.
  • the frame F2-60 is updated to the frame F2 (third frame 730).
  • step S2602 If there is no remaining frame in the buffer (step S2602: NO), the synthesizing unit 703 ends the synthesizing process (step S2507). Thereby, the composition unit 703 can generate the frame F2 with less discomfort as shown in FIG.
  • the playback device (3-6) shown in the first embodiment includes the synthesis unit 703.
  • the synthesizing unit 703 acquires the first moving image data 721 and the second moving image data 722 from the storage device 1202, and more temporally than the first frame 711 and the first frame 711.
  • the second frame 713 obtained later is synthesized, and the second frame 713 is combined with the image data of the first image area a1 in the first frame 711 and the image data of the second image area a2 in the second frame 713.
  • a combined third frame 730 is generated.
  • the synthesizing unit 703 uses the image data of the second image area a2 in the second frame 713 and the image of the first image area a1 in the first frame 711. For the area overlapping with the data, the third frame 730 is generated by applying the image data of the second image area a2 in the second frame 713.
  • composition unit 703 is second frame 713.
  • the top part of the train of frame F2 is applied with priority. Therefore, it is possible to obtain an image with less sense of discomfort (the frame F2 which is the third frame 730), and the reproducibility of the subject moving image is improved, so that it can be reproduced as a more realistic image.
  • the combining unit 703 does not belong to either the second image area a2 in the second frame 713 or the first image area a1 in the first frame 711.
  • the third frame 730 is generated by applying the image data of the second image region a2 in the first frame 711.
  • an image area between the end portion of the train of the second frame of the frame F2-60 which is the second frame 713 and the background area of the frame F1 of the first frame 711 is the first frame 711.
  • the image data (second train end) of the second image area a2 in a certain frame F1 is preferentially applied. Therefore, it is possible to obtain an image with less sense of discomfort (the frame F2 which is the third frame 730), and the reproducibility of the subject moving image is improved, so that it can be reproduced as a more realistic image.
  • the specifying unit 1240 corresponds to the second imaging region in the first frame 711 based on the first frame 711 and the second frame 713.
  • the complementary image portion Da1 that is the non-image region n1-60 to be performed and is the complementary region 712y in the second frame 713 is specified.
  • the synthesizing unit 703 includes the image data of the second image area a2 in the second frame 713, the image data of the first image area a1 (r1-30) corresponding to the first imaging area in the first frame 711, and the first frame.
  • the specific image of the complementary image portion Da1 specified by the specifying unit 1240 in the image data other than the image data of the first image area a1 (r1-30) in 711 and the image data of the second image area a2 in the second frame 713 And image data.
  • the non-image area n2-30 that is not output by the imaging of the image data 712 can be supplemented by a frame temporally close to the image data 712. Therefore, it is possible to obtain a composite frame that is less uncomfortable than the image data 712.
  • the first frame 711 is a frame (for example, the frame F1) generated before the second frame 713 in time.
  • the image data is a range in the first image area a1 (r3-30) of a frame (for example, frame F3) generated by output from the first imaging area and the second imaging area after the second frame 713 in time.
  • the image data may be (Da1) image data (that is, image data of the complementary image portion Db1).
  • the non-image region n2-30 that is not output by the imaging of the second frame 713 is compensated by the first frame 711 immediately before the second frame 713 and the fourth frame after it. Can do. Therefore, it is possible to obtain a composite frame (third frame 730) with a little discomfort.
  • the first frame 711 is a frame (for example, the frame F3) generated after the second frame 713, and the specific image data is the second frame 713.
  • An image of the range (Da2) in the first image area a1 (r1-30) of the frame (for example, the frame F1) generated by the output from the first imaging area and the second imaging area before the frame 713 Data (that is, image data of the complementary image portion Db2) may be used.
  • the non-image region n2-30 which is the complement region 712y of the second frame 713, can be supplemented by the first frame 711 immediately before the second frame 713 and the fourth frame after the second frame 713. it can. Therefore, it is possible to obtain a composite frame (third frame 730) with a little discomfort.
  • the specifying unit 1240 specifies the range used by the combining unit 703 based on the first range (Da1) and the second range (Da2).
  • the combining unit 703 also includes the second frame 713 and one frame (F1 / F3) that is the identification source of one range (Da1 / Da2) identified by the identifying unit 1240 among the first frame 711 and the fourth frame.
  • the synthesizing unit 703 can minimize a sense of incongruity due to duplication by selecting a narrower range.
  • the first frame 711 is a frame generated before the second frame 713 in time, and the specific image data is the second frame of the first frame 711.
  • Image data in the range (Da1) in the image region a2 that is, image data of the complementary image portion Db3) may be used.
  • the non-image region n2-30 which is the complement region 712y of the second frame 713 can be supplemented by the first frame 711 which is temporally one previous to the second frame 713. Therefore, it is possible to obtain a composite frame (third frame 730) with a little discomfort.
  • Example 3 will be described.
  • the synthesis unit 703 paints a specific color or executes a demosaic process.
  • the synthesizing unit 703 generates frames F2, F4,... With less discomfort without performing such image processing.
  • FIG. 35 is an explanatory diagram of a synthesis example of a frame [2] of 60 [[fps] according to the third embodiment.
  • the preprocessing unit 1210 Before imaging the frame F2-60, the preprocessing unit 1210 detects a specific subject such as a train from the frame F1 and the like before the frame F2-60, and detects a motion vector of the specific subject in the immediately preceding frame F1. .
  • the preprocessing unit 1210 can obtain a 60 [fps] image region R12-60 in the next frame F2-60 based on the image region and motion vector of the specific subject in the frame F1.
  • the synthesis unit 703 duplicates the image data (landscape) of the first image region r1-30 of the previous frame F1, and the first The frame F2 can be obtained by synthesizing the image data (landscape) in the image region r1-30 and the image data (part of the train and landscape) in the image region R12-60.
  • FIG. 36 is an explanatory diagram showing the correspondence between the setting of the imaging area and the image area of the frame F2-60.
  • (A) shows an example of motion vector detection
  • (B) shows the correspondence between the setting of the imaging region and the image region of the frame F2-60.
  • the imaging region p1-60 is an imaging region of a specific subject that has already been detected after the generation of the frame F0-60 immediately before the frame F1 and before the generation of the frame F1. Therefore, in the frame F1, the image data o1 of the specific subject (train) exists in the second image region r1-60 corresponding to the imaging region p1-60.
  • the pre-processing unit 1210 detects the motion vector mv of the specific subject from the image data o1 of the specific subject in the frame F0 and the image data o1 of the specific subject in the frame F1 by the detection unit 1211. Then, the preprocessing unit 1210 detects the second image region r2-60 in which the specific subject is projected in the next frame F2-60 based on the second image region r1-60 of the specific subject in the frame F1 and the motion vector mv. Then, the detected imaging region p2-60 of the imaging surface 200 of the imaging device 100 corresponding to the detected second image region r2-60 is detected.
  • the preprocessing unit 1210 uses the setting unit 1212 to set the frame rate of the specific imaging region P12-60 including the imaging region p1-60 specified when the frame F1 is generated and the detection imaging region p2-60.
  • the second frame rate is set, and the setting instruction is output to the image sensor 100.
  • the image sensor 100 captures an image by setting the specific imaging region P12-60 to the second frame rate, and generates image data 712.
  • the first generation unit 701 complements the image data 712 generated by imaging at the second frame rate set by the setting unit 1212 and outputs the second frame 713 (F2-60). In this case, the image data output from the specific imaging region P12-60 becomes the image data of the image region R12-60.
  • the synthesizing unit 703 includes the image data of the first image region r1-30 included in the frame F1 and the image data (image region R12-) from the specific imaging region P12-60 included in the second frame 713 (F2-60). 60). As a result, the frame F2-60 is updated to the frame F2 (third frame 730).
  • the preprocessing unit 1210 sets the frame rate of the detection imaging region p2-60 to the second frame rate, and the detected imaging of the imaging plane 200 is detected.
  • the frame rate of the imaging region other than the region p2-60 may be set to the first frame rate.
  • the second imaging area in which the second frame rate is set is only the detection imaging area p2-60, as with the frame F1. .
  • specific detection imaging regions are set for the frames F2-60, F4-60,... To be combined, useless processing in the frames F1, F3,.
  • the frame F2-60 includes image data o1 of the specific subject (train) and image data o2 of a part of the landscape in the image region R12-60.
  • the image region R12-60 is expanded on the opposite side of the moving direction of the specific subject compared to the second image region r2-60. Therefore, it is not necessary to specify the complementary image portions Da1 and Da2 as in the second embodiment and to duplicate and synthesize the image data of the complementary image portions Db1 and Db2 of other frames.
  • the combining process of the third embodiment is executed in, for example, step S2507 in FIG. This synthesis process is applied to the synthesis of the frames F2-60, F4-60,..., And is not executed for the frames F1, F3,.
  • the composition source image data is the two image regions R12-60 in the second frame 713 and the first image region r1-30 in the frame F1, a frame with less discomfort. F2 can be generated. That is, since the image data o1 and o2 are image data output by imaging at the same timing, the boundary between the image data o1 and o2 is not unnatural and does not feel strange. Further, as in the second embodiment, it is not necessary to specify the complementary image portions Da1 and Da2 and to select the optimum range from the complementary image portions Da1 and Da2, so that the load of the frame F2 composition processing is reduced. Reduction can be achieved.
  • the imaging apparatus includes the imaging element 100, the detection unit 1211, and the setting unit 1212.
  • the imaging device 100 has a first imaging area for imaging a subject and a second imaging area for imaging the subject, and a first frame rate (for example, 30 [fps]) can be set in the first imaging area.
  • a second frame rate for example, 60 [fps]
  • the first frame rate for example, 30 [fps]
  • a second frame rate for example, 60 [fps]
  • the detection unit 1211 Based on the second image region r1-60 of the specific subject included in the frame F1 generated by the output from the image sensor 100, the detection unit 1211 detects the detection image region p2-60 of the specific subject in the image sensor 100. .
  • the setting unit 1212 includes specific imaging including the imaging area p1-60 of the specific subject used to generate the frame F1 and the imaging area (hereinafter, detected imaging area) p2-60 detected by the detection unit 1211.
  • the frame rate of region P12-60 is set to the second frame rate.
  • the imaging area at the second frame rate can be expanded and the specific subject can be imaged at the second frame rate so that the complementary image portion Da1 in which the non-image areas overlap in the frames F1 and F2 does not occur. Further, it is possible to suppress the image loss of the frame F2-60 output by the imaging at the second frame rate.
  • the detection unit 1211 is temporally longer than the second image region r1-60 of the specific subject included in the frame F1, and the frames F1 and F1. Based on the motion vector mv of the specific subject between the previous frame F0-60, the detection imaging region p2-60 of the specific subject is detected.
  • the setting unit 1212 sets the specific imaging area when the frame is the first frame F1 generated by the output from the first imaging area.
  • the frame rate of the detected imaging region p2-60 Is set to the second frame rate
  • the frame rate of the imaging region other than the detection imaging region p2-60 is set to the first frame rate.
  • a specific detection imaging region is set only for the frames F2-60, F4-60,... To be combined, and therefore it is possible to suppress useless processing in the frames F1, F3,.
  • the image processing apparatus includes a first imaging area for imaging a subject and a second imaging area for imaging the subject, and the first frame rate is set in the first imaging area. (For example, 30 [fps]) can be set, and the output from the image sensor 100 can set a second frame rate (for example, 60 [fps]) faster than the first frame rate in the second imaging region.
  • the frame generated by the above is subjected to image processing.
  • This image processing apparatus includes a detection unit 1211, a setting unit 1212, a first generation unit 701, and a synthesis unit 703.
  • the detection unit 1211 detects the imaging region p2-60 of the specific subject in the imaging device 100 based on the second image region r1-60 of the specific subject included in the frame F1 generated by the output from the imaging device 100.
  • the setting unit 1212 includes a frame of the specific imaging region P12-60 including the imaging region p1-60 of the specific subject used for generating the frame F1 and the detected imaging region p2-60 detected by the detection unit 1211. Set the rate to the second frame rate.
  • the first generation unit 701 complements the image data 712 generated by imaging at the second frame rate set by the setting unit 1212 and outputs the second frame 713 (F2-60).
  • the synthesizing unit 703 includes the image data of the first image region r1-30 included in the first frame F1 and the image data (image region) from the specific imaging region P12-60 included in the second frame 713 (F2-60). R12-60).
  • the imaging area at the second frame rate can be expanded and the specific subject can be imaged at the second frame rate so that the complementary image portion Da1 in which the non-image areas overlap in the frames F1 and F2 does not occur. Further, it is possible to suppress the image loss of the frame F2-60 output by the imaging at the second frame rate. In addition, since it is not necessary to compensate for the overlapping complementary image portion Da1 at the time of synthesis, it is possible to obtain an image with less sense of incongruity and to reduce the load of the synthesis process.
  • image sensor 100 image sensor, 701 complementing unit, 702 compression / decompression unit, 703 synthesis unit, 704 playback unit, 800 video file, 801 header unit, 802 data unit, 835 additional information, 910 imaging condition information, 911 frame rate information, 912 position information , 920 insertion position information, 921 insertion frame number, 922 insertion destination, 1201 processor, 1202 storage device, 1210 preprocessing unit, 1211 detection unit, 1212 setting unit, 1220 acquisition unit, 1231 compression unit, 1232 generation unit, 1233 selection unit , 1234 extension part, 1240 specific part

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Studio Devices (AREA)

Abstract

被写体を撮像する第1撮像領域と、被写体を撮像する第2撮像領域と、を有する撮像素子から出力されたデータを圧縮した動画ファイルを生成する生成装置は、第1フレームレートが設定された前記第1撮像領域から出力されたデータに基づいて生成された複数の第1フレームを圧縮した第1圧縮データと、前記第1フレームレートよりも速い第2フレームレートが設定された前記第2撮像領域から出力されたデータに基づいて生成された複数の第2フレームを圧縮した第2圧縮データと、前記第1圧縮データの格納位置を示す第1位置情報と、前記第2圧縮データの格納位置を示す第2位置情報と、を含む動画ファイルを生成する生成部と、前記生成部によって生成された動画ファイルを記憶デバイスに格納する格納部と、を有する。

Description

生成装置、電子機器、生成プログラムおよびデータ構造 参照による取り込み
 本出願は、平成30年(2018年)3月30日に出願された日本出願である特願2018-70249の優先権を主張し、その内容を参照することにより、本出願に取り込む。
 本発明は、生成装置、電子機器、生成プログラムおよびデータ構造に関する。
 領域ごとに異なる撮像条件を設定可能な撮像素子を搭載した撮像装置が知られている(特許文献1参照)。しかしながら、異なる撮像条件で撮像されたフレームの動画圧縮は従来考慮されていない。
特開2006-197192号公報
 本開示技術の生成装置は、被写体を撮像する第1撮像領域と、被写体を撮像する第2撮像領域と、を有する撮像素子から出力されたデータを圧縮した動画ファイルを生成する生成装置であって、第1フレームレートが設定された前記第1撮像領域から出力されたデータに基づいて生成された複数の第1フレームを圧縮した第1圧縮データと、前記第1フレームレートよりも速い第2フレームレートが設定された前記第2撮像領域から出力されたデータに基づいて生成された複数の第2フレームを圧縮した第2圧縮データと、前記第1圧縮データの格納位置を示す第1位置情報と、前記第2圧縮データの格納位置を示す第2位置情報と、を含む動画ファイルを生成する生成部と、前記生成部によって生成された動画ファイルを記憶デバイスに格納する格納部と、を有する。
 また、本願において開示される技術の他の側面となる生成装置は、被写体を撮像する第1撮像領域と、被写体を撮像する第2撮像領域と、を有する撮像素子から出力されたデータを圧縮した動画ファイルを生成する生成装置であって、第1フレームレートが設定された前記第1撮像領域から出力されたデータに基づいて生成された複数の第1フレームを圧縮した第1圧縮データと、前記第1フレームレートよりも速い第2フレームレートが設定された前記第2撮像領域から出力されたデータに基づいて生成された複数の第2フレームを圧縮した第2圧縮データと、を含む動画ファイルを生成する生成部と、前記生成部によって生成された動画ファイルを記憶デバイスに格納する格納部と、を有する。
 本開示技術の電子機器は、被写体を撮像する第1撮像領域と、被写体を撮像する第2撮像領域と、を有する撮像素子と、第1フレームレートが設定された前記第1撮像領域から出力されたデータに基づいて生成された複数の第1フレームを圧縮した第1圧縮データと、前記第1フレームレートよりも速い第2フレームレートが設定された前記第2撮像領域から出力されたデータに基づいて生成された複数の第2フレームを圧縮した第2圧縮データと、前記第1圧縮データの格納位置を示す第1位置情報と、前記第2圧縮データの格納位置を示す第2位置情報と、を含む動画ファイルを生成する生成部と、前記生成部によって生成された動画ファイルを記憶デバイスに格納する格納部と、を有する。
 また、本願において開示される技術の他の側面となる電子機器は、被写体を撮像する第1撮像領域と、被写体を撮像する第2撮像領域と、を有する撮像素子と、第1フレームレートが設定された前記第1撮像領域から出力されたデータに基づいて生成された複数の第1フレームを圧縮した第1圧縮データと、前記第1フレームレートよりも速い第2フレームレートが設定された前記第2撮像領域から出力されたデータに基づいて生成された複数の第2フレームを圧縮した第2圧縮データと、を含む動画ファイルを生成する生成部と、前記生成部によって生成された動画ファイルを記憶デバイスに格納する格納部と、を有する。
 本開示技術の生成プログラムは、被写体を撮像する第1撮像領域と、被写体を撮像する第2撮像領域と、を有する撮像素子から出力されたデータを圧縮した動画ファイルの生成をプロセッサに実行させる生成プログラムであって、前記プロセッサに、第1フレームレートが設定された前記第1撮像領域から出力されたデータに基づいて生成された複数の第1フレームを圧縮した第1圧縮データと、前記第1フレームレートよりも速い第2フレームレートが設定された前記第2撮像領域から出力されたデータに基づいて生成された複数の第2フレームを圧縮した第2圧縮データと、前記第1圧縮データの格納位置を示す第1位置情報と、前記第2圧縮データの格納位置を示す第2位置情報と、を含む動画ファイルを生成する生成処理と、前記生成処理によって生成された動画ファイルを記憶デバイスに格納する格納処理と、を実行させる。
 また、本開示技術の他の生成プログラムは、被写体を撮像する第1撮像領域と、被写体を撮像する第2撮像領域と、を有する撮像素子から出力されたデータを圧縮した動画ファイルの生成をプロセッサに実行させる生成プログラムであって、前記プロセッサに、第1フレームレートが設定された前記第1撮像領域から出力されたデータに基づいて生成された複数の第1フレームを圧縮した第1圧縮データと、前記第1フレームレートよりも速い第2フレームレートが設定された前記第2撮像領域から出力されたデータに基づいて生成された複数の第2フレームを圧縮した第2圧縮データと、を含む動画ファイルを生成する生成処理と、前記生成処理によって生成された動画ファイルを記憶デバイスに格納する格納処理と、を実行させる。
 本開示技術のデータ構造は、被写体を撮像する第1撮像領域と、被写体を撮像する第2撮像領域と、を有する撮像素子から出力されたデータを圧縮した動画ファイルのデータ構造であって、第1フレームレートが設定された前記第1撮像領域から出力されたデータに基づいて生成された複数の第1フレームを圧縮した第1圧縮データと、前記第1フレームレートよりも速い第2フレームレートが設定された前記第2撮像領域から出力されたデータに基づいて生成された複数の第2フレームを圧縮した第2圧縮データと、を格納するデータ部と、前記第1圧縮データの格納位置を示す第1位置情報と、前記第2圧縮データの格納位置を示す第2位置情報と、を格納するヘッダ部と、を有する。
図1は、積層型撮像素子の断面図である。 図2は、撮像チップの画素配列を説明する図である。 図3は、撮像チップの回路図である。 図4は、撮像素子の機能的構成例を示すブロック図である。 図5は、電子機器のブロック構成例を示す説明図である。 図6は、撮像面と被写体像との関係を示す説明図である。 図7は、実施例1にかかる動画圧縮伸張例を示す説明図である。 図8は、動画ファイルのファイルフォーマット例を示す説明図である。 図9は、フレームと付加情報との関係を示す説明図である。 図10は、図7に示した合成部における合成処理例1を示す説明図である。 図11は、図7に示した合成部における合成処理例2を示す説明図である。 図12は、図5に示した制御部の構成例を示すブロック図である。 図13は、圧縮部の構成例を示すブロック図である。 図14は、制御部の動作処理手順例を示すシーケンス図である。 図15は、図14に示した設定処理(ステップS1404、S1410)の詳細な処理手順例を示すフローチャートである。 図16は、図15に示したフレームレート設定処理(ステップS1505)の詳細な処理手順例を示すフローチャートである。 図17は、補完部による補完処理手順例を示すフローチャートである。 図18は、図14に示した動画ファイル生成処理(ステップS1413、S1415)の詳細な処理手順例を示すフローチャートである。 図19は、圧縮制御部による第1圧縮制御方法の圧縮制御処理手順例を示すフローチャートである。 図20は、動き検出部による第1圧縮制御方法の動き検出処理手順例を示すフローチャートである。 図21は、動き補償部による第1圧縮制御方法の動き補償処理手順例を示すフローチャートである。 図22は、圧縮制御部による第2圧縮制御方法の圧縮制御処理手順例を示すフローチャートである。 図23は、動き検出部による第2圧縮制御方法の動き検出処理手順例を示すフローチャートである。 図24は、動き補償部による第2圧縮制御方法の動き補償処理手順例を示すフローチャートである。 図25は、伸張から再生までの処理手順例を示すフローチャートである。 図26は、図25に示した合成処理(ステップS2507)の詳細な処理手順例を示すフローチャートである。 図27は、図10に示した合成例の具体的な処理の流れを示す説明図である。 図28は、実施例2にかかる60[fps]のフレームの合成例1を示す説明図である。 図29は、実施例2にかかる60[fps]のフレームの合成例2を示す説明図である。 図30は、実施例2にかかる60[fps]のフレームの合成例4を示す説明図である。 図31は、合成部によるフレームの合成例1による合成処理手順例1を示すフローチャートである。 図32は、合成部によるフレームの合成例2による合成処理手順例2を示すフローチャートである。 図33は、合成部によるフレームの合成例3による合成処理手順例3を示すフローチャートである。 図34は、合成部によるフレームの合成例4による合成処理手順例4を示すフローチャートである。 図35は、実施例3にかかる60[fps]のフレームの合成例を示す説明図である。 図36は、撮像領域の設定と補完後第2フレームの画像領域との対応関係を示す説明図である。
 <撮像素子の構成例>
 初めに、電子機器に搭載する積層型撮像素子について説明する。電子機器は、たとえば、デジタルカメラやデジタルビデオカメラなどの撮像装置である。
 図1は、積層型撮像素子100の断面図である。積層型撮像素子(以下、単に、「撮像素子」)100は、入射光に対応した画素信号を出力する裏面照射型撮像チップ(以下、単に、「撮像チップ」)113と、画素信号を処理する信号処理チップ111と、画素信号を記憶するメモリチップ112とを備える。これら撮像チップ113、信号処理チップ111およびメモリチップ112は積層されており、Cuなどの導電性を有するバンプ109により互いに電気的に接続される。
 なお、図1に示すように、入射光は主に白抜き矢印で示すZ軸プラス方向へ向かって入射する。本実施形態においては、撮像チップ113において、入射光が入射する側の面を裏面と称する。また、座標軸120に示すように、Z軸に直交する紙面左方向をX軸プラス方向、Z軸およびX軸に直交する紙面手前方向をY軸プラス方向とする。以降のいくつかの図においては、図1の座標軸を基準として、それぞれの図の向きがわかるように座標軸を表示する。
 撮像チップ113の一例は、裏面照射型のMOS(Metal Oxide Semiconductor)イメージセンサである。PD(フォトダイオード)層106は、配線層108の裏面側に配されている。PD層106は、二次元的に配され、入射光に応じた電荷を蓄積する複数のPD104、および、PD104に対応して設けられたトランジスタ105を有する。
 PD層106における入射光の入射側にはパッシベーション膜103を介してカラーフィルタ102が設けられる。カラーフィルタ102は、互いに異なる波長領域を透過する複数の種類を有しており、PD104のそれぞれに対応して特定の配列を有している。カラーフィルタ102の配列については後述する。カラーフィルタ102、PD104およびトランジスタ105の組が、一つの画素を形成する。
 カラーフィルタ102における入射光の入射側には、それぞれの画素に対応して、マイクロレンズ101が設けられる。マイクロレンズ101は、対応するPD104へ向けて入射光を集光する。
 配線層108は、PD層106からの画素信号を信号処理チップ111に伝送する配線107を有する。配線107は多層であってもよく、また、受動素子および能動素子が設けられてもよい。
 配線層108の表面には複数のバンプ109が配される。当該複数のバンプ109が信号処理チップ111の対向する面に設けられた複数のバンプ109と位置合わせされて、撮像チップ113と信号処理チップ111とが加圧などされることにより、位置合わせされたバンプ109同士が接合されて、電気的に接続される。
 同様に、信号処理チップ111およびメモリチップ112の互いに対向する面には、複数のバンプ109が配される。これらのバンプ109が互いに位置合わせされて、信号処理チップ111とメモリチップ112とが加圧などされることにより、位置合わせされたバンプ109同士が接合されて、電気的に接続される。
 なお、バンプ109間の接合には、固相拡散によるCuバンプ接合に限らず、はんだ溶融によるマイクロバンプ結合を採用してもよい。また、バンプ109は、たとえば、後述する一つのブロックに対して一つ程度設ければよい。したがって、バンプ109の大きさは、PD104のピッチよりも大きくてもよい。また、画素が配列された画素領域以外の周辺領域において、画素領域に対応するバンプ109よりも大きなバンプを併せて設けてもよい。
 信号処理チップ111は、表裏面にそれぞれ設けられた回路を互いに接続するTSV(シリコン貫通電極)110を有する。TSV110は、周辺領域に設けられることが好ましい。また、TSV110は、撮像チップ113の周辺領域、メモリチップ112にも設けられてよい。
 図2は、撮像チップ113の画素配列を説明する図である。特に、撮像チップ113を裏面側から観察した様子を示す。(a)は、撮像チップ113の裏面である撮像面200を模式的に示す平面図であり、(b)は、撮像面200の一部領域200aを拡大した平面図である。(b)に示すように、撮像面200には、画素201が二次元状に多数配列されている。
 画素201は、それぞれ不図示の色フィルタを有している。色フィルタは、赤(R)、緑(G)、青(B)の3種類からなり、(b)における「R」、「G」、および「B」という表記は、画素201が有する色フィルタの種類を表している。(b)に示すように、撮像素子100の撮像面200には、このような各色フィルタを備えた画素201が、いわゆるベイヤー配列に従って配列されている。
 赤フィルタを有する画素201は、入射光のうち、赤色の波長帯の光を光電変換して受光信号(光電変換信号)を出力する。同様に、緑フィルタを有する画素201は、入射光のうち、緑色の波長帯の光を光電変換して受光信号を出力する。また、青フィルタを有する画素201は、入射光のうち、青色の波長帯の光を光電変換して受光信号を出力する。
 撮像素子100は、隣接する2画素×2画素の計4つの画素201から成るブロック202ごとに、個別に制御可能に構成されている。たとえば、互いに異なる2つのブロック202について、同時に電荷蓄積を開始したときに、一方のブロック202では電荷蓄積開始から1/30秒後に電荷の読み出し、すなわち受光信号の読み出しを行い、他方のブロック202では電荷蓄積開始から1/15秒後に電荷の読み出しを行うことができる。換言すると、撮像素子100は、1回の撮像において、ブロック202ごとに異なる露光時間(電荷蓄積時間であり、いわゆるシャッタースピード)を設定することができる。
 撮像素子100は、上述した露光時間以外にも、撮像信号の増幅率(いわゆるISO感度)をブロック202ごとに異ならせることが可能である。撮像素子100は、電荷蓄積を開始するタイミングや受光信号を読み出すタイミングをブロック202ごとに変化させることができる。すなわち、撮像素子100は、動画撮像時のフレームレートをブロック202ごとに変化させることができる。
 以上をまとめると、撮像素子100は、ブロック202ごとに、露光時間、増幅率、フレームレートなどの撮像条件を異ならせることが可能に構成されている。たとえば、画素201が有する不図示の光電変換部から撮像信号を読み出すための不図示の読み出し線が、ブロック202ごとに設けられ、ブロック202ごとに独立して撮像信号を読み出し可能に構成すれば、ブロック202ごとに露光時間(シャッタースピード)を異ならせることができる。
 また、光電変換された電荷により生成された撮像信号を増幅する不図示の増幅回路をブロック202ごとに独立して設け、増幅回路による増幅率を増幅回路ごとに独立して制御可能に構成すれば、ブロック202ごとに信号の増幅率(ISO感度)を異ならせることができる。
 また、ブロック202ごとに異ならせることが可能な撮像条件は、上述した撮像条件のほか、フレームレート、ゲイン、解像度(間引き率)、画素信号を加算する加算行数または加算列数、電荷の蓄積時間または蓄積回数、デジタル化のビット数などである。さらに、制御パラメータは、画素からの画像信号取得後の画像処理におけるパラメータであってもよい。
 また、撮像条件は、たとえば、ブロック202ごとに独立して制御可能な区画(1区画が1つのブロック202に対応する)を有する液晶パネルを撮像素子100に設け、オンオフ可能な減光フィルタとして利用すれば、ブロック202ごとに明るさ(絞り値)を制御することが可能になる。
 なお、ブロック202を構成する画素201の数は、上述した2×2の4画素でなくてもよい。ブロック202は、少なくとも1個の画素201を有していればよいし、逆に、4個より多くの画素201を有していてもよい。
 図3は、撮像チップ113の回路図である。図3において、代表的に点線で囲む矩形が、1つの画素201に対応する回路を表す。また、一点鎖線で囲む矩形が1つのブロック202(202-1~202-4)に対応する。なお、以下に説明する各トランジスタの少なくとも一部は、図1のトランジスタ105に対応する。
 上述したように、画素201のリセットトランジスタ303は、ブロック202単位でオン/オフされる。また、画素201の転送トランジスタ302も、ブロック202単位でオン/オフされる。図3に示す例において、左上ブロック202-1に対応する4つのリセットトランジスタ303をオン/オフするためのリセット配線300-1が設けられており、同ブロック202-1に対応する4つの転送トランジスタ302に転送パルスを供給するためのTX配線307-1も設けられる。
 同様に、左下ブロック202-3に対応する4つのリセットトランジスタ303をオン/オフするためのリセット配線300-3が、上記リセット配線300-1とは別個に設けられる。また、同ブロック202-3に対応する4つの転送トランジスタ302に転送パルスを供給するためのTX配線307-3が、上記TX配線307-1と別個に設けられる。
 右上ブロック202-2や右下ブロック202-4についても同様に、それぞれリセット配線300-2とTX配線307-2、およびリセット配線300-4とTX配線307-4が、それぞれのブロック202に設けられている。
 各画素201に対応する16個のPD104は、それぞれ対応する転送トランジスタ302に接続される。各転送トランジスタ302のゲートには、上記ブロック202ごとのTX配線を介して転送パルスが供給される。各転送トランジスタ302のドレインは、対応するリセットトランジスタ303のソースに接続されるとともに、転送トランジスタ302のドレインとリセットトランジスタ303のソース間のいわゆるフローティングディフュージョンFDが、対応する増幅トランジスタ304のゲートに接続される。
 各リセットトランジスタ303のドレインは、電源電圧が供給されるVdd配線310に共通に接続される。各リセットトランジスタ303のゲートには、上記ブロック202ごとのリセット配線を介してリセットパルスが供給される。
 各増幅トランジスタ304のドレインは、電源電圧が供給されるVdd配線310に共通に接続される。また、各増幅トランジスタ304のソースは、対応する選択トランジスタ305のドレインに接続される。各選択トランジスタ305のゲートには、選択パルスが供給されるデコーダ配線308に接続される。デコーダ配線308は、16個の選択トランジスタ305に対してそれぞれ独立に設けられる。
 そして、各々の選択トランジスタ305のソースは、共通の出力配線309に接続される。負荷電流源311は、出力配線309に電流を供給する。すなわち、選択トランジスタ305に対する出力配線309は、ソースフォロアにより形成される。なお、負荷電流源311は、撮像チップ113側に設けてもよいし、信号処理チップ111側に設けてもよい。
 ここで、電荷の蓄積開始から蓄積終了後の画素出力までの流れを説明する。上記ブロック202ごとのリセット配線を通じてリセットパルスがリセットトランジスタ303に印加され、同時に上記ブロック202(202-1~202-4)ごとのTX配線を通じて転送パルスが転送トランジスタ302に印加されると、上記ブロック202ごとに、PD104およびフローティングディフュージョンFDの電位がリセットされる。
 各PD104は、転送パルスの印加が解除されると、受光する入射光を電荷に変換して蓄積する。その後、リセットパルスが印加されていない状態で再び転送パルスが印加されると、蓄積された電荷はフローティングディフュージョンFDへ転送され、フローティングディフュージョンFDの電位は、リセット電位から電荷蓄積後の信号電位になる。
 そして、デコーダ配線308を通じて選択パルスが選択トランジスタ305に印加されると、フローティングディフュージョンFDの信号電位の変動が、増幅トランジスタ304および選択トランジスタ305を介して出力配線309に伝わる。これにより、リセット電位と信号電位とに対応する画素信号は、単位画素から出力配線309に出力されることになる。
 上述したように、ブロック202を形成する4画素に対して、リセット配線とTX配線が共通である。すなわち、リセットパルスと転送パルスはそれぞれ、同ブロック202内の4画素に対して同時に印加される。したがって、あるブロック202を形成するすべての画素201は、同一のタイミングで電荷蓄積を開始し、同一のタイミングで電荷蓄積を終了する。ただし、蓄積された電荷に対応する画素信号は、それぞれの選択トランジスタ305に選択パルスが順次印加されることにより、選択的に出力配線309から出力される。
 このように、ブロック202ごとに電荷蓄積開始タイミングを制御することができる。換言すると、異なるブロック202間では、異なったタイミングで撮像することができる。
 図4は、撮像素子100の機能的構成例を示すブロック図である。アナログのマルチプレクサ411は、ブロック202を形成する16個のPD104を順番に選択して、それぞれの画素信号を当該ブロック202に対応して設けられた出力配線309へ出力させる。マルチプレクサ411は、PD104と共に、撮像チップ113に形成される。
 マルチプレクサ411を介して出力された画素信号は、信号処理チップ111に形成された、相関二重サンプリング(CDS)・アナログ/デジタル(A/D)変換を行う信号処理回路412により、CDSおよびA/D変換が行われる。A/D変換された画素信号は、デマルチプレクサ413に引き渡され、それぞれの画素に対応する画素メモリ414に格納される。デマルチプレクサ413および画素メモリ414は、メモリチップ112に形成される。
 演算回路415は、画素メモリ414に格納された画素信号を処理して後段に引き渡す。演算回路415は、信号処理チップ111に設けられてもよいし、メモリチップ112に設けられてもよい。なお、図4では4つのブロック202の分の接続を示すが、実際にはこれらが4つのブロック202ごとに存在して、並列で動作する。
 ただし、演算回路415は4つのブロック202ごとに存在しなくてもよく、たとえば、一つの演算回路415がそれぞれの4つのブロック202に対応する画素メモリ414の値を順に参照しながらシーケンシャルに処理してもよい。
 上記の通り、ブロック202のそれぞれに対応して出力配線309が設けられている。撮像素子100は撮像チップ113、信号処理チップ111およびメモリチップ112を積層しているので、これら出力配線309にバンプ109を用いたチップ間の電気的接続を用いることにより、各チップを面方向に大きくすることなく配線を引き回すことができる。
 <電子機器のブロック構成例>
 図5は、電子機器のブロック構成例を示す説明図である。電子機器500は、たとえば、レンズ一体型のカメラである。電子機器500は、撮像光学系501と、撮像素子100と、制御部502と、液晶モニタ503と、メモリカード504と、操作部505と、DRAM506と、フラッシュメモリ507と、録音部508とを備える。制御部502は、後述するように動画データを圧縮する圧縮部を含む。したがって、電子機器500のうち、少なくとも制御部502を含む構成が動画圧縮装置や伸張装置、再生装置となる。また、メモリカード504、DRAM506、およびフラッシュメモリ507は、後述する記憶デバイス1202を構成する。
 撮像光学系501は、複数のレンズから構成され、撮像素子100の撮像面200に被写体像を結像させる。なお、図5では、便宜上、撮像光学系501を1枚のレンズとして図示している。
 撮像素子100は、たとえば、CMOS(Complementary Metal Oxide Semiconductor)やCCD(Charge Coupled Device)などの撮像素子であり、撮像光学系501により結像された被写体像を撮像して撮像信号を出力する。制御部502は、電子機器500の各部を制御する電子回路であり、プロセッサとその周辺回路とから構成される。
 不揮発性の記憶媒体であるフラッシュメモリ507には、予め所定の制御プログラムが書き込まれている。制御部502のプロセッサは、フラッシュメモリ507から制御プログラムを読み込んで実行することにより、各部の制御を行う。この制御プログラムは、揮発性の記憶媒体であるDRAM506を作業用領域として使用する。
 液晶モニタ503は、液晶パネルを利用した表示装置である。制御部502は、所定周期(たとえば60分の1秒)ごとに撮像素子100に繰り返し被写体像を撮像させる。そして、撮像素子100から出力された撮像信号に種々の画像処理を施していわゆるスルー画を作成し、液晶モニタ503に表示する。液晶モニタ503には、上記のスルー画以外に、たとえば撮像条件を設定する設定画面などが表示される。
 制御部502は、撮像素子100から出力された撮像信号に基づき、後述する画像ファイルを作成し、可搬性の記録媒体であるメモリカード504に画像ファイルを記録する。操作部505は、プッシュボタンなどの種々の操作部材を有し、それら操作部材が操作されたことに応じて制御部502に操作信号を出力する。
 録音部508は、たとえば、マイクロフォンにより構成され、環境音を音声信号に変換して制御部502に入力する。なお、制御部502は、可搬性の記録媒体であるメモリカード504に動画ファイルを記録するのではなく、電子機器500に内蔵されたSSD(Solid State Drive)やハードディスクのような不図示の記録媒体に記録してもよい。
 <撮像面200と被写体像との関係>
 図6は、撮像面200と被写体像との関係を示す説明図である。(a)は、撮像素子100の撮像面200(撮像範囲)と被写体像601とを模式的に示す。(a)において、制御部502は、被写体像601を撮像する。(a)の撮像は、たとえばライブビュー画像(いわゆるスルー画)の作成のために行われる撮像を兼ねていてもよい。
 制御部502は、(a)の撮像により得られた被写体像601に対して、所定の画像解析処理を実行する。画像解析処理は、たとえば周知の被写体検出技術(特徴量を演算して所定の被写体が存在する範囲を検出する技術)により、主要被写体を検出する処理である。実施例1では、主要被写体以外は背景とする。画像解析処理によって、主要被写体が検出されるため、撮像面200は、主要被写体が存在する主要被写体領域602と、背景が存在する背景領域603とに分割される。
 なお、(a)では、被写体像601を大まかに含む領域を主要被写体領域602として図示しているが、主要被写体領域602は、被写体像601の外形に沿った形状であってもよい。つまり、被写体像601以外のものをできるだけ含まないように主要被写体領域602を設定してもよい。
 制御部502は、主要被写体領域602内の各ブロック202と、背景領域603内の各ブロック202とで、異なる撮像条件を設定する。たとえば、前者の各ブロック202には、後者の各ブロック202に比べて高速なシャッタースピードを設定する。このようにすると、(a)の撮像の次に撮像される(c)の撮像において、主要被写体領域602では像ぶれが発生しにくくなる。
 また、制御部502は、背景領域603に存在する太陽などの光源の影響で、主要被写体領域602が逆光状態となっている場合には、前者の各ブロック202に、相対的に高めのISO感度を設定したり、低速なシャッタースピードを設定したりする。また、制御部502は、後者の各ブロック202に、相対的に低めのISO感度を設定したり、高速なシャッタースピードを設定したりする。このようにすると、(c)の撮像において、逆光状態の主要被写体領域602の黒つぶれや、光量の大きい背景領域603の白飛びを防止することができる。
 なお、画像解析処理は、上述した主要被写体領域602と背景領域603とを検出する処理とは異なる処理であってもよい。たとえば、撮像面200全体のうち、明るさが一定以上の部分(明るすぎる部分)や明るさが一定未満の部分(暗すぎる部分)を検出する処理であってもよい。画像解析処理をこのような処理とした場合、制御部502は、前者の領域に含まれるブロック202について、露出値(Ev値)が他の領域に含まれるブロック202よりも低くなるように、シャッタースピードやISO感度を設定してもよい。
 また、制御部502は、後者の領域に含まれるブロック202については、露出値(Ev値)が他の領域に含まれるブロック202よりも高くなるように、シャッタースピードやISO感度を設定する。このようにすることで、(c)の撮像により得られる画像のダイナミックレンジを、撮像素子100の本来のダイナミックレンジよりも広げることができる。
 図6の(b)は、(a)に示した撮像面200に対応するマスク情報604の一例を示す。主要被写体領域602に属するブロック202の位置には「1」が、背景領域603に属するブロック202の位置には「2」がそれぞれ格納されている。
 制御部502は、1フレーム目の画像データに対して、画像解析処理を実行し、主要被写体領域602と背景領域603とを検出する。これにより、(a)の撮像によるフレームは、(b)に示すように、主要被写体領域602と背景領域603とに分割される。制御部502は、主要被写体領域602内の各ブロック202と、背景領域603内の各ブロック202とで、異なる撮像条件を設定して、(c)の撮像を行い、画像データを作成する。このときのマスク情報604の例を(d)に示す。
 (a)の撮像の結果に対応する(b)のマスク情報604と、(c)の撮像の結果に対応する(d)のマスク情報604とでは、異なる時刻に撮像を行っている(時間差がある)ため、たとえば、被写体が移動している場合や、ユーザが電子機器500を動かした場合に、これら2つのマスク情報604が異なる内容になる。換言すると、マスク情報604は、時間経過に伴い変化する動的情報である。従って、あるブロック202において、フレームごとに異なる撮像条件が設定されることになる。
 以下、上述した撮像素子100を用いた動画の圧縮、動画ファイル生成、伸張、および再生の実施例について説明する。
 <動画圧縮伸張例>
 図7は、実施例1にかかる動画圧縮伸張例を示す説明図である。電子機器500は、上述した撮像素子100と、制御部502と、を有する。制御部502は、第1生成部701と、圧縮伸張部702と、合成部703と、再生部704と、を含む。撮像素子100は、上述したように、被写体を撮像する複数の撮像領域を有する。撮像領域は、少なくとも1画素以上の画素集合であり、たとえば、上述した1以上のブロック202である。撮像領域には、ブロック202ごとに撮像条件(たとえば、フレームレート、露光時間、ISO感度)が設定可能である。
 ここでは、撮像面200のうち、第1フレームレート(たとえば、30[fps])が設定される撮像領域を「第1撮像領域」と称し、第1フレームレートよりも速い第2フレームレート(たとえば、60[fps])が設定される撮像領域を「第2撮像領域」と称す。なお、第1フレームレートおよび第2フレームレートの値は一例であり、第2フレームレートが第1フレームレートよりも速ければ他の値でもよい。なお、第2フレームレートが第1フレームレートの倍数であれば、第1フレームレートの撮像タイミングで第1撮像領域および第2撮像領域から出力されたフレームを得ることができる。
 撮像素子100は、被写体を撮像して、入力動画データ710を第1生成部701に出力する。撮像素子100のある撮像領域から出力された画像データの領域を、(当該撮像領域に対応する)画像領域と称す。
 たとえば、撮像面200全域が第1フレームレート(30[fps])に設定された第1撮像領域である場合、第1フレームレート(30[fps])での撮像により当該第1撮像領域(撮像面200全域)から出力される第1画像領域a1(網掛け)の画像データは、画像処理により1枚のフレームとなる。このフレームを「第1フレーム711」と称する。
 具体的には、たとえば、風景を定点撮影している場合、第1フレームレート(30[fps])での撮像により、風景のみの第1画像領域a1の画像データとして第1フレーム711が生成される。
 また、たとえば、撮像面200全域が第1フレームレート(30[fps])に設定された第1撮像領域である場合で、かつ、特定被写体が検出された撮像領域が第1撮像領域から第2フレームレート(60[fps])に設定された第2撮像領域に変更される場合、第1フレームレート(30[fps])での撮像により当該第1撮像領域から出力される第1画像領域a1(網掛け)の画像データおよび第2撮像領域から出力される第2画像領域a2の画像データの組み合わせも、第1フレーム711である。
 具体的には、たとえば、風景の定点撮影中に特定被写体(電車)が検出された場合、第1フレームレート(30[fps])での撮像により、第1フレームレート(30[fps])で得られた当該電車を除いた風景(第1画像領域a1)の画像データと、第2フレームレート(60[fps])で得られた電車(第2画像領域a2)の画像データと、の組み合わせとして、第1フレーム711が生成される。
 またこの場合、第2フレームレート(60[fps])での撮像により撮像面200の第2撮像領域から出力される第2撮像領域から出力される第2画像領域a2の画像データを、「画像データ712」と称する。この場合、第1撮像領域から被写体の画像データが出力されなかった画像領域を、「欠損領域712x」と称す。
 具体的には、たとえば、風景の定点撮影中に特定被写体(電車)が検出された場合、第2フレームレート(60[fps])での撮像により、第2フレームレート(60[fps])で得られた電車(第2画像領域a2)の画像データは、画像データ712である。
 なお、異なるフレームレートが設定される撮像領域は3以上でもよい。この場合、第3撮像領域以降については、第1フレームレートおよび第2フレームレートとは異なるフレームレートが設定可能となる。
 第1生成部701は、撮像素子100から入力された入力動画データ710のうち、画像データ712を補完する。具体的には、たとえば、第1生成部701は、撮像素子100の第1撮像領域から画像信号が出力されなかった欠損領域712xを特定色で補完する。本例では、特定色は黒とし、図7でも黒塗りとする。なお、特定色は、黒以外の色でもよく、また、特定のパターンでもよい。また、特定色は、一色ではなく、複数の色を用いてもよい。また、第2画像領域a2の周囲の画素領域を第2画像領域a2の境界と同色にしてもよい。また、特定色で補完された欠損領域712xを「補完領域712y」と称す。
 画像処理により画像データ712と補完領域712yとを組み合わせた画像データを、第2フレーム713と称す。また、第1フレーム711群により構成される動画データを第1動画データ721とし、第2フレーム713群により構成される動画データを第2動画データ722と称す。第1生成部701は、第1動画データ721および第2動画データ722を圧縮伸張部702に出力する。
 圧縮伸張部702は、第1動画データ721および第2動画データ722をそれぞれ圧縮して、記憶デバイス(たとえば、メモリカード504、フラッシュメモリ507)に格納する。圧縮伸張部702は、たとえば、動き補償フレーム間予測(Motion Compensation:MC)と離散コサイン変換(Discrete Cosine Transform:DCT)とに、エントロピー符号化を組み合わせたハイブリッド符号化によって圧縮する。
 圧縮伸張部702は、第1動画データ721を構成する第1フレーム711のうち、網掛けで示した第1画像領域a1については、動き検出や動き補償が不要な圧縮処理を実行する。圧縮伸張部702は、ハッチングした特定被写体像が出力された第2画像領域a2の画像データ712については、上述したハイブリッド符号化によって圧縮する。このように、特定被写体像以外の第1画像領域a1については、動き検出および動き補償が実行されないため、動画圧縮の処理負荷の低減を図ることができる。
 なお、第1画像領域a1については、撮像装置の手ブレがない場合、あるいは被写体に動きがない場合を想定して、動き検出や動き補償が不要な圧縮処理を実行することとした。しかしながら、手ブレや被写体の動きがある場合には、圧縮伸張部702は、第1画像領域a1について上述したハイブリッド符号化によって圧縮してもよい。
 同様に、圧縮伸張部702は、第2動画データ722を構成する第2フレーム713のうち、黒塗りで示した補完領域712yについては、動き検出や動き補償が不要な圧縮処理を実行する。圧縮伸張部702は、ハッチングした特定被写体像が出力された第2画像領域a2の画像データ712については、上述したハイブリッド符号化によって圧縮する。このように、特定被写体像以外の補完領域712y(黒塗り)については、動き検出および動き補償が実行されないため、動画圧縮の処理負荷の低減を図ることができる。また、手ブレや被写体の動きがある場合には、圧縮伸張部702は、補完領域712yについて上述したハイブリッド符号化によって圧縮してもよい。
 このように、第2フレームレート(60[fps])で得られた第2フレーム713は、第1フレームレート(30[fps])で得られた第1フレーム711と同サイズとなる。したがって、第2フレーム713は、第1フレーム711の圧縮処理と同じ圧縮処理が適用されるため、画像データ712のサイズに適合する他の圧縮処理を適用する必要がない。
 また、圧縮伸張部702は、動画の再生指示または伸張指示があった場合に、圧縮された第1動画データ721および第2動画データ722を伸張して、元の第1動画データ721および第2動画データ722に戻す。
 合成部703は、第2フレーム713の時間的に1つ前の第1フレーム711を参照して、その第1フレーム711を第2フレーム713に複製、すなわち、合成する。具体的には、合成部703は、第2フレームに合成する他の第1フレーム711を複製により生成し、生成した第1フレームと第2フレームとを合成する。合成されたフレームを「第3フレーム730」と称す。第3フレーム730は、第1フレーム711の被写体像に、第2フレーム713における特定被写体像(第2画像領域a2)が重畳されたフレームである。合成部703は、30[fps]の撮像で出力された第1フレーム711と、合成フレームである第3フレーム730と、を含む動画データ(以下、第4動画データ)740を再生部704に出力する。なお、合成指示がない場合、たとえば、30fpsで動画を再生したい場合には、合成部703は合成処理を実行しない。
 再生部704は、第4動画データ740を再生して動画を液晶モニタ503に表示する。このように、上述した入力動画データ710そのままでは圧縮伸張部702で圧縮することができない。そのため、第1生成部701は、画像データ712を補完領域712yで補完して、複数の第2フレーム713からなる第2動画データ722を生成する。圧縮伸張部702は、第1動画データ721および第2動画データ722を別々に圧縮、伸張する。
 これにより、汎用の圧縮伸張部702により、圧縮伸張部702において通常の動画データ(第1動画データ721)と同様に第2動画データ722の圧縮が可能となる。なお、合成部703で合成処理が実行されなかった場合、再生部704は、フレームレートが30[fps]の第1動画データ721を再生して、その動画を液晶モニタ503に表示することになる。
 なお、上記の例では、撮像面200全域が第1フレームレート(30[fps])に設定された第1撮像領域である場合で、かつ、特定被写体が検出された撮像領域が第1撮像領域から第2フレームレート(60[fps])に設定された第2撮像領域に変更される場合について説明したが、撮像面200の撮像領域の撮像条件の設定はこれに限られない。
 たとえば、千鳥配置のように、撮像面200において、第1フレームレート(30[fps])に設定された複数の第1撮像領域と第2フレームレート(60[fps])に設置された複数の第2撮像領域とが混在する場合、複数の第1撮像領域に対応する複数の第1画像領域a1により組み合わされた画像データは、第1フレームF711となる。また、この場合、複数の第2撮像領域に対応する複数の第2画像領域a2により組み合わされた画像データは、「第2フレームF712」となる。なお、千鳥配置において、第1撮像領域および第2撮像領域のフレームレートは同一とし、露光時間やISO感度、間引き率といった他の撮像条件を第1撮像領域および第2撮像領域で異なるように設定してもよい。
 <動画ファイルのファイルフォーマット例>
 図8は、動画ファイルのファイルフォーマット例を示す説明図である。図8では、たとえば、MPEG4(Moving Picture Experts Group phase 4)に準拠するファイルフォーマットを適用した場合を例に挙げて説明する。
 動画ファイル800は、ボックスと呼ばれるデータの集合であり、たとえば、ヘッダ部801とデータ部802とを有する。ヘッダ部801は、ボックスとして、ftyp811と、uuid812と、moov813と、を含む。データ部802は、ボックスとして、mdat820を含む。
 ftyp811は、動画ファイル800の種別を示す情報を格納するボックスであり、動画ファイル800内で他のボックスよりも前の位置に配置される。uuid812は、汎用固有識別子を格納するボックスであり、ユーザが拡張可能である。実施例1では、たとえば、uuid812には、この動画ファイル800におけるフレーム群のフレームレートが第1フレームレート(たとえば、30[fps])のみの動画データであるか、第1フレームレートおよび第2フレームレート(60[fps])を含む動画データ(第1動画データ721および第2動画データ722)であるかを識別するフレームレート識別情報が書き込まれてもよい。これにより、伸張や合成、再生時にどの動画データがどのフレームレートであるかを特定することができる。
 moov813は、動画、音声、テキストといった各種メディアに関するメタデータを格納するボックスである。mdat820は、動画、音声、テキストといった各種メディアのデータを格納するボックスである。
 つぎに、moov813内のボックスについて具体的に説明する。moov813は、uuid831と、udta832と、mvhd833と、trak834a,834bと、付加情報835と、を有する。trak834a,834bを区別しない場合には、単に、trak834と表記する。同様に、trak834a内のデータのtkhd841a等やtrak834b内のデータのtkhd841b等を区別しない場合には、単にtkhd841と称する。
 uuid831は、uuid812と同様、汎用固有識別子を格納するボックスであり、ユーザが拡張可能である。実施例1では、たとえば、動画ファイル800の生成の際に、uuid831に、この動画ファイル800におけるフレームの各々が、第1フレーム711であるか、第2フレーム713であるかを識別するフレーム種別識別情報が、フレーム番号と対応付けて書き込まれる。
 また、uuid831には、第1動画データ721の圧縮データと、第2動画データ722の圧縮データと、の格納位置を示す情報が書き込まれてもよい。具体的には、たとえば、第1動画データ721の圧縮データの格納位置を示す情報として、(SOM(Start Of Movie)850a,EOM(End Of Movie)854a)が書き込まれ、第2動画データ722の圧縮データの格納位置を示す情報として、(SOM850b,EOM854b)が書き込まれる。これにより、伸張や合成、再生時にどの動画データがどの格納位置に格納されているかを特定することができる。
 なお、圧縮データの格納位置は、後述のstsz847a,847bおよびstco848a,848bで特定可能である。したがって、SOM850aおよびEOM854aの代わりにstsz847a,847bおよびstco848a,848bから特定した第1動画データ721の圧縮データのアドレスを、第1フレームレートを示す第1フレームレート情報に関連付けて、格納位置を示す情報としてstsz847a,847bおよびstco848a,848bに設定してもよい。
 同様に、SOM850bおよびEOM854bの代わりにstsz847a,847bおよびstco848a,848bから特定した第2動画データ722の圧縮データのアドレスを、第2フレームレートを示す第2フレームレート情報に関連付けて、格納位置を示す情報としてstsz847a,847bおよびstco848a,848bに設定してもよい。
 udta832は、ユーザデータを格納するボックスである。ユーザデータとしては、たとえば、電子機器の識別コードや電子機器の位置情報がある。
 mvhd833は、trak834ごとに、タイムスケールと、デュレーションと、を格納するボックスである。タイムスケールは、フレームレートまたはサンプリング周波数である。デュレーションは、タイムスケールを基準にした長さである。デュレーションをタイムスケールで除算すると、そのtrak834で特定されるメディアの時間長が得られる。
 trak834は、メディアの種類(動画、音声、テキスト)ごとに設定されるボックスである。本実施例では、moovは、trak834a,834bを含む。trak834aは、たとえば、30[fps]の撮像で出力された第1動画データ721の動画、音声、テキストに関するメタデータを格納するボックスである。
 trak834aは、第1動画データ721の動画、音声、テキストごとに設定される。trak834bは、たとえば、60[fps]の撮像で出力された第2動画データ722の動画、音声、テキストに関するメタデータを格納するボックスである。trak834bも、第2動画データ722の動画、音声、テキストごとに設定される。
 付加情報835は、撮像条件情報と挿入位置情報とを含むボックスである。撮像条件情報とは、撮影条件(たとえば、30[fps]、60[fps]のようなフレームレート)ごとに動画ファイル800内でのメディアの格納位置を示す情報である。挿入位置情報とは、速い方のフレームレートのメディアのデータ(第2動画データ722)を遅い方のフレームレートのメディアのデータ(第1動画データ721)に挿入する位置を示す情報である。
 つぎに、trak834内のボックスについて具体的に説明する。trak834a,834bはそれぞれ、tkhd841a,841bと、edts842a,842bと、tref843a,843bと、stsc844a,844bと、stts845a,845bと、stss846a,846bと、stsz847a,847bと、stco848a,848bと、を有する。なお、tkhd841a~stco848aおよびtkhd841b~stco848bを区別しない場合は、単に、tkhd841~stco848と表記する。
 tkhd841は、trak834の再生時間や表示解像度、メディアの種類を決める識別コードといったtrak834の基本属性を格納するボックスである。たとえば、trak834が動画であればメディアID=1、音声であればメディアID=2、テキストであればメディアID=3となる。
 edts842は、trak834のエディットリストとして、trak834の再生開始位置と、その再生位置からの再生時間とを、格納するボックスである。tref843は、trak834間の参照情報を格納するボックスである。たとえば、動画のtrak834がテキストのtrak834をチャプタとして参照する場合、動画のtrak834のtref843には、テキストのtrak834を示すメディアID=3が格納され、テキストのtrak834をチャプタとして参照するため、識別コードとして「chap」が格納される。
 stsc844は、1チャンク内のサンプル数を格納するボックスである。チャンクとは、サンプル数分のメディアのデータの集合であり、mdat820に格納される。たとえば、メディアが動画である場合、チャンク内のサンプルはフレームである。サンプル数が「3」であれば、1チャンク内に3フレームが格納されることを意味する。
 stts845は、そのtrak834内の各チャンクまたはチャンク内のサンプルについての再生時刻を格納するボックスである。stss846は、キーフレーム(Iピクチャ)の間隔に関する情報を格納するボックスである。GOP(Group of Pictures)が「5」の場合は、stss846には、「1,6,11,・・・」と格納される。
 stsz847は、mdat820内のサンプルごとのデータサイズを格納するボックスである。stco848は、mdat820内のチャンクごとに動画ファイル800の先頭アドレスからのオフセットを格納するボックスである。stsz847およびstco848を参照することで、mdat820内のメディアのデータ(フレーム、音声データ、テキスト(チャプタ))の位置を特定することが可能となる。
 mdat820は、メディアごとのチャンクを格納するボックスである。SOM850a,850b(区別しない場合は、SOM850と表記)は、ある撮像条件のチャンク群の格納開始位置を示す識別子である。また、EOM854a,854b(区別しない場合は、EOM854と表記)は、ある撮像条件のチャンク群の格納終了位置を示す識別子である。
 図8では、mdat820は、動画チャンク851-1、音声チャンク852-1、テキストチャンク853-1、…、動画チャンク851-2、音声チャンク852-2、テキストチャンク853-2、…、動画チャンク851-3、音声チャンク852-3、テキストチャンク853-3を格納する。
 本例は、2つの撮像条件(30[fps],60[fps])で動画撮影をおこなう例であるため、撮像条件ごとにチャンクが区分けされる。具体的には、たとえば、SOM850a~EOM854aまでが30[fps]の撮像タイミングで得られたチャンク群が格納され、SOM850b~EOM854bまでが60[fps]の撮像タイミングで得られたチャンク群が格納される。
 動画チャンク851-1は、30[fps]の撮像で出力されたサンプルである特定被写体検出前の第1フレーム711の圧縮フレーム、すなわち、圧縮フレーム861-s1、861-s2、861-s3を格納する。動画チャンク851-2は、30[fps]の撮像で出力されたサンプルである特定被写体検出時の第1フレーム711の圧縮フレーム、すなわち、圧縮フレーム862-s1、862-s2、862-s3を格納する。フレーム862-s1、862-s2、862-s3は、60[fps]と撮像タイミングが重複するため、60[fps]での特定被写体像(第2画像領域a2)が含まれる。
 動画チャンク851-3は、60[fps]の撮像で出力されたサンプルである特定被写体検出時の第2フレーム713の圧縮フレーム、すなわち、圧縮フレーム863-s1、863-s2、863-s3を格納する。
 <付加情報>
 図9は、フレームと付加情報835との関係を示す説明図である。(A)はフレームFのデータ構造例を示す。フレームFは、フレーム番号901とフレームデータ902とを有する。フレームデータ902は、撮像により生成された画像データである。
 (B)は、圧縮フレーム列を示す。(B)では、左(最古)から右(最新)に時系列に圧縮フレームが配列されている。#1a~#6aは、30[fps]の撮像で出力された圧縮フレーム861-s1、861-s2、861-s3、862-s1、862-s2、862-s3のフレーム番号である。#1b~#3bは、60[fps]の撮像で出力された圧縮フレーム863-s1、863-s2、863-s3のフレーム番号である。
 (C)は、付加情報835のデータ構造例を示す。付加情報835は、撮像条件情報910と、挿入位置情報920と、を有する。撮像条件情報910は、上述したように、撮影条件(たとえば、30[fps]、60[fps]のようなフレームレート)ごとに動画ファイル800内でのメディアの格納位置を示す情報である。撮像条件情報910は、フレームレート情報911と位置情報912とを有する。
 フレームレート情報911は、たとえば、30[fps]、60[fps]のようなフレームレートである。位置情報912は、動画ファイル800内での圧縮フレームの格納位置を示す情報であり、stsz847およびstco848を参照することで特定される。具体的には、たとえば、フレームレート情報911が30[fps]の圧縮フレームの位置情報912の値Paは、SOM850a~EOM854aの範囲のアドレスを示す。同様に、フレームレート情報911が60[fps]の圧縮フレームの位置情報912の値Pbは、SOM850b~EOM854bの範囲のアドレスを示す。
 挿入位置情報920は、速い方のフレームレート(60[fps])のメディアのデータ(第2動画データ722)を遅い方のフレームレート(30[fps])のメディアのデータ(第1動画データ721)に挿入する位置を示す情報である。挿入位置情報920は、挿入フレーム番号921と、挿入先922と、を有する。挿入フレーム番号921は、挿入対象となる圧縮フレームのフレーム番号を示す。本例では、フレーム番号#1b~#3bで特定される圧縮フレーム863-s1、863-s2、863-s3が挿入対象となる圧縮フレームである。
 挿入先922は、挿入フレーム番号921で特定される圧縮フレームの挿入位置を示す。挿入先922は、具体的には、たとえば、2つのフレーム番号の間として特定される。たとえば、挿入フレーム番号#1bの圧縮フレーム863-s1は、挿入先922の2つのフレーム番号(#3a,#4a)で特定される圧縮フレーム861-s3と圧縮フレーム862-s1との間に挿入される。なお、図9では、挿入先922をフレーム番号を用いて特定したが、アドレス(stsz847およびstco848)を参照することで特定)を用いて特定してもよい。
 なお、図8および図9においては、1つの動画ファイル800に、第1フレーム711を圧縮した圧縮データと、第2フレーム713を圧縮した圧縮データと、を格納する例について説明したが、第1フレーム711を圧縮した動画ファイルと、第2フレーム713を圧縮した動画ファイルと、を別々に生成してもよい。この場合、両動画ファイル800のヘッダ部801に、一方の動画ファイル800が他方の動画ファイル800と関連付ける関連情報が格納される。関連情報は、たとえば、ヘッダ部801のuuid812,831やmvhd833に格納される。
 これにより、1つの動画ファイル800にまとめた場合と同様、伸張、合成、再生をおこなうことができる。たとえば、第1フレームレートが選択された場合には、第1フレーム711を圧縮した動画ファイルが伸張および再生され、第2フレームレートが選択された場合には、第1フレーム711を圧縮した動画ファイル800および第2フレーム713を圧縮した動画ファイル800が伸張され、合成および再生が実行される。
 なお、付加情報835は、moov813内に格納されていれば、他のボックス(831~834)に格納されていてもよい。
 <合成処理例>
 図10は、図7に示した合成部703における合成処理例1を示す説明図である。合成処理例1では、電子機器500は、田んぼ、山、および空を含む風景の定点撮影中に、特定被写体として、走行する電車を撮影する。特定被写体である電車は、上述した周知の被写体検出技術により特定される。撮影されたフレームFは、時系列順にフレームF1,F2-60,F3,F4-60,F5とする。ここでは、電車は、フレームF1,F2-60,F3,F4-60,F5内において、右から左に向かって走行するものとする。
 フレームF1,F3,F5は、第1撮像領域が30[fps]の第1フレームレートの撮像で出力された第1画像領域a1の画像データと、第2撮像領域が60[fps]の第2フレームレートの撮像で出力された第2画像領域a2の画像データと、を含む第1フレーム711である。フレームF2-60,F4-60は、第2撮像領域が60[fps]の第2フレームレートの撮像で出力された第2画像領域a2の画像データを含み、かつ、背景が黒塗りで補完された第2フレーム713である。
 具体的には、たとえば、フレームF1,F3,F5は、第1画像領域a1に田んぼ、山、および空を含む風景が撮像され、第2画像領域a2に特定被写体として走行する電車が撮像された第1フレーム711である。フレームF2-60,F4-60は、第2画像領域a2に電車が撮像されたフレームである。
 すなわち、フレームF1,F2-60,F3,F4-60,F5において、電車が撮像された第2画像領域a2の画像データが、第2撮像領域(60[fps])の撮像で出力された画像データである。また、フレームF1,F3,F5において、風景が撮像された第1画像領域a1の画像データが、第1撮像領域(30[fps])の撮像で出力された画像データである。第1画像領域a1は、第1フレームレート(30[fps])の撮像で出力されるため、第2フレームレート(60[fps])の撮像で出力されるフレームF2-60,F4-60の補完領域712yは、特定色(黒)で塗りつぶされている。
 フレームF1,F2-60,F3,F4-60,F5…は、上述した第1動画データ721および第2動画データ722に相当する。第2動画データ722は、補完領域712yが黒塗りの第2フレーム713を含むため、合成部703は、第1動画データ721と第2動画データ722とを合成する。
 具体的には、たとえば、合成部703は、フレームF2-60よりも時間的に1つ前のフレームF1の第1画像領域a1の画像データ(電車を除いた風景)に、フレームF2-60の第2画像領域a2の画像データ(電車)を複製する。これにより、合成部703は、第3フレーム730であるフレームF2を生成する。
 フレームF4-60も同様に、合成部703は、フレームF4-60よりも時間的に1つ前のフレームF3の第1画像領域a1の画像データ(電車を除いた風景)に、フレームF4-60の第2画像領域a2の画像データ(電車)を複製する。これにより、合成部703は、第3フレーム730であるフレームF4を生成する。そして、合成部703は、フレームF1~F5を含む第4動画データ740を出力する。
 このようにして、フレームF2-60,F4-60の補完領域712yに、時間的に1つ前の第1フレームレートのフレームF1、F3の第1画像領域a1を設定することにより、第1画像領域a1について、フレームF1,F2間の差分をほぼ0にし、フレームF3,F4間の差分をほぼ0にすることができる。これにより、違和感のない動画を再生することができる。
 したがって、第1フレーム711と第3フレーム730とが混在するフレーム列である第4動画データ740を再生することが可能となる。また、第1動画データ721および第2動画データ722をそれぞれ従来の圧縮伸張部702により伸張することができ、伸張処理の処理負荷の低減を図ることができる。また、30[fps]で再生する場合は、圧縮伸張部702は、第1動画データ721のみ伸張するだけで、合成部703による合成は不要であるため、再生処理の効率化を図ることができる。
 なお、フレームF2では、フレームF1の第1画像領域a1の画像データ(電車を除いた風景)が複製される。したがって、本来フレームF1の第2画像領域a2だった部分(電車の末尾)がフレームF2に複製されない。このため、フレームF2は、何も出力されていない補完画像部分Da1を有する。
 同様に、フレームF4では、フレームF3の第1画像領域a1の画像データ(電車を除いた風景)が複製される。したがって、本来フレームF3の第2画像領域a2だった部分(電車の末尾)がフレームF4に複製されない。このため、フレームF4は、何も出力されていない補完画像部分Da3を有する。
 実施例1では、補完画像部分Da1,Da3については、合成部703は、塗りつぶした特定色のままでもよく、周辺画素を用いて補間処理を実行してもよい。これにより、動画圧縮が可能で、かつ、違和感がより少ないフレームF2,F4,…を再現することができる。
 図11は、図7に示した合成部703における合成処理例2を示す説明図である。合成処理例2では、電子機器500は、たとえば、ドライブレコーダであり、前方を走行する車(先行車)および風景を撮影する。この場合、先行車が追尾対象となる特定被写体であり、風景が自走により変化する。撮影により生成されたフレームFは、時系列順にフレームF6,F7-60,F8,F9-60,F10とする。
 フレームF6,F8,F10は、第1撮像領域が30[fps]の第1フレームレートの撮像で出力された第1画像領域a1の画像データと、第2撮像領域が60[fps]の第2フレームレートの撮像で出力された第2画像領域a2の画像データ712と、を含む第1フレーム711である。フレームF7-60,F9-60は、第2撮像領域が60[fps]の第2フレームレートの撮像で出力された第2画像領域a2の画像データ712である。
 具体的には、たとえば、フレームF6,F8,F10は、第1画像領域a1に先行車が撮像され、第2画像領域a2に変わりゆく風景が撮像された第1フレーム711である。フレームF7-60,F9-60は、第2画像領域a2に風景が撮像されたフレームである。
 すなわち、フレームF6,F7-60,F8,F9-60,F10において、風景が撮像された第2画像領域a2の画像データが、第2撮像領域(60[fps])の撮像で出力された画像データある。また、フレームF6,F8,F10において、先行車が撮像された第1画像領域a1の画像データが、第1撮像領域(30[fps])の撮像で出力された動画データである。第1撮像領域は、第1フレームレート(30[fps])の撮像で出力されるため、第2フレームレート(60[fps])の撮像で出力されるフレームF7-60,F9-60の第1画像領域a1は、圧縮時に第1生成部701により黒塗りにされる。
 合成部703は、フレームF7-60よりも時間的に1つ前のフレームF6の第1画像領域a1の画像データ(風景を除いた先行車)に、フレームF7-60の第2画像領域a2の画像データ(風景)を複製する。これにより、合成部703は、第3フレーム730であるフレームF7を生成する。
 フレームF9も同様に、合成部703は、フレームF9-60よりも時間的に1つ前のフレームF8の第1画像領域a1の画像データ(風景を除いた先行車)に、フレームF9-60の第2画像領域a2の画像データ(風景)を複製する。これにより、合成部703は、第3フレーム730であるフレームF9を生成する。そして、合成部703は、フレームF6~F10を含む第4動画データ740を出力する。
 このようにして、フレームF7-60,F9-60の補完領域712yに、時間的に1つ前の第1フレームレートのフレームF6,F8の第2画像領域a2を設定することにより、第1画像領域a1について、フレームF6,F7間の差分を0にし、フレームF8,F9間の差分を0にすることができる。
 したがって、第1フレーム711と画像データ712とが混在するフレーム列である第4動画データ740を再生することが可能となる。また、第1動画データ721および第2動画データ722をそれぞれ従来の圧縮伸張部702により伸張することができ、伸張処理の処理負荷の低減を図ることができる。また、30[fps]で再生する場合は、圧縮伸張部702は、第1動画データ721のみ伸張するだけで、合成部703による合成は不要であるため、再生処理の効率化を図ることができる。
 <制御部502の構成例>
 図12は、図5に示した制御部502の構成例を示すブロック図である。制御部502は、前処理部1210と、第1生成部701と、取得部1220と、圧縮伸張部702と、特定部1240と、合成部703と、再生部704と、を有する。制御部502は、プロセッサ1201、記憶デバイス1202、集積回路1203、およびこれらを接続するバス1204により構成される。なお、記憶デバイス1202、伸張部1234、特定部1240、合成部703、および再生部704は、電子機器500とアクセス可能な他の装置に実装されていてもよい。
 前処理部1210、第1生成部701、取得部1220、圧縮伸張部702、特定部1240、合成部703、および再生部704は、記憶デバイス1202に記憶されたプログラムをプロセッサ1201に実行させることにより実現してもよく、ASIC(Application Specific Integrated Circuit)やFPGA(Field-Programmable Gate Array)などの集積回路1203により実現してもよい。また、プロセッサ1201は、記憶デバイス1202をワークエリアとして利用してもよい。また、集積回路1203は、記憶デバイス1202を、画像データを含む各種データを一時的に保持するバッファとして利用してもよい。
 なお、少なくとも圧縮伸張部702内の圧縮部1231を含む装置は、動画圧縮装置となる。少なくとも圧縮伸張部702内の第2生成部1232を含む装置は、生成装置となる。また、少なくとも圧縮伸張部702内の伸張部1234を含む装置は、伸張装置となる。また、少なくとも再生部704を含む装置は、再生装置となる。
 前処理部1210は、撮像素子100からの入力動画データ710について動画ファイル800の生成の前処理を実行する。具体的には、たとえば、前処理部1210は、検出部1211と設定部1212とを有する。検出部1211は、上述した周知の被写体検出技術により、特定被写体を検出する。
 設定部1212は、撮像素子100の撮像面200のうち、特定被写体が検出された撮像領域を第1フレームレート(たとえば、30[fps])から第2フレームレート(たとえば、60[fps])に変更する。
 具体的には、たとえば、設定部1212は、入力フレームでの特定被写体が検出された撮像領域と入力済みフレームの特定被写体が検出された撮像領域との差分から特定被写体の動きベクトルを検出して、次の入力フレームでの特定被写体の撮像領域を予測する。設定部1212は、予測した撮像領域について第2フレームレートに変更する。設定部1212は、第1フレームレート(たとえば、30[fps])の画像領域と第2フレームレート(たとえば、60[fps])の画像領域とを示す情報をフレームFに付与する。
 第1生成部701は、特定被写体が撮像された第2フレームレートの画像領域である画像データ712について、第2フレームレートの撮像で出力されかなった欠損領域712xを特定色で補完して、補完領域712yにする。具体的には、たとえば、図10のフレームF2-60、F4-60では、60[fps]の撮像で出力された特定被写体像である第2画像領域a2以外の画像領域(背景に相当)が補完領域712yである。
 また、図11のフレームF7-60、F9-60では、60[fps]で撮像された変わりゆく風景である第2画像領域a2以外の画像領域(先行車に相当)が補完領域712yである。第1生成部701は当該欠損領域712xを特定色に設定し、欠損領域712xを解消する。
 このように、特定色である補完領域712yの画像データは、第2撮像領域からの出力に基づかないデータであり、第2撮像領域からの出力データとは無関係な所定のデータとして構成される。
 取得部1220は、前処理部1210から出力された入力動画データ710、または、第1動画データ721および第2動画データ722を取得して、記憶デバイス1202に保持し、所定のタイミングで複数のフレームを時系列順に1フレームずつ圧縮伸張部702に出力する。具体的には、たとえば、取得部1220は、特定被写体が検出されていない場合は前処理部から入力動画データ710を取得し、特定被写体が検出された場合は、第1動画データ721および第2動画データ722を取得する。
 圧縮伸張部702は、圧縮部1231と第2生成部1232と選択部1233と伸張部1234と格納部1235とを有する。圧縮部1231は、取得部1220からの動画データを圧縮する。具体的には、たとえば、圧縮部1231は、特定被写体が検出されていない動画データを取得した場合、各フレームは、第1画像領域a1であるため、動き検出や動き補償が不要な圧縮処理を実行する。
 また、圧縮部1231は、第1動画データ721および第2動画データ722を取得した場合、第1動画データ721と第2動画データ722とをそれぞれ圧縮する。具体的には、たとえば、圧縮部1231は、第1動画データ721の場合、第1画像領域a1の画像データについては、動き検出や動き補償が不要な圧縮処理を実行し、特定被写体が撮像された第2画像領域a2の画像データについては、上述したハイブリッド符号化によって圧縮する。このように、特定被写体像以外の領域については、動き検出や動き補償が実行されないため、動画圧縮の処理負荷の低減を図る。
 また、圧縮部1231は、第2動画データ722の場合も、補完領域712y(黒塗り)の画像データについては、動き検出や動き補償が不要な圧縮処理を実行し、特定被写体が撮像された第2画像領域a2の画像データについては、上述したハイブリッド符号化によって圧縮する。このように、特定被写体像以外の補完領域712yについては、動き検出や動き補償が実行されないため、動画圧縮の処理負荷の低減を図る。また、補完領域712yが存在するため、第2フレーム713は、第1フレーム711と同様に、通常の動画圧縮処理の適用が可能となる。
 このように、第2フレームレート(60[fps])で得られた第2フレーム713は、第1フレームレート(30[fps])で得られた第1フレーム711と同サイズとなる。したがって、第2フレーム713は、第1フレーム711の圧縮処理と同じ圧縮処理が適用されるため、画像データ712のサイズに適合する他の圧縮処理を適用する必要がない。すなわち、圧縮部1231は、第1フレーム711で適用した圧縮処理を、第2フレーム713にもそのまま適用することができる。このため、画像データ712用の他の圧縮処理を実装する必要がない。
 第2生成部1232は、圧縮部1231で圧縮された動画データ(圧縮データ)を含む動画ファイル800を生成する。具体的には、たとえば、第2生成部1232は、図8に示したようなファイルフォーマットに従って、動画ファイル800を生成する。格納部1235は、生成した動画ファイル800を記憶デバイス1202に格納する。
 なお、圧縮部1231は、たとえば、圧縮データをバッファメモリに格納し、第2生成部1232は、バッファメモリに格納された圧縮データを読み出して、動画ファイル800を生成してもよい。
 選択部1233は、動画ファイル800の再生指示を操作部505から受け付けて、伸張対象となる動画ファイル800を記憶デバイス1202から読み出して、伸張部1234に渡す。伸張部1234は、選択部1233から渡された動画ファイル800を、ファイルフォーマットに従って伸張する。
 すなわち、伸張部1234は、汎用の伸張処理を実行する。具体的には、たとえば、伸張部1234は、入力された圧縮フレームに可変長復号処理、逆量子化、逆変換を実行し、フレーム内予測またはフレーム間予測を適用して、圧縮フレームを元のフレームに伸張する。
 動画ファイル800には、特定被写体が検出されていない動画データを圧縮した動画ファイル800と、第1動画データ721および第2動画データ722を圧縮した動画ファイル800とがある。前者の動画ファイル800は、本例では、30[fps]のフレームレートの撮像で出力された、たとえば、電車が通過していない風景のみの定点撮影された動画データである。したがって、伸張部1234は、選択部1233が当該動画ファイル800の再生指示の選択を受け付けると、当該動画ファイル800をファイルフォーマットに従って伸張する。
 一方、第1動画データ721および第2動画データ722を圧縮した動画ファイル800は、第1動画データ721および第2動画データ722の圧縮動画データを含む。したがって、選択部1233は、第1動画データ721および第2動画データ722を圧縮した動画ファイル800の再生指示の選択を受け付けた場合には、当該再生指示で選択されているフレームレート(たとえば、30[fps],60[fps])を特定する。
 選択フレームレートが30[fps]である場合、選択部1233は、第1動画データ721の圧縮データとして、動画ファイル800のmdat820内のSOM850a~EOM854aの間に存在するチャンク群を伸張部1234に渡す。これにより、伸張部1234は、第1動画データ721の圧縮データを第1動画データ721に伸張することができる。
 選択フレームレートが60[fps]である場合、選択部1233は、第1動画データ721の圧縮データとして、動画ファイル800のmdat820内のSOM850a~EOM854aの間に存在するチャンク群を伸張部1234に渡すとともに、第2動画データ722の圧縮データとして、動画ファイル800のmdat820内のSOM850b~EOM854bの間に存在するチャンク群を伸張部1234に渡す。これにより、伸張部1234は、第1動画データ721の圧縮データを第1動画データ721に伸張し、かつ、第2動画データ722の圧縮データを第2動画データ722に伸張することができる。
 なお、このように、伸張部1234は、伸張対象の圧縮データが2つ存在する場合、第1動画データ721の圧縮データ,第2動画データ722の圧縮データの順(逆でもよい)に伸張してもよく、第1動画データ721の圧縮データ,第2動画データ722の圧縮データを並列に伸張してもよい。
 特定部1240は、伸張部1234で第1動画データ721および第2動画データ722が伸張された場合、第1動画データ721内の第1フレーム711(たとえば、図10のフレームF1)と、第2動画データ722内の第2フレーム713(たとえば、図10のフレームF2-60)と、に基づいて、差分領域を特定する。
 差分領域とは、第1フレーム711における第2撮像領域に対応する第2画像領域a2と、第2フレーム713における第2撮像領域に対応する第2画像領域a2と、の差分を示す領域である。フレームF1とフレームF2-60との差分領域は、フレームF2-60における電車の後方の白点線矩形の領域Da1となる。フレームF3とフレームF4-60との差分領域は、フレームF4-60における電車の後方の白点線矩形の領域Da3となる。
 合成部703は、図7~図11に示したように、第2フレーム713(たとえば、図10のフレームF2-60)に、時間的に1つ前の第1画像領域a1の画像データを含む第1フレーム711(たとえば、図10のフレームF1)を複製して合成し、第3フレーム730(たとえば、図10のフレームF2)を生成する。なお、合成部703は、特定部1240で特定された差分領域(Da1,Da3)に、第1フレーム711において当該差分領域と同一位置における第2画像領域a2の画像データ(電車の末尾部分)を複製してもよい。これにより、時間的に連続する第1フレーム711と第3フレーム730との差分をほぼ0にすることができる。したがって、違和感のない動画を再生することができる。
 なお、特定部1240および合成部703において、フレームF2-60の第1動画データ721への挿入位置は、付加情報835の挿入位置情報920で特定される。たとえば、フレームF1、F3のフレーム番号がそれぞれ#4a,#5a、フレームF2-60のフレーム番号が#2bとすると、挿入フレーム番号921の値#2bの挿入位置922は(#4a,#5a)となる。したがって、フレームF2-60の挿入位置は、フレームF1、F3の間と特定される。
 <圧縮部1231の構成例>
 図13は、圧縮部1231の構成例を示すブロック図である。上述したように、圧縮部1231は、動き補償フレーム間予測(MC)と離散コサイン変換(DCT)とに、エントロピー符号化を組み合わせたハイブリッド符号化によって、取得部1220からの各フレームFを圧縮する。
 圧縮部1231は、減算部1301と、DCT部1302と、量子化部1303と、エントロピー符号化部1304と、符号量制御部1305と、逆量子化部1306と、逆DCT部1307と、生成部1308と、フレームメモリ1309と、動き検出部1310と、動き補償部1311と、圧縮制御部1312と、を有する。減算部1301~動き補償部1311は、既存の圧縮器と同様な構成である。
 具体的には、たとえば、減算部1301は、入力フレームから、当該入力フレームを予測する動き補償部1311からの予測フレームを減算して差分データを出力する。DCT部1302は、減算部1301からの差分データを離散コサイン変換する。
 量子化部1303は、離散コサイン変換された差分データを量子化する。エントロピー符号化部1304は、量子化された差分データをエントロピー符号化し、また、動き検出部1310からの動きベクトルもエントロピー符号化する。
 符号量制御部1305は、量子化部1303による量子化を制御する。逆量子化部1306は、量子化部1303で量子化された差分データを逆量子化して、離散コサイン変換された差分データにする。逆DCT部1307は、逆量子化された差分データを逆離散コサイン変換する。
 生成部1308は、逆離散コサイン変換された差分データと、動き補償部1311からの予測フレームとを加算して、当該入力フレームよりも時間的に後に入力されるフレームが参照する参照フレームを生成する。フレームメモリ1309は、生成部1308から得られた参照フレームを保持する。動き検出部1310は、入力フレームと参照フレームとを用いて、動きベクトルを検出する。動き補償部1311は、参照フレームと動きベクトルとを用いて、予測フレームを生成する。
 動き補償部1311は、具体的には、たとえば、フレームメモリ1309に保持された複数の参照フレームのうち特定の参照フレームと動きベクトルとを用いて、第2フレームレートの撮像で出力されたフレームの動き補償を実行する。参照フレームを特定の参照フレームとすることにより、特定の参照フレーム以外の他の参照フレームをも用いた高負荷の動き補償を抑制することができる。また、特定の参照フレームを、入力フレームの時間的に1つ前のフレームから得られた1枚の参照フレームとすることにより、高負荷な動き補償を回避して、動き補償の処理負荷の低減を図ることができる。
 圧縮制御部1312は、動き検出部1310と動き補償部1311を制御する。具体的には、たとえば、圧縮制御部1312は、動き検出部1310で動きがないことを示す特定の動きベクトルを設定する第1圧縮制御方法と、動き検出自体をスキップする第2圧縮制御方法を実行する。
 第1圧縮制御方法について説明する。第1動画データ721の場合、圧縮制御部1312は、動き検出部1310を制御して、第1フレームレート(たとえば、30[fps])の撮像で出力された第1画像領域a1については、動きベクトルの検出ではなく、動きがないことを示す特定の動きベクトルを設定して、動き補償部1311に出力する。また、圧縮制御部1312は、動き検出部1310を制御して、第2フレームレート(たとえば、60[fps])の撮像で出力された第2画像領域a2については、動きベクトルを検出して、動き補償部1311に出力する。特定の動きベクトルは、方向が規定されず、かつ、動き量が0の動きベクトルである。このように、第1フレームレート(たとえば、30[fps])の撮像で出力された第1画像領域a1については、動きベクトルの検出は行わない。
 この場合、圧縮制御部1312は、動き補償部1311を制御して、第1画像領域a1の画像データについては、特定の動きベクトルと参照フレームとに基づいて動き補償を実行する。圧縮制御部1312は、第2画像領域a2の画像データについては、動き検出部1310によって検出された動きベクトルに基づいて動き補償を実行する。なお、第2動画データ722の場合は、第1フレームレート(たとえば、30[fps])の撮像で出力された第1画像領域a1を特定色で塗りつぶした領域に置き換えればよい。
 第2圧縮制御方法について説明する。第1動画データ721の場合、圧縮制御部1312は、動き検出部1310を制御して、補完領域712yの画像データについては、動きベクトルの検出を実行しない。また、圧縮制御部1312は、動き検出部1310を制御して、第2フレームレート(たとえば、60[fps])の撮像で出力された第2画像領域a2については、動きベクトルの検出を実行する。
 この場合、圧縮制御部1312は、動き補償部1311を制御して、第1画像領域a1の画像データについては、参照フレームに基づいて動き補償を実行する。すなわち、動きベクトルがないため、圧縮制御部1312は、動き補償部1311を制御して、補完領域712yの画像データについては、参照フレームを、入力フレームの時間的に1つ後のフレームを予測する予測フレームに決定する。
 また、圧縮制御部1312は、動き補償部1311を制御して、第2画像領域a2の画像データについては、参照フレームと動き検出部1310によって検出された動きベクトルに基づいて動き補償を実行する。なお、第2動画データ722の場合は、第1フレームレート(たとえば、30[fps])の撮像で出力された第1画像領域a1を補完領域712yに置き換えればよい。
 第1圧縮制御方法によれば、動きベクトルが特定の動きベクトルであるため、第1画像領域a1および補完領域712yでの動き検出が簡略化される。したがって、動画圧縮の処理負荷の低減を図る。また、第2圧縮制御方法によれば、第1画像領域a1および補完領域712yについて動き検出自体が実行されないため、第1圧縮制御方法よりも、動画圧縮の処理負荷の低減を図る。
 <制御部502の動作処理手順例>
 図14は、制御部502の動作処理手順例を示すシーケンス図である。図14では、説明の便宜上、取得部1220を省略する。前処理部1210は、たとえば、ユーザが操作部505を操作することにより、または、ステップS1412の特定被写体の非検出の場合(ステップS1412:Yes)は自動で、撮像素子100の撮像面200全域の撮像条件を第1フレームレート(たとえば、30[fps])に設定する(ステップS1401)。
 これにより、撮像素子100では、撮像面200全域の撮像条件が第1フレームレートに設定され(ステップS1402)、撮像素子100は、被写体を第1フレームレートで撮像して、入力動画データ710を前処理部1210に出力する(ステップS1403)。
 前処理部1210は、入力動画データ710が入力されると(ステップS1403)、設定処理を実行する(ステップS1404)。設定処理(ステップS1404)は、入力動画データ710の各フレームに、フレームレートを設定する。たとえば、第1フレームレート(たとえば、30[fps])が付加された画像領域は、第1画像領域a1として認識され、第2フレームレート(たとえば、60[fps])が付加された画像領域は、第2画像領域a2として認識される。
 また、前処理部1210は、入力動画データ710を第1生成部701に出力する(ステップS1405)。また、前処理部1210は、設定処理(ステップS1404)で次の入力フレームの第2フレームレートの画像領域が検出されなかった場合(ステップS1406:No)、ステップS1403の入力動画データ710の入力を待ち受ける。一方、前処理部1210は、設定処理(ステップS1404)で次の入力フレームの第2フレームレートの画像領域が検出された場合(ステップS1406:Yes)、特定被写体を含む第2画像領域a2を第2フレームレート(たとえば、60[fps])に設定変更する(ステップS1407)。
 そして、ステップS1407の設定変更内容にしたがって撮像面200全域のうち第2撮像領域の撮像条件が第2フレームレートに設定される(ステップS1408)。これにより、撮像素子100は、撮像素子100は、被写体を第1撮像領域では第1フレームレートで撮像し、第2撮像領域では第2フレームレートで撮像して、入力動画データ710を前処理部1210に出力する(ステップS1409)。
 前処理部1210は、入力動画データ710が入力されると(ステップS1409)、設定処理を実行する(ステップS1410)。設定処理(ステップS1410)は、設定処理(ステップS1404)と同一処理である。設定処理(ステップS1410)の詳細については、図15で後述する。前処理部1210は、入力動画データ710を第1生成部701に出力する(ステップS1411)。
 前処理部1210は、特定被写体が非検出になった場合(ステップS1412:Yes)、ステップS1401に戻り、撮像面200全域を第1フレームレートに設定変更する(ステップS1401)。一方、特定被写体が検出され続けている場合(ステップS1412:No)、ステップS1407に戻り、特定被写体の検出位置に応じた第2画像領域a2を第2フレームレートに変更する(ステップS1407)。なお、この場合、特定被写体が検出されなくなった画像領域については、前処理部1210は、第1フレームレートに設定変更する。
 また、第1生成部701は、入力動画データ710が入力されると(ステップS1405)、補完処理を実行する(ステップS1413)。なお、補完処理(ステップS1413)では、第1生成部701は、各フレームのフレームレートを参照して、入力動画データ710の各フレームは、第1フレーム711のみであると特定する。
 したがって、特定被写体が撮像されていないため画像データ712が存在しない。したがって、第1生成部701は、画像データ712を補完しない。補完処理(ステップS1413)の詳細については、図18で後述する。第1生成部701は、入力動画データ710を圧縮部1231に出力する(ステップS1414)。
 また、第1生成部701は、入力動画データ710が入力されると(ステップS1411)、補完処理を実行する(ステップS1415)。なお、補完処理(ステップS1415)では、第1生成部701は、各フレームのフレームレートを参照して、入力動画データ710の各フレームは、第1フレーム711および画像データ712を含むと判断する。
 したがって、第1フレーム711および画像データ712に特定被写体が撮像されているため、第1生成部701は、第2フレーム713を生成する。補完処理(ステップS1415)の詳細については、図18で後述する。第1生成部701は、第1フレーム711および第2フレーム713を圧縮部1231に出力する(ステップS1416)。
 圧縮部1231および第2生成部1232は、入力動画データ710が入力されると(ステップS1414)、入力動画データ710の動画ファイル生成処理を実行する(ステップS1417)。入力動画データ710は、第1フレーム711のみで構成されるため、圧縮部1231は、圧縮処理(ステップS1417)において、動き検出や動き補償が不要な圧縮符号化を実行する。動画ファイル生成処理(ステップS1417)の詳細については、図18~図24で後述する。
 また、圧縮部1231および第2生成部1232は、第1動画データ721および第2動画データ722が入力されると(ステップS1416)、第1動画データ721および第2動画データ722の動画ファイル生成処理を実行する(ステップS1418)。第1動画データ721は、第1フレーム711で構成され、第2動画データ722は、第2フレーム713で構成される。
 圧縮部1231は、動画ファイル生成処理(ステップS1418)において、圧縮対象が第1動画データ721である場合、第1画像領域a1の画像データについては、動き検出や動き補償が不要な圧縮処理を実行し、特定被写体が撮像された第2画像領域a2の画像データについては、上述したハイブリッド符号化によって圧縮する。このように、特定被写体像以外の領域については、動き検出や動き補償が実行されないため、動画圧縮の処理負荷の低減を図る。
 また、圧縮部1231は、圧縮対象が第2動画データ722である場合も、補完領域712y(黒塗り)の画像データについては、動き検出や動き補償が不要な圧縮処理を実行し、特定被写体が撮像された第2画像領域a2の画像データについては、上述したハイブリッド符号化によって圧縮する。このように、特定被写体像以外の領域については、動き検出や動き補償が実行されないため、動画圧縮の処理負荷の低減を図る。動画ファイル生成処理(ステップS1418)の詳細については、図18~図24で後述する。
 <設定処理(ステップS1404、S1410)>
 図15は、図14に示した設定処理(ステップS1404、S1410)の詳細な処理手順例を示すフローチャートである。図15では、撮像素子100には、あらかじめ第1フレームレート(例:30[[fps])が設定されており、検出部1211の被写体検出技術により第2フレームレート(例:60[[fps])の画像領域を追尾して、撮像素子100にフィードバックする。なお、第1フレームレートおよび第2フレームレートの画像領域は、常時固定でもよい。
 前処理部1210は、入力動画データ710を構成するフレームの入力を待ち受け(ステップS1501)、フレームが入力された場合(ステップS1501:Yes)、検出部1211により主要被写体などの特定被写体が検出されたか否かを判断する(ステップS1502)。特定被写体が検出されていない場合(ステップS1502:No)、ステップS1504に移行する。
 一方、特定被写体が検出された場合(ステップS1502:Yes)、前処理部1210は、検出部1211により、時間的に1つ前のフレーム(たとえば、参照フレーム)と入力フレームとを比較して動きベクトルを検出し、次の入力フレームでの第2フレームレートの画像領域を予測し、撮像素子100に出力し、ステップS1504に移行する(ステップS1503)。これにより、撮像素子100は、予測された画像領域に対応する撮像領域を構成するブロック202の撮像条件を第2フレームレートに設定し、残余のブロック202の撮像条件を第1フレームレートに設定して、被写体を撮像することができる。
 そして、前処理部1210は、入力フレームについてフレームレート設定処理を実行し(ステップS1504)、ステップS1501に戻る。フレームレート設定処理(ステップS1505)は、上述したフレームレートをフレームFに設定する処理であり、図16で詳細に説明する。
 フレームFの入力がない場合(ステップS1501:No)、入力動画データ710の入力が終了しているため、前処理部1210は、設定処理(ステップS1404、S1410)を終了する。
 <フレームレート設定処理(ステップS1504)>
 図16は、図15に示したフレームレート設定処理(ステップS1504)の詳細な処理手順例を示すフローチャートである。前処理部1210は、フレームが入力されると(ステップS1601)、入力フレームに未選択画像領域があるか否かを判断する(ステップS1602)。未選択画像領域がある場合(ステップS1602:Yes)、前処理部1210は、未選択画像領域を1つ選択し(ステップS1603)、特定被写体の検出フラグがONであるか否かを判断する(ステップS1604)。検出フラグは、特定被写体の検出の有無を示す情報であり、デフォルトはOFF(非検出)である。
 図14のステップS1406で特定被写体が検出された場合(ステップS1406:Yes)、前処理部1210は、検出フラグをOFFからON(検出中)に変更する。ステップS1412で特定被写体が非検出となった場合(ステップS1412:Yes)、前処理部1210は、検出フラグをONからOFFに変更する。
 検出フラグがOFFである場合(ステップS1604:No)、選択画像領域について第1フレームレートを示す情報を入力フレームに設定し(ステップS1605)、ステップS1602に戻る。一方、検出フラグがONである場合(ステップS1604:Yes)、前処理部1210は、選択画像領域は、特定被写体像が存在する画像領域であるか否かを判断する(ステップS1606)。
 特定被写体像が存在しない場合(ステップS1606:No)、ステップS1602に戻る。一方、特定被写体像が存在する場合(ステップS1606:Yes)、前処理部1210は、選択画像領域について第2フレームレートを示す情報を入力フレームに設定し(ステップS1607)、ステップS1602に戻る。
 ステップS1602において、未選択画像領域がない場合(ステップS1602:No)、前処理部1210は、フレームレート設定処理を終了する。このあと、前処理部1210は、フレームレートを撮像素子100に設定する(ステップS1401、S1407)。
 各フレームの画像領域ごとに、フレームレートを示す情報を設定することにより、前処理部1210は、どの画像領域に対応する撮像素子100の撮像領域をどのフレームレートに設定すればよいかを特定することができる。また、第1生成部701および圧縮部1231は、入力されたフレームFの各画像領域のフレームレートを特定することができる。
 <補完処理(ステップS1413,S1415)>
 図17は、第1生成部701による補完処理手順例を示すフローチャートである。第1生成部701は、フレームFの入力を受け付けると(ステップS1701)、入力フレームのフレームレートを参照する(ステップS1702)。第2フレームレート(60[fps])のみでない場合(ステップS1703:No)、第1生成部701は、補完処理を実行せずに終了する。第2フレームレート(60[fps])のみである場合(ステップS1703:Yes)、入力フレームは画像データ712であるため、第1生成部701は、補完処理を実行して、入力フレームを第2フレーム713にする(ステップS1704)。これにより、図10に示したフレームF2-60、フレームF4-60、図11に示したフレームF7-60、フレームF9-60を生成することができる。
 <動画ファイル生成処理(ステップS1417、S1418)>
 図18は、図14に示した動画ファイル生成処理(ステップS1417、S1418)の詳細な処理手順例を示すフローチャートである。圧縮部1231は、第1フレーム711からなる第1動画データ721の圧縮と、第2フレーム713からなる第2動画データ722の圧縮と、を別々に行うことになる。圧縮部1231は、フレームFの入力を受け付けると(ステップS1801)、入力フレームについて圧縮符号化を実行する(ステップS1802)。圧縮符号化の詳細な制御内容については、図19~図24を用いて後述する。
 このあと、第2生成部1232は、圧縮符号化したデータから、図8に示したuuid831,udta832,mvhd833,trak834などのメタデータを生成する(ステップS1803)。なお、第2生成部1232は、圧縮前の情報が必要なメタデータについては、ステップS1803を、圧縮符号化(ステップS1802)の前に実行してもよい。
 第2生成部1232は、フレームFに付与されたフレームレートを示す情報を参照して、撮像条件情報910を生成し(ステップS1804)、チャンクの位置情報(stsz847およびstco848)を参照し、第2フレーム713の挿入先を特定して、挿入位置情報を生成する(ステップS1805)。ステップS1804、S1805により付加情報835が生成される。そして、第2生成部1232は、ヘッダ部801とデータ部802とを合わせて動画ファイル800を生成し(ステップS1806)、記憶デバイス1202に格納する(ステップS1807)。
 <圧縮処理例:第1圧縮制御方法>
 つぎに、図18に示した圧縮部1231による圧縮符号化(ステップS1802)を第1圧縮制御方法と第2圧縮制御方法に分けて説明する。
 図19は、圧縮制御部1312による第1圧縮制御方法の圧縮制御処理手順例を示すフローチャートである。圧縮制御部1312は、入力フレーム(第1フレーム711または第2フレーム713)を取得し(ステップS1901)、取得した入力フレームから未選択画像領域を選択する(ステップS1902)。そして、圧縮制御部1312は、選択画像領域のフレームレートを入力フレームから参照する(ステップS1903)。
 なお、入力フレームが第1フレーム711である場合、選択画像領域は、第1フレームレートの撮像で出力された第1画像領域a1または第2フレームレートの撮像で出力された第2画像領域a2となる。また、入力フレームが第2フレーム713である場合、選択画像領域は、第1フレームレートの撮像で出力された第1画像領域a1に対応する補完領域712yまたは第2フレームレートの撮像で出力された第2画像領域a2となる。
 選択画像領域のフレームレートが第2フレームレートである場合(ステップS1903:第2FR)、圧縮制御部1312は、選択画像領域の画像データを動き検出部1310に出力する(ステップS1904)。これにより、動き検出部1310は、第2フレームレートの選択画像領域については、通常通り、参照フレームを用いて動きベクトルを検出する。
 一方、選択画像領域のフレームレートが第1フレームレートである場合(ステップS1903:第1FR)、圧縮制御部1312は、第1フレームレートの選択画像領域にスキップフラグを設定して、動き検出部1310に出力する(ステップS1905)。これにより、動き検出部1310は、第1フレームレートの選択画像領域については、動きがないことを示す特定の動きベクトルを設定することになる。
 ステップS1904またはS1905のあと、圧縮制御部1312は、取得した入力フレームに未選択画像領域があるか否かを判断する(ステップS1906)。未選択画像領域がある場合(ステップS1906:Yes)、ステップS1902に戻る。一方、未選択画像領域がない場合(ステップS1906:No)、圧縮制御部1312は、一連の処理を終了する。
 図20は、動き検出部1310による第1圧縮制御方法の動き検出処理手順例を示すフローチャートである。動き検出部1310は、入力フレームよりも時間的に1つ前の参照フレームをフレームメモリ1309から取得し(ステップS2001)、図19のステップS1904またはS1905で出力された選択画像領域の入力を待ち受ける(ステップS2002:No)。
 選択画像領域が入力された場合(ステップS2002:Yes)、動き検出部1310は、選択画像領域と同一箇所の画像領域の画像データを参照フレームから取得する(ステップS2003)。そして、動き検出部1310は、選択画像領域にスキップフラグがあるか否かを判断する(ステップS2004)。スキップフラグがない場合(ステップS2004:No)、選択画像領域のフレームレートが第2フレームレートである。したがって、動き検出部1310は、選択画像領域の画像データと、ステップS2003で取得した参照フレームの画像領域の画像データとを用いて、動きベクトルを検出する(ステップS2005)。
 一方、スキップフラグがある場合(ステップS2004:Yes)、動き検出部1310は、動きがないことを示す特定の動きベクトルを設定する(ステップS2006)。これにより、動き検出部1310での動き検出処理は、常に、動きがないことを示す特定の動きベクトルを用いるため、第1フレームレートの選択画像領域について、動き検出の処理負荷が低減される。そして、動き検出部1310は、ステップS2005またはS2006で得られた動きベクトルを動き補償部1311に出力して(ステップS2007)、一連の処理を終了する。
 図21は、動き補償部1311による第1圧縮制御方法の動き補償処理手順例を示すフローチャートである。動き補償部1311は、フレームメモリ1309から参照フレームを取得する(ステップS2101)。動き補償部1311は、選択画像領域と同一箇所の画像領域を参照フレームから取得する(ステップS2102)。
 そして、動き補償部1311は、動き検出部1310からの選択画像領域についての動きベクトルと、ステップS2102で取得された参照フレームの画像領域とを用いて、動き補償を実行する(ステップS2103)。これにより、動き補償部1311は、選択画像領域における予測画像データを生成することができる。
 そして、動き補償部1311は、全選択画像領域の動き補償が終了したか否かを判断する(ステップS2104)。具体的には、たとえば、圧縮制御部1312がステップS1906で未選択画像領域があると判断した場合に(ステップS1906:Yes)、動き補償部1311は、全選択画像領域の動き補償が終了していないと判断し(ステップS2104:No)、ステップS2102に戻る。
 一方、圧縮制御部1312がステップS1906で未選択画像領域がないと判断した場合に(ステップS1906:No)、動き補償部1311は、全選択画像領域の動き補償が終了したと判断する(ステップS2104:Yes)。そして、動き補償部1311は、全選択画像領域についての予測画像データを結合した予測フレームを減算部1301および生成部1308に出力して(ステップS2105)、一連の処理を終了する。
 <圧縮処理例:第2圧縮制御方法>
 図22は、圧縮制御部1312による第2圧縮制御方法の圧縮制御処理手順例を示すフローチャートである。圧縮制御部1312は、入力フレームを取得し(ステップS2201)、取得した入力フレームから未選択画像領域を選択する(ステップS2202)。そして、圧縮制御部1312は、選択画像領域のフレームレートを入力フレームから参照する(ステップS2203)。
 選択画像領域のフレームレートが第2フレームレートである場合(ステップS2203:第2FR)、圧縮制御部1312は、選択画像領域を動き検出部1310に出力する(ステップS2204)。これにより、動き検出部1310は、第2フレームレートの選択画像領域については、通常通り、参照フレームを用いて動きベクトルを検出する。
 一方、選択画像領域のフレームレートが第1フレームレートである場合(ステップS2203:第1FR)、圧縮制御部1312は、第1フレームレートの選択画像領域にスキップフラグを設定して、動き検出部1310に出力する(ステップS2205)。これにより、動き検出部1310は、第1フレームレートの選択画像領域については、動き検出を実行しないことになる。そして、圧縮制御部1312は、選択画像領域の動き補償停止指示を発行して、動き補償部1311に出力する(ステップS2206)。これにより、当該選択画像領域について動き補償の実行を停止することができる。
 ステップS2204またはS2206のあと、圧縮制御部1312は、取得した入力フレームに未選択画像領域があるか否かを判断する(ステップS2207)。未選択画像領域がある場合(ステップS2207:Yes)、ステップS2202に戻る。一方、未選択画像領域がない場合(ステップS2207:No)、圧縮制御部1312は、一連の処理を終了する。
 図23は、動き検出部1310による第2圧縮制御方法の動き検出処理手順例を示すフローチャートである。動き検出部1310は、入力フレームFよりも時間的に1つ前の参照フレームをフレームメモリ1309から取得し(ステップS2301)、図22のステップS2204またはS2205で出力された選択画像領域の入力を待ち受ける(ステップS2302:No)。
 選択画像領域が入力された場合(ステップS2302:Yes)、動き検出部1310は、選択画像領域と同一箇所の画像領域の画像データを参照フレームから取得する(ステップS2303)。そして、動き検出部1310は、選択画像領域にスキップフラグがあるか否かを判断する(ステップS2304)。スキップフラグがない場合(ステップS2304:No)、選択画像領域のフレームレートが第2フレームレートである。したがって、動き検出部1310は、選択画像領域の画像データと、ステップS2003で取得した参照フレームの画像領域の画像データとを用いて、動きベクトルを検出する(ステップS2305)。
 そして、動き検出部1310は、ステップS2305で得られた動きベクトルを動き補償部1311に出力して(ステップS2306)、一連の処理を終了する。一方、スキップフラグがある場合(ステップS2304:Yes)、動き検出部1310は、動き検出を実行せずに、一連の処理を終了する。
 図24は、動き補償部1311による第2圧縮制御方法の動き補償処理手順例を示すフローチャートである。動き補償部1311は、フレームメモリ1309から参照フレームを取得する(ステップS2401)。動き補償部1311は、選択画像領域と同一箇所の画像領域を参照フレームから取得する(ステップS2402)。
 そして、動き補償部1311は、選択画像領域についての動き補償のトリガ入力が動きベクトルか動き補償停止指示のいずれかであるかを判断する(ステップS2403)。トリガ入力が動きベクトルである場合(ステップS2403:動きベクトル)、動き補償部1311は、動き検出部1310からの選択画像領域についての動きベクトルと、ステップS2402で取得された参照フレームの画像領域とを用いて、動き補償を実行する(ステップS2404)。これにより、動き補償部1311は、選択画像領域における予測画像データを生成することができる。
 一方、トリガ入力が動き補償停止指示である場合(ステップS2403:動き補償停止指示)、動き補償部1311は、取得画像領域の画像データを予測画像領域の画像データ(予測画像データ)に決定する(ステップS2405)。
 そして、動き補償部1311は、ステップS2404またはS2405のあと、全選択画像領域の動き補償が終了したか否かを判断する(ステップS2406)。具体的には、たとえば、圧縮制御部1312がステップS2207で未選択画像領域があると判断した場合に(ステップS2007:Yes)、動き補償部1311は、全選択画像領域の動き補償が終了していないと判断し(ステップS2406:No)、ステップS2402に戻る。
 一方、圧縮制御部1312がステップS2207で未選択画像領域がないと判断した場合に(ステップS2207:No)、動き補償部1311は、全選択画像領域の動き補償が終了したと判断する(ステップS2406:Yes)。そして、動き補償部1311は、全選択画像領域についての予測画像データを結合した予測フレームを減算部1301および生成部1308に出力して(ステップS2407)、一連の処理を終了する。
 <伸張から再生までの処理>
 図25は、伸張から再生までの処理手順例を示すフローチャートである。選択部1233は、操作部505から再生指示の選択を待ち受け(ステップS2501:No)、再生指示の選択があった場合(ステップS2501:Yes)、選択部1233は、再生対象となる動画ファイル800のフレームレートが選択可能か否かを判断する(ステップS2502)。選択可能でない場合(ステップS2502:No)、動画ファイル800は、第1フレームレート(30[fps])のみのフレーム群を圧縮した動画ファイル800である。この場合、伸張部1234は、当該動画ファイル800を伸張し(ステップS2504)、ステップS2508に移行する。
 一方、ステップS2502で選択可能である場合(ステップS2502:Yes)、選択部1233は、選択されたフレームレートが第1フレームレート(30[fps])であるか否かを判断する(ステップS2503)。第1フレームレート(30[fps])が選択された場合(ステップS2503:Yes)、再生対象となる動画ファイル800は、第1動画データ721を圧縮した動画ファイル800である。したがって、伸張部1234は、当該動画ファイル800を伸張して(ステップS2504)、ステップS2508に移行する。
 一方、第2フレームレート(60[fps])が選択された場合(ステップS2503:No)、再生対象となる動画ファイル800は、第1動画データ721および第2動画データ722を圧縮した動画ファイル800である。したがって、伸張部1234は、当該動画ファイル800を伸張して、第1動画データ721および第2動画データ722を出力する(ステップS2505)。
 そして、特定部1240は、ステップS2505で伸張された第1動画データ721および第2動画データ722を参照して、差分領域を特定する(ステップS2506)。このあと、合成部703は、図10、図11に示したように、第1動画データ721および第2動画データ722の合成処理を実行する(ステップS2507)。合成処理(ステップS2507)の詳細については、図26で後述する。最後に、再生部704は、合成処理(ステップS2507)またはステップS2504で得られた動画データを液晶モニタに再生する(ステップS2508)。
 <合成処理(ステップS2507)>
 図26は、図25に示した合成処理(ステップS2507)の詳細な処理手順例を示すフローチャートである。合成部703は、挿入位置情報920に従い、フレームFの出力順を設定する(ステップS2601)。つぎに、合成部703は、再生部704へ未出力の残存フレームがあるか否かを判断する(ステップS2602)。残存フレームがある場合(ステップS2602:Yes)、合成部703は、出力順でフレームを取得する(ステップS2603)。
 合成部703は、たとえば、uuid831に書き込まれたフレーム種別識別情報を参照して、取得フレームが第2フレーム713であるか否かを判断する(ステップS2604)。第2フレーム713でない場合(ステップS2604:No)、取得フレームは第1フレーム711であるため、合成部703は、取得フレームを再生対象として再生部704に出力し、バッファに書き込む(ステップS2605)。そして、ステップS2602に戻る。
 一方、ステップS2604において、取得フレームが第2フレーム713である場合(ステップS2604:Yes)、合成部703は、バッファ内のフレームと、取得フレームとを合成して、第3フレーム730を生成し、再生対象として再生部704に出力する(ステップS2606)。そして、ステップS2602に戻る。ステップS2602において、残存フレームがない場合(ステップS2602:No)、合成部703は、合成処理(ステップS2507)を終了する。
 これにより、合成部703は、図10、図11に示したように、第2フレーム713と、時間的に1つ前の第1フレーム711と、を用いて、第1画像領域a1および第2画像領域a2を含む第3フレーム730に合成することができる。したがって、1フレーム内のフレームレートの相違を吸収することができる。
 (1-1)このように、動画圧縮装置は、第1撮像領域から出力されたデータに基づいて複数の第1フレームを生成し、第2撮像領域から出力されたデータに基づいて複数の第2フレームを生成し、複数の第1フレーム711を圧縮するとともに、複数の第2フレーム713を圧縮する。これにより、画像領域毎にフレームレートが異なる動画データを圧縮する際に、当該動画データを別々に圧縮することができる。
 (1-2)また、上記(1-1)において、動画圧縮装置は、第1撮像領域から出力されたデータと、第2撮像領域から出力されたデータと、に基づいて、第1フレーム711を生成する。これにより、複数の撮像領域からの出力により欠損のないフレームを生成することができる。
 (1-3)また、上記(1-1)において、動画圧縮装置は、第2撮像領域から出力されたデータと、撮像素子100からの出力に基づかないデータと、に基づいて、第2フレーム713を生成する。これにより、撮像素子100からの出力に基づかないデータとは、第1撮像領域からのデータではなく、たとえば、欠損領域712xについて画像処理で得られたデータである。したがって、第2フレーム713を第1フレーム711と同じように圧縮することができる。
 (1-4)また、上記(1-3)において、動画圧縮装置は、第2撮像領域から出力されたデータと、所定のデータと、に基づいて、第2フレーム713を生成する。所定のデータとは、たとえば、欠損領域712xについて画像処理で得られたデータである。したがって、第2フレーム713を第1フレーム711と同じように圧縮することができる。
 (1-5)また、上記(1-4)において、動画圧縮装置は、第2撮像領域から出力されたデータに対して、第1撮像領域からデータが出力されなかった領域(欠損領域712x)を補完することにより、第2フレーム713を生成する。これにより、欠損領域712xを補って第2フレーム713を第1フレーム711と同じように圧縮することができる。
 (1-6)また、上記(1-5)において、動画圧縮装置は、第2撮像領域から出力されたデータに対して、第1撮像領域からデータが出力されなかった領域を特定色で補完することにより、第2フレーム713を生成する。これにより、圧縮効率の向上を図ることができる。
 (1-7)また、上記(1-3)~(1-6)において、動画圧縮装置は、記第2フレームのうちの、前記第2撮像領域から出力されたデータに基づいて生成された領域の画像データについては動きベクトルを検出する。これにより、たとえば、第1画像領域a1および補完領域712yの画像データについては動きベクトルの検出に替えて特定の動きベクトルを設定することにより、動き検出が実行されないこととなり、圧縮処理の負荷低減を図ることができる。
 (1-8)また、上記(1-7)において、動画圧縮装置は、前記第2撮像領域から出力されたデータに基づいて生成された領域以外の領域の画像データについては動きベクトルを検出しない。これにより、たとえば、第1画像領域a1および補完領域712yの画像データについて動き検出を実行しないことにより、圧縮処理の負荷低減を図ることができる。
 (1-9)また、上記(1-7)または(1-8)において、動画圧縮装置は、動きベクトル検出結果に基づいて動き補償を実行する。これにより、圧縮処理の負荷低減を図ることができる。
 このように、上述した動画圧縮装置によれば、第1フレーム711からなる第1動画データ721と、補完後第2フレーム713からなる第2動画データ722と、を別々に圧縮することができる。すなわち、異なるフレームレートが混在する入力動画データ710をフレームレートの撮像タイミングで区分けして圧縮することができる。
 したがって、伸張や再生をしたい場合、伸張や再生の対象として、第1動画データ721や、第1動画データ721および第2動画データ722の両方といった選択が可能となる。たとえば、第1フレーム711の撮像タイミングである30[fps]で再生したい場合は、第1動画データ721のみ伸張して再生すればよい。
 これにより、第2動画データ722の伸張処理が不要となり、再生対象の伸張処理の高速化および省電力化を図ることができる。また、たとえば、画像データ712の撮像タイミングである60[fps]で再生したい場合には、第1動画データ721および第2動画データ722の両方を伸張して合成すればよい。これにより、必要に応じて被写体動画の再現性が高まり、よりリアルな映像として再生することができる。
 (2-1)また、生成装置は、第1フレームレート(たとえば、30[fps])が設定された第1撮像領域から出力されたデータに基づいて生成された複数の第1フレーム711を圧縮した第1圧縮データと、第1フレームレートよりも速い第2フレームレート(たとえば、60[fps])が設定された第2撮像領域から出力されたデータに基づいて生成された複数の第2フレーム713を圧縮した第2圧縮データと、第1圧縮データの格納位置を示す第1位置情報と、前記第2圧縮データの格納位置を示す第2位置情報と、を含む動画ファイル800を生成する生成部(第2生成部1232)と、生成部によって生成された動画ファイル800を記憶デバイス1202に格納する格納部1235と、を有する。
 これにより、撮像タイミングが異なる第1フレーム711および第2フレーム713の各圧縮動画データを共通の圧縮方法で圧縮することにより、1つの動画ファイル800にまとめることができる。
 (2-2)また、上記(2-1)の生成装置では、第1フレーム711は、第1撮像領域から出力されたデータと、第2撮像領域から出力されたデータと、に基づいて生成されたフレームとしてもよい。
 これにより、第1フレームレートの撮像タイミングで撮像された第1フレーム711の圧縮データと、第2フレームレートの撮像タイミングで撮像された第2フレーム713の圧縮データとを、共通の圧縮方法で圧縮することにより、1つの動画ファイル800にまとめることができる。
 (2-3)また、上記(2-1)の生成装置では、第2フレーム713は、第2撮像領域から出力されたデータと、撮像素子100からの出力に基づかないデータと、に基づいて生成されたフレームとしてもよい。
 これにより、第2フレームレートの撮像タイミングで出力されていない画像領域(欠損領域712x)が存在しても、第2撮像領域から出力されたデータを第2フレーム713として扱うことで、第1フレーム711と共通の圧縮方法で圧縮することができる。
 (2-4)また、上記(2-3)の生成装置では、撮像素子100からの出力に基づかないデータは、所定のデータとしてもよい。これにより、撮像素子100からの出力とは無関係なデータにより、第2フレーム713を構成することができ、第1フレーム711と共通の圧縮方法で圧縮することができる。
 (2-5)また、上記(2-4)の生成装置では、第2フレーム713は、第2撮像領域から出力されたデータに対して、第1撮像領域からデータが出力されなかった欠損領域712xを補完することにより生成されたフレームとしてもよい。これにより、第2フレーム713は、第2フレームレートの撮像タイミングで出力されていない欠損領域712xが補完されて補完領域712yに設定されているため、第1フレーム711と共通の圧縮方法で圧縮することができる。
 (2-6)また、上記(2-1)の生成装置では、生成部は、第1圧縮データおよび第2圧縮データをデータ部802に設定し、第1位置情報および第2位置情報をヘッダ部801に設定することにより、データ部802およびヘッダ部801を含む動画ファイル800を生成する。これにより、データ部802の圧縮データをヘッダ部801を参照して読みだすことができる。
 (2-7)また、上記(2-5)の生成装置では、生成部は、ヘッダ部801に、第1フレームレートを示す第1フレームレート情報(911の「30[fps]」)を、第1位置情報(912のPa)に関連付けて設定し、第2フレームレートを示す第2フレームレート情報(911の「60[fps]」)を、第1位置情報(912のPa)および前記第2位置情報(912のPb)に関連付けて設定することにより、ヘッダ部801およびデータ部802を含む動画ファイル800を生成する。
 これにより、第1フレームレート情報に関連付けられた第1位置情報で特定される第1動画データ721の圧縮データを読み出したり、第1フレームレート情報に関連付けられた第1位置情報で特定される第1動画データ721を圧縮した第1圧縮動画データと、第2フレームレート情報に関連付けられた第2位置情報で特定される第2動画データ722を圧縮した第2圧縮動画データと、を読み出すことができる。
 これにより、第1フレームレートが選択された場合に、動画ファイル800から確実に第1動画データ721を圧縮した第1圧縮動画データを呼び出すことができる。また、第2フレームレートが選択された場合に、動画ファイル800から確実に第2動画データ722を圧縮した第2圧縮動画データを呼び出すことができる。さらに、第1フレームレートが選択された場合に、動画ファイル800からの第1圧縮動画データの呼び出し漏れを抑制することができる。
 (2-8)また、上記(2-7)の生成装置では、第2生成部1232は、ヘッダ部801に、第2フレーム713が挿入される第1フレーム711内の挿入先を示す情報(挿入位置情報920)を設定することにより、ヘッダ部801およびデータ部802を含む動画ファイル800を生成する。
 これにより、第1動画データ721および第2動画データ722の合成の高精度化を図ることができ、被写体動画の再現性が高まり、よりリアルな映像として再生することができる。
 (2-9)また、上記(2-3)の生成装置では、生成部は、第1動画データ721および第2動画データ722ごとに動画ファイル800を生成して、両動画ファイル800を関連付けてもよい。これにより、第1動画データ721の動画ファイル800単体で流通させることができる。また、第2フレームレートで再生したい場合は、別途第2動画データ722の動画ファイル800を取得すればよい。
 このように、第1動画データ721と第2動画データ722とを別々の動画ファイル800とすることで、条件に応じた動画ファイル800の流通(たとえば、ダウンロード)を図ることができる。たとえば、動画配信サービスに無課金のユーザの端末は、第1動画データ721の動画ファイル800のみダウンロード可能であり、課金したユーザの端末は、両動画ファイル800がダウンロード可能となる。
 (3-1)また、再生装置は、第1フレームレートが設定された第1撮像領域から出力されたデータに基づいて生成された複数の第1フレーム711を圧縮した第1圧縮データと、第1フレームレートよりも速い第2フレームレートが設定された第2撮像領域から出力されたデータに基づいて生成された複数の第2フレーム713を圧縮した第2圧縮データと、を含む動画ファイルを読み込んで、第1圧縮データおよび第2圧縮データのうちの少なくとも第1圧縮データを伸張する伸張部1234と、伸張部1234によって伸張された複数のフレームを再生する再生部704と、を有する。
 したがって、再生の対象として、第1動画データ721や、第1動画データ721およびの両方といった選択が可能となる。たとえば、第1フレーム711の撮像タイミングである30[fps]で再生したい場合は、複数の第1フレーム711のみ再生すればよい。
 これにより、複数の第2フレーム713の無駄な再生処理が不要となり、省電力化を図ることができる。また、たとえば、画像データ712の撮像タイミングである60[fps]で再生したい場合には、第1動画データ721および第2動画データ722の両方を再生すればよい。これにより、必要に応じて被写体動画の再現性が高まり、よりリアルな映像として再生することができる。
 (3-2)また、上記(3-1)の再生装置では、第1フレーム711は、第1撮像領域から出力されたデータと、第2撮像領域から出力されたデータと、に基づいて生成されたフレームとしてもよい。
 これにより、第1フレームレートの撮像タイミングで撮像された第1フレーム711の圧縮データと、第2フレームレートの撮像タイミングで撮像された第2フレーム713の圧縮データとが、共通の圧縮方法で圧縮されて動画ファイル800が生成されているため、動画ファイル800を伸張することで、第1動画データ721や、第1動画データ721および第2動画データ722の両方といった再生対象の選択が可能となる。
 (3-3)また、上記(3-1)の再生装置では、第2フレーム713は、第2撮像領域から出力されたデータと、撮像素子100からの出力に基づかないデータと、に基づいて生成されたフレームとしてもよい。
 これにより、第2フレームレートの撮像タイミングで出力されていない画像領域(欠損領域712x)が存在しても、第2撮像領域から出力されたデータを第2フレーム713として扱うことで、第1フレーム711と共通の圧縮方法で圧縮されて動画ファイル800が生成されているため、動画ファイル800を伸張することで、第1フレームレートおよび第2フレームレートのいずれのフレームレートでも動画再生が可能となる。
 (3-4)また、上記(3-3)の再生装置では、撮像素子100からの出力に基づかないデータは、所定のデータとしてもよい。これにより、撮像素子100からの出力とは無関係なデータを用いて構成された第2フレーム713と第1フレーム711とが共通の圧縮方法で圧縮されて動画ファイル800が生成されているため、動画ファイル800を伸張することで、第2フレームレートで再生する場合、第1動画データ721および第2動画データ722の両方を組み合わせて再生することができる。
 (3-5)また、上記(3-4)の再生装置では、第2フレーム713は、第2撮像領域から出力されたデータに対して、第1撮像領域からデータが出力されなかった欠損領域712xを補完することにより生成されたフレームとしてもよい。これにより、第2フレームレートで再生する場合、第1動画データ721および第2動画データ722の両方を組み合わせて再生することができる。
 (3-6)また、上記(3-1)の再生装置では、再生するフレームレートを選択する選択部1233を備え、伸張部1234は、選択部1233によって選択されたフレームレートに基づいて、第1圧縮データおよび第2圧縮データを伸張する。これにより、第1動画データ721および第2動画データ722の両方といった再生対象を、再生したいフレームレートを選択することにより再生することができる。
 (3-7)また、上記(3-6)の再生装置では、伸張部1234は、選択部1233によって第1フレームレートが選択された場合、第1圧縮データを伸張し、選択部1233によって第2フレームレートが選択された場合、第1圧縮データおよび第2圧縮データを伸張する。これにより、選択するフレームレートに応じて再生対象を変えることができる。
 このように、伸張の対象として、第1圧縮動画データや、第1圧縮動画データおよび第2圧縮動画データの両方といった選択が可能となる。たとえば、第1フレーム711の撮像タイミングである30[fps]で再生したい場合は、第1圧縮動画データのみ伸張して第1動画データ721を再生すればよい。
 これにより、第2圧縮動画データの無駄な伸張処理が不要となり、省電力化を図ることができる。また、たとえば、画像データ712の撮像タイミングである60[fps]で再生したい場合には、第1圧縮動画データおよび第2圧縮動画データの両方を伸張して、第1動画データ721および第2動画データ722を再生すればよい。これにより、必要に応じて被写体動画の再現性が高まり、よりリアルな映像として再生することができる。
 実施例2について説明する。実施例1では、図10に示したフレームF2,F4,…において、補完画像部分Da1,Da3,…が存在するため、当該範囲は、特定色に塗りつぶしたり、デモザイク処理を実行したりした。実施例2では、合成部703は、そのような画像処理を実行することなく、より違和感がより少ないフレームF2,F4,…を生成する。なお、実施例2では、実施例1と共通部分については、同一符号を用い、その説明を省略する。
 <フレームの合成例>
 ここで、実施例2におけるフレームFの合成例について説明する。図10では、電子機器500は、田んぼ、山、および空を含む風景の定点撮影中に、特定被写体として、走行する電車を撮影する合成例について説明した。以下、当該合成例の処理の流れを具体的に説明する。
 図27は、図10に示した合成例の具体的な処理の流れを示す説明図である。図10でも説明したように、撮像素子100は、時系列順にフレームF1,F2-60,F3,…を出力する。電車は、フレームF1,F2-60,F3内において、右から左に向かって走行するものとする。
 図27において、フレームF1~F3の枝番は、当該フレームF1~F3のフレームレートを示す。たとえば、奇数番号のフレームF1-30は、フレームF1のうち30[fps]のフレームレートの撮像で出力された第1画像領域r1-30の画像データを示し、フレームF1-60は、フレームF1のうち60[fps]のフレームレートの撮像で出力された第2画像領域r1-60の画像データを示す。
 フレームF1-60の60[fps]のフレームレートの撮像で出力された第2画像領域r1-60は電車の画像データを有するが、フレームF1-30では、第2画像領域r1-60はない。フレームF1-30におけるこのような領域を非画像領域n1-60と称す。フレームF1-60も同様に、フレームF1-30の30[fps]のフレームレートの撮像で出力された第1画像領域r1-30は風景の画像データを有するが、フレームF1-60では、第2画像領域r1-60にない。フレームF1-60におけるこのような領域を非画像領域n1-30と称す。
 フレームF3においても同様に、フレームF3-30は、風景の画像データが出力されている第1画像領域r3-30と、何も出力されない非画像領域n3-60と、で構成され、フレームF3-60は、電車の画像データが出力されている第2画像領域r3-60と、何も出力されない非画像領域n3-60と、で構成される。フレームF3-30,F3-60以降の不図示の奇数番号フレームについても同様である。
 また、偶数番号のフレームF2-60は、60[fps]のフレームレートの撮像で出力された第2画像領域r2-60の画像データ(電車)と、特定色(たとえば、黒)で塗りつぶされた補完領域712yと、で構成される第2フレーム713である。以降の不図示の偶数番号フレームについても同様である。
 合成部703は、フレームF2-60の第2画像領域r2-60の画像データ(電車)と、フレームF1-30の第1画像領域r1-30の画像データ(風景)とを合成することにより、合成画像データであるフレームF2を生成する。この場合、図10でも説明したように、フレームF2は、フレームF1-30の非画像領域n1-60と、非画像領域n2-30から補完されたフレームF2-60の補完領域712yとの重複する補完画像部分Da1を有する。
 実施例1では、合成部703が、補完画像部分Da1を特定色に塗りつぶしたり、デモザイク処理を実行したりしたが、実施例2では、合成部703は、そのような画像処理を行うことなく、他の画像領域における補完画像部分Da1の画像データを複製する。これにより、合成部703は、より違和感がより少ないフレームF2を生成する。補完画像部分Da3についても同様であるが、実施例2では、補完画像部分Da1に着目して説明する。
 <フレームF2の合成例>
 つぎに、合成部703によるフレームF2の合成例について説明する。
[合成例1]
 図28は、実施例2にかかる60[fps]のフレームF2の合成例1を示す説明図である。合成例1は、補完画像部分Da1への複製対象となる他の画像領域として、フレームF2-60よりも時間的に1つ後のフレームF3の第1画像領域r3-30において補完画像部分Da1と同一位置の補完画像部分Db1を用いる例である。補完画像部分Db1の画像データは、風景の一部である。
 図28において、合成部703は、フレームF1-30の非画像領域n1-60と、非画像領域n2-30から補完されたフレームF2-60の補完領域712yと、が重複する補完画像部分Da1を特定し、特定した補完画像部分Da1と同一位置の補完画像部分Db1をフレームF3から特定する。そして、合成部703は、フレームF2における補完画像部分Da1に補完画像部分Db1の画像データを複製する。これにより、合成部703は、違和感がより少ないフレームF2を生成することができる。
[合成例2]
 図29は、実施例2にかかる60[fps]のフレームF2の合成例2を示す説明図である。合成例1では、フレームF1-30の第1画像領域r1-30の画像データをフレームF2の第1画像領域への複製元とし、フレームF3の補完画像部分Db1の画像データを補完画像部分Da1への複製元としたが、合成例2では逆に、フレームF3-30の第1画像領域r3-30の画像データをフレームF2の第1画像領域への複製元とし、フレームF1の補完画像部分Db2の画像データを補完画像部分Da2への複製元とする。
 ここで、補完画像部分Da2は、フレームF3-30の非画像領域n3-60と、非画像領域n2-30から補完されたフレームF2-60の補完領域712yとが重複する範囲である。フレームF1の補完画像部分Db2は、補完画像部分Da2と同一位置の範囲である。
 図29において、合成部703は、フレームF3-30の非画像領域n3-60と、非画像領域n2-30から補完されたフレームF2-60の補完領域712yと、が重複する補完画像部分Da2を特定し、特定した補完画像部分Da2と同一位置の補完画像部分Db2をフレームF1から特定する。そして、合成部703は、フレームF2における補完画像部分Da2に補完画像部分Db2の画像データを複製する。これにより、合成部703は、違和感がより少ないフレームF2を生成することができる。
[合成例3]
 合成例3は、合成例1および合成例2のうちいずれか一方を選択して合成する例である。合成例3では、合成部703は、合成例1における補完画像部分Da1と合成例2における補完画像部分Da2とを特定する。合成部703は、補完画像部分Da1,Da2のうちいずれか一方を選択し、選択した範囲を特定した合成例を適用する。合成部703は、補完画像部分Da1が選択された場合は合成例1、補完画像部分Da2が選択された場合は合成例2を適用する。
 合成部703は、補完画像部分Da1,Da2のうちいずれか一方を選択する選択基準として、たとえば、範囲の狭さを選択基準とする。図28および図29の例では、補完画像部分Da1が補完画像部分Da2よりも狭いため、合成例1が適用される。狭い方の範囲を選択することにより、複製による違和感を最小限度に留めることができる。
[合成例4]
 図30は、実施例2にかかる60[fps]のフレームF2の合成例4を示す説明図である。合成例4は、合成例1における補完画像部分Da1の複製元を、フレームF3の第1画像領域r3-30内における補完画像部分Db1の画像データ(風景の一部)ではなく、フレームF1の第2画像領域r1-60における補完画像部分Db3の画像データ(電車の末尾)とする。
 これにより、フレームF2において第2画像領域r2-60の画像データ(電車)は、補完画像部分Db3の画像データが追加されたことになるが、第2画像領域r2-60の画像データ(電車)の進行方向反対側に追加されるため、ユーザが映像を見た場合に、当該第2画像領域r2-60の画像データ(電車)を、走行する電車の残像と錯覚する。したがって、この場合も違和感がより少ないフレームF2,F4,…を生成することができる。
 <フレームF2の合成処理手順例>
 以下、上述した合成例1~合成例4によるフレームF2の合成処理手順例について説明する。以下のフローチャートでは、第2フレーム713は、合成対象となる第2フレームレート(たとえば、60[[fps])のみの撮像で出力され、かつ、欠損領域712xが特定色(黒)で塗りつぶされたフレームである。たとえば、図27~図30のフレームF2-60が第2フレーム713である。
 また、第1フレーム711は、第2フレーム713よりも時間的に1つ前で、かつ、第1フレームレート(たとえば、30[[fps])および第2フレームレートのうち少なくとも第1フレームレートの撮像で出力された画像領域を含むフレームである。たとえば、図27~図30のフレームF1が第1フレーム711である。
 また、第3フレーム730は、第2フレーム713と第1フレーム711または第3フレーム730とにより合成されたフレームである。たとえば、図27~図30のフレームF2が第3フレーム730である。
 また、第4フレームは、第2フレーム713よりも時間的に1つ後で、かつ、第1フレームレートおよび第2フレームレートのうち少なくとも第1フレームレートの撮像で出力された画像領域を含むフレームである。たとえば、図27~図30のフレームF3が第4フレームである。
[合成例1]
 図31は、合成部703によるフレームF2の合成例1による合成処理手順例1を示すフローチャートである。なお、図26と同一ステップには同一ステップ番号を付し、その説明を省略する。
 ステップS2604において、取得フレームが第2フレーム713である場合(ステップS2604:Yes)、特定部1240は、第1フレーム711の非画像領域でかつ第2フレーム713の補完領域712yとなる範囲を特定する(ステップS3101)。具体的には、たとえば、特定部1240は、図28に示したように、フレームF1-30の非画像領域n1-60と非画像領域n2-30から補完されたフレームF2-60の補完領域712yとが重複する補完画像部分Da1を特定する。
 つぎに、合成部703は、第1フレーム711の第1画像領域a1の画像データを複製する(ステップS3102)。具体的には、たとえば、合成部703は、図28に示したように、フレームF1の第1画像領域r1-30の画像データ(風景)を複製する。
 そして、合成部703は、ステップS3101で特定した範囲の画像データを第4フレームから複製する(ステップS3103)。具体的には、たとえば、合成部703は、図28に示したように、ステップS3101で特定した補完画像部分Da1と同補完画像部分Db1の画像データをフレームF3から複製する。
 つぎに、合成部703は、合成により第3フレーム730を生成する(ステップS3104)。具体的には、たとえば、合成部703は、図28に示したように、フレームF2-60の第2画像領域r2-60と、複製した第1画像領域r1-30の画像データ(風景)と、複製した補完画像部分Db1の画像データと、を合成することにより、フレームF2-60をフレームF2(第3フレーム730)に更新する。
 このあと、ステップS2602に戻る。残存フレームがバッファにない場合(ステップS2602:No)、合成部703は、合成処理(ステップS2507)を終了する。これにより、合成部703は、図28に示したように、違和感がより少ないフレームF2を生成することができる。
[合成例2]
 図32は、合成部703によるフレームF2の合成例2による合成処理手順例2を示すフローチャートである。なお、図26と同一ステップには同一ステップ番号を付し、その説明を省略する。
 ステップS2604において、取得フレームが第2フレーム713である場合(ステップS2604:Yes)、特定部1240は、第4フレームの非画像領域でかつ第2フレーム713の補完領域712yとなる範囲を特定する(ステップS3201)。具体的には、たとえば、特定部1240は、図29に示したように、フレームF3-30の非画像領域n3-60と非画像領域n2-30から補完されたフレームF2-60の補完領域712yとが重複する補完画像部分Da2を特定する。
 つぎに、合成部703は、第4フレームの第1画像領域a1の画像データを複製する(ステップS3202)。具体的には、たとえば、合成部703は、図29に示したように、フレームF3の第1画像領域r3-30の画像データ(風景)を複製する。
 そして、合成部703は、ステップS3201で特定した範囲の画像データを第1フレーム711から複製する(ステップS3203)。具体的には、たとえば、合成部703は、図29に示したように、ステップS3201で特定した補完画像部分Da2と同補完画像部分Db2の画像データをフレームF1から複製する。
 つぎに、合成部703は、合成により第3フレーム730を生成する(ステップS3204)。具体的には、たとえば、合成部703は、図29に示したように、フレームF2-60の第2画像領域r2-60と、複製した第1画像領域r3-30の画像データ(風景)と、複製した補完画像部分Db2の画像データと、を合成することにより、フレームF2-60をフレームF2(第3フレーム730)に更新する。
 このあと、ステップS2602に戻る。残存フレームがバッファにない場合(ステップS2602:No)、合成部703は、合成処理(ステップS2507)を終了する。これにより、合成部703は、図29に示したように、違和感がより少ないフレームF2を生成することができる。
[合成例3]
 図33は、合成部703によるフレームF2の合成例3による合成処理手順例3を示すフローチャートである。なお、図26と同一ステップには同一ステップ番号を付し、その説明を省略する。
 ステップS2604において、取得フレームが第2フレーム713である場合(ステップS2604:Yes)、特定部1240は、第1フレーム711の非画像領域でかつ第2フレーム713の補完領域712yとなる第1範囲を特定する(ステップS3301)。具体的には、たとえば、特定部1240は、図28に示したように、フレームF1-30の非画像領域n1-60と非画像領域n2-30から補完されたフレームF2-60の補完領域712yとが重複する補完画像部分Da1を特定する。
 特定部1240は、第4フレームの非画像領域でかつ第2フレーム713の補完領域712yとなる第2範囲を特定する(ステップS3302)。具体的には、たとえば、特定部1240は、図29に示したように、フレームF3-30の非画像領域n3-60と非画像領域n2-30から補完されたフレームF2-60の補完領域712yとが重複する補完画像部分Da2を特定する。
 つぎに、合成部703は、特定した第1範囲および第2範囲のいずれか一方の範囲を選択する(ステップS3303)。具体的には、たとえば、合成部703は、第1範囲および第2範囲のうち狭い方(面積が小さい方)の範囲を選択する。選択された範囲を選択範囲と称す。補完画像部分Da1、Da2の場合、合成部703は、補完画像部分Da1を選択する。これにより、合成に用いる範囲を最小限に抑制することができ、違和感をより一層抑制することができる。
 そして、合成部703は、選択フレームの第1画像領域a1の画像データを複製する(ステップS3304)。選択フレームとは、選択範囲の特定元となるフレームであり、たとえば、第1範囲(補完画像部分Da1)が選択された場合は、選択フレームは、第1フレーム711(フレームF1)であり、第2範囲(補完画像部分Da2)が選択された場合は、選択フレームは、第4フレーム(フレームF3)である。
 したがって、選択フレームの第1画像領域a1の画像データとは、選択フレームがフレームF1であれば、フレームF1の第1画像領域r1-30の画像データ(風景)であり、選択フレームがフレームF3であれば、フレームF3の第1画像領域r3-30の画像データ(風景)である。
 そして、合成部703は、ステップS3303の選択範囲の画像データを非選択フレームから複製する(ステップS3305)。非選択フレームとは、選択されなかった範囲の特定元となるフレームであり、たとえば、第1範囲(補完画像部分Da1)が選択されなかった場合は、非選択フレームは、第1フレーム711(フレームF1)であり、第2範囲(補完画像部分Da2)が選択されなかった場合は、非選択フレームは、第4フレーム(フレームF3)である。したがって、合成部703は、選択範囲が補完画像部分Da1であれば、補完画像部分Da1と同位置の補完画像部分Db1の画像データをフレームF3から複製し、選択範囲が補完画像部分Da2であれば、補完画像部分Da2と同位置の補完画像部分Db2の画像データをフレームF1から複製する。
 つぎに、合成部703は、合成により第3フレーム730を生成する(ステップS3306)。具体的には、たとえば、選択範囲が第1範囲(補完画像部分Da1)である場合、合成部703は、フレームF2-60の第2画像領域r2-60と、複製した第1画像領域r1-30の画像データ(風景)と、複製した補完画像部分Db1の画像データと、を合成することにより、フレームF2-60をフレームF2(第3フレーム730)に更新する。
 また、選択範囲が第2範囲(補完画像部分Da2)である場合、合成部703は、フレームF2-60の第2画像領域r2-60と、複製した第1画像領域r3-30の画像データ(風景)と、複製した補完画像部分Db2の画像データと、を合成することにより、フレームF2-60をフレームF2(第3フレーム730)に更新する。
 このあと、ステップS2602に戻る。残存フレームがバッファにない場合(ステップS2602:No)、合成部703は、合成処理(ステップS2507)を終了する。これにより、合成部703は、狭い方の範囲を選択することにより、複製による違和感を最小限度に留めることができる。
[合成例4]
 図34は、合成部703によるフレームF2の合成例4による合成処理手順例4を示すフローチャートである。なお、図26と同一ステップには同一ステップ番号を付し、その説明を省略する。
 ステップS2604において、取得フレームが第2フレーム713である場合(ステップS2604:Yes)、特定部1240は、第1フレーム711の非画像領域でかつ第2フレーム713の補完領域712yとなる範囲を特定する(ステップS3401)。具体的には、たとえば、合成部703は、図30に示したように、フレームF1-30の非画像領域n1-60と非画像領域n2-30から補完されたフレームF2-60の補完領域712yとが重複する補完画像部分Da1を特定する。
 つぎに、合成部703は、第1フレーム711の第1画像領域a1の画像データを複製する(ステップS3402)。具体的には、たとえば、合成部703は、フレームF1の第1画像領域r1-30の画像データ(風景)を複製する。
 そして、合成部703は、ステップS3401で特定した範囲の画像データを第1フレーム711から複製する(ステップS3403)。具体的には、たとえば、合成部703は、ステップS3401で特定した補完画像部分Da1と同補完画像部分Db3の画像データをフレームF1から複製する。
 つぎに、合成部703は、合成により第3フレーム730を生成する(ステップS3404)。具体的には、たとえば、合成部703は、フレームF2-60の第2画像領域r2-60と、複製した第1画像領域r1-30の画像データ(風景)と、複製した補完画像部分Db3の画像データと、を合成することにより、フレームF2-60をフレームF2(第3フレーム730)に更新する。
 このあと、ステップS2602に戻る。残存フレームがバッファにない場合(ステップS2602:No)、合成部703は、合成処理(ステップS2507)を終了する。これにより、合成部703は、図30に示したように、違和感がより少ないフレームF2を生成することができる。
 (3-8)このように、実施例1に示した上記(3-6)の再生装置は、合成部703を有する。合成部703は、第2フレームレートが選択された場合、記憶デバイス1202から第1動画データ721および第2動画データ722を取得して、第1フレーム711と、第1フレーム711よりも時間的に後に得られた第2フレーム713と、を合成して、第2フレーム713を、第1フレーム711における第1画像領域a1の画像データと第2フレーム713における第2画像領域a2の画像データとを合成した第3フレーム730を生成する。
 これにより、フレームレートの相違による第2フレーム713での画像データの欠落を抑制することができる。したがって、1枚のフレームにフレームレートの相違がある場合でも、第3フレーム730により被写体動画の再現性が高まり、よりリアルな映像として再生することができる。
 (3-9)また、上記(3-8)の再生装置では、合成部703は、第2フレーム713における第2画像領域a2の画像データにおいて、第1フレーム711における第1画像領域a1の画像データと重複する領域については、第2フレーム713における第2画像領域a2の画像データを適用することにより、第3フレーム730を生成する。
 これにより、たとえば、第2フレーム713であるフレームF2-60の電車の先頭部分と第1フレーム711であるフレームF1の背景領域とが重複する領域では、合成部703は、第2フレーム713であるフレームF2の電車の先頭部分を優先適用する。したがって、違和感がより少ない画像(第3フレーム730であるフレームF2)を得ることができ、被写体動画の再現性が高まり、よりリアルな映像として再生することができる。
 (3-10)また、上記(3-8)の再生装置では、合成部703は、第2フレーム713における第2画像領域a2および第1フレーム711における第1画像領域a1のいずれにも属さない領域については、第1フレーム711における第2画像領域a2の画像データを適用することにより、第3フレーム730を生成する。
 これにより、たとえば、第2フレーム713であるフレームF2-60の第2フレームの電車の末尾部分と第1フレーム711であるフレームF1の背景領域との間の画像領域については、第1フレーム711であるフレームF1における第2画像領域a2の画像データ(電車の末尾)を優先適用する。したがって、違和感がより少ない画像(第3フレーム730であるフレームF2)を得ることができ、被写体動画の再現性が高まり、よりリアルな映像として再生することができる。
 (3-11)また、上記(3-5)の再生装置では、特定部1240は、第1フレーム711と、第2フレーム713と、に基づいて、第1フレーム711における第2撮像領域に対応する非画像領域n1-60で、かつ、第2フレーム713における補完領域712yである補完画像部分Da1を特定する。
 合成部703は、第2フレーム713における第2画像領域a2の画像データと、第1フレーム711における第1撮像領域に対応する第1画像領域a1(r1-30)の画像データと、第1フレーム711における第1画像領域a1(r1-30)の画像データおよび第2フレーム713における第2画像領域a2の画像データ以外の他の画像領域において特定部1240によって特定された補完画像部分Da1の特定の画像データと、を合成する。
 これにより、画像データ712の撮像で出力されかなった非画像領域n2-30を、画像データ712と時間的に近いフレームにより補うことができる。したがって、画像データ712よりも違和感が少ない合成フレームを得ることができる。
 (3-12)また、上記(3-11)の再生装置では、第1フレーム711は、第2フレーム713よりも時間的に前に生成されたフレーム(たとえば、フレームF1)であり、特定の画像データは、第2フレーム713よりも時間的に後に第1撮像領域および第2撮像領域からの出力により生成されたフレーム(たとえば、フレームF3)の第1画像領域a1(r3-30)における範囲(Da1)の画像データ(すなわち、補完画像部分Db1の画像データ)としてもよい。
 これにより、第2フレーム713の撮像で出力されかなった非画像領域n2-30を、第2フレーム713の時間的に1つ前の第1フレーム711と1つ後の第4フレームとにより補うことができる。したがって、違和感が少ない合成フレーム(第3フレーム730)を得ることができる。
 また、上記(3-11)の再生装置では、第1フレーム711は、第2フレーム713よりも時間的に後に生成されたフレーム(たとえば、フレームF3)であり、特定の画像データは、第2フレーム713よりも時間的に前に第1撮像領域および第2撮像領域からの出力により生成されたフレーム(たとえば、フレームF1)の第1画像領域a1(r1-30)における範囲(Da2)の画像データ(すなわち、補完画像部分Db2の画像データ)としてもよい。
 これにより、第2フレーム713の補完領域712yである非画像領域n2-30を、第2フレーム713の時間的に1つ前の第1フレーム711と1つ後の第4フレームとにより補うことができる。したがって、違和感が少ない合成フレーム(第3フレーム730)を得ることができる。
 また、上記(3-5)の再生装置では、特定部1240は、第1範囲(Da1)と第2範囲(Da2)とに基づいて、合成部703で用いる範囲を特定する。また、合成部703は、第2フレーム713と、第1フレーム711および第4フレームのうち特定部1240によって特定された一方の範囲(Da1/Da2)の特定元となる一方のフレーム(F1/F3)における第1画像領域a1(r1-30/r3-30)の画像データと、第1フレーム711および第4フレームのうち特定部1240によって特定されなかった他方の範囲(Da2/Da1)の特定元となる他方のフレーム(F3/F1)の第1画像領域a1(r3-30/r1-30)における一方の範囲(Da1/Da2)の画像データ(Db1/Db2)と、を合成する。
 これにより、合成部703は、狭い方の範囲を選択することにより、複製による違和感を最小限度に留めることができる。
 また、上記(3-5)の再生装置では、第1フレーム711は、第2フレーム713よりも時間的に前に生成されたフレームであり、特定の画像データは、第1フレーム711の第2画像領域a2における範囲(Da1)の画像データ(すなわち、補完画像部分Db3の画像データ)としてもよい。
 これにより、第2フレーム713の補完領域712yである非画像領域n2-30を、第2フレーム713の時間的に1つ前の第1フレーム711により補うことができる。したがって、違和感が少ない合成フレーム(第3フレーム730)を得ることができる。
 実施例3について説明する。実施例1では、図10に示したフレームF2,F4,…において、補完画像部分Da1,Da3,…が存在するため、合成部703が、特定色に塗りつぶしたり、デモザイク処理を実行したりした。実施例3では、実施例2と同様、合成部703は、そのような画像処理を実行することなく、より違和感がより少ないフレームF2,F4,…を生成する。
 なお、実施例3では、実施例1および実施例2と共通部分については、同一符号を用い、その説明を省略する。ただし、図35および図36では、符号が不鮮明となるため、補完による黒塗りは施されていない。
 図35は、実施例3にかかる60[[fps]のフレームF2の合成例を示す説明図である。フレームF2-60の撮像前に、前処理部1210は、フレームF2-60以前のフレームF1などから電車などの特定被写体を検出し、1つ前のフレームF1での特定被写体の動きベクトルを検出する。前処理部1210は、フレームF1の特定被写体の画像領域と動きベクトルとにより、次のフレームF2-60で、60[fps]の画像領域R12-60を得ることができる。
 また、合成フレームであるフレームF2の合成では、実施例1と同様に、合成部703は、1つ前のフレームF1の第1画像領域r1-30の画像データ(風景)を複製し、第1画像領域r1-30の画像データ(風景)と、画像領域R12-60の画像データ(電車と風景の一部)とを合成することにより、フレームF2を得ることができる。
 図36は、撮像領域の設定とフレームF2-60の画像領域との対応関係を示す説明図である。(A)は、動きベクトルの検出例を示し、(B)は、撮像領域の設定とフレームF2-60の画像領域との対応関係を示す。
 撮像領域p1-60は、フレームF1の時間的に1つ前のフレームF0-60の生成後、フレームF1の生成前にすでに検出済みの特定被写体の撮像領域である。したがって、フレームF1では、特定被写体(電車)の画像データo1は、撮像領域p1-60に対応する第2画像領域r1-60に存在する。
 前処理部1210は、検出部1211により、フレームF0の特定被写体の画像データo1とフレームF1の特定被写体の画像データo1とにより特定被写体の動きベクトルmvを検出する。そして、前処理部1210は、フレームF1の特定被写体の第2画像領域r1-60と動きベクトルmvとにより、次のフレームF2-60で特定被写体が映し出される第2画像領域r2-60を検出し、検出した第2画像領域r2-60に対応する撮像素子100の撮像面200の検出撮像領域p2-60を検出する。
 前処理部1210は、設定部1212により、フレームF1の生成の際に特定済みの撮像領域p1-60と、検出撮像領域p2-60と、を包含する特定の撮像領域P12-60のフレームレートを、第2フレームレートに設定し、当該設定指示を撮像素子100に出力する。これにより、撮像素子100は、特定の撮像領域P12-60を第2フレームレートに設定して撮像し、画像データ712を生成する。
 第1生成部701は、設定部1212によって設定された第2フレームレートでの撮像により生成された画像データ712を補完して、第2フレーム713(F2-60)を出力する。この場合、特定の撮像領域P12-60から出力された画像データが、画像領域R12-60の画像データとなる。
 合成部703は、フレームF1に含まれる第1画像領域r1-30の画像データと、第2フレーム713(F2-60)に含まれる特定の撮像領域P12-60からの画像データ(画像領域R12-60)と、を合成する。これにより、フレームF2-60は、フレームF2(第3フレーム730)に更新される。
 なお、フレームF2-60の生成後、次のフレームF3の生成前において、前処理部1210は、検出撮像領域p2-60のフレームレートを第2フレームレートに設定し、撮像面200のうち検出撮像領域p2-60以外の他の撮像領域のフレームレートを第1フレームレートに設定してもよい。
 これにより、第1フレームレートの撮像領域を含む撮像で得られるフレームF3の生成においては、フレームF1と同様、第2フレームレートが設定される第2撮像領域は検出撮像領域p2-60のみとなる。このように、合成対象となるフレームF2-60,F4-60,…について特定の検出撮像領域が設定されるため、フレームF1,F3,…での無駄な処理が抑制される。
 フレームF2-60は、画像領域R12-60に、特定被写体(電車)の画像データo1と風景の一部の画像データo2を含む。このように、画像領域R12-60は、第2画像領域r2-60に比べて、特定被写体の移動方向の反対側において拡張される。したがって、実施例2のように補完画像部分Da1,Da2を特定して、他のフレームの補完画像部分Db1、Db2の画像データを複製して合成する必要がない。なお、実施例3の合成処理は、たとえば、図25のステップS2507で実行される。また、この合成処理は、フレームF2-60,F4-60,…の合成の場合に適用され、第1フレームレートの画像領域を含むフレームF1,F3,…では実行されない。
 このように、実施例3では、合成元の画像データが、第2フレーム713内の画像領域R12-60とフレームF1の第1画像領域r1-30の2つであるため、違和感がより少ないフレームF2を生成することができる。すなわち、画像データo1,o2は同一タイミングの撮像で出力された画像データであるため、画像データo1,o2の境界は不自然ではなく違和感がない。また、実施例2のように、補完画像部分Da1,Da2を特定したり、補完画像部分Da1,Da2から最適な範囲を選択したりするという処理が不要となるため、フレームF2の合成処理の負荷低減を図ることができる。
 (4-1)このように、実施例3にかかる撮像装置は、撮像素子100と、検出部1211と、設定部1212と、を有する。撮像素子100は、被写体を撮像する第1撮像領域と、被写体を撮像する第2撮像領域と、を有し、第1撮像領域に第1フレームレート(たとえば、30[fps])を設定可能であり、かつ、第2撮像領域に第1フレームレートよりも速い第2フレームレート(たとえば、60[fps])を設定可能である。
 検出部1211は、撮像素子100からの出力により生成されたフレームF1に含まれる特定被写体の第2画像領域r1-60に基づいて、撮像素子100における特定被写体の検出撮像領域p2-60を検出する。設定部1212は、フレームF1の生成に用いられた特定被写体の撮像領域p1-60と、検出部1211によって検出された撮像領域(以下、検出撮像領域)p2-60と、を包含する特定の撮像領域P12-60のフレームレートを、第2フレームレートに設定する。
 これにより、第2フレームレートでの撮像領域を拡張設定して、フレームF1,F2で非画像領域が重複する補完画像部分Da1が生じないように第2フレームレートで特定被写体を撮像することができ、第2フレームレートの撮像で出力されるフレームF2-60の画像欠損を抑制することができる。
 (4-2)また、上記(4-1)の撮像装置では、検出部1211は、フレームF1に含まれる特定被写体の第2画像領域r1-60と、フレームF1とフレームF1よりも時間的に前のフレームF0-60との間における特定被写体の動きベクトルmvと、に基づいて、特定被写体の検出撮像領域p2-60を検出する。
 これにより、特定被写体の検出撮像領域p2-60の予測を容易に実現することができる。
 (4-3)また、上記(4-1)の撮像装置では、設定部1212は、フレームが第1撮像領域からの出力により生成された第1フレームF1である場合に、特定の撮像領域のフレームレートを第2フレームレートに設定し、フレームが第1フレームF1の後に特定の撮像領域からの出力により生成された第2フレームF2-60である場合に、検出撮像領域p2-60のフレームレートを第2フレームレートに設定し、検出撮像領域p2-60以外の他の撮像領域(撮像面200のうち検出撮像領域p2-60を除いた部分)のフレームレートを第1フレームレートに設定する。
 これにより、合成対象となるフレームF2-60,F4-60,…についてのみ特定の検出撮像領域が設定されるため、フレームF1,F3,…での無駄な処理の抑制を図ることができる。
 (4-4)また、実施例3にかかる画像処理装置は、被写体を撮像する第1撮像領域と、被写体を撮像する第2撮像領域と、を有し、第1撮像領域に第1フレームレート(たとえば、30[fps])を設定可能であり、かつ、第2撮像領域に第1フレームレートよりも速い第2フレームレート(たとえば、60[fps])を設定可能な撮像素子100からの出力により生成されたフレームを画像処理する。
 この画像処理装置は、検出部1211と、設定部1212と、第1生成部701と、合成部703と、を有する。検出部1211は、撮像素子100からの出力により生成されたフレームF1に含まれる特定被写体の第2画像領域r1-60に基づいて、撮像素子100における特定被写体の撮像領域p2-60を検出する。設定部1212は、フレームF1の生成に用いられた特定被写体の撮像領域p1-60と、検出部1211によって検出された検出撮像領域p2-60と、を包含する特定の撮像領域P12-60のフレームレートを、第2フレームレートに設定する。
 第1生成部701は、設定部1212によって設定された第2フレームレートでの撮像により生成された画像データ712を補完して、第2フレーム713(F2-60)を出力する。
 合成部703は、第1フレームF1に含まれる第1画像領域r1-30の画像データと、第2フレーム713(F2-60)に含まれる特定の撮像領域P12-60からの画像データ(画像領域R12-60)と、を合成する。
 これにより、第2フレームレートでの撮像領域を拡張設定して、フレームF1,F2で非画像領域が重複する補完画像部分Da1が生じないように第2フレームレートで特定被写体を撮像することができ、第2フレームレートの撮像で出力されるフレームF2-60の画像欠損を抑制することができる。また、合成の際、重複する補完画像部分Da1について補う必要がないため、より違和感の少ない画像を得ることができ、また、合成処理の負荷低減を図ることができる。
 なお、本発明は上記の内容に限定されるものではなく、これらを任意に組み合わせたものであってもよい。また、本発明の技術的思想の範囲で考えられるその他の態様も本発明の範囲に含まれる。
100 撮像素子、701 補完部、702 圧縮伸張部、703 合成部、704 再生部、800 動画ファイル、801 ヘッダ部、802 データ部、835 付加情報、910 撮像条件情報、911 フレームレート情報、912 位置情報、920 挿入位置情報、921 挿入フレーム番号、922 挿入先、1201 プロセッサ、1202 記憶デバイス、1210 前処理部、1211 検出部、1212 設定部、1220 取得部、1231 圧縮部、1232 生成部、1233 選択部、1234 伸張部、1240 特定部

Claims (16)

  1.  被写体を撮像する第1撮像領域と、被写体を撮像する第2撮像領域と、を有する撮像素子から出力されたデータを圧縮した動画ファイルを生成する生成装置であって、
     第1フレームレートが設定された前記第1撮像領域から出力されたデータに基づいて生成された複数の第1フレームを圧縮した第1圧縮データと、前記第1フレームレートよりも速い第2フレームレートが設定された前記第2撮像領域から出力されたデータに基づいて生成された複数の第2フレームを圧縮した第2圧縮データと、前記第1圧縮データの格納位置を示す第1位置情報と、前記第2圧縮データの格納位置を示す第2位置情報と、を含む動画ファイルを生成する生成部と、
     前記生成部によって生成された動画ファイルを記憶デバイスに格納する格納部と、
     を有する生成装置。
  2.  請求項1に記載の生成装置において、
     前記第1フレームは、前記第1撮像領域から出力されたデータと、前記第2撮像領域から出力されたデータと、に基づいて生成されたフレームである、生成装置。
  3.  請求項1に記載の生成装置において、
     前記第2フレームは、前記第2撮像領域から出力されたデータと、前記撮像素子からの出力に基づかないデータと、に基づいて生成されたフレームである、生成装置。
  4.  請求項3に記載の生成装置において、
     前記撮像素子からの出力に基づかないデータは、所定のデータである、生成装置。
  5.  請求項4に記載の生成装置において、
     前記第2フレームは、前記第2撮像領域から出力されたデータに対して、前記第1撮像領域からデータが出力されなかった欠損領域を補完することにより生成されたフレームである、生成装置。
  6.  請求項1に記載の生成装置において、
     前記生成部は、前記第1圧縮データおよび前記第2圧縮データをデータ部に設定し、前記第1位置情報および前記第2位置情報をヘッダ部に設定することにより、前記データ部および前記ヘッダ部を含む前記動画ファイルを生成する、生成装置。
  7.  請求項5に記載の生成装置であって、
     前記生成部は、前記ヘッダ部に、前記第1フレームレートを示す第1フレームレート情報を、前記第1位置情報に関連付けて設定し、前記第2フレームレートを示す第2フレームレート情報を、前記第1位置情報および前記第2位置情報に関連付けて設定することにより、前記ヘッダ部および前記データ部を含む前記動画ファイルを生成する、生成装置。
  8.  請求項7に記載の生成装置であって、
     前記生成部は、前記ヘッダ部に、前記第2フレームが挿入される前記複数の第1フレーム内の挿入先を示す情報を設定することにより、前記ヘッダ部および前記データ部を含む前記動画ファイルを生成する、生成装置。
  9.  請求項5に記載の生成装置であって、
     前記生成部は、前記第1圧縮データを第1データ部に設定し、かつ、前記第1圧縮データの格納位置を指定する第1位置情報および前記第2圧縮データと関連付ける第1関連付け情報を第1ヘッダ部に設定することにより、前記第1ヘッダ部および前記第1データ部を含む第1動画ファイルを生成して、前記記憶デバイスに格納するとともに、前記第2圧縮データを第2データ部に設定し、かつ、前記第2圧縮データの格納位置を指定する第2位置情報を第2ヘッダ部に設定することにより、前記第2ヘッダ部および前記第2データ部を含む第2動画ファイルを生成する、生成装置。
  10.  請求項5に記載の生成装置であって、
     前記生成部は、前記第1圧縮データを第1データ部に設定し、かつ、前記第1圧縮データの格納位置を指定する第1位置情報を第1ヘッダ部に設定することにより、前記第1ヘッダ部および前記第1データ部を含む第1動画ファイルを生成して、前記記憶デバイスに格納するとともに、前記第2圧縮データを第2データ部に設定し、かつ、前記第2圧縮データの格納位置を指定する第2位置情報および前記第1圧縮データと関連付ける第2関連付け情報を第2ヘッダ部に設定することにより、前記第2ヘッダ部および前記第2データ部を含む第2動画ファイルを生成する、生成装置。
  11.  被写体を撮像する第1撮像領域と、被写体を撮像する第2撮像領域と、を有する撮像素子から出力されたデータを圧縮した動画ファイルを生成する生成装置であって、
     第1フレームレートが設定された前記第1撮像領域から出力されたデータに基づいて生成された複数の第1フレームを圧縮した第1圧縮データと、前記第1フレームレートよりも速い第2フレームレートが設定された前記第2撮像領域から出力されたデータに基づいて生成された複数の第2フレームを圧縮した第2圧縮データと、を含む動画ファイルを生成する生成部と、
     前記生成部によって生成された動画ファイルを記憶デバイスに格納する格納部と、
     を有する生成装置。
  12.  被写体を撮像する第1撮像領域と、被写体を撮像する第2撮像領域と、を有する撮像素子と、
     第1フレームレートが設定された前記第1撮像領域から出力されたデータに基づいて生成された複数の第1フレームを圧縮した第1圧縮データと、前記第1フレームレートよりも速い第2フレームレートが設定された前記第2撮像領域から出力されたデータに基づいて生成された複数の第2フレームを圧縮した第2圧縮データと、前記第1圧縮データの格納位置を示す第1位置情報と、前記第2圧縮データの格納位置を示す第2位置情報と、を含む動画ファイルを生成する生成部と、
     前記生成部によって生成された動画ファイルを記憶デバイスに格納する格納部と、
     を有する電子機器。
  13.  被写体を撮像する第1撮像領域と、被写体を撮像する第2撮像領域と、を有する撮像素子と、
     第1フレームレートが設定された前記第1撮像領域から出力されたデータに基づいて生成された複数の第1フレームを圧縮した第1圧縮データと、前記第1フレームレートよりも速い第2フレームレートが設定された前記第2撮像領域から出力されたデータに基づいて生成された複数の第2フレームを圧縮した第2圧縮データと、を含む動画ファイルを生成する生成部と、
     前記生成部によって生成された動画ファイルを記憶デバイスに格納する格納部と、
     を有する電子機器。
  14.  被写体を撮像する第1撮像領域と、被写体を撮像する第2撮像領域と、を有する撮像素子から出力されたデータを圧縮した動画ファイルの生成をプロセッサに実行させる生成プログラムであって、
     前記プロセッサに、
     第1フレームレートが設定された前記第1撮像領域から出力されたデータに基づいて生成された複数の第1フレームを圧縮した第1圧縮データと、前記第1フレームレートよりも速い第2フレームレートが設定された前記第2撮像領域から出力されたデータに基づいて生成された複数の第2フレームを圧縮した第2圧縮データと、前記第1圧縮データの格納位置を示す第1位置情報と、前記第2圧縮データの格納位置を示す第2位置情報と、を含む動画ファイルを生成する生成処理と、
     前記生成処理によって生成された動画ファイルを記憶デバイスに格納する格納処理と、
     を実行させる生成プログラム。
  15.  被写体を撮像する第1撮像領域と、被写体を撮像する第2撮像領域と、を有する撮像素子から出力されたデータを圧縮した動画ファイルの生成をプロセッサに実行させる生成プログラムであって、
     前記プロセッサに、
     第1フレームレートが設定された前記第1撮像領域から出力されたデータに基づいて生成された複数の第1フレームを圧縮した第1圧縮データと、前記第1フレームレートよりも速い第2フレームレートが設定された前記第2撮像領域から出力されたデータに基づいて生成された複数の第2フレームを圧縮した第2圧縮データと、を含む動画ファイルを生成する生成処理と、
     前記生成処理によって生成された動画ファイルを記憶デバイスに格納する格納処理と、
     を実行させる生成プログラム。
  16.  被写体を撮像する第1撮像領域と、被写体を撮像する第2撮像領域と、を有する撮像素子から出力されたデータを圧縮した動画ファイルのデータ構造であって、
     第1フレームレートが設定された前記第1撮像領域から出力されたデータに基づいて生成された複数の第1フレームを圧縮した第1圧縮データと、前記第1フレームレートよりも速い第2フレームレートが設定された前記第2撮像領域から出力されたデータに基づいて生成された複数の第2フレームを圧縮した第2圧縮データと、を格納するデータ部と、
     前記第1圧縮データの格納位置を示す第1位置情報と、前記第2圧縮データの格納位置を示す第2位置情報と、を格納するヘッダ部と、
     を有するデータ構造。
PCT/JP2019/012893 2018-03-30 2019-03-26 生成装置、電子機器、生成プログラムおよびデータ構造 WO2019189199A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018070249 2018-03-30
JP2018-070249 2018-03-30

Publications (1)

Publication Number Publication Date
WO2019189199A1 true WO2019189199A1 (ja) 2019-10-03

Family

ID=68062176

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/012893 WO2019189199A1 (ja) 2018-03-30 2019-03-26 生成装置、電子機器、生成プログラムおよびデータ構造

Country Status (1)

Country Link
WO (1) WO2019189199A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012178860A (ja) * 2007-01-15 2012-09-13 Panasonic Corp 撮像装置
WO2017175802A1 (ja) * 2016-04-06 2017-10-12 株式会社ニコン 画像処理装置、電子機器、再生装置、再生プログラムおよび再生方法
JP2017224970A (ja) * 2016-06-15 2017-12-21 ソニー株式会社 画像処理装置、画像処理方法、および撮像装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012178860A (ja) * 2007-01-15 2012-09-13 Panasonic Corp 撮像装置
WO2017175802A1 (ja) * 2016-04-06 2017-10-12 株式会社ニコン 画像処理装置、電子機器、再生装置、再生プログラムおよび再生方法
JP2017224970A (ja) * 2016-06-15 2017-12-21 ソニー株式会社 画像処理装置、画像処理方法、および撮像装置

Similar Documents

Publication Publication Date Title
JP2023166557A (ja) 動画圧縮装置
CN111194547B (zh) 视频压缩装置、电子设备以及存储介质
US6373523B1 (en) CCD camera with two CCDs having mutually different color filter arrays
CN104272721A (zh) 拍摄装置
JP2013211645A (ja) 画像処理装置
US8564685B2 (en) Video signal capturing apparatus, signal processing and control apparatus, and video signal capturing, video signal processing, and transferring system and method
JP4178634B2 (ja) 映像信号伝送装置、映像信号伝送方法、映像信号撮像装置および映像信号処理装置
JP2009253667A (ja) 動画処理装置及び動画処理方法、動画処理プログラム
WO2019065919A1 (ja) 撮像装置、画像処理装置、動画圧縮装置、設定プログラム、画像処理プログラム、および動画圧縮プログラム
JP2005303972A (ja) 処理装置及びガンマ値調整プログラム
WO2019189199A1 (ja) 生成装置、電子機器、生成プログラムおよびデータ構造
WO2019189206A1 (ja) 再生装置、伸張装置、電子機器、再生プログラムおよび伸張プログラム
KR20140103521A (ko) 동영상 데이터를 기록하는 방법, 및 이 방법을 채용한 촬영 장치
WO2019065918A1 (ja) 画像処理装置、動画圧縮装置、画像処理プログラム、および動画圧縮プログラム
KR100195129B1 (ko) 가정용 hdtv 카메라를 위한 수직라인 배속 변환방법 및 그 회로
JP7156367B2 (ja) 動画圧縮装置、伸張装置、電子機器、動画圧縮プログラム、および伸張プログラム
JP2003283906A (ja) 高解像度撮像装置
JP7167928B2 (ja) 動画圧縮装置、電子機器、および動画圧縮プログラム
JP2013211644A (ja) 画像処理装置
WO2019065917A1 (ja) 動画圧縮装置、電子機器、および動画圧縮プログラム
CN112689175A (zh) 一种可直播滑板车
Sato et al. 8K Camera Recorder using Organic CMOS Image Sensor
JP2008263650A (ja) 固体撮像装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19777170

Country of ref document: EP

Kind code of ref document: A1

122 Ep: pct application non-entry in european phase

Ref document number: 19777170

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP