WO2011048742A1 - 半導体集積回路及びそれを備える撮像装置 - Google Patents

半導体集積回路及びそれを備える撮像装置 Download PDF

Info

Publication number
WO2011048742A1
WO2011048742A1 PCT/JP2010/005513 JP2010005513W WO2011048742A1 WO 2011048742 A1 WO2011048742 A1 WO 2011048742A1 JP 2010005513 W JP2010005513 W JP 2010005513W WO 2011048742 A1 WO2011048742 A1 WO 2011048742A1
Authority
WO
WIPO (PCT)
Prior art keywords
person
region
area
image
unit
Prior art date
Application number
PCT/JP2010/005513
Other languages
English (en)
French (fr)
Inventor
淳 高橋
Original Assignee
パナソニック株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パナソニック株式会社 filed Critical パナソニック株式会社
Publication of WO2011048742A1 publication Critical patent/WO2011048742A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/77Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body

Definitions

  • the present invention relates to a semiconductor integrated circuit connected to an imaging element and a memory, and an imaging apparatus including the semiconductor integrated circuit.
  • a digital still camera, digital video camera, etc. that forms a subject on an image sensor with a lens, performs various signal processing on the image data obtained by photoelectric conversion, displays the subject video on a liquid crystal monitor, etc., and records it on a recording medium
  • Such an image pickup apparatus has been put into practical use and widely used.
  • the photographer controls the direction of the camera and the zoom function to determine the composition of the subject and take a picture, such as shooting a scene where a child is playing.
  • the photographer does not necessarily change the camera work even if the user is urged to call attention to assist good camera work.
  • it provides a function to select and play a highly important scene from the shot scenes, so the objective is to shoot a good video if the camera work is not changed and shot Cannot be achieved.
  • Good video here refers to video that is attractive to watch and does not get tired, and is a short video that lasts from 5 seconds to several tens of seconds for one scene (camera work). Define. Most of the images taken by professional photographers, such as images broadcast on television and movies, are applicable to this law.
  • a semiconductor integrated circuit is a semiconductor integrated circuit connected to an image sensor and a memory, and stores a video captured by the image sensor as a main video in the memory.
  • a storage unit a detection unit that repeatedly detects a gaze region, which is a region to be watched, of the main video stored in the memory; and a video of the gaze region of the video imaged by the image sensor.
  • the sub-picture can be recorded with the composition where the person who wants to shoot is watched.
  • the sub-image can be recorded with the composition gazing at the person who wants to shoot.
  • the detection unit is further held in the holding unit holding a person information indicating a person, a person included in each of at least one person area detected by the person detection unit, and the holding unit.
  • a collation unit that collates the personal information, and the region detection unit may detect the gaze region based on a collation result by the collation unit.
  • the holding unit further holds feature data indicating the characteristics of the person corresponding to the person information
  • the collating unit is included in each of at least one person area detected by the person detecting unit.
  • a matching score indicating a similarity between the feature of the person and the feature data is calculated by comparing the feature of the person to be recorded and the feature data held in the holding unit, A region including a person region of a person with a high calculated collation score may be preferentially detected as the gaze region.
  • the holding unit further holds the number of times the person has been detected so far, corresponding to each person information included in the person area detected by the person detecting unit until now,
  • the area detection unit may preferentially detect the area including the person area of the person who is held by the holding unit as the gaze area.
  • the detection unit further includes a person direction detection unit that detects a direction of a person included in each of at least one person region detected by the person detection unit, and the region detection unit includes the person direction detection.
  • the gaze area may be detected using the orientation detected by the unit so that the area ahead of the person is larger than the area behind the person.
  • the predetermined time is preferably 5 seconds or more and 30 seconds or less.
  • the imaging device of the present invention includes the semiconductor integrated circuit, an imaging device, and a display device, and stores the main video and the sub video in the memory.
  • the composition determined by the photographer is monotonous and boring camera work, it is possible to record a moving image with a variety of changes as a sub-image. Further, since the main image is recorded as the photographer intends, even if there is an erroneous determination in the sub-image area switching, a failure that the scene that should be originally recorded is not recorded does not occur.
  • the semiconductor integrated circuit according to the present invention and the image pickup apparatus including the same can record a moving image by adaptively switching scenes as sub-pictures separately from a main picture taken by an amateur photographer.
  • FIG. 1 is a block diagram showing a system configuration of an imaging apparatus according to the present invention.
  • FIG. 2 is a schematic diagram for explaining main image reading.
  • FIG. 3 is a schematic diagram for explaining sub-image reading.
  • FIG. 4 is a diagram showing the data flow until an image is stored on a recording medium, focusing on the buffer configuration of the memory.
  • FIG. 5 is a diagram showing the image capturing operation of the digital processing unit in time series.
  • FIG. 6 is a schematic diagram for explaining the encoding operation of the main image and the sub-image.
  • FIG. 7 is a block diagram illustrating a detailed configuration of the detection unit.
  • FIG. 8 is a diagram for explaining the operation of the detection unit.
  • FIG. 9A is a diagram illustrating an example of a data structure of a person database.
  • FIG. 9B is a diagram illustrating an example of the data structure of the person result / collation result
  • FIG. 10 is a flowchart showing the operation of the region determination unit.
  • An image pickup apparatus is a semiconductor integrated circuit used by being connected to an image pickup device and a memory, wherein a main image storage unit that stores an image picked up by the image pickup device as a main image in the memory, and the memory A detection unit that detects a gaze area that is an area to be watched out of the main video stored in the image, and a video of the gaze area out of the video captured by the imaging device is stored in the memory as a sub-video.
  • a sub-video storage unit an encoder unit that compresses the main video and the sub-video stored in the memory by the main video storage unit and the sub-video storage unit; the main video compressed by the encoder unit;
  • a recording unit that records a sub-video on a recording medium, and the detection unit further determines whether or not the same subject is included in the gaze area for a predetermined period; and If it is determined that the contains the same subject by the tough, and a changing unit for changing the gaze region.
  • FIG. 1 is a block diagram illustrating a system configuration of an imaging apparatus according to an embodiment.
  • the imaging apparatus 100 includes a lens 1 that is a zoomable optical element, a lens driving unit 2 that drives the lens 1 to perform a zoom operation, and a zoom that specifies the zoom direction / zoom amount of the lens 1.
  • a switch 11 an image sensor 3 that photoelectrically converts subject light that has passed through the lens 1 and outputs an image signal; and an image sensor drive unit 4 that generates a drive signal for extracting an arbitrary region from the image sensor 3 as an image.
  • the analog processing unit 5 that performs various processes such as noise reduction, gain control, and A / D conversion on the analog image signal output from the image sensor 3, and the Y / C conversion process on the digitized image signal Or a digital processing unit 6 that performs electronic zoom processing, a memory 7 that temporarily stores an image processed by the digital processing unit 6, and an image stored in the memory 7
  • the encoder 8 that compresses the image into the format of the above
  • the recording unit 9 that stores the data compressed by the encoder 8 in a recording medium (recording medium) such as an SD card or HDD
  • the image output from the digital processing unit 6 This is an image area to be watched with respect to the display unit 10 that is a display device such as an LCD (Liquid Crystal Display) or an organic EL (Electro Luminescence) that is displayed as much as possible, and the image data processed by the digital processing unit 6.
  • a detection unit 12 that detects a gaze area
  • a control unit 13 that performs overall control
  • a mode switch 14 that receives
  • the imaging apparatus 100 includes the memory 7.
  • the present invention is not limited to an imaging apparatus with a built-in memory, and may be an imaging apparatus that is used connected to an external memory.
  • the digital processing unit 6, the encoder 8, the recording unit 9, the detection unit 12, and the control unit 13 that are processing units surrounded by a dotted line may be realized as a SoC (System on Chip).
  • the digital processing unit 6 includes a main image storage unit 15 and a sub image storage unit 16.
  • the main image storage unit 15 corresponds to a main video storage unit of the present invention that stores a video imaged by the image sensor 3 as a main video in the memory 7. Specifically, the main image storage unit 15 reads out an image signal corresponding to the image of the main image region that is the entire image captured by the image sensor 3 from the analog processing unit 5, and a plurality of main images that are temporally continuous. The main video image is stored in the memory 7.
  • the sub-image storage unit 16 corresponds to a sub-video storage unit of the present invention that stores, in the memory 7, the video of the gaze area among the video captured by the image sensor 3 as a sub-video. Specifically, the sub-image storage unit 16 reads out an image signal corresponding to the image of the gaze area detected by the detection unit 12 from the entire image formed from the analog processing unit 5 and continuously in time. Are stored in the memory 7 as sub-pictures composed of a plurality of sub-images.
  • FIGS. 2 and 3 are diagrams illustrating an operation in which the digital processing unit 6 reads an image from the image sensor 3.
  • the number of pixels of the image sensor 3 is 256 pixels of 16 pixels ⁇ 16 pixels
  • the number of pixels of the moving image stored in the memory 7 is 64 pixels of 8 pixels ⁇ 8 pixels.
  • the main image storage unit 15 included in the digital processing unit 6 stores the entire image (image of the main image area) 21 captured by the image sensor 3 in the memory 7 as the main image 22.
  • the main image storage unit 15 creates the main image 22 by reducing the vertical and horizontal dimensions of the image 21 in the main image area, for example, by 1/2. That is, the number of pixels of the main image 22 is halved in both the vertical and horizontal directions compared to the number of pixels of the image 21 in the main image area.
  • the sub-image storage unit 16 included in the digital processing unit 6 is an image of an image region to be watched detected by the detection unit 12 among the entire images 31 captured by the image sensor 3. (Gaze area image) 32 is stored in the memory 7 as the sub-image 33. At this time, the sub-image storage unit 16 creates the sub-image 33 at the same magnification without changing the vertical and horizontal magnifications.
  • the image sensor 3 has a larger number of pixels than the number of pixels of the image that the memory 7 records as the main image and the sub image.
  • the main image storage unit 15 may convert the number of pixels by thinning out the reading from the image sensor 3 when creating the main image 22, or may read all the pixels from the image sensor 3. In this case, the number of pixels subjected to digital filter processing may be converted.
  • the sub-image storage unit 16 has shown the example in which the gaze area image 32 and the sub-image 33 have the same number of pixels when the sub-image 33 is created, the number of pixels may be different or the number of pixels If they are different, pixel readout thinning or pixel number conversion by digital filter processing may be performed.
  • FIG. 4 is a diagram showing the data flow until the image formed on the image sensor 3 is stored in the recording medium, focusing on the buffer configuration of the memory 7.
  • the digital processing unit 6 includes a YC conversion processing unit 6A and a digital zoom unit 6B as hardware configurations.
  • the YC conversion processing unit 6A converts the RGB image signal output from the analog processing unit 5 into Y (luminance) and C (color difference) image signals.
  • the digital zoom unit 6B enlarges / reduces the image converted by the YC conversion processing unit 6A.
  • the entire image 21 is reduced by a factor of 1/2 by the digital zoom unit 6B and stored as the main image 22 in the memory 7.
  • the image 32 in the gaze area is cut out at the same magnification without being enlarged / reduced by the digital zoom unit 6B and stored in the memory 7 as the sub image 33.
  • the main image storage unit 15 has a hardware configuration of the YC conversion processing unit 6A and the digital zoom unit 6B
  • the sub-image storage unit 16 has a hardware configuration of the YC conversion processing unit 6A.
  • the sub-image storage unit 16 may have the hardware configuration of the digital zoom unit 6B, and may generate a sub-image by performing enlargement / reduction processing of the image 32 in the gaze area.
  • the encoder 8 performs compression processing using the main image 22 and the sub-image 33 stored in the memory 7 as input images.
  • the reference image and the encoded moving image necessary for the encoding process are stored in the encoding buffer 7C, and the recording unit 9 acquires the encoded moving image from the encoding buffer 7C and writes it to the recording medium.
  • the imaging device 3 since the imaging device 3 has a higher number of pixels than the number of moving image pixels, the sub-image does not require digital zoom processing, and the main image is also high. Since reduction processing is performed from a fine image, it is possible to suppress image quality deterioration. Further, since the image converted into a desired size is stored in the memory 7, it is possible to reduce the number of memory accesses and the memory capacity to be used.
  • FIG. 5 is a diagram showing the image capturing operation of the digital processing unit 6 in time series.
  • the imaging element 3 is an element capable of imaging at a speed higher than the moving image frame period, and is an imaging element capable of imaging 120 frames per second, for example.
  • the whole images 51a to 51h represent images picked up by the image pickup device 3 at a 1/120 second period.
  • the digital processing unit 6 stores the image in the memory 7 while switching between the main image and the sub image every frame period of the image sensor 3.
  • the main image storage unit 15 converts the number of pixels using the whole images 51b, 51d, 51f, and 51h as images of the main image region, and stores them in the memory 7 as the main images 53b, 53d, 53f, and 53h. Further, the sub-image storage unit 16 stores the gaze area images of the whole images 51a, 51c, 51e, and 51g having different times from the whole images 51b, 51d, 51f, and 51h as the sub-images 52a, 52c, 52e, and 52g. To store.
  • the main images 53b, 53d, 53f, and 53h have a 1/60 second cycle
  • the sub images 52a, 52c, 52e, and 52g also have a 1/60 second cycle. That is, the digital processing unit 6 generates two different series of images from one series of whole images and stores them in the memory 7.
  • the main image storage unit 15 corresponds to the main video storage unit of the present invention that stores in the memory 7 the main video composed of the main images 53b, 53d, 53f, and 53h captured at a 1/60 second period.
  • the sub-image storage unit 16 corresponds to a sub-video storage unit of the present invention that stores, in the memory 7, sub-videos composed of sub-images 52a, 52c, 52e, and 52g captured at a 1/60 second period.
  • FIG. 6 is a schematic diagram for explaining the operation of encoding the main image and the sub-image stored in the memory 7 and recording them on an external recording medium.
  • the encoder 8 compresses the main image 61 to generate a main image moving image 63 and also compresses the sub image 62 to generate a sub image moving image 64.
  • the recording unit 9 stores the generated two different moving images in the recording medium 65 as two files.
  • the encoder 8 compresses the main image 61 and the sub-image 62 to generate a multi-angle video 66.
  • the recording unit 9 stores the generated single multi-angle video 66 in the recording medium 65 as one file. That is, the encoder 8 compresses the main video and the sub video stored in the memory 7, and the recording unit 9 records the multi-angle moving image 66 generated by the compression by the encoder 8 on a recording medium that is a recording medium.
  • the imaging apparatus determines the readout frame period in accordance with the imaging capability (maximum frame period, number of pixels, etc.) of the imaging element 3 for the input of the main image and the input of the sub-image, and the encoder 8 determines the determined frame. You may make it compress an image by a period.
  • FIG. 7 is a block diagram showing a detailed configuration of the detection unit 12. In the figure, the digital processing unit 6, the control unit 13, and the mode changeover switch 14 are also shown.
  • the detecting unit 12 repeatedly detects a gaze area that is a gaze area in the main image.
  • the detection unit 12 includes a frame memory 71, a person detection unit 72, a person orientation detection unit 73, a person verification unit 74, a person registration unit 75, a person storage unit 76, an area determination unit 77, an elapsed time timer 78, and an invalid time timer 79. Is provided. Specifically, it is determined whether or not the same subject is included in the current gaze area for a predetermined period. If it is determined that the same gaze area is included, the gaze area is detected again.
  • the person storage unit 76 holds a person database 81, and the area determination unit 77 holds a person detection / collation result 82 and a priority state 83.
  • the frame memory 71 stores the main image by storing the image signal corresponding to the image of the main image area output from the main image storage unit 15 of the digital processing unit 6.
  • the frame memory 71 is a partial area of the memory 7, and the detection unit 12 captures a main image from the partial area of the memory 7 via the digital processing unit 6.
  • the frame memory 71 may be a physically different memory from the memory 7.
  • the person detection unit 72 detects at least one person area that is an area including at least one person in the main image. Specifically, the person detection unit 72 holds a person's characteristic pattern in advance, and determines whether or not a person is included in the main image stored in the frame memory 71 using pattern matching. When a person is included, an area including the person is detected as a person area. Further, the person detection unit 72 passes area information (area ID, position, size) indicating the detected person area to the area determination unit 77.
  • the area ID is an ID corresponding to each detected person area on a one-to-one basis
  • the position is a coordinate indicating the reference point of the person area in the main image
  • the size is the person area in the main image. It is a size.
  • the person orientation detection unit 73 detects the orientation of a person included in each of at least one person region detected by the person detection unit 72. Specifically, the person orientation detection unit 73 uses the information on the person area detected by the person detection unit 72 to detect which direction the person is facing, and the person orientation information (area ID, Direction and angle) to the region determination unit 77. For example, the image of the person area detected by the person detection unit 72 is extracted from the main image stored in the frame memory 71, the orientation of the person in the person area is specified from the extracted image of the person area, and the person orientation information Is detected.
  • the person collation unit 74 corresponds to the collation unit of the present invention, and collates the person included in each of at least one person area detected by the person detection unit 72 with the person information held in the person storage unit 76. To do. Specifically, the person collation unit 74 collates the characteristics of the person included in each of the at least one person area detected by the person detection unit 72 with the characteristic data held in the person storage unit 76. Thus, a collation score indicating the similarity between the feature of the person and the feature data is calculated. More specifically, the person collation unit 74 extracts the feature amount of the person using the information on the person area detected by the person detection unit 72 and the person direction information detected by the person direction detection unit 73.
  • the person collation unit 74 collates the extracted feature quantity with the feature quantity of the specific person registered in the person database 81 held in the person storage unit 76, and the similarity that is the probability that the person is a specific person.
  • Information is passed to the region determination unit 77.
  • the person verification unit 74 extracts an image of the person area detected by the person detection unit 72 from the main image stored in the frame memory 71, and features of the person included in the person area from the extracted image of the person area. Extract the amount. Then, by comparing the extracted feature quantity with the feature data of the specific person registered in the person database 81, a matching score indicating the similarity between the feature of the person included in the person region and the feature data Is calculated.
  • the person registering unit 75 registers new person feature data in the person database 81.
  • the person storage unit 76 corresponds to a holding unit of the present invention that holds person information indicating a person.
  • the person storage unit 76 includes a person database 81 that stores person information and person data indicating the characteristics of the person corresponding to the person information.
  • the data structure of the person database 81 will be described later.
  • the region determination unit 77 corresponds to the region detection unit of the present invention, and detects a region including any one of at least one person region detected by the person detection unit 72 as a gaze region. Specifically, the region determination unit 77 detects the gaze region based on the collation score that is the collation result by the person collation unit 74. More specifically, the region determination unit 77 is instructed by the photographer with the region information, the person orientation information, and the similarity information passed from the person detection unit 72, the person orientation detection unit 73, and the person verification unit 74. The gaze area is determined according to the mode. The area determination unit 77 has a person detection / collation result 82 and a priority state 83.
  • the person detection / collation result 82 is a database that stores information indicating the person area and information indicating the person in the person area corresponding to each person area detected by the person detection unit 72.
  • the data structure of the person detection / collation result 82 will be described later.
  • the priority state 83 indicates a mode that is a criterion for determining an area by the area determining unit 77. Specifically, the priority state 83 indicates one of (A) position priority mode, (B) size priority mode, and (C) collation priority mode. The priority state 83 is switched to any mode by the photographer operating the mode switch 14.
  • the position priority mode is a mode in which it is assumed that the composition is determined so that the person who the photographer wants to take is reflected in the center.
  • the region determination unit 77 preferentially focuses on a region including a person region closer to the center of the main image among at least one person region detected by the person detection unit 72. Detect as.
  • the size priority mode is a mode in which it is assumed that the photographer decides the composition so that the subject that he / she wants to shoot is displayed closer to the front.
  • the region determination unit 77 preferentially detects a region including a human region having a larger area as a gaze region among at least one human region detected by the person detection unit 72. To do.
  • the collation priority mode is a mode in which it is assumed that the person the photographer wants to take is determined in advance, such as his family or acquaintance.
  • the area determination unit 77 detects the gaze area based on the collation result by the person collation unit 74 when the priority state 83 is the collation priority mode. Specifically, an area including a person area of a person with a high matching score calculated by the person matching unit 74 is preferentially detected as a gaze area.
  • a predetermined elapsed time (for example, 10 seconds) is set by the area determination unit 77.
  • the elapsed time timer 78 generates an event when the set elapsed time has passed. Specifically, the elapsed time timer 78 prevents the region determination unit 77 from determining the same region for a predetermined elapsed time or more as the gaze region.
  • a predetermined invalid time (for example, 20 seconds) is set by the area determination unit 77.
  • the invalid time timer 79 generates an event when the set invalid time has passed. Specifically, the invalid time timer 79 is activated when the gaze area is the same area for a predetermined elapsed time or longer, thereby forcing the area determination unit 77 to change the gaze area.
  • the detection unit 12 configured as described above can adaptively switch the gaze area according to the mode instructed by the photographer.
  • FIG. 8 is a diagram for explaining the operation of the detection unit 12
  • FIG. 9A is a diagram illustrating an example of the data structure of the person database 81
  • FIG. 9B is data of the person result / collation result 82 It is a figure which shows an example of a structure.
  • the description here uses the position and orientation of the face as information for specifying a person, it is not limited to the region determination method using face information, and the region is determined using another method. It doesn't matter.
  • the main image 91 shown in FIG. 8 is an image of 16 pixels ⁇ 16 pixels and represents the position with the upper left pixel as the origin coordinates (0, 0).
  • the area information of the area ID 1 is represented as a position (11, 4) and a size 2.
  • the person database 81 stores name and feature amount data corresponding to each registered person registration ID.
  • feature amount data is registered by a photographer.
  • the person detection unit 72 detects a person area corresponding to each of the three persons from the main image 91, and passes the detection result to the area determination unit 77.
  • the detection results are, for example, a position (11, 4) as a region ID1, a region of size 2, a position (8, 7) as a region ID2, a region of size 2.5, and a position (2, 9) as a region ID3.
  • the area determination unit 77 that has received the detection result from the person detection unit 72 stores the detection result in the person detection / collation result 82.
  • the person orientation detection unit 73 detects the orientation of the person for each of the three person regions detected by the person detection unit 72 and passes the result to the region determination unit 77.
  • the detection results are, for example, 45 ° right as region ID1, 90 ° right as region ID2, and front as region ID3.
  • the area determination unit 77 that has received the detection result from the person orientation detection unit 73 stores the detection result in the person detection / collation result 82.
  • the person collation unit 74 collates each of the three person regions with the feature amount data registered in the person database 81 and passes the collation result to the region determination unit 77.
  • the area ID1 is 90 points as the collation score with the person registration ID1
  • the area ID2 is 80 points as the collation score with the person registration ID2
  • no area ID3 can be collated with the area ID3.
  • the area determination unit 77 that has received the collation result from the person collation unit 74 stores the collation result in the person detection / collation result 82.
  • the area determination unit 77 determines a gaze area based on the person detection / collation result 82 and the priority state 83.
  • FIG. 10 is a flowchart showing the operation of the area determining unit 77.
  • the area determination unit 77 determines whether the priority state 83 is (A) position priority mode, (B) size priority mode, or (C) collation priority mode (step S01).
  • the area determination unit 77 selects an area ID for which the validity flag is valid among the area IDs stored in the person detection / collation result 82.
  • An area ID corresponding to the position closest to the center of the main image is selected from the inside (step S02). For example, in the example of FIG. 8, the area ID of the person area closest to the position (8, 8) is selected. Therefore, the area ID2 is selected in FIGS. 8 and 9B.
  • the area determination unit 77 sets the validity flag among the area IDs stored in the person detection / collation result 82 to be valid.
  • the largest region ID is selected from the region IDs (step S03). For example, the area ID 3 is selected in FIGS. 8 and 9B.
  • the region determination unit 77 is a region where the validity flag is valid among the region IDs stored in the person detection / collation result 82.
  • a region ID having the highest matching score is selected from the IDs (step S04). For example, in FIG. 8 and FIG. 9B, the region ID1 is selected.
  • the area ID is not selected. In addition, regardless of the mode in which the priority state 83 is set, the area ID is not selected even if there is no person area detected by the person detection unit 72.
  • the area determination unit 77 determines whether there is a selected area ID after selecting an area ID corresponding to each mode ((A) position priority mode, (B) size priority mode, and (C) collation priority mode). It is determined whether or not (step S05).
  • the area determination unit 77 monitors the elapsed time when the same area ID is selected by the elapsed time timer 78 so as not to be monotonous camera work.
  • the area determination unit compares the area ID selected last time with the area ID selected this time, and determines whether or not there is a change in the area ID (Ste S07).
  • the area determination unit 77 sets an elapsed time in which selection of the same area ID is allowed in the elapsed time timer 78, and starts the elapsed time timer (step S1). S08).
  • the elapsed time timer 78 is reset to a predetermined time. This predetermined time is, for example, 5 seconds or more and 30 seconds or less. As a result, it is possible to make the video attractive without watching the sub-video.
  • the area determination unit 77 determines whether or not an event occurs by the elapsed time timer 78 ( Step S09).
  • step S09 When an event occurs by the elapsed time timer 78 (YES in step S09), that is, when the same area ID is continuously selected for a certain period, the area determination unit 77 selects the area ID selected for a certain period for the subsequent certain period. In order to prevent this from happening, the valid flag of the corresponding area ID of the person detection / collation result 82 is cleared. Further, the area determination unit 77 sets the invalid time of the corresponding area ID in the invalid time timer 79 and starts the invalid time timer 79 (step S10). Then, it returns to step S01 and repeats the said process.
  • the area ID selected with the priority according to the mode changes and before the event of the elapsed time set in the elapsed time timer 78 occurs.
  • the elapsed time timer 78 is reset.
  • an event of the elapsed time set in the elapsed time timer 78 occurs.
  • the validity flag of the corresponding area ID of the person detection / collation result 82 is cleared, and the corresponding area ID cannot be selected for a certain period.
  • the region determination unit 77 selects the next region ID during the period when the valid flag is cleared (step S02, step S03, or step S04), the remaining region IDs excluding the region ID for which the valid flag is cleared are used. A region ID having a high priority is selected. Thereby, since different person areas are selected at regular intervals, the gaze area is also different at regular intervals. Therefore, the imaging apparatus 100 can change the sub image.
  • step S05 when a certain period of time has passed with only one person detected in the main image, or when there is no region ID to be selected due to a change in camera work or movement of the subject (NO in step S05), The region of the main image 91 is set as the gaze region, and the elapsed time timer 78 is stopped (step S11). By doing so, it is possible to change the sub-image even when a plurality of persons are not detected.
  • the region IDs selected in succession must be returned to the selection target after a certain period. Specifically, when it is determined in step S09 that the event by the elapsed time timer 78 has not occurred (NO in step S09), or after the elapsed time timer 78 is stopped in step S11, the region determination unit 77 The invalid time timer 79 determines whether an event has occurred (step S12).
  • step S10 When an event is generated by the invalid time timer 79 set in step S10 (YES in step S12), the validity flag of the corresponding area ID of the person detection / collation result 82 is validated to return the corresponding area ID to the selection target. Then, the invalid time timer 79 is stopped (step S13). Then, it returns to step S01 and repeats the said process.
  • step S12 when the event by the invalid time timer 79 does not occur (NO in step S12), the process returns to step S01 and the above processing is repeated.
  • the detection unit 12 adaptively switches the gaze area according to the mode instructed by the photographer. Therefore, the imaging apparatus 100 according to the present embodiment can record a variety of video as a sub-image even when the photographer performs photographing with monotonous camera work.
  • the imaging apparatus 100 includes the main image storage unit 15 that stores the image captured by the image sensor 3 as the main image in the memory 7, and the main image stored in the memory 7.
  • a detection unit 12 that repeatedly detects a gaze region that is a region to be watched, a sub-image storage unit 16 that stores a video of the gaze region in the memory 7 as a sub-video among images captured by the image sensor 3,
  • An encoder 8 that compresses the main image and the sub-image stored in the memory 7 by the image storage unit 15 and the sub-image storage unit 16, and a recording unit 9 that records the main image and the sub-image compressed by the encoder 8 on a recording medium;
  • the detection unit 12 determines whether or not the same subject is included in the current gaze area for a predetermined period. When it is determined that the current gaze area is included, the detection unit 12 detects the gaze area again.
  • the imaging apparatus 100 can record a moving image by adaptively switching the scene as a sub-image separately from the main image taken by the amateur photographer.
  • the imaging device concerning the present invention was explained based on an embodiment, the present invention is not limited to these embodiments.
  • Other forms realized by combining arbitrary components in these embodiments, and forms obtained by subjecting these embodiments to modifications conceivable by those skilled in the art without departing from the gist of the present invention are also possible. Are included in the present invention.
  • the physical location of the frame memory 71 is not mentioned, and may exist on the memory 7.
  • the ID is temporarily invalidated and the next candidate is selected.
  • the area ID may be switched to a different area ID, or the previously selected area ID and The integrated area including both the area IDs selected this time may be set as the gaze area.
  • the gaze area may be instantaneously switched from the area A to the area B. The area may be continuously moved so that virtual pan / tilt / zoom is performed from A to the area B.
  • the elapsed time value set in the elapsed time timer 78 may be the same every time, and when a low priority area ID is selected, the elapsed time to be set is shortened, and the time is changed in conjunction with the priority. May be. The same applies when invalidating the area ID.
  • the elapsed time timer 78 that measures the elapsed time and the invalid time timer 79 that measures the invalid time may physically exist separately, or may be physically configured so that two systems can be used logically. Good.
  • the contents of the embodiment may be realized as hardware as a semiconductor integrated circuit, or a part of the processing may be realized as software.
  • the digital processing unit 6, the encoder 8, the recording unit 9, the detection unit 12, and the control unit 13 may be formed as a one-chip or multiple-chip semiconductor integrated circuit.
  • the constituent elements constituting the imaging apparatus 100 may be configured by one or a plurality of system LSIs (Large Scale Integrations).
  • the system LSI is a super multifunctional LSI manufactured by integrating a plurality of components on one chip, and specifically, a computer system including a microprocessor, a ROM, a RAM, and the like. .
  • a computer program is stored in the RAM.
  • the system LSI achieves its functions by the microprocessor operating according to the computer program.
  • the system LSI is called here, but it may be called IC, LSI, super LSI, or ultra LSI depending on the degree of integration.
  • the method of circuit integration is not limited to LSI's, and implementation using dedicated circuitry or general purpose processors is also possible.
  • an FPGA Field Programmable Gate Array
  • a reconfigurable processor that can reconfigure the connection and setting of circuit cells inside the LSI may be used.
  • the imaging apparatus may be the following embodiment.
  • the person registration unit 75 registers the person detected this time in the person database 81 and counts the appearance frequency.
  • the area determination unit 77 can select an area including a specific individual as a gaze area using the appearance frequency of the newly registered person and the matching result.
  • the person storage unit 76 holds the number of times that the person has been detected so far, corresponding to each person information of the person included in the person area detected by the person detection unit 72, and the area determination unit 77
  • the region including the person region of the person who is held in the person storage unit 76 with a large number of times is preferentially detected as the gaze region. In this way, since a person who frequently appears in the imaging apparatus can be photographed as a sub-image, the photographer can avoid the trouble of registering the person in advance.
  • a person motion detection unit may be provided in addition to the person direction detection unit 73, and the frame of the sub-image area may be shifted in consideration of not only the direction of the person but also the movement direction.
  • the imaging apparatus 100 can be realized as, for example, a digital video camera shown in FIG.
  • the present invention is useful in the field of, for example, a consumer video camera, as an imaging device, particularly as an imaging device that allows an amateur photographer to easily shoot a good image.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Studio Devices (AREA)
  • Television Signal Processing For Recording (AREA)
  • Transforming Light Signals Into Electric Signals (AREA)

Abstract

 本発明の半導体集積回路は、撮像素子(3)により撮像された映像を主映像としてメモリ(7)に格納する主画像格納部(15)と、メモリ(7)に格納された主映像のうち、注視すべき領域である注視領域を繰り返し検出する検出部(12)と、撮像素子(3)により撮像された映像のうち、注視領域の映像を副映像としてメモリ(7)に格納する副画像格納部(16)と、メモリ(7)に格納された主映像及び副映像を圧縮するエンコーダ(8)と、エンコーダ(8)により圧縮された主映像及び副映像を記録媒体に記録する記録部(9)とを備え、検出部(12)は、現在の注視領域に所定期間同一の被写体が含まれるか否かを判定し、含まれると判定した場合、注視領域を再度検出する。

Description

半導体集積回路及びそれを備える撮像装置
 本発明は、撮像素子及びメモリに接続される半導体集積回路と、当該半導体集積回路を備える撮像装置とに関する。
 被写体をレンズにより撮像素子上に結像させ、光電変換により得られた画像データに各種信号処理を施し、液晶モニターなどに被写体映像を表示させると共に記録媒体に記録するデジタルスチルカメラやデジタルビデオカメラなどの撮像装置が実用化され広く普及している。撮影者はカメラの向きやズーム機能を制御し、子供が遊んでいるシーンを撮影するなど被写体の構図を自分の意思で決定し撮影を行なっている。
 アマチュアの撮影者がビデオ撮影を行なう場合、一般的には撮影に関する訓練を受けていないので、しばしば誤った判断、操作で撮影を行なうため、観て楽しめる良好な映像になっていない場合がある。その多くは撮りっ放しの映像であり、冗長で退屈なものとなってしまう。またこのように記録された映像を魅力ある映像にするには撮影後の編集作業が必要になるが、編集作業には技術と時間を要するため実施されない場合が多い。
 応用技術として、撮影者のカメラワークをモニターし、ズームアップのシーンばかりが続くなど撮影状態に偏りがある場合、撮影者に注意喚起し良好な映像が撮影できるようアシストする技術が提案されている(例えば特許文献1)。また本応用技術では、再生時に重要なシーンのみを選択して再生できるように、撮影状態の変化によりメタデータを生成し優先度の高い順に決められた個数のメタデータを付帯情報として記録する技術も開示されている。
特開2008-227859号公報
 しかしながら、上記従来の撮像装置においては、良好なカメラワークをアシストする注意喚起を促したとしても必ずしも撮影者がカメラワークを変更するとは限らない。また、撮影されたシーンの中から重要度の高いシーンを選択して再生するための機能を提供しているので、実際にカメラワークを変更して撮影されなければ良好な映像を撮影するという目的を達成できない。
 ここで言う良好な映像とは、観ていて魅力的な(飽きない)映像を意味し、1つのシーン(カメラワーク)の持続時間が5秒から長くて数十秒程度の短い映像のことと定義する。テレビで放送される映像や映画などで上映される映像である、プロのカメラマンが撮影した映像はこの法則に当てはまっているものがほとんどである。
 本発明は、上記従来の課題を解決するものであり、アマチュアの撮影者が撮影する主映像とは別に、副映像として適応的にシーンの切り替えを行ない躍動感のある映像を記録する半導体集積回路を提供することを目的とする。また、そのような半導体集積回路を含む撮像装置を提供することも、本発明の目的に含まれる。
 上記目的を達成するため、本発明に係る半導体集積回路は、撮像素子及びメモリに接続される半導体集積回路であって、前記撮像素子により撮像された映像を主映像として前記メモリに格納する主映像格納部と、前記メモリに格納された前記主映像のうち、注視すべき領域である注視領域を繰り返し検出する検出部と、前記撮像素子により撮像された映像のうち、前記注視領域の映像を副映像として前記メモリに格納する副映像格納部と、前記主映像格納部及び前記副映像格納部により前記メモリに格納された前記主映像及び前記副映像を圧縮するエンコーダ部と、前記エンコーダ部により圧縮された前記主映像及び前記副映像を記録媒体に記録する記録部とを備え、前記検出部は、現在の注視領域に所定期間同一の被写体が含まれるか否かを判定し、含まれると判定した場合、前記注視領域を再度検出する。
 かかる構成により、撮影者が単調なカメラワークで撮影を行なった場合でも、副映像には変化のある映像を記録することができる。
 また、前記検出部は、前記撮像素子により撮像された映像のうち、人物が含まれる領域である少なくとも1つの人物領域を検出する人物検出部と、検出された少なくとも1つの人物領域のいずれかを含む領域を前記注視領域として検出する領域検出部とを備えてもよい。
 かかる構成により、人物を撮影した場合に映っている人物に注視する構図で副映像を記録することができる。
 また、前記領域検出部は、検出された少なくとも1つの人物領域のうち、前記主映像の中心に近い人物領域を含む領域ほど優先的に前記注視領域として検出してもよい。
 かかる構成により、撮影者が撮りたい人物を画面の中心になるように構図を決定する場合に、撮りたい人物を注視する構図で副映像を記録することができる。
 また、前記領域検出部は、検出された少なくとも1つの人物領域のうち、面積が大きい人物領域を含む領域ほど優先的に前記注視領域として検出してもよい。
 かかる構成により、撮影者が撮りたい人物を画面の手前に大きく配置されるように構図を決定する場合に、撮りたい人物を注視する構図で副画像を記録することができる。
 また、前記検出部は、さらに、人物を示す人物情報を保持している保持部と、前記人物検出部により検出された少なくとも1つの人物領域のそれぞれに含まれる人物と、前記保持部に保持されている前記人物情報とを照合する照合部を備え、前記領域検出部は、前記照合部による照合結果に基づいて前記注視領域を検出してもよい。
 また、前記保持部は、さらに、前記人物情報に対応して、人物の特徴を示す特徴データを保持し、前記照合部は、前記人物検出部により検出された少なくとも1つの人物領域のそれぞれに含まれる人物の特徴と、前記保持部に保持されている前記特徴データとを照合することにより、当該人物の特徴と当該特徴データとの類似度を示す照合スコアを算出し、前記領域検出部は、算出された前記照合スコアが高い人物の人物領域を含む領域ほど優先的に前記注視領域として検出してもよい。
 かかる構成により、撮影する人物が予め決まっている場合に、撮りたい人物を注視する構図で副画像を記録することができる。
 また、前記保持部は、さらに、現在までに前記人物検出部により検出された人物領域に含まれる人物の人物情報ごとに対応して、当該人物が現在までに検出された回数を保持し、前記領域検出部は、前記保持部に保持された回数が多い人物の人物領域を含む領域ほど優先的に前記注視領域として検出してもよい。
 かかる構成により、撮影する人物が予め決まっていない場合に、頻繁に撮影されている人物を撮りたい人物として注視する構図で副画像を記録することができる。よって、撮影者は、予め人物を登録する必要がなくなり、煩わしさを回避できる。
 また、前記検出部は、さらに、前記人物検出部により検出された少なくとも1つの人物領域のそれぞれに含まれる人物の向きを検出する人物向き検出部を備え、前記領域検出部は、前記人物向き検出部により検出された前記向きを用いて、人物の後方の領域よりも前方の領域が大きくなるように前記注視領域を検出してもよい。
 かかる構成により、撮りたい人物を注視するとともに、人物の見ている方向にある被写体も合わせた形で構図を決定し副映像を記録することができる。つまり、人物の視線方向の領域を含む映像を副映像として撮影できるので、見ていて分かりやすい映像にすることができる。
 また、前記所定時間は、5秒以上かつ30秒以下が望ましい。
 かかる構成により、副映像を観ていて飽きない魅力的な映像にできる。
 また、本発明の撮像装置は、上記半導体集積回路と、撮像素子と、表示装置とを備え、前記主映像及び前記副映像を前記メモリに格納する。
 本発明によれば、撮影者の決定した構図が単調で退屈なカメラワークであったとしても、副画像としては変化に富んだ躍動感のある映像を記録することが可能となる。また、主画像は撮影者の意思のまま記録されるため、副画像の領域切り替えに誤判定があったとしても本来記録されるべき場面が記録されていないという失敗が発生することもない。
 つまり、本発明に係る半導体集積回路及びそれを備える撮像装置は、アマチュアの撮影者が撮影する主映像とは別に、副映像として適応的にシーンの切り替えを行ない躍動感のある映像を記録できる。
図1は、本発明の撮像装置のシステム構成を示すブロック図である。 図2は、主画像読み出しを説明するための模式図である。 図3は、副画像読み出しを説明するための模式図である。 図4は、画像が記録メディアに格納されるまでのデータフローについて、メモリのバッファ構成について着目して示した図である。 図5は、デジタル処理部の画像取り込み動作を時系列で示した図である。 図6は、主画像および副画像のエンコード動作を説明するための模式図である。 図7は、検出部の詳細な構成を示すブロック図である。 図8は、検出部の動作を説明するための図である。 図9Aは、人物データベースのデータ構造の一例を示す図である。 図9Bは、人物結果・照合結果のデータ構造の一例を示す図である 図10は、領域決定部の動作を示すフローチャートである。 図11は、本発明の撮像装置の外観図である。
 本発明の撮像装置は、撮像素子およびメモリに接続して使用される半導体集積回路であって、前記撮像素子により撮像された映像を主映像として前記メモリに格納する主映像格納部と、前記メモリに格納された前記主映像のうち、注視すべき領域である注視領域を検出する検出部と、前記撮像素子により撮像された映像のうち、前記注視領域の映像を副映像として前記メモリに格納する副映像格納部と、前記主映像格納部及び前記副映像格納部により前記メモリに格納された前記主映像及び前記副映像を圧縮するエンコーダ部と、前記エンコーダ部により圧縮された前記主映像及び前記副映像を記録媒体に記録する記録部とを備え、前記検出部は、さらに、前記注視領域に所定期間同一の被写体が含まれるか否かを判定する判定部と、前記判定部により前記同一の被写体が含まれると判定された場合、前記注視領域を変更する変更部とを備える。
 以下、本発明の実施の形態における撮像装置について、図面を参照しながら説明する。
 図1は、実施の形態に係る撮像装置のシステム構成を示すブロック図である。
 本実施の形態に係る撮像装置100は、ズーム可能な光学素子であるレンズ1と、レンズ1を駆動しズーム動作を行なわせるレンズ駆動部2と、レンズ1のズーム方向/ズーム量を指定するズームスイッチ11と、レンズ1を通過した被写体光を光電変換して画像信号を出力する撮像素子3と、撮像素子3から任意の領域を画像として取り出すための駆動信号を生成する撮像素子駆動部4と、撮像素子3から出力されるアナログの画像信号にノイズ低減やゲイン制御、A/D変換などの各種処理を実施するアナログ処理部5と、デジタル化された画像信号に対してY/C変換処理や電子的なズーム処理を実施するデジタル処理部6と、デジタル処理部6により処理された画像を一時記憶しておくメモリ7と、メモリ7に格納された画像を所定のフォーマットに画像圧縮するエンコーダ8と、エンコーダ8により画像圧縮されたデータをSDカードやHDDなどの記録メディア(記録媒体)に格納する記録部9と、デジタル処理部6から出力される画像を確認可能なように表示するLCD(Liquid Crystal Display)や有機EL(Electro Luminescence)等の表示装置である表示部10と、デジタル処理部6により処理された画像データに対して注視すべき画像領域である注視領域を検出する検出部12と、全体制御を実施する制御部13と、撮影者によるモード切替指示を受け付けるモード切替スイッチ14とを備える。
 なお、本実施の形態では、撮像装置100がメモリ7を有しているが、本発明は、メモリ内蔵の撮像装置に限られず、外部のメモリに接続されて使用される撮像装置であってもよい。また、点線で囲まれた処理部であるデジタル処理部6、エンコーダ8、記録部9、検出部12及び制御部13は、SoC(System on Chip)として実現されていてもよい。
 デジタル処理部6は、主画像格納部15および副画像格納部16を備える。
 主画像格納部15は、撮像素子3に撮像された映像を主映像としてメモリ7に格納する、本発明の主映像格納部に相当する。具体的には、主画像格納部15は、撮像素子3に撮像された全体画像である主画像領域の画像に対応する画像信号をアナログ処理部5から読み出して、時間的に連続する複数の主画像からなる主映像としてメモリ7へ格納する。
 副画像格納部16は、撮像素子3に撮像された映像のうち、注視領域の映像を副映像としてメモリ7に格納する、本発明の副映像格納部に相当する。具体的には、副画像格納部16は、結像された全体画像のうち、検出部12により検出された注視領域の画像に対応する画像信号をアナログ処理部5から読み出して、時間的に連続する複数の副画像からなる副映像としてメモリ7へ格納する。
 次に各構成要素について、より具体的に説明する。
 図2および図3は撮像素子3からデジタル処理部6が画像を読み出す動作を示す図である。説明を簡単にするため、例えば、撮像素子3の画素数を16画素×16画素の256画素、メモリ7に格納される動画の画素数を8画素×8画素の64画素とする。
 図2に示されるように、デジタル処理部6が有する主画像格納部15は、撮像素子3により撮像された全体画像(主画像領域の画像)21を主画像22としてメモリ7に格納する。このとき、主画像格納部15は、主画像領域の画像21の縦横を例えば1/2倍に縮小して主画像22を作成する。つまり、主画像22の画素数は、主画像領域の画像21の画素数と比較して、縦横それぞれ1/2となる。
 また、図3に示されるように、デジタル処理部6が有する副画像格納部16は、撮像素子3により撮像された全体画像31のうち、検出部12により検出された注視すべき画像領域の画像(注視領域の画像)32を副画像33としてメモリ7に格納する。このとき副画像格納部16は、縦横の倍率は変えず等倍で副画像33を作成する。このように、撮像素子3は、メモリ7が主画像および副画像として記録する画像の画素数よりも多い数の画素数を有している。
 なお、主画像格納部15は、主画像22を作成する際に、撮像素子3からの読出しを間引くことで画素数の変換を行なってもよいし、あるいは撮像素子3からは全画素を読み出しておいて、デジタルフィルタ処理を施した画素数変換を行なってもよい。
 また、副画像格納部16は、副画像33を作成する際に、注視領域の画像32と副画像33が同じ画素数である例を示したが、画素数が異なってもよいし、画素数が異なる場合には画素読出しの間引きや、デジタルフィルタ処理による画素数変換を行なってもよい。
 次に、撮像素子3に結像された画像が、記録部9により記録メディアに記録されるまでの流れについて説明する。
 図4は、撮像素子3に結像された画像が記録メディアに格納されるまでのデータフローについて、メモリ7のバッファ構成について着目して示した図である。
 同図に示すように、デジタル処理部6は、ハードウェア構成としては、YC変換処理部6Aとデジタルズーム部6Bとを備える。YC変換処理部6Aは、アナログ処理部5から出力されたRGBの画像信号をY(輝度)およびC(色差)の画像信号に変換する。デジタルズーム部6Bは、YC変換処理部6Aで変換された画像の拡大/縮小を行う。
 図2および図3で説明している例では、全体画像21はデジタルズーム部6Bにより1/2倍に縮小され、主画像22としてメモリ7に格納される。一方、注視領域の画像32は、デジタルズーム部6Bによる拡大/縮小処理を行なわず、等倍で切り出されて副画像33としてメモリ7に格納される。つまり、主画像格納部15は、YC変換処理部6Aおよびデジタルズーム部6Bのハードウェア構成を有し、副画像格納部16は、YC変換処理部6Aのハードウェア構成を有する。なお、副画像格納部16はデジタルズーム部6Bのハードウェア構成を有し、注視領域の画像32の拡大/縮小処理を行い、副画像を生成してもよい。
 次に、メモリ7に格納された主画像22および副画像33を入力画像としてエンコーダ8は圧縮処理を行なう。この際、エンコード処理に必要な参照画像やエンコードされた動画はエンコードバッファ7Cに格納され、記録部9はエンコードバッファ7Cからエンコードされた動画を取得し記録メディアに書き込む。
 このように、本実施の形態の撮像装置100は、撮像素子3が動画画素数よりも高精細な画素数を有しているため、副画像はデジタルズーム処理が不要になり、主画像についても高精細な画像から縮小処理を行なうため、画質劣化を抑えることが可能となる。また、所望のサイズに変換した画像をメモリ7へ格納するため、メモリアクセス回数や使用するメモリ容量を削減することも可能になる。
 図5は、デジタル処理部6の画像取り込み動作を時系列で示した図である。撮像素子3は動画フレーム周期よりも高速に撮像可能な素子であり、例えば、毎秒120フレーム撮像できる撮像素子である。ここで、全体画像51a~51hは1/120秒周期で撮像素子3に撮像された画像を表している。デジタル処理部6は、撮像素子3の1フレーム周期ごとに主画像と副画像とを切り替えながらメモリ7へ画像を格納する。
 すなわち主画像格納部15は、全体画像51b、51d、51f、51hを主画像領域の画像として画素数を変換し、主画像53b、53d、53f、53hとしてメモリ7へ格納する。また、副画像格納部16は、全体画像51b、51d、51f、51hとは時間が異なる全体画像51a、51c、51e、51gの注視領域の画像を副画像52a、52c、52e、52gとしてメモリ7へ格納する。
 これにより、主画像53b、53d、53f、53hは1/60秒周期、副画像52a、52c、52e、52gも1/60秒周期となる。つまり、デジタル処理部6は、1系列の全体画像から異なる2つの系列の画像を生成し、メモリ7へ格納する。言い換えると、主画像格納部15は、1/60秒周期で撮像された主画像53b、53d、53f、53hからなる主映像をメモリ7に格納する、本発明の主映像格納部に相当する。また、副画像格納部16は、1/60秒周期で撮像された副画像52a、52c、52e、52gからなる副映像をメモリ7に格納する、本発明の副映像格納部に相当する。
 図6は、メモリ7に格納された主画像および副画像をエンコードし、外部の記録メディアに記録する動作を説明するための模式図である。
 エンコーダ8は、主画像61を画像圧縮し主画像動画63を生成すると共に、副画像62を画像圧縮し副画像動画64を生成する。記録部9は生成された2つの異なる動画を2つのファイルとして記録メディア65に格納する。
 また、エンコーダ8は主画像61と副画像62を画像圧縮しマルチアングル動画66を生成する。記録部9は生成された1つのマルチアングル動画66を1つのファイルとして記録メディア65に格納する。つまり、エンコーダ8はメモリ7に格納された主映像及び副映像を圧縮し、記録部9はエンコーダ8により圧縮されることにより生成されたマルチアングル動画66を記録媒体である記録メディアに記録する。
 なお、ここでは2つの異なる画像をエンコードする例を記載しているが2つに限定するものではない。また、複数の動画として記録する場合において、関連のある動画であることを示すためにファイル名やファイル管理情報の属性に特徴を持たせるようなことを実施しても構わない。
 また、撮像装置は、主画像の入力および副画像の入力について、撮像素子3の撮像能力(最高フレーム周期、画素数など)に応じて読み出しフレーム周期を決定し、エンコーダ8はそれぞれ決定されたフレーム周期で画像圧縮するようにしてもよい。
 次に、検出部12による注視領域の検出方法について説明する。
 図7は、検出部12の詳細な構成を示すブロック図である。なお、同図にはデジタル処理部6、制御部13及びモード切替スイッチ14も示されている。
 検出部12は、主画像のうち注視すべき領域である注視領域を繰り返し検出する。この検出部12は、フレームメモリ71、人物検出部72、人物向き検出部73、人物照合部74、人物登録部75、人物記憶部76、領域決定部77、経過時間タイマー78及び無効時間タイマー79を備える。具体的には、現在の注視領域に所定期間同一の被写体が含まれるか否かを判定し、含まれると判定した場合、注視領域を再度検出する。また、人物記憶部76は人物データベース81を保持し、領域決定部77は人物検出・照合結果82及び優先状態83を保持する。
 フレームメモリ71は、デジタル処理部6の主画像格納部15から出力された主画像領域の画像に対応する画像信号を格納することにより、主画像を格納する。このフレームメモリ71はメモリ7の一部の領域であり、検出部12はデジタル処理部6を介してメモリ7の当該一部の領域から主画像を取り込む。なお、フレームメモリ71は、メモリ7とは物理的に別のメモリであってもよい。
 人物検出部72は、主画像のうち、少なくとも1人の人物が含まれる領域である少なくとも1つの人物領域を検出する。具体的には、人物検出部72は、人物の特徴的なパターンを予め保持しており、パターンマッチングを用いて、フレームメモリ71に格納された主画像に人物が含まれる否かを判定し、人物が含まれる場合、当該人物を含む領域を人物領域として検出する。さらに、人物検出部72は、検出した人物領域を示す領域情報(領域ID、位置、大きさ)を領域決定部77に渡す。ここで、領域IDとは検出した人物領域のそれぞれと1対1に対応するIDであり、位置とは主画像における人物領域の基準点を示す座標であり、大きさとは主画像における人物領域の大きさである。
 人物向き検出部73は、人物検出部72で検出された少なくとも1つの人物領域のそれぞれに含まれる人物の向きを検出する。具体的には、人物向き検出部73は、人物検出部72で検出された人物領域の情報を使用し、その人物がどちらの方向を向いているかを検出し、人物の向き情報(領域ID、方向、角度)を領域決定部77に渡す。例えば、人物検出部72で検出された人物領域の画像をフレームメモリ71に格納された主画像から抽出し、抽出した人物領域の画像から当該人物領域の人物の向きを特定し、人物の向き情報を検出する。
 人物照合部74は、本発明の照合部に相当し、人物検出部72により検出された少なくとも1つの人物領域のそれぞれに含まれる人物と、人物記憶部76に保持されている人物情報とを照合する。具体的には、人物照合部74は、人物検出部72により検出された少なくとも1つの人物領域のそれぞれに含まれる人物の特徴と、人物記憶部76に保持されている特徴データとを照合することにより、当該人物の特徴と当該特徴データとの類似度を示す照合スコアを算出する。より具体的には、人物照合部74は、人物検出部72で検出された人物領域の情報や人物向き検出部73で検出された人物向き情報を使用して人物の特徴量を抽出する。さらに、人物照合部74は、抽出した特徴量と、人物記憶部76に保持されている人物データベース81に登録された特定人物の特徴量とを照合し、特定人物である確からしさである類似度情報(領域ID、照合スコア)を領域決定部77に渡す。例えば、人物照合部74は、人物検出部72で検出された人物領域の画像をフレームメモリ71に格納された主画像から抽出し、抽出した人物領域の画像から当該人物領域に含まれる人物の特徴量を抽出する。そして、抽出した特徴量と、人物データベース81に登録された特定人物との特徴データとを照合することにより、当該人物領域に含まれる人物の特徴と、当該特徴データとの類似度を示す照合スコアを算出する。
 人物登録部75は、人物照合部74で照合した人物が人物データベース81に登録されていなかった場合、人物データベース81に新たな人物の特徴量データを登録する。
 人物記憶部76は、人物を示す人物情報を保持している、本発明の保持部に相当する。具体的には、人物記憶部76は、人物情報と、当該人物情報に対応して、人物の特徴を示す人物データとが格納された人物データベース81を有する。人物データベース81のデータ構造については、後述する。
 領域決定部77は、本発明の領域検出部に相当し、人物検出部72によって検出された少なくとも1つの人物領域のいずれかを含む領域を注視領域として検出する。具体的には、領域決定部77は、人物照合部74による照合結果である照合スコアに基づいて注視領域を検出する。より具体的には、領域決定部77は、人物検出部72、人物向き検出部73及び人物照合部74から渡された領域情報、人物の向き情報及び類似度情報と、撮影者により指示されたモードとに応じて、注視領域を決定する。この領域決定部77は、人物検出・照合結果82と優先状態83とを有する。
 人物検出・照合結果82は、人物検出部72で検出された人物領域ごとに対応して、当該人物領域を示す情報及び当該人物領域の人物を示す情報を格納するデータベースである。この人物検出・照合結果82のデータ構造については後述する。
 優先状態83は、領域決定部77による領域を決定するための判断基準となるモードを示す。具体的には、優先状態83は、(A)位置優先モード、(B)大きさ優先モード及び(C)照合優先モードのいずれかを示す。この優先状態83は、撮影者がモード切替スイッチ14を操作することにより、いずれかのモードに切り替えられる。
 (A)位置優先モードは、撮影者が撮りたい人物をより中央に映るよう構図を決定することを想定したモードである。領域決定部77は、優先状態83が位置優先モードの場合に、人物検出部72により検出された少なくとも1つの人物領域のうち、主画像の中心に近い人物領域を含む領域ほど優先的に注視領域として検出する。
 (B)大きさ優先モードは、撮影者が自身の撮りたい被写体をより手前に、より大きく映るように構図を決定することを想定したモードである。領域決定部77は、優先状態83が大きさ優先モードの場合に、人物検出部72により検出された少なくとも1つの人物領域のうち、面積が大きい人物領域を含む領域ほど優先的に注視領域として検出する。
 (C)照合優先モードは、撮影者が撮りたい人物は自分の家族や知人など予め決まっていることを想定したモードである。領域決定部77は、優先状態83が照合優先モードの場合に、人物照合部74による照合結果に基づいて注視領域を検出する。具体的には、人物照合部74により算出された照合スコアが高い人物の人物領域を含む領域ほど優先的に注視領域として検出する。
 経過時間タイマー78は、領域決定部77により、所定の経過時間(例えば、10秒)が設定される。そして、経過時間タイマー78は、設定された経過時間が過ぎた場合にイベントを発生する。具体的には、経過時間タイマー78は、領域決定部77により所定の経過時間以上同一の領域が注視領域として決定されることを防止する。
 無効時間タイマー79は、領域決定部77により、所定の無効時間(例えば、20秒)が設定される。そして、無効時間タイマー79は、設定された無効時間が過ぎた場合にイベントを発生する。具体的には、無効時間タイマー79は、注視領域が所定の経過時間以上同一の領域である場合に起動されることにより、領域決定部77に注視領域を強制的に変更させる。
 以上のように構成された検出部12は、撮影者によって指示されたモードに応じて、注視領域を適応的に切り替えることができる。
 次に、図8、図9A及び図9Bを用いて、上記のように構成された検出部12の動作を説明する。具体的には、図8は検出部12の動作を説明するための図であり、図9Aは人物データベース81のデータ構造の一例を示す図であり、図9Bは人物結果・照合結果82のデータ構造の一例を示す図である。なお、ここでは人物を特定するための情報として顔の位置や向きを用いて説明するが、顔情報を用いた領域決定方法に限定するものではなく、別の手法を用いて領域を決定しても構わない。
 図8に示す主画像91は16画素×16画素の画像であり左上の画素を原点座標(0,0)として位置を表す。例えば、領域ID1の領域情報としては、位置(11,4)、大きさ2として表される。
 人物データベース81は、図9Aに示すように、登録された人物登録IDごとに対応して、名前及び特徴量データが格納されている。この人物データベース81には、例えば、撮影者により特徴量データが登録されている。
 人物検出・照合結果82は、人物検出部72で検出された領域IDごとに対応して、当該領域IDに対応する人物領域の位置及び大きさと、当該人物領域に含まれる人物の向きと、当該人物領域に含まれる人物の照合スコアと、当該人物領域を有効とするか否かを示す有効フラグとが格納されている。具体的には、この人物検出・照合結果82は、人物検出部72で検出された領域ID、位置及び大きさと、人物向き検出部73で検出された向きと、人物照合部74で算出された照合スコアと、当該人物領域を注視領域として選択できるか否かを示す有効フラグとが格納されている。
 まず人物検出部72は、主画像91から3人の人物それぞれに対応する人物領域を検出し、検出結果を領域決定部77に渡す。検出結果はそれぞれ、例えば、領域ID1として位置(11,4)、大きさ2の領域、領域ID2として位置(8,7)、大きさ2.5の領域、領域ID3として位置(2,9)、大きさ3の領域となっている。人物検出部72から検出結果を受け取った領域決定部77は、当該検出結果を人物検出・照合結果82に格納する。
 次に人物向き検出部73は、人物検出部72により検出された3つの人物領域のそれぞれについて人物の向き検出を行ない、結果を領域決定部77に渡す。検出結果はそれぞれ、例えば領域ID1として右45°、領域ID2として右90°、領域ID3として正面となっている。人物向き検出部73から検出結果を受け取った領域決定部77は、当該検出結果を人物検出・照合結果82に格納する。
 次に人物照合部74は、前記3つの人物領域のそれぞれに対して人物データベース81に登録済みの特徴量データとの照合を行ない、照合結果を領域決定部77に渡す。照合結果はそれぞれ、例えば、領域ID1は人物登録ID1との照合スコアとして90ポイント、領域ID2は人物登録ID2との照合スコアとして80ポイント、領域ID3と照合できたものは存在しないとなっている。人物照合部74から照合結果を受け取った領域決定部77は、当該照合結果を人物検出・照合結果82に格納する。
 次に、領域決定部77は、人物検出・照合結果82及び優先状態83に基づき、注視領域を決定する。
 図10は、領域決定部77の動作を示すフローチャートである。
 領域決定部77は、優先状態83が(A)位置優先モード、(B)大きさ優先モード及び(C)照合優先モードのいずれであるかを判定する(ステップS01)。
 優先状態83が(A)位置優先モードの場合(ステップS01で位置優先モード)、領域決定部77は、人物検出・照合結果82に格納された各領域IDのうち有効フラグが有効な領域IDの中から、主画像の中心に最も近い位置に対応する領域IDを選択する(ステップS02)。例えば、図8の例においては、位置(8,8)に最も近い人物領域の領域IDが選択される。よって、図8及び図9Bでは領域ID2が選択される。
 また、優先状態83が(B)大きさ優先モードの場合(ステップS01で大きさ優先モード)、領域決定部77は、人物検出・照合結果82に格納された各領域IDのうち有効フラグが有効な領域IDの中から、最も大きさが大きい領域IDを選択する(ステップS03)。例えば、図8及び図9Bでは領域ID3が選択される。
 また、優先状態83が(C)照合優先モードの場合(ステップS01で照合優先モード)、領域決定部77は、人物検出・照合結果82に格納された各領域IDのうち有効フラグが有効な領域IDの中から、照合スコアが最も高い領域IDを選択する(ステップS04)。例えば、図8及び図9Bでは領域ID1が選択される。
 なお、優先状態83がいずれのモードであっても、人物検出・照合結果82に格納された各領域IDのうち有効フラグが有効な領域IDがない場合、領域IDは選択されない。また、優先状態83がいずれのモードであっても、人物検出部72で検出された人物領域がない場合も、領域IDは選択されない。
 次に、領域決定部77は、各モード((A)位置優先モード、(B)大きさ優先モード及び(C)照合優先モード)に応じた領域IDの選択後に、選択した領域IDがあるか否かを判断する(ステップS05)。
 選択された領域IDがある場合(ステップS05でYES)、選択した領域IDの人物領域を含む領域92を注視領域とする(ステップS06)。例えば、図8及び図9Bにおいて位置優先モードの場合、領域決定部77は領域92を注視領域とすることになる。ここで、領域決定部77は、選択した領域IDの人物領域が注視領域の中心になるように、注視領域を決定する。
 なお、領域ID2の人物領域に含まれる人物の向きが右90°であるので、人物領域を中心に注視領域を決定するのではなく、当該人物の向いている方向に何か別の被写体が存在すると判断し、人物の向きの方向にシフトさせた領域を中心に注視領域を決定してもよい。例えば、図8において、領域ID2をシフトさせた領域を中心とする領域93を注視領域としてもよい。こうすることで、本実施の形態に係る撮像装置100は、人物の視線方向も副画像として撮影できるので、見て分かりやすい映像にすることができる。
 ところで、領域決定部77は、単調なカメラワークにならないよう、経過時間タイマー78により同一領域IDが選択されている経過時間を監視する。
 具体的には、領域決定部は注視領域を決定(ステップS06)した後に、前回選択された領域IDと今回選択された領域IDを比較し、領域IDに変化があるか否かを判断する(ステップS07)。
 領域IDに変化があった場合(ステップS07でYES)、領域決定部77は、経過時間タイマー78に同一の領域IDの選択が許容される経過時間を設定し、経過時間タイマーを起動する(ステップS08)。言い換えると、経過時間タイマー78を、所定時間に再設定する。この所定時間とは、例えば、5秒以上かつ30秒以下である。これにより、副映像を観ていて飽きない魅力的な映像にできる。
 一方、領域IDに変化がない場合(ステップS07でNO)、又は、経過時間タイマー78を再設定した後、領域決定部77は、経過時間タイマー78によりイベントが発生するか否かを判断する(ステップS09)。
 経過時間タイマー78によりイベントが発生した場合(ステップS09でYES)、つまり同一の領域IDが一定期間選択され続けた場合、領域決定部77は、一定期間選択された領域IDを以降の一定期間選択させないようにするため人物検出・照合結果82の該当する領域IDの有効フラグをクリアする。さらに、領域決定部77は、該当する領域IDの無効時間を無効時間タイマー79に設定し、無効時間タイマー79を起動する(ステップS10)。その後、ステップS01に戻り、上記処理を繰り返す。
 撮影者がカメラワークを変更したり、被写体が移動したりする場合は、モードに応じた優先度で選択される領域IDが変化し、経過時間タイマー78に設定した経過時間のイベントが発生する前に、経過時間タイマー78が再設定される。ところが単調なカメラワークで動きの少ないシーンなどの場合は、同一領域IDが一定期間選択され続け、経過時間タイマー78が再設定されないため、経過時間タイマー78に設定した経過時間のイベントが発生し、人物検出・照合結果82の該当する領域IDの有効フラグをクリアし該当する領域IDが一定期間選択できないようになる。有効フラグがクリアされている期間において、領域決定部77が次回領域IDを選択する際には(ステップS02、ステップS03又はステップS04)、有効フラグがクリアされた領域IDを除く残りの領域IDから優先度の高い領域IDを選択する。これにより、異なる人物領域が一定期間毎に選択されるので、注視領域も一定期間毎に異なる領域となる。よって、撮像装置100は、副画像に変化をつけることができる。
 ここで、主画像内に検出された人物が1人しかいない状態で一定期間経過したとき、あるいはカメラワークの変更もしくは被写体の移動により選択すべき領域IDがなくなった場合(ステップS05でNO)、主画像91の領域を注視領域とし、経過時間タイマー78を停止する(ステップS11)。こうすることで複数の人物が検出されない場合でも副画像に変化をつけることができる。
 連続で選択された領域IDは、一定期間後に選択対象に戻さなければならない。具体的には、ステップS09で経過時間タイマー78によるイベントが発生しなかったと判断された場合(ステップS09でNO)、又は、ステップS11における経過時間タイマー78を停止した後に、領域決定部77は、無効時間タイマー79によりイベントが発生した否かを判断する(ステップS12)。
 ステップS10で設定された無効時間タイマー79によりイベントが発生した場合(ステップS12でYES)、該当する領域IDを選択対象に戻すため人物検出・照合結果82の該当する領域IDの有効フラグを有効にし、無効時間タイマー79を停止する(ステップS13)。その後、ステップS01に戻り、上記処理を繰り返す。
 一方、無効時間タイマー79によるイベントが発生しない場合(ステップS12でNO)、ステップS01に戻り、上記処理を繰り返す。
 このように、検出部12は、撮影者によって指示されたモードに応じて、注視領域を適応的に切り替える。よって、本実施の形態に係る撮像装置100は、撮影者が単調なカメラワークで撮影を行った場合でも、副画像として変化に富んだ映像を記録することができる。
 以上のように、本実施の形態に係る撮像装置100は、撮像素子3により撮像された画像を主画像としてメモリ7に格納する主画像格納部15と、メモリ7に格納された主画像のうち、注視すべき領域である注視領域を繰り返し検出する検出部12と、撮像素子3に撮像された画像のうち、注視領域の映像を副映像としてメモリ7に格納する副画像格納部16と、主画像格納部15及び副画像格納部16によりメモリ7に格納された主画像及び副画像を圧縮するエンコーダ8と、エンコーダ8により圧縮された主画像及び副画像を記録媒体に記録する記録部9とを備え、検出部12は、現在の注視領域に所定期間同一の被写体が含まれるか否かを判定し、含まれると判定した場合、注視領域を再度検出する。
 これにより、本実施の形態に係る撮像装置100は、アマチュアの撮影者が撮影する主画像とは別に、副画像として適応的にシーンの切り替えを行ない躍動感のある映像を記録できる。
 以上、本発明に係る撮像装置について、実施の形態に基づいて説明したが、本発明は、これらの実施の形態に限定されるものではない。これらの実施の形態における任意の構成要素を組み合わせて実現される別の形態や、本発明の主旨を逸脱しない範囲でこれらの実施の形態に対して当業者が思いつく変形を施して得られる形態も、本発明に含まれる。
 例えば、フレームメモリ71の物理的な場所は言及しておらず、メモリ7上に存在してもよい。また、一定期間同一の領域IDが選択され続けた場合に一旦そのIDを無効化し次の候補を選択するが、その際に異なる領域IDに切り替えてもよいし、以前選択されていた領域IDと今回選択された領域IDの両方を含む統合領域を注視領域としてもよい。また、一の人物領域を含む領域Aから他の一の人物領域を含む領域Bへ注視領域を切り替えるときは、領域Aからと領域Bへと注視領域を瞬間的に切り替えてもよいし、領域Aから領域Bへと仮想的なパン/チルト/ズームを行なっているように連続的に領域を移動させてもよい。
 また、経過時間タイマー78に設定する経過時間の値は毎回同じでもよいし、優先度の低い領域IDが選択されたときは設定する経過時間を短くするなど、優先度に連動して時間を変更してもよい。領域IDを無効にする場合も同様である。経過時間を計測する経過時間タイマー78と、無効時間を計測する無効時間タイマー79とは、物理的に別々に存在してもよいし、物理的には1つで論理的に2系統使える構成でもよい。
 また、実施の形態の内容は半導体集積回路として全てハードウェアで実現されてもよいし、一部の処理をソフトウェアで実現しても構わない。例えば、デジタル処理部6、エンコーダ8、記録部9、検出部12及び制御部13は、1チップ又は複数チップの半導体集積回路として形成されていてもよい。
 例えば、上記の撮像装置100を構成する構成要素の一部又は全部は、1個又は複数個のシステムLSI(Large Scale Integration:大規模集積回路)から構成されているとしてもよい。システムLSIは、複数の構成要素を1個のチップ上に集積して製造された超多機能LSIであり、具体的には、マイクロプロセッサ、ROM、RAMなどを含んで構成されるコンピュータシステムである。上記RAMには、コンピュータプログラムが記憶されている。上記マイクロプロセッサが、上記コンピュータプログラムにしたがって動作することにより、システムLSIは、その機能を達成する。
 また、ここでは、システムLSIと呼称したが、集積度の違いにより、IC、LSI、スーパーLSI、ウルトラLSIと呼称されることもある。また、集積回路化の手法はLSIに限られるものではなく、専用回路又は汎用プロセッサで実現してもよい。また、LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。
 さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて構成要素の集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
 また、図10では説明していないが、本発明に係る撮像装置は、次のような実施の形態でも構わない。ステップS04において照合優先モードで人物データベース81に登録されていない人物が検出された場合は、人物登録部75は今回検出された人物を人物データベース81に登録し、出現頻度をカウントする。領域決定部77は、新規に登録された人物の出現頻度と照合結果とを用いて特定の個人が含まれる領域を注視領域として選択することが可能となる。つまり、人物記憶部76は、人物検出部72により検出された人物領域に含まれる人物の人物情報ごとに対応して、当該人物が現在までに検出された回数を保持し、領域決定部77は、人物記憶部76に保持された回数が多い人物の人物領域を含む領域ほど優先的に注視領域として検出する。こうすることで、撮像装置が頻繁に出現する人物を副画像として撮影できるので、撮影者は、予め人物を登録しておくという煩わしさを回避することができる。
 また、人物向き検出部73に加えて人物動き検出部を設け、人物の向きだけでなく動き方向も考慮して副画像領域の枠をシフトさせてもよい。
 また、上記実施の形態においては、被写体として人物を挙げたがこれに限らない。例えば、被写体として動物でもよいし、飛行機又は電車でもよい。
 また、実施の形態に係る撮像装置100は、例えば、図11に示すデジタルビデオカメラとして実現できる。
 本発明は、撮像装置として、特に、アマチュアの撮影者が手軽に良好な映像を撮影できる撮像装置として、例えば民生用ビデオカメラなどの分野で有用である。
1 レンズ
2 レンズ駆動部
3 撮像素子
4 撮像素子駆動部
5 アナログ処理部
6 デジタル処理部
7 メモリ
8 エンコーダ
9 記録部
10 表示部
11 ズームスイッチ
12 検出部
13 制御部
15 主画像格納部
16 副画像格納部
21、31、51a~51h 全体画像
22、53b、53d、53f、53h、61、91 主画像
32 注視領域の画像
33、52a、52c、52e、52g、62 副画像
63 主画像動画
64 副画像動画
65 記録メディア
66 マルチアングル動画
71 フレームメモリ
72 人物検出部
73 人物向き検出部
74 人物照合部
75 人物登録部
76 人物記憶部
77 領域決定部
78 経過時間タイマー
79 無効時間タイマー
81 人物データベース
82 人物検出・照合結果
92、93 領域

Claims (10)

  1.  撮像素子及びメモリに接続される半導体集積回路であって、
     前記撮像素子により撮像された映像を主映像として前記メモリに格納する主映像格納部と、
     前記メモリに格納された前記主映像のうち、注視すべき領域である注視領域を繰り返し検出する検出部と、
     前記撮像素子により撮像された映像のうち、前記注視領域の映像を副映像として前記メモリに格納する副映像格納部と、
     前記主映像格納部及び前記副映像格納部により前記メモリに格納された前記主映像及び前記副映像を圧縮するエンコーダ部と、
     前記エンコーダ部により圧縮された前記主映像及び前記副映像を記録媒体に記録する記録部とを備え、
     前記検出部は、
     現在の注視領域に所定期間同一の被写体が含まれるか否かを判定し、含まれると判定した場合、前記注視領域を再度検出する
     半導体集積回路。
  2.  前記検出部は、
     前記撮像素子により撮像された映像のうち、人物が含まれる領域である少なくとも1つの人物領域を検出する人物検出部と、
     検出された少なくとも1つの人物領域のいずれかを含む領域を前記注視領域として検出する領域検出部とを備える
     請求項1記載の半導体集積回路。
  3.  前記領域検出部は、
     検出された少なくとも1つの人物領域のうち、前記主映像の中心に近い人物領域を含む領域ほど優先的に前記注視領域として検出する
     請求項2記載の半導体集積回路。
  4.  前記領域検出部は、
     検出された少なくとも1つの人物領域のうち、面積が大きい人物領域を含む領域ほど優先的に前記注視領域として検出する
     請求項2記載の半導体集積回路。
  5.  前記検出部は、さらに、
     人物を示す人物情報を保持している保持部と、
     前記人物検出部により検出された少なくとも1つの人物領域のそれぞれに含まれる人物と、前記保持部に保持されている前記人物情報とを照合する照合部を備え、
     前記領域検出部は、
     前記照合部による照合結果に基づいて前記注視領域を検出する
     請求項2記載の半導体集積回路。
  6.  前記保持部は、さらに、
     前記人物情報に対応して、人物の特徴を示す特徴データを保持し、
     前記照合部は、
     前記人物検出部により検出された少なくとも1つの人物領域のそれぞれに含まれる人物の特徴と、前記保持部に保持されている前記特徴データとを照合することにより、当該人物の特徴と当該特徴データとの類似度を示す照合スコアを算出し、
     前記領域検出部は、
     算出された前記照合スコアが高い人物の人物領域を含む領域ほど優先的に前記注視領域として検出する
     請求項5記載の半導体集積回路。
  7.  前記保持部は、さらに、
     現在までに前記人物検出部により検出された人物領域に含まれる人物の人物情報ごとに対応して、当該人物が現在までに検出された回数を保持し、
     前記領域検出部は、
     前記保持部に保持された回数が多い人物の人物領域を含む領域ほど優先的に前記注視領域として検出する
     請求項5記載の半導体集積回路。
  8.  前記検出部は、さらに、前記人物検出部により検出された少なくとも1つの人物領域のそれぞれに含まれる人物の向きを検出する人物向き検出部を備え、
     前記領域検出部は、前記人物向き検出部により検出された前記向きを用いて、人物の後方の領域よりも前方の領域が大きくなるように前記注視領域を検出する
     請求項2記載の半導体集積回路。
  9.  前記所定時間は、5秒以上かつ30秒以下である
     請求項1記載の半導体集積回路。
  10.  請求項1記載の半導体集積回路と、撮像素子と、表示装置とを備え、
     前記主映像及び前記副映像を前記メモリに格納する
     撮像装置。
     
     
     
PCT/JP2010/005513 2009-10-19 2010-09-09 半導体集積回路及びそれを備える撮像装置 WO2011048742A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2009-240768 2009-10-19
JP2009240768A JP2011087257A (ja) 2009-10-19 2009-10-19 半導体集積回路及び撮像装置

Publications (1)

Publication Number Publication Date
WO2011048742A1 true WO2011048742A1 (ja) 2011-04-28

Family

ID=43899987

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2010/005513 WO2011048742A1 (ja) 2009-10-19 2010-09-09 半導体集積回路及びそれを備える撮像装置

Country Status (2)

Country Link
JP (1) JP2011087257A (ja)
WO (1) WO2011048742A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015216686A (ja) * 2015-07-23 2015-12-03 オリンパス株式会社 撮影機器
JP2016174425A (ja) * 2016-06-30 2016-09-29 オリンパス株式会社 撮影機器
CN112640428A (zh) * 2018-12-05 2021-04-09 索尼半导体解决方案公司 固态成像装置、信号处理芯片和电子设备

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5886479B2 (ja) * 2013-11-18 2016-03-16 オリンパス株式会社 撮像装置、撮像アシスト方法及び撮像アシストプログラムを記録した記録媒体
JPWO2023079623A1 (ja) * 2021-11-04 2023-05-11

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004187124A (ja) * 2002-12-05 2004-07-02 Minolta Co Ltd 撮像装置
JP2006109119A (ja) * 2004-10-06 2006-04-20 Omron Corp 動画記録装置および動画再生装置
JP2007150603A (ja) * 2005-11-25 2007-06-14 Nikon Corp 電子カメラ
JP2008205650A (ja) * 2007-02-16 2008-09-04 Sony Corp 画像処理装置及び画像処理方法、撮像装置、並びにコンピュータ・プログラム
JP2008244976A (ja) * 2007-03-28 2008-10-09 Casio Comput Co Ltd 撮像装置、撮像画像の撮影記録方法およびプログラム
JP2009033369A (ja) * 2007-07-26 2009-02-12 Sony Corp 記録装置、再生装置、記録再生装置、撮像装置、記録方法およびプログラム
JP2009182905A (ja) * 2008-01-31 2009-08-13 Casio Comput Co Ltd 撮像装置及びそのプログラム
JP2009212714A (ja) * 2008-03-03 2009-09-17 Olympus Imaging Corp 撮像装置、画像再生装置、撮影プログラム、画像再生プログラム、撮影制御方法及び画像再生方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004187124A (ja) * 2002-12-05 2004-07-02 Minolta Co Ltd 撮像装置
JP2006109119A (ja) * 2004-10-06 2006-04-20 Omron Corp 動画記録装置および動画再生装置
JP2007150603A (ja) * 2005-11-25 2007-06-14 Nikon Corp 電子カメラ
JP2008205650A (ja) * 2007-02-16 2008-09-04 Sony Corp 画像処理装置及び画像処理方法、撮像装置、並びにコンピュータ・プログラム
JP2008244976A (ja) * 2007-03-28 2008-10-09 Casio Comput Co Ltd 撮像装置、撮像画像の撮影記録方法およびプログラム
JP2009033369A (ja) * 2007-07-26 2009-02-12 Sony Corp 記録装置、再生装置、記録再生装置、撮像装置、記録方法およびプログラム
JP2009182905A (ja) * 2008-01-31 2009-08-13 Casio Comput Co Ltd 撮像装置及びそのプログラム
JP2009212714A (ja) * 2008-03-03 2009-09-17 Olympus Imaging Corp 撮像装置、画像再生装置、撮影プログラム、画像再生プログラム、撮影制御方法及び画像再生方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015216686A (ja) * 2015-07-23 2015-12-03 オリンパス株式会社 撮影機器
JP2016174425A (ja) * 2016-06-30 2016-09-29 オリンパス株式会社 撮影機器
CN112640428A (zh) * 2018-12-05 2021-04-09 索尼半导体解决方案公司 固态成像装置、信号处理芯片和电子设备
CN112640428B (zh) * 2018-12-05 2023-10-17 索尼半导体解决方案公司 固态成像装置、信号处理芯片和电子设备

Also Published As

Publication number Publication date
JP2011087257A (ja) 2011-04-28

Similar Documents

Publication Publication Date Title
US8665345B2 (en) Video summary including a feature of interest
US9013604B2 (en) Video summary including a particular person
US8587658B2 (en) Imaging device, image display device, and program with intruding object detection
JP5810307B2 (ja) 撮像装置
JP5456023B2 (ja) 画像撮影装置、画像撮影方法、プログラム、及び集積回路
WO2009133693A1 (ja) 撮像装置
JPH114398A (ja) デジタルワイドカメラ
JP2011139282A (ja) 画像処理装置、撮像装置、画像処理方法およびプログラム
US20100246968A1 (en) Image capturing apparatus, image processing method and recording medium
WO2011048742A1 (ja) 半導体集積回路及びそれを備える撮像装置
JP2012105205A (ja) キーフレーム抽出装置、キーフレーム抽出プログラム、キーフレーム抽出方法、撮像装置、およびサーバ装置
JP2014050022A (ja) 画像処理装置、撮像装置、およびプログラム
KR101469544B1 (ko) 영상 처리 방법 및 장치, 이를 이용한 디지털 촬영 장치
JP5519376B2 (ja) 電子機器
US9374525B2 (en) Shooting apparatus and shooting method
JP2014123908A (ja) 画像処理装置、画像切り出し方法、及びプログラム
JP5369776B2 (ja) 撮像装置、撮像方法、及び撮像プログラム
JP2011119936A (ja) 撮影装置及び再生方法
JP4849330B2 (ja) 表示制御装置および方法、撮像装置、情報処理装置および方法、並びにプログラム
JP2011119934A (ja) 画像撮影装置及び画像撮影方法
JP2011101161A (ja) 撮像装置、その制御方法、再生装置およびプログラム
JP5170217B2 (ja) カメラ、カメラ制御プログラム及び撮影方法
JP2001094919A (ja) 画像記録装置、方法、及びコンピュータ読み取り可能な記憶媒体
JP2012029119A (ja) 表示制御装置、カメラ、および、表示装置
JP6979799B2 (ja) カメラおよび動画の撮影方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10824597

Country of ref document: EP

Kind code of ref document: A1

122 Ep: pct application non-entry in european phase

Ref document number: 10824597

Country of ref document: EP

Kind code of ref document: A1