JP7077141B2 - 画像記録装置、画像記録方法およびプログラム - Google Patents
画像記録装置、画像記録方法およびプログラム Download PDFInfo
- Publication number
- JP7077141B2 JP7077141B2 JP2018101560A JP2018101560A JP7077141B2 JP 7077141 B2 JP7077141 B2 JP 7077141B2 JP 2018101560 A JP2018101560 A JP 2018101560A JP 2018101560 A JP2018101560 A JP 2018101560A JP 7077141 B2 JP7077141 B2 JP 7077141B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- frame
- unit
- still image
- moving image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 102
- 238000003384 imaging method Methods 0.000 claims description 71
- 238000011156 evaluation Methods 0.000 claims description 68
- 230000008569 process Effects 0.000 claims description 61
- 230000033001 locomotion Effects 0.000 claims description 59
- 230000001133 acceleration Effects 0.000 claims description 19
- 238000010801 machine learning Methods 0.000 description 21
- 238000012545 processing Methods 0.000 description 21
- 238000012854 evaluation process Methods 0.000 description 16
- 238000013136 deep learning model Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 13
- 230000003287 optical effect Effects 0.000 description 12
- 238000004891 communication Methods 0.000 description 11
- 238000001514 detection method Methods 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000003780 insertion Methods 0.000 description 6
- 230000037431 insertion Effects 0.000 description 6
- 238000010191 image analysis Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000006073 displacement reaction Methods 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 239000002131 composite material Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000005484 gravity Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 230000002457 bidirectional effect Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000004904 shortening Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000005401 electroluminescence Methods 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/804—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
- H04N9/8042—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/91—Television signal processing therefor
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00007—Time or data compression or expansion
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/34—Indicating arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/107—Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/114—Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
- H04N19/139—Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/4223—Cameras
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/433—Content storage operation, e.g. storage operation in response to a pause request, caching operations
- H04N21/4334—Recording operations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/8146—Monomedia components thereof involving graphical data, e.g. 3D object, 2D graphics
- H04N21/8153—Monomedia components thereof involving graphical data, e.g. 3D object, 2D graphics comprising still images, e.g. texture, background image
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
- H04N21/8455—Structuring of content, e.g. decomposing content into time segments involving pointers to the content, e.g. pointers to the I-frames of the video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/50—Constructional details
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/50—Constructional details
- H04N23/54—Mounting of pick-up tubes, electronic image sensors, deviation or focusing coils
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/50—Constructional details
- H04N23/55—Optical parts specially adapted for electronic image sensors; Mounting thereof
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/80—Camera processing pipelines; Components thereof
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00007—Time or data compression or expansion
- G11B2020/00072—Time or data compression or expansion the compressed signal including a video signal
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computer Graphics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Studio Devices (AREA)
- Television Signal Processing For Recording (AREA)
Description
例えば、特許文献1に記載の記録方法は、動画の記録中に所定の操作を受け付け、その操作が行われときIピクチャを生成し、生成したIピクチャを静止画像として記録する。Iピクチャとは、動画を構成する複数のフレームの画像のうち、他のフレームの画像を参照せずに自フレームでのフレーム内予測を行って符号化の対象とするフレームの画像を意味する。記録された静止画像に対応するフレームから動画を再生するとき、当該静止画像に対応するフレームがIピクチャであるため、他のフレームから再生を行うよりも再生処理に要する処理量が少なくなる。
図1は、本実施形態に係る画像記録装置10の機能構成の一例を示すブロック図である。
画像記録装置10は、画像を撮像し、撮像した画像を示す画像データを符号化し、符号化により得られる符号化データを記録する。画像記録装置10は、動画像と静止画像を撮像し、記録可能とする。また、画像記録装置10は、動画像の撮像中に静止画像を撮像することを可能としてもよい。画像記録装置10は、専用の撮像装置(カメラ)であってもよいし、他の機能を有する電子機器、例えば、多機能携帯電話機、タブレット端末装置、などとして実装されてもよい。
なお、第2撮像部103の撮像素子は、撮像の指示がなされるか否かに関わらず、第2画像を撮像してもよい。そして、合焦制御部は撮像される第2画像に対して合焦制御を実行してもよい。
表示制御部122は、操作部101から入力される操作信号に基づいて表示に係る機能を制御する。表示制御部122は、例えば、操作信号に基づいて、画像復号部111と表示部112による動画像の表示もしくは表示停止、静止画像の表示などを制御する。撮像制御部121及び表示制御部122が実行する処理の例については、後述する。
画像復号部111は、復号制御信号が第2符号化データを指示するとき、読み出した第2符号化データを復号して第2画像データを生成し、生成した第2画像データを表示部112に出力する。
第2符号化データの復号に用いられる復号方式は、第2符号化データの符号化に用いられた静止画像符号化方式に対応する復号方式であればよい。
画像復号部111から第1画像データが入力されるとき、表示部112は、第1画像データが示す第1画像(動画像)を表示する。画像復号部111から第2画像データが入力されるとき、表示部112は、第2画像データが示す第2画像(静止画像)を表示する。
なお、第1撮像部102は、操作部101からの第1画像の表示を示す操作信号の入力に応じて、制御部104から第1画像の表示を指示する表示制御信号が入力されるとき、第1画像データを表示部112に出力してもよい。表示部112は、第1画像の撮像中に、その第1画像(動画像)を表示する。
次に、ユーザ操作に応じた画像記録装置10の動作例について説明する。
図2に示す例は、主に撮像に係る画像記録装置10の動作を示す。図2の横軸は、時刻tを示す。図2に対して右方ほど時間が経過していることを示す。図2では上から下の順に、ユーザ操作、制御部104(撮像制御部121)、動画像符号化部105及び静止画像符号化部106の状態を示す。
IDRフレーム待機期間の閾値ΔTは、静止画像の撮像の指示から現実に撮像に至るまでに許容される遅延時間(例えば、0.2~1.0秒)以内であればよい。
より具体的には、撮像制御部121は、動画像符号化部105から入力されるIDRフレーム待機期間T3が予め自部に設定された所定のIDRフレーム待機期間ΔT以下であるとき、処理対象のフレームが次にIDRフレームになるまで待機する。ここで、撮像制御部121は、動画像符号化部105からのIDR情報の待ち状態をセットする。撮像制御部121は、IDR情報の待ち状態がセットされている間、動画像符号化部105からのIDR情報の入力を待機する。撮像制御部121は、動画像符号化部105からIDR情報が入力されるとき、セットしたIDR情報の待ち状態を解除する。その後、撮像制御部121は、静止画像の撮像を指示するための撮像指示信号を第2撮像部103に出力する。
次に、本実施形態に係る画像記録処理について説明する。
図3は、本実施形態に係る画像記録処理の一例を示すフローチャートである。
(ステップS102)撮像制御部121は、操作部101から入力される操作信号に基づき、動画像の撮像開始が指示されたか否かを判定する。撮像開始が指示されるとき(ステップS102 YES)、ステップS104の処理に進む。撮像開始が指示されないとき(ステップS102 NO)、ステップS102の処理を繰り返す。
(ステップS108)撮像制御部121は、IDRフレーム待機期間Tが所定のIDRフレーム待機期間の閾値ΔT以下であるか否かを判定する。IDRフレーム待機期間Tが閾値ΔT以下であるとき(ステップS108 YES)、ステップS110の処理に進む。IDRフレーム待機期間Tが閾値ΔTを超えるとき(ステップS108 NO)、ステップS112の処理に進む。
(ステップS112)撮像制御部121は、IDR挿入要求信号を動画像符号化部105に出力する。動画像符号化部105は、撮像制御部121からIDR挿入要求信号が入力されるとき、その時点で符号化対象とするフレームをIDRフレームとして定める。その後、ステップS120の処理に進む。
(ステップS116)撮像制御部121は、動画像符号化部105からIDR情報が入力されたか否かを判定する。IDR情報が入力されるとき(ステップS116 YES)、ステップS118の処理に進む。IDR情報が入力されないとき(ステップS116 NO)、ステップS122の処理に進む。
(ステップS120)撮像制御部121は、静止画像の撮像を示す撮像制御信号を第2撮像部103に出力する。第2撮像部103は、第2画像を撮像する。静止画像符号化部106は、第2画像を示す第2画像データを符号化し、符号化により得られる第2符号化データを記録部107に記録する。その後、ステップS122の処理に進む。
(ステップS122)動画像符号化部105は、第1撮像部102から入力される第1符号化データを符号化し、符号化により得られる第1符号化データを記録部107に記録する。その後、処理対象のフレームを次のフレームに進め、ステップS104の処理に進む。
動画像符号化部105は、第1照会信号に対する応答として、その時点で定めたIDRフレーム待機期間Tを撮像制御部121に通知する。
次に、画像記録装置10が撮像した画像の表示例について説明する。
図4は、本実施形態に係る、画像記録装置10が撮像した画像の表示例を示す図である。
表示制御部122は、動画像の表示を指示する操作信号が入力されるとき、所定のビューアVw01を表示部112に表示させ、操作信号で指示される動画像を示す第1符号化データを記録部107から画像復号部111に読み出させる。画像復号部111は、第1符号化データと対応付けて記憶された静止画像を表す第2符号化データと、第1符号化データと対応付けられた時刻を示す時刻情報を読み出す。時刻情報は、第1符号化データが示す動画像の冒頭の時点を基準とする時刻、つまり冒頭からの経過時間として表された再生時点であってもよい。画像復号部111は、読み出した第2符号化データを復号して静止画像を示す第2画像データを生成する。生成した第2画像データと時刻情報を表示制御部122に出力する。画像復号部111は、第2符号化データの復号の際、符号化の際に用いた符号化方式に対応する復号方式を用いる。
表示制御部122は、表示されたサムネイルのいずれかの押下を検知するとき、画像復号部111に対して、そのサムネイルの位置に対応する再生時点から第1符号化データの復号を開始させる。ここで、押下とは、その表示領域内の座標を示す操作信号が操作部101から入力されることの意味を含む。画像復号部111は、第1符号化データを復号して得られる第1画像データを逐次に表示部112に出力する。表示部112は、画像復号部111から入力される第1画像データが示す第1画像(動画像)を表示する。
上記の説明では、静止画像の撮像がユーザの操作により指示される場合を例にしたが、これには限られない。図5に示すように、制御部104は、撮像判定部124を備えてもよい。
撮像判定部124は、第1撮像部102から入力される第1画像データが示す第1画像の撮像対象の適格性を示す評価値を算出し、算出した評価値が所定の評価値の閾値よりも高いか否かにより、第2画像の撮像の要否を判定する。より具体的には、撮像判定部124は、公知のパターン認識処理を用いて評価値を算出することができる。
第1評価処理では、撮像判定部124は、第1画像データに基づいて第1機械学習モデルを用いて第1撮像評価値を算出する。第1撮像評価値は、評価画像が表す主たる被写体が特定の認識対象物である可能性を示す値である。認識対象物の候補は、例えば、人物、動物、花、球技に用いられるボールなどである。認識対象物の候補は、特定の表情(例えば、笑い)を表す人物の顔面であってもよい。第1機械学習モデルを構成するモデルパラメータは、第1評価処理を実行する前に予め生成(学習)し、撮像判定部124に設定しておく。学習に用いる教師データとして、被写体を表す画像を示す画像データが用いられる。第1機械学習モデルのモデルパラメータの学習は、モデル学習部(図示せず)が行う(オフライン処理)。画像記録装置10はモデル学習部を備えてもよいし、備えなくともよい。撮像判定部124は、第1機械学習モデルのモデルパラメータを画像記録装置10とは別個の外部機器(例えば、サーバ装置)から取得してもよい。
(ステップS11)モデル学習部は、既知の被写体を表す画像の教師データに対して、第1機械学習モデルを作用して既知の認識対象物の候補毎に第1撮像評価値を算出する。第1機械学習モデルとして深層学習モデルを用いる場合、モデル学習部は、例えば、教師データが示す画素毎の信号値に基づいて各入力端への入力値を定める。モデル学習部は、画素毎の信号値を入力値として用いてもよいし、その信号値に基づいて得られる画像特徴量を構成する要素値を入力値として用いてもよい。画像特徴量として、例えば、画素毎のエッジ方向、画素毎の信号値の勾配などが利用可能である。モデル学習部は、定めた入力値に対して深層学習モデルを用いて算出される各出力端からの出力値を、その出力端に対応する認識対象物の候補の第1撮像評価値として定める。
第2評価処理を行わない場合には、撮像判定部124は、認識対象物の候補毎に算出した第1撮像評価値のうち、最も第1撮像評価値が大きい認識対象物の候補を認識対象物として特定し、その第1撮像評価値を撮像評価値として定める。
(ステップS21)モデル学習部は、教師データに対して、第2機械学習モデルを作用して第2撮像評価値を算出する。第2機械学習モデルとして深層学習モデルを用いる場合、モデル学習部は、教師データが示す画素毎の信号値に基づいて各入力端への入力値を定める。モデル学習部は、定めた入力値に対して深層学習モデルを用いて算出される出力端からの出力値を第2撮像評価値として定める。
第1評価処理と第2評価処理の両方を行う場合には、撮像判定部124は、第1撮像評価値と第2撮像評価値に、それぞれに対応する所定の重み係数を乗算し、乗算により得られる乗算値の総和を撮像評価値として算出する。
撮像制御部121は、その時点のフレームの第1画像の動画像の動き量が大きいほど、短くなるように閾値ΔTを定めてもよい。撮像制御部121には、予め動き量と対応付けて閾値ΔTを示す待機期間制御データを設定しておき、その時点における動き量に対応付けられた閾値ΔTを特定することができる。
移動量を検出するために、画像記録装置10は、さらに加速度検出部(図示せず)を備えてもよい。加速度検出部は、例えば、3軸の加速度センサである。加速度検出部は、各感度軸方向の加速度を検出し、検出した加速度を撮像制御部121に出力する。そして、撮像制御部121は、加速度検出部から入力される各感度軸方向の加速度の重み付き移動平均値を重力成分として算出する。撮像制御部121は、加速度検出部から入力される加速度から重力成分を差し引いて加速度の移動成分を算出し、算出した加速度の移動成分を時間積分して得られる速度成分の感度軸方向間の二乗和の平方根を移動量として算出する。これにより、画像記録装置10の移動量に基づいて閾値ΔTが定められる。
動画像符号化部105は、共用される1個の撮像部が撮像した画像を動画像として示す第1画像データを符号化し、静止画像符号化部106は、その撮像部が撮像した画像を静止画像として示す第2画像データを符号化する。
この構成により、待機期間が所定の時間以下である場合には、次の非参照フレームまで待機して、指示時点におけるフレームを非参照フレームとして符号化が行われない。そのため、一律に非参照フレームとして符号化を行う場合よりも、非参照フレームの増加に伴う符号化データの増加が抑制される。そのため、復号過程において符号化データがバッファ容量を超えるために、正常に画像が再生されなくなるリスクが低減する。画像記録装置10が記録した第1符号化データおよび第2符号化データは、他の電子機器において復号される可能性があるが、かかるリスクは、画像記録装置10の仕様を考慮せずに定めたバッファ容量を有する他の電子機器において生じる可能性が高い。
一般に、動画像の動き量が大きいほど、撮像が指示される時点から非参照フレームとして符号化するまでの絵柄の変動が大きくなるので、待機期間として許容される時間が短くなる。許容される待機期間に連動して所定の時間を短くすることで、より意図に沿った非参照フレームの画像を記録することができる。
この構成により、動き量を定める際に動画像の符号化の過程で算出される動きベクトルを利用することができるので、処理量の増大を抑制することができる。
この構成により、動き量を定める際に、動画像に表された所定の被写体の表示領域における動きベクトルが用いられるので、その被写体の動きに応じて所定の時間が定められる。
撮像中における画像記録装置10の動き量が大きいほど、撮像される動画像の絵柄の変動が大きくなるので、待機期間として許容される時間が短くなる。待機期間に連動して所定の時間を短くすることで、より意図に沿った非参照フレームの画像を記録することができる。
この構成により、動画像に基づいて撮像対象としての適格性が定量的に評価され、評価された適格性に基づいて静止画像の撮像の要否が判定される。そのため、判定結果に基づいて一律に非参照フレームとして符号化を行う場合よりも、非参照フレームの増加に伴う符号化データの増加が抑制される。
Claims (8)
- 動画像を形成する各フレームの画像を符号化する動画像符号化部と、
静止画像を符号化する静止画像符号化部と、
制御部と、を備え、
前記動画像を形成するフレームの系列は、
前記動画像符号化部がフレーム内予測を行って符号化するフレーム内予測フレームと、他のフレームの画像を参照画像として参照してフレーム間予測を行って符号化するフレーム間予測フレームとを含み、かつ、
前記系列は、前記フレーム内予測フレームのうち、過去のフレーム間予測フレームのフレーム間予測において参照されない非参照フレームを所定周期毎に含み、
前記制御部は、
静止画像の撮像が指示される指示時点から次の非参照フレームまでの待機期間が所定の時間以下であるとき、当該次の非参照フレームに対応する静止画像を前記静止画像符号化部に符号化させ、
前記待機期間が前記所定の時間を超えるとき、前記指示時点における現フレームの画像を非参照フレームとして前記動画像符号化部に符号化させるとともに、前記現フレームに対応する静止画像を前記静止画像符号化部に符号化させ、または
前記待機期間が前記所定の時間未満であるとき、前記次の非参照フレームに対応する静止画像を前記静止画像符号化部に符号化させ、
前記待機期間が前記所定の時間以上であるとき、前記現フレームの画像を非参照フレームとして前記動画像符号化部に符号化させるとともに、前記現フレームに対応する静止画像を前記静止画像符号化部に符号化させる
画像記録装置。 - 前記制御部は、
前記動画像の動き量が大きいほど、前記所定の時間を短くする
請求項1に記載の画像記録装置。 - 前記制御部は、
前記現フレームの少なくとも一部のブロックにおける画像の他フレームからの動きを示す動きベクトルを取得し、
前記動きベクトルに基づいて前記動き量を定める
請求項2に記載の画像記録装置。 - 前記制御部は、
前記各フレームの画像から所定の被写体を認識し、
前記被写体の表示領域におけるブロック毎の動きベクトルの代表値を前記動き量として定める
請求項2に記載の画像記録装置。 - 加速度を検出する加速度検出部を備え、
前記制御部は、
前記加速度に基づいて自装置の動き量を定め、
自装置の動き量が大きいほど、前記所定の時間を短くする
請求項1に記載の画像記録装置。 - 前記制御部は、
前記動画像の撮像対象としての適格性を示す評価値を算出し、
前記評価値が所定の閾値よりも高いとき前記静止画像の撮像が指示されたと判定する
請求項1から請求項5のいずれか一項に記載の画像記録装置。 - 画像記録装置における画像記録方法であって、
動画像を形成する各フレームの画像を符号化する動画像符号化過程と、
静止画像を符号化する静止画像符号化過程と、
制御過程と、を有し、
前記動画像を形成するフレームの系列は、
前記動画像符号化過程において、フレーム内予測を行って符号化するフレーム内予測フレームと、他のフレームの画像を参照画像として参照してフレーム間予測を行って符号化するフレーム間予測フレームとを含み、かつ、
前記系列は、前記フレーム内予測フレームのうち、過去のフレーム間予測フレームのフレーム間予測において参照されない非参照フレームを所定周期毎に含み、
前記制御過程は、
静止画像の撮像が指示される指示時点から次の非参照フレームまでの待機期間が所定の時間以下であるとき、当該次の非参照フレームに対応する静止画像を前記静止画像符号化過程において符号化させ、
前記待機期間が前記所定の時間を超えるとき、前記指示時点における現フレームの画像を非参照フレームとして前記動画像符号化過程において符号化させるとともに、前記現フレームに対応する静止画像を前記静止画像符号化過程において符号化させる、または
前記待機期間が前記所定の時間未満であるとき、当該次の非参照フレームに対応する静止画像を前記静止画像符号化過程において符号化させ、
前記待機期間が前記所定の時間を以上であるとき、前記現フレームの画像を非参照フレームとして前記動画像符号化過程において符号化させるとともに、前記現フレームに対応する静止画像を前記静止画像符号化過程において符号化させる
画像記録方法。 - 画像記録装置のコンピュータに、
動画像を形成する各フレームの画像を符号化する動画像符号化手順と、
静止画像を符号化する静止画像符号化手順と、
制御手順と、を実行させ、
前記動画像を形成するフレームの系列は、
前記動画像符号化手順において、フレーム内予測を行って符号化するフレーム内予測フレームと、他のフレームの画像を参照画像として参照してフレーム間予測を行って符号化するフレーム間予測フレームとを含み、かつ、
前記系列は、前記フレーム内予測フレームのうち、過去のフレーム間予測フレームのフレーム間予測において参照されない非参照フレームを所定周期毎に含み、
前記制御手順は、
静止画像の撮像が指示される指示時点から次の非参照フレームまでの待機期間が所定の時間以下であるとき、当該次の非参照フレームに対応する静止画像を前記静止画像符号化手順において符号化させ、
前記待機期間が前記所定の時間を超えるとき、前記指示時点における現フレームの画像を非参照フレームとして前記動画像符号化手順において符号化させるとともに、前記現フレームに対応する静止画像を前記静止画像符号化手順において符号化させる、または
前記待機期間が前記所定の時間未満であるとき、当該次の非参照フレームに対応する静止画像を前記静止画像符号化手順において符号化させ、
前記待機期間が前記所定の時間を以上であるとき、前記現フレームの画像を非参照フレームとして前記動画像符号化手順において符号化させるとともに、前記現フレームに対応する静止画像を前記静止画像符号化手順において符号化させる
プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018101560A JP7077141B2 (ja) | 2018-05-28 | 2018-05-28 | 画像記録装置、画像記録方法およびプログラム |
CN201910424880.8A CN110545367B (zh) | 2018-05-28 | 2019-05-21 | 图像记录装置、图像记录方法以及记录介质 |
US16/419,469 US10616526B2 (en) | 2018-05-28 | 2019-05-22 | Image recording apparatus, image recording method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018101560A JP7077141B2 (ja) | 2018-05-28 | 2018-05-28 | 画像記録装置、画像記録方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019208103A JP2019208103A (ja) | 2019-12-05 |
JP7077141B2 true JP7077141B2 (ja) | 2022-05-30 |
Family
ID=68613572
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018101560A Active JP7077141B2 (ja) | 2018-05-28 | 2018-05-28 | 画像記録装置、画像記録方法およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10616526B2 (ja) |
JP (1) | JP7077141B2 (ja) |
CN (1) | CN110545367B (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7122821B2 (ja) * | 2017-12-15 | 2022-08-22 | 川崎重工業株式会社 | ロボットシステム及びロボット制御方法 |
JP7459506B2 (ja) * | 2019-12-24 | 2024-04-02 | 株式会社Jvcケンウッド | 画像処理装置及び画像処理方法 |
CN111259215B (zh) | 2020-02-14 | 2023-06-27 | 北京百度网讯科技有限公司 | 基于多模态的主题分类方法、装置、设备、以及存储介质 |
JP2021132305A (ja) * | 2020-02-20 | 2021-09-09 | シャープ株式会社 | 画像符号化装置および画像符号化方法 |
US20230110503A1 (en) * | 2020-02-24 | 2023-04-13 | Nokia Technologies Oy | Method, an apparatus and a computer program product for video encoding and video decoding |
CN113099270B (zh) * | 2021-04-07 | 2023-03-24 | 浙江大华技术股份有限公司 | 文件存储方法及解码方法、装置、存储介质、电子装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007181164A (ja) | 2005-11-29 | 2007-07-12 | Matsushita Electric Ind Co Ltd | 画像再生装置 |
JP2015119231A (ja) | 2013-12-16 | 2015-06-25 | キヤノン株式会社 | 画像処理装置及び画像処理装置の制御方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3182289B2 (ja) | 1994-04-06 | 2001-07-03 | 三洋電機株式会社 | 画像記録方法及び画像記録装置 |
KR101391661B1 (ko) * | 2010-05-12 | 2014-05-07 | 니폰덴신뎅와 가부시키가이샤 | 동화상 부호화 제어 방법, 동화상 부호화 장치 및 동화상 부호화 프로그램 |
JP5914871B2 (ja) * | 2011-10-19 | 2016-05-11 | パナソニックIpマネジメント株式会社 | 通信端末及び符号化レート低減方法 |
WO2014010300A1 (ja) * | 2012-07-10 | 2014-01-16 | ソニー株式会社 | 画像復号装置、画像復号方法、画像符号化装置及び画像符号化方法 |
US10148983B2 (en) * | 2015-09-25 | 2018-12-04 | Qualcomm Incorporated | Methods and systems of improved video stream switching and random access |
-
2018
- 2018-05-28 JP JP2018101560A patent/JP7077141B2/ja active Active
-
2019
- 2019-05-21 CN CN201910424880.8A patent/CN110545367B/zh active Active
- 2019-05-22 US US16/419,469 patent/US10616526B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007181164A (ja) | 2005-11-29 | 2007-07-12 | Matsushita Electric Ind Co Ltd | 画像再生装置 |
JP2015119231A (ja) | 2013-12-16 | 2015-06-25 | キヤノン株式会社 | 画像処理装置及び画像処理装置の制御方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110545367B (zh) | 2021-03-23 |
CN110545367A (zh) | 2019-12-06 |
US20190364242A1 (en) | 2019-11-28 |
JP2019208103A (ja) | 2019-12-05 |
US10616526B2 (en) | 2020-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7077141B2 (ja) | 画像記録装置、画像記録方法およびプログラム | |
CN103988490B (zh) | 图像处理装置、图像处理方法和记录介质 | |
US10410061B2 (en) | Image capturing apparatus and method of operating the same | |
JP5293206B2 (ja) | 画像検索装置、画像検索方法及びプログラム | |
US20100214445A1 (en) | Image capturing method, image capturing apparatus, and computer program | |
JP4839908B2 (ja) | 撮像装置、自動焦点調整方法、およびプログラム | |
JP2011097576A (ja) | 撮像装置 | |
JP2008294737A (ja) | 画像処理装置及びプログラム | |
CN104702826A (zh) | 摄像设备及其控制方法 | |
JP5888614B2 (ja) | 撮像装置、映像コンテンツ生成方法、及び、プログラム | |
JP2009260892A (ja) | 画像処理装置及びその制御方法及びプログラム | |
JP5375846B2 (ja) | 撮像装置、自動焦点調整方法、およびプログラム | |
KR101782997B1 (ko) | 디지털 촬영 장치 및 이의 전력 제어 방법 | |
JP5990903B2 (ja) | 画像生成装置 | |
JP4850111B2 (ja) | 画像表示装置およびそれを搭載した撮像装置 | |
JP2010081115A (ja) | 画像処理装置及び画像処理方法及びプログラム | |
KR101476650B1 (ko) | 디지털 영상 처리기에서 연속 촬영된 영상 데이터 처리장치 및 방법 | |
JP6103481B2 (ja) | 撮像装置、及びその制御方法とプログラム | |
JP6223160B2 (ja) | 撮像装置、その制御方法、および制御プログラム | |
JP4157003B2 (ja) | 画像処理装置 | |
JP2007049449A (ja) | 画像記録装置 | |
JP2019212938A (ja) | 撮像装置、撮像方法およびプログラム | |
JP5109866B2 (ja) | 撮像装置、撮像方法及びプログラム | |
JP4651103B2 (ja) | 画像処理装置、画像処理方法 | |
JP2019193152A (ja) | 撮像装置、撮像方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210324 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220201 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220222 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220407 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220510 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220518 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7077141 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |