WO2022201810A1 - 制御装置、制御方法、及びプログラム - Google Patents
制御装置、制御方法、及びプログラム Download PDFInfo
- Publication number
- WO2022201810A1 WO2022201810A1 PCT/JP2022/002054 JP2022002054W WO2022201810A1 WO 2022201810 A1 WO2022201810 A1 WO 2022201810A1 JP 2022002054 W JP2022002054 W JP 2022002054W WO 2022201810 A1 WO2022201810 A1 WO 2022201810A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- monitoring mode
- image
- captured image
- teacher
- monitoring
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 27
- 238000012544 monitoring process Methods 0.000 claims abstract description 249
- 238000001514 detection method Methods 0.000 claims abstract description 79
- 238000010801 machine learning Methods 0.000 claims abstract description 24
- 238000003384 imaging method Methods 0.000 claims description 80
- 238000012545 processing Methods 0.000 claims description 36
- 230000008859 change Effects 0.000 claims description 22
- 230000008569 process Effects 0.000 claims description 12
- 238000004091 panning Methods 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 6
- 238000013135 deep learning Methods 0.000 claims description 4
- 230000009467 reduction Effects 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 description 20
- 230000006870 function Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 15
- 230000004048 modification Effects 0.000 description 10
- 238000012986 modification Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 7
- 238000010276 construction Methods 0.000 description 6
- 230000009471 action Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 4
- 235000008429 bread Nutrition 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004549 pulsed laser deposition Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000005401 electroluminescence Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/18—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
- H04N7/183—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a single remote source
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/70—Labelling scene content, e.g. deriving syntactic or semantic representations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/66—Remote control of cameras or camera parts, e.g. by remote control devices
- H04N23/661—Transmitting camera control signals through networks, e.g. control via the Internet
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/667—Camera operation mode switching, e.g. between still and video, sport and normal or high- and low-resolution modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/695—Control of camera direction for changing a field of view, e.g. pan, tilt or based on tracking of objects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/765—Interface circuits between an apparatus for recording and another apparatus
- H04N5/77—Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/91—Television signal processing therefor
- H04N5/92—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/18—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Studio Devices (AREA)
- Image Analysis (AREA)
Abstract
Description
SWIRとは、“Short Wave Infra-Red”の略称を指す。LANとは、“Local Area Network”の略称を指す。
一例として図1に示すように、監視システム10は、監視カメラ12、及び管理装置16を備えている。監視システム10は、例えば、建設現場を監視するシステムである。監視カメラ12は、例えば、建設現場の近傍の建物の屋上等の高所に設置されている。管理装置16は、例えば、建設現場の作業員を監督する現場監督等のユーザにより使用される。ユーザは、例えば、作業中の建設現場に危険性が生じていないかを、管理装置16を用いて監視する。監視システム10は、ユーザの監視負担を軽減するためのシステムである。
第1実施形態では、監視モードが自動監視モードから手動監視モードへの切り替え操作が行われたことに応じて第1撮像画像を教師画像TDとして出力する例を示したが、第2実施形態では、ユーザにより与えられた出力指示に応じて、第1撮像画像を教師画像TDとして出力する。
第1実施形態では、監視モードが自動監視モードから手動監視モードへの切り替え操作が行われたことに応じて第1撮像画像を教師画像TDとして出力する例を示したが、第3実施形態では、第1撮像画像に加えて、切り替え前の自動監視モードで取得した第2撮像画像P2を教師画像TDとして出力する。
次に、第4実施形態について説明する。第4実施形態は、第3実施形態を変形したものである。第3実施形態では、監視モードが自動監視モードから手動監視モードに切り替えられた場合に、切り替え前の自動監視モードで取得された第2撮像画像P2を教師画像TDとして出力している。第4実施形態では、監視モードが自動監視モードから手動監視モードに切り替えられた後、一定の条件が満たされた場合に、切り替え前の自動監視モードで取得された第2撮像画像P2を教師画像TDとして出力する。
図14は、教師画像出力処理の第1変形例を示す。図14に示すように、第1変形例では、教師画像出力部55は、教師画像TD内に写り込んでいる物体を検出し、検出した物体の教師画像TD内における位置情報を教師画像TDに付加する。
図15は、教師画像出力処理の第2変形例を示す。図15に示すように、第2変形例では、第1変形例で示した位置情報付加処理に加えて、ユーザが位置情報を変更可能とする。
第3変形例では、教師画像出力部55は、学習済みモデルLMを用いた物体検出を行わずに、ユーザにより与えられた指示に応じて、教師画像TD内に写り込んでいる物体の位置を決定し、決定した物体の教師画像TD内における位置情報を教師画像TDに付加する。
第4変形例では、教師画像出力部55は、学習済みモデルLMの機械学習の精度をさらに向上させるために、教師画像TDに対して拡張処理を施すことにより水増しする拡張処理を行う。一例として図17に示すように、教師画像出力部55は、教師画像TDとして出力対象の第1撮像画像P1に加えて、第1撮像画像P1を反転させた拡張画像P1Eを教師画像TDとして出力する。これにより、教師画像TDの数が増えるので、学習済みモデルLMの機械学習の精度が向上する。
Claims (16)
- 監視カメラを制御するプロセッサを備える制御装置であって、
前記プロセッサは、
監視カメラに対して撮像を行わせることで第1撮像画像を取得し、かつ、与えられた指示に応じて撮像範囲を変化させる第1監視モードと、前記監視カメラに対して撮像を行わせることで第2撮像画像を取得し、かつ、機械学習による学習済みモデルを用いて、前記第2撮像画像に写り込んでいる物体を検出し、検出結果に応じて前記撮像範囲を変化させる第2監視モードと、を切り替え、
前記第1監視モードで取得した前記第1撮像画像を、前記機械学習に対する教師画像として出力する、
制御装置。 - 前記プロセッサは、前記監視カメラに対して行われた手動操作に応じて、前記第1撮像画像を前記教師画像として出力する、
請求項1に記載の制御装置。 - 前記手動操作は、前記第2監視モードから前記第1監視モードへの切り替え操作であり、
前記プロセッサは、前記第2監視モードから前記第1監視モードへの切り替え後の前記第1監視モードで取得した前記第1撮像画像を前記教師画像として出力する、
請求項2に記載の制御装置。 - 前記監視カメラは、パン、チルト、及びズームのうち少なくとも1つを変更することにより前記撮像範囲を変化させることが可能であり、
前記切り替え操作は、前記第2監視モード時におけるパン、チルト、及びズームのうち少なくとも1つを変更する操作である、
請求項3に記載の制御装置。 - 前記プロセッサは、前記第2監視モードから前記第1監視モードへの切り替え後に、与えられた出力指示に応じて、前記第1撮像画像を前記教師画像として出力する、
請求項3又は請求項4に記載の制御装置。 - 前記プロセッサは、
切り替え前の前記第2監視モードで取得した前記第2撮像画像を、前記物体の検出に不適合である判断結果を付与して前記教師画像として出力し、かつ、
切り替え後の前記第1監視モードで取得した前記第1撮像画像を、前記物体の検出に適合する判断結果を付与して前記教師画像として出力する、
請求項3から請求項5のうちいずれか1項に記載の制御装置。 - 前記プロセッサは、前記第2監視モードから前記第1監視モードへ切り替えた後、前記第1監視モードにおいて一定時間操作がなされない場合に、前記第2監視モードへ切り替える、
請求項6に記載の制御装置。 - 前記プロセッサは、
前記第1監視モードから前記第2監視モードへ切り替えた後、前回の前記手動操作から一定時間経過した後に前記手動操作が行われた場合には、前記第2撮像画像は前記教師画像として出力しない、
請求項7に記載の制御装置。 - 前記プロセッサは、
前記教師画像内に写り込んでいる物体を検出し、検出した物体の前記教師画像内における位置情報を前記教師画像に付加する、
請求項1から請求項8のうちいずれか1項に記載の制御装置。 - 前記プロセッサは、
前記教師画像に写り込んでいる物体を検出する場合における物体検出の検出基準を、前記第2撮像画像に写り込んでいる物体を検出する場合における物体検出の検出基準よりも下げる、
請求項9に記載の制御装置。 - 前記プロセッサは、
与えられた指示に応じて前記位置情報を変更する位置情報変更処理を行う、
請求項9又は請求項10に記載の制御装置。 - 前記プロセッサは、
与えられた指示に応じて、前記教師画像内に写り込んでいる物体の位置を決定し、決定した物体の前記教師画像内における位置情報を前記教師画像に付加する、
請求項1から請求項8のうちいずれか1項に記載の制御装置。 - 前記プロセッサは、
前記教師画像に加えて、前記教師画像に対して拡張処理を施すことにより生成した拡張画像を前記教師画像として出力する、
請求項1から請求項12のうちいずれか1項に記載の制御装置。 - 前記拡張処理は、反転、縮小、ノイズの付加、ディープラーニングによるスタイル変化のうち少なくともいずれか1つの処理である、
請求項13に記載の制御装置。 - 監視カメラに対して撮像を行わせることで第1撮像画像を取得し、かつ、与えられた指示に応じて撮像範囲を変化させる第1監視モードと、前記監視カメラに対して撮像を行わせることで第2撮像画像を取得し、かつ、機械学習による学習済みモデルを用いて、前記第2撮像画像に写り込んでいる物体を検出し、検出結果に応じて前記撮像範囲を変化させる第2監視モードと、を切り替え可能とすること、
前記第1監視モードで取得した前記第1撮像画像を、前記機械学習に対する教師画像として出力すること、
を含む制御方法。 - 監視カメラに対して撮像を行わせることで第1撮像画像を取得し、かつ、与えられた指示に応じて撮像範囲を変化させる第1監視モードと、前記監視カメラに対して撮像を行わせることで第2撮像画像を取得し、かつ、機械学習による学習済みモデルを用いて、前記第2撮像画像に写り込んでいる物体を検出し、検出結果に応じて前記撮像範囲を変化させる第2監視モードと、を切り替え可能とすること、
前記第1監視モードで取得した前記第1撮像画像を、前記機械学習に対する教師画像として出力すること、
を含む処理をコンピュータに実行させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023508697A JPWO2022201810A1 (ja) | 2021-03-24 | 2022-01-20 | |
CN202280021394.1A CN117063480A (zh) | 2021-03-24 | 2022-01-20 | 控制装置、控制方法及程序 |
US18/464,257 US20230421731A1 (en) | 2021-03-24 | 2023-09-10 | Control apparatus, control method, and program |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021050783 | 2021-03-24 | ||
JP2021-050783 | 2021-03-24 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
US18/464,257 Continuation US20230421731A1 (en) | 2021-03-24 | 2023-09-10 | Control apparatus, control method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2022201810A1 true WO2022201810A1 (ja) | 2022-09-29 |
Family
ID=83395385
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2022/002054 WO2022201810A1 (ja) | 2021-03-24 | 2022-01-20 | 制御装置、制御方法、及びプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230421731A1 (ja) |
JP (1) | JPWO2022201810A1 (ja) |
CN (1) | CN117063480A (ja) |
WO (1) | WO2022201810A1 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018117280A (ja) * | 2017-01-19 | 2018-07-26 | キヤノン株式会社 | 画像処理装置、画像処理方法、プログラム |
JP2019106694A (ja) * | 2017-09-28 | 2019-06-27 | キヤノン株式会社 | 撮像装置およびその制御方法 |
JP2020061761A (ja) * | 2017-12-26 | 2020-04-16 | キヤノン株式会社 | 画像処理装置、画像処理方法、プログラム |
-
2022
- 2022-01-20 WO PCT/JP2022/002054 patent/WO2022201810A1/ja active Application Filing
- 2022-01-20 JP JP2023508697A patent/JPWO2022201810A1/ja active Pending
- 2022-01-20 CN CN202280021394.1A patent/CN117063480A/zh active Pending
-
2023
- 2023-09-10 US US18/464,257 patent/US20230421731A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018117280A (ja) * | 2017-01-19 | 2018-07-26 | キヤノン株式会社 | 画像処理装置、画像処理方法、プログラム |
JP2019106694A (ja) * | 2017-09-28 | 2019-06-27 | キヤノン株式会社 | 撮像装置およびその制御方法 |
JP2020061761A (ja) * | 2017-12-26 | 2020-04-16 | キヤノン株式会社 | 画像処理装置、画像処理方法、プログラム |
Also Published As
Publication number | Publication date |
---|---|
CN117063480A (zh) | 2023-11-14 |
JPWO2022201810A1 (ja) | 2022-09-29 |
US20230421731A1 (en) | 2023-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10451705B2 (en) | Tracking control device, tracking control method, tracking control program, and automatic tracking imaging system | |
JP4928275B2 (ja) | カメラ制御装置及びその制御方法 | |
GB2401977A (en) | Surveillance of an area | |
EP3772217A1 (en) | Output control apparatus, display terminal, remote control system, control method, and carrier medium | |
US20090043422A1 (en) | Photographing apparatus and method in a robot | |
CN112954214B (zh) | 拍摄的方法、装置、电子设备及存储介质 | |
JP2019129410A (ja) | 監視カメラ、監視カメラの制御方法、およびプログラム | |
US10455144B2 (en) | Information processing apparatus, information processing method, system, and non-transitory computer-readable storage medium | |
JP7371076B2 (ja) | 情報処理装置、情報処理システム、情報処理方法及びプログラム | |
US20170134627A1 (en) | Control apparatus, control method, and recording medium | |
JP4594197B2 (ja) | 自動追尾装置 | |
CN110677580A (zh) | 拍摄方法、装置、存储介质及终端 | |
WO2022201810A1 (ja) | 制御装置、制御方法、及びプログラム | |
JP2011239104A (ja) | カメラ装置、拡大表示方法およびプログラム | |
JP2013065971A (ja) | 撮像装置、撮像装置の制御方法 | |
JP2019087840A (ja) | 監視システム | |
WO2022209135A1 (ja) | 制御装置、制御方法、及びプログラム | |
US11151730B2 (en) | System and method for tracking moving objects | |
CN112468722B (zh) | 一种拍摄方法、装置、设备及存储介质 | |
JP2022105047A (ja) | 撮像装置、飛行装置、撮像方法及びプログラム | |
JP6115673B2 (ja) | 装置、及びプログラム | |
CN112422827B (zh) | 信息处理方法、装置及设备和存储介质 | |
US20230341947A1 (en) | Information processing apparatus, information processing method, and storage medium | |
JP2021064871A (ja) | 情報処理装置および情報処理方法 | |
JP2024042352A (ja) | 撮像装置、撮像装置の制御方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 22774613 Country of ref document: EP Kind code of ref document: A1 |
|
WWE | Wipo information: entry into national phase |
Ref document number: 2023508697 Country of ref document: JP |
|
WWE | Wipo information: entry into national phase |
Ref document number: 202280021394.1 Country of ref document: CN |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 22774613 Country of ref document: EP Kind code of ref document: A1 |