JP2020174345A - 画像を取り込むシステムおよびカメラ機器 - Google Patents
画像を取り込むシステムおよびカメラ機器 Download PDFInfo
- Publication number
- JP2020174345A JP2020174345A JP2020041939A JP2020041939A JP2020174345A JP 2020174345 A JP2020174345 A JP 2020174345A JP 2020041939 A JP2020041939 A JP 2020041939A JP 2020041939 A JP2020041939 A JP 2020041939A JP 2020174345 A JP2020174345 A JP 2020174345A
- Authority
- JP
- Japan
- Prior art keywords
- scene
- camera
- image
- quality
- posture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010801 machine learning Methods 0.000 claims description 21
- 230000002787 reinforcement Effects 0.000 claims description 4
- 230000036544 posture Effects 0.000 description 60
- 238000000034 method Methods 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004880 explosion Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000036461 convulsion Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/61—Control of cameras or camera modules based on recognised objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
- G06T7/74—Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/80—Analysis of captured images to determine intrinsic or extrinsic camera parameters, i.e. camera calibration
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/61—Control of cameras or camera modules based on recognised objects
- H04N23/611—Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/64—Computer-aided capture of images, e.g. transfer from script file into camera, check of taken image quality, advice or proposal for image composition or decision on when to take image
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/695—Control of camera direction for changing a field of view, e.g. pan, tilt or based on tracking of objects
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B64—AIRCRAFT; AVIATION; COSMONAUTICS
- B64U—UNMANNED AERIAL VEHICLES [UAV]; EQUIPMENT THEREFOR
- B64U2101/00—UAVs specially adapted for particular uses or applications
- B64U2101/30—UAVs specially adapted for particular uses or applications for imaging, photography or videography
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2200/00—Indexing scheme for image data processing or generation, in general
- G06T2200/21—Indexing scheme for image data processing or generation, in general involving computational photography
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30168—Image quality inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30232—Surveillance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30244—Camera pose
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
Abstract
Description
・カメラに対する被写体の方向(例えば、被写体の顔が視認可能になる方向)
・被写体からカメラまでの距離(例えば、被写体の顔が解像可能になる距離)
・取込画像内の被写体のオクルージョン(例えば、被写体が遮蔽されている割合、その中でも、被写体の顔などの重要領域が遮蔽されている割合)
・被写体の画像内の位置/占有率(美学の場合、例えば、三分割法または分野特有の規則)
Claims (15)
- システムであって、
シーンの画像を取り込むように動作可能なカメラと、
前記シーンの画像内の注目物体を識別するように構成された識別ユニットと、
前記カメラに対する前記シーン内の前記注目物体の姿勢を取得するように構成された姿勢プロセッサと、
取得した前記注目物体の姿勢および前記カメラによって取り込まれた画像の少なくとも一方に基づいて、それぞれの姿勢で前記カメラによって取り込まれた画像に関連付けられたシーンの品質を判定するように動作可能なシーン解析部であって、
前記シーン解析部が、それぞれの姿勢で前記カメラによって取り込まれた前記画像に関連付けられた前記シーンの品質を判定するように訓練された第1の機械学習モデルを含む、シーン解析部と、
現在の姿勢で取り込まれた画像の前記シーンの品質が閾値未満であるという判定に基づいて、前記カメラの姿勢を調整するように構成されたコントローラと
を備える、システム。 - 前記第1の機械学習モデルが、訓練画像および/または注目物体の訓練画像を取り込んだ前記カメラに対する前記シーン内の前記注目物体の姿勢を示す姿勢データを用いて訓練され、前記姿勢データおよび/または前記訓練画像には、それぞれのシーンの品質がラベル付けされる、請求項1に記載のシステム。
- 前記姿勢データおよび/または前記訓練画像が、前記姿勢データおよび/または訓練画像のソースおよび前記姿勢データおよび/または訓練画像に関連付けられたユーザフィードバックの少なくとも一方に基づいて、高品質のシーンを有するとしてラベル付けされる、請求項2に記載のシステム。
- 前記コントローラが、現在の姿勢で取り込まれた画像の前記シーンの品質が閾値未満であるという判定に基づいて、前記カメラの1つ以上の内部パラメータを調整するように構成され、
前記第1の機械学習モデルが、前記姿勢データおよび/または前記訓練画像が取得された前記カメラの1つ以上の内部パラメータを示す固有データを用いてさらに訓練される、請求項2または3に記載のシステム。 - 前記コントローラが、結果的により高品質のシーンを有する注目物体の画像を取り込む可能性が高い前記カメラの姿勢を特定するように訓練された、第2の機械学習モデルを含む、請求項1〜4のいずれか一項に記載のシステム。
- 前記第2の機械学習モデルが、深層強化学習を使用して訓練されたエージェントを含み、前記エージェントが、前記カメラによって取り込まれた画像の前記シーンの品質を最大限に高める姿勢を学習するように訓練され、前記エージェントが、複数の異なる仮想シーン内を移動し、かつ前記仮想シーン内の注目物体の仮想画像を取り込むことによって訓練される、請求項5に記載のシステム。
- 前記第2の機械学習モデルが、前記仮想画像を前記第1の訓練された機械学習モデルに入力することによって、前記仮想画像に関連付けられたシーンの品質を判定するように構成される、請求項6に記載のシステム。
- 前記識別ユニットが、前記カメラによって取り込まれた前記画像が対応するシーンのタイプを識別するように構成され、
前記シーン解析部が、前記識別されたシーンのタイプに基づいて、それぞれの姿勢で前記カメラによって取り込まれた前記画像に関連付けられたシーンの品質を判定するようにさらに構成される、請求項1〜7のいずれか一項に記載のシステム。 - 前記識別ユニットが、前記カメラによって取り込まれた前記画像が対応するシーンのタイプを識別するように訓練された第3の機械学習モデルを含み、前記第3の機械学習モデルが、異なるタイプのシーンの画像および対応するシーン識別子を用いて訓練される、請求項8に記載のシステム。
- 前記注目物体がシーン内にキャラクタを含み、シーン品質モデルが、姿勢データおよび/またはシーン内のキャラクタの訓練画像を用いて訓練される、請求項1〜9のいずれか一項に記載のシステム。
- 前記注目物体が複数のキャラクタを含み、前記システムが、
前記取込画像に含まれる1人以上のキャラクタを示す入力をユーザから受信するように動作可能な入力ユニットを備え、
前記シーン解析部が、取り込まれた前記画像および/または前記カメラによって取り込まれた前記画像に含まれるキャラクタの3D姿勢に基づいて、シーンの品質を判定するように構成される、請求項10に記載のシステム。 - 少なくとも1人のキャラクタが話しているか、または話し始めようとしていることを示す音声データを受信するように動作可能な音声ユニットを備え、
前記識別ユニットが、前記音声データに基づいて前記少なくとも1人のキャラクタを主要キャラクタとして識別するように構成され、
前記シーン解析部が、前記カメラおよび/または前記カメラによって取り込まれた前記画像に対する前記シーン内の前記少なくとも1人の主要キャラクタの姿勢に基づいて、前記シーンの品質を検出するように構成される、請求項11に記載のシステム。 - 前記識別ユニットが、前記シーン内の音源を識別するように構成され、前記姿勢プロセッサが、前記カメラに対する前記音源の姿勢を特定するように構成され、
前記シーン解析部が、前記カメラに対する前記音源の検出された姿勢に基づいて、取り込まれた前記画像に関連付けられたシーンの品質を判定するようにさらに構成される、請求項1〜12のいずれか一項に記載のシステム。 - 前記カメラが実カメラであり、前記システムが、前記カメラの前記位置および/または前記方向を制御する運動手段を含み、
コントローラから入力を受信するように構成される前記運動手段が、車輪およびプロペラの少なくとも一方を備える、請求項1〜13のいずれか一項に記載のシステム。 - カメラ機器が、
シーンの画像を取り込むように動作可能なセンサと、
i.識別ユニット、
ii.姿勢プロセッサ、
iii.シーン解析部、および
iv.コントローラ
から選択された1つ以上の構成要素と
を含む、請求項1に記載のシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB1903715.9 | 2019-03-19 | ||
GB1903715.9A GB2584986B (en) | 2019-03-19 | 2019-03-19 | System and camera device for capturing images |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020174345A true JP2020174345A (ja) | 2020-10-22 |
Family
ID=66381023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020041939A Pending JP2020174345A (ja) | 2019-03-19 | 2020-03-11 | 画像を取り込むシステムおよびカメラ機器 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11785328B2 (ja) |
EP (1) | EP3713217B1 (ja) |
JP (1) | JP2020174345A (ja) |
CN (1) | CN111726518A (ja) |
GB (1) | GB2584986B (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2584986B (en) | 2019-03-19 | 2023-07-26 | Sony Interactive Entertainment Inc | System and camera device for capturing images |
WO2020212470A1 (en) * | 2019-04-17 | 2020-10-22 | Koninklijke Philips N.V. | Medical imaging systems and methods with auto-correction of image quality-based on the log analysis of medical devices |
EP3772720B1 (en) * | 2019-08-08 | 2021-09-29 | Siemens Healthcare GmbH | Method and system for image analysis |
US11877052B2 (en) * | 2020-12-08 | 2024-01-16 | Cortica Ltd. | Filming an event by an autonomous robotic system |
US11879984B2 (en) * | 2021-05-21 | 2024-01-23 | Booz Allen Hamilton Inc. | Systems and methods for determining a position of a sensor device relative to an object |
US11386580B1 (en) * | 2021-08-13 | 2022-07-12 | Goodsize Inc. | System apparatus and method for guiding user to comply with application-specific requirements |
CN114627134B (zh) * | 2022-05-18 | 2022-08-09 | 深圳元象信息科技有限公司 | 场景图像生成方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10334158B2 (en) * | 2014-11-03 | 2019-06-25 | Robert John Gove | Autonomous media capturing |
US10379534B2 (en) * | 2016-01-28 | 2019-08-13 | Qualcomm Incorporated | Drone flight control |
US10616482B2 (en) * | 2017-03-10 | 2020-04-07 | Gopro, Inc. | Image quality assessment |
CN109144092A (zh) * | 2017-06-16 | 2019-01-04 | 昊翔电能运动科技(昆山)有限公司 | 无人机飞行辅助方法、装置及无人机 |
US10762605B2 (en) * | 2017-08-04 | 2020-09-01 | Outward, Inc. | Machine learning based image processing techniques |
CN107749952B (zh) * | 2017-11-09 | 2020-04-10 | 睿魔智能科技(东莞)有限公司 | 一种基于深度学习的智能无人摄影方法和系统 |
KR102438201B1 (ko) * | 2017-12-01 | 2022-08-30 | 삼성전자주식회사 | 사진 촬영과 관련된 추천 정보를 제공하는 방법 및 시스템 |
GB2584986B (en) | 2019-03-19 | 2023-07-26 | Sony Interactive Entertainment Inc | System and camera device for capturing images |
-
2019
- 2019-03-19 GB GB1903715.9A patent/GB2584986B/en active Active
-
2020
- 2020-01-07 EP EP20150461.0A patent/EP3713217B1/en active Active
- 2020-03-11 JP JP2020041939A patent/JP2020174345A/ja active Pending
- 2020-03-12 CN CN202010169525.3A patent/CN111726518A/zh active Pending
- 2020-03-12 US US16/816,526 patent/US11785328B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN111726518A (zh) | 2020-09-29 |
GB2584986B (en) | 2023-07-26 |
EP3713217B1 (en) | 2023-12-06 |
US11785328B2 (en) | 2023-10-10 |
EP3713217A3 (en) | 2020-10-07 |
GB201903715D0 (en) | 2019-05-01 |
EP3713217A2 (en) | 2020-09-23 |
GB2584986A (en) | 2020-12-30 |
US20200304707A1 (en) | 2020-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2020174345A (ja) | 画像を取り込むシステムおよびカメラ機器 | |
US11509817B2 (en) | Autonomous media capturing | |
US10721439B1 (en) | Systems and methods for directing content generation using a first-person point-of-view device | |
US11122258B2 (en) | Method and apparatus for generating and displaying 360-degree video based on eye tracking and physiological measurements | |
US10083363B2 (en) | System and method for customizing content for a user | |
US10262461B2 (en) | Information processing method and apparatus, and program for executing the information processing method on computer | |
US11553126B2 (en) | Systems and methods to control camera operations | |
US20180373413A1 (en) | Information processing method and apparatus, and program for executing the information processing method on computer | |
US9460340B2 (en) | Self-initiated change of appearance for subjects in video and images | |
US10453248B2 (en) | Method of providing virtual space and system for executing the same | |
JP6574937B2 (ja) | 通信システム、制御方法、および記憶媒体 | |
CN109069933A (zh) | 在vr环境中的观众视角 | |
CN109069932A (zh) | 观看与虚拟现实(vr)用户互动性相关联的vr环境 | |
TWI610247B (zh) | 在玩遊戲期間標識、擷取、呈現和處理照片的方法以及用於該方法的電腦可讀取儲存媒體 | |
CN107533356A (zh) | 头像控制系统 | |
WO2021139728A1 (zh) | 全景视频处理方法、装置、设备及存储介质 | |
JP2018113616A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
US20190005731A1 (en) | Program executed on computer for providing virtual space, information processing apparatus, and method of providing virtual space | |
US20180160054A1 (en) | System and method for automatically generating split screen for a video of a dynamic scene | |
KR102239134B1 (ko) | 드론에 부착된 vr 카메라를 이용하여 촬영한 운동 경기 영상을 제공하는 방송 시스템 | |
CN110771175A (zh) | 视频播放速度的控制方法、装置及运动相机 | |
US20180124374A1 (en) | System and Method for Reducing System Requirements for a Virtual Reality 360 Display | |
WO2014179749A1 (en) | Interactive real-time video editor and recorder | |
US10902681B2 (en) | Method and system for displaying a virtual object |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221222 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231031 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240205 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240312 |