JP2020195117A - 撮像装置、通知装置、通知方法、及びプログラム - Google Patents
撮像装置、通知装置、通知方法、及びプログラム Download PDFInfo
- Publication number
- JP2020195117A JP2020195117A JP2019101485A JP2019101485A JP2020195117A JP 2020195117 A JP2020195117 A JP 2020195117A JP 2019101485 A JP2019101485 A JP 2019101485A JP 2019101485 A JP2019101485 A JP 2019101485A JP 2020195117 A JP2020195117 A JP 2020195117A
- Authority
- JP
- Japan
- Prior art keywords
- subject
- layer
- image
- notification
- classes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000003384 imaging method Methods 0.000 title claims abstract description 12
- 238000001514 detection method Methods 0.000 claims abstract description 34
- 230000008569 process Effects 0.000 claims description 14
- 238000010187 selection method Methods 0.000 claims 2
- 238000012545 processing Methods 0.000 description 32
- 240000008415 Lactuca sativa Species 0.000 description 27
- 235000012045 salad Nutrition 0.000 description 27
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 24
- 240000003768 Solanum lycopersicum Species 0.000 description 24
- 210000004027 cell Anatomy 0.000 description 21
- 210000002569 neuron Anatomy 0.000 description 19
- 235000013399 edible fruits Nutrition 0.000 description 18
- 238000013527 convolutional neural network Methods 0.000 description 14
- 240000008067 Cucumis sativus Species 0.000 description 13
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 description 13
- 241000208822 Lactuca Species 0.000 description 13
- 235000003228 Lactuca sativa Nutrition 0.000 description 13
- 230000006870 function Effects 0.000 description 13
- 230000008878 coupling Effects 0.000 description 10
- 238000010168 coupling process Methods 0.000 description 10
- 238000005859 coupling reaction Methods 0.000 description 10
- 230000010354 integration Effects 0.000 description 8
- 238000012360 testing method Methods 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- -1 Polypropylene Polymers 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 238000001454 recorded image Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/231—Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
- G06V10/7625—Hierarchical techniques, i.e. dividing or merging patterns to obtain a tree-like representation; Dendograms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/70—Labelling scene content, e.g. deriving syntactic or semantic representations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/63—Control of cameras or camera modules by using electronic viewfinders
- H04N23/633—Control of cameras or camera modules by using electronic viewfinders for displaying additional information relating to control or operation of the camera
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/69—Control of means for changing angle of the field of view, e.g. optical zoom objectives or electronic zooming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/698—Control of cameras or camera modules for achieving an enlarged field of view, e.g. panoramic image capture
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/68—Food, e.g. fruit or vegetables
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computational Linguistics (AREA)
- Image Analysis (AREA)
- Studio Devices (AREA)
- Indication In Cameras, And Counting Of Exposures (AREA)
- Processing Or Creating Images (AREA)
Abstract
Description
図1は、通知装置を備える撮像装置100の構成を示すブロック図である。撮像装置100は、階層化された複数の被写体クラスを画像から検出し、所定の選択基準に基づいて特定の階層を選択し、選択した階層に属する被写体クラスを優先して、複数の被写体クラスの一部をユーザに通知する。特定の階層の選択基準は特に限定されないが、第1の実施形態では、画像の撮影時における選択基準の例について説明する。
第2の実施形態では、画像の再生時における、優先的に通知する被写体クラスの階層の選択基準の例について説明する。本実施形態において、撮像装置100の基本的な構成は第1の実施形態と同様である(図1参照)。以下、主に第1の実施形態と異なる点について説明する。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
Claims (18)
- 連続撮影を行う撮影制御手段と、
前記連続撮影により得られた画像から、上位階層の被写体クラスが下位階層の被写体クラスを包含する階層構造に従って階層化された複数の被写体クラスを検出する検出手段と、
所定の選択基準に基づいて特定の階層を選択する選択手段と、
前記特定の階層に属する被写体クラスを優先して、前記複数の被写体クラスの一部をユーザに通知する通知手段と、
を備えることを特徴とする撮像装置。 - 前記選択手段は、ユーザ操作に基づいて前記特定の階層を選択する
ことを特徴とする請求項1に記載の撮像装置。 - 前記連続撮影の間に広角側へのズーム操作が行われた場合、前記選択手段は、前回選択した階層よりも上位の階層を前記特定の階層として選択し、
前記連続撮影の間に望遠側へのズーム操作が行われた場合、前記選択手段は、前回選択した階層よりも下位の階層を前記特定の階層として選択する
ことを特徴とする請求項2に記載の撮像装置。 - 前記選択手段は、前記複数の被写体クラスのうち合焦度合いが最も高い被写体クラスが属する階層を、前記特定の階層として選択する
ことを特徴とする請求項2に記載の撮像装置。 - 前記通知手段が前記複数の被写体クラスの一部をユーザに通知することは、通知対象の被写体クラスを示す情報を表示手段に表示することを含む
ことを特徴とする請求項1乃至4のいずれか1項に記載の撮像装置。 - 前記通知手段が前記複数の被写体クラスの一部をユーザに通知することは、通知対象の被写体クラスを示す音声を音声出力手段から出力することを含む
ことを特徴とする請求項1乃至5のいずれか1項に記載の撮像装置。 - 前記複数の被写体クラスの数が閾値以下の場合、前記通知手段は、前記複数の被写体クラスの全てを前記ユーザに通知する
ことを特徴とする請求項1乃至6のいずれか1項に記載の撮像装置。 - 画像から検出された、上位階層の被写体クラスが下位階層の被写体クラスを包含する階層構造に従って階層化された複数の被写体クラスを取得する取得手段と、
所定の選択基準に基づいて特定の階層を選択する選択手段と、
前記特定の階層に属する被写体クラスを優先して、前記複数の被写体クラスの一部をユーザに通知する通知手段と、
を備えることを特徴とする通知装置。 - 前記選択手段は、ユーザ操作に基づいて前記特定の階層を選択する
ことを特徴とする請求項8に記載の通知装置。 - 前記画像を表示手段に表示する表示制御手段を更に備え、
前記選択手段は、前記画像の表示倍率が第1の倍率の場合、第1の階層を前記特定の階層として選択し、前記画像の表示倍率が前記第1の倍率より高い第2の倍率の場合、前記第1の階層より下位の第2の階層を前記特定の階層として選択する
ことを特徴とする請求項8に記載の通知装置。 - 前記画像のサムネイル画像を表示手段に表示する表示制御手段を更に備え、
前記選択手段は、前記表示手段に前記サムネイル画像が表示される場合、最上位の階層を前記特定の階層として選択する
ことを特徴とする請求項8に記載の通知装置。 - 前記表示手段に前記サムネイル画像が表示される場合、前記通知手段が前記複数の被写体クラスの一部をユーザに通知することは、通知対象の被写体クラスを示す情報を前記表示手段において前記サムネイル画像の近傍に表示することを含む
ことを特徴とする請求項11に記載の通知装置。 - 前記複数の被写体クラスを前記画像から検出する検出手段を更に備える
ことを特徴とする請求項8乃至12のいずれか1項に記載の通知装置。 - 前記複数の被写体クラスの数が閾値以下の場合、前記通知手段は、前記複数の被写体クラスの全てを前記ユーザに通知する
ことを特徴とする請求項8乃至13のいずれか1項に記載の通知装置。 - 撮像装置が実行する通知方法であって、
連続撮影を行う撮影制御工程と、
前記連続撮影により得られた画像から、上位階層の被写体クラスが下位階層の被写体クラスを包含する階層構造に従って階層化された複数の被写体クラスを検出する検出工程と、
所定の選択基準に基づいて特定の階層を選択する選択工程と、
前記特定の階層に属する被写体クラスを優先して、前記複数の被写体クラスの一部をユーザに通知する通知工程と、
を備えることを特徴とする通知方法。 - 通知装置が実行する通知方法であって、
画像から検出された、上位階層の被写体クラスが下位階層の被写体クラスを包含する階層構造に従って階層化された複数の被写体クラスを取得する取得工程と、
所定の選択基準に基づいて特定の階層を選択する選択工程と、
前記特定の階層に属する被写体クラスを優先して、前記複数の被写体クラスの一部をユーザに通知する通知工程と、
を備えることを特徴とする通知方法。 - コンピュータを、請求項1乃至7のいずれか1項に記載の撮像装置の各手段として機能させるためのプログラム。
- コンピュータを、請求項8乃至14のいずれか1項に記載の通知装置の各手段として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019101485A JP7394542B2 (ja) | 2019-05-30 | 2019-05-30 | 撮像装置、通知装置、通知方法、及びプログラム |
US16/882,721 US11902650B2 (en) | 2019-05-30 | 2020-05-25 | Image capturing apparatus, notification apparatus, notification method, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019101485A JP7394542B2 (ja) | 2019-05-30 | 2019-05-30 | 撮像装置、通知装置、通知方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020195117A true JP2020195117A (ja) | 2020-12-03 |
JP7394542B2 JP7394542B2 (ja) | 2023-12-08 |
Family
ID=73548104
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019101485A Active JP7394542B2 (ja) | 2019-05-30 | 2019-05-30 | 撮像装置、通知装置、通知方法、及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US11902650B2 (ja) |
JP (1) | JP7394542B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090110300A1 (en) * | 2007-10-31 | 2009-04-30 | Yuka Kihara | Apparatus and method for processing image |
JP2015222285A (ja) * | 2014-05-22 | 2015-12-10 | ウイングアーク1st株式会社 | 地理情報システムおよび数値データの可視化用プログラム |
JP2019049961A (ja) * | 2017-09-08 | 2019-03-28 | キヤノン株式会社 | 画像処理装置、画像処理方法及びプログラム |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070076116A1 (en) * | 2005-10-05 | 2007-04-05 | Pandit Amol S | Method and apparatus for dynamically adjusting the clock frequency of an imaging sensor in a digital imaging device |
JP4725408B2 (ja) | 2006-05-10 | 2011-07-13 | 株式会社ニコン | 被写体認識装置および被写体認識プログラム |
KR101719982B1 (ko) * | 2010-07-19 | 2017-03-27 | 엘지전자 주식회사 | 이동 단말기 및 그 제어방법 |
US8576184B2 (en) * | 2010-08-19 | 2013-11-05 | Nokia Corporation | Method and apparatus for browsing content files |
JP2013070303A (ja) * | 2011-09-26 | 2013-04-18 | Kddi Corp | 画面への押圧で撮影が可能な撮影装置、撮影方法及びプログラム |
JP2013084074A (ja) * | 2011-10-07 | 2013-05-09 | Sony Corp | 情報処理装置、情報処理サーバ、情報処理方法、情報抽出方法及びプログラム |
JP5911300B2 (ja) | 2011-12-27 | 2016-04-27 | キヤノン株式会社 | 撮像装置及びその制御方法 |
US10194112B2 (en) * | 2015-06-29 | 2019-01-29 | Lg Electronics Inc. | Display device and control method therefor |
US10499090B2 (en) * | 2016-12-30 | 2019-12-03 | Facebook, Inc. | Systems and methods to transition between media content items |
US10579897B2 (en) * | 2017-10-02 | 2020-03-03 | Xnor.ai Inc. | Image based object detection |
KR102592463B1 (ko) * | 2018-08-01 | 2023-10-23 | 삼성전자 주식회사 | 카메라 모듈을 통해 획득한 영상에 기반하여 정보를 저장하는 방법 및 이를 사용하는 전자 장치 |
KR102661596B1 (ko) * | 2018-08-08 | 2024-04-29 | 삼성전자주식회사 | 이미지에 대한 인식 정보, 인식 정보와 관련된 유사 인식 정보, 및 계층 정보를 이용하여 외부 객체에 대한 인식 결과를 제공하는 전자 장치 및 그의 동작 방법 |
-
2019
- 2019-05-30 JP JP2019101485A patent/JP7394542B2/ja active Active
-
2020
- 2020-05-25 US US16/882,721 patent/US11902650B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090110300A1 (en) * | 2007-10-31 | 2009-04-30 | Yuka Kihara | Apparatus and method for processing image |
JP2015222285A (ja) * | 2014-05-22 | 2015-12-10 | ウイングアーク1st株式会社 | 地理情報システムおよび数値データの可視化用プログラム |
JP2019049961A (ja) * | 2017-09-08 | 2019-03-28 | キヤノン株式会社 | 画像処理装置、画像処理方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US11902650B2 (en) | 2024-02-13 |
US20200382720A1 (en) | 2020-12-03 |
JP7394542B2 (ja) | 2023-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10002313B2 (en) | Deeply learned convolutional neural networks (CNNS) for object localization and classification | |
JP2018055259A (ja) | 情報処理装置、情報処理方法及びプログラム | |
CN109033994B (zh) | 一种基于卷积神经网络的人脸表情识别方法 | |
JP7228961B2 (ja) | ニューラルネットワークの学習装置およびその制御方法 | |
US8331713B2 (en) | Image processing apparatus, image processing method, program and learning apparatus | |
JP4546157B2 (ja) | 情報処理方法、情報処理装置、撮像装置 | |
JP2005352900A (ja) | 情報処理装置、情報処理方法、パターン認識装置、及びパターン認識方法 | |
CN112489092B (zh) | 细粒度工业运动模态分类方法、存储介质、设备和装置 | |
JP2013506198A (ja) | デジタル画像の美的品質の推定方法 | |
US20200279166A1 (en) | Information processing device | |
CN110879982A (zh) | 一种人群计数系统及方法 | |
CN114998210B (zh) | 一种基于深度学习目标检测的早产儿视网膜病变检测系统 | |
CN112036447A (zh) | 零样本目标检测系统及可学习语义和固定语义融合方法 | |
JP2018181273A (ja) | 画像処理装置及びその方法、プログラム | |
KR20180129640A (ko) | 화상 분류 프로그램, 분류 데이터 작성 프로그램 및 분류 데이터 작성 방법 | |
CN111814754A (zh) | 面向夜间场景的单帧图像行人检测方法和装置 | |
CN111126278A (zh) | 针对少类别场景的目标检测模型优化与加速的方法 | |
KR102540208B1 (ko) | 딥러닝을 이용한 화재감지방법 | |
CN114782759B (zh) | 一种基于YOLOv5网络对密集遮挡鱼类的检测方法 | |
Singh et al. | Activity detection and counting people using Mask-RCNN with bidirectional ConvLSTM | |
CN114494786A (zh) | 一种基于多层协调卷积神经网络的细粒度图像分类方法 | |
US20200286254A1 (en) | Information processing device | |
JP7394542B2 (ja) | 撮像装置、通知装置、通知方法、及びプログラム | |
JP4314017B2 (ja) | 階層処理装置 | |
JP2018205858A (ja) | 学習装置、認識装置、学習方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20210103 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210113 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220530 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230313 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230327 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230524 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230904 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231017 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231030 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231128 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7394542 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |