JP2016157219A - 画像処理方法、画像処理装置 - Google Patents
画像処理方法、画像処理装置 Download PDFInfo
- Publication number
- JP2016157219A JP2016157219A JP2015033704A JP2015033704A JP2016157219A JP 2016157219 A JP2016157219 A JP 2016157219A JP 2015033704 A JP2015033704 A JP 2015033704A JP 2015033704 A JP2015033704 A JP 2015033704A JP 2016157219 A JP2016157219 A JP 2016157219A
- Authority
- JP
- Japan
- Prior art keywords
- coordinate
- image processing
- neural network
- image data
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
Description
上記した以外の課題、構成および効果は、以下の実施形態の説明により明らかにされるであろう。
以下では本発明の理解を容易にするため、まず本発明の基本的な考え方について最初に説明し、その後に本発明の実施形態について説明する。
図1は、本発明の実施形態1に係る画像処理装置100の機能ブロック図である。画像処理装置100は、ニューラルネットワークを用いて画像データ200内の物体を検出する装置であり、領域定義器110、座標分解器120、量子化器130、マッピング器140、学習器150、分類器160、再現器170を備える。以下では画像データ200の例として、人の顔画像を取り扱う。各機能部の動作については後述する。
以上のように、本実施形態1に係る画像処理装置100は、画像データ200上の座標値を量子化して学習器150内部の分類を割り当て、各座標値が各サブ領域内の検出対象物体のXY座標であるか否かを分類する。これにより、物体検出問題を分類問題として取り扱うことができるので、学習器150の学習効率を向上させることができる。
図6は、本発明の実施形態2に係る画像処理装置100の機能ブロック図である。本実施形態2に係る画像処理装置100は、実施形態1で説明した構成に加えてシフト器180を備える。その他構成は実施形態1と同様である。
本発明の実施形態3では、画像データ200が人の顔画像以外である場合におけるサブ領域の定義について例示する。画像処理装置100の構成は実施形態1〜2で説明したものと同様である。
図10は、本発明の実施形態4に係る画像処理装置100のハードウェア構成を示す図である。実施形態1〜3で説明した画像処理装置100が備える各機能部は、その機能を実装したソフトウェアをCPU(Central Processing Unit)などの演算装置が実行することにより構成することができる。
以上の実施形態1〜4において、分類器160はfully connected層の出力に対してロジスティック回帰分析を実施することを説明した。ロジスティック回帰分析は、fully connected層の出力を分類するためのものであるので、同様の処理をニューラルネットワークによる分類処理として実装することもできる。したがって分類器160は、ロジスティック回帰分析を実施することに代えて、fully connected層の次の新たなニューラルネットワーク層として構成することもできる。
本発明は上記した実施形態に限定されるものではなく、様々な変形例が含まれる。上記実施形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施形態の構成の一部を他の実施形態の構成に置き換えることもできる。また、ある実施形態の構成に他の実施形態の構成を加えることもできる。また、各実施形態の構成の一部について、他の構成を追加・削除・置換することもできる。
Claims (10)
- 入力データを分類するように学習を実施するニューラルネットワークを用いて、物体を含む画像データを処理する方法であって、
前記画像データのピクセル座標を量子化する量子化ステップ、
前記量子化したピクセル座標に対して、前記ニューラルネットワークが内部的に有するいずれかの内部分類を割り当てるマッピングステップ、
前記画像データの前記量子化したピクセル座標、および前記マッピングステップにおいて割り当てた内部分類を用いて前記ニューラルネットワークの学習を実施する学習ステップ、
前記学習後の前記ニューラルネットワークの出力値を取得する出力ステップ、
前記学習後の前記ニューラルネットワークの出力値に対して、前記量子化の逆量子化を実施することにより、前記ニューラルネットワークの出力値を前記画像データの座標系上に投影し、前記物体の位置を前記座標系上に再現する再現ステップ、
を有することを特徴とする画像処理方法。 - 前記画像処理方法はさらに、前記画像データ上において複数の領域を定義するステップを有し、
前記画像処理方法は、前記量子化ステップと前記マッピングステップを前記領域毎に実施する
ことを特徴とする請求項1記載の画像処理方法。 - 前記画像処理方法はさらに、前記ピクセル座標を座標軸毎に分解するステップを有し、
前記マッピングステップにおいては、前記分解した座標軸毎に個別の前記内部分類を割り当てる
ことを特徴とする請求項1記載の画像処理方法。 - 前記画像処理方法はさらに、前記ピクセル座標を座標軸毎に分解するステップを有し、
前記マッピングステップにおいては、前記分解した座標軸毎に個別の前記内部分類を割り当て、
前記画像処理方法はさらに、前記ニューラルネットワークの出力値を前記物体の前記座標軸上におけるいずれかの座標値へ分類する分類ステップを有し、
前記再現ステップにおいては、前記分類ステップの結果に対して前記量子化の逆量子化を実施することにより、前記物体の位置を前記座標系上に再現する
ことを特徴とする請求項1記載の画像処理方法。 - 前記画像処理方法はさらに、前記再現ステップにおいて前記座標系上に再現した前記物体を前記画像データ上の中央に向けてシフトさせるステップを有する
ことを特徴とする請求項1記載の画像処理方法。 - 入力データを分類するように学習を実施するニューラルネットワークを用いて、物体を含む画像データを処理する装置であって、
前記画像データのピクセル座標を量子化する量子化器、
前記量子化したピクセル座標に対して、前記ニューラルネットワークが内部的に有するいずれかの内部分類を割り当てるマッピング器、
前記画像データの前記量子化したピクセル座標、および前記マッピング器が割り当てた内部分類を用いて前記ニューラルネットワークの学習を実施する学習器、
前記学習後のニューラルネットワークの出力値に対して、前記量子化の逆量子化を実施することにより、前記ニューラルネットワークの出力値を前記画像データの座標系上に投影し、前記物体の位置を前記座標系上に再現する再現器、
を備えることを特徴とする画像処理装置。 - 前記画像処理装置はさらに、前記画像データ上において複数の領域を定義する領域定義器を備え、
前記画像処理装置は、前記量子化器による処理と前記マッピング器による処理を前記領域毎に実施する
ことを特徴とする請求項6記載の画像処理装置。 - 前記画像処理装置はさらに、前記ピクセル座標を座標軸毎に分解する分解器を備え、
前記マッピング器は、前記分解した座標軸毎に個別の前記内部分類を割り当てる
ことを特徴とする請求項6記載の画像処理装置。 - 前記画像処理装置はさらに、前記ピクセル座標を座標軸毎に分解する分解器を備え、
前記マッピング器は、前記分解した座標軸毎に個別の前記内部分類を割り当て、
前記画像処理装置はさらに、前記ニューラルネットワークの出力値を前記物体の前記座標軸上におけるいずれかの座標値へ分類する分類器を備え、
前記再現器は、前記分類器による処理結果に対して前記量子化器による量子化の逆量子化を実施することにより、前記物体の位置を前記座標系上に再現する
ことを特徴とする請求項6記載の画像処理装置。 - 前記画像処理装置はさらに、前記再現器が前記座標系上に再現した前記物体を前記画像データ上の中央に向けてシフトさせるシフト器を備える
ことを特徴とする請求項6記載の画像処理装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015033704A JP6348431B2 (ja) | 2015-02-24 | 2015-02-24 | 画像処理方法、画像処理装置 |
PCT/JP2016/054828 WO2016136607A1 (ja) | 2015-02-24 | 2016-02-19 | 画像処理方法、画像処理装置 |
CN201680008800.5A CN107251091A (zh) | 2015-02-24 | 2016-02-19 | 图像处理方法、图像处理装置 |
SG11201706065VA SG11201706065VA (en) | 2015-02-24 | 2016-02-19 | Image processing method, image processing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015033704A JP6348431B2 (ja) | 2015-02-24 | 2015-02-24 | 画像処理方法、画像処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016157219A true JP2016157219A (ja) | 2016-09-01 |
JP6348431B2 JP6348431B2 (ja) | 2018-06-27 |
Family
ID=56788589
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015033704A Active JP6348431B2 (ja) | 2015-02-24 | 2015-02-24 | 画像処理方法、画像処理装置 |
Country Status (4)
Country | Link |
---|---|
JP (1) | JP6348431B2 (ja) |
CN (1) | CN107251091A (ja) |
SG (1) | SG11201706065VA (ja) |
WO (1) | WO2016136607A1 (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018235628A1 (ja) * | 2017-06-23 | 2018-12-27 | オムロン株式会社 | 見守り支援システム及びその制御方法、及びプログラム |
WO2019003859A1 (ja) * | 2017-06-27 | 2019-01-03 | オムロン株式会社 | 見守り支援システム及びその制御方法、及びプログラム |
JP2019021313A (ja) * | 2017-07-14 | 2019-02-07 | シナプス テクノロジー コーポレイション | アイテムの検出 |
CN111260214A (zh) * | 2020-01-15 | 2020-06-09 | 大亚湾核电运营管理有限责任公司 | 核电站预留工单领料方法、装置、设备及存储介质 |
JP2020113945A (ja) * | 2019-01-16 | 2020-07-27 | パナソニック株式会社 | 監視カメラおよび検知方法 |
US10950104B2 (en) | 2019-01-16 | 2021-03-16 | PANASONIC l-PRO SENSING SOLUTIONS CO., LTD. | Monitoring camera and detection method |
JPWO2020240851A1 (ja) * | 2019-05-31 | 2021-09-13 | ニューラルポケット株式会社 | 情報処理システム、情報処理装置、サーバ装置、プログラム、又は方法 |
US11960565B2 (en) | 2018-03-02 | 2024-04-16 | Nec Corporation | Add-mulitply-add convolution computation for a convolutional neural network |
US11989639B2 (en) | 2018-03-02 | 2024-05-21 | Nec Corporation | Inferential device, convolutional operation method, and program |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03103997A (ja) * | 1989-09-19 | 1991-04-30 | Teremateiiku Kokusai Kenkyusho:Kk | 文字切出し認識装置 |
JPH0458943A (ja) * | 1990-06-28 | 1992-02-25 | Konica Corp | デジタル放射線画像の画像認識装置 |
JPH04317263A (ja) * | 1991-04-17 | 1992-11-09 | Fuji Photo Film Co Ltd | ニューラルネットワークを用いた照射野認識の前処理方法 |
JPH05307639A (ja) * | 1992-04-30 | 1993-11-19 | Toshiba Corp | 郵便物の宛名領域検出装置 |
JPH08272971A (ja) * | 1995-03-31 | 1996-10-18 | Toyota Motor Corp | 対象物認識方法 |
JP2008198078A (ja) * | 2007-02-15 | 2008-08-28 | Toyota Central R&D Labs Inc | 画像検出装置 |
JP2010086482A (ja) * | 2008-10-02 | 2010-04-15 | Canon Inc | 画像認識装置および画像認識方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100014755A1 (en) * | 2008-07-21 | 2010-01-21 | Charles Lee Wilson | System and method for grid-based image segmentation and matching |
JP2010055194A (ja) * | 2008-08-26 | 2010-03-11 | Sony Corp | 画像処理装置および方法、学習装置および方法、並びにプログラム |
US8582807B2 (en) * | 2010-03-15 | 2013-11-12 | Nec Laboratories America, Inc. | Systems and methods for determining personal characteristics |
CN102722712B (zh) * | 2012-01-02 | 2014-04-16 | 西安电子科技大学 | 基于连续度的多尺度高分辨图像目标检测方法 |
-
2015
- 2015-02-24 JP JP2015033704A patent/JP6348431B2/ja active Active
-
2016
- 2016-02-19 CN CN201680008800.5A patent/CN107251091A/zh active Pending
- 2016-02-19 WO PCT/JP2016/054828 patent/WO2016136607A1/ja active Application Filing
- 2016-02-19 SG SG11201706065VA patent/SG11201706065VA/en unknown
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03103997A (ja) * | 1989-09-19 | 1991-04-30 | Teremateiiku Kokusai Kenkyusho:Kk | 文字切出し認識装置 |
JPH0458943A (ja) * | 1990-06-28 | 1992-02-25 | Konica Corp | デジタル放射線画像の画像認識装置 |
JPH04317263A (ja) * | 1991-04-17 | 1992-11-09 | Fuji Photo Film Co Ltd | ニューラルネットワークを用いた照射野認識の前処理方法 |
JPH05307639A (ja) * | 1992-04-30 | 1993-11-19 | Toshiba Corp | 郵便物の宛名領域検出装置 |
JPH08272971A (ja) * | 1995-03-31 | 1996-10-18 | Toyota Motor Corp | 対象物認識方法 |
JP2008198078A (ja) * | 2007-02-15 | 2008-08-28 | Toyota Central R&D Labs Inc | 画像検出装置 |
JP2010086482A (ja) * | 2008-10-02 | 2010-04-15 | Canon Inc | 画像認識装置および画像認識方法 |
Non-Patent Citations (3)
Title |
---|
中西 功: ""特徴の種類と位置を用いたパターン認識手法の検討"", 電子情報通信学会技術研究報告, vol. 92, no. 521, JPN6018005979, 18 March 1993 (1993-03-18), JP, pages 17 - 24, ISSN: 0003798367 * |
近藤 正: ""ロジスティックGMDH−typeニューラルネットワークスによる医用画像認識"", 第47回 システム制御情報学会研究発表講演会講演論文集, JPN6018018245, 16 May 2003 (2003-05-16), JP, pages 639 - 640, ISSN: 0003798369 * |
鈴井 智史、外2名: ""システム簡易化のための特徴点選択による表情認識手法に関する検討"", 映像情報メディア学会技術報告, vol. 28, no. 61, JPN6016013926, 21 October 2004 (2004-10-21), JP, pages 1 - 4, ISSN: 0003798368 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019008515A (ja) * | 2017-06-23 | 2019-01-17 | オムロン株式会社 | 見守り支援システム及びその制御方法 |
WO2018235628A1 (ja) * | 2017-06-23 | 2018-12-27 | オムロン株式会社 | 見守り支援システム及びその制御方法、及びプログラム |
WO2019003859A1 (ja) * | 2017-06-27 | 2019-01-03 | オムロン株式会社 | 見守り支援システム及びその制御方法、及びプログラム |
JP2019008638A (ja) * | 2017-06-27 | 2019-01-17 | オムロン株式会社 | 見守り支援システム及びその制御方法 |
JP2019021313A (ja) * | 2017-07-14 | 2019-02-07 | シナプス テクノロジー コーポレイション | アイテムの検出 |
US11960565B2 (en) | 2018-03-02 | 2024-04-16 | Nec Corporation | Add-mulitply-add convolution computation for a convolutional neural network |
US11989639B2 (en) | 2018-03-02 | 2024-05-21 | Nec Corporation | Inferential device, convolutional operation method, and program |
JP2020113945A (ja) * | 2019-01-16 | 2020-07-27 | パナソニック株式会社 | 監視カメラおよび検知方法 |
US11380177B2 (en) | 2019-01-16 | 2022-07-05 | Panasonic I-Pro Sensing Solutions Co., Ltd. | Monitoring camera and detection method |
US10950104B2 (en) | 2019-01-16 | 2021-03-16 | PANASONIC l-PRO SENSING SOLUTIONS CO., LTD. | Monitoring camera and detection method |
JPWO2020240851A1 (ja) * | 2019-05-31 | 2021-09-13 | ニューラルポケット株式会社 | 情報処理システム、情報処理装置、サーバ装置、プログラム、又は方法 |
CN111260214B (zh) * | 2020-01-15 | 2024-01-26 | 大亚湾核电运营管理有限责任公司 | 核电站预留工单领料方法、装置、设备及存储介质 |
CN111260214A (zh) * | 2020-01-15 | 2020-06-09 | 大亚湾核电运营管理有限责任公司 | 核电站预留工单领料方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP6348431B2 (ja) | 2018-06-27 |
CN107251091A (zh) | 2017-10-13 |
WO2016136607A1 (ja) | 2016-09-01 |
SG11201706065VA (en) | 2017-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6348431B2 (ja) | 画像処理方法、画像処理装置 | |
JP6983937B2 (ja) | 畳み込みニューラルネットワークにおける構造学習 | |
US10373312B2 (en) | Automated skin lesion segmentation using deep side layers | |
EP3295385B1 (en) | Fixed point neural network based on floating point neural network quantization | |
US9734567B2 (en) | Label-free non-reference image quality assessment via deep neural network | |
Kim et al. | Nonnegative tucker decomposition | |
KR102564854B1 (ko) | 정규화된 표현력에 기초한 표정 인식 방법, 표정 인식 장치 및 표정 인식을 위한 학습 방법 | |
US9734424B2 (en) | Sensor data filtering | |
KR20180048930A (ko) | 분류를 위한 강제된 희소성 | |
WO2022012668A1 (zh) | 一种训练集处理方法和装置 | |
KR102370910B1 (ko) | 딥러닝 기반 소수 샷 이미지 분류 장치 및 방법 | |
KR20200067631A (ko) | 영상 처리 장치 및 그 동작방법 | |
CN111950700A (zh) | 一种神经网络的优化方法及相关设备 | |
JP2023507248A (ja) | 物体検出および認識のためのシステムおよび方法 | |
EP3239897A1 (en) | Method and apparatus for determining the similarity between multivariate data sets | |
CN115294563A (zh) | 一种基于Transformer的增强了局部语义学习能力的3D点云分析方法及装置 | |
Bezak | Building recognition system based on deep learning | |
KR102420104B1 (ko) | 영상 처리 장치 및 그 동작방법 | |
US9679219B2 (en) | Image feature classification | |
US20220383073A1 (en) | Domain adaptation using domain-adversarial learning in synthetic data systems and applications | |
EP3588441B1 (en) | Imagification of multivariate data sequences | |
Mikhaylevskiy et al. | Fast emotion recognition neural network for IoT devices | |
CN115909009A (zh) | 图像识别方法、装置、存储介质及电子设备 | |
CN116229584A (zh) | 一种人工智能领域的文本分割识别方法、系统、设备及介质 | |
US20220121953A1 (en) | Multi-task learning via gradient split for rich human analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170321 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180119 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180413 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180522 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180531 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6348431 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |