JP2022507144A - 人工画像生成用コンピュータアーキテクチャ - Google Patents
人工画像生成用コンピュータアーキテクチャ Download PDFInfo
- Publication number
- JP2022507144A JP2022507144A JP2021525568A JP2021525568A JP2022507144A JP 2022507144 A JP2022507144 A JP 2022507144A JP 2021525568 A JP2021525568 A JP 2021525568A JP 2021525568 A JP2021525568 A JP 2021525568A JP 2022507144 A JP2022507144 A JP 2022507144A
- Authority
- JP
- Japan
- Prior art keywords
- images
- target
- image processing
- image
- encoder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Image Analysis (AREA)
Abstract
Description
IMAGE GENERATION」に対する米国特許法第119条に基づく優先権を主張するものであり、その全体が参照により本明細書に組み込まれる。
networks, NN)、マトリックス因数分解(matrix factorization)、及びサポート・ベクトル・マシン(Support Vector Machines, SVM)ツールが、ジョブ・ポスティング(job postings)を分類又はスコアリングするために使用され得る。
problems)である。分類問題は、カテゴリ付け問題とも呼ばれ、項目群をいくつかのカテゴリ値の1つに分類する(例えば、このオブジェクトはリンゴ又はオレンジ)ことを目的としている。回帰アルゴリズムは、いくつかの項目を(例えば、実数である値を提供することによって)定量化することを目的としている。機械学習アルゴリズムは、訓練データ112を利用して、結果に影響を及ぼす、識別された特徴量(features)102間の相関を見出す。
criteria)に対して評価される。最初の実施例では、入力のための既知の出力を含む試験データセットが、訓練されていないデータを扱う際のモデルの正確さを決定するために、最終化モデルに供給される。第2の実施例では、偽陽性率又は偽陰性率を用いて、最終化後のモデルを評価してもよい。第3の実施例では、データクラスタ間の描写を使用して、そのデータクラスタに対して最も明確な境界を生成するモデルを選択する。
POOLING)を適用する。ストライド(STRIDE)は、フィルタが入力ボリュームの周りで(around the input volume)如何に畳み込むかを制御する。「STRIDE
OF 4」は、4つのユニットを一度に入力ボリュームの周りで畳み込むフィルタをいう。MAX POOLINGとは、各々のmaxプーリングされた領域の最大値を選択することによって、ダウンサンプリングすることを指す。
Claims (15)
- 処理回路及びメモリを含む画像処理装置であって、前記処理回路が:
ターゲット対象のボクセルモデルを受信し(前記ターゲット対象が画像認識装置を用いて認識されるべきであり);
前記ボクセルモデルに基づいて、ターゲット対象のTSBイメージのセットを生成し;
自動エンコーダで、前記ターゲット対象の実画像のセットを受信し;
前記自動エンコーダを使用して、前記実画像のセットに基づいて、前記TSB画像のセットに基づいて前記ターゲット対象の1つ以上の人工画像を生成し(前記自動エンコーダは、サブエンコーダを使用して前記TSB画像のセットを潜在ベクトルへとエンコードし、サブデコーダを使用して前記潜在ベクトルをデコードして前記1つ以上の人工画像を生成する);そして
出力として、前記の生成されたターゲット対象の1つ以上の人工画像を提供する、
ことを特徴とする画像処理装置。 - 請求項1に記載の画像処理装置であって:
前記サブエンコーダは、複数の畳み込み層と、前記畳み込み層を散在させた複数のプーリング層とを備え、
前記サブエンコーダは、機械学習訓練アルゴリズムを用いて、前記TSB画像のセットに基づいて前記潜在ベクトルを生成するよう訓練される、
ことを特徴とする画像処理装置。 - 請求項1に記載の画像処理装置であって:
前記サブデコーダは、複数の逆重畳層と、前記逆重畳層を散在させた複数のデプーリング層とを含み、
前記サブデコーダは、機械学習訓練アルゴリズムを用いて、前記潜在ベクトルに基づいて前記1つ以上の人工画像を生成するように訓練される、
ことを特徴とする画像処理装置。 - 請求項1に記載の画像処理装置であって、
前記前記処理回路はさらに:
前記の実画像のセットと前記の生成された1つ以上の人工画像とを用いて、前記画像認識装置を訓練し前記ターゲット対象を認識し;そして
出力として、画像認識装置が訓練されたことを示す表示を提供する;
ことを特徴とする画像処理装置。 - 請求項4に記載の画像処理装置であって、
前記前記処理回路はさらに:
前記の訓練された画像認識装置を使用してターゲット対象の新しい画像を認識する、
ことを特徴とする画像処理装置。 - 請求項4に記載の画像処理装置であって、
前記画像認識装置は、ResNet (残留ニューラルネットワーク)を備える、
ことを特徴とする画像処理装置。 - 請求項1に記載の画像処理装置であって、
前記サブエンコーダは、複数の畳み込みプールを含み、各前記畳み込みプールにはバッチ正規化が続き、各前記バッチ正規化にはReLU(整流線形ユニット)が続く、
ことを特徴とする画像処理装置。 - 請求項7に記載の画像処理装置であって、
各前記畳み込みプールのカーネルサイズは、以前の畳み込みプールのカーネルサイズよりも大きい、
ことを特徴とする画像処理装置。 - 請求項1に記載の画像処理装置であって、
前記サブデコーダは、複数のスキップ接続を含み、各前記スキップ接続にはバッチ正規化が続き、各前記バッチ正規化にはReLU (整流線形ユニット)が続き、各前記ReLUにはデコードコンボリューションが続く、
ことを特徴とする画像処理装置。 - 請求項9に記載の画像処理装置であって、
各前記デコードコンボリューションのカーネルサイズは、以前のデコードコンボリューションのカーネルサイズよりも小さい、
ことを特徴とする画像処理装置。 - 命令を記憶する、画像処理のための非一時的な機械可読媒体であって、前記命令が、1つ以上の機械の処理回路によって実行されるときに前記処理回路に:
ターゲット対象のボクセルモデルを受信するステップであり、前記ターゲット対象は画像認識装置を用いて認識されるべきである、ステップ;
前記ボクセルモデルに基づいて、前記ターゲット対象のTSB画像のセットを生成するステップ;
自動エンコーダで、前記ターゲット対象の実画像のセットを受信するステップ;
前記自動エンコーダを使用して、前記実画像のセットに基づいて、前記TSB画像のセットに基づき前記ターゲット対象の1つ以上の人工画像を生成するステップであり、前記自動エンコーダは、サブエンコーダを使用して前記TSB画像のセットを潜在ベクトルへとエンコードし、サブデコーダを使用して前記潜在ベクトルをデコードして前記1つ以上の人工画像を生成する、ステップ;
出力として、生成されたターゲット対象の1つ以上の人工画像を提供するステップ;
を実行させる命令である、
ことを特徴とする機械可読媒体。 - 請求項11に記載の機械可読媒体であって、
前記サブエンコーダは、複数の畳み込み層と、前記畳み込み層を散在させた複数のプーリング層とを備え、
前記サブエンコーダは、機械学習訓練アルゴリズムを用いて、前記TSB画像のセットに基づいて前記潜在ベクトルを生成するよう訓練される、
ことを特徴とする機械可読媒体。 - 請求項11に記載の機械可読媒体であって:
前記サブデコーダは、複数の逆重畳層と、前記逆重畳層を散在させた複数のデプーリング層とを含み、
前記サブデコーダは、機械学習訓練アルゴリズムを用いて、前記潜在ベクトルに基づいて前記1つ以上の人工画像を生成するように訓練される、
ことを特徴とする機械可読媒体。 - 請求項11に記載の機械可読媒体であって、
前記前記処理回路はさらに:
前記の実画像のセットと前記の生成された1つ以上の人工画像とを用いて、前記画像認識装置を訓練し前記ターゲット対象を認識し;そして
出力として、画像認識装置が訓練されたことを示す表示を提供する;
ことを特徴とする機械可読媒体。 - 請求項14に記載の機械可読媒体であって、
前記前記処理回路はさらに:
前記の訓練された画像認識装置を使用してターゲット対象の新しい画像を認識する、
ことを特徴とする機械可読媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862771802P | 2018-11-27 | 2018-11-27 | |
US62/771,802 | 2018-11-27 | ||
PCT/US2019/047985 WO2020112188A1 (en) | 2018-11-27 | 2019-08-23 | Computer architecture for artificial image generation |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022507144A true JP2022507144A (ja) | 2022-01-18 |
JP7214863B2 JP7214863B2 (ja) | 2023-01-30 |
Family
ID=67876094
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021525568A Active JP7214863B2 (ja) | 2018-11-27 | 2019-08-23 | 人工画像生成用コンピュータアーキテクチャ |
Country Status (4)
Country | Link |
---|---|
US (1) | US11195053B2 (ja) |
EP (1) | EP3888008A1 (ja) |
JP (1) | JP7214863B2 (ja) |
WO (1) | WO2020112188A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3888008A1 (en) | 2018-11-27 | 2021-10-06 | Raytheon Company | Computer architecture for artificial image generation |
US11585918B2 (en) * | 2020-01-14 | 2023-02-21 | Raytheon Company | Generative adversarial network-based target identification |
CN112070151B (zh) * | 2020-09-07 | 2023-12-29 | 北京环境特性研究所 | 一种mstar数据图像的目标分类识别方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017162456A (ja) * | 2016-03-11 | 2017-09-14 | 株式会社東芝 | 道路シーンのセマンティックセグメンテーションのための制約付きデコンボリューションネットワークのトレーニング |
US20170350974A1 (en) * | 2016-04-29 | 2017-12-07 | The Boeing Company | Methods and systems for model based automatic target recognition in sar data |
JP2018077786A (ja) * | 2016-11-11 | 2018-05-17 | 株式会社東芝 | 画像処理装置、画像処理方法、プログラム、運転制御システム、および、車両 |
JP2018163554A (ja) * | 2017-03-27 | 2018-10-18 | 富士通株式会社 | 画像処理装置、画像処理方法、画像処理プログラム、及び教師データ生成方法 |
JP2018181124A (ja) * | 2017-04-18 | 2018-11-15 | Kddi株式会社 | エンコーダデコーダ畳み込みニューラルネットワークにおける解像感を改善するプログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5559950A (en) * | 1994-02-02 | 1996-09-24 | Video Lottery Technologies, Inc. | Graphics processor enhancement unit |
US7359562B2 (en) * | 2003-03-19 | 2008-04-15 | Mitsubishi Electric Research Laboratories, Inc. | Enhancing low quality videos of illuminated scenes |
US9922437B1 (en) * | 2013-03-15 | 2018-03-20 | William S. Baron | Process for creating an augmented image |
KR102565279B1 (ko) * | 2018-08-23 | 2023-08-09 | 삼성전자주식회사 | 객체 검출 방법, 객체 검출을 위한 학습 방법 및 그 장치들 |
US10229346B1 (en) * | 2018-09-04 | 2019-03-12 | StradVision, Inc. | Learning method, learning device for detecting object using edge image and testing method, testing device using the same |
EP3888008A1 (en) | 2018-11-27 | 2021-10-06 | Raytheon Company | Computer architecture for artificial image generation |
-
2019
- 2019-08-23 EP EP19765590.5A patent/EP3888008A1/en active Pending
- 2019-08-23 US US16/550,015 patent/US11195053B2/en active Active
- 2019-08-23 JP JP2021525568A patent/JP7214863B2/ja active Active
- 2019-08-23 WO PCT/US2019/047985 patent/WO2020112188A1/en unknown
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017162456A (ja) * | 2016-03-11 | 2017-09-14 | 株式会社東芝 | 道路シーンのセマンティックセグメンテーションのための制約付きデコンボリューションネットワークのトレーニング |
US20170350974A1 (en) * | 2016-04-29 | 2017-12-07 | The Boeing Company | Methods and systems for model based automatic target recognition in sar data |
JP2018077786A (ja) * | 2016-11-11 | 2018-05-17 | 株式会社東芝 | 画像処理装置、画像処理方法、プログラム、運転制御システム、および、車両 |
JP2018163554A (ja) * | 2017-03-27 | 2018-10-18 | 富士通株式会社 | 画像処理装置、画像処理方法、画像処理プログラム、及び教師データ生成方法 |
JP2018181124A (ja) * | 2017-04-18 | 2018-11-15 | Kddi株式会社 | エンコーダデコーダ畳み込みニューラルネットワークにおける解像感を改善するプログラム |
Non-Patent Citations (5)
Title |
---|
BADRINARAYANAN, V. ET AL.: "SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation", IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE [ONLINE], vol. 39, no. 12, JPN6021004558, December 2017 (2017-12-01), pages 2481 - 2495, XP055942927, ISSN: 0004824444, DOI: 10.1109/TPAMI.2016.2644615 * |
DENG, S. ET AL.: "SAR Automatic Target Recognition Based on Euclidean Distance Restricted Autoencoder", IEEE JOURNAL OF SELECTED TOPICS IN APPLIED EARTH OBSERVATIONS AND REMOTE SENSING [ONLINE], vol. 10, no. 7, JPN6022028821, July 2017 (2017-07-01), pages 3323 - 3333, XP011657825, ISSN: 0004824446, DOI: 10.1109/JSTARS.2017.2670083 * |
GIRDHAR, R. ET AL., LEARNING A PREDICTABLE AND GENERATIVE VECTOR REPRESENTATION FOR OBJECTS [ONLINE], JPN6022028820, 31 August 2016 (2016-08-31), pages 1 - 16, ISSN: 0004824447 * |
中原啓貴 外2名: "3状態CNNを用いたYOLOv2のFPGA実現に関して", 電子情報通信学会技術研究報告, vol. 118, no. 63, JPN6022028822, 17 May 2018 (2018-05-17), pages 87 - 92, ISSN: 0004824445 * |
柳部 正樹 外6名: "電子部品検査精度の向上のためのオートエンコーダを用いた欠陥画像生成手法の検討", 2018年度精密工学会秋季大会講演論文集 [ONLINE], JPN6022028819, 20 August 2018 (2018-08-20), pages 632 - 633, ISSN: 0004824443 * |
Also Published As
Publication number | Publication date |
---|---|
JP7214863B2 (ja) | 2023-01-30 |
US11195053B2 (en) | 2021-12-07 |
EP3888008A1 (en) | 2021-10-06 |
US20200167605A1 (en) | 2020-05-28 |
WO2020112188A1 (en) | 2020-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7250126B2 (ja) | 自動エンコーダを用いる人工画像生成のためのコンピュータアーキテクチャ | |
US11585918B2 (en) | Generative adversarial network-based target identification | |
US11551026B2 (en) | Dynamic reconfiguration training computer architecture | |
US11068747B2 (en) | Computer architecture for object detection using point-wise labels | |
US11755838B2 (en) | Machine learning for joint recognition and assertion regression of elements in text | |
US11037027B2 (en) | Computer architecture for and-or neural networks | |
US11593619B2 (en) | Computer architecture for multiplier-less machine learning | |
US11763551B2 (en) | Systems and methods for fine tuning image classification neural networks | |
JP7214863B2 (ja) | 人工画像生成用コンピュータアーキテクチャ | |
US11003909B2 (en) | Neural network trained by homographic augmentation | |
US10877634B1 (en) | Computer architecture for resource allocation for course of action activities | |
US20230097940A1 (en) | System and method for extracting and using groups of features for interpretability analysis | |
US20220269991A1 (en) | Evaluating reliability of artificial intelligence | |
US11587323B2 (en) | Target model broker | |
US11315352B2 (en) | Calculating the precision of image annotations | |
US20230162028A1 (en) | Extracting and transferring feature representations between models | |
US20240028931A1 (en) | Directed Acyclic Graph of Recommendation Dimensions | |
US20230359208A1 (en) | Computer Architecture for Identification of Nonlinear Control Policies |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210511 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220712 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221003 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221220 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230118 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7214863 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |