JP2020154654A - 推定プログラム、推定装置および推定方法 - Google Patents
推定プログラム、推定装置および推定方法 Download PDFInfo
- Publication number
- JP2020154654A JP2020154654A JP2019051976A JP2019051976A JP2020154654A JP 2020154654 A JP2020154654 A JP 2020154654A JP 2019051976 A JP2019051976 A JP 2019051976A JP 2019051976 A JP2019051976 A JP 2019051976A JP 2020154654 A JP2020154654 A JP 2020154654A
- Authority
- JP
- Japan
- Prior art keywords
- data
- compression
- estimation
- degree
- data group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/776—Validation; Performance evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/08—Detecting or categorising vehicles
Abstract
Description
図1は、実施例に係る推定装置の構成を示す機能ブロック図である。図1に示す推定装置1は、特定のタスクに対応したデータ群で自己符号化器を学習し、学習した自己符号化器を用いて、データ群に含まれるデータの部分毎の圧縮率の差異により、当該データ内の必要な情報(データ群の共通の情報)を推定する。ここでいう自己符号化器とは、オートエンコーダ(AE:Auto Encoder)のことをいう。
図4Aおよび図4Bは、実施例に係る圧縮度合い算出処理の一例を示す図である。ここでは、図3と同様に、特定のタスクを「車が撮影された画像から車のメーカを判別する」というタスクとして説明する。
図5は、実施例に係る推定処理の一例を示す図である。ここでは、図3、図4Aおよび図4Bと同様に、特定のタスクを「車が撮影された画像から車のメーカを判別する」というタスクとして説明する。また、圧縮の度合いを示す指標は、式(1)により算出された場合とする。
なお、推定部13は、さらに、以下の方法で、補助画像からマスク画像へ変換しても良い。図6Aおよび図6Bは、実施例に係る推定処理の別の例を示す図である。ここでは、図3、図4Aおよび図4Bと同様に、特定のタスクを「車が撮影された画像から車のメーカを判別する」というタスクとして説明する。また、圧縮の度合いを示す指標は、式(1)により算出された場合とする。
図7は、実施例に係るAE学習処理のフローチャートの一例を示す図である。図7に示すように、AE学習部11は、特定のタスクに対応したデータ群21を読み込む(ステップS11)。AE学習部11は、AEモデルを初期化する(ステップS12)。
図8は、実施例に係る圧縮度合い算出処理のフローチャートの一例を示す図である。図8に示すように、圧縮度合い算出部12は、データ群21を読み込む(ステップS21)。圧縮度合い算出部12は、学習済みのAEモデルを読み込む(ステップS22)。
上記実施例によれば、推定装置1は、特定のタスクに対応したデータ群21で自己符号化器を学習する。推定装置1は、学習した自己符号化器を用いて、データ群21に含まれるデータについて、部分毎の圧縮の度合いを算出する。推定装置1は、算出した部分毎の圧縮の度合いに基づいて、特定のタスクに対応したデータについてのデータ群21に含まれる他のデータとの共通部分を推定する。かかる構成によれば、推定装置1は、特定のタスクに必要な情報を手間なく自動で推定することができる。言い換えれば、推定装置1は、特定のタスクに不要な情報を推定することができる。
なお、推定装置1は、データ群21を画像データの集合として、データ群21の共通の要素を推定する場合を説明した。しかしながら、推定装置1は、これに限定されず、データ群21を音声データの集合として、データ群21の共通の音声要素を推定しても良い。また、推定装置1は、データ群21を文字列データの集合として、データ群21の共通の文字列要素を推定しても良い。
10 制御部
11 AE学習部
12 圧縮度合い算出部
13 推定部
20 記憶部
21 データ群
22 AEモデルパラメータ
23 推定結果
Claims (8)
- コンピュータに、
特定のタスクに対応したデータ群で自己符号化器を学習し、
該学習した前記自己符号化器を用いて、前記データ群に含まれるデータについて、部分毎の圧縮の度合いを算出し、
該算出した部分毎の圧縮の度合いに基づいて、前記特定のタスクに対応した前記データについての前記データ群に含まれる他のデータとの共通部分を推定する
処理を実行させる推定プログラム。 - 該学習する処理は、特定のタスクに対応した教師なしの前記データ群を用いて、前記自己符号化器の入力と出力とが一致するように前記自己符号化器を学習し、
該算出する処理は、前記自己符号化器を用いて、前記データ群に含まれるデータを入力して学習させることにより得られる第1中間特徴量を生成し、前記データの部分を加工したデータを入力して学習させることにより得られる第2中間特徴量を生成し、前記第1中間特徴量と前記第2中間特徴量とを用いて前記データの部分毎の圧縮の度合いを算出する
ことを特徴とする請求項1に記載の推定プログラム。 - 該推定する処理は、前記部分毎の圧縮の度合いを用いて、前記データ群について圧縮率が高い部分ほど強調した補助画像を生成し、生成した前記補助画像に基づいて前記共通部分を推定する
ことを特徴とする請求項1または請求項2に記載の推定プログラム。 - 該推定する処理は、さらに、対象のデータを所定の手法で領域に分割し、分割した領域を用いて、前記補助画像から圧縮率が所定値より高い領域を前記共通部分として推定する
ことを特徴とする請求項3に記載の推定プログラム。 - 該推定する処理は、さらに、対象のデータを所定の手法で領域に分割し、分割した領域毎に前記補助画像から得られる前記圧縮の度合いの平均値を算出し、分割した領域毎の平均値に基づいて分割した領域を結合し、結合した領域を前記共通部分として推定する
ことを特徴とする請求項3に記載の推定プログラム。 - 前記データ群は、画像データのデータ群、音声データのデータ群または文章データのデータ群であることを特徴とする請求項1に記載の推定プログラム。
- 特定のタスクに対応したデータ群で自己符号化器を学習する学習部と、
前記学習部によって学習された前記自己符号化器を用いて、前記データ群に含まれるデータについて、部分毎の圧縮の度合いを算出する算出部と、
前記算出部によって算出された部分毎の圧縮の度合いに基づいて、前記特定のタスクに対応した前記データについての前記データ群に含まれる他のデータとの共通部分を推定する推定部と、
を有することを特徴とする推定装置。 - 特定のタスクに対応したデータ群で自己符号化器を学習し、
該学習した前記自己符号化器を用いて、前記データ群に含まれるデータについて、部分毎の圧縮の度合いを算出し、
該算出した部分毎の圧縮の度合いに基づいて、前記特定のタスクに対応した前記データについての前記データ群に含まれる他のデータとの共通部分を推定する
処理をコンピュータが実行する推定方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019051976A JP7205328B2 (ja) | 2019-03-19 | 2019-03-19 | 推定プログラム、推定装置および推定方法 |
US16/811,108 US11145062B2 (en) | 2019-03-19 | 2020-03-06 | Estimation apparatus, estimation method, and non-transitory computer-readable storage medium for storing estimation program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019051976A JP7205328B2 (ja) | 2019-03-19 | 2019-03-19 | 推定プログラム、推定装置および推定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020154654A true JP2020154654A (ja) | 2020-09-24 |
JP7205328B2 JP7205328B2 (ja) | 2023-01-17 |
Family
ID=72514459
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019051976A Active JP7205328B2 (ja) | 2019-03-19 | 2019-03-19 | 推定プログラム、推定装置および推定方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11145062B2 (ja) |
JP (1) | JP7205328B2 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005090974A (ja) * | 2003-09-12 | 2005-04-07 | Daihatsu Motor Co Ltd | 先行車認識装置 |
WO2017168870A1 (ja) * | 2016-03-28 | 2017-10-05 | ソニー株式会社 | 情報処理装置及び情報処理方法 |
JP2018018313A (ja) * | 2016-07-28 | 2018-02-01 | 国立大学法人信州大学 | 画像判別装置及び画像判別方法 |
JP2018513507A (ja) * | 2015-03-20 | 2018-05-24 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 人工ニューラルネットワークの関連性スコア割当て |
JP2019003615A (ja) * | 2017-04-27 | 2019-01-10 | ダッソー システムズDassault Systemes | オートエンコーダの学習 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6059314B1 (ja) | 2015-09-17 | 2017-01-11 | ヤフー株式会社 | 推定装置、推定方法及び推定プログラム |
JP6522050B2 (ja) | 2017-06-07 | 2019-05-29 | ヤフー株式会社 | 判定装置、学習装置、判定方法及び判定プログラム |
WO2019009449A1 (ko) * | 2017-07-06 | 2019-01-10 | 삼성전자 주식회사 | 영상을 부호화/복호화 하는 방법 및 그 장치 |
KR102061810B1 (ko) * | 2018-03-23 | 2020-01-02 | 단국대학교 산학협력단 | 멀티모달 딥러닝 기반의 이종 센서 신호 처리를 위한 장치 및 방법 |
US11507846B2 (en) * | 2018-03-26 | 2022-11-22 | Nvidia Corporation | Representing a neural network utilizing paths within the network to improve a performance of the neural network |
US11544606B2 (en) * | 2018-09-14 | 2023-01-03 | Disney Enterprises, Inc. | Machine learning based video compression |
US11159789B2 (en) * | 2018-10-24 | 2021-10-26 | City University Of Hong Kong | Generative adversarial network based intra prediction for video coding |
-
2019
- 2019-03-19 JP JP2019051976A patent/JP7205328B2/ja active Active
-
2020
- 2020-03-06 US US16/811,108 patent/US11145062B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005090974A (ja) * | 2003-09-12 | 2005-04-07 | Daihatsu Motor Co Ltd | 先行車認識装置 |
JP2018513507A (ja) * | 2015-03-20 | 2018-05-24 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 人工ニューラルネットワークの関連性スコア割当て |
WO2017168870A1 (ja) * | 2016-03-28 | 2017-10-05 | ソニー株式会社 | 情報処理装置及び情報処理方法 |
JP2018018313A (ja) * | 2016-07-28 | 2018-02-01 | 国立大学法人信州大学 | 画像判別装置及び画像判別方法 |
JP2019003615A (ja) * | 2017-04-27 | 2019-01-10 | ダッソー システムズDassault Systemes | オートエンコーダの学習 |
Also Published As
Publication number | Publication date |
---|---|
JP7205328B2 (ja) | 2023-01-17 |
US20200302611A1 (en) | 2020-09-24 |
US11145062B2 (en) | 2021-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101871098B1 (ko) | 이미지 처리 방법 및 장치 | |
US10482352B2 (en) | Information processing device and non-transitory computer readable medium | |
US10388018B2 (en) | Image processing apparatus, image processing method, and storage medium | |
JP7030493B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
US20200380641A1 (en) | Image processing apparatus, image processing method, and storage medium | |
US11373098B2 (en) | Processing apparatus, learning apparatus, processing method, and nonvolatile recording medium | |
KR20150032822A (ko) | 이미지를 필터링하기 위한 방법 및 장치 | |
KR101786754B1 (ko) | 나이 추정 장치 및 방법 | |
JP2015191521A (ja) | 画像処理装置、画像処理方法、およびプログラム | |
JP5146797B2 (ja) | パターン欠陥検査のための装置、その方法及びそのプログラムを記録したコンピュータ読取り可能な記録媒体 | |
US20200234139A1 (en) | Learning method, learning apparatus, and computer-readable recording medium | |
JP4252308B2 (ja) | 解像度向上方法及び装置 | |
JP2020177582A (ja) | 学習装置、学習方法、プログラムおよび認識装置 | |
JP2000232384A (ja) | データ処理装置およびデータ処理方法 | |
JP2009294733A (ja) | 画像処理装置および画像処理方法 | |
JP2020154654A (ja) | 推定プログラム、推定装置および推定方法 | |
JP7395705B2 (ja) | 推定装置、推定方法及びプログラム | |
CN114078149A (zh) | 一种图像估计方法、电子设备及存储介质 | |
JP2021086284A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
CN112801883A (zh) | 图像处理方法、装置、电子设备及计算机可读存储介质 | |
US11501417B2 (en) | Image processing apparatus for estimating the number of specific objects in an image | |
CN115191928A (zh) | 信息处理装置、信息处理方法、学习方法以及存储介质 | |
CN111861931A (zh) | 模型训练、图像增强方法和装置、电子设备及存储介质 | |
CN111932514A (zh) | 一种图像噪声水平估计、抑制方法、装置及电子设备 | |
JP7458857B2 (ja) | 画像処理装置、画像処理方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211208 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221017 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221129 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221212 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7205328 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |