JP2018101406A - ニューラルネットワークにトレーニングデータを提供するための画像解析アルゴリズムの使用 - Google Patents
ニューラルネットワークにトレーニングデータを提供するための画像解析アルゴリズムの使用 Download PDFInfo
- Publication number
- JP2018101406A JP2018101406A JP2017182561A JP2017182561A JP2018101406A JP 2018101406 A JP2018101406 A JP 2018101406A JP 2017182561 A JP2017182561 A JP 2017182561A JP 2017182561 A JP2017182561 A JP 2017182561A JP 2018101406 A JP2018101406 A JP 2018101406A
- Authority
- JP
- Japan
- Prior art keywords
- image
- digital
- training
- pixels
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012549 training Methods 0.000 title claims abstract description 164
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 70
- 238000010191 image analysis Methods 0.000 title claims description 61
- 238000000034 method Methods 0.000 claims abstract description 19
- 238000012545 processing Methods 0.000 claims abstract description 5
- 230000002123 temporal effect Effects 0.000 claims description 22
- 230000006835 compression Effects 0.000 claims description 16
- 238000007906 compression Methods 0.000 claims description 16
- 238000005259 measurement Methods 0.000 claims description 16
- 238000002372 labelling Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 238000013527 convolutional neural network Methods 0.000 description 9
- 238000001514 detection method Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 238000012937 correction Methods 0.000 description 3
- 230000033001 locomotion Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
- G06F18/2414—Smoothing the distance, e.g. radial basis function networks [RBFN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/20—Processor architectures; Processor configuration, e.g. pipelining
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19173—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
複数のデジタル画像を取り込み、
複数のデジタル画像の画像データをトレーニングされたニューラルネットワークに提供し、複数のデジタル画像の各特定のデジタル画像について、特定のデジタル画像のピクセル群に各々対応する複数の関連度を取得するように構築されてもよい。
102 畳み込みレイヤ
102a 畳み込みレイヤ
102b 畳み込みレイヤ
104 回帰ヘッド
104a 完全接続レイヤ
104b 完全接続レイヤ
104c 完全接続レイヤ
104d 完全接続レイヤ
106 出力
200 デバイス、コンピュータ
208 デジタルトレーニング画像
212 トレーニングデータセット
204 第1の画像解析アルゴリズム
206 第2の画像解析アルゴリズム
214 人物
210 画像
302 無線ネットワーク
304 カメラ
Claims (11)
- 複数の入力用デジタル画像を受信し、特定の入力用デジタル画像内のピクセル群の関連度を決定するためのデータを前記特定の入力用デジタル画像の各々について出力するニューラルネットワークをトレーニングするための方法であって、
第1の複数のデジタルトレーニング画像について、前記第1の複数のデジタルトレーニング画像の各特定のデジタルトレーニング画像内のピクセル群の関連度を、前記ピクセル群に関連度を自動的にラベル付けするように構成された第1の画像解析アルゴリズムを使用することにより決定すること(S402)であって、1つの画像内のピクセル群の前記関連度は、当該ピクセル群の画像コンテンツが前記画像の閲覧者にとってどの程度関心のあるものであるかを規定し、前記第1の画像解析アルゴリズムは、1つの画像内のピクセル群内の画像コンテンツの閲覧者にとっての関心度を当該ピクセル群の空間的および時間的画像特性に基づいて自動的に格付けする、決定すること(S402)によって、トレーニングデータセットを決定することと、
前記第1の複数のデジタルトレーニング画像および前記ラベルを前記トレーニングデータセットとして含めることと、
前記ニューラルネットワークのトレーニング(S408)のために前記トレーニングデータセットを使用することと
を含む、方法。 - 前記第1の画像解析アルゴリズムは、
前記ピクセル群の空間的統計測定値を計算することと、
前記第1の複数のデジタルトレーニング画像の画像シーケンスに時間的フィルタリングを適用することによって、前記ピクセル群の時間的統計測定値を計算することであって、前記画像シーケンスは前記特定のデジタルトレーニング画像を含む、前記ピクセル群の時間的統計測定値を計算することと、
前記ピクセル群の前記時間的統計測定値および前記空間的統計測定値を重み付けすることによって重み付け統計測定値を計算して、前記重み付け統計測定値に基づいて前記ピクセル群に関連度をラベル付けすることと
を行うことにより、前記ピクセル群に関連度を自動的にラベル付けするように構成される、請求項1に記載の方法。 - 前記トレーニングデータセットを決定することは、
第2の複数のデジタルトレーニング画像について、前記第2の複数のデジタルトレーニング画像の各特定のデジタルトレーニング画像内のピクセル群の関連度を、前記ピクセル群に関連度を自動的にラベル付けするように構成された第2の画像解析アルゴリズムを使用することにより決定すること(S404)を含み、前記第2の画像解析アルゴリズムは前記第1の画像解析アルゴリズムとは異なる、請求項1または2に記載の方法。 - 前記第2の複数のデジタルトレーニング画像は、前記第1の複数のデジタルトレーニング画像の一部である少なくとも1つのデジタルトレーニング画像を含む、請求項3に記載の方法。
- 前記第2の複数のデジタルトレーニング画像は、前記第1の複数のデジタルトレーニング画像の一部ではない少なくとも1つのデジタルトレーニング画像を含む、請求項3または4に記載の方法。
- 前記トレーニングデータセットは、前記第1の複数のデジタルトレーニング画像の中の少なくとも1つのデジタルトレーニング画像のピクセル群に関連度を手動でラベル付けすることによってさらに決定される(S406)、請求項1から5のいずれか一項に記載の方法。
- 前記トレーニングデータセットは、前記第2の複数のデジタルトレーニング画像の中の少なくとも1つのデジタルトレーニング画像のピクセル群に関連度を手動でラベル付けすることによってさらに決定される、請求項3から6のいずれか一項に記載の方法。
- 処理能力を有するデバイスによって実行されるとき、請求項1から7のいずれか一項に記載の方法を遂行するように適合された命令を伴うコンピュータ可読記憶媒体を備えるコンピュータプログラム製品。
- 複数の入力用デジタル画像を受信し、特定の入力用デジタル画像内のピクセル群の関連度を決定するためのデータを前記特定の入力デジタル用画像の各々について出力するニューラルネットワークをトレーニングするように構成されたプロセッサを備えるコンピュータであって、前記ニューラルネットワークの前記トレーニングは、
第1の複数のデジタルトレーニング画像について、前記第1の複数のデジタルトレーニング画像の各特定のデジタルトレーニング画像内のピクセル群の関連度を、前記ピクセル群に関連度を自動的にラベル付けするように構成された第1の画像解析アルゴリズムを使用することにより決定することであって、1つの画像内のピクセル群の前記関連度は、当該ピクセル群の画像コンテンツが前記画像の閲覧者にとってどの程度関心のあるものであるかを規定し、前記第1の画像解析アルゴリズムは、1つの画像内のピクセル群内の画像コンテンツの閲覧者にとっての関心度を当該ピクセル群の空間的および時間的画像特性に基づいて自動的に格付けする、決定することによって、トレーニングデータセットを決定することと、
前記第1の複数のデジタルトレーニング画像および前記ラベルを前記トレーニングデータセットとして含めることと、
前記ニューラルネットワークのトレーニングのために前記トレーニングデータセットを使用することと
を含む、コンピュータ。 - ビデオカメラとコンピュータとを備えるシステムであって、前記コンピュータは、複数の入力用デジタル画像を受信し、特定の入力用デジタル画像内のピクセル群の関連度を決定するためのデータを前記特定の入力用デジタル画像の各々について出力するニューラルネットワークをトレーニングするように構成されたプロセッサを有し、前記ニューラルネットワークの前記トレーニングは、
第1の複数のデジタルトレーニング画像について、前記第1の複数のデジタルトレーニング画像の各特定のデジタルトレーニング画像内のピクセル群の関連度を、前記ピクセル群に関連度を自動的にラベル付けするように構成された第1の画像解析アルゴリズムを使用することにより決定することであって、1つの画像内のピクセル群の前記関連度は、当該ピクセル群の画像コンテンツが前記画像の閲覧者にとってどの程度関心のあるものであるかを規定し、前記第1の画像解析アルゴリズムは、1つの画像内のピクセル群内の画像コンテンツの閲覧者にとっての関心度を当該ピクセル群の空間的および時間的画像特性に基づいて自動的に格付けする、決定することによって、トレーニングデータセットを決定することと、
前記第1の複数のデジタルトレーニング画像および前記ラベルを前記トレーニングデータセットとして含めることと、
前記ニューラルネットワークのトレーニングのために前記トレーニングデータセットを使用することとを含み、
前記プロセッサは、結果として得られたトレーニングされたニューラルネットワークを前記カメラに提供するようにさらに構成され(S410)、
前記カメラが、
前記トレーニングされたニューラルネットワークを受信し、
複数のデジタル画像を取り込み、前記複数のデジタル画像の画像データを前記トレーニングされたニューラルネットワークに供給し、前記複数のデジタル画像の各特定のデジタル画像について、前記特定のデジタル画像のピクセル群に各々対応する複数の関連度を取得するように構築された、システム。 - 前記カメラが、
取得された前記関連度に従って前記特定のデジタル画像の圧縮度を制御することによって前記特定のデジタル画像をエンコードするようにさらに構築された、請求項10に記載のシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP16192142.4A EP3306528B1 (en) | 2016-10-04 | 2016-10-04 | Using image analysis algorithms for providing traning data to neural networks |
EP16192142.4 | 2016-10-04 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2018101406A true JP2018101406A (ja) | 2018-06-28 |
JP2018101406A5 JP2018101406A5 (ja) | 2020-08-20 |
JP6842395B2 JP6842395B2 (ja) | 2021-03-17 |
Family
ID=57083180
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017182561A Active JP6842395B2 (ja) | 2016-10-04 | 2017-09-22 | ニューラルネットワークにトレーニングデータを提供するための画像解析アルゴリズムの使用 |
Country Status (6)
Country | Link |
---|---|
US (1) | US10496903B2 (ja) |
EP (1) | EP3306528B1 (ja) |
JP (1) | JP6842395B2 (ja) |
KR (1) | KR102203694B1 (ja) |
CN (1) | CN107895359B (ja) |
TW (1) | TWI735669B (ja) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6624125B2 (ja) * | 2017-03-13 | 2019-12-25 | コニカミノルタ株式会社 | 画像検査装置、画像形成システム及び画像圧縮方法 |
JP7028333B2 (ja) * | 2018-03-05 | 2022-03-02 | オムロン株式会社 | 照明条件の設定方法、装置、システム及びプログラム並びに記憶媒体 |
DE102019208257A1 (de) * | 2018-07-03 | 2020-01-09 | Heidelberger Druckmaschinen Ag | Druckqualitätsanalyse mit neuronalen Netzen |
CN109271847B (zh) | 2018-08-01 | 2023-04-07 | 创新先进技术有限公司 | 无人结算场景中异常检测方法、装置及设备 |
KR102194303B1 (ko) | 2018-10-08 | 2020-12-22 | 단국대학교 산학협력단 | 3d 데이터 프로세싱에 이용되는 ai 트레이닝을 위한 데이터 셋 확장 생성과 전처리를 위한 장치 및 방법 |
EP3667557B1 (en) * | 2018-12-13 | 2021-06-16 | Axis AB | Method and device for tracking an object |
TWI701565B (zh) * | 2018-12-19 | 2020-08-11 | 財團法人工業技術研究院 | 資料標記系統及資料標記方法 |
US11853812B2 (en) * | 2018-12-20 | 2023-12-26 | Here Global B.V. | Single component data processing system and method utilizing a trained neural network |
US10540572B1 (en) * | 2019-01-31 | 2020-01-21 | StradVision, Inc. | Method for auto-labeling training images for use in deep learning network to analyze images with high precision, and auto-labeling device using the same |
US10762393B2 (en) * | 2019-01-31 | 2020-09-01 | StradVision, Inc. | Learning method and learning device for learning automatic labeling device capable of auto-labeling image of base vehicle using images of nearby vehicles, and testing method and testing device using the same |
US11106977B2 (en) | 2019-02-22 | 2021-08-31 | Stratuscent Inc. | Systems and methods for learning across multiple chemical sensing units using a mutual latent representation |
CN114127776A (zh) * | 2019-05-17 | 2022-03-01 | 巴科股份有限公司 | 用于训练具有构数据的生成式对抗网络的方法和系统 |
DE102019207575A1 (de) * | 2019-05-23 | 2020-11-26 | Volkswagen Aktiengesellschaft | Verfahren zum Beurteilen einer funktionsspezifischen Robustheit eines Neuronalen Netzes |
KR102339181B1 (ko) * | 2020-03-09 | 2021-12-13 | 에스케이 주식회사 | Machine Learning을 이용한 데이터 연관성 자동 탐색 방법 및 시스템 |
TWI809266B (zh) * | 2020-04-21 | 2023-07-21 | 中華電信股份有限公司 | 電梯事件偵測模型之產生與更新方法 |
EP3905659B1 (en) * | 2020-04-28 | 2022-06-01 | Axis AB | Statistics-based electronics image stabilization |
WO2021230675A1 (ko) * | 2020-05-13 | 2021-11-18 | (주)사맛디 | 딥러닝 기반 대상체 감성 인식 방법 및 장치 |
US11379697B2 (en) | 2020-05-20 | 2022-07-05 | Bank Of America Corporation | Field programmable gate array architecture for image analysis |
US11295430B2 (en) | 2020-05-20 | 2022-04-05 | Bank Of America Corporation | Image analysis architecture employing logical operations |
CN111767985B (zh) * | 2020-06-19 | 2022-07-22 | 深圳市商汤科技有限公司 | 一种神经网络的训练方法、视频识别方法及装置 |
KR102213291B1 (ko) * | 2020-07-30 | 2021-02-04 | 배도연 | 웹사이트 제작 시스템 |
KR20230068508A (ko) * | 2021-11-11 | 2023-05-18 | 한국전자기술연구원 | 효율적인 딥러닝 학습을 위한 메모리 구조 및 제어 방법 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010252276A (ja) * | 2009-04-20 | 2010-11-04 | Fujifilm Corp | 画像処理装置、画像処理方法およびプログラム |
JP2010537263A (ja) * | 2007-06-13 | 2010-12-02 | マイクロソフト コーポレーション | 広告イメージまたは非広告イメージとしてのイメージの分類 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6757602B2 (en) * | 1997-02-06 | 2004-06-29 | Automotive Technologies International, Inc. | System for determining the occupancy state of a seat in a vehicle and controlling a component based thereon |
JP3524250B2 (ja) * | 1995-11-27 | 2004-05-10 | キヤノン株式会社 | デジタル画像処理プロセッサ |
US7444030B2 (en) * | 2004-11-12 | 2008-10-28 | Micron Technology, Inc. | Image encoding with dynamic buffer-capacity-level-based compression adjustment |
US9208405B2 (en) * | 2010-08-06 | 2015-12-08 | Sony Corporation | Systems and methods for digital image analysis |
EP2499964B1 (en) * | 2011-03-18 | 2015-04-15 | SensoMotoric Instruments Gesellschaft für innovative Sensorik mbH | Optical measuring device and system |
EP2557789B1 (en) * | 2011-08-09 | 2017-09-27 | Dolby Laboratories Licensing Corporation | Guided image up-sampling in video coding |
US9066048B2 (en) * | 2013-06-17 | 2015-06-23 | Spotify Ab | System and method for switching between audio content while navigating through video streams |
US8965112B1 (en) * | 2013-12-09 | 2015-02-24 | Google Inc. | Sequence transcription with deep neural networks |
CN104103033B (zh) * | 2014-08-05 | 2017-06-06 | 广州国米科技有限公司 | 图像实时处理方法 |
EP3021583B1 (en) | 2014-11-14 | 2019-10-23 | Axis AB | Method of identifying relevant areas in digital images, method of encoding digital images, and encoder system |
EP3029937B1 (en) * | 2014-12-03 | 2016-11-16 | Axis AB | Method and encoder for video encoding of a sequence of frames |
CN104679863B (zh) | 2015-02-28 | 2018-05-04 | 武汉烽火众智数字技术有限责任公司 | 一种基于深度学习的以图搜图方法和系统 |
CN105260734A (zh) * | 2015-10-10 | 2016-01-20 | 燕山大学 | 一种具有自建模功能的商品油表面激光标码识别方法 |
CN105430394A (zh) | 2015-11-23 | 2016-03-23 | 小米科技有限责任公司 | 视频数据压缩处理方法、装置和设备 |
CN105551036B (zh) * | 2015-12-10 | 2019-10-08 | 中国科学院深圳先进技术研究院 | 一种深度学习网络的训练方法和装置 |
-
2016
- 2016-10-04 EP EP16192142.4A patent/EP3306528B1/en active Active
-
2017
- 2017-09-22 JP JP2017182561A patent/JP6842395B2/ja active Active
- 2017-09-28 KR KR1020170126009A patent/KR102203694B1/ko active IP Right Grant
- 2017-09-29 CN CN201710905791.6A patent/CN107895359B/zh active Active
- 2017-09-29 TW TW106133689A patent/TWI735669B/zh active
- 2017-10-04 US US15/725,029 patent/US10496903B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010537263A (ja) * | 2007-06-13 | 2010-12-02 | マイクロソフト コーポレーション | 広告イメージまたは非広告イメージとしてのイメージの分類 |
JP2010252276A (ja) * | 2009-04-20 | 2010-11-04 | Fujifilm Corp | 画像処理装置、画像処理方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
EP3306528A1 (en) | 2018-04-11 |
TWI735669B (zh) | 2021-08-11 |
KR20180037593A (ko) | 2018-04-12 |
JP6842395B2 (ja) | 2021-03-17 |
EP3306528B1 (en) | 2019-12-25 |
CN107895359B (zh) | 2023-06-09 |
US20180096232A1 (en) | 2018-04-05 |
KR102203694B1 (ko) | 2021-01-15 |
CN107895359A (zh) | 2018-04-10 |
TW201814596A (zh) | 2018-04-16 |
US10496903B2 (en) | 2019-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6842395B2 (ja) | ニューラルネットワークにトレーニングデータを提供するための画像解析アルゴリズムの使用 | |
US20200351509A1 (en) | Method and device for compressing image and neural network using hidden variable | |
CN108780499B (zh) | 基于量化参数的视频处理的系统和方法 | |
US11297319B2 (en) | Method for encoding images and corresponding terminals | |
CN110637460B (zh) | 利用深层神经网络的视觉质量保持量化参数预测 | |
EP3292512B1 (en) | Full reference image quality assessment based on convolutional neural network | |
Minnen et al. | Spatially adaptive image compression using a tiled deep network | |
US11010929B2 (en) | Image compression with bounded deep neural network perception loss | |
CN110309732A (zh) | 基于骨架视频的行为识别方法 | |
Lyudvichenko et al. | A semiautomatic saliency model and its application to video compression | |
CN111047543A (zh) | 图像增强方法、装置和存储介质 | |
GB2606785A (en) | Adaptive convolutions in neural networks | |
KR20200091661A (ko) | 조작 이미지 판별 장치 및 방법 | |
US20240357142A1 (en) | Video and feature coding for multi-task machine learning | |
JP6600288B2 (ja) | 統合装置及びプログラム | |
CN110913221A (zh) | 一种视频码率预测方法及装置 | |
KR20220154578A (ko) | 이미지 디노이징을 수행하는 이미지 프로세싱 장치 | |
WO2022194344A1 (en) | Learnable augmentation space for dense generative adversarial networks | |
Sopov et al. | Design efficient technologies for context image analysis in dialog HCI using self-configuring novelty search genetic algorithm | |
Ma | Blind image quality assessment: Exploiting new evaluation and design methodologies | |
Dranoshchuk et al. | About perceptual quality estimation for image compression | |
CN108805944B (zh) | 一种归类精度保持的在线图像集压缩方法 | |
CN114531594B (zh) | 一种数据处理方法、装置、设备及存储介质 | |
US20240267531A1 (en) | Systems and methods for optimizing a loss function for video coding for machines | |
CN117474810A (zh) | 一种利用色块波长信息和深度学习技术的颜色校正方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200708 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200708 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20200708 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20200714 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201030 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210121 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210216 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210219 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6842395 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |