RU2018110382A - Репродуцирующая аугментация данных изображения - Google Patents

Репродуцирующая аугментация данных изображения Download PDF

Info

Publication number
RU2018110382A
RU2018110382A RU2018110382A RU2018110382A RU2018110382A RU 2018110382 A RU2018110382 A RU 2018110382A RU 2018110382 A RU2018110382 A RU 2018110382A RU 2018110382 A RU2018110382 A RU 2018110382A RU 2018110382 A RU2018110382 A RU 2018110382A
Authority
RU
Russia
Prior art keywords
images
matrix
layers
providing
layer
Prior art date
Application number
RU2018110382A
Other languages
English (en)
Other versions
RU2018110382A3 (ru
RU2716322C2 (ru
Inventor
Константин Алексеевич Зуев
Андрей Саутин
Original Assignee
Общество с ограниченной ответственностью "Аби Продакшн"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Общество с ограниченной ответственностью "Аби Продакшн" filed Critical Общество с ограниченной ответственностью "Аби Продакшн"
Priority to RU2018110382A priority Critical patent/RU2716322C2/ru
Priority to US15/938,897 priority patent/US10671920B2/en
Publication of RU2018110382A publication Critical patent/RU2018110382A/ru
Publication of RU2018110382A3 publication Critical patent/RU2018110382A3/ru
Application granted granted Critical
Publication of RU2716322C2 publication Critical patent/RU2716322C2/ru
Priority to US16/889,619 priority patent/US20200334532A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/1914Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries, e.g. user dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/293Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of characters other than Kanji, Hiragana or Katakana

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Claims (64)

1. Способ случайной аугментации данных, содержащий этапы:
получение обрабатывающим устройством одного или более первых изображений, ассоциированных с обучающей выборкой изображений для обучения модели машинного обучения в обучении;
предоставление обрабатывающим устройством одного или более первых изображений в качестве первого входа для первого множества слоев вычислительных блоков, где первое множество слоев применяет фильтры изображений;
предоставление первого выхода первого множества слоев вычислительных блоков в качестве второго входа для второго слоя вычислительных блоков, где второй слой применяет для вычислений случайные наборы параметров;
получение параметров искажений от второго слоя вычислительных блоков;
генерация одного или более вторых изображений на основе одного или более первых изображений и параметров искажений;
получение в качестве третьего выхода одного или более вторых изображений; и
добавление одного или более вторых изображений к обучающей выборке изображений для обучения модели машинного обучения.
2. Способ по п. 1, дополнительно содержащий:
предоставление второго выхода второго слоя вычислительных блоков в качестве третьего входа в третий набор слоев вычислительных блоков.
3. Способ по п. 1, отличающийся тем, что модель машинного обучения содержит сверточную нейронную сеть.
4. Способ по п. 1, в котором предоставление первого входа включает:
разделение одного или более первых изображений на множество частей; и
предоставление каждой части из множества частей первому набору слоев вычислительных блоков.
5. Способ по п. 4, в котором получение параметров искажения включает:
получение параметров искажения для каждой части из множества частей одного или более первых изображений.
6. Способ по п. 1, дополнительно содержащий:
генерацию случайной матрицы ядра свертки для второго слоя вычислительных блоков на основе одной или более матриц.
7. Способ по п. 6, в котором одна или более матриц включают одну или более:
первых матриц средних значений, первая матрица инициализируется случайными значениями;
вторых матриц значений стандартного отклонения, вторая матрица инициализируется нулевыми значениями;
третьих матриц значений смещения, третья матрица базируется на количестве фильтров, применяемых ко второму входу; или
четвертых матриц, которые базируются на произвольном значении стандартного отклонения и значении нормального распределения.
8. Способ по п. 7, в котором произвольное значение стандартного отклонения задает грубость искажения изображения.
9. Способ по п. 6, в котором параметры одной или более матриц могут включать по меньшей мере один из параметров: высота фильтра, ширина фильтра, высота изображения, ширина изображения, размер фильтра, число каналов, число фильтров или число изображений.
10. Способ по п. 9, в котором высота изображения и ширина изображения могут содержать произвольные значения.
11. Способ по п. 1, в котором одно или более первых изображений включают одно или более из:
одного или более иероглифов;
одного или более символов китайского-японского-корейского языков;
одну или более арабских строк; или
комбинацию из одного или более других символов.
12. Способ по п. 1, в котором генерация одного или более вторых изображений включает:
генерацию одного или более вторых изображений, соответствующих естественно искаженным изображениям.
13. Способ по п. 1, в котором построение одного или более вторых изображений дополнительно включает выполнение свертки перед передачей одного или более вторых изображений в качестве третьего выхода.
14. Способ по п. 7, в котором первая матрица, вторая матрица и третья матрица содержат обучаемые параметры.
15. Система случайной аугментации данных, содержащая компоненты:
память; и
процессор, взаимосвязанный с указанной памятью, обеспечивающий:
получение одного или более первых изображений, ассоциированных с обучающей выборкой изображений для обучения модели машинного обучения в обучении;
предоставление одного или более первых изображений в качестве первого входа для первого множества слоев вычислительных блоков, где первое множество слоев применяет фильтры изображений;
предоставление первого выхода первого множества слоев вычислительных блоков в качестве второго входа для второго слоя вычислительных блоков, где второй слой применяет для вычислений случайные наборы параметров;
получение параметров искажений от второго слоя вычислительных блоков;
генерация одного или более вторых изображений на основе одного или более первых изображений и параметров искажений;
получение в качестве третьего выхода одного или более вторых изображений; и
добавление одного или более вторых изображений к обучающей выборке изображений для обучения модели машинного обучения.
16. Система по п. 15, отличающаяся тем, что процессор дополнительно обеспечивает:
генерацию случайной матрицы ядра свертки для второго слоя вычислительных блоков на основе одной или более матриц.
17. Система по п. 16, в которой одна или более матриц включают одну или более из:
первых матриц средних значений, где первая матрица инициализируется случайными значениями;
вторых матриц значений стандартного отклонения, где вторая матрица инициализируется нулевыми значениями;
третьих матриц значений смещения, где третья матрица базируется на количестве фильтров, применяемых ко второму входу; или
четвертых матриц, которые базируются на произвольном значении стандартного отклонения и значении нормального распределения.
18. Система по п. 17, в которой произвольное значение стандартного отклонения задает грубость искажений изображения.
19. Постоянный машиночитаемый носитель данных, содержащий исполняемые команды, которые при их исполнении вычислительным устройством побуждают его к:
получению одного или более первых изображений, ассоциированных с обучающей выборкой изображений для обучения модели машинного обучения в обучении;
предоставлению одного или более первых изображений в качестве первого входа для первого множества слоев вычислительных блоков, где первое множество слоев применяет фильтры изображений;
предоставлению первого выхода первого множества слоев вычислительных блоков в качестве второго входа для второго слоя вычислительных блоков, где второй слой применяет для вычислений случайные наборы параметров;
получению параметров искажений от второго слоя вычислительных блоков;
генерации одного или более вторых изображений на основе одного или более первых изображений и параметров искажений;
получению в качестве третьего выхода одного или более вторых изображений; и
добавлению одного или более вторых изображений к обучающей выборке изображений для обучения модели машинного обучения.
20. Носитель по п. 19, в котором для получения первого входа обрабатывающее устройство выполняет:
разделение одного или более первых изображений на множество частей; и
предоставление каждой части из множества частей первому набору слоев вычислительных блоков.
RU2018110382A 2018-03-23 2018-03-23 Репродуцирующая аугментация данных изображения RU2716322C2 (ru)

Priority Applications (3)

Application Number Priority Date Filing Date Title
RU2018110382A RU2716322C2 (ru) 2018-03-23 2018-03-23 Репродуцирующая аугментация данных изображения
US15/938,897 US10671920B2 (en) 2018-03-23 2018-03-28 Generative augmentation of image data
US16/889,619 US20200334532A1 (en) 2018-03-23 2020-06-01 Generative augmentation of image data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2018110382A RU2716322C2 (ru) 2018-03-23 2018-03-23 Репродуцирующая аугментация данных изображения

Publications (3)

Publication Number Publication Date
RU2018110382A true RU2018110382A (ru) 2019-09-23
RU2018110382A3 RU2018110382A3 (ru) 2020-02-05
RU2716322C2 RU2716322C2 (ru) 2020-03-11

Family

ID=67985362

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2018110382A RU2716322C2 (ru) 2018-03-23 2018-03-23 Репродуцирующая аугментация данных изображения

Country Status (2)

Country Link
US (2) US10671920B2 (ru)
RU (1) RU2716322C2 (ru)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11820289B2 (en) 2018-07-31 2023-11-21 Sony Semiconductor Solutions Corporation Solid-state imaging device and electronic device
WO2020027233A1 (ja) 2018-07-31 2020-02-06 ソニーセミコンダクタソリューションズ株式会社 撮像装置及び車両制御システム
US10818386B2 (en) * 2018-11-21 2020-10-27 Enlitic, Inc. Multi-label heat map generating system
US11995854B2 (en) * 2018-12-19 2024-05-28 Nvidia Corporation Mesh reconstruction using data-driven priors
US10984311B2 (en) * 2019-02-27 2021-04-20 Robert Bosch Gmbh Involved generative machine learning models for functional testing
US11126895B2 (en) * 2019-05-22 2021-09-21 Lawrence Livermore National Security, Llc Mimicking of corruption in images
US11687778B2 (en) 2020-01-06 2023-06-27 The Research Foundation For The State University Of New York Fakecatcher: detection of synthetic portrait videos using biological signals
US11676406B2 (en) 2020-05-20 2023-06-13 Applications Mobiles Overview Inc. System and method of augmenting a three-dimensional objects training dataset
CN111784580B (zh) * 2020-06-30 2024-08-20 北京金山云网络技术有限公司 图像的超分辨率方法、装置和服务器
US11909482B2 (en) * 2020-08-18 2024-02-20 Qualcomm Incorporated Federated learning for client-specific neural network parameter generation for wireless communication
JP2022049261A (ja) * 2020-09-16 2022-03-29 キヤノン株式会社 情報処理装置及び情報処理方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9916538B2 (en) 2012-09-15 2018-03-13 Z Advanced Computing, Inc. Method and system for feature detection
RU2504006C1 (ru) * 2012-06-05 2014-01-10 Александр Николаевич Цуриков Способ обучения искусственной нейронной сети
US11017311B2 (en) 2014-06-30 2021-05-25 Hewlett Packard Enterprise Development Lp Dataset augmentation based on occlusion and inpainting
RU2566979C1 (ru) * 2014-12-15 2015-10-27 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Тульский государственный университет" (ТулГУ) Способ обучения искусственной нейронной сети
CN115879519A (zh) * 2014-12-24 2023-03-31 渊慧科技有限公司 增强神经网络以生成附加输出
WO2017031356A1 (en) 2015-08-19 2017-02-23 D-Wave Systems Inc. Discrete variational auto-encoder systems and methods for machine learning using adiabatic quantum computers
US9785855B2 (en) * 2015-12-17 2017-10-10 Conduent Business Services, Llc Coarse-to-fine cascade adaptations for license plate recognition with convolutional neural networks
US10373073B2 (en) * 2016-01-11 2019-08-06 International Business Machines Corporation Creating deep learning models using feature augmentation
WO2018006095A2 (en) * 2016-07-01 2018-01-04 Digimarc Corporation Image-based pose determination
US10445569B1 (en) * 2016-08-30 2019-10-15 A9.Com, Inc. Combination of heterogeneous recognizer for image-based character recognition
US10467458B2 (en) * 2017-07-21 2019-11-05 Altumview Systems Inc. Joint face-detection and head-pose-angle-estimation using small-scale convolutional neural network (CNN) modules for embedded systems
US10474988B2 (en) * 2017-08-07 2019-11-12 Standard Cognition, Corp. Predicting inventory events using foreground/background processing
JP7346401B2 (ja) * 2017-11-10 2023-09-19 エヌビディア コーポレーション 安全で信頼できる自動運転車両のためのシステム及び方法

Also Published As

Publication number Publication date
RU2018110382A3 (ru) 2020-02-05
US20200334532A1 (en) 2020-10-22
RU2716322C2 (ru) 2020-03-11
US20190294961A1 (en) 2019-09-26
US10671920B2 (en) 2020-06-02

Similar Documents

Publication Publication Date Title
RU2018110382A (ru) Репродуцирующая аугментация данных изображения
US11645529B2 (en) Sparsifying neural network models
WO2019224823A8 (en) Method and system for imaging and image processing
WO2018216207A1 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
CN111542839B (zh) 一种反卷积神经网络的硬件加速方法、装置和电子设备
CN109410149B (zh) 一种基于并行特征提取的cnn去噪方法
CN110009573B (zh) 模型训练、图像处理方法、装置、电子设备及存储介质
CN110569961A (zh) 一种神经网络训练方法、装置及终端设备
CN113469072B (zh) 基于GSoP和孪生融合网络的遥感图像变化检测方法及系统
JP2018520531A5 (ru)
CN111368941B (zh) 一种图像处理方法、装置以及计算机存储介质
CN116310712A (zh) 一种基于循环生成对抗网络的图像水墨风格迁移方法及系统
KR102537207B1 (ko) 머신 러닝에 기반한 이미지 처리 방법 및 장치
CN110070503A (zh) 基于卷积神经网络的尺度校准方法、系统及介质
CN109359542B (zh) 基于神经网络的车辆损伤级别的确定方法及终端设备
CN109993701A (zh) 一种基于金字塔结构的深度图超分辨率重建的方法
Guo et al. VDN: Variant‐depth network for motion deblurring
TWI766203B (zh) 用於實施神經網路應用之卷積塊陣列及其使用方法、和卷積塊電路
CN106663186A (zh) 用于脸部识别的方法和系统
JP2016064634A5 (ru)
JP2016116108A5 (ja) 画像処理装置
JPWO2021020339A5 (ru)
CN110992245B (zh) 一种高光谱图像降维方法及装置
CN103632344B (zh) Mean边界条件下模糊矩阵与图像矢量乘积的替代计算方法
CN114332567A (zh) 训练样本的获取方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
QB4A Licence on use of patent

Free format text: LICENCE FORMERLY AGREED ON 20201211

Effective date: 20201211

QC41 Official registration of the termination of the licence agreement or other agreements on the disposal of an exclusive right

Free format text: LICENCE FORMERLY AGREED ON 20201211

Effective date: 20220311