RU2018110382A

RU2018110382A - Репродуцирующая аугментация данных изображения

Info

Publication number: RU2018110382A
Application number: RU2018110382A
Authority: RU
Inventors: Константин Алексеевич Зуев; Андрей Саутин
Original assignee: Общество с ограниченной ответственностью "Аби Продакшн"
Priority date: 2018-03-23
Filing date: 2018-03-23
Publication date: 2019-09-23
Also published as: RU2018110382A3; US20200334532A1; RU2716322C2; US20190294961A1; US10671920B2

Claims

1. Способ случайной аугментации данных, содержащий этапы:

получение обрабатывающим устройством одного или более первых изображений, ассоциированных с обучающей выборкой изображений для обучения модели машинного обучения в обучении;

предоставление обрабатывающим устройством одного или более первых изображений в качестве первого входа для первого множества слоев вычислительных блоков, где первое множество слоев применяет фильтры изображений;

предоставление первого выхода первого множества слоев вычислительных блоков в качестве второго входа для второго слоя вычислительных блоков, где второй слой применяет для вычислений случайные наборы параметров;

получение параметров искажений от второго слоя вычислительных блоков;

генерация одного или более вторых изображений на основе одного или более первых изображений и параметров искажений;

получение в качестве третьего выхода одного или более вторых изображений; и

добавление одного или более вторых изображений к обучающей выборке изображений для обучения модели машинного обучения.

2. Способ по п. 1, дополнительно содержащий:

предоставление второго выхода второго слоя вычислительных блоков в качестве третьего входа в третий набор слоев вычислительных блоков.

3. Способ по п. 1, отличающийся тем, что модель машинного обучения содержит сверточную нейронную сеть.

4. Способ по п. 1, в котором предоставление первого входа включает:

разделение одного или более первых изображений на множество частей; и

предоставление каждой части из множества частей первому набору слоев вычислительных блоков.

5. Способ по п. 4, в котором получение параметров искажения включает:

получение параметров искажения для каждой части из множества частей одного или более первых изображений.

6. Способ по п. 1, дополнительно содержащий:

генерацию случайной матрицы ядра свертки для второго слоя вычислительных блоков на основе одной или более матриц.

7. Способ по п. 6, в котором одна или более матриц включают одну или более:

первых матриц средних значений, первая матрица инициализируется случайными значениями;

вторых матриц значений стандартного отклонения, вторая матрица инициализируется нулевыми значениями;

третьих матриц значений смещения, третья матрица базируется на количестве фильтров, применяемых ко второму входу; или

четвертых матриц, которые базируются на произвольном значении стандартного отклонения и значении нормального распределения.

8. Способ по п. 7, в котором произвольное значение стандартного отклонения задает грубость искажения изображения.

9. Способ по п. 6, в котором параметры одной или более матриц могут включать по меньшей мере один из параметров: высота фильтра, ширина фильтра, высота изображения, ширина изображения, размер фильтра, число каналов, число фильтров или число изображений.

10. Способ по п. 9, в котором высота изображения и ширина изображения могут содержать произвольные значения.

11. Способ по п. 1, в котором одно или более первых изображений включают одно или более из:

одного или более иероглифов;

одного или более символов китайского-японского-корейского языков;

одну или более арабских строк; или

комбинацию из одного или более других символов.

12. Способ по п. 1, в котором генерация одного или более вторых изображений включает:

генерацию одного или более вторых изображений, соответствующих естественно искаженным изображениям.

13. Способ по п. 1, в котором построение одного или более вторых изображений дополнительно включает выполнение свертки перед передачей одного или более вторых изображений в качестве третьего выхода.

14. Способ по п. 7, в котором первая матрица, вторая матрица и третья матрица содержат обучаемые параметры.

15. Система случайной аугментации данных, содержащая компоненты:

память; и

процессор, взаимосвязанный с указанной памятью, обеспечивающий:

получение одного или более первых изображений, ассоциированных с обучающей выборкой изображений для обучения модели машинного обучения в обучении;

предоставление одного или более первых изображений в качестве первого входа для первого множества слоев вычислительных блоков, где первое множество слоев применяет фильтры изображений;

16. Система по п. 15, отличающаяся тем, что процессор дополнительно обеспечивает:

17. Система по п. 16, в которой одна или более матриц включают одну или более из:

первых матриц средних значений, где первая матрица инициализируется случайными значениями;

вторых матриц значений стандартного отклонения, где вторая матрица инициализируется нулевыми значениями;

третьих матриц значений смещения, где третья матрица базируется на количестве фильтров, применяемых ко второму входу; или

18. Система по п. 17, в которой произвольное значение стандартного отклонения задает грубость искажений изображения.

19. Постоянный машиночитаемый носитель данных, содержащий исполняемые команды, которые при их исполнении вычислительным устройством побуждают его к:

получению одного или более первых изображений, ассоциированных с обучающей выборкой изображений для обучения модели машинного обучения в обучении;

предоставлению одного или более первых изображений в качестве первого входа для первого множества слоев вычислительных блоков, где первое множество слоев применяет фильтры изображений;

предоставлению первого выхода первого множества слоев вычислительных блоков в качестве второго входа для второго слоя вычислительных блоков, где второй слой применяет для вычислений случайные наборы параметров;

получению параметров искажений от второго слоя вычислительных блоков;

генерации одного или более вторых изображений на основе одного или более первых изображений и параметров искажений;

получению в качестве третьего выхода одного или более вторых изображений; и

добавлению одного или более вторых изображений к обучающей выборке изображений для обучения модели машинного обучения.

20. Носитель по п. 19, в котором для получения первого входа обрабатывающее устройство выполняет: