RU2708504C1 - Способ обучения системы распознавания товаров на изображениях - Google Patents

Способ обучения системы распознавания товаров на изображениях Download PDF

Info

Publication number
RU2708504C1
RU2708504C1 RU2018134658A RU2018134658A RU2708504C1 RU 2708504 C1 RU2708504 C1 RU 2708504C1 RU 2018134658 A RU2018134658 A RU 2018134658A RU 2018134658 A RU2018134658 A RU 2018134658A RU 2708504 C1 RU2708504 C1 RU 2708504C1
Authority
RU
Russia
Prior art keywords
images
goods
product
image
unique
Prior art date
Application number
RU2018134658A
Other languages
English (en)
Inventor
Павел Юрьевич Бойко
Марк Сергеевич Виноградов
Максим Валерьевич Федоров
Original Assignee
Автономная некоммерческая образовательная организация высшего образования "Сколковский институт науки и технологий"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Автономная некоммерческая образовательная организация высшего образования "Сколковский институт науки и технологий" filed Critical Автономная некоммерческая образовательная организация высшего образования "Сколковский институт науки и технологий"
Priority to RU2018134658A priority Critical patent/RU2708504C1/ru
Application granted granted Critical
Publication of RU2708504C1 publication Critical patent/RU2708504C1/ru

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

Изобретение относится к системам распознавания товаров на изображениях. Техническим результатом является автоматизированное обучение нейронной сети на основе новых изображений товаров. Способ содержит этапы, на которых посредством устройства обучения нейронной сети извлекают из блока хранения данных изображения товаров, полученных с помощью устройств пользователей; формируют для каждого изображения товара многомерный вектор изображения; кластеризируют сформированные многомерные векторы изображения для получения кластеров изображений; идентифицируют по меньшей мере один кластер изображений либо как один из известных системе товаров, либо как новый, ранее не известный товар; присваивают по меньшей мере одному кластеру изображений, который был идентифицирован как новый товар, уникальную метку кластера; обучают нейронную сеть распознавать товары на изображениях на основе изображений упомянутых кластеров изображений, причем товару, который был определен ранее как неизвестный товар, назначается уникальная метка кластера в качестве уникальной характеристики товара; формируют в базе каталога товаров новый вид товара, которому в качестве уникальной характеристики товара назначается уникальная метка кластера, а примерами изображений товара назначаются изображения, которые вошли в кластер с данной уникальной меткой кластера. 2 н. и 2 з.п. ф-лы, 1 ил.

Description

ОБЛАСТЬ ТЕХНИКИ
Техническое решение относится к системам технического зрения на базе алгоритмов машинного обучения (в частности, на основе искусственных нейронных сетей), а именно к системам распознавания товаров на изображениях. Под распознаванием товаров на изображениях в настоящем документе понимается автоматическое определение местоположения (координаты центра и размеры описанного прямоугольника) и наименования (среди одного из известных классов) товаров на фото- или видео-изображении выкладки товара в торговом оборудовании.
УРОВЕНЬ ТЕХНИКИ
Из уровня техники известны различные решения, обеспечивающие распознавание товаров на изображениях.
В документах US8923893B2 (США, 2015), US20030154141A1 (США, 2001), US9665794B2 (США, 2012) описывается только технический процесс распознавания товаров и обходят стороной вопрос обучения; патенты US20130051611A1 (США, 2011), US20160155011A1 (США, 2014) используют эталонные изображения товаров для сравнения и распознавания, не раскрывая процесс создания каталога эталонных изображений товаров. Другие патенты, например, US20160342863A1 (США, 2016), упоминают о возможности дообучения и поддержки каталога, но не указывают конкретных механизмов его актуализации.
Для каталогизации, разметки и доразметки изображений в большинстве используются системы колл-центров (такие как Mechanical Turk и пр.). Таким образом, текущий уровень техники обучения распознавания товаров использует ручную разметку и ручную каталогизацию как для задачи распознавания по известному каталогу, так и для задачи обновления каталога товаров.
РАСКРЫТИЕ ИЗОБРЕТЕНИЯ
Технической задачей, на решение которой направлено заявленное решение, обеспечение возможности обучения системы технического зрения распознаванию новых классов объектов, а именно обучение системы распознавания товаров на изображениях распознаванию новых товаров или новых вариантах дизайна упаковки товаров. В начальном состоянии система обучена распознаванию определенного количества «старых» товаров, а также имеется множество изображений, на каждом из которых изображены один или несколько товаров «старых», а также неизвестных («новых») товаров. Описываемый способ обучения позволяет получить в конечном состоянии систему, обученную распознаванию как «старых», так и «новых» товаров. Особенностью описываемого способа является кратное снижение ручных операций, выполняемых человеком, в процессе обучения, по сравнению с альтернативными методами, в том числе возможность полностью автоматического режима работы, без привлечения человека в процессе обучения распознаванию «новых» товаров.
Техническим результатом является обеспечение возможности автоматизированного обучения нейронных сетей распознаванию изображений товаров на основе новых изображений товаров.
Для обеспечения достижения указанного технического результата разработан способ обучения системы распознавания товаров на изображениях, содержащий этапы, на которых: извлекают из блока хранения данных изображения товаров, полученных с помощью устройств пользователей; формируют для каждого изображения товара многомерный вектор изображения; кластеризируют сформированные многомерные вектора изображения для получения кластеров изображений; идентифицируют по меньшей мере один кластер изображений либо как один из известных системе товаров, либо как новый, ранее не известный товар; присваивают по меньшей мере одному кластеру изображений, который был идентифицирован как новый товар, уникальную метку кластера; обучают нейронную сеть распознавать товары на изображениях на основе изображений упомянутых кластеров изображений, причем товару, который был определен ранее как неизвестный товар, назначается уникальная метка кластера в качестве уникальной характеристики товара.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
Для лучшего понимания сущности изобретения, и чтобы более ясно показать, каким образом оно может быть осуществлено, далее будет сделана ссылка, лишь в качестве примера, на прилагаемый чертеж, на котором изображено:
фиг. 1 – система распознавания товаров на изображениях.
ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ
В соответствии со схемой, приведенной на фиг. 1, система распознавания товаров на изображениях содержит: блок обработки данных 10, содержащий блок приема и передачи данных 11 и блок хранения данных 12; подсистему распознавания изображений 20; базу каталога товаров 30 и устройство 40 обучения нейронной сети.
Блок обработки данных 10 реализован на базе программно-аппаратных средств и предназначен для сбора данных, например, изображений, текста и геопозиции от различных источников данных. Например, блок обработки данных 10 может принимать посредством блока приема и передачи данных 11 фотографии от устройств пользователя, в частности, мобильных телефонов, смартфонов или планшетов, подключенных к Интернет посредством беспроводного соединения и оснащенных специализированным мобильным приложением. Посредством мобильного приложения пользователи могут получать фотографии выкладки товаров в торговом оборудовании, отправлять в блок приема и передачи данных 11 фотографии и другие данные, например, время и место съёмки, и получать от блока приема и передачи данных 11 результаты распознавания, например, информацию о соответствии выкладки правилам и требованиям. Полученный данные блок приема и передачи данных 11 сохраняет в блоке хранения данных 12, а также передает их в подсистему распознавания изображений 20.
Подсистема распознавания изображений 20 реализована на базе по меньшей мере одного сервера, выполненного в программно-аппаратной части таким образом, чтобы обеспечить выполнение приписанный в настоящей заявке ей функций, в частности, подсистема распознавания изображений 20 может быть реализована на базе искусственной нейронной сети. Подсистема распознавания изображений 20 получает фотографии выкладки товаров в торговом оборудовании, а также время и место съёмки от блока приема и передачи данных 11, определяет местоположение товара на изображении и характеристики внешнего вида товара. Характеристики внешнего вида товара определяются заранее обученной нейронной сетью на основе обучающей выборки из каталога, например, методами, раскрытыми в заявке EP3032461 (A1), опубл. 15.06.2016.
Далее подсистема распознавания изображений 20 на основе информации о времени и месте съёмки и характеристик внешнего вида товара для каждого товара, распознанном на изображении, осуществляет построение многомерного вектора, описывающего неявные и явные признаки этого товара. Под неявными признаками понимаются признаки, полученные нейросетью, которая описывает характеристики внешнего вида данного товара, а под явными – время и место съёмки. Дополнительно при формировании многомерного вектора могут учитываться характеристики внешнего вида товаров, распознанных на том же изображении товара. Полученные многомерные вектора для изображений сохраняются в блоке хранения данных 12.
База каталога товаров 30 представляет собой базу данных, содержащую примеры изображений товаров, информацию о местоположении товаров на примерах изображений, характеристики внешнего вида товара на примерах изображений, метка товара, информацию о географическом местоположении товаров, производные показатели, например, информация о правилах выкладки, а также уникальные характеристики товара, например, его наименование, торговую марку, компанию-производителя и т.п. В качестве уникального идентификатора товара в каталоге товаров выступает один или несколько числовых «штрих-кодов» стандарта EAN-13, EAN-8 или другого стандарта. Информация о географическом местоположении задается пользователем в зависимости от точек продаж, где данный товар находится на полке.
Подсистема распознавания изображений 20 обращается к базе каталога товаров 30, извлекает характеристики внешнего вида товара на примерах изображений и информацию о географическом местоположении данного товара и осуществляет построение многомерных векторов для примеров изображений товаров аналогичным ранее способом. В альтернативном варианте реализации заявленного решения многомерные вектора для примера изображения могут быть заранее рассчитаны и сохранены в базе каталога товаров 30.
Полученные многомерные вектора для примера изображений товара сравниваются упомянутой подсистемой 20 с многомерными векторами, сохраненными в блоке хранения данных 12 для определения коэффициентов похожести товаров, распознанном на изображении, на товары из каталога товаров 30. Коэффициенты похожести товара, распознанном на изображении, может определяться по различным метрикам, например, по евклидовому расстоянию от многомерного вектора, сохраненного в блоке хранения данных 12 до многомерных векторов для примеров изображений товара. Далее подсистема распознавания изображений 20 выбирает минимальное значение коэффициента похожести товара и сравнивает его с заранее заданным диапазоном минимальных значений коэффициента похожести товара. Диапазон минимальных значений коэффициента похожести товара может быть заранее задан пользователем в подсистеме распознавания изображений 20 с учетом данных о характеристиках внешнего вида товаров, распознанных на том же изображении товара, а также с учетом места и времени съемки.
Подсистема распознавания изображений 20 определяет многомерный вектор для примера изображения товара, ближайший по заданной метрике к тому вектору, у которого получилось выбранное минимальное значение коэффициента похожести товара, и обращается к базе каталога товаров 30 и определяет товар, соответствующий данному многомерному вектору для примера изображения товара, а также извлекает уникальные характеристиками данного товара и производные показатели. Полученные уникальные характеристиками товара назначаются товару, распознанному на изображении, и сохраняются в блок хранения данных 12. Уникальные характеристиками товара и производные показатели могут быть переданы в мобильное приложение в ответ на направленное им ранее изображение товара в блок приема и передачи данных 11.
Если выбранное минимальное значение коэффициента похожести находится в пределах заданного диапазона минимальных значений коэффициента похожести товара, то товар классифицируется системой 20 как известный с меткой или уникальным идентификатором товара, полученных из каталога товаров 30; если выбранное минимальное значение коэффициента похожести выходит за пределы заданного диапазона минимальных значений коэффициента похожести товара, то подсистема распознавания изображений 20 определяет данный товар как неизвестный системе.
В процессе работы подсистемы распознавания изображений 20 возникает необходимость в обучении искусственной сети распознаванию товаров на изображениях в соответствии с новыми примерами изображений товаров. Для обучения подсистемы 20 в систему распознавания товаров на изображениях введено устройство 40 обучения нейронной сети. Устройство 40 обучения нейронной сети может быть выполнено на базе по меньшей мере одного процессора или микроконтроллера, выполненных в программно-аппаратной части таким образом, чтобы обеспечить выполнение приписанных устройству ниже функций.
В соответствии с заложенным в устройство 40 обучения нейронной сети программным алгоритмом или по запросу пользователя, упомянутое устройство обращается к блоку хранения данных 12 и извлекает из него изображения товаров, полученных с помощью устройств пользователей, уникальные характеристики товаров, многомерные вектора для товаров, распознанных на изображении, информацию о местонахождении товара на изображении, информацию о соседних товарах и месте съемки. Далее для каждого извлеченного изображения товара устройство 40 обучения нейронной сети формирует многомерный вектор изображения с учетом информации о уникальных характеристиках товаров, распознанном на данном изображении, многомерных векторов товаров, местонахождении товара на изображении, о соседних товарах и месте съемки.
Полученные многомерные вектора изображений кластеризуются устройством 40 обучения нейронной сети для получения кластеров изображений. Кластеризация этих векторов может осуществляться посредством известных алгоритмов, например, алгоритмом KMeans, EM-алгоритмом и др. алгоритмами с L2-метрикой. Затем каждый кластер изображений устройство 40 обучения нейронной сети идентифицирует либо как один из известных системе товаров, либо как новый, ранее не известный товар. Соответственно, кластеры, в которые вошли изображения товаров с назначенными ранее уникальными характеристиками товара, идентифицируется как на основе упомянутых назначенных уникальных характеристик, например, кластеру присваивается наименование товара, распознанном на изображениях, которые вошли в данный кластер. Кластеры, в которые вошли изображения неизвестных товаров, идентифицируются как неизвестные и им присваивается уникальная метка, сформированная, например, на основе информации о характеристиках внешнего вида товаров, изображение которых вошли в кластер, в частности, информации о размерах товара и/или цвете товара.
Далее устройство 40 обучения нейронной сети переходит к этапу обучения нейронной сети. На данном этапе устройство 40 обучения нейронной сети обращается к базе каталога товаров 30 и формирует в ней новый вид товара, которому в качестве уникальной характеристики товара назначается уникальная метка кластера, а примерами изображений товара назначаются изображения, которые вошли в кластер с данной уникальной меткой кластера. После того, как новый вид товара создан в базе каталога товаров 30, устройство 40 обучения нейронной сети инициирует процесс распознавания товаров соответствующим запросом на подсистему 20. При получении запроса подсистема распознавания изображений 20 определяет, в какой кластер попало изображение товара, который был определен ранее как неизвестный товар, назначает данному товару уникальную метку кластера и сохраняет ее в блок хранения данных 12 в качестве уникальной характеристики товара. Уникальная метка кластера и производные показатели товара могут быть переданы в мобильное приложение пользователя в ответ на направленное им ранее изображение товара в блок приема и передачи данных 11.
Таким образом, достигается обеспечение возможности автоматизированного обучения нейронных сетей распознаванию изображений товаров на основе новых изображений товаров, полученных от устройств пользователей. Для реализации заявленного способа не требуется высоких затрат вычислительных ресурсов, при этом автоматизированное обучения нейронных сетей осуществляется в максимально короткие сроки.

Claims (11)

1. Способ автоматизированного обучения системы распознавания товаров на изображениях, содержащий этапы, на которых посредством устройства обучения нейронной сети
извлекают из блока хранения данных изображения товаров, полученных с помощью устройств пользователей;
формируют для каждого изображения товара многомерный вектор изображения;
кластеризируют сформированные многомерные векторы изображения для получения кластеров изображений;
идентифицируют по меньшей мере один кластер изображений либо как один из известных системе товаров, либо как новый, ранее не известный товар;
присваивают по меньшей мере одному кластеру изображений, который был идентифицирован как новый товар, уникальную метку кластера;
обучают нейронную сеть распознавать товары на изображениях на основе изображений упомянутых кластеров изображений, причем товару, который был определен ранее как неизвестный товар, назначается уникальная метка кластера в качестве уникальной характеристики товара;
формируют в базе каталога товаров, на основе которого система распознавания товаров распознает товары на изображениях, новый вид товара, которому в качестве уникальной характеристики товара назначается уникальная метка кластера, а примерами изображений товара назначаются изображения, которые вошли в кластер с данной уникальной меткой кластера.
2. Способ по п. 1, отличающийся тем, что из блока хранения данных дополнительно получают уникальные характеристики товаров и многомерные векторы для товаров, распознанных на изображении, информацию о местонахождении товара на изображении, информацию о соседних товарах и месте съемки, причем формирование многомерного вектора изображения для каждого изображения товара осуществляется с учетом дополнительной полученной указанной информации.
3. Способ по п. 1, отличающийся тем, что уникальная метка сформирована на основе информации о характеристиках внешнего вида товаров, изображение которых вошли в кластер.
4. Система распознавания товаров на изображениях, содержащая соединенные между собой блок обработки данных, подсистему распознавания изображений, базу каталога товаров и устройство обучения нейронной сети, причем устройство обучения нейронной сети выполнено с возможностью осуществлять способ по любому из пп. 1-3.
RU2018134658A 2018-10-02 2018-10-02 Способ обучения системы распознавания товаров на изображениях RU2708504C1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2018134658A RU2708504C1 (ru) 2018-10-02 2018-10-02 Способ обучения системы распознавания товаров на изображениях

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2018134658A RU2708504C1 (ru) 2018-10-02 2018-10-02 Способ обучения системы распознавания товаров на изображениях

Publications (1)

Publication Number Publication Date
RU2708504C1 true RU2708504C1 (ru) 2019-12-09

Family

ID=68836386

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2018134658A RU2708504C1 (ru) 2018-10-02 2018-10-02 Способ обучения системы распознавания товаров на изображениях

Country Status (1)

Country Link
RU (1) RU2708504C1 (ru)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023023366A1 (en) * 2021-08-19 2023-02-23 Rehrig Pacific Company Imaging system with unsupervised learning

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2453919C1 (ru) * 2011-03-28 2012-06-20 Закрытое акционерное общество "Лаборатория Касперского" Способ выявления спама в растровом изображении
RU2470363C2 (ru) * 2011-02-14 2012-12-20 Общество с ограниченной ответственностью "Адривер" Способ электронной продажи товаров и услуг
US20130051611A1 (en) * 2011-08-24 2013-02-28 Michael A. Hicks Image overlaying and comparison for inventory display auditing
US20160342863A1 (en) * 2013-08-14 2016-11-24 Ricoh Co., Ltd. Hybrid Detection Recognition System

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2470363C2 (ru) * 2011-02-14 2012-12-20 Общество с ограниченной ответственностью "Адривер" Способ электронной продажи товаров и услуг
RU2453919C1 (ru) * 2011-03-28 2012-06-20 Закрытое акционерное общество "Лаборатория Касперского" Способ выявления спама в растровом изображении
US20130051611A1 (en) * 2011-08-24 2013-02-28 Michael A. Hicks Image overlaying and comparison for inventory display auditing
US20160342863A1 (en) * 2013-08-14 2016-11-24 Ricoh Co., Ltd. Hybrid Detection Recognition System

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023023366A1 (en) * 2021-08-19 2023-02-23 Rehrig Pacific Company Imaging system with unsupervised learning
US11823440B2 (en) 2021-08-19 2023-11-21 Rehrig Pacific Company Imaging system with unsupervised learning

Similar Documents

Publication Publication Date Title
CN111523621B (zh) 图像识别方法、装置、计算机设备和存储介质
JP5734460B2 (ja) 画像を比較するための方法およびシステム
CN109145766B (zh) 模型训练方法、装置、识别方法、电子设备及存储介质
US9367756B2 (en) Selection of representative images
CN110348362B (zh) 标签生成、视频处理方法、装置、电子设备及存储介质
CN108491794B (zh) 面部识别的方法和装置
CN110362677B (zh) 文本数据类别的识别方法及装置、存储介质、计算机设备
CN105590097B (zh) 暗视觉条件下双摄像头协同实时人脸识别安防系统及方法
JP5848833B2 (ja) 画像を比較するための方法およびシステム
CN106933867B (zh) 一种图像查询方法和装置
US20160092790A1 (en) Method for multiclass classification in open-set scenarios and uses thereof
CN110795584B (zh) 一种用户标识生成方法、装置及终端设备
CN112101360B (zh) 一种目标检测方法、装置以及计算机可读存储介质
CN111275060A (zh) 识别模型更新处理方法、装置、电子设备及存储介质
US11455501B2 (en) Response based on hierarchical models
CN113128526B (zh) 图像识别方法、装置、电子设备和计算机可读存储介质
RU2708504C1 (ru) Способ обучения системы распознавания товаров на изображениях
JP6573233B2 (ja) 認識容易性指標算出装置、方法、及びプログラム
RU2703970C1 (ru) Способ актуализации каталога товаров в системе распознавания товаров на изображениях
CN111291611A (zh) 一种基于贝叶斯查询扩展的行人重识别方法及装置
CN111191065A (zh) 一种同源图像确定方法及装置
Moctezuma et al. Appearance model update based on online learning and soft‐biometrics traits for people re‐identification in multi‐camera environments
CN112364946B (zh) 图像确定模型的训练方法、图像确定的方法、装置和设备
CN113642519A (zh) 一种人脸识别系统和人脸识别方法
JP7369247B2 (ja) 情報処理装置、情報処理方法およびプログラム

Legal Events

Date Code Title Description
PD4A Correction of name of patent owner
QB4A Licence on use of patent

Free format text: LICENCE FORMERLY AGREED ON 20220427

Effective date: 20220427