RU2013134325A - Устройство и способ распознавания жестов на основе анализа множества возможных границ раздела - Google Patents

Устройство и способ распознавания жестов на основе анализа множества возможных границ раздела Download PDF

Info

Publication number
RU2013134325A
RU2013134325A RU2013134325/08A RU2013134325A RU2013134325A RU 2013134325 A RU2013134325 A RU 2013134325A RU 2013134325/08 A RU2013134325/08 A RU 2013134325/08A RU 2013134325 A RU2013134325 A RU 2013134325A RU 2013134325 A RU2013134325 A RU 2013134325A
Authority
RU
Russia
Prior art keywords
image
sets
class
estimates
vectors
Prior art date
Application number
RU2013134325/08A
Other languages
English (en)
Inventor
Дмитрий Николаевич Бабин
Иван Леонидович Мазуренко
Александр Александрович Петюшко
Алексей Александрович Летуновский
Денис Владимирович Зайцев
Original Assignee
ЭлЭсАй Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ЭлЭсАй Корпорейшн filed Critical ЭлЭсАй Корпорейшн
Priority to RU2013134325/08A priority Critical patent/RU2013134325A/ru
Priority to US14/168,391 priority patent/US20150023607A1/en
Priority to PCT/US2014/031471 priority patent/WO2015012896A1/en
Publication of RU2013134325A publication Critical patent/RU2013134325A/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/107Static hand or arm
    • G06V40/113Recognition of static hand signs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • G06V10/763Non-hierarchical techniques, e.g. based on statistics of modelling distributions

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

1. Способ, содержащий этапы, на которых:идентифицируют множество возможных границ раздела в изображении;получают соответствующие модифицированные изображения для соответственных возможных границ раздела;применяют функцию отображения к каждому из модифицированных изображений, чтобы сгенерировать соответствующий вектор;определяют наборы оценок для соответственных векторов по отношению к намеченным параметрам класса; ивыбирают конкретную одну из возможных границ раздела на основе наборов оценок;при этом упомянутые этапы идентификации, получения, применения, определения и выбора реализуются в, по меньшей мере, на одном устройстве обработки, содержащем процессор, соединенный с памятью.2. Способ по п.1, в котором при идентификации множества возможных границ раздела идентифицируют множество возможных границ раздела ладони, ассоциированных с рукой на изображении.3. Способ по п.1, дополнительно содержащий этапы, на которых:принимают входное изображение; ивыполняют одну или более операций нормализации над входным изображением для получения нормализованного изображения, в котором идентифицированы возможные границы раздела.4. Способ по п.3, в котором упомянутые одна или более операций нормализации содержат, по меньшей мере, одну из нормализации ориентации и нормализации масштаба.5. Способ по п.4, в котором нормализация ориентации содержит:определение основного направления руки в пределах входного изображения; иповорот входного изображения на величину, основанную на упомянутом определенном основном направлении руки.6. Способ по п.1, дополнительно содержащий этап, на котором выбирают конкретный один из множест�

Claims (20)

1. Способ, содержащий этапы, на которых:
идентифицируют множество возможных границ раздела в изображении;
получают соответствующие модифицированные изображения для соответственных возможных границ раздела;
применяют функцию отображения к каждому из модифицированных изображений, чтобы сгенерировать соответствующий вектор;
определяют наборы оценок для соответственных векторов по отношению к намеченным параметрам класса; и
выбирают конкретную одну из возможных границ раздела на основе наборов оценок;
при этом упомянутые этапы идентификации, получения, применения, определения и выбора реализуются в, по меньшей мере, на одном устройстве обработки, содержащем процессор, соединенный с памятью.
2. Способ по п.1, в котором при идентификации множества возможных границ раздела идентифицируют множество возможных границ раздела ладони, ассоциированных с рукой на изображении.
3. Способ по п.1, дополнительно содержащий этапы, на которых:
принимают входное изображение; и
выполняют одну или более операций нормализации над входным изображением для получения нормализованного изображения, в котором идентифицированы возможные границы раздела.
4. Способ по п.3, в котором упомянутые одна или более операций нормализации содержат, по меньшей мере, одну из нормализации ориентации и нормализации масштаба.
5. Способ по п.4, в котором нормализация ориентации содержит:
определение основного направления руки в пределах входного изображения; и
поворот входного изображения на величину, основанную на упомянутом определенном основном направлении руки.
6. Способ по п.1, дополнительно содержащий этап, на котором выбирают конкретный один из множества классов для распознавания соответствующего жеста на основе наборов оценок.
7. Способ по п.1, в котором при идентификации множества возможных границ раздела в изображении дополнительно определяют, по меньшей мере, подмножество упомянутых границ раздела на основе одного или более из фиксированных, возрастающих, уменьшающихся или случайных размеров шагов между соседними возможными границами раздела.
8. Способ по п.1, в котором, по меньшей мере, подмножество возможных границ раздела содержит возможные границы раздела ладони, ориентированные в направлении, перпендикулярном к основному направлению руки в изображении.
9. Способ по п.3, в котором каждое из модифицированных изображений содержит первую и вторую части на противоположных сторонах своей возможной границы раздела, где первая часть модифицированного изображения содержит пиксели, имеющие значения, которые являются такими же, как значения соответствующих пикселей в первой части нормализованного изображения, и вторая часть модифицированного изображения содержит пиксели, имеющие значения, которые отличаются от значений соответствующих пикселей во второй части нормализованного изображения.
10. Способ по п.9, в котором каждый из пикселей во второй части каждого модифицированного изображения имеет одно и то же заранее заданное значение.
11. Способ по п.1, в котором упомянутые намеченные параметры класса включают в себя наборы параметров класса для соответствующих классов из множества классов, каждый из которых соответствует отличающемуся от других жесту.
12. Способ по п.11, в котором заданный один из наборов параметров класса для конкретного класса c содержит набор параметров класса T c = { w i c , μ i c , Ω i c } i = 1 M
Figure 00000001
на основе смешанной модели Гаусса, имеющей M кластеров, где wi обозначает вес i-ого кластера из M кластеров, и
Figure 00000002
и
Figure 00000003
обозначают вектор математического ожидания и ковариационную матрицу, соответственно, многомерного нормального распределения i-ого кластера.
13. Способ по п.11, в котором заданный один из наборов параметров класса для конкретного класса генерируется путем применения функции отображения к каждому из множества обучающих изображений жеста, связанного с этим классом, для генерации соответствующего множества векторов и использования этих векторов для построения модели классификации, имеющей этот заданный набор параметров класса.
14. Способ по п.1, в котором при определении наборов оценок для соответственных оценок векторов генерируют набор вероятностных оценок p ( x t | T j )
Figure 00000004
для конкретного одного из векторов xt относительно наборов параметров класса Tj, где индекс t принимает целые значения от 1 до S, где S количество число возможных границ раздела, и где индекс j принимает целые значения от 1 до K, где K обозначает общее количество классов, каждый из которых соответствует отличающемуся от других жесту.
15. Способ по п.1, при этом при определении наборов оценок для соответственных векторов генерируют набор отрицательных оценок логарифмической функции правдоподобия
Figure 00000005
для конкретного одного из векторов xt относительно наборов параметров класса Tj, где индекс t принимает целые значения от 1 до S, где S обозначает количество возможных границ раздела, и где индекс j принимает целые значения от 1 до K, где K обозначает общее количество классов, каждый из которых соответствует отличающемуся от других жесту.
16. Машиночитаемый носитель, на котором реализован компьютерный программный код, при этом компьютерный программный код, при его исполнении в устройстве обработки, предписывает устройству обработки выполнять способ по п.1.
17. Устройство, содержащее:
по меньшей мере, одно устройство обработки, содержащее процессор, соединенный с памятью;
причем это, по меньшей мере, одно устройство обработки выполнено с возможностью идентифицировать множество границ раздела в изображении, получать соответствующие модифицированные изображения для соответственных возможных границ раздела, применять функцию отображения к каждому из модифицированных изображений, для генерирования соответствующего вектора, определять набор оценок для соответственных векторов по отношению к намеченным параметрам класса и выбирать конкретную одну из возможных границ раздела на основе наборов оценок.
18. Устройство по п.17, в котором устройство обработки содержит процессор изображений, при этом процессор изображений содержит:
модуль предварительной обработки; модуль выявления границы раздела; и
модуль распознавания, выполненный с возможностью выбора конкретного одного из множества классов для распознавания соответствующего жесту, на основе наборов оценок;
при этом упомянутые модули реализованы с использованием схемы обработки изображений, содержащей ,по меньшей мере, один графический процессор из состава процессора изображений.
19. Интегральная схема, содержащая устройство по п.17.
20. Система обработки изображений, содержащая устройство по п.17.
RU2013134325/08A 2013-07-22 2013-07-22 Устройство и способ распознавания жестов на основе анализа множества возможных границ раздела RU2013134325A (ru)

Priority Applications (3)

Application Number Priority Date Filing Date Title
RU2013134325/08A RU2013134325A (ru) 2013-07-22 2013-07-22 Устройство и способ распознавания жестов на основе анализа множества возможных границ раздела
US14/168,391 US20150023607A1 (en) 2013-07-22 2014-01-30 Gesture recognition method and apparatus based on analysis of multiple candidate boundaries
PCT/US2014/031471 WO2015012896A1 (en) 2013-07-22 2014-03-21 Gesture recognition method and apparatus based on analysis of multiple candidate boundaries

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2013134325/08A RU2013134325A (ru) 2013-07-22 2013-07-22 Устройство и способ распознавания жестов на основе анализа множества возможных границ раздела

Publications (1)

Publication Number Publication Date
RU2013134325A true RU2013134325A (ru) 2015-01-27

Family

ID=52343631

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2013134325/08A RU2013134325A (ru) 2013-07-22 2013-07-22 Устройство и способ распознавания жестов на основе анализа множества возможных границ раздела

Country Status (3)

Country Link
US (1) US20150023607A1 (ru)
RU (1) RU2013134325A (ru)
WO (1) WO2015012896A1 (ru)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10261584B2 (en) 2015-08-24 2019-04-16 Rambus Inc. Touchless user interface for handheld and wearable computers
US11714880B1 (en) * 2016-02-17 2023-08-01 Ultrahaptics IP Two Limited Hand pose estimation for machine learning based gesture recognition
US11841920B1 (en) 2016-02-17 2023-12-12 Ultrahaptics IP Two Limited Machine learning based gesture recognition
US11854308B1 (en) 2016-02-17 2023-12-26 Ultrahaptics IP Two Limited Hand initialization for machine learning based gesture recognition
US10592776B2 (en) * 2017-02-08 2020-03-17 Adobe Inc. Generating multimodal image edits for a digital image
CN109325972B (zh) * 2018-07-25 2020-10-27 深圳市商汤科技有限公司 激光雷达稀疏深度图的处理方法、装置、设备及介质
CN109977826B (zh) * 2019-03-15 2021-11-02 百度在线网络技术(北京)有限公司 物体的类别识别方法和装置
JP7207210B2 (ja) * 2019-07-12 2023-01-18 日本電信電話株式会社 行動認識装置、行動認識方法、及び行動認識プログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9317124B2 (en) * 2006-09-28 2016-04-19 Nokia Technologies Oy Command input by hand gestures captured from camera
US20130120595A1 (en) * 2008-01-18 2013-05-16 Mitek Systems Systems for Mobile Image Capture and Remittance Processing of Documents on a Mobile Device
US8107726B2 (en) * 2008-06-18 2012-01-31 Samsung Electronics Co., Ltd. System and method for class-specific object segmentation of image data
TWI489317B (zh) * 2009-12-10 2015-06-21 Tatung Co 電子裝置的操作方法及系統
US8754862B2 (en) * 2010-07-11 2014-06-17 Lester F. Ludwig Sequential classification recognition of gesture primitives and window-based parameter smoothing for high dimensional touchpad (HDTP) user interfaces

Also Published As

Publication number Publication date
WO2015012896A1 (en) 2015-01-29
US20150023607A1 (en) 2015-01-22

Similar Documents

Publication Publication Date Title
RU2013134325A (ru) Устройство и способ распознавания жестов на основе анализа множества возможных границ раздела
CN107944020B (zh) 人脸图像查找方法及装置、计算机装置和存储介质
US20200097742A1 (en) Training neural networks for vehicle re-identification
US9349076B1 (en) Template-based target object detection in an image
CN110349147B (zh) 模型的训练方法、眼底黄斑区病变识别方法、装置及设备
CN111192292A (zh) 基于注意力机制与孪生网络的目标跟踪方法及相关设备
US10467547B1 (en) Normalizing text attributes for machine learning models
US20150019464A1 (en) method and apparatus for supplying interpolation point data for a data-based function model calculation unit
CN111914908B (zh) 一种图像识别模型训练方法、图像识别方法及相关设备
CN112085056B (zh) 目标检测模型生成方法、装置、设备及存储介质
CN113822207B (zh) 高光谱遥感图像识别方法、装置、电子设备及存储介质
CN111723918A (zh) 用于卷积内核的自动生成和调谐工具
CN104616029A (zh) 数据分类方法及装置
US11562554B1 (en) Workload reduction for non-maximum suppression operation
WO2020243922A1 (en) Automatic machine learning policy network for parametric binary neural networks
US20140089365A1 (en) Object detection method, object detector and object detection computer program
JP6603477B2 (ja) 情報処理装置、情報処理方法
CN107729909B (zh) 一种属性分类器的应用方法及装置
CN116137061B (zh) 数量统计模型的训练方法、装置、电子设备及存储介质
CN112257470A (zh) 一种模型训练方法、装置、计算机设备和可读存储介质
CN111512321A (zh) 对用于训练检测卷积神经网络的先验项的自动选择
CN109447021B (zh) 一种属性检测方法及属性检测装置
CN116935368A (zh) 深度学习模型训练方法、文本行检测方法、装置及设备
CN111582302A (zh) 车辆识别方法、装置、设备及存储介质
WO2016149937A1 (en) Neural network classification through decomposition

Legal Events

Date Code Title Description
FA93 Acknowledgement of application withdrawn (no request for examination)

Effective date: 20160725