RU2013134325A - Устройство и способ распознавания жестов на основе анализа множества возможных границ раздела - Google Patents
Устройство и способ распознавания жестов на основе анализа множества возможных границ раздела Download PDFInfo
- Publication number
- RU2013134325A RU2013134325A RU2013134325/08A RU2013134325A RU2013134325A RU 2013134325 A RU2013134325 A RU 2013134325A RU 2013134325/08 A RU2013134325/08 A RU 2013134325/08A RU 2013134325 A RU2013134325 A RU 2013134325A RU 2013134325 A RU2013134325 A RU 2013134325A
- Authority
- RU
- Russia
- Prior art keywords
- image
- sets
- class
- estimates
- vectors
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/107—Static hand or arm
- G06V40/113—Recognition of static hand signs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
- G06V10/763—Non-hierarchical techniques, e.g. based on statistics of modelling distributions
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
1. Способ, содержащий этапы, на которых:идентифицируют множество возможных границ раздела в изображении;получают соответствующие модифицированные изображения для соответственных возможных границ раздела;применяют функцию отображения к каждому из модифицированных изображений, чтобы сгенерировать соответствующий вектор;определяют наборы оценок для соответственных векторов по отношению к намеченным параметрам класса; ивыбирают конкретную одну из возможных границ раздела на основе наборов оценок;при этом упомянутые этапы идентификации, получения, применения, определения и выбора реализуются в, по меньшей мере, на одном устройстве обработки, содержащем процессор, соединенный с памятью.2. Способ по п.1, в котором при идентификации множества возможных границ раздела идентифицируют множество возможных границ раздела ладони, ассоциированных с рукой на изображении.3. Способ по п.1, дополнительно содержащий этапы, на которых:принимают входное изображение; ивыполняют одну или более операций нормализации над входным изображением для получения нормализованного изображения, в котором идентифицированы возможные границы раздела.4. Способ по п.3, в котором упомянутые одна или более операций нормализации содержат, по меньшей мере, одну из нормализации ориентации и нормализации масштаба.5. Способ по п.4, в котором нормализация ориентации содержит:определение основного направления руки в пределах входного изображения; иповорот входного изображения на величину, основанную на упомянутом определенном основном направлении руки.6. Способ по п.1, дополнительно содержащий этап, на котором выбирают конкретный один из множест�
Claims (20)
1. Способ, содержащий этапы, на которых:
идентифицируют множество возможных границ раздела в изображении;
получают соответствующие модифицированные изображения для соответственных возможных границ раздела;
применяют функцию отображения к каждому из модифицированных изображений, чтобы сгенерировать соответствующий вектор;
определяют наборы оценок для соответственных векторов по отношению к намеченным параметрам класса; и
выбирают конкретную одну из возможных границ раздела на основе наборов оценок;
при этом упомянутые этапы идентификации, получения, применения, определения и выбора реализуются в, по меньшей мере, на одном устройстве обработки, содержащем процессор, соединенный с памятью.
2. Способ по п.1, в котором при идентификации множества возможных границ раздела идентифицируют множество возможных границ раздела ладони, ассоциированных с рукой на изображении.
3. Способ по п.1, дополнительно содержащий этапы, на которых:
принимают входное изображение; и
выполняют одну или более операций нормализации над входным изображением для получения нормализованного изображения, в котором идентифицированы возможные границы раздела.
4. Способ по п.3, в котором упомянутые одна или более операций нормализации содержат, по меньшей мере, одну из нормализации ориентации и нормализации масштаба.
5. Способ по п.4, в котором нормализация ориентации содержит:
определение основного направления руки в пределах входного изображения; и
поворот входного изображения на величину, основанную на упомянутом определенном основном направлении руки.
6. Способ по п.1, дополнительно содержащий этап, на котором выбирают конкретный один из множества классов для распознавания соответствующего жеста на основе наборов оценок.
7. Способ по п.1, в котором при идентификации множества возможных границ раздела в изображении дополнительно определяют, по меньшей мере, подмножество упомянутых границ раздела на основе одного или более из фиксированных, возрастающих, уменьшающихся или случайных размеров шагов между соседними возможными границами раздела.
8. Способ по п.1, в котором, по меньшей мере, подмножество возможных границ раздела содержит возможные границы раздела ладони, ориентированные в направлении, перпендикулярном к основному направлению руки в изображении.
9. Способ по п.3, в котором каждое из модифицированных изображений содержит первую и вторую части на противоположных сторонах своей возможной границы раздела, где первая часть модифицированного изображения содержит пиксели, имеющие значения, которые являются такими же, как значения соответствующих пикселей в первой части нормализованного изображения, и вторая часть модифицированного изображения содержит пиксели, имеющие значения, которые отличаются от значений соответствующих пикселей во второй части нормализованного изображения.
10. Способ по п.9, в котором каждый из пикселей во второй части каждого модифицированного изображения имеет одно и то же заранее заданное значение.
11. Способ по п.1, в котором упомянутые намеченные параметры класса включают в себя наборы параметров класса для соответствующих классов из множества классов, каждый из которых соответствует отличающемуся от других жесту.
12. Способ по п.11, в котором заданный один из наборов параметров класса для конкретного класса c содержит набор параметров класса
на основе смешанной модели Гаусса, имеющей M кластеров, где wi обозначает вес i-ого кластера из M кластеров, и и обозначают вектор математического ожидания и ковариационную матрицу, соответственно, многомерного нормального распределения i-ого кластера.
13. Способ по п.11, в котором заданный один из наборов параметров класса для конкретного класса генерируется путем применения функции отображения к каждому из множества обучающих изображений жеста, связанного с этим классом, для генерации соответствующего множества векторов и использования этих векторов для построения модели классификации, имеющей этот заданный набор параметров класса.
14. Способ по п.1, в котором при определении наборов оценок для соответственных оценок векторов генерируют набор вероятностных оценок
для конкретного одного из векторов xt относительно наборов параметров класса Tj, где индекс t принимает целые значения от 1 до S, где S количество число возможных границ раздела, и где индекс j принимает целые значения от 1 до K, где K обозначает общее количество классов, каждый из которых соответствует отличающемуся от других жесту.
15. Способ по п.1, при этом при определении наборов оценок для соответственных векторов генерируют набор отрицательных оценок логарифмической функции правдоподобия для конкретного одного из векторов xt относительно наборов параметров класса Tj, где индекс t принимает целые значения от 1 до S, где S обозначает количество возможных границ раздела, и где индекс j принимает целые значения от 1 до K, где K обозначает общее количество классов, каждый из которых соответствует отличающемуся от других жесту.
16. Машиночитаемый носитель, на котором реализован компьютерный программный код, при этом компьютерный программный код, при его исполнении в устройстве обработки, предписывает устройству обработки выполнять способ по п.1.
17. Устройство, содержащее:
по меньшей мере, одно устройство обработки, содержащее процессор, соединенный с памятью;
причем это, по меньшей мере, одно устройство обработки выполнено с возможностью идентифицировать множество границ раздела в изображении, получать соответствующие модифицированные изображения для соответственных возможных границ раздела, применять функцию отображения к каждому из модифицированных изображений, для генерирования соответствующего вектора, определять набор оценок для соответственных векторов по отношению к намеченным параметрам класса и выбирать конкретную одну из возможных границ раздела на основе наборов оценок.
18. Устройство по п.17, в котором устройство обработки содержит процессор изображений, при этом процессор изображений содержит:
модуль предварительной обработки; модуль выявления границы раздела; и
модуль распознавания, выполненный с возможностью выбора конкретного одного из множества классов для распознавания соответствующего жесту, на основе наборов оценок;
при этом упомянутые модули реализованы с использованием схемы обработки изображений, содержащей ,по меньшей мере, один графический процессор из состава процессора изображений.
19. Интегральная схема, содержащая устройство по п.17.
20. Система обработки изображений, содержащая устройство по п.17.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2013134325/08A RU2013134325A (ru) | 2013-07-22 | 2013-07-22 | Устройство и способ распознавания жестов на основе анализа множества возможных границ раздела |
US14/168,391 US20150023607A1 (en) | 2013-07-22 | 2014-01-30 | Gesture recognition method and apparatus based on analysis of multiple candidate boundaries |
PCT/US2014/031471 WO2015012896A1 (en) | 2013-07-22 | 2014-03-21 | Gesture recognition method and apparatus based on analysis of multiple candidate boundaries |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2013134325/08A RU2013134325A (ru) | 2013-07-22 | 2013-07-22 | Устройство и способ распознавания жестов на основе анализа множества возможных границ раздела |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2013134325A true RU2013134325A (ru) | 2015-01-27 |
Family
ID=52343631
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2013134325/08A RU2013134325A (ru) | 2013-07-22 | 2013-07-22 | Устройство и способ распознавания жестов на основе анализа множества возможных границ раздела |
Country Status (3)
Country | Link |
---|---|
US (1) | US20150023607A1 (ru) |
RU (1) | RU2013134325A (ru) |
WO (1) | WO2015012896A1 (ru) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10261584B2 (en) | 2015-08-24 | 2019-04-16 | Rambus Inc. | Touchless user interface for handheld and wearable computers |
US11714880B1 (en) * | 2016-02-17 | 2023-08-01 | Ultrahaptics IP Two Limited | Hand pose estimation for machine learning based gesture recognition |
US11841920B1 (en) | 2016-02-17 | 2023-12-12 | Ultrahaptics IP Two Limited | Machine learning based gesture recognition |
US11854308B1 (en) | 2016-02-17 | 2023-12-26 | Ultrahaptics IP Two Limited | Hand initialization for machine learning based gesture recognition |
US10592776B2 (en) * | 2017-02-08 | 2020-03-17 | Adobe Inc. | Generating multimodal image edits for a digital image |
CN109325972B (zh) * | 2018-07-25 | 2020-10-27 | 深圳市商汤科技有限公司 | 激光雷达稀疏深度图的处理方法、装置、设备及介质 |
CN109977826B (zh) * | 2019-03-15 | 2021-11-02 | 百度在线网络技术(北京)有限公司 | 物体的类别识别方法和装置 |
JP7207210B2 (ja) * | 2019-07-12 | 2023-01-18 | 日本電信電話株式会社 | 行動認識装置、行動認識方法、及び行動認識プログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9317124B2 (en) * | 2006-09-28 | 2016-04-19 | Nokia Technologies Oy | Command input by hand gestures captured from camera |
US20130120595A1 (en) * | 2008-01-18 | 2013-05-16 | Mitek Systems | Systems for Mobile Image Capture and Remittance Processing of Documents on a Mobile Device |
US8107726B2 (en) * | 2008-06-18 | 2012-01-31 | Samsung Electronics Co., Ltd. | System and method for class-specific object segmentation of image data |
TWI489317B (zh) * | 2009-12-10 | 2015-06-21 | Tatung Co | 電子裝置的操作方法及系統 |
US8754862B2 (en) * | 2010-07-11 | 2014-06-17 | Lester F. Ludwig | Sequential classification recognition of gesture primitives and window-based parameter smoothing for high dimensional touchpad (HDTP) user interfaces |
-
2013
- 2013-07-22 RU RU2013134325/08A patent/RU2013134325A/ru not_active Application Discontinuation
-
2014
- 2014-01-30 US US14/168,391 patent/US20150023607A1/en not_active Abandoned
- 2014-03-21 WO PCT/US2014/031471 patent/WO2015012896A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2015012896A1 (en) | 2015-01-29 |
US20150023607A1 (en) | 2015-01-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2013134325A (ru) | Устройство и способ распознавания жестов на основе анализа множества возможных границ раздела | |
CN107944020B (zh) | 人脸图像查找方法及装置、计算机装置和存储介质 | |
US20200097742A1 (en) | Training neural networks for vehicle re-identification | |
US9349076B1 (en) | Template-based target object detection in an image | |
CN110349147B (zh) | 模型的训练方法、眼底黄斑区病变识别方法、装置及设备 | |
CN111192292A (zh) | 基于注意力机制与孪生网络的目标跟踪方法及相关设备 | |
US10467547B1 (en) | Normalizing text attributes for machine learning models | |
US20150019464A1 (en) | method and apparatus for supplying interpolation point data for a data-based function model calculation unit | |
CN111914908B (zh) | 一种图像识别模型训练方法、图像识别方法及相关设备 | |
CN112085056B (zh) | 目标检测模型生成方法、装置、设备及存储介质 | |
CN113822207B (zh) | 高光谱遥感图像识别方法、装置、电子设备及存储介质 | |
CN111723918A (zh) | 用于卷积内核的自动生成和调谐工具 | |
CN104616029A (zh) | 数据分类方法及装置 | |
US11562554B1 (en) | Workload reduction for non-maximum suppression operation | |
WO2020243922A1 (en) | Automatic machine learning policy network for parametric binary neural networks | |
US20140089365A1 (en) | Object detection method, object detector and object detection computer program | |
JP6603477B2 (ja) | 情報処理装置、情報処理方法 | |
CN107729909B (zh) | 一种属性分类器的应用方法及装置 | |
CN116137061B (zh) | 数量统计模型的训练方法、装置、电子设备及存储介质 | |
CN112257470A (zh) | 一种模型训练方法、装置、计算机设备和可读存储介质 | |
CN111512321A (zh) | 对用于训练检测卷积神经网络的先验项的自动选择 | |
CN109447021B (zh) | 一种属性检测方法及属性检测装置 | |
CN116935368A (zh) | 深度学习模型训练方法、文本行检测方法、装置及设备 | |
CN111582302A (zh) | 车辆识别方法、装置、设备及存储介质 | |
WO2016149937A1 (en) | Neural network classification through decomposition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FA93 | Acknowledgement of application withdrawn (no request for examination) |
Effective date: 20160725 |