CN114816077A - 一种多模态融合的智能手套系统 - Google Patents
一种多模态融合的智能手套系统 Download PDFInfo
- Publication number
- CN114816077A CN114816077A CN202210754057.5A CN202210754057A CN114816077A CN 114816077 A CN114816077 A CN 114816077A CN 202210754057 A CN202210754057 A CN 202210754057A CN 114816077 A CN114816077 A CN 114816077A
- Authority
- CN
- China
- Prior art keywords
- channel
- intention
- experimental
- probability
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 55
- 230000004927 fusion Effects 0.000 claims abstract description 40
- 230000000007 visual effect Effects 0.000 claims abstract description 31
- 238000000034 method Methods 0.000 claims abstract description 10
- 230000003993 interaction Effects 0.000 claims abstract description 9
- 239000013598 vector Substances 0.000 claims description 31
- 230000006870 function Effects 0.000 claims description 14
- 230000009471 action Effects 0.000 claims description 12
- 238000013507 mapping Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 8
- 241000282465 Canis Species 0.000 claims description 3
- 239000012467 final product Substances 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 210000000239 visual pathway Anatomy 0.000 claims description 3
- 230000004400 visual pathway Effects 0.000 claims description 3
- 210000000707 wrist Anatomy 0.000 abstract description 3
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 230000007812 deficiency Effects 0.000 abstract 1
- 230000008447 perception Effects 0.000 abstract 1
- 238000002474 experimental method Methods 0.000 description 23
- 238000010586 diagram Methods 0.000 description 6
- 239000003814 drug Substances 0.000 description 6
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 5
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 4
- UQSXHKLRYXJYBZ-UHFFFAOYSA-N Iron oxide Chemical compound [Fe]=O UQSXHKLRYXJYBZ-UHFFFAOYSA-N 0.000 description 4
- 239000012153 distilled water Substances 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 239000003610 charcoal Substances 0.000 description 3
- 230000019771 cognition Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000003542 behavioural effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 238000005452 bending Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- AXCZMVOFGPJBDE-UHFFFAOYSA-L calcium dihydroxide Chemical compound [OH-].[OH-].[Ca+2] AXCZMVOFGPJBDE-UHFFFAOYSA-L 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
- G06F3/014—Hand-worn input/output arrangements, e.g. data gloves
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Human Computer Interaction (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Life Sciences & Earth Sciences (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明公开了一种多模态融合的智能手套系统,涉及人工智能技术领域,包括输入层、识别层、融合层和交互层,所述输入层包括视觉通道、传感器通道和语音通道,所述的识别层分别采用基于YOLOv5的视觉通道意图概率获取算法、基于欧氏距离传感器通道意图概率获取算法和基于余弦相似度匹配的语音通道意图概率获取算法来分别获取视觉通道、传感器通道和语音通道的实验意图,所述的融合层采用多模态融合算法来融合用户多通道意图信息。本发明能够更好识别用户意图并进行交互,利用智能手套手腕处的视觉通道对场景信息进行了无遮挡的实时感知,改进了传统TMFA算法串行处理模态信息的不足的问题。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种智能手套,具体是指一种多模态融合的智能手套系统。
背景技术
本发明基于认知行为理论对用户实验操作进行指导和纠正,该理论指的是通过改变思维和行为的方法来改变不良认知。理想状况下,用户的思考与行动应是紧密结合的。但是在现实条件下,用户认知的形成过程会受到其自动化思考的影响,即用户的某些行为会不通过大脑的思考而执行一些错误的操作。因此,认知行为理论的出现可以帮助用户在理性层面纠正其不假思索的行为。
在智能手套系统整体框架一般包括输入层、识别层、融合层和交互层,在输入层中,智能手套可以获取用户语音、视觉、传感器等多模态信息,并将数据传入识别层;在识别层中,智能手套系统将输入层的数据转化为意图概率集合;在融合层,智能手套系统利用信息量权数法对来自各个通道的意图信息并行融合,从而获取到用户当前真正的实验意图;当获取到用户实验意图后,系统就可以在交互层建立多种用户与智能手套系统的交互功能。
在智能手套的整体框架中,识别层和融合层发挥着重要的作用。在智能实验的背景下,传统多模态融合算法虽然使用了多个通道的信息,但是只能实现一个通道的信息输入与一个实验步骤的单独对应。为了解决这个问题,本发明在识别层分别建立了语音、视觉和传感器通道的意图概率模型,它们用于实时更新其对应通道的意图概率,这些意图概率模型通过对用户行为的分析,将每个通道下用户行为的抽象意图转换成可以计算的意图概率集合,并且在融合层提出一种新的算法,该算法可根据识别层获取的意图概率集合来动态更新每个意图对应的权值,最终对用户行为的意图进行并行融合。
发明内容
本发明针对现有技术的不足,提供了一种能够更好识别用户意图并进行交互的多模态融合的智能手套系统。
本发明是通过如下技术方案实现的,提供一种多模态融合的智能手套系统,包括输入层、识别层、融合层和交互层,所述输入层包括视觉通道、传感器通道和语音通道,其特征在于,所述的识别层分别采用基于YOLOv5的视觉通道意图概率获取算法、基于欧氏距离传感器通道意图概率获取算法和基于余弦相似度匹配的语音通道意图概率获取算法来分别获取视觉通道、传感器通道和语音通道的实验意图,所述的融合层采用多模态融合算法来融合用户多通道意图信息。
在视觉通道下,智能手套上的单目摄像头可以对整个实验场景进行感知,为了获取用户在视觉通道下的实验意图,本优选方案利用YOLOv5中的实验物品的Bounding Box面积变化增量来推断用户的实验意图概率,众所周知,Bounding Box是目标检测中一个重要概念,其常见的输出坐标是边界框的左上角坐标、右下角坐标,即,用户每次进行实验操作时,其所操作的目标物体将会进行动态更新,所述的基于YOLOv5的视觉通道意图概率获取算法包括以下步骤:
在传感器通道下,不同的实验操作对应有不同的实验意图,在实验操作过程中,用户产生的传感器数据会进行动态更新,由于用户操作产生的传感器数据复杂,所以本发明设置一个七维向量建立起弯曲度传感器、压力传感器和姿态传感器三者之间的映射关系,在本优选方案中,所述的基于欧氏距离传感器通道意图概率获取算法包括以下步骤:
(2)对于弯曲度传感器,我们对每一根手指的弯曲度值信息进行向量化,首先将五维向量的弯曲度维度划分为[,),[,),[,3),[,),[9180),当获得手指的弯曲度值时,即可将放置在向量相应的维度下,
余弦相似度指的是利用两个向量的夹角余弦值判断两个向量的相似程度,余弦值取值为[-1,1],越接近1,两向量的夹角越小,则越相似,在语音通道下,本发明固定用户的语音输入语句,并设计了基于余弦相似度匹配的语音通道意图概率获取算法(Voicechannel intention probability acquisition algorithm based on cosinesimilarity,以下简称VCIPAA),所述的基于余弦相似度匹配的语音通道意图概率获取算法包括以下步骤:
在虚实融合实验的背景下,多模态融合指的在系统真正确认用户意图之前对所有输入信息的整体融合,而传统的多模态融合算法(Traditional multimodal fusionalgorithm,以下简称TMFA)是利用一种通道的输入信息对应一种实验意图的规则来完成实验,其本质是串行融合了模态信息的多样性,而不是在意图层上对所有模态意图的并行融合,而本发明独创性的提出了基于智能手套系统的多模态融合算法(Multimodal fusionalgorithm based on smart glove system,以下简称MFA),该算法实现了在意图层上并行融合用户多通道意图信息的功能,所述的多模态融合算法包括以下步骤:
(2)计算意图概率集的概率均值,
(3)计算意图概率集的概率方差,
(5)对变异系数进行归一化处理,得到每个通道的权值,
算法有效性是指当输入值满足条件时,此算法要保证正常工作且输出相应的结果,即不论将断点设置在语音通道、视觉通道还是传感器通道都会输出相应的意图。在真实实验过程中,用户不一定会同时输入三个通道的信息,比如用户在操作时可能没有进行语音的输入,则该算法会会实时的弹性的更新视觉通道和传感器通道的变异系数来进行最终意图概率的计算。
当用户利用智能手套手腕部的摄像头感知实验场景信息时,多模态融合算法使用YOLOv5对场景中的实验物体进行识别,该算法将识别物体boundingbox的面积变化值输入进VSIPAA算法中,获取了视觉通道下的实验意图的概率集合。当用户使用智能手套操作真实或者虚拟实验物品时,MFA算法调用SRIPAA算法对实时获取的传感器数据建立映射关系,并利用高维空间下的欧式距离公式计算传感器通道下的实验意图概率集合。当用户输入语音数据时,MFA算法调用VCIPAA算法对输入语音数据的独热编码与系统语音库中语句的独热编码进行余弦相似度匹配,最后输出语音通道下的意图概率集合。
在实验过程中,MFA算法会实时更新每个通道的意图概率集合的值,并根据概率值变化来更新每个通道对应的权值,即变异系数。最终,MFA算法根据归一化后的变异系数对三个通道的概率集合进行意图层融合,即可得到用户的最终意图。
MFA算法在理论上有效的解决了本发明提出的两个关键问题:(1)MFA算法与应用在室内交互输入装置的TMFA算法相比,该算法利用智能手套手腕处的视觉通道对场景信息进行了无遮挡的实时感知;(2)MFA算法可以在意图层上并行融合用户的多模态意图,改进了TMFA算法串行处理模态信息的不足。
附图说明
图1为本发明中用户操作木炭还原氧化铁实验示意图。
图2为本发明中多模态融合的智能手套系统的总体框架结构示意图,图中,(a)是用户佩戴智能手套倾倒蒸馏水溶液的示意图;(b)是用户拿起热毛巾进行气密性检验的示意图;(c)是用户取出铁粉后药粒跟随药匙尖端移动的示意图;(d)是用户点燃酒精喷灯后的实验现象示意图。
具体实施方式
为能清楚说明本发明方案的技术特点,下面结合附图,并通过具体实施方式,对本方案进一步阐述。
如图1中所示,提供一种多模态融合的智能手套系统,包括输入层、识别层、融合层和交互层,所述输入层包括视觉通道、传感器通道和语音通道,所述的识别层分别采用基于YOLOv5的视觉通道意图概率获取算法、基于欧氏距离传感器通道意图概率获取算法和基于余弦相似度匹配的语音通道意图概率获取算法来分别获取视觉通道、传感器通道和语音通道的实验意图,所述的融合层采用多模态融合算法来融合用户多通道意图信息。
在本实施例中,所述的基于YOLOv5的视觉通道意图概率获取算法包括以下步骤:
所述的基于欧氏距离传感器通道意图概率获取算法包括以下步骤:
(2)对于弯曲度传感器,我们对每一根手指的弯曲度值信息进行向量化,首先将五维向量的弯曲度维度划分为[,),[,),[,3),[,),[9180),当获得手指的弯曲度值时,即可将放置在向量相应的维度下,
所述的基于余弦相似度匹配的语音通道意图概率获取算法包括以下步骤:
所述的多模态融合算法包括以下步骤:
(2)计算意图概率集的概率均值,
(3)计算意图概率集的概率方差,
(5)对变异系数进行归一化处理,得到每个通道的权值,
实施案例和仿真结果
本发明利用了多模态融合的智能手套进行木炭还原氧化铁实验。
在本实验当中,第二步是倾倒蒸馏水,佩戴智能手套的用户的拿着盛有液体的真实烧杯向虚拟烧杯做倾倒动作,并输入语音“倾倒蒸馏水”。此时,系统通过多模态融合算法推断出用户当前的行为意图为“倾倒蒸馏水溶液”。如图2中的(a)所示,MR实验系统通过实验场景动画实时反馈用户当前的行为,并语音输出对用户操作的提醒。接下来,当智能手套检测到用户拿起热毛巾,并对虚拟烧杯做出捂住杯壁的动作时,即使不用语音输入“气密性检验”,系统仍可以利用多模态融合算法推断出用户当前的行为是“气密性检验”,如图2中的(b)所示,该实验利用信息增强技术在虚拟烧杯中显示产生的气泡,证明装置气密性良好。随着操作的进行,当智能手套检测到用户拿起药匙向盛有铁粉的小细口瓶做取药动作,并输入语音“取出铁粉”时,智能手套系统获取用户当前的操作行为是“取出铁粉”,如图2中的(c)所示,实验系统中虚拟的铁粉药粒跟随药匙尖端移动。在最后一步,当用户将铁粉和木炭粉装入试管后,用户佩戴智能手套操作虚拟的酒精喷灯,与此同时输入语音“点燃酒精喷灯”,系统就会获取到用户当前的行为是“点燃酒精喷灯”,如图2中的(d)所示,MR实验系统中酒精喷灯燃烧起虚拟火焰,并且澄清石灰水变浑浊。
最后,还应说明,上述举例和说明也并不仅限于上述实施例,本发明未经描述的技术特征可以通过或采用现有技术实现,在此不再赘述;以上实施例及附图仅用于说明本发明的技术方案并非是对本发明的限制,参照优选的实施方式对本发明进行了详细说明,本领域的普通技术人员应当理解,本技术领域的普通技术人员在本发明的实质范围内所做出的变化、改型、添加或替换都不脱离本发明的宗旨,也应属于本发明的权利要求保护范围。
Claims (5)
1.一种多模态融合的智能手套系统,包括输入层、识别层、融合层和交互层,所述输入层包括视觉通道、传感器通道和语音通道,其特征在于,所述的识别层分别采用基于YOLOv5的视觉通道意图概率获取算法、基于欧氏距离传感器通道意图概率获取算法和基于余弦相似度匹配的语音通道意图概率获取算法来分别获取视觉通道、传感器通道和语音通道的实验意图,所述的融合层采用多模态融合算法来融合用户多通道意图信息。
2.根据权利要求1所述的一种多模态融合的智能手套系统,其特征在于,所述的基于YOLOv5的视觉通道意图概率获取算法包括以下步骤:
3.根据权利要求1所述的一种多模态融合的智能手套系统,其特征在于,所述的基于欧氏距离传感器通道意图概率获取算法包括以下步骤:
(2)对于弯曲度传感器,我们对每一根手指的弯曲度值信息进行向量化,首先将五维向量的弯曲度维度划分为[,),[,),[,3),[,),[9180),当获得手指的弯曲度值时,即可将放置在向量相应的维度下,
4.根据权利要求1所述的一种多模态融合的智能手套系统,其特征在于,所述的基于余弦相似度匹配的语音通道意图概率获取算法包括以下步骤:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210754057.5A CN114816077A (zh) | 2022-06-30 | 2022-06-30 | 一种多模态融合的智能手套系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210754057.5A CN114816077A (zh) | 2022-06-30 | 2022-06-30 | 一种多模态融合的智能手套系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114816077A true CN114816077A (zh) | 2022-07-29 |
Family
ID=82523075
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210754057.5A Pending CN114816077A (zh) | 2022-06-30 | 2022-06-30 | 一种多模态融合的智能手套系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114816077A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110286763A (zh) * | 2019-06-21 | 2019-09-27 | 济南大学 | 一种具有认知功能的导航式实验交互装置 |
CN111651035A (zh) * | 2020-04-13 | 2020-09-11 | 济南大学 | 一种基于多模态交互的虚拟实验系统及方法 |
CN112099633A (zh) * | 2020-09-16 | 2020-12-18 | 济南大学 | 一种多模态感知的智能实验方法及装置 |
CN112748800A (zh) * | 2020-09-16 | 2021-05-04 | 济南大学 | 一种基于智能手套的实验场景感知交互方法 |
CN113569656A (zh) * | 2021-07-02 | 2021-10-29 | 广州大学 | 一种基于深度学习的考场监控方法 |
CN114093028A (zh) * | 2021-11-19 | 2022-02-25 | 济南大学 | 一种基于意图分析的人机协同方法、系统及机器人 |
US20220171465A1 (en) * | 2020-12-02 | 2022-06-02 | Wenshu LUO | Methods and devices for hand-on-wheel gesture interaction for controls |
EP4012653A1 (en) * | 2020-12-09 | 2022-06-15 | Toyota Jidosha Kabushiki Kaisha | Depth-map prediction method; computer program, readable medium, system and mobile machine for implementing the method |
-
2022
- 2022-06-30 CN CN202210754057.5A patent/CN114816077A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110286763A (zh) * | 2019-06-21 | 2019-09-27 | 济南大学 | 一种具有认知功能的导航式实验交互装置 |
CN111651035A (zh) * | 2020-04-13 | 2020-09-11 | 济南大学 | 一种基于多模态交互的虚拟实验系统及方法 |
CN112099633A (zh) * | 2020-09-16 | 2020-12-18 | 济南大学 | 一种多模态感知的智能实验方法及装置 |
CN112748800A (zh) * | 2020-09-16 | 2021-05-04 | 济南大学 | 一种基于智能手套的实验场景感知交互方法 |
US20220171465A1 (en) * | 2020-12-02 | 2022-06-02 | Wenshu LUO | Methods and devices for hand-on-wheel gesture interaction for controls |
EP4012653A1 (en) * | 2020-12-09 | 2022-06-15 | Toyota Jidosha Kabushiki Kaisha | Depth-map prediction method; computer program, readable medium, system and mobile machine for implementing the method |
CN113569656A (zh) * | 2021-07-02 | 2021-10-29 | 广州大学 | 一种基于深度学习的考场监控方法 |
CN114093028A (zh) * | 2021-11-19 | 2022-02-25 | 济南大学 | 一种基于意图分析的人机协同方法、系统及机器人 |
Non-Patent Citations (3)
Title |
---|
BOTAO ZENG 等: "Research on Intelligent Experimental Equipment and Key Algorithms Based on Multimodal Fusion Perception", 《IEEE》 * |
XIN ZHANG 等: "Multimodal data fusion algorithm applied to robots", 《CISAI 2019》 * |
刘如松: "基于样本间最小欧氏距离的多特征融合识别算法研究", 《计算机与数字工程》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021103648A1 (zh) | 手部关键点检测方法、手势识别方法及相关装置 | |
CN109657631B (zh) | 人体姿态识别方法及装置 | |
CN109325398B (zh) | 一种基于迁移学习的人脸属性分析方法 | |
CN105868715B (zh) | 一种手势识别方法、装置及手势学习系统 | |
CN103955267B (zh) | 光透视增强现实系统中双手人机交互方法 | |
CN112131985B (zh) | 一种基于OpenPose改进的实时轻量人体姿态估计方法 | |
CN110717927A (zh) | 基于深度学习和视惯融合的室内机器人运动估计方法 | |
Tang et al. | Facial landmark detection by semi-supervised deep learning | |
CN114663915B (zh) | 基于Transformer模型的图像人-物交互定位方法及系统 | |
CN111414837A (zh) | 手势识别方法、装置、计算机设备及存储介质 | |
CN108073851B (zh) | 一种抓取手势识别的方法、装置及电子设备 | |
CN111680550B (zh) | 情感信息识别方法、装置、存储介质及计算机设备 | |
CN112989947A (zh) | 一种人体关键点的三维坐标的估计方法及装置 | |
CN116222543B (zh) | 用于机器人环境感知的多传感器融合地图构建方法及系统 | |
CN112949569B (zh) | 一种面向跌倒分析的人体姿态点有效提取方法 | |
CN104423566A (zh) | 手势辨识方法及穿戴式装置 | |
CN116091551A (zh) | 一种基于多模态融合的目标检索跟踪方法及系统 | |
CN103426000B (zh) | 一种静态手势指尖检测方法 | |
Mi et al. | Intention-related natural language grounding via object affordance detection and intention semantic extraction | |
CN106512391B (zh) | 一种双手手势识别方法及基于其的模拟驾驶系统、方法 | |
CN116206328A (zh) | 一种基于多视点几何的三维人体姿态估计方法 | |
CN114816077A (zh) | 一种多模态融合的智能手套系统 | |
CN108564063B (zh) | 基于深度信息的掌心定位方法及系统 | |
CN104964684B (zh) | 一种高动态下快速星跟踪方法 | |
Wang et al. | MFA: a smart glove with multimodal intent sensing capability |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20220729 |