CN103257703B - 一种增强现实装置及方法 - Google Patents
一种增强现实装置及方法 Download PDFInfo
- Publication number
- CN103257703B CN103257703B CN201210039895.0A CN201210039895A CN103257703B CN 103257703 B CN103257703 B CN 103257703B CN 201210039895 A CN201210039895 A CN 201210039895A CN 103257703 B CN103257703 B CN 103257703B
- Authority
- CN
- China
- Prior art keywords
- image
- instruction
- recognition result
- user
- described image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- User Interface Of Digital Computer (AREA)
Abstract
本发明公开了一种增强现实装置及方法,该装置具体包括:可佩戴的发声装置,图象采集单元和图像识别单元;其中,所述图像采集单元安装在所述发声装置上;所述图象采集单元,用于采集图象并将所述图像发送至所述图像识别单元;所述图像识别单元,用于根据预存的信息对所述图像进行识别,生成识别结果;所述发声装置,用于将所述识别结果通过语音提示给用户。本发明简化了增强现实技术的步骤,操作简单、便捷。
Description
技术领域
本发明涉及电子领域,尤其涉及一种增强现实装置及方法。
背景技术
AR(AugmentedReality)技术即增强现实技术,是指把把原本在现实世界的一定时间空间范围内很难体验到的实体信息(视觉信息,声音,味道,触觉等),通过科学技术模拟仿真后再叠加到现实世界被人类感官所感知,从而达到超越现实的感官体验。
AR技术是透过某种装置进行观看实现的。早先的装置主要是HMD<Head-MountedDisplay;头罩式装置>,技术大概分成光学式<Optical>与影像<Video>两种,前者是一种透明的装置<像是柯南的眼镜之类>,使用者可以直接透过这层看到真实世界的影像,然后会有一些另外的投影装置把虚拟影像投射在这层透明装置上。另外一种是不透明装置,使用者看到的是由电脑处理好、已经虚实结合的影像。但专门佩戴头戴式的HMD比较麻烦。
最近几年较为通用的装置是安装了摄像头的移动设备如智能手机。通过在智能手机上安装摄像头进行拍摄,然后在后台进行处理获取信息以传递给用户。移动设备体积小,携带较为方便,但使用移动设备进行拍摄,需要打开移动设备,调到拍摄模式,然后对准物体进行拍摄等步骤,操作过程比较繁琐。
发明内容
本发明提供了一种增强现实装置及方法、能够简化增强现实技术的步骤,操作简单、便捷。
本发明提供了一种增强现实装置,该装置包括:
可佩戴的发声装置,图象采集单元和图像识别单元;其中,所述图像采集单元安装在所述发声装置上;
所述图象采集单元,用于采集图象并将所述图像发送至所述图像识别单元;
所述图像识别单元,用于根据预存的信息对所述图像进行识别,生成识别结果;
所述发声装置,用于将所述识别结果通过语音提示给用户。
优选的,所述装置还包括:
指令获取单元,用于获取用户的指令;
所述图像识别单元,还用于依据所述指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
优选的,所述指令获取单元包括:
语音识别单元,用于接收用户通过所述发声装置发送的语音信号并进行识别,生成语音指令;
所述图像识别单元,还用于依据所述语音指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
优选的,所述指令获取单元包括:
手势识别单元,用于获取用户的手势并生成手势指令;
所述图像识别单元,还用于依据所述手势指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
优选的,所述图象采集单元包括:摄像头。
优选的,所述发声装置包括:耳机。
本发明还提供了一种增强现实的方法,所述方法包括:
采集现实环境中的物体的图像;
根据预存的信息对所述图像进行识别,生成识别结果;
将所述识别结果通过语音提示给用户。
优选的,所述方法还包括:
获取用户的指令;
所述根据预存的信息对所述图像进行识别,生成识别结果包括:
依据所述指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
优选的,所述获取用户的指令包括:
接收用户发送的语音信号并进行识别,生成语音指令;
所述依据所述指令,根据所述预存的信息对所述图像进行识别,生成识别结果包括:
依据所述语音指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
优选的,所述获取用户的指令包括:
获取用户的手势并生成手势指令;
所述依据所述指令,根据所述预存的信息对所述图像进行识别,生成识别结果包括:
依据所述手势指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
与现有技术相比,本发明具有如下有益效果:
本发明通过将图像采集单元安装在可佩戴的发声装置上,能够在用户佩戴发声装置的同时进行图像的采集,通过发声装置告知用户识别结果,从而使用户得到超越现实的体验。用户不用专门携带移动设备,而且也不用在每次拍摄时,进行打开、拍摄、关闭等操作,相比现有技术,本发明简化了增强现实技术的步骤,操作简单、便捷。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例1装置结构图;
图2是本发明实施例5示意图;
图3是本发明实施例5示意图;
图4是本发明实施例7方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例1提供了一种增强现实装置,参见图1,该装置包括:
可佩戴的发声装置11,图象采集单元12和图像识别单元13;其中,所述图像采集单元12安装在所述发声装置11上。
为保证采集的图像与用户观看的图像一致,可设置该增强现实装置,使图像采集单元的视线角度与用户的视线角度一致。
所述图象采集单元12,用于采集图象并将所述图像发送至所述图像识别单元13。
所述图像识别单元13,用于根据预存的信息对所述图像进行识别,生成识别结果。
该预存的信息具体可以包括:存储的人的信息如人的脸部特征、身高、胖瘦等信息。还可以包括物体的特征如高楼大厦、标识、条形码等。
当存储的信息较多时,会减慢识别的速度。为此,可以先对存储的信息进分类,比如分为人和物体两大类。在人的类别后可以再具体分为男人、女人。在物体的类别后可以分为建筑类、食品类、标识类等。在进行识别时,显示别出其属于哪一类,然后在某一类的信息中进行查找识别。
所述发声装置11,用于将所述识别结果通过语音提示给用户。
具体的,可佩戴的发声装置可以为耳机。图像采集单元可以为摄像头。优选的,该耳机可以为蓝牙耳机。以蓝牙耳机为例,现在蓝牙耳机的应用已经越来越广,很多用户都随时佩戴该耳机。因此,将摄像头安装在蓝牙耳机上,可使用户在使用蓝牙耳机的同时进行图像采集,避免了用户额外携带其他设备。而且相对使用现有技术中的移动设备如智能手机等,本发明中的摄像头可一直处于拍摄状态,不用在每次拍摄时进行打开、拍摄、关闭等一系列操作。
有时用户并不需要对所有采集的图像进行识别,因此,在本发明的实施例2中,增强现实装置还包括:
指令获取单元,用于获取用户的指令。该指令获取单元与图像识别单元相连。
所述图像识别单元,还用于依据所述指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
用户可以通过语音或手势发送指令。
因此,在本发明的实施例3中,指令获取单元可以包括:
语音识别单元,用于接收用户通过所述发声装置发送的语音信号并进行识别,生成语音指令。
所述图像识别单元,还用于依据所述语音指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
比如,用户发出“此人是谁”的指令,那么图像识别单元就要对刚刚拍摄的人的图像进行识别,并告知用户结果。
在具体识别时,如果图像识别单元在预存的信息中没有找到该图像的信息,那么可以返回不能识别的信息。如果在预存的信息中找到了至少两个相似的信息,那么可以将该至少两个信息均返回给用户。
在本发明的实施例4中,所述指令获取单元包括:
手势识别单元,用于获取用户的手势并生成手势指令。
所述图像识别单元,还用于依据所述手势指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
比如,当用户用手指向看到的某一物体时,手势识别单元获取到该信息并生成识别该物体的指令,图像识别单元就会根据预存的信息对其进行识别并生成识别结果。
同实施例3一样,在具体识别时,如果图像识别单元在预存的信息中没有找到对应的信息,那么可以返回不能识别的信息。如果在预存的信息中找到了至少两个相似的信息,那么可以将该至少两个信息均返回给用户。
更进一步的为节省资源,图像采集单元可只对用户要识别的物体进行拍摄。此时,该增强现实装置还包括第二指令获取单元,与图像采集单元相连,用于获取用户的指令。图像采集单元用于根据用户的指令进行图像采集。图像识别单元用于对采集的图像进行识别。
本发明实施例5,参见图2为该增强现实装置在具体场景下的一个应用。
用户佩戴蓝牙耳机行走在路上,安装在蓝牙耳机上的摄像头对用户视野范围内的物体或人进行图像采集。
用户发现前方走过一人,但记不清此人,于是用户通过蓝牙耳机发出“此人是谁”的指令。
语音识别单元接收到该指令后进行识别,生成图像识别单元可识别的语音指令。之后图像识别单元,依据该语音指令,根据预存的信息对该人进行识别,发现该人叫“John”。于是生成“该人是john”的识别结果。并通过发声装置反馈给用户。用户可以凭借该结果与该人打招呼,以避免叫不出他人姓名的尴尬。
该用户继续行走,发现某一陌生的标识,于是用手势指向该标识。
手势识别单元接收到该手势后进行识别,生成识别该标识的指令。之后图像识别单元,依据该指令,根据预存的信息对该标识进行识别,发现存储的信息中没有该标识的相关信息,于是生成“不能识别该标识”的识别结果。
该识别结果被发送至发声装置,发声装置将其转换为相应的语音信息后发送至用户。
本发明实施例6还提供了一种增强现实的方法,参见图4,该方法包括:
S1、利用安装在可佩戴的发声装置上的图像采集单元采集现实环境中的物体的图像。
为保证采集的图像与用户观看的图像一致,可设置该发声装置,使图像采集单元的视线角度与用户的视线角度一致。
S2、根据预存的信息对所述图像进行识别,生成识别结果。
该预存的信息具体可以包括:存储的人的信息如人的脸部特征、身高、胖瘦等信息。还可以包括物体的特征如高楼大厦、标识、条形码等。
当存储的信息较多时,会减慢识别的速度。为此,可以先对存储的信息进分类,比如分为人和物体两大类。在人的类别后可以再具体分为男人、女人。在物体的类别后可以分为建筑类、食品类、标识类等。在进行识别时,显示别出其属于哪一类,然后在某一类的信息中进行查找识别。
S3、将所述识别结果通过语音提示给用户。
具体的,可佩戴的发声装置可以为耳机。图像采集单元可以为摄像头。优选的,该耳机可以为蓝牙耳机。以蓝牙耳机为例,现在蓝牙耳机的应用已经越来越广,很多用户都随时佩戴该耳机。因此,将摄像头安装在蓝牙耳机上,可使用户在使用蓝牙耳机的同时进行图像采集,避免了用户额外携带其他设备。而且相对使用现有技术中的移动设备如智能手机等,本发明中的摄像头可一直处于拍摄状态,不用在每次拍摄时进行打开、拍摄、关闭等一系列操作。
有时用户并不需要对所有采集的图像进行识别,因此,在本发明的实施例7中,该方法还包括:
获取用户的指令。
所述根据预存的信息对所述图像进行识别,生成识别结果包括:
依据所述指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
具体的,用户可以通过语音或手势发送指令。
因此,在本发明的实施例8中,所述获取用户的指令包括:
接收用户发送的语音信号并进行识别,生成语音指令。
所述依据所述指令,根据所述预存的信息对所述图像进行识别,生成识别结果包括:
依据所述语音指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
在本发明的实施例9中,所述获取用户的指令包括:
获取用户的手势并生成手势指令;
所述依据所述指令,根据所述预存的信息对所述图像进行识别,生成识别结果包括:
依据所述手势指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
值得注意的是,本发明方法与本发明的电子设备是相对应的,因此对电子设备部分不再详述,相关部分参见方法实施例即可。
以上对本发明所提供的一种组合按键的提示方法及电子设备进行了介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (8)
1.一种增强现实装置,其特征在于,该装置包括:
可佩戴的发声装置,图象采集单元和图像识别单元;其中,所述图像采集单元安装在所述发声装置上;
所述图象采集单元,用于采集图象并将所述图像发送至所述图像识别单元;
所述图像识别单元,用于根据预存的信息对所述图像进行识别,生成识别结果;
所述发声装置,用于将所述识别结果通过语音提示给用户;
其中,所述装置还包括:
指令获取单元,用于获取用户的指令;
所述图像识别单元,还用于依据所述指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
2.根据权利要求1所述的装置,其特征在于,所述指令获取单元包括:
语音识别单元,用于接收用户通过所述发声装置发送的语音信号并进行识别,生成语音指令;
所述图像识别单元,还用于依据所述语音指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
3.根据权利要求1所述的装置,其特征在于,所述指令获取单元包括:
手势识别单元,用于获取用户的手势并生成手势指令;
所述图像识别单元,还用于依据所述手势指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
4.根据权利要求1至3任一项所述的装置,其特征在于,所述图象采集单元包括:摄像头。
5.根据权利要求1或3任一项所述的装置,其特征在于,所述发声装置包括:耳机。
6.一种增强现实的方法,其特征在于,所述方法包括:
利用安装在可佩戴的发声装置上的图像采集单元采集现实环境中的物体的图像;
根据预存的信息对所述图像进行识别,生成识别结果;
将所述识别结果通过语音提示给用户;
其中,所述方法还包括:
获取用户的指令;
所述根据预存的信息对所述图像进行识别,生成识别结果包括:
依据所述指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
7.根据权利要求6所述的方法,其特征在于,所述获取用户的指令包括:
接收用户发送的语音信号并进行识别,生成语音指令;
所述依据所述指令,根据所述预存的信息对所述图像进行识别,生成识别结果包括:
依据所述语音指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
8.根据权利要求6所述的方法,其特征在于,所述获取用户的指令包括:
获取用户的手势并生成手势指令;
所述依据所述指令,根据所述预存的信息对所述图像进行识别,生成识别结果包括:
依据所述手势指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210039895.0A CN103257703B (zh) | 2012-02-20 | 2012-02-20 | 一种增强现实装置及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210039895.0A CN103257703B (zh) | 2012-02-20 | 2012-02-20 | 一种增强现实装置及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103257703A CN103257703A (zh) | 2013-08-21 |
CN103257703B true CN103257703B (zh) | 2016-03-30 |
Family
ID=48961660
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210039895.0A Active CN103257703B (zh) | 2012-02-20 | 2012-02-20 | 一种增强现实装置及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103257703B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103440603A (zh) * | 2013-08-30 | 2013-12-11 | 苏州跨界软件科技有限公司 | 基于增强现实的点菜系统 |
CN104182051B (zh) * | 2014-08-29 | 2018-03-09 | 百度在线网络技术(北京)有限公司 | 头戴式智能设备和具有该头戴式智能设备的交互系统 |
CN104484037A (zh) * | 2014-12-12 | 2015-04-01 | 三星电子(中国)研发中心 | 通过可穿戴设备进行智能控制的方法及该可穿戴设备 |
CN105867617B (zh) * | 2016-03-25 | 2018-12-25 | 京东方科技集团股份有限公司 | 增强现实设备、系统、图像处理方法及装置 |
CN108363556A (zh) * | 2018-01-30 | 2018-08-03 | 百度在线网络技术(北京)有限公司 | 一种基于语音与增强现实环境交互的方法和系统 |
CN109862274A (zh) * | 2019-03-18 | 2019-06-07 | 北京字节跳动网络技术有限公司 | 带摄像功能的耳机、用于输出控制信号的方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1302056A (zh) * | 1999-12-28 | 2001-07-04 | 索尼公司 | 信息处理设备,信息处理方法和存储介质 |
US6771294B1 (en) * | 1999-12-29 | 2004-08-03 | Petri Pulli | User interface |
CN102193772A (zh) * | 2010-03-19 | 2011-09-21 | 索尼公司 | 信息处理器、信息处理方法和程序 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5372157B2 (ja) * | 2008-09-17 | 2013-12-18 | ノキア コーポレイション | 拡張現実のためのユーザインターフェース |
-
2012
- 2012-02-20 CN CN201210039895.0A patent/CN103257703B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1302056A (zh) * | 1999-12-28 | 2001-07-04 | 索尼公司 | 信息处理设备,信息处理方法和存储介质 |
US6771294B1 (en) * | 1999-12-29 | 2004-08-03 | Petri Pulli | User interface |
CN102193772A (zh) * | 2010-03-19 | 2011-09-21 | 索尼公司 | 信息处理器、信息处理方法和程序 |
Also Published As
Publication number | Publication date |
---|---|
CN103257703A (zh) | 2013-08-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103257703B (zh) | 一种增强现实装置及方法 | |
CN105487673B (zh) | 一种人机交互系统、方法及装置 | |
KR102303115B1 (ko) | 웨어러블 디바이스 및 웨어러블 디바이스 의 증강 현실 정보 제공 방법 | |
CN110045819A (zh) | 一种手势处理方法及设备 | |
CN106291930A (zh) | 头戴式显示器 | |
CN206440890U (zh) | 可穿戴分离式智能眼镜 | |
CN118334214A (zh) | 一种图像渲染方法、电子设备及系统 | |
CN112835445B (zh) | 虚拟现实场景中的交互方法、装置及系统 | |
JP6516464B2 (ja) | ウェアラブル検索システム | |
CN105334955A (zh) | 一种信息处理方法及电子设备 | |
CN110660032A (zh) | 一种对象屏蔽方法、对象屏蔽装置及电子设备 | |
CN110891181B (zh) | 直播画面显示方法、装置、存储介质及终端 | |
CN205826965U (zh) | 智能眼镜 | |
US11900058B2 (en) | Ring motion capture and message composition system | |
CN111918114A (zh) | 图像显示方法、装置、显示设备及计算机可读存储介质 | |
Deshpande et al. | Google glass | |
CN117311490A (zh) | 腕戴设备控制方法及相关系统、存储介质 | |
WO2022179279A1 (zh) | 交互方法、电子设备与交互系统 | |
CN117940878A (zh) | 通过分布式和连接的真实世界对象建立社交连接 | |
CN109271026A (zh) | 可穿戴设备及实现鼠标功能方法、系统、装置、存储介质 | |
CN114531582B (zh) | 一种增强现实功能控制方法和电子设备 | |
CN205039859U (zh) | 手机显示扩展系统 | |
CN107168461A (zh) | 一种穿戴设备及信息处理方法 | |
Sharma et al. | Sixth Sense Technology | |
CN110119383A (zh) | 一种文件管理方法及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |