WO2014090034A1

WO2014090034A1 - 实现增强现实应用的方法及设备

Info

Publication number: WO2014090034A1
Application number: PCT/CN2013/085080
Authority: WO
Inventors: 李国庆
Original assignee: 华为终端有限公司
Priority date: 2012-12-13
Filing date: 2013-10-12
Publication date: 2014-06-19
Also published as: CN103870485B; CN103870485A; EP2851811B1; EP2851811A1; EP2851811A4; US20150103097A1

Abstract

本发明公开了一种实现增强现实应用的方法，包括：收集用户上传的图片和所述图片的标签信息；根据所述用户在互联网的社交图谱和兴趣图谱，发布所述图片和所述标签信息给所述用户的社交网络联系人，获得所述社交网络联系人对所述图片的评论信息；从所述评论信息中提取出现频率大于第一门限值的关键词；根据所述图片的标签信息和所述关键词，将所述图片添加到一图片集；根据所述图片集内所有图片的图像特征和所述关键词，生成所述图片所描述对象的增强现实模式和增强现实内容。本发明还公开了一种实现增强现实应用的设备。本发明实施例能够解决增强现实应用中对无标记物环境中随机对象的识别问题。

Description

实现增强现实应用的方法及设备

本申请要求于 2012 年 12 月 13 日提交中国专利局，申请号为 201210539054.6、发明名称为 "实现增强现实应用的方法及设备" 的中国专利申请，其全部内容通过引用结合在本申请中。技术领域

本发明涉及计算机技术领域，尤其涉及一种实现增强现实应用的方法及设备。

背景技术

增强现实（Augmented Reality, 简称 AR ) 的概念产生于 20世纪 90年代。 1994年，保罗 '米尔格拉姆 ( Paul Milgram )和岸野文郎（ Fumio Kishino ) 提出现实-虚拟连续统一体 ( Milgram's Reality- Virtuality Continuum ), 他们将真实环境和虚拟环境分别作为连续系统的两端，位于它们中间的被称为 "混合现实（ Mixed Reality )"。其中靠近真实环境的是增强现实（ Augmented Reality ), 靠近虚拟环境的则是增强虚境（ Augmented Virtuality )。

增强现实 AR是一种用于帮助人们以更直观、更形象的方式获取关于现实世界中物体的相关信息的技术。增强现实应用（简称 AR应用）的处理流程可以简单描述为感知、识别、匹配和渲染四个步骤，具体如下：

感知，是指用户使用终端设备提供的摄像头和各种传感器感知身边真实世界中的各种对象，釆集图片或图像、位置、方向、速度、温度、光照强度等等各种参数，供 AR软件使用。识别，是指 AR软件处理传感器所收集的数据，例如，对摄像头捕捉到的图片进行分析和处理，尝试识别出照片中的对象。 AR软件将从图片中提取到的对象特征模式，与本地或者在线的模式库中保存的模式进行匹配，如果匹配到则识别成功，否则识别失败。

匹配，是指识别成功后， AR软件准备好与某个模式相关的多媒体内容，如图文信息、音视频、 3D模型等等。这些媒体信息可以保存在终端本地，也可以在线获得。

渲染，是指 AR软件将多媒体内容同摄像头捕获的真实世界影像合并起来，渲染在用户的终端显示设备上。

目前，针对标志性建筑物、书籍、著名画作、条码、商标和文本等特殊类型的图片， AR应用具有艮好的识别效果。然而，对于不属于上述特殊类型的图片， AR应用的识别成功率不高，其可识别对象的种类有限，应用场景是受限制的。

发明内容

本发明实施例的多个方面提供了一种实现增强现实应用的方法及设备，能够解决增强现实应用中对无标记物环境中随机对象的识别问题。

第一方面，本发明实施例提供了一种实现增强现实应用的方法，包括：收集用户上传的图片和所述图片的标签信息；

根据所述用户在互联网的社交图谱和兴趣图谱，发布所述图片和所述标签信息给所述用户的社交网络联系人，获得所述社交网络联系人对所述图片的评论信息；

从所述评论信息中提取出现频率大于第一门限值的关键词；

根据所述图片的标签信息和所述关键词，将所述图片添加到一图片集；根据所述图片集内所有图片的图像特征和所述关键词，生成所述图片所描述对象的增强现实模式和增强现实内容。

结合第一方面，在第一种实现方式下，所述标签信息包括所述图片所描述对象的地理位置信息；则所述根据所述图片的标签信息和所述关键词，将所述图片添加到一图片集，包括：

才艮据所述图片所描述对象的地理位置信息，将所述图片添加到图片库中，所述图片库内的图片所描述对象具有相同的地理位置信息，所述图片库内包含有至少一个图片集；

根据所述关键词，将所述图片添加到所述图片库的一图片集中，所述图片集内的图片具有相同的关键词。

结合第一方面或第一方面的第一种实现方式，在第二种实现方式下，所述根据所述图片集内所有图片的图像特征和所述关键词，生成所述图片所描述对象的增强现实模式和增强现实内容，包括：

从所述图片集内所有图片中提取图像特征，根据所述图像特征确定共有图像特征；所述共有图像特征是指所述图片集内超过第一百分比的图片都具有的图像特征；

结合所述共有图像特征和所述关键词，生成所述图片所描述对象的增强现实模式，并添加到可识别模式库中；

根据所述关键词，从搜索引擎或者第三方内容提供商获得所述图片所描述对象的增强现实内容；

建立所述增强现实内容与所述增强现实模式的关联关系，并将所述增强现实内容添加到增强现实内容库。

结合第一方面的第二种实现方式，在第三种实现方式下，在生成图片所描述对象的增强现实模式和增强现实内容之后，还包括：

接收用户发送的增强现实应用服务请求消息，所述增强现实应用服务请求消息包含待识别的图片和所述图片的标签信息；

根据所述待识别的图片的图像特征和 /或所述标签信息，从所述可识别模式库中搜索所述待识别的图片所描述对象的增强现实模式；

若搜索到所述待识别的图片所描述对象的增强现实模式，根据所述增强现实模式从增强现实内容库中获取相关联的增强现实内容，将所述增强现实内容发送给所述用户；

若搜索不到相关的增强现实模式，将所述待识别的图片标记为不可识别的图片。

结合第一方面的第三种实现方式，在第四种实现方式下，在所述收集用户上传的图片和所述图片的标签信息的步骤中，所收集的图片是用户上传的被标记为不可识别的图片。

第二方面，本发明实施例提供了一种实现增强现实应用的设备，包括：图片收集单元，用于收集用户上传的图片和所述图片的标签信息；评论获取单元，用于根据所述用户在互联网的社交图谱和兴趣图谱，发布所述图片和所述标签信息给所述用户的社交网络联系人，获得所述社交网络联系人对所述图片的评论信息；

关键词获取单元，用于从所述评论信息中提取出现频率大于第一门限值的关键词；

图片归类单元，用于根据所述图片的标签信息和所述关键词，将所述图片添加到一图片集；和，

增强现实处理单元，用于根据所述图片集内所有图片的图像特征和所述关键词，生成所述图片所描述对象的增强现实模式和增强现实内容。

结合第二方面，在第一种实现方式下，所述标签信息包括所述图片所描述对象的地理位置信息；所述图片归类单元包括：

第一归类子单元，用于根据所述图片所描述对象的地理位置信息，将所述图片添加到图片库中，所述图片库内的图片所描述对象具有相同的地理位置信息，所述图片库内包含有至少一个图片集；和，

第二归类子单元，用于根据所述关键词，将所述图片添加到所述图片库的一图片集中，所述图片集内的图片具有相同的关键词。

结合第二方面或第二方面的第一种实现方式，在第二种实现方式下，所述增强现实处理单元包括：

图像优选子单元，用于从所述图片集内所有图片中提取图像特征，根据所述图像特征确定共有图像特征；所述共有图像特征是指所述图片集内超过第一百分比的图片都具有的图像特征；

增强现实模式生成子单元，用于结合所述共有图像特征和所述关键词，生成所述图片所描述对象的增强现实模式，并添加到可识别模式库中；

增强现实内容获取子单元，用于根据所述关键词，从搜索引擎或者第三方内容提供商获得所述图片所描述对象的增强现实内容；和，

增强现实内容存储子单元，用于建立所述增强现实内容与所述增强现实模式的关联关系，并将所述增强现实内容添加到增强现实内容库。

结合第二方面的第二种实现方式，在第三种实现方式下，所述设备还包括：

请求接收单元，用于接收用户发送的增强现实应用服务请求消息，所述增强现实应用服务请求消息包含待识别的图片和所述图片的标签信息；

增强现实模式匹配单元，用于根据所述待识别的图片的图像特征和 /或所述标签信息，从所述可识别模式库中搜索所述待识别的图片所描述对象的增强现实模式；

增强现实内容提供单元，用于若搜索到所述待识别的图片所描述对象的增强现实模式，根据所述增强现实模式从增强现实内容库中获取相关联的增强现实内容，将所述增强现实内容发送给所述用户；和，

图片标记单元，用于若搜索不到相关的增强现实模式，将所述待识别的图片标记为不可识别的图片。

结合第二方面的第三种实现方式，在第四种实现方式下，所述图片收集单元所收集的图片是用户上传的被标记为不可识别的图片。

本发明实施例提供的实现增强现实应用的方法及设备，收集用户上传的图片及标签信息，以及所述用户的社交网络联系人对所述图片的评论信息；从所述评论信息中提取用于识别图片的关键词；根据所述图片的标签信息和关键词，将所述图片添加到一图片集；根据所述图片集内所有图片的图像特征和关键词，实现对无标记物环境中随机对象的增强现实模式与增强现实内容的自动生成。利用所生成的增强现实模式与增强现实内容，能够解决增强现实应用中对无标记物环境中随机对象的识别问题。附图说明

图 1是本发明实施例提供的一种实现增强现实应用的方法的流程示意图；图 2是图 1所示的实现增强现实应用的方法中的步骤 S105的流程示意图；图 3 是本发明实施例提供的另一种实现增强现实应用的方法的流程示意图；

图 4是本发明实施例提供的一种实现增强现实应用的设备的结构示意图；图 5是本发明实施例提供的一种实现增强现实应用的设备的图片归类单元的结构示意图；

图 6是本发明实施例提供的一种实现增强现实应用的设备的增强现实处理单元的结构示意图；

图 7是本发明实施例提供的另一种实现增强现实应用的设备的结构示意图；

图 8是本发明实施例提供的一种终端的结构示意图。具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例 , 都属于本发明保护的范围。

本发明提供的实现增强现实应用的方法及设备，所要解决的技术问题是：在一个普通的、没有经过处理的、没有标记物的环境里，提取任意的对象，作为 AR识别的模式并生成相关的 AR内容，解决增强现实应用中对无标记物环境中随机对象的识别问题。

参见图 1 ,是本发明实施例提供的一种实现增强现实应用的方法的流程示意图。

本发明实施例提供一种实现增强现实应用的方法，包括步骤 S101 S105, 具体如下：

5101 , 收集用户上传的图片和所述图片的标签信息。

具体的，所述图片的标签信息可以是文本格式的任意内容，可以是所述图片所描述对象的地理位置信息、所述图片的辅助描述信息、拍摄时间等内容。例如，在天安门广场拍摄一张照片，则 "天安门广场" 为图片所描述对象， "天安门广场" 的地理位置为图片所描述对象的地理位置信息，用户给照片添加的关于 "天安门广场" 的景物、建筑、历史等信息为图片的辅助描述信息。

具体实施时，釆用具有地理位置显示功能的相机拍摄照片，可自动为拍摄的 JPEG格式的图片添加扩展信息，该扩展信息以 EXIF格式保存，其内容包括地理位置（经纬度、海拔）和拍摄时间。

5102, 根据所述用户在互联网的社交图谱和兴趣图谱，发布所述图片和所述标签信息给所述用户的社交网络联系人，获得所述社交网络联系人对所述图片的评论信息。

随着 Facebook等网站的爆炸式发展，社交网络受到越来越多的关注，由此衍生了社交图谱和兴趣图谱的概念。其中，社交图谱揭示了人与人之间的关系；兴趣图谱揭示了用户的爱好与兴趣，以及由此衍生出的人与人之间的关系。

本发明实施例根据用户在互联网上的社交图谱和兴趣图谱，向用户的社交网络联系人发布图片，可以推断该图片是所述社交网络联系人感兴趣的内容。从所述社交网络联系人中获得的图片评论信息，更能精准地反应出图片所描述对象的特征，利用从所述图片评论信息中提取的关键词来构建增强现实模式和增强现实内容，能够提高增强现实应用中对无标记物环境中随机对象的识别成功率，提升用户体验。

5103 , 从所述评论信息中提取出现频率大于第一门限值的关键词。

其中，所述关键词可以是所述图片所描述对象的景物特征、人文、历史渊源等信息。从所述评论信息中提取的关键词可以是一个或者多个。

5104 , 根据所述图片的标签信息和所述关键词，将所述图片添加到一图在一个实施方式中，所述标签信息包括所述图片所描述对象的地理位置信息。则上述步骤 S104包括：根据所述图片所描述对象的地理位置信息，将所述图片添加到图片库中，所述图片库内的图片所描述对象具有相同的地理位置信息，所述图片库内包含有至少一个图片集；根据所述关键词，将所述图片添加到所述图片库的一图片集中，所述图片集内的图片具有相同的关键词。

具体实施时，可以先根据图片所描述对象的地理位置信息建立图片库，将具有相同地理位置信息的图片添加到同一图片库中。当图片库中的图片数量达到设定的边界条件后，再根据不同的关键词，在图片库中创建至少一个图片集，将具有相同关键词的图片添加到同一图片集中，从而实现对图片库中的图片作进一步分类。例如，某个图片库保存有与地理位置 "天安门广场" 相关的图片，此 "天安门广场" 图片库进一步划分为 "人民英雄纪念碑" 图片集、 "毛主席纪念堂" 图片集和 "正阳门" 图片集，形成 "地理位置图片库 -关键词图片集"这样的二级图片存储结构。其中， "人民英雄纪念碑" 图片集用于存放具有 "人民英雄纪念碑" 这一关键词的图片， "毛主席纪念堂" 图片集用于存放具有 "毛主席纪念堂" 这一关键词的图片， "正阳门" 图片集用于存放具有 "正阳门" 这一关键词的图片。同一图片集内的每张图片所描述的对象相同。

上述的 "具有相同地理位置信息的图片" 并非要求地理位置严格一致，这里的地理位置相同是一个范围，比如，分析照片的地理位置信息，发现一些照片都是在以人民英雄纪念碑为圓心、半径为 500米的圓这个范围内拍摄的，那么就把这些照片归为一类。

S105, 根据所述图片集内所有图片的图像特征和所述关键词，生成所述图片所描述对象的增强现实模式（简称 AR模式）和增强现实内容（简称 AR 内容）。

物理空间中的每一个对象都具有多个特征，例如长、宽、高、颜色、紋理、地理位置等； AR模式是指数字化格式保存的一组用于在 AR应用中标识一个物理空间中的对象的特征，这些特征可以是颜色、紋理、形状、位置等。

AR应用把数字化的多媒体信息（图片、文字、 3D对象等）与物理空间中的真实对象合并，在用户终端设备上显示为一个融合的 AR体验。这里的所有可以用于叠加到物理空间真实对象之上的多媒体信息都是 AR内容。

具体实施时，可以在图片集内的所有图片的数量达到设定的边界条件后，或者在图片集内的所有图片具有的关键词数量达到设定的边界条件后，再执行步骤 S105。其中，所述边界条件可以是：图片集内的所述图片的数量大于设定的图片数量门限值，或者图片集内的所述图片具有的关键词的数量大于设定的关键词数量门限值。

参见图 2, 步骤 S105具体包括步骤 S201 S204, 如下：

S201 , 从所述图片集内所有图片中提取图像特征，根据所述图像特征确定共有图像特征；所述共有图像特征是指所述图片集内超过第一百分比的图片都具有的图像特征。

其中，所述第一百分比可以根据实际应用来设定，例如设为 80%。

具体实施时，从所述图片集内的每张图片中提取图像特征，假设一共提取出 n个图像特征，包括图像特征 XI、 X2、 X3 Xn。例如，一张拍摄有天安门广场的图片，从图片中提取的 "毛主席像"、 "天安门城楼" 的图像信息均为图像特征。

分别使用图像特征 XI、 X2、 X3 Xn去识别所述图片集内的图片，获得每个图像特征对图片的检出率。例如，图片集内的 90%的图片中都具有图像特征 XI , 则图像特征 XI对图片的检出率为 90%。

在获得每个图像特征对图片的检出率后，对检出率做归一化处理，其中检出率中的最大值归一化为 1 , 其他检出率做归一化处理后都小于 1 , 每个归一化处理后的检出率为其对应的图像特征的加权值。当有新的图片加入图片集时，按照上述方法重新对图片集内的图片进行识别。每个图像特征的加权值将根据每次的识别结果不断地刷新，在经过多次识别后，将检出率长期大于门限值（例如， 0.6 ) 的图像特征标记为共有图像特征，所述共有图像特征与图片所描述对象（即 AR目标）相匹配。而检出率长期小于或等于所述门限值的图像特征则被剔除。

此外，还可以设定一个相似度评价函数： ,∑₂,... ,、= 1^ 。其中，是图像特征 Xi的归一化加权值。如果使用图像特征 Xi能够判定某张用户上传的图片包含 AR目标，则 bfl , 否则 bH)。加权值会根据每次的识别结果不断刷新，则相似度评价函数是一个动态更新的函数，使用此函数可评价用户上传的某张图片与 AR目标的匹配度。显然，如果某个图像特征和 AR目标的相关度不大，则此图像特征的归一化加权值对相似度评价函数的影响很小；经过多次迭代后，归一化加权值小于某个门限值的图像特征，可以从 AR模式中剔除。

5202, 结合所述共有图像特征和所述关键词，生成所述图片所描述对象的增强现实模式，并添加到可识别模式库中。

5203 , 根据所述关键词，从搜索引擎或者第三方内容提供商获得所述图片所描述对象的增强现实内容。

5204, 建立所述增强现实内容与所述增强现实模式的关联关系，并将所述增强现实内容添加到增强现实内容库。

本发明实施例提供的实现增强现实应用的方法，收集用户上传的图片及标签信息，以及所述用户的社交网络联系人对所述图片的评论信息；从所述评论信息中提取用于识别图片的关键词；根据所述图片的标签信息和关键词，将所述图片添加到图片集；根据所述图片集内所有图片的图像特征和关键词，实现对无标记物环境中随机对象的增强现实模式与增强现实内容的自动生成。利用所生成的增强现实模式与增强现实内容，能够解决增强现实应用中对无标记物环境中随机对象的识别问题。

参见图 3 ,是本发明实施例提供的另一种实现增强现实应用的方法的流程示意图。

本发明实施例提供另一种实现增强现实应用的方法，包括上述步骤 S101 S105和 S201~S204。此外，在生成增强现实模式与增强现实内容之后，还可以利用所生成的增强现实模式与增强现实内容，对无标记物环境中随机对象进行识别，包括以下步骤：

5301 , 接收用户发送的增强现实应用服务请求消息，所述增强现实应用服务请求消息包含待识别的图片和所述图片的标签信息。

5302 , 根据所述待识别的图片的图像特征和 /或所述标签信息，从所述可识别模式库中搜索所述待识别的图片所描述对象的增强现实模式。

5303 , 若搜索到所述待识别的图片所描述对象的增强现实模式，根据所述增强现实模式从增强现实内容库中获取相关联的增强现实内容，将所述增强现实内容发送给所述用户。

5304 , 若搜索不到相关的增强现实模式，将所述待识别的图片标记为不可识别的图片。

在又一个实施方式中，在步骤 S304的将所述待识别的图片标记为不可识别的图片之后，还可以执行上述实施例中的步骤 S101 S105和 S201 S204的方法，以生成 "被标记为不可识别的图片" 所描述对象的增强现实模式与增强现实内容。即在步骤 S101中，所收集的图片是用户上传的被标记为不可识别的图片。在生成所述 "被标记为不可识别的图片" 所描述对象的增强现实模式与增强现实内容之后，当用户再次上传所述 "被标记为不可识别的图片" 时，就可以识别出所述 "被标记为不可识别的图片"，从而解决增强现实应用中对无标记物环境中随机对象的识别问题。

本发明实施例提供的实现增强现实应用的方法，在用户使用增强现实应用服务时，还具备学习能力，能够利用识别失败的图片，自动生成该图片所描述对象的增强现实模式与增强现实内容。这种方法使用的时间越长，使用的用户越多，所生成的新的增强现实模式与增强现实内容就越丰富，设备的可用性越高，能够解决增强现实应用中对无标记物环境中随机对象的识别问题。本发明还提供一种实现增强现实应用的设备，能够实现上述的实现增强现实应用的方法的所有流程，下面结合图 4〜图 7进行详细说明。

参见图 4,是本发明实施例提供的一种实现增强现实应用的设备的结构示意图。

本发明实施例提供的一种实现增强现实应用的设备，包括图片收集单元 41、评论获取单元 42、关键词获取单元 43、图片归类单元 44和增强现实处理单元 45; 具体如下：

图片收集单元 41 , 用于收集用户上传的图片和所述图片的标签信息。评论获取单元 42 , 用于根据所述用户在互联网的社交图谱和兴趣图谱，发布所述图片和所述标签信息给所述用户的社交网络联系人，获得所述社交网络联系人对所述图片的评论信息。

关键词获取单元 43 , 用于从所述评论信息中提取出现频率大于第一门限值的关键词。

图片归类单元 44 , 用于根据所述图片的标签信息和所述关键词，将所述图片添加到一图片集。

增强现实处理单元 45 , 用于根据所述图片集内所有图片的图像特征和所述关键词，生成所述图片所描述对象的增强现实模式和增强现实内容。参见图 5 ,是本发明实施例提供的一种实现增强现实应用的设备的图片归类单元的结构示意图。

所述标签信息包括所述图片所描述对象的地理位置信息；则所述图片归类单元 44包括第一归类子单元 51和第二归类子单元 52, 如下：

第一归类子单元 51 , 用于根据所述图片所描述对象的地理位置信息，将所述图片添加到图片库中，所述图片库内的图片所描述对象具有相同的地理位置信息，所述图片库内包含有至少一个图片集。

第二归类子单元 52, 用于根据所述关键词，将所述图片添加到所述图片库的一图片集中，所述图片集内的图片具有相同的关键词。参见图 6,是本发明实施例提供的一种实现增强现实应用的设备的增强现实处理单元的结构示意图。

本发明实施例提供一种增强现实处理单元 45 , 包括图像优选子单元 61、增强现实模式生成子单元 62、增强现实内容获取子单元 63和增强现实内容存储子单元 64; 具体如下：

图像优选子单元 61 , 用于从所述图片集内所有图片中提取图像特征，根据所述图像特征确定共有图像特征；所述共有图像特征是指所述图片集内超过第一百分比的图片都具有的图像特征。

增强现实模式生成子单元 62 ,用于结合所述共有图像特征和所述关键词，生成所述图片所描述对象的增强现实模式，并添加到可识别模式库中。

增强现实内容获取子单元 63 , 用于根据所述关键词，从搜索引擎或者第三方内容提供商获得所述图片所描述对象的增强现实内容。增强现实内容存储子单元 64, 用于建立所述增强现实内容与所述增强现实模式的关联关系，并将所述增强现实内容添加到增强现实内容库。参见图 7 ,本发明实施例提供的另一种实现增强现实应用的设备的结构示意图。

本发明实施例提供另一种实现增强现实应用的设备，除了包括上述实施例中的图片收集单元 41、评论获取单元 42、关键词获取单元 43、图片归类单元 44和增强现实处理单元 45 , 还包括请求接收单元 71、增强现实模式匹配单元 72、增强现实内容提供单元 73和图片标记单元 74, 具体如下：

请求接收单元 71 , 用于接收用户发送的增强现实应用服务请求消息，所述增强现实应用服务请求消息包含待识别的图片和所述图片的标签信息。

增强现实模式匹配单元 72 , 用于根据所述待识别的图片的图像特征和 /或所述标签信息，从所述可识别模式库中搜索所述待识别的图片所描述对象的增强现实模式。

增强现实内容提供单元 73 , 用于若搜索到所述待识别的图片所描述对象的增强现实模式，根据所述增强现实模式从增强现实内容库中获取相关联的增强现实内容，将所述增强现实内容发送给所述用户。

图片标记单元 74 , 用于若搜索不到相关的增强现实模式，将所述待识别的图片标记为不可识别的图片。

在又一个实施方式中，所述图片收集单元 41所收集的图片是用户上传的被标记为不可识别的图片。

本发明实施例提供的实现增强现实应用的设备，收集用户上传的图片及标签信息，以及所述用户的社交网络联系人对所述图片的评论信息；从所述评论信息中提取用于识别图片的关键词；根据所述图片的标签信息和关键词，将所述图片添加到图片集；根据所述图片集内所有图片的图像特征和关键词，实现对无标记物环境中随机对象的增强现实模式与增强现实内容的自动生成。利用所生成的增强现实模式与增强现实内容，能够解决增强现实应用中对无标记物环境中随机对象的识别问题。下面结合步骤 S801 S814,仅以用户上传的图片为照片为例，对本发明提供的实现增强现实应用的方法及设备的处理流程进行详细说明。

5801 , 用户使用智能手机拍摄一张照片，照片中所描述的对象是用户感兴趣的一个对象（AR 目标），同时用户为所述照片添加地理位置信息

( GeoTagging )和其他用户自定义的标签信息；然后，将所述照片和地理位置信息标签提交给实现增强现实应用的设备（以下简称 AR设备）。其中，所述 AR设备能够实施本发明实施例中的实现增强现实应用的方法。

5802, AR设备对所述照片进行图像处理，提取出了所述照片中对象的 AR模式，如果能够在可识别模式库中匹配到了所述照片中对象的 AR模式，则根据所述 AR模式，从 AR内容库中搜索相关联的 AR内容。

5803 , AR内容库将搜索到的 AR内容返回给智能手机，之后智能手机上的本地应用把 AR内容与摄像头捕捉到的真实场景合并成一个 AR体验，呈现给用户。

当 AR设备无法识别照片中的对象的 AR模式时，执行本发明提供的实现增强现实应用的方法的处理流程，产生 AR模式和 AR内容，为以后的用户再次试图识别上述对象时提供 Λ良务。如下步骤 S804~ S815:

5804, AR设备对所述照片进行图像处理，提取出了照片中对象的 AR模式，但是无法在可识别模式库中搜索到上述的 AR模式，或者 AR识别模块无法从照片中提取一个有效的 AR模式，则把该照片标记为不可识别图片，并将该照片发送到不可识别图片库。

假如，多个用户在同一地点拍摄并上传了大量照片， AR设备则依据 GeoTagging建立图片库，将具有相同地理位置信息的照片存放到同一图片库中。 5805 , 从不可识别图片库中获取不可识别的照片及其标签信息。

5806 , 根据用户在互联网上的社交图谱，将所述照片发布给用户在社交网站上的好友，或者根据用户添加的标签和用户的兴趣图谱，把照片发送给用户的相关社交网络联系人。

5807 , 在社交网站 SNS发布照片之后，期望用户的好友会针对上述照片添加评论、展开讨论， SNS将这些评论信息返回给 AR设备。

5808, AR设备对收到的评论信息进行综合分析，提取热门关键词或者使用频率较高的关键词，以此作为描述上述照片的信息。

5809, AR设备在收集到足够多的关键词之后，对依据地理位置信息建立的图片库再作进一步的分割。例如，某个图片库保存的是与地理位置 "天安门广场"相关的照片， AR设备收集到的关键词包括 "人民英雄纪念碑"、 "毛主席纪念堂" 和 "正阳门"，则此 "天安门广场" 图片库可以进一步的划分为三个图片集，分别存储包含上述三个关键词的照片，这样，图片存放库将逐渐被划分为 "不可识别图片库-地理位置图片库-关键词图片集"这样的三级存储结构。

5810 , 在图片集内的图片数量达到设定的边界条件后，启动图像处理算法，从所述图片集内的照片中提取共有图像特征。对于无法提取图像特征的照片可作为样本，训练识别算法，提高识别精度。

5811 , 结合所述共有图像特征和所述关键词，生成所述图片所描述对象的 AR模式，并保存到可识别模式库。因此，可识别模式库将逐渐丰富，本次不可识别的对象，在识别失败若干次，可识别模式库积累足够多的数据之后将变成一个可识别的对象。

5812, 将所述关键词发送给搜索引擎，由搜索引擎收集 AR内容。

5813 , 将搜索引擎收集到的 AR内容保存到 AR内容库。此外，还可以把 AR模式提供给第三方内容提供商，由第三方内容提供商为该 AR模式提供 AR内容，这部分的 AR内容同样也被存储到 AR内容库中。 S814, AR内容库返回一组内容给智能手机，智能手机上的 AR设备合并虚拟信息和真实场景，呈现一个 AR体验给用户。

综上所述，步骤 S804~ S814利用用户上传的不可识别的照片生成了新的 AR模式和 AR内容。这种方法使用的时间越长，使用的用户越多，生成的新 AR模式和 AR内容就越丰富， AR设备的对图片的识别性能越高。下面结合三个应用场景，对本发明提供的实现增强现实应用的方法及设备的有益效果进行详细说明。

应用场景一：

每天有大量游客前往天安门广场，天安门广场附近大型目标包括天安门城楼、金水桥、观礼台、国旗杆、人民大会堂、正阳门、人民英雄纪念碑、毛主席纪念堂和国家博物馆等等，此外，还有一些其他的用户可能关注的目标，例如，毛主席纪念堂门前的雕塑、人民英雄纪念碑上的浮雕、人民大会堂的廊柱、地铁一号线的入口以及每逢五一、国庆日会摆放在广场上的临时性景观等。下面结合这个场景，对本发明提供的实现增强现实应用的方法及设备的有益效果进行描述。

来自杭州的小 A国庆日到北京旅游，来到了天安门广场，广场周围的宏伟建筑引发了小 A的浓厚兴趣，其中小 A最感兴趣的是正阳门城楼上的牌匾，小 A很喜欢书法，想知道正阳门城楼上的牌匾是谁书写的。

为了解除疑问，小 A拍摄了正阳门城楼牌匾的照片，启动 AR设备尝试识别，不幸的是 AR设备没有成功的识别这个牌匾，只是提示小 A可以添加一些描述信息和地理位置信息，并提示小 A过一段时间再使用 AR设备进行识别。

AR设备把牌匾照片发送到了小 A在人人网上的好友，并留了一个问题给好友们：你们知道这个牌匾是谁题写的吗？ AR设备依据人人网提供的 API ( Application Programming Interface , 应用程序编程接口）把照片发送给了那些在小 A的爱好中添加了书法项目的好友。

小 A的好友们收到照片后，纷纷对这张照片发表了评论， AR设备使用人人网的 API获得了所有评论信息，并经过分析得到了关键词 "牌匾"。

同时，大量的游客聚集在天安门广场游览，不少和小 A有着类似兴趣点的游客，使用相同的 AR设备尝试识别正阳门城楼牌匾，短时间内， AR设备接收到了大量关于正阳门城楼（地理位置）的照片，并且从这些用户的好友对照片的评论中分析出了关键词 "牌匾"，因此 AR设备将所有带有牌匾标签 (来源于用户定义标签或者好友评论）的照片划分为一个子集，并进行了图像处理，提取了这类照片的特征，记录了地理位置信息和关键词 "牌匾"，并把这个特征（也就是 AR模式）保存到了可识别模式库。

AR设备向搜索引擎提供了地理位置信息和 "牌匾" 关键词，搜索引擎检索到了一系列的相关内容，例如，牌匾相关的图片，牌匾的颜色和材质，牌匾何时挂到城楼上，牌匾为何人书写等等。同时， AR设备把照片、地理位置信息和关键词 "牌匾" 提供给了自己的一个第三方内容提供商，此内容提供商拥有老北京商户牌匾和城门楼牌匾的详细信息，记录了牌匾书写人及其生平。检索到的这些内容后，返回给 AR内容库，并与上一步提取的 AR模式关联起来。

第二天，小 A带自己在北京的朋友小 D—起来到正阳门城楼下，再次使用 AR设备尝试识别牌匾，惊喜的发现可以成功的识别这块牌匾，并且获得了牌匾书写人的信息及其生平。小 A高兴地和朋友一起交流关于这块牌匾的故事。应用场景二：

国家博物馆经常举行文物和艺术品展览，最近国家博物馆将推出《佛造像艺术展》，该展览计划持续 3个月，前两周为预展，邀请部分专家和一定数目的观众参观；两周后开放普通观众参观。同时，国家博物馆使用了本发明提供的实现增强现实应用的方法及设备， AR后台与国家博物馆的数据库和一个内部搜索引擎相连，进入国家博物馆时观众可以使用无线连接下载和安装这个 AR设备，并提示用户可以通过使用该 AR设备为改进展览提供帮助，为普通观众提供更多的内容。

第一批受邀请观众大多配合主办方安装了 AR设备，他们是佛造像领域的专家，参观展览时深感介绍文字太简单，提供的相关信息不够丰富。于是纷纷拿出手机使用 AR设备对各种造型的佛造像进行拍照和评论。

专家的照片和评论很快上传到了 AR后台， AR设备依据专家评论（例如，专家添加的标签，专家针对佛造像的提问等），对照片进行了分类，将收集到的照片精确的划分成了一个个的子集，并提取了 AR模式，保存到了模式库。同时， AR设备将这些专家的照片发送给了该专家的不能亲自前来参观展览的朋友们，这些专家的朋友们针对照片发表了大量的评论和提问。 AR设备收集了这些评论和提问，提取了关键词。

AR设备分析了专家的评论和提出的问题，获得了一些关键词和关键问题，之后在国家博物馆数据库中检索到了大量的相关内容，作为 AR内容和上一步生成的 AR模式关联了起来。

2周之后， AR设备积累了足够多的 AR模式和与之相关联的 AR内容，开放普通用户参观之后，普通用户使用 AR设备可以很轻易的识别出摄像头中的佛造像并获得详细的朝代、来源地、造像名字等信息。应用场景三：

A和 B两人通过社交图片分享网站 Instagram建立了好友关系，二人有着共同的喜欢宠物猫的兴趣爱好， A和 B对自己家附近的流浪猫也很关心，经常拍摄照片进行分享，二人都是本发明公开的 AR设备的用户。

A尝试使用自己终端上的 AR设备识别自己家附近的一只流浪猫，但由于 AR设备后台模式库中没有这只猫的 "模式" （pattern ), 识别失败。 A给这张照片添加了一个标签 "猫叔 "，然后提交给了 AR设备。

AR设备调用 SNS网站提供的 API, 把这张无法识别的照片发送给 SNS 好友 B, B对此照片添加了评论 "猫叔是新华社资深员工"，那么 AR设备可以从 B的评论中提取关键词猫叔。假定 AR设备不可识别图片库内有大量地理位置不同、标签是 "猫叔" 的照片，那么这张照片可以加入到地理位置是 A 家、标签是 "猫叔" 的照片子集。该子集内还包含了一些其他用户在 A家附近拍摄上传的标签为 "猫叔" 的照片。

AR设备才艮据地理位置、用户自定义辅助信息和用户关系，找到了在 A家这个地理位置附近关于猫的照片，和 B家附近拍摄的关于猫的照片。这两个图片的地理位置信息不同，属于不同图片集的照片，但是这两个照片都是包含 "猫叔" 标签， AR设备认为这两类照片是有内在联系的，因此将这两个图片集整合成一个子集，使照片的分类不受地理位置的限制。

当 AR设备获取的具有内在联系（如具有相同标签）的照片达到一定数量后，通过特征提取，获得了标签为 "猫叔" 的照片的图像特征，如花紋、颜色等特征，并将此图像特征作为模式，注册到 AR设备， AR设备获得了一个新的可识别的 AR模式。

AR设备的后台连接了第三方内容提供商，例如某宠物医院网站，该网站向 AR设备提供了一些为宠物猫定制的服务信息。通过搜索引擎， AR设备收集到了一些很可爱的宠物猫的照片、养猫注意事项等信息。

A或 B以后再使用 AR设备识别上述的那只猫的照片时，由于 AR设备中注册了那只猫的 AR模式，因此可以识别这个目标，并向 AR设备的用户提供 AR内容，如宠物医院提供的服务信息，搜索引擎搜到的信息和、 B对这只猫的评论等等。

本发明实施例提供的实现增强现实应用的方法及设备，收集用户上传的图片及标签信息，以及所述用户的社交网络联系人对所述图片的评论信息；从所述评论信息中提取用于识别图片的关键词；根据所述图片的标签信息和关键词，将所述图片添加到图片集；根据所述图片集内所有图片的图像特征和关键词，实现对无标记物环境中随机对象的增强现实模式与增强现实内容的自动生成。利用所生成的增强现实模式与增强现实内容，能够解决增强现实应用中对无标记物环境中随机对象的识别问题。参见图 8, 本发明实施例提供一种终端，包括接收装置 81、发送装置 82、存储器 83和处理器 84。

除图 8 所示的连接方式之外，在本发明的其它一些实施例中，接收装置 81、发送装置 82、存储器 83和处理器 84还可以通过总线连接。该总线可以是 ISA( Industry Standard Architecture,工业标准体系结构）总线、 PCI( Peripheral Component , 夕卜部设备互连）总线或 EISA ( Extended Industry Standard Architecture, 扩展工业标准体系结构）总线等。所述总线可以是一条或多条物理线路，当是多条物理线路时可以分为地址总线、数据总线、控制总线等。

处理器 84可执行如下步骤：通过该接收装置 81收集用户上传的图片和所述图片的标签信息；根据所述用户在互联网的社交图谱和兴趣图谱，通过该发送装置 82发布所述图片和所述标签信息给所述用户的社交网络联系人，并通过该接收装置 81获得所述社交网络联系人对所述图片的评论信息；从所述评论信息中提取出现频率大于第一门限值的关键词；根据所述图片的标签信息和所述关键词，将所述图片添加到一图片集；根据所述图片集内所有图片的图像特征和所述关键词，生成所述图片所描述对象的增强现实模式和增强现实内容。

处理器 84执行程序的进一步详细技术方案，可以但不限于如图 1〜图 3 所示的实施例的详细描述。

存储器 83用于存储处理器 84需要执行的程序，进一步的，存储器 83还可以存储处理器 84在计算过程中产生的结果。

在本发明实施例中还提供了一种计算机存储介质，该计算机存储介质中存储有计算机程序，该计算机程序可执行如图 1〜图 3所示的实施例中的步骤。需说明的是，以上所描述的装置实施例仅仅是示意性的，其中所述作为部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外，本发明提供的装置实施例附图中，模块之间的连接关系表示它们之间具有通信连接，具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现，当然也可以通过专用硬件包括专用集成电路、专用 CPU、专用存储器、专用元器件等来实现。一般情况下，凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现，而且，用来实现同一功能的具体硬件结构也可以是多种多样的，例如模拟电路、数字电路或专用电路等。但是，对本发明而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在可读取的存储介质中 ,如计算机的软盘， U盘、移动硬盘、只读存储器（ ROM, Read-Only Memory )、随机存取存 4诸器 ( RAM, Random Access Memory )、磁碟或者光盘等，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述的方法。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

权利要求书

1、一种实现增强现实应用的方法，其特征在于，包括：

收集用户上传的图片和所述图片的标签信息；

从所述评论信息中提取出现频率大于第一门限值的关键词；

2、如权利要求 1所述的实现增强现实应用的方法，其特征在于，所述标签信息包括所述图片所描述对象的地理位置信息；

则所述根据所述图片的标签信息和所述关键词，将所述图片添加到一图片集，包括：

根据所述图片所描述对象的地理位置信息，将所述图片添加到图片库中，所述图片库内的图片所描述对象具有相同的地理位置信息，所述图片库内包含有至少一个图片集；

3、如权利要求 1或 2所述的实现增强现实应用的方法，其特征在于，所述根据所述图片集内所有图片的图像特征和所述关键词，生成所述图片所描述对象的增强现实模式和增强现实内容，包括：

4、如权利要求 3所述的实现增强现实应用的方法，其特征在于，在生成图片所描述对象的增强现实模式和增强现实内容之后，还包括：

5、如权利要求 4所述的实现增强现实应用的方法，其特征在于，在所述收集用户上传的图片和所述图片的标签信息的步骤中，所收集的图片是用户上传的被标记为不可识别的图片。

6、一种实现增强现实应用的设备，包括：

图片收集单元，用于收集用户上传的图片和所述图片的标签信息；评论获取单元，用于根据所述用户在互联网的社交图谱和兴趣图谱，发布所述图片和所述标签信息给所述用户的社交网络联系人，获得所述社交网络联系人对所述图片的评论信息；

关键词获取单元，用于从所述评论信息中提取出现频率大于第一门限值的关键词；图片归类单元，用于根据所述图片的标签信息和所述关键词，将所述图片添加到一图片集；和，

7、如权利要求 6所述的实现增强现实应用的设备，其特征在于，所述标签信息包括所述图片所描述对象的地理位置信息；所述图片归类单元包括：

8、如权利要求 6或 7所述的实现增强现实应用的设备，其特征在于，所述增强现实处理单元包括：

9、如权利要求 8所述的实现增强现实应用的设备，其特征在于，所述设备还包括：

请求接收单元，用于接收用户发送的增强现实应用服务请求消息，所述增强现实应用服务请求消息包含待识别的图片和所述图片的标签信息；增强现实模式匹配单元，用于根据所述待识别的图片的图像特征和 /或所述标签信息，从所述可识别模式库中搜索所述待识别的图片所描述对象的增强现实模式；

10、如权利要求 9 所述的实现增强现实应用的设备，其特征在于，所述图片收集单元所收集的图片是用户上传的被标记为不可识别的图片。