用于处理信息的方法和装置
技术领域
本申请实施例涉及计算机技术领域,具体涉及用于处理信息的方法和装置。
背景技术
随着计算机技术的发展,图像识别技术逐渐成熟。通常,可以利用图像识别技术对空间(例如店铺)中的客户及产品进行跟踪和识别。
现有的方式通常是人工依据经验部署图像采集装置(例如深度摄像头)的位置,利用图像采集装置采集图像,再人工进行图像中的客户和产品的识别。
发明内容
本申请实施例提出了用于处理信息的方法和装置。
第一方面,本申请实施例提供了一种用于处理信息的方法,该方法包括:响应于确定目标空间中存在目标对象,开启安装在目标空间内的图像采集装置以进行图像采集,其中,图像采集装置位于目标空间的位置和姿态是通过仿真预先确定的;提取预置的、图像采集装置的标定参数,基于标定参数和图像采集装置所采集到的图像,确定目标对象的位置;对图像采集装置所采集到的图像进行解析,确定目标对象的手势和手持的物品;将用于分别指示位置、手势和物品的信息进行存储。
在一些实施例中,标定参数包括预置的内参数和预先生成的外参数;以及外参数通过如下步骤生成:建立目标空间的三维模型;基于用于表征三维模型的三维模型数据和内参数,利用仿真工具进行目标空间的仿真、图像采集装置的布置和标志物的布置,生成配置文件,其中,配置文件包括图像采集装置的位置信息和姿态信息、标志物的位置信息和姿态信息;将配置文件输入至标定工具,按照所生成的位置信息和姿态信息在目标空间中摆放图像采集装置和标志物,利用标定工具确定图像采集装置的外参数。
在一些实施例中,图像采集装置的布置和标志物的布置满足以下条件:图像采集装置的图像采集区域覆盖目标空间的目标区域,相邻图像采集装置的图像采集区域中包含重叠区域,相邻图像采集装置的图像采集区域的重叠区域摆放有标志物。
在一些实施例中,提取预置的、图像采集装置的标定参数,基于标定参数和图像采集装置所采集到的图像,确定目标对象的位置,包括:提取预置的、图像采集装置的标定参数;确定目标对象在图像采集装置所采集的图像中的第一位置,并确定目标对象的深度信息;基于内参数、第一位置和深度信息,确定目标对象在相机坐标系下的第二位置;基于外参数和第二位置,确定目标对象在世界坐标系下的位置。
在一些实施例中,该方法还包括:响应于确定目标空间中不存在目标对象,向安装在目标空间内的图像采集装置发送待机指令。
在一些实施例中,该方法还包括:响应于确定目标空间中不存在目标对象,确定图像采集装置的运行时长是否小于预设时长;响应于确定不小于预设时长,重新对目标空间中的图像采集装置进行标定,将图像采集装置的运行时长清零。
第二方面,本申请实施例提供了一种用于处理信息的装置,该装置包括:开启单元,被配置成响应于确定目标空间中存在目标对象,开启安装在目标空间内的图像采集装置以进行图像采集,其中,图像采集装置位于目标空间的位置和姿态是通过仿真预先确定的;定位单元,被配置成提取预置的、图像采集装置的标定参数,基于标定参数和图像采集装置所采集到的图像,确定目标对象的位置;解析单元,被配置成对图像采集装置所采集到的图像进行解析,确定目标对象的手势和手持的物品;存储单元,被配置成将用于分别指示位置、手势和物品的信息进行存储。
在一些实施例中,标定参数包括预置的内参数和预先生成的外参数;以及外参数通过如下步骤生成:建立目标空间的三维模型;基于用于表征三维模型的三维模型数据和内参数,利用仿真工具进行目标空间的仿真、图像采集装置的布置和标志物的布置,生成配置文件,其中,配置文件包括图像采集装置的位置信息和姿态信息、标志物的位置信息和姿态信息;将配置文件输入至标定工具,按照所生成的位置信息和姿态信息在目标空间中摆放图像采集装置和标志物,利用标定工具确定图像采集装置的外参数。
在一些实施例中,图像采集装置的布置和标志物的布置满足以下条件:图像采集装置的图像采集区域覆盖目标空间的目标区域,相邻图像采集装置的图像采集区域中包含重叠区域,相邻图像采集装置的图像采集区域的重叠区域摆放有标志物。
在一些实施例中,定位单元包括:提取模块,被配置成提取预置的、图像采集装置的标定参数;第一确定模块,被配置成确定目标对象在图像采集装置所采集的图像中的第一位置,并确定目标对象的深度信息;第二确定模块,被配置成基于内参数、第一位置和深度信息,确定目标对象在相机坐标系下的第二位置;第三确定模块,被配置成基于外参数和第二位置,确定目标对象在世界坐标系下的位置。
在一些实施例中,该装置还包括:发送单元,被配置成响应于确定目标空间中不存在目标对象,向安装在目标空间内的图像采集装置发送待机指令。
在一些实施例中,该装置还包括:确定单元,被配置成响应于确定目标空间中不存在目标对象,确定图像采集装置的运行时长是否小于预设时长;标定单元,被配置成响应于确定不小于预设时长,重新对目标空间中的图像采集装置进行标定,将图像采集装置的运行时长清零。
第三方面,本申请实施例提供了一种服务器,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如用于处理信息的方法中任一实施例的方法。
第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如用于处理信息的方法中任一实施例的方法。
本申请实施例提供的用于处理信息的方法和装置,响应于确定目标空间中存在目标对象,开启安装在该目标空间内的图像采集装置以进行图像采集,而后,基于预置的、该图像采集装置的标定参数和该图像采集装置所采集到的图像,确定该目标对象的位置,之后对该图像采集装置所采集到的图像进行解析,确定该目标对象的手势和手持的物品,最后将用于分别指示该位置、该手势和该物品的信息进行存储。由于该图像采集装置位于目标空间的位置是和姿态通过仿真预先确定的,因而可以精确掌握图像采集装置的数量和布置的位置,避免人工依据经验部署图像采集装置导致出现视觉盲区。此外,对目标对象的位置、手势和手持的物品的观测和信息存储等处理不需要人工进行,提高了信息处理的灵活性。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性系统架构图;
图2是根据本申请的用于处理信息的方法的一个实施例的流程图;
图3是根据本申请的用于处理信息的方法的一个应用场景的示意图;
图4是根据本申请的用于处理信息的方法的又一个实施例的流程图;
图5是根据本申请的用于处理信息的装置的一个实施例的结构示意图;
图6是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的用于处理信息的方法或用于处理信息的装置的示例性系统架构100。
如图1所示,系统架构100可以包括图像采集装置101、102、103,网络104和服务器105。网络104用以在图像采集装置101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
图像采集装置101、102、103可以通过网络104与服务器105交互,以接收指令或发送消息等。图像采集装置101、102、103可以包括摄像头和深度摄像头。
服务器105可以是提供各种服务的服务器,例如对图像采集装置101、102、103所发送的信息进行解析等处理的后台服务器。后台服务器可以利用图像采集装置101、102、103进行监控,确定目标空间是否存在目标对象,以及确定目标对象的位置、手势和手持的物品等信息,还可以将所确定的位置、手势和手持的物品等信息进行存储。
需要说明的是,服务器可以是硬件,也可以是软件。当服务器为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
需要说明的是,本申请实施例所提供的用于处理信息的方法一般由服务器105执行,相应地,用于处理信息的装置一般设置于服务器105中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的用于处理信息的方法的一个实施例的流程200。该用于处理信息的方法,包括以下步骤:
步骤201,响应于确定目标空间中存在目标对象,开启安装在目标空间内的图像采集装置以进行图像采集。
在本实施例中,用于处理信息的方法的执行主体(例如图1所示的服务器105)可以对目标空间中的目标对象的数量进行监控。响应于确定目标空间中存在目标对象,可以开启安装在上述目标空间内的图像采集装置以进行图像采集。其中,上述目标空间可以是预先指定的任意三维空间,例如商店室内空间等。上述目标对象可以是人。上述图像采集装置可以是用于采集图像的一个或多个电子设备,例如摄像头、深度摄像头等。
需要说明的是,上述执行主体可以利用各种方式确定目标空间中的目标对象的数量。作为示例,目标空间的入口处和出口处均可以安装有用于检测目标对象的传感器(例如红外线传感器),且该传感器与上述执行主体通信连接。上述执行主体可以通过该传感器对目标空间中的目标对象的个数进行监控。当目标空间的入口处的传感器检测到目标对象进入目标空间后,上述执行主体可以将上述目标对象的个数加1。当目标空间的出口处的传感器检测到目标对象离开目标空间后,上述执行主体可以将上述目标对象的个数减1。从而,当目标对象的个数为0时,则可以确定目标空间中不存在目标对象。当目标对象的个数不为0时,则可以确定目标空间中存在目标对象。
需要指出的是,上述图像采集装置位于上述目标空间的位置和姿态可以是通过仿真预先确定的。实践中,可以首先对目标空间的各个尺寸(例如长、宽、高)和目标空间中所摆放的物品(例如货架)的尺寸和摆放角度进行测量,得到测量数据。而后,可以利用三维建模工具(例如autoCAD、3D Studio Max等),按照上述测量数据进行目标空间的建模。之后,可以利用仿真工具(例如Unity3D),在所建立的目标空间三维模型中进行图像采集装置的搭建和仿真,从而通过在目标空间三维模型中调整图像采集装置的位置、角度等,确定出合适的位置和姿态,从而得到图像采集装置位于目标空间的位置和姿态,并按照该位置和姿态在目标空间中进行图像采集装置的布置和摆放。由此,通过进行目标空间、图像采集装置的仿真,从而确定图像采集装置的数量、位置和姿态,可以提高图像采集装置布置的灵活性和准确性,降低了实施难度。同时,避免依据人工经验进行图像采集装置的布置导致的容易出现盲区的问题。并且,通常依据人工经验进行图像采集装置的布置,会导致使用过多地图像采集装置,造成资源浪费,在大场景下无法保证传输的实时性和图像采集装置的布置的高利用率。而通过进行目标空间、图像采集装置的仿真,从而确定图像采集装置的数量、位置和姿态,可避免此问题。
步骤202,提取预置的、图像采集装置的标定参数,基于标定参数和图像采集装置所采集到的图像,确定目标对象的位置。
在本实施例中,对于每一个图像采集装置,上述执行主体可以首先提取预置的、该图像采集装置的标定参数。其中,上述标定参数可以包括但不限于视场角、距离极限、内参数、外参数等。上述内参数可以用于表征图像采集装置的相机坐标系中的坐标到像素坐标系中的坐标的对应关系。上述内参数可以包括焦距、主点坐标(即图像的中心像素坐标和图像原点像素坐标之间相差的横向像素数和纵向像素数)等参数。上述外参数可以用于表征图像采集装置的相机坐标系中的坐标与世界坐标系中的坐标的对应关系。上述外参数可以包括旋转矩阵和平移矩阵等。
在本实施例中,对于每一个图像采集装置,在提取该图像采集装置的标定参数之后,上述执行主体可以首先确定该图像采集装置所采集到的图像中的目标对象的位置(可以用坐标表示)。此处,可以将该图像采集装置所采集到的图像输入至预先训练的人体识别模型,得到用于表征目标对象在图像中的位置的位置信息。上述人体识别模型可以是利用训练样本和机器学习方法,对现有的卷积神经网络结构(例如DenseBox、VGGNet、ResNet、SegNet等)进行有监督训练后所得到的。其中,上述训练样本可以包括大量的包含人体对象的图像,且每一张图像带用于表征人体对象在该图像中的位置的位置标注(例如坐标)和人体对象的身份标注。需要说明的是,机器学习方法是目前广泛研究和应用的公知技术,在此不再赘述。而后,由于内参数可以用于表征图像采集装置的相机坐标系中的坐标到像素坐标系中的坐标的对应关系,因此,上述执行主体可以通过上述内参数和图像中的目标对象的坐标,确定出目标对象在图像采集装置的相机坐标系中的坐标。之后,由于外参数可以用于表征图像采集装置的相机坐标系中的坐标与世界坐标系中的坐标的对应关系,因此,上述执行主体可以通过上述外参数和目标对象在相机坐标系中的坐标,确定出目标对象在世界坐标系中的位置。从而,可以确定出目标对象在目标空间中的位置。此处,可以生成用于指示目标对象在目标空间中的位置的信息(例如,可以用坐标表示)。此处,通过内参数和外参数进行坐标变换,是是目前广泛研究和应用的公知技术,在此不再赘述。
在一种场景中,每一个图像采集装置的标定参数可以预先存储于该图像采集装置的寄存器中,并且图像采集装置可提供接口以便调取。此时,上述执行主体可以从各个图像采集装置调取各个图像采集装置的标定参数。
在另一种场景中,每一个图像采集装置的标定参数可以记录于配置文件中。此时,上述执行主体可以直接从配置文件中读取各个图像采集装置的标定参数。
在本实施例的一些可选的实现方式中,上述标定参数可以是图像采集装置出厂前所标定得到的。
在本实施例的一些可选的实现方式中,上述标定参数中的内参数可以是图像采集装置出厂前所标定得到的。上述标定参数中的外参数可以是技术人员对图像采集装置进行标定后得到的。具体地,技术人员在建立目标空间的三维模型后,在利用仿真工具在所建立的目标空间三维模型中进行图像采集装置的搭建和仿真的同时,也可以进行标志物(例如圆球体)的搭建和仿真。而后在目标空间中进行标志物的布置和摆放。之后,可以利用各种现有的相机标定方法或者标定工具(例如OpenCV标定工具箱),利用该标志物对上述图像采集装置进行标定,得到外参数。需要说明的是,相机标定方法是目前广泛研究和应用的公知技术,在此不再赘述。
步骤203,对图像采集装置所采集到的图像进行解析,确定目标对象的手势和手持的物品。
在本实施例中,上述执行主体可以利用预先训练的手势识别模型和物品识别模型,对上述图像采集装置所采集到的图像进行解析,确定上述目标对象的手势和手持的物品。具体地,可以按照如下步骤执行:
第一步,对于每一个图像采集装置所采集的图像,可以将该图像输入至预先训练的手势识别模型,得到用于指示该图像中的目标对象的手势的信息(可以包括手势类别和手部位置)。其中,上述手势识别模型可以用于识别图像中的目标对象的手势类别和手部位置。其中,上述手势类别可以包括持物品手势、未持物品手势。手部位置可以用坐标表示。上述手势识别模型可以是利用训练样本和机器学习方法,对现有的卷积神经网络结构(例如DenseBox、VGGNet、ResNet、SegNet等)进行有监督训练后所得到的。其中,上述训练样本可以包括大量的包含目标对象的图像,且每一张图像带用于表征目标对象的手势类别的标注和手部位置的标注(例如坐标值)。需要说明的是,机器学习方法是目前广泛研究和应用的公知技术,在此不再赘述。
第二步,确定所得到的手势的信息中所包含的手势类别所指示的手势是否为持物品手势。若是,则将该图像中的、持物品手势对应的手部位置的预设区域(例如以手部位置的坐标为中心的预设长宽的矩形区域)进行截取。
第三步,将所截取的图像区域输入至预先训练的物品识别模型,得到用于指示该图像区域中的物品的信息。其中,上述物品识别模型可以用于识别图像中的物品。上述物品识别模型可以是利用训练样本和机器学习方法,对现有的卷积神经网络结构(例如DenseBox、VGGNet、ResNet、SegNet等)进行有监督训练后所得到的。其中,上述训练样本可以包括大量的图像。每一张图像可以呈现有手持物品的手部和该物品。并且,每一张图像带用于指示该图像中的物品的标注。需要说明的是,机器学习方法是目前广泛研究和应用的公知技术,在此不再赘述。
需要说明的是,在第二步中,响应于确定所得到的手势的信息中所包含的手势类别所指示的手势为未持物品手势,可以直接将用于指示目标对象在目标空间中的位置的信息和用于指示目标对象的手势的信息进行存储,不再执行步骤204。此处,还可以存储有图像采集时间。随着图像采集装置不断进行图像采集,当执行主体解析出不同于所存储的内容时(例如目标对象的位置发生变化且目标对象的移动距离大于预设距离,或者手势发生改变),可以再次对所更新的内容进行存储,并记录相应的图像采集时间。
需要指出的是,若某一个目标对象被多个图像采集装置在同一时间采集到,则可以对同一时间所采集到的各个图像的解析结果进行融合。具体地,可以将基于各个图像所确定的目标对象的位置取平均,将该平均值作为目标对象的位置。另外,可以从对各个图像的解析结果(包括目标对象的手势和手持的物品)中,确定最多的相同解析结果,将最多的相同解析结果所指示的手势和手持的物品分别确定为目标对象的手势和手持的物品。
步骤204,将用于分别指示上述位置、上述手势和上述物品的信息进行存储。
在本实施例中,上述执行主体可以将用于分别指示上述位置、上述手势和上述物品的信息进行存储。实践中,可以为每一个目标对象分配一个标识,以区分和指示该目标对象。对于每一个目标对象,上述执行主体可以建立该目标对象的标识与该目标对象的关联信息的映射(例如键值对形式的映射),并存储该映射。其中,上述关联关系可以包括用于指示该目标对象的位置的信息、用于指示该目标对象的手势的信息,用于指示该目标对象手持的物品的信息。需要说明的是,在图像采集装置持续拍摄过程中,每一个目标对象通常会移动到多个位置,
此处,上述执行主体还可以存储有图像采集时间。随着图像采集装置不断进行图像采集,当执行主体解析出不同于所存储的内容时(例如目标对象的位置发生变化且目标对象的移动距离大于预设距离,或者手势发生改变),可以再次对所更新的内容进行存储,并记录相应的图像采集时间。需要说明的是,上述执行主体可以进行目标对象的识别,以区分同一时间不同图像采集装置所拍摄到的不同目标对象。
通过存储每一个目标对象的关联信息,可以确定每一个目标空间中的目标对象的活动状态和活动顺序,不仅可以为分析目标对象的兴趣点、热销物品等信息提供支持,还可以有效监控目标对象的行为和动作。同时,对目标对象的位置、手势和手持的物品的观测和信息存储等处理不需要人工进行,提高了信息处理的灵活性。
继续参见图3,图3是根据本实施例的用于处理信息的方法的应用场景的一个示意图。在图3的应用场景中,安装在商店的摄像头301与后台服务器302通信连接。后台服务器302响应于确定商店中存在顾客,开启摄像头301以进行图像采集。其中,上述图像采集装置位于上述目标空间的位置和姿态是通过仿真预先确定的。而后,后台服务器302从摄像投301的寄存器中提取标定参数303,并获取摄像投301采集到的图像304,基于标定参数303和图像304确定顾客的位置。之后,后台服务器302对图像304进行解析,确定顾客的手势和手持的物品。最后,后台服务器302将用于分别指示上述位置、上述手势和上述物品的信息进行存储。
本申请的上述实施例提供的方法,响应于确定目标空间中存在目标对象,开启安装在该目标空间内的图像采集装置以进行图像采集,而后,基于预置的、该图像采集装置的标定参数和该图像采集装置所采集到的图像,确定该目标对象的位置,之后对该图像采集装置所采集到的图像进行解析,确定该目标对象的手势和手持的物品,最后将用于分别指示该位置、该手势和该物品的信息进行存储。由于该图像采集装置位于目标空间的位置是和姿态通过仿真预先确定的,因而可以精确掌握图像采集装置的数量和布置的位置,避免人工依据经验部署图像采集装置导致出现视觉盲区。此外,对目标对象的位置、手势和手持的物品的观测和信息存储等处理不需要人工进行,提高了信息处理的灵活性。
进一步参考图4,其示出了用于处理信息的方法的又一个实施例的流程400。该用于处理信息的方法的流程400,包括以下步骤:
步骤401,响应于确定目标空间中存在目标对象,开启安装在目标空间内的图像采集装置以进行图像采集。
在本实施例中,用于处理信息的方法的执行主体(例如图1所示的服务器105)可以对目标空间中的目标对象的数量进行监控。响应于确定目标空间中存在目标对象,可以开启安装在上述目标空间内的图像采集装置以进行图像采集。其中,上述目标空间可以是预先指定的任意三维空间,例如商店室内空间等。上述目标对象可以是人。上述图像采集装置可以包括摄像头、深度摄像头等。
需要指出的是,上述图像采集装置位于上述目标空间的位置和姿态可以是通过仿真预先确定的。实践中,可以按照如下步骤进行操作:
第一步,对目标空间的各个尺寸和目标空间中所摆放的物品(例如货架)的尺寸和摆放角度进行测量,得到测量数据。
第二步,利用三维建模工具(例如autoCAD、3D Studio Max等),按照上述测量数据进行目标空间的建模,得到三维模型数据(例如obj格式的三维模型文件)。需要说明的是,所建立的目标空间中,可以包含所测量的物品(例如货架)的模型。
第三步,将上述三维模型数据(例如obj格式的三维模型文件)和记录有图像采集装置的内参数的内参数文件导入仿真工具(例如Unity3D)中。此处,内参数可以是图像采集装置出厂前通过标定得到,为已知参数。上述内参数可以用于表征图像采集装置的相机坐标系中的坐标到像素坐标系中的坐标的对应关系。上述内参数可以包括焦距、主点坐标(相对于成像平面)、视场角、距离极限等参数。
第四步,利用上述仿真工具,在所建立的目标空间三维模型中进行图像采集装置的搭建和仿真。在搭建过程中,可以按照图像采集装置的内参数以及场景的特点来搭建图像采集装置。具体地,可以基于内参数,进行图像采集装置视场建模,模拟图像采集装置的覆盖区域。实践中,通常可以将图像采集装置布置在目标空间的顶部。当目标空间为长方体时,可以布置在目标空间顶部的斜对角。在仿真过程中,可以通过观察在目标空间三维模型中的各个图像采集装置到的覆盖区域,从而调整图像采集装置的位置、角度等,以便确定出合适的位置和姿态。进而,可以得到图像采集装置位于目标空间的位置和姿态,并按照该位置和姿态在目标空间中进行图像采集装置的布置和摆放。需要说明的是,图像采集装置的布置的需要满足以下条件:图像采集装置的图像采集区域覆盖上述目标空间的目标区域(可以是预先划定的区域,例如两米以下的区域),相邻图像采集装置的图像采集区域中包含重叠区域。
需要说明的是,在利用仿真工具在所建立的目标空间三维模型中进行图像采集装置的搭建和仿真的同时,也可以进行标志物(例如圆球体)的搭建和仿真。而后在目标空间中进行标志物的布置和摆放。此时,图像采集装置的布置和标志物的布置需要满足以下条件:图像采集装置的图像采集区域覆盖上述目标空间的目标区域,相邻图像采集装置的图像采集区域中包含重叠区域,相邻图像采集装置的图像采集区域的重叠区域摆放有标志物。
需要指出的是,在所建立的目标空间三维模型中进行图像采集装置和标志物的搭建和仿真后,可以利用上述仿真工具生成配置文件(例如xml格式)。其中,上述配置文件可以包括图像采集装置的位置信息和姿态信息、标志物的位置信息和姿态信息等信息。
由此,通过进行目标空间、图像采集装置和标志物等的仿真,从而确定图像采集装置的数量、位置和姿态,可以提高图像采集装置布置的灵活性和准确性,降低了实施难度。同时,避免依据人工经验进行图像采集装置的布置导致的容易出现盲区的问题。并且,通常依据人工经验进行图像采集装置的布置,会导致使用过多地图像采集装置,造成资源浪费,在大场景下无法保证传输的实时性和图像采集装置的布置的高利用率。而通过进行目标空间、图像采集装置和标志物的仿真,从而确定图像采集装置的数量、位置和姿态,可避免此问题。
在本实施例的一些可选的实现方式中,响应于确定上述目标空间中不存在目标对象,上述执行主体可以向安装在上述目标空间内的图像采集装置发送待机指令。这样可以避免图像采集装置长时间工作导致温度过高、失灵或者浪费计算资源等问题,可以保持图像采集装置的使用稳定性。
步骤402,提取预置的、图像采集装置的标定参数。
在本实施例中,对于每一个图像采集装置,上述执行主体可以首先提取预置的、该图像采集装置的标定参数。其中,标定参数可以包括预置的内参数和预先生成的外参数。上述内参数可以用于表征图像采集装置的相机坐标系中的坐标到像素坐标系中的坐标的对应关系。上述内参数可以包括焦距(此处用f表示)、主点坐标(即图像的中心像素坐标和图像原点像素坐标之间相差的横向像素数和纵向像素数,此处用(cu,cv)表示)等参数。上述外参数可以用于表征图像采集装置的相机坐标系中的坐标与世界坐标系中的坐标的对应关系。上述外参数可以包括旋转矩阵(此处用R表示,通常R为3*3的矩阵)和平移矩阵(此处用T表示,T为1*3的矩阵)等。
需要说明的是,上述外参数可以是在对图像采集装置和标志物进行搭建和仿真之后,通过对图像采集装置进行标定后生成。具体执行过程可以参见如下步骤:
第一步,建立上述目标空间的三维模型。此步骤可参见上述确定图像采集装置位于上述目标空间的位置和姿态的第一步和第二步,此处不再赘述。
第二步,基于用于表征上述三维模型的三维模型数据和上述内参数,利用仿真工具进行上述目标空间的仿真、图像采集装置的布置和标志物的布置,生成配置文件。其中,上述配置文件可以包括图像采集装置的位置信息和姿态信息、标志物的位置信息和姿态信息。此步骤可参见上述确定图像采集装置位于上述目标空间的位置和姿态的第三步和第四步,此处不再赘述。
第三步,将上述配置文件输入至标定工具(例如OpenCV标定工具箱),按照所生成的位置信息和姿态信息在上述目标空间中摆放图像采集装置和标志物,利用上述标定工具确定上述图像采集装置的外参数。此处,可以将所得到的外参数存储至上述配置文件中,并写入图像采集装置的寄存器中进行保存。需要说明的是,相机标定方法是目前广泛研究和应用的公知技术,在此不再赘述。
在本实施例的一些可选的实现方式中,响应于确定上述目标空间中不存在目标对象,上述执行主体可以确定上述图像采集装置的运行时长是否小于预设时长。响应于确定不小于上述预设时长,可以重新对上述目标空间中的图像采集装置进行标定,将上述图像采集装置的运行时长清零。此处,在初次进行标定后,图像采集装置在长时间使用过程中,可能会发生位置变化,则标定的参数就有可能会失效。所以在使用过程中,在目标空间不存在目标对象且达到预设时长,重新进行标定,可以提高数据处理的准确性。
步骤403,确定目标对象在图像采集装置所采集的图像中的第一位置,并确定目标对象的深度信息。
在本实施例中,对于每一个图像采集装置,在提取该图像采集装置的标定参数之后,上述执行主体可以首先确定该图像采集装置所采集到的图像中的目标对象的第一位置(目标对象在图像坐标系中的位置,以坐标P0(X0,Y0)表示)。其中,X0和Y0分别为图像坐标系中的横坐标值和纵坐标值。此处,可以将该图像采集装置所采集到的图像输入至预先训练的人体识别模型,得到用于表征目标对象在图像中的位置的位置信息和识别结果。上述人体识别模型可以用于进行人体对象的识别,以及检测图像中的人体对象的位置。此处,由于图像采集装置可以包括深度摄像头,因而,可以直接从其所采集到的数据中得到目标对象的深度信息(用Z0表示)。此处,上述深度信息可以是图像采集装置到目标对象的距离。
步骤404,基于内参数、第一位置和深度信息,确定目标对象在相机坐标系下的第二位置。
在本实施例中,由于内参数可以用于表征图像采集装置的相机坐标系中的坐标到像素坐标系中的坐标的对应关系,因此,上述执行主体可以通过上述内参数和目标对象的第一位置,确定出目标对象在图像采集装置的相机坐标系中的第二位置(目标对象在相机坐标系中的位置,可以用坐标表示)。具体可以按照如下算式确定第二位置(以坐标PR(XR,YR,ZR)表示,XR,YR,ZR分别表示该位置在相机坐标系的X轴、Y轴、Z轴坐标值):
步骤405,基于外参数和第二位置,确定目标对象在世界坐标系下的位置。
在本实施例中,由于外参数可以用于表征图像采集装置的相机坐标系中的坐标与世界坐标系中的坐标的对应关系,因此,上述执行主体可以通过上述外参数和第二位置,确定出目标对象在世界坐标系下的位置(以坐标Pw(Xw,Yw,Zw)表示,Xw,Yw,Zw分别表示该位置在世界坐标系中的X轴、Y轴、Z轴坐标值)。具体可以按照如下算式确定该位置:
此处,R[0][0]、R[0][1]、R[0][2]分别可以表示旋转矩阵R的第1行第1列的值、第1行第2列的值、第1行第3列的值。R[1][0]、R[1][1]、R[1][2]分别可以表示旋转矩阵R的第2行第1列的值、第2行第2列的值、第2行第3列的值。R[2][0]、R[2][1]、R[2][2]分别可以表示旋转矩阵R的第3行第1列的值、第3行第2列的值、第3行第3列的值。T[0]、T[1]、T[2]分别可以表示平移矩阵T的第1列的值、第2列的值、第3列的值。
步骤406,对图像采集装置所采集到的图像进行解析,确定目标对象的手势和手持的物品。
在本实施例中,上述执行主体可以利用预先训练的手势识别模型和物品识别模型,对上述图像采集装置所采集到的图像进行解析,确定上述目标对象的手势和手持的物品。具体地,可以按照如下步骤执行:第一步,对于每一个图像采集装置所采集的图像,可以将该图像输入至预先训练的手势识别模型,得到用于指示该图像中的目标对象的手势的信息(可以包括手势类别和手部位置)。其中,上述手势识别模型可以用于识别图像中的目标对象的手势类别和手部位置。其中,上述手势类别可以包括持物品手势、未持物品手势。手部位置可以用坐标表示。第二步,确定所得到的手势的信息所包含的手势类别所指示的手势是否为持物品手势。若是,则将该图像中的、持物品手势对应的手部位置的预设区域(例如以手部位置的坐标为中心的预设长宽的矩形区域)进行截取。第三步,将所截取的图像区域输入至预先训练的物品识别模型,得到用于指示该图像区域中的物品的信息。其中,上述物品识别模型可以用于识别图像中的物品。
需要说明的是,在第二步中,响应于确定所得到的手势的信息所包含的手势类别所指示的手势为未持物品手势,则可以直接将用于指示目标对象在目标空间中的位置的信息和用于指示目标对象的手势的信息进行存储,不再执行步骤407。此处,还可以存储有图像采集时间。随着图像采集装置不断进行图像采集,当执行主体解析出不同于所存储的内容时(例如目标对象的位置发生变化且目标对象的移动距离大于预设距离,或者手势发生改变),可以再次对所更新的内容进行存储,并记录相应的图像采集时间。
步骤407,将用于分别指示上述位置、上述手势和上述物品的信息进行存储。
在本实施例中,上述执行主体可以将用于分别指示上述位置、上述手势和上述物品的信息进行存储。实践中,可以为每一个目标对象分配一个标识,以区分和指示该目标对象。对于每一个目标对象,上述执行主体可以建立该目标对象的标识与该目标对象的关联信息的映射,并存储该映射。其中,上述关联关系可以包括用于指示该目标对象的位置的信息、用于指示该目标对象的手势的信息,用于指示该目标对象手持的物品的信息。
此处,上述执行主体还可以存储有图像采集时间。随着图像采集装置不断进行图像采集,当执行主体解析出不同于所存储的内容时(例如目标对象的位置发生变化且目标对象的移动距离大于预设距离,或者手势发生改变),可以再次对所更新的内容进行存储,并记录相应的图像采集时间。需要说明的是,上述执行主体可以进行目标对象的识别,以区分同一时间不同图像采集装置所拍摄到的不同目标对象。此处,对目标对象的识别可以利用上述人体识别模型进行。
通过存储每一个目标对象的关联信息,可以确定每一个目标空间中的目标对象的活动状态和活动顺序,不仅可以为分析目标对象的兴趣点、热销物品等信息提供支持,还可以有效监控目标对象的行为和动作。同时,对目标对象的位置、手势和手持的物品的观测和信息存储等处理不需要人工进行,提高了信息处理的灵活性。
从图4中可以看出,与图2对应的实施例相比,本实施例中的用于处理信息的方法的流程400突出了对标定参数汇中的外参数的获取步骤,以及在确定上述目标空间中不存在目标对象后,向图像采集装置发送待机指令或者使图像采集装置重新进行标定的步骤。由此,本实施例描述的方案自动对图像采集装置标定,可以提高数据处理的准确性,同时,进一步提高了信息处理的灵活性。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供了一种用于处理信息的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例所述的用于处理信息的装置500包括:开启单元501,被配置成响应于确定目标空间中存在目标对象,开启安装在上述目标空间内的图像采集装置以进行图像采集,其中,上述图像采集装置位于上述目标空间的位置和姿态是通过仿真预先确定的;定位单元502,被配置成提取预置的、上述图像采集装置的标定参数,基于上述标定参数和上述图像采集装置所采集到的图像,确定上述目标对象的位置;解析单元503,被配置成对上述图像采集装置所采集到的图像进行解析,确定上述目标对象的手势和手持的物品;存储单元504,被配置成将用于分别指示上述位置、上述手势和上述物品的信息进行存储。
在本实施例的一些可选的实现方式中,上述标定参数可以包括预置的内参数和预先生成的外参数。上述外参数可以通过如下步骤生成:建立上述目标空间的三维模型;基于用于表征上述三维模型的三维模型数据和上述内参数,利用仿真工具进行上述目标空间的仿真、图像采集装置的布置和标志物的布置,生成配置文件,其中,上述配置文件包括图像采集装置的位置信息和姿态信息、标志物的位置信息和姿态信息;将上述配置文件输入至标定工具,按照所生成的位置信息和姿态信息在上述目标空间中摆放图像采集装置和标志物,利用上述标定工具确定上述图像采集装置的外参数。
在本实施例的一些可选的实现方式中,图像采集装置的布置和标志物的布置满足以下条件:图像采集装置的图像采集区域覆盖上述目标空间的目标区域,相邻图像采集装置的图像采集区域中包含重叠区域,相邻图像采集装置的图像采集区域的重叠区域摆放有标志物。
在本实施例的一些可选的实现方式中,上述定位单元502可以包括提取模块、第一确定模块、第二确定模块和第三确定模块(图中未示出)。其中,上述提取模块可以被配置成提取预置的、上述图像采集装置的标定参数。上述第一确定模块可以被配置成确定上述目标对象在上述图像采集装置所采集的图像中的第一位置,并确定上述目标对象的深度信息。上述第二确定模块可以被配置成基于上述内参数、上述第一位置和上述深度信息,确定上述目标对象在相机坐标系下的第二位置。上述第三确定模块可以被配置成基于上述外参数和上述第二位置,确定上述目标对象在世界坐标系下的位置。
在本实施例的一些可选的实现方式中,该装置还可以包括发送单元(图中未示出)。其中,上述发送单元可以被配置成响应于确定上述目标空间中不存在目标对象,向安装在上述目标空间内的图像采集装置发送待机指令。
在本实施例的一些可选的实现方式中,该装置还包括确定单元和标定单元(图中未示出)。其中,上述确定单元可以被配置成响应于确定上述目标空间中不存在目标对象,确定上述图像采集装置的运行时长是否小于预设时长。上述标定单元可以被配置成响应于确定不小于上述预设时长,重新对上述目标空间中的图像采集装置进行标定,将上述图像采集装置的运行时长清零。
本申请的上述实施例提供的装置,开启单元501响应于确定目标空间中存在目标对象,开启安装在该目标空间内的图像采集装置以进行图像采集,而后,定位单元502基于预置的、该图像采集装置的标定参数和该图像采集装置所采集到的图像,确定该目标对象的位置,之后解析单元503对该图像采集装置所采集到的图像进行解析,确定该目标对象的手势和手持的物品,最后存储单元504将用于分别指示该位置、该手势和该物品的信息进行存储。由于该图像采集装置位于目标空间的位置是和姿态通过仿真预先确定的,因而可以精确掌握图像采集装置的数量和布置的位置,避免人工依据经验部署图像采集装置导致出现视觉盲区。此外,对目标对象的位置、手势和手持的物品的观测和信息存储等处理不需要人工进行,提高了信息处理的灵活性。
下面参考图6,其示出了适于用来实现本申请实施例的服务器的计算机系统600的结构示意图。图6示出的服务器仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括开启单元、定位单元、解析单元和存储单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,接收单元还可以被描述为“开启安装在目标空间内的图像采集装置的单元”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的装置中所包含的;也可以是单独存在,而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该装置执行时,使得该装置:响应于确定目标空间中存在目标对象,开启安装在该目标空间内的图像采集装置以进行图像采集;提取预置的、该图像采集装置的标定参数,基于该标定参数和该图像采集装置所采集到的图像,确定该目标对象的位置;对该图像采集装置所采集到的图像进行解析,确定该目标对象的手势和手持的物品;将用于分别指示该位置、该手势和该物品的信息进行存储。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。