CN110991955A

CN110991955A - 一种基于信息矩的组群数量多样性估计方法

Info

Publication number: CN110991955A
Application number: CN201911185649.4A
Authority: CN
Inventors: 赵菊敏; 李灯熬; 吕晓宇
Original assignee: Taiyuan University of Technology
Current assignee: Taiyuan University of Technology
Priority date: 2019-11-27
Filing date: 2019-11-27
Publication date: 2020-04-10
Anticipated expiration: 2039-11-27
Also published as: CN110991955B

Abstract

本发明一种基于信息矩的组群数量多样性估计方法，属于物联网数据分析技术领域，结合递归采样过程对采样过程进行更加合理的优化，利用种群信息矩，能够极大的反应大组群内部多样性等特性，对于组群决策，观察组群特性具有重要作用：具体包括递归采样和常用组识别，所述递归采样是将采样过程分层，得出采样概率；扫描每层被采样的组，根据哈希函数给出由其时隙组成的字节位图，采样之后进行基于阈值的常用组识别，在一个ALOHA时隙中识别常用组和非常用组，通过计算得出所有标签的矩估计即所有标签的数量特征。

Description

一种基于信息矩的组群数量多样性估计方法

技术领域

本发明属于物联网数据分析技术领域，具体涉及一种基于信息矩的组群数量多样性估计方法，可用于大规模集散中心对于物品种类的管理。

背景技术

随着物联网技术的发展，RFID技术已被广泛用于仓库管理，传统的管理系统基于产品数量的统计和产品种类的统计，但是单纯的产品数量并不能体现出这个种群的特征；对于产品种类计种类大小的估计需要阅读器某个组进行数量统计后再断电激活下一个组的标签进行种类大小估计，当种类特别多的时候就会造成极大的时间损耗；如果对特定组进行采样对于少数的组如果数量巨大且在采样中无论是否被采样对于采样结果的影响都很大，造成对群体估计的不准确，此外，单纯的组群数量不能很好的反映整体样本的特征，因此，设计一种合理的组群数量估计方法和反应组群数字特征的算法显得极为重要。

发明内容

本发明克服了现有技术的不足，提出一种基于信息矩的组群数量多样性估计方法，结合递归采样过程对采样过程进行更加合理的优化，利用种群信息矩，能够极大的反应大组群内部多样性等特性，对于组群决策，观察组群特性具有重要作用。

为了达到上述目的，本发明是通过如下技术方案实现的。

一种基于信息矩的组群数量多样性估计方法，具体包括以下步骤：

a)采样分层：将采样过程分为i层，假设第0层采样概率为1即所有组都能被采样到，第一层采样概率为p，第二层的采样概率为p2以此类推，下一层为上一层的子集；对于第j层，概率为pj。

b)信息矩估计：扫描每层被采样的组，识别采样层的组是常用组还是非常用组，并根据哈希函数给出由其时隙组成的字节位图，然后使用编码信息对其组群大小，组群数目，组群矩进行估计，根据采样定理从低层到高层估计其g矩。

c)常用组识别：采样之后进行基于阈值的常用组识别，在一个ALOHA时隙中识别常用组和非常用组：对于一个组中的所有标签在共享时隙中的索引为

这些时隙中的字节转化为组id的逻辑位图LB(g_id).将上述过程进行w轮，B_i为第i次收集的位图，LB_i为第i次收集的逻辑位图；估计总数：

zⁱ是shared bitmap中的非0个数。

逻辑位图对于一个组的标签数量的估计：

常用组的个数为：

α是阈值，α根据实际情况取0-1中的一个值，用以区分常用组和非常用组。

设H_j为第j层的常用组，F_j为被采样的组的矩

H_j＝{i|i∈S_j∩g(n_i)≥αF_j}

n_i为每个组的标签个数，g为矩的算法。

假设第j+1层F_j+1已经知道，则对第j层的F_j估计为：

矩估计为：

当j层的矩估计算出以后，根据采样规则，就能通过计算得出第一层的所有标签的矩估计即所有标签的数量特征。

进一步的，对组的逻辑位图移除噪声，移除噪声后标签数目估计为：

本发明相对于现有技术所产生的有益效果为。

本发明结合递归采样过程对采样过程进行更加合理的优化，利用种群信息矩，能够极大的反应大组群内部多样性等特性，对于组群决策，观察组群特性具有重要作用。

附图说明

图1为递归采样原理图。

图2为ALOHA时隙标签位图。

具体实施方式

为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白，结合实施例和附图，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。下面结合实施例及附图详细说明本发明的技术方案，但保护范围不被此限制。

如图1所示，是递归采样过程。将采样过程分为i层，假设第0层采样概率为1即所有组都能被采样到，第一层采样概率为p，第二层的采样概率为p2以此类推，下一层为上一层的子集。对于第j层，概率为pj。这样的话，在底层组群数量足够小的基础上就可以对其进行基础的样本大小进行估计。

矩估计协议：

矩估计协议由两部分组成，首先扫描所有每层被采样的组，然后识别采样层的组是常用组还是非常用组，并根据哈希函数给出由其时隙组成的字节位图,然后使用编码信息对其组群大小，组群数目，组群矩进行估计，然后根据采样定理从低层到高层估计其g矩。

假设有l+1层，他们的采样可能性如上所述，RFID阅读器广播一个SELECT命令让每个标签调用一个布尔散列函数p_j(g_id)，它将其组ID分别以概率p和1-p映射到1/0。当j层以上的每个层都1时标签组将会被采样。

采样之后进行基于阈值的常用组识别，使用常用组识别在一个ALOHA时隙中识别常用组和非常用组。常用组识别过程如下：

阅读器广播query命令启动一个被所有组共用的(shared bitmap)ALOHA时隙，时隙数f，逻辑时隙数s，随机数种子r。对于任意一组g_id中的一个标签i_id，当它收到query命令之后，标签计算

将所有标签的所有组转换到一个ALOHA时隙中，这个时隙叫做位图B。

对于一个组中的所有标签在共享时隙中的索引为

这些时隙中的字节转化为组id的逻辑位图LB(g_id).将上述过程进行w轮，B_i为第i次收集的位图，LB_i为第i次收集的逻辑位图。由下图可知对于常用组由于组的数量较大，它的逻辑位图中1的比例明显多于0，在非常用组中1与0的比例明显小得多，用这种方法实现常用组的识别。阅读器根据1和0的个数进行数量的估计，(如图2所示)：

估计总数:

zⁱ是shared bitmap中的非0个数

逻辑位图对于一个组的标签数量的估计：

由上图可知一个组的逻辑位图不是只属于该组，可能有其他的组，这种现象称为噪声，如果f和s足够大，则认为其噪声分布近似于高斯噪声，移除噪声后标签数目估计为：

最后计算得出常用组的个数为：

设H_j为第j层的常用组，F_j为被采样的组的矩

H_j＝{i|i∈S_j∩g(n_i)≥αF_j}

n_i为每个组的标签个数，g为矩的算法。

假设第j+1层F_j+1已经知道，则对第j层的F_j估计为：

矩估计为：

当j层的矩估计算出以后，根据采样规则，就能通过计算得出第一层的(所有标签)的矩估计即所有标签的数量特征，有助于对所有标签的多样性观察和标签决策。

以上内容是结合具体的优选实施方式对本发明所做的进一步详细说明，不能认定本发明的具体实施方式仅限于此，对于本发明所属技术领域的普通技术人员来说，在不脱离本发明的前提下，还可以做出若干简单的推演或替换，都应当视为属于本发明由所提交的权利要求书确定专利保护范围。