CN107818336A

CN107818336A - 一种基于城市特定人群和关联政策的匹配推荐方法及系统

Info

Publication number: CN107818336A
Application number: CN201710934706.9A
Authority: CN
Inventors: 陶卫峰; 王冉; 游庆根; 林宇; 何雯; 孙苑; 华婷婷; 龚少麟; 童号; 陶骏
Original assignee: CETC 28 Research Institute
Current assignee: CETC 28 Research Institute
Priority date: 2017-10-09
Filing date: 2017-10-09
Publication date: 2018-03-20

Abstract

本发明涉及一种基于城市特定人群和关联政策的匹配推荐方法及系统，该方法包括：S1、收集特定人群的基本数据和该人群对特定领域的需求和行为数据，形成特定人群集合；S2、对收集的数据进行预处理，得到人物特征序列；S3、通过基于神经网络的聚类分析对所述特定人群进行挖掘分类，并抽取出各分类人群的需求标签，生成需求标签集合；S4、根据针对所述特定人群所采取的相关政策进行分析，并将所有相关政策分解成多个与需求标签关联的政策模块集合；S5、根据所述特定人群集合、需求标签集合和政策模块集合生成三维空间集合，并基于知识的模糊标签推荐算法，在特定人群集合和政策资源集合的二维中为每个政策资源进行匹配，并推荐给指定用户。

Description

一种基于城市特定人群和关联政策的匹配推荐方法及系统

技术领域

本发明涉及智慧城市技术领域，具体涉及一种基于城市特定人群和关联政策的匹配推荐方法及系统。

背景技术

在绝大多数的发达及发展中国家，人们对民生福祉的关注度都日益提高。一个国家或地区的经济腾飞在释放广泛的发展红利的同时，也往往会带来一系列始料未及的社会与环境难题。提高人民的综合生活福利就成为当地政府的工作重点之一。本专利所关注的特定人群主要包括以下三类人群，一是大规模城市建设所产生的新建安置区的移民和尚未迁出农村的遗留家庭，二是城市流动人口，三是老弱病残人群。随着我国经济的发展和社会的进步，这些特殊群体的权益也越来越受到政府的重视和各项政策法规的保护，不仅在政府的一般工作中体现对这些特定人群的扶助，而且在立法层次上形成了以《宪法》为统领的多层次法律和政策的体系。然而往往出现制定的政策没有真正解决特定人群的主要关注问题或者真正需要帮助的人群没有得到充分帮助。

发明内容

针对现有技术存在的缺陷，本发明提供了一种基于城市特定人群和关联政策的匹配推荐方法及系统，产生一个基于用户，标签，政策的三维空间集合，根据基于知识的模糊标签推荐算法在二维空间里获得每个特定用户的推荐标签集合，然后参照的映射关系，在特定人群和政策资源的二维空间为每个特定用户找到基于需求的政策资源模块匹配集合，推荐给指定用户。

本发明的一个目的是提供了一种基于城市特定人群和关联政策的匹配推荐方法，其特征在于，包括：

S1、收集特定人群的基本数据和该人群对特定领域的需求和行为数据，形成特定人群集合；

S2、对收集的数据进行预处理，得到人物特征序列；

S3、通过基于神经网络的聚类分析对所述特定人群进行挖掘分类，并抽取出各分类人群的需求标签，生成需求标签集合；

S4、根据针对所述特定人群所采取的相关政策进行分析，并将所有相关政策分解成多个与需求标签关联的政策模块集合；

S5、根据所述特定人群集合、需求标签集合和政策模块集合生成三维空间集合，并基于知识的模糊标签推荐算法，在特定人群集合和政策资源集合的二维中为每个政策资源进行匹配，并推荐给指定用户。

其中，所述特定人群的基本数据包括：

所述特定人群的年龄、性别、职业、收入、受教育程度、户籍和/或婚姻状况；

所述特定人群家庭层面的机动车、就业、保险、住房、存款、证券、个体工商户、纳税、公积金。

其中，所述特定人群对特定领域的需求和行为数据的来源包括各委办局的信息系统数据以及针对特定人群的问卷调查数据。

其中，所述步骤S3具体包括：

S31、设所述特定人群的样本数据具有n个样本，从n个数据对象抽取K个对象作为初始聚类簇的中心；

S32、计算剩余的数据对象鱼K个初始簇的均值点的距离，并按照最小距离的标准重新将其余的数据对象划分给与其距离最近的簇；

S33、统计每个产生变化了的聚类簇的均值，更新均值点；

S34、反复执行步骤S31-S33，直到聚类不再发生变化，生成K个子簇；

S35、计算每个子簇的相对互联率；

S36、计算每个子簇的相对近似率；

S37、设定每个子簇的相对互联率的阈值和相对近似率的阈值，将同时满足相对互联率大于阈值且相对近似率大于阈值的子簇进行合并，形成新的子簇；

S38、对每个新的子簇从预先确定的主题进行分类，形成需求标签集合。

其中，所述步骤S4具体包括：

将针对政策文本集合使用一个m×n的矩阵Z替代，如下：

Z＝(Z_ij)m×n

其中，政策文本特征标签由行向量表示，对应的数量大小是m；政策集由列向量表示，对应的数量大小是n；zij表示在第j个政策中第i个特征标签出现的数值；

对上述集合矩阵Z进行SVD处理，获得对应的SVD的U∑V^T矩阵；

通过预先设置的k值，转换U∑V^T矩阵，经过k维空间压缩处理，得到对应的k秩近似集合，即即Ak为政策分解模块集合；

其中，所述步骤S5具体包括：

上述S3、S4步骤生成由特定人群集合U、需求标签集合I和政策模块集合P生成三维空间集合{U，I，P}，并以张量为模型呈现所述三维空间集合{U，I，P}；

使用基于HOSVD方法的张量分解方法实现{U，I，P}3种类型实体之间潜在的语义分析，输出重建的近似张量T；

根据张量T预测用户、物品、标签三者之间的协同关联，T中的元素由一个四元组{U，I，P，r}表示，其中r表示政策P适合需要标签I的用户U的概率。

其中，所述步骤S5具体包括：

S51、基于标签元数据三元组{U，I，P}构造初始张量T0；

S52、应用HOSVD方法将张量T0在3个模式下进行矩阵展开，生成3个矩阵展开式T1、T2、T3；

S53、在矩阵展开式T1、T2、T3上分别进行二维矩阵SVD计算，得到3个对应的左奇异矩阵U1、U2、U3；

S54、根据低秩近似计算过滤掉由较小的奇异值引起的噪声数据，通过得到的左奇异矩阵U1、U 2、U 3，求解其降秩后的维度参数c1、c2、c3，再根据维度参数求解各左奇异矩阵的近似矩阵

S55、根据求解的近似矩阵构造核心张量的近似张量T；核心张量S∈R^I1×I2×I3，是一个与张量T维数相同的张量，具有正交的所有性质，用于协调各正交矩阵U1、U2、U3之间的相互作用；

S56、根据重建的近似张量T中元素的关联权重，向目标政策推荐用户。

本发明又一个方面，提供一种基于城市特定人群和关联政策的匹配推荐系统，其特征在于，包括：

数据收集单元，用于收集特定人群的基本数据和该人群对特定领域的需求和行为数据，形成特定人群集合；

预处理单元，用于对收集的数据进行预处理，得到人物特征序列；

分类单元，用于通过基于神经网络的聚类分析对所述特定人群进行挖掘分类，并抽取出各分类人群的需求标签，生成需求标签集合；

政策模块集合形成单元，用于根据针对所述特定人群所采取的相关政策进行分析，并将所有相关政策分解成多个与需求标签关联的政策模块集合；

推荐单元，用于根据所述特定人群集合、需求标签集合和政策模块集合生成三维空间集合，并基于知识的模糊标签推荐算法，在特定人群集合和政策资源集合的二维中为每个政策资源进行匹配，并推荐给指定用户。

其中，所述特定人群的基本数据包括：

其中，其特征在于，所述特定人群对特定领域的需求和行为数据的来源包括各委办局的信息系统数据以及针对特定人群的问卷调查数据。

其中，所述分类单元，具体包括：

聚类簇中心抽取子单元，用于设所述特定人群的样本数据具有n个样本，从n个数据对象抽取K个对象作为初始聚类簇的中心；

聚类子单元，用于计算剩余的数据对象鱼K个初始簇的均值点的距离，并按照最小距离的标准重新将其余的数据对象划分给与其距离最近的簇；

更新子单元，用于统计每个产生变化了的聚类簇的均值，更新均值点；

子簇生成单元，用于当聚类不再发生变化时，生成K个子簇；

相对互联率计算子单元，用于计算每个子簇的相对互联率；

相对近似率计算子单元，用于计算每个子簇的相对近似率；

新子簇生成子单元，用于设定每个子簇的相对互联率的阈值和相对近似率的阈值，将同时满足相对互联率大于阈值且相对近似率大于阈值的子簇进行合并，形成新的子簇；

需求标签集合生成单元，用于对每个新的子簇从预先确定的主题进行分类，形成需求标签集合。

其中，所述政策模块集合形成单元根据针对所述特定人群所采取的相关政策进行分析，并将所有相关政策分解成多个与需求标签关联的政策模块集合，具体包括：

将针对政策文本集合使用一个m×n的矩阵Z替代，如下：

Z＝(Z_ij)m×n

对上述集合矩阵Z进行SVD处理，获得对应的SVD的U∑V^T矩阵；

其中，所述推荐单元具体包括：

上述分类单元和政策模块集合形成单元生成由特定人群集合U、需求标签集合I和政策模块集合P生成三维空间集合{U，I，P}，并以张量为模型呈现所述三维空间集合{U，I，P}；

其中，所述推荐单元，具体包括：

张量构造子单元，用于基于标签元数据三元组{U，I，P}构造初始张量T0；

矩阵展开子单元，用于应用HOSVD方法将张量T0在3个模式下进行矩阵展开，生成3个矩阵展开式T1、T2、T3；

左奇异矩阵生成子单元，用于在矩阵展开式T1、T2、T3上分别进行二维矩阵SVD计算，得到3个对应的左奇异矩阵U1、U2、U3；

近似矩阵计算子单元，用于根据低秩近似计算过滤掉由较小的奇异值引起的噪声数据，通过得到的左奇异矩阵U1、U2、U3，求解其降秩后的维度参数c1、c2、c3，再根据维度参数求解各左奇异矩阵的近似矩阵

近似张量构造子单元，用于根据求解的近似矩阵构造核心张量的近似张量T；核心张量S∈R^I1×I2×I3，是一个与张量T维数相同的张量，具有正交的所有性质，用于协调各正交矩阵U1、U2、U3之间的相互作用；

推荐子单元，用于根据重建的近似张量T中元素的关联权重，向目标政策推荐用户。

本发明的基于城市特定人群和关联政策的匹配推荐方法及系统，通过产生一个基于用户，标签，政策的三维空间集合，根据基于知识的模糊标签推荐算法在二维空间里获得每个特定用户的推荐标签集合，然后参照的映射关系，在特定人群和政策资源的二维空间为每个特定用户找到基于需求的政策资源模块匹配集合，推荐给指定用户，从而实现准确快速的匹配推荐。

附图说明

图1示出了本发明的基于城市特定人群和关联政策的匹配推荐方法的流程图。

图2示出了本发明的基于城市特定人群和关联政策的匹配推荐系统的结构框图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明，应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

现在将详细参考本发明的实施例，这些实施例的示例在附图中示出。元件的后缀“模块”和“单元”在此用于方便描述，并且因此可以可交换地被使用，而且没有任何可区别的意义或功能。

虽然构成本发明的实施例的所有元件或单元被描述为结合到单个元件中或被操作为单个元件或单元，但是本发明不一定局限于此种实施例。根据实施例，在本发明的目的和范围内所有的元件可以选择性地结合到一个或多个元件并且被操作为一个或多个元件。

本发明的一个实施例中，如图1所示，提供一种基于城市特定人群和关联政策的匹配推荐方法，该方法具体包括：

本实施例中，特定人群的基本数据包括：所述特定人群的年龄、性别、职业、收入、受教育程度、户籍和婚姻状况。以及家族层面机动车、就业、保险、住房、存款、证券、个体工商户、纳税、公积金等多方面的资产信息。所述特定人群对特定领域的需求和行为数据的来源包括各委办局的信息系统数据以及针对特定人群的问卷调查数据。例如，本发明的实施例的方法在对城市贫困群体的需求特征进行分类时，引入贫困度概念，从物质贫困和精神贫困两个层面着手进行度量，物质层面可分为生活资料贫乏(衣、食、住、行)、收入低下等层面，精神层面可分为职业培训、子女教育、就业创业支持，失业保险保障等。贫困测量利用纵贯数据或面板数据对某一个体或家庭的集合进行持续的观察。它可以区分出持续贫困、偶发贫困以及非贫困家庭。分类标准可参考城市低保标准、收入消费标准、资产标准。

S2、对收集的数据进行预处理，得到人物特征序列；

在一个实施例中，步骤S3具体包括：

S31、设所述特定人群的样本数据具有n个样本，从n个数据对象抽取K个对象作为初始聚类簇的中心，S32、计算剩余的数据对象与K个初始簇的均值点的距离，并按照最小距离的标准重新将其余的数据对象划分给与其距离最近的簇；

S33、统计每个产生变化了的聚类簇的均值，更新均值点；

S35、计算每个子簇的相对互联率；

RI(C_i，C_j)＝2|EC(C_i，C_j)|/(|EC(C_i)|+|EC(C_j)|)

其中，EC(C_i，C_j)表示连接簇C_i和C_j的所有边的权重和。C_i和C_j表示把簇C_i划分为两个大致相等部分的最小等分线切断的所有边的权重和；

S36、计算每个子簇的相对近似率；

+(|C_j|×SEC(C_j)/(|C_i|+|C_i|))

其中，SEC(C_i，C_j)表示连接簇C_i和C_j的边的平均权重。SEC(C_i)表示把簇C_i划分为两个大致相等部分的最小等分线切断的所有边的平均权重；

S37、设定每个子簇的相对互联率的阈值TRI和相对近似率的阈值TRC，将同时满足RC＞TRC并且RI＞TRI的子簇进行合并，形成新的子簇；

进一步地，以贫困度量为例，则针对每个子簇从住房，医疗，教育，就业，养老，债务，环境等主题分析确定贫困度指数分为持续极端贫困，持续贫困、偶发贫困以及非贫困家庭(量化为3，2，1，0)。

具体地，步骤S4具体包括：

将针对政策文本集合使用一个m×n的矩阵Z替代，如下：

Z＝(Z_ij)m×n

其中，政策文本特征标签由行向量表示，对应的数量大小是m；政策集由列向量表示，对应的数量大小是n；zij表示在第j个政策中第i个特征标签出现的数值。对上述集合矩阵进行SVD处理，可获得对应的SVD的U∑V^T矩阵，通过选取适当的k值，转换U∑V^T矩阵，经过k维空间压缩处理，最终得到对应的k秩近似集合，即Ak就是政策分解模块集合。针对上述贫困群体案例的政策包括和住房，医疗，教育，就业，养老，债务，环境主题标签相关的提供立法保护，完善最低生活保障制度，扩大社会保障覆盖面，降低社会保险缴费率，建立农民工的医疗保险、户籍转换制度，提供发展性政策支持，包括完善就业政策、教育政策，实施政府开发式扶贫等。

其中，所述步骤S5具体包括：

根据张量T预测用户、物品、标签三者之间的协同关联，T中的元素由一个四元组{U，I，P，r}表示，其中r表示政策P适合需要标签I的用户U的概率(也称关联权重)。因此，用户U是否被推荐给政策P由三元组{U，I，P}之间的关联权重r决定。

进一步的实施例中，步骤S5具体包括：

S51、基于标签元数据三元组{U，I，P}构造初始张量T0；

S52、应用HOSVD方法将张量TO在3个模式下进行矩阵展开，生成3个矩阵展开式T1、T2、T3；

S54、根据低秩近似计算过滤掉由较小的奇异值引起的噪声数据，通过得到的左奇异矩阵U1、U2、U3，求解其降秩后的维度参数c1、c2、c3，再根据维度参数求解各左奇异矩阵的近似矩阵

数据收集单元10，用于收集特定人群的基本数据和该人群对特定领域的需求和行为数据，形成特定人群集合；

预处理单元20，用于对收集的数据进行预处理，得到人物特征序列；

分类单元30，用于通过基于神经网络的聚类分析对所述特定人群进行挖掘分类，并抽取出各分类人群的需求标签，生成需求标签集合；

政策模块集合形成单元40，用于根据针对所述特定人群所采取的相关政策进行分析，并将所有相关政策分解成多个与需求标签关联的政策模块集合；

推荐单元50，用于根据所述特定人群集合、需求标签集合和政策模块集合生成三维空间集合，并基于知识的模糊标签推荐算法，在特定人群集合和政策资源集合的二维中为每个政策资源进行匹配，并推荐给指定用户。

其中，所述特定人群的基本数据包括：

其中，所述分类单元，具体包括：

子簇生成单元，用于当聚类不再发生变化时，生成K个子簇；

相对互联率计算子单元，用于计算每个子簇的相对互联率；

相对近似率计算子单元，用于计算每个子簇的相对近似率；

将针对政策文本集合使用一个m×n的矩阵Z替代，如下：

Z＝(Z_ij)m×n

对上述集合矩阵Z进行SVD处理，获得对应的SVD的U∑V^T矩阵；

其中，所述推荐单元具体包括：

其中，所述推荐单元，具体包括：

应当理解，在本说明书中描述的功能单元或能力可被称为或标示为组件、模块或系统，以便更具体地强调它们的实现独立。例如，组件、模块或系统可被实现为硬件电路，其包括定制超大规模集成(VLSI)电路或门阵列、现成的半导体，诸如逻辑芯片、晶体管，或其他分立组件。组件或模块还可在可编程硬件设备中实现，诸如场可编程门阵列、可编程阵列逻辑、可编程逻辑设备等。组件或模块还可以在用于由各种类型的处理器执行的软件中实现。例如，可执行代码的识别的组件或模块可以包括一个或多个物理或逻辑的计算机指令，其可以，例如，被组织为对象、程序或功能。然而，所识别的组件或模块不必在物理上定位在一起，而是可以包含存储在不同位置的全异指令，其当逻辑上接合在一起时，包含组件或模块并实现对于组件或模块的规定目的。

应该理解由本领域技术人员通过本发明能够实现的效果并不局限于在上文已特别描述的内容，并且本发明的其它优点从上面的详细描述中将更清楚地理解。

对于本领域技术人员，显然可以在不脱离本发明的精神或范围的情况下在本发明中做出各种修改和变型。因此，本发明旨在如果本发明的修改和变型落入附随权利要求和它们的等同形式的范围内，那么本发明覆盖这些修改和变型。

Claims

1.一种基于城市特定人群和关联政策的匹配推荐方法，其特征在于，包括：

S2、对收集的数据进行预处理，得到人物特征序列；

2.根据权利要求1所述方法，其特征在于，所述特定人群的基本数据包括：

3.根据权利要求1所述的方法，其特征在于，所述特定人群对特定领域的需求和行为数据的来源包括各委办局的信息系统数据以及针对特定人群的问卷调查数据。

4.根据权利要求1所述的方法，其特征在于，所述步骤S3具体包括：

S33、统计每个产生变化了的聚类簇的均值，更新均值点；

S35、计算每个子簇的相对互联率；

S36、计算每个子簇的相对近似率；

5.根据权利要求1所述的方法，其特征在于，所述步骤S4具体包括：

将针对政策文本集合使用一个m×n的矩阵Z替代，如下：

Z＝(Z_ij)_m×n

对上述集合矩阵Z进行SVD处理，获得对应的SVD的U∑V^T矩阵；

通过预先设置的k值，转换U∑V^T矩阵，经过k维空间压缩处理，得到对应的k秩近似集合，即即Ak为政策分解模块集合。

6.根据权利要求1所述的方法，其特征在于，所述步骤S5具体包括：

7.根据权利要求1所述的方法，其特征在于，所述步骤S5具体包括：

S51、基于标签元数据三元组{U，I，P}构造初始张量T0；

8.一种基于城市特定人群和关联政策的匹配推荐系统，其特征在于，包括：

9.根据权利要求8所述系统，其特征在于，所述特定人群的基本数据包括：

10.根据权利要求8所述的系统，其特征在于，所述特定人群对特定领域的需求和行为数据的来源包括各委办局的信息系统数据以及针对特定人群的问卷调查数据。

11.根据权利要求8所述的系统，其特征在于，所述分类单元，具体包括：

子簇生成单元，用于当聚类不再发生变化时，生成K个子簇；

相对互联率计算子单元，用于计算每个子簇的相对互联率；

相对近似率计算子单元，用于计算每个子簇的相对近似率；

12.根据权利要求8所述的系统，其特征在于，所述政策模块集合形成单元根据针对所述特定人群所采取的相关政策进行分析，并将所有相关政策分解成多个与需求标签关联的政策模块集合，具体包括：

将针对政策文本集合使用一个m×n的矩阵Z替代，如下：

Z＝(Z_ij)_m×n

对上述集合矩阵Z进行SVD处理，获得对应的SVD的U∑V^T矩阵；

13.根据权利要求8所述的方法，其特征在于，所述推荐单元具体包括：

14.根据权利要求8所述的系统，其特征在于，所述推荐单元，具体包括：