CN115495665A - 地表覆盖更新众包任务推荐方法 - Google Patents

地表覆盖更新众包任务推荐方法 Download PDF

Info

Publication number
CN115495665A
CN115495665A CN202211432498.XA CN202211432498A CN115495665A CN 115495665 A CN115495665 A CN 115495665A CN 202211432498 A CN202211432498 A CN 202211432498A CN 115495665 A CN115495665 A CN 115495665A
Authority
CN
China
Prior art keywords
task
user
area
surface coverage
crowdsourcing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211432498.XA
Other languages
English (en)
Other versions
CN115495665B (zh
Inventor
周晓光
陈倩岚
侯东阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN202211432498.XA priority Critical patent/CN115495665B/zh
Publication of CN115495665A publication Critical patent/CN115495665A/zh
Application granted granted Critical
Publication of CN115495665B publication Critical patent/CN115495665B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及地表覆盖更新众包任务推荐方法,包括如下步骤:A)获取需要收集地表覆盖数据的空间区域,对其进行地表覆盖众包任务划分形成网格空间,得到待推荐的众包任务区;B)设计基于多元用户画像的初始任务推荐方法,对众包任务区构建顾及用户活跃度的时空偏好模型和顾及地表覆盖类型的隐语义偏好模型,得到时空偏好分数和隐语义偏好分数,以融合得到用户的综合兴趣分数,并据此产生任务推荐列表;C)基于顾及多源数据不一致性的任务重排序方法计算各个众包任务区的不一致性系数,以对任务推荐列表中的任务进行降序排序获得最终推荐列表。本发明的地表覆盖更新众包任务推荐方法能够将地表覆盖类型难以区分的区域优先推荐给用户进行标报。

Description

地表覆盖更新众包任务推荐方法
技术领域
本发明涉及信息推荐方法,具体地,涉及一种地表覆盖更新众包任务推荐方法。
背景技术
地表覆盖及其变化是可持续发展监测、环境变化研究、土地资源管理等研究领域中不可或缺的重要基础信息,全球规模的地表覆盖更新正面临着样本获取难度大、机器智能更新有遗漏、效率低、成本高等瓶颈问题,而众包模式则可以利用全球志愿者协作的理念在人类知识引导下交互收集辅助更新的信息,但随着海量众包任务和用户间交互行为的大量涌现,用户的贡献积极性却难以保证,研究发现只有5%的用户以高效的方式积极为开放地图平台贡献数据,严重制约了众包模式实施的效率。
高效的任务推荐方法是提高众包模式实施的效率的途径之一,众包模式主要利用基于用户画像的方法实现个性化的任务推送,以帮助用户快速地找到感兴趣的任务,继而吸引其贡献更多高质量的数据。
在现有技术中,不同地表覆盖类型的标绘难易程度不同,导致不同地表覆盖类型对用户的吸引程度不同,因此,仅考虑时空偏好未考虑地表覆盖类型偏好的用户画像推荐方法并不能直接适用于地表覆盖众包任务的推荐,此外,受限于分类方法有偏、验证样本不足、地表覆盖类型复杂等因素,当前的地表覆盖数据生成方法的精度仍相对较低,而现有的任务推送方式难以保证能够将地表覆盖类型难以准确区分的区域(难分区域)充分收集到众包数据,并将难分区域优先推荐给用户进行标报。
有鉴于此,需要设计一种地表覆盖更新众包任务推荐方法。
发明内容
本发明所要解决的技术问题是提供一种地表覆盖更新众包任务推荐方法。
为了解决上述技术问题,本发明提供一种地表覆盖更新众包任务推荐方法,包括如下步骤:
A)获取需要收集地表覆盖数据的空间区域,对所述空间区域进行地表覆盖众包任务划分,形成网格空间,以将所述网格空间作为待推荐的众包任务区;
B)设计基于用户多元兴趣画像的偏好模型,对所述众包任务区构建顾及用户活跃度的时空偏好模型以及顾及地表覆盖类型的隐语义偏好模型,以得到用户对所述众包任务区的时空偏好分数以及隐语义偏好分数,并基于所述时空偏好分数以及隐语义偏好分数融合得到用户的综合兴趣分数,并基于所述用户的综合兴趣分数产生任务推荐列表;
C)基于顾及多源数据不一致性的任务重排序方法计算各个所述众包任务区的不一致性系数,以基于所述不一致性系数对所述任务推荐列表中的任务进行排序获得最终推荐列表。
具体地,所述地表覆盖众包任务划分的步骤包括:利用网格划分,将所述空间区域等分成包括多个网格单元的所述网格空间,每个所述网格单元代表一个待推荐的地表覆盖众包任务区。
进一步地,所述用户多元画像的模型的构建步骤包括计算时空兴趣偏好、贡献活跃度和覆盖类型偏好。
进一步地,所述时空兴趣偏好的计算过程包括:
B11)基于用户的历史贡献信息,对于用户u采用三角核函数
Figure 212039DEST_PATH_IMAGE001
构建待推荐 任务区i和已标报任务区j之间的地理相似度:
Figure 633793DEST_PATH_IMAGE002
其中,d(i, j)为所述待推荐任务区i的质心和所述已标报任务区j的质心之间的球面距离;d为所述三角核函数的宽度参数,I为指示函数,表示当所述待推荐任务区i和所述已标报任务区j之间的距离超过d时,地理相似度为0;当所述待推荐任务区i和所述已标报任务区j之间的距离小于d时,距离越近,地理相似度越大;
B12)利用非线性逐步遗忘函数
Figure 570842DEST_PATH_IMAGE004
度量用户对所述待推荐任务区i的兴趣随时 间动态下降的程度:
Figure 9913DEST_PATH_IMAGE005
其中,θ为遗忘率;
Figure 286174DEST_PATH_IMAGE006
为所述已标报任务区j的最后时间戳,
Figure 519709DEST_PATH_IMAGE007
为用户最早标报的 时间戳,
Figure 881420DEST_PATH_IMAGE008
为用户最后标报的时间戳;
B13)基于内容协同过滤方法量化用户u对所述待推荐任务区i的时空偏好:
Figure 858604DEST_PATH_IMAGE009
其中,
Figure 254950DEST_PATH_IMAGE010
为用户u贡献过数据的所述众包任务区的集合,
Figure 659387DEST_PATH_IMAGE011
为用户u贡献过数据 的所述众包任务区的数量。
进一步地,所述贡献活跃度的计算步骤包括:
B21)统计用户u在各个所述众包任务区的标注频数
Figure 508394DEST_PATH_IMAGE012
,采用MIN-MAX方法归一化用 户对所述已标报任务区j的贡献活跃度
Figure 23689DEST_PATH_IMAGE013
Figure 274542DEST_PATH_IMAGE014
其中,
Figure 849879DEST_PATH_IMAGE015
为统计结果的最大值,
Figure 186183DEST_PATH_IMAGE016
为统计结果的最小值;
B22)基于所述时空兴趣偏好,结合贡献频率,以得到顾及用户贡献活跃度差异的 所述时空偏好分数
Figure 505169DEST_PATH_IMAGE017
Figure 610528DEST_PATH_IMAGE018
其中α为用户活跃频率影响权重因子。
进一步地,所述覆盖类型偏好的计算步骤包括:
B31)统计用户u对覆盖类型c的贡献次数占贡献总数的比率
Figure 356767DEST_PATH_IMAGE019
,如果用户u对某一 覆盖类型c贡献为零,则赋值
Figure 914787DEST_PATH_IMAGE019
为0,根据
Figure 37464DEST_PATH_IMAGE019
填充得到用户类型矩阵
Figure 997330DEST_PATH_IMAGE020
并对所述用 户类型矩阵
Figure 914470DEST_PATH_IMAGE020
进行矩阵分解:
Figure 225366DEST_PATH_IMAGE021
其中,
Figure 886154DEST_PATH_IMAGE022
为用户总数量,
Figure 700527DEST_PATH_IMAGE023
为地物类型的数量,
Figure 54148DEST_PATH_IMAGE024
为用户特征矩阵,
Figure 586760DEST_PATH_IMAGE025
为类型特征矩阵,f为隐特征维数;
B32)根据现有的地表覆盖数据反映的地球表面地物类型的分类情况,将覆盖类型 一一映射到相应的所述众包任务区,并提取每一类所述覆盖类型c在对应的所述众包任务 区的面积占比
Figure 51239DEST_PATH_IMAGE026
,若所述众包任务区未包含相应的覆盖类型c,则所述众包任务区对该覆 盖类型c的面积占比
Figure 720118DEST_PATH_IMAGE026
为0,以得到任务区类型特征矩阵D,并结合类型特征矩阵
Figure 244640DEST_PATH_IMAGE025
以 得到目标矩阵T
Figure 264549DEST_PATH_IMAGE027
需要注意的是,
Figure 267140DEST_PATH_IMAGE028
中的T是矩阵转置的符号;
B33)通过所述用户特征矩阵
Figure 56105DEST_PATH_IMAGE024
和所述目标矩阵T,解算出用户u对所述待推 荐任务区i的所述隐语义偏好分数
Figure 751528DEST_PATH_IMAGE029
Figure 993154DEST_PATH_IMAGE030
进一步地,所述任务推荐列表的获取步骤包括:
B41)计算综合兴趣分数
Figure 799436DEST_PATH_IMAGE031
Figure 708486DEST_PATH_IMAGE032
B42)基于所述综合兴趣分数
Figure 43652DEST_PATH_IMAGE031
的值,对所述待推荐任务区i进行降序排序, 并选取前k个所述待推荐任务区i作为所述任务推荐列表。
进一步地,所述不一致性系数的计算步骤包括:
C1)获取地表覆盖参考数据;
C2)将各所述地表覆盖参考数据基于设定的转换方法转化为设定标准下的标准地表覆盖数据;
C3)根据分类准确像元数在总像元数中的比例,获取不一致性系数。
进一步地,所述不一致性系数
Figure 862372DEST_PATH_IMAGE033
的计算步骤包括:
Figure 206765DEST_PATH_IMAGE034
其中
Figure 970322DEST_PATH_IMAGE035
为所述分类准确像元数,Num为所述总像元数,n为不同地表覆盖类型种类 数目。
进一步地,所述任务推荐列表中的所述待推荐任务区i基于所述不一致性系数
Figure 741969DEST_PATH_IMAGE033
进行降序排序以得到所述最终推荐列表。
通过上述技术方案,在本发明所提供的地表覆盖更新众包任务推荐方法,其先对需要收集地表覆盖数据的空间区域进行地表覆盖众包任务划分,形成网格空间,以将网格空间作为待推荐的众包任务区,随后设计基于多元用户画像的初始任务推荐方法,对众包任务区构建顾及用户活跃度的时空偏好模型以及顾及地表覆盖类型的隐语义偏好模型,以分别得到用户对所述众包任务区的时空偏好分数以及隐语义偏好分数,从而能够基于时空偏好分数以及隐语义偏好分数融合得到用户的综合兴趣分数,并基于用户的综合兴趣分数产生任务推荐列表,从而能够保证使得向用户推荐的是用户感兴趣的任务内容,此外,还能够继续基于顾及多源数据不一致性的任务重排序方法计算各个众包任务区的不一致性系数,以基于不一致性系数,在基于用户的综合兴趣分数产生任务推荐列表的基础上对该任务推荐列表中的任务继续进行降序排序,获得最终推荐列表,使得最终推荐列表中排名靠前的推荐任务的不一致性系数更高,也即是地表覆盖类型不易识别的任务区域,继而使得能够将难分区域优先推荐给用户进行标报,从而能够提升地表覆盖数据更新的效率。
有关本发明的其它优点以及优选实施方式的技术效果,将在下文的具体实施方式中进一步说明。
附图说明
图1是本发明地表覆盖更新众包任务推荐方法的步骤图;
图2是本发明地表覆盖更新众包任务推荐方法的流程图;
图3是本发明地表覆盖更新众包任务推荐方法中地表覆盖类型参考数据的转化示意图。
具体实施方式
以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
如图1所示,作为本发明所提供的地表覆盖更新众包任务推荐方法的一种实施例,该方法包括如下步骤:
A)获取需要收集地表覆盖数据的空间区域,对该空间区域进行地表覆盖众包任务划分,形成网格空间,以将网格空间作为待推荐的众包任务区;
B)设计基于多元用户画像的初始任务推荐方法,对众包任务区构建顾及用户活跃度的时空偏好模型以及顾及地表覆盖类型的隐语义偏好模型,以分别得到用户对众包任务区的时空偏好分数以及隐语义偏好分数,并基于时空偏好分数以及隐语义偏好分数得到用户的综合兴趣分数,从而基于用户的综合兴趣分数产生任务推荐列表;
C)基于顾及多源数据不一致性的任务重排序方法计算各个众包任务区的不一致性系数,以基于不一致性系数对所述任务推荐列表中的任务进行降序排序获得最终推荐列表。
具体地,所述地表覆盖众包任务划分的步骤包括:利用网格划分,将所述空间区域等分成包括多个网格单元的所述网格空间,每个所述网格单元代表一个待推荐的地表覆盖众包任务区。
进一步地,基于用户多元兴趣画像的偏好模型的构建步骤包括计算时空兴趣偏好、贡献活跃度和覆盖类型偏好。
具体地,根据地理学第一定律(距离越近,越相关)和时间遗忘性规律,用户倾向于在贡献过数据的地区周围继续贡献数据,并且对近期贡献地区的兴趣更强烈,根据以上思想,需要先得出用户的时空兴趣偏好,时空兴趣偏好的计算过程包括:
B11)获取用户的历史贡献信息,基于用户的历史贡献信息,对于用户u采用三角核 函数
Figure 223766DEST_PATH_IMAGE001
构建待推荐任务区i和已标报任务区j之间的地理相似度:
Figure 371850DEST_PATH_IMAGE002
其中,d(i, j)为待推荐任务区i的质心和已标报任务区j的质心之间的球面距离;d为三角核函数的宽度参数,I为指示函数,表示当待推荐任务区i和已标报任务区j之间的距离超过d时,地理相似度为0;当待推荐任务区i和已标报任务区j之间的距离小于d时,距离越近,地理相似度越大;
B12)利用非线性逐步遗忘函数
Figure 989914DEST_PATH_IMAGE004
度量用户对待推荐任务区i的兴趣随时间动 态下降的程度:
Figure 198041DEST_PATH_IMAGE005
其中,θ为遗忘率;
Figure 901555DEST_PATH_IMAGE006
为已标报任务区j的最后时间戳,
Figure 60321DEST_PATH_IMAGE007
为用户最早标报的时间 戳,
Figure 173770DEST_PATH_IMAGE008
为用户最后标报的时间戳。
B13)基于内容协同过滤方法量化用户u对待推荐任务区i的时空偏好:
Figure 364580DEST_PATH_IMAGE009
其中,
Figure 854467DEST_PATH_IMAGE010
为用户u贡献过数据的众包任务区的集合,
Figure 447123DEST_PATH_IMAGE011
为用户u贡献过数据的众 包任务区的数量。
进一步地,用户在不同地区的贡献活跃度差异,反映了用户的兴趣差异,当用户的贡献次数越多,表明用户在相应地区贡献行为越活跃,用户可能更熟悉或更偏爱这些地区,如果优先向用户推荐这些区域,将有效提高推荐成功率,因此,需要计算出用户在相应地区的贡献活跃度,贡献活跃度的计算步骤包括:
B21)统计用户u在各个众包任务区的标注频数
Figure 997053DEST_PATH_IMAGE012
,采用MIN-MAX方法归一化用户对 已标报任务区
Figure 675159DEST_PATH_IMAGE037
的贡献活跃度
Figure 703158DEST_PATH_IMAGE013
Figure 150320DEST_PATH_IMAGE014
其中,
Figure 871151DEST_PATH_IMAGE015
为统计结果的最大值,
Figure 36553DEST_PATH_IMAGE016
为统计结果的最小值;
B22)基于时空兴趣偏好,结合贡献频率作为加权频率,以得到顾及用户贡献活跃 度差异的所述时空偏好分数
Figure 868243DEST_PATH_IMAGE017
Figure 169911DEST_PATH_IMAGE018
其中α为用户活跃频率影响权重因子。
结合贡献活跃度的时空兴趣偏好的推荐,能够向用户推送熟悉地区的任务,提高推荐的准确性,从而能够提高用户贡献众包数据的积极性,进而使得地表覆盖数据的更新更加高效。
进一步地,由于用户对于大部分任务的贡献记录为零,使得用户任务矩阵十分稀疏庞大,导致预测效果不佳,且目前位置推荐领域少有关于类型特征的研究,但类型特征的差异会在众包的应用场景下影响用户的贡献行为,例如,OpenStreetMap(公开地图平台)的贡献者在绘制不同对象时有类型优先级,用户之间对同一种覆盖类型的贡献比例相差甚远,显示出用户的类型偏好差异明显的特点,因此,需要计算用户的覆盖类型偏好,覆盖类型偏好的计算步骤包括:
B31)统计用户u的对类型c的贡献次数占用户u贡献总数的比率
Figure 61644DEST_PATH_IMAGE019
,如果对某一类 型c贡献次数为零,则赋值
Figure 714342DEST_PATH_IMAGE019
为0,根据
Figure 349723DEST_PATH_IMAGE019
填充得到用户类型矩阵
Figure 771477DEST_PATH_IMAGE020
并对用户类型 矩阵
Figure 99690DEST_PATH_IMAGE020
进行矩阵分解:
Figure 974105DEST_PATH_IMAGE021
其中,
Figure 678756DEST_PATH_IMAGE022
为用户总数量,
Figure 955016DEST_PATH_IMAGE023
为地表覆盖类型的种类数目,
Figure 188552DEST_PATH_IMAGE024
为用户特征矩 阵,
Figure 550263DEST_PATH_IMAGE025
为类型特征矩阵,f为隐特征维数;
B32)根据现有地表覆盖数据所反映的地貌类型的分类情况,将覆盖类型一一映射 到相应的众包任务区,并提取每一类覆盖类型c在对应的众包任务区的面积占比
Figure 261867DEST_PATH_IMAGE026
,若众 包任务区未包含相应的覆盖类型c,则众包任务区内该覆盖类型c的面积占比
Figure 658213DEST_PATH_IMAGE026
为0,以得 到任务区类型特征矩阵D,并结合类型特征矩阵
Figure 62650DEST_PATH_IMAGE025
以得到目标矩阵T
Figure 911657DEST_PATH_IMAGE027
需要注意的是,
Figure 426952DEST_PATH_IMAGE028
中的T是矩阵转置的符号;
B33)通过用户特征矩阵
Figure 677805DEST_PATH_IMAGE024
和所述目标矩阵T,解算出用户u对待推荐任务区i 的隐语义偏好分数
Figure 253142DEST_PATH_IMAGE029
Figure 323867DEST_PATH_IMAGE030
从用户特征矩阵出发,能够有效缓解原始的用户任务矩阵的稀疏性,能够提升推荐质量,并且在一定程度上能够反映出用户对不同覆盖类型的兴趣差异。
进一步地,乘法公式被广泛应用于多因素的融合,并显现出高鲁棒性。因此,可将 计算得到的顾及用户贡献活跃度差异的所述时空偏好分数
Figure 642853DEST_PATH_IMAGE017
和用户对待推荐任 务区的隐语义偏好分数
Figure 748212DEST_PATH_IMAGE029
进行乘法融合,综合度量用户对任务的兴趣分数,即计 算综合兴趣
Figure 494451DEST_PATH_IMAGE031
Figure 52471DEST_PATH_IMAGE032
随后,基于综合兴趣分数
Figure 175148DEST_PATH_IMAGE031
的值,对待推荐任务区
Figure 135014DEST_PATH_IMAGE038
进行降序排序,并选取 前k个待推荐任务区作为任务推荐列表,以使得推荐方法能够全面考虑到用户的时空偏好、 贡献频率以及覆盖类型偏好,为用户推荐熟悉且感兴趣的地区的众包任务。
进一步地,由于地表覆盖更新众包模式的目标之一是利用人的先验知识和经验,通过用户标绘、判别、上传各种自动更新方法难以区分的类型信息,实际上,在上述用户画像推荐方法中用户的贡献兴趣和任务的流行程度相互影响,容易陷入推荐系统“长尾效应”。这将导致难分区域的数据贡献率严重不足,进而无法达到众包模式与机器智能更新方法互补的目的,因此,需要提升推荐系统对难分区域任务的发掘能力,以提高难分区域的推荐排名,对此,可通过计算不一致性系数,以不一致性系数作为判断该待推荐任务区是否为难分区域的标准,具体地,如图3所示,不一致性系数的计算步骤包括:
C1)获取地表覆盖参考数据;
C2)将各地表覆盖参考数据基于设定的转换方法转化为设定标准下的标准地表覆盖数据;
C3)根据分类准确像元数在总像元数中的比例,获取不一致性系数。
具体地,地表覆盖参考数据可以包括:清华大学团队研制的全球30米分辨率的地表覆盖产品FROM_GLC30、空天院研制的全球30米分辨率的地表覆盖产品GLC_FCS30,清华大学团队研制的全球10米分辨率的地表覆盖制图产品FROM_GLC10、欧空局研制的10米分辨率的地表覆盖产品ESA和ESRI公司研制的10米分辨率地表覆盖产品ESRI2020等,若是面向GlobeLand30(全球30米地表覆盖)2020年的数据更新目标,由于GlobeLand30的数据与参考数据的分类体系不一致,因此需要将上述的FROM_GLC30、GLC_FCS30、FROM_GLC10、ESA和ESRI2020的数据转换到GlobeLand30的分类标准上,具体可以按照表1所示的转换规则进行转换:
表1
Figure 52154DEST_PATH_IMAGE039
其中,针对FROM_GLC10等10米分辨率产品与GlobeLand30分辨率不同的问题,采用 跨尺度匹配的方法,将10米粗分数据按照众数法重采样至30米,即基于3×3窗口中出现频 次最高的类型来确定重采样后像素的类型。若Globeland30和FROM_GLC10等10米数据重采 样后分类完全一致,则认为Globeland30上该像元的分类准确,否则不准确,在规定的任务 区内,空间不一致性系数
Figure 363050DEST_PATH_IMAGE040
的计算步骤包括:
Figure 23838DEST_PATH_IMAGE041
其中
Figure 838211DEST_PATH_IMAGE035
为分类准确像元数,Num为总像元数,n为不同地表覆盖类型种类数目,此处n=10。
最后,对任务推荐列表中的推荐任务区i基于不一致性系数
Figure 191831DEST_PATH_IMAGE040
进行降序,以得到最 终推荐列表,得到的最终推荐列表能够在保证用户感兴趣的前提下,使得类型难分的任务 区排在列表前列,从而通过提高用户选择此类任务的机率来保证难分区域的众包数据覆盖 率,以便于数据进行全面而高效的更新。
由于当前地表覆盖更新的众包平台尚未全面铺开应用,使得真实的众包用户标报数据较少,所以可以利用OpenStreetMap(公开地图平台)的真实用户及其历史标注数据模拟构建地表覆盖更新众包任务推荐评测数据集。
在评测数据集中,OpenStreetMap(公开地图平台)用户的对不同地理事物的真实标注信息会根据类型映射规则转换为地表覆盖类型,且会根据其空间范围映射到众包任务区。该数据集主要以尼泊尔中部发展区为研究区,该区域地形多样、地势悬殊、气候形态差异大、地表覆盖类型复杂,容易形成难分区域。最终,在用户信息、标注信息和时间信息齐全的前提下,该评测数据集一共包括837名用户、1118个任务区和143079个标注目标,其时间跨度为2007年11月至2022年2月。在实验过程中,评测数据集根据用户标注时间戳以8:2的比例划分为训练集和测试集,即对每个用户的标注目标记录按照标注时间戳进行排序,取出每个用户标注时间最新的20%的标注目标,统计以上标注目标所在的任务区后,将相应任务区加入到该用户测试集,汇总所有用户的测试集得到最终测试集。
在推荐任务时,当推荐列表中的任务区为用户在测试集实际标注过的任务区,则表示该任务被正确推荐。推荐效果的评价指标采用精确率,召回率和F1来综合评价推荐质量,其中,精确率Precison@K是指为用户推荐的任务区列表中,被正确推荐的任务区所占的比例;召回率Recall@K是指在测试集的任务区列表中,被正确推荐的任务所占的比例。F1是精确率和召回率的调和平均值。3个指标具体公式如下:
Figure 458865DEST_PATH_IMAGE042
Figure 657765DEST_PATH_IMAGE043
Figure 592223DEST_PATH_IMAGE044
其中,
Figure 116745DEST_PATH_IMAGE045
为前K个待推荐任务区的集合,
Figure 871074DEST_PATH_IMAGE046
为用户测试集中实际标注过的 任务区域的集合。
对于难分区域任务的判定,本发明以区域总体不一致性系数作为划分标准,当某 个任务区的不一致性系数高于设定的标准,则认为其分布大量覆盖分类不准确的区域,属 于难分区域,需要被优先推荐。根据不一致性系数对任务推荐列表进行重排能够提升推荐 对难分区域任务的发掘能力,因此,可使用难分区域的推荐覆盖率作为推荐结果的评测指 标。在评测数据集中,研究区的总体不一致性为0.569,一共有586个难分区域。因此,评测数 据集中的难分任务集合
Figure 139245DEST_PATH_IMAGE047
大小为586。假设,用户集合为U,给每个用户u推荐的任务 列表中属于难分区域的任务集合
Figure 928209DEST_PATH_IMAGE048
,则覆盖率定义如下:
Figure 358054DEST_PATH_IMAGE049
覆盖率直观地反映了经过每次推荐后,难分区域任务出现在推荐列表中的概率,推荐概率越大,越易收集到用户对难分区域贡献的众包数据。
为了对本发明的推荐方法的性能进行评估,本文选取了以下三种基线方法:仅考虑时空偏好、仅考虑引入贡献活跃度的时空偏好、仅考虑类型偏好。
为保证本发明的推荐方法的性能,将三角核函数的宽度参数
Figure 865258DEST_PATH_IMAGE050
取10,时间遗忘率θ 取0.7,用户活跃频率影响权重因子α取0.5,此时效果最好。在利用矩阵分解计算隐语义分 数时,隐特征维数f取5,此时分解的均方根误差RMSE指标最小。
实验的推荐效果对比如表2所示,表2中结果以%为单位。在推荐列表长度K为5、10、15和20下,基于多元用户画像的推荐方法在精确率、召回率和F1均优于只考虑单方面兴趣的推荐,当K=5时,推荐效果的提升最明显。随着K的增大,精确率逐渐下降,但召回率逐渐上升,综合指标F1在K=10时取得最大,此时,初始推荐效果最佳。上述实验结果表明,顾及地表覆盖类型的多元用户兴趣推荐模型优于仅考虑时空偏好、贡献活跃度和类型偏好的推荐方法,在一定程度上能够提高用户的贡献积极性。
表2
Figure 671540DEST_PATH_IMAGE051
此外,上述实验结果表明,当K增加到20,综合兴趣推荐方法对比基础方法提升效果有限,但这并不影响推荐方法的适用性,因为在实际推荐中,用户一般也仅仅关注排在推荐列表前几名的任务。
在保证提高用户对推荐任务接收率的前提下,将重排序范围也划定在前20个任 务,根据任务的空间不一致性系数
Figure 315011DEST_PATH_IMAGE052
,进行降序重排,再按照不同的步长进行推荐,重排序 实验结果如表3所示,表3结果以%为单位:
表3
Figure 181336DEST_PATH_IMAGE053
由表3可知,随着列表长度的增加,能够推荐给用户的难分任务在全部难分任务的覆盖率占比逐渐提高。其中,在前5个推荐任务中,难分区域的覆盖率较初始排序提高了6.48%,在前10个推荐任务中,难分区域的覆盖率提高了8.02%。由于覆盖率正向反映了众包平台推荐难分任务的能力,并且重排序是在顾及多元用户偏好的基础上进行的,并不会大幅影响用户对任务的接收率。因此,该实验结果表明顾及多源数据不一致性的重排序策略在提高用户贡献积极性的基础上,进一步提升了对亟需更新的难分地区的推荐能力。
通过上述技术方案,在本发明所提供的地表覆盖更新众包任务推荐方法,其先对需要收集地表覆盖数据的空间区域进行地表覆盖众包任务划分,形成网格空间,以将网格空间作为待推荐的众包任务区,随后设计基于多元用户画像的初始任务推荐方法,对众包任务区构建顾及用户活跃度的时空偏好模型以及顾及地表覆盖类型的隐语义偏好模型,以分别得到用户对众包任务区的时空偏好分数以及隐语义偏好分数,从而能够基于时空偏好分数以及隐语义偏好分数融合得到用户的综合兴趣分数,并基于用户的综合兴趣分数产生任务推荐列表,从而能够保证向用户推荐的是用户感兴趣的任务地区,此外,还能够继续基于顾及多源数据不一致性的任务重排序方法计算各个众包任务区的不一致性系数,以基于不一致性系数,在基于用户的综合兴趣分数产生任务推荐列表的基础上对该任务推荐列表中的任务继续进行降序排序,获得最终推荐列表,使得最终推荐列表中排名靠前的推荐任务是不一致性系数更高,也即是地表覆盖类型不易识别的任务区域,使得能够将难分区域优先推荐给用户进行标报,从而能够提升利用众包模式对地表覆盖数据进行更新的效率。
以上结合附图详细描述了本发明的优选实施方式,但是,本发明并不限于此。在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,包括各个具体技术特征以任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。但这些简单变型和组合同样应当视为本发明所公开的内容,均属于本发明的保护范围。

Claims (10)

1.地表覆盖更新众包任务推荐方法,其特征在于,包括如下步骤:
A)获取需要收集地表覆盖数据的空间区域,对所述空间区域进行地表覆盖众包任务划分,形成网格空间,以将所述网格空间作为待推荐的众包任务区;
B)设计基于用户多元兴趣画像的偏好模型,对所述众包任务区构建顾及用户活跃度的时空偏好模型以及顾及地表覆盖类型的隐语义偏好模型,以融合得到用户对待推荐众包任务区的时空偏好分数以及隐语义偏好分数,并基于所述时空偏好分数以及隐语义偏好分数得到用户的综合兴趣分数,并基于所述用户的综合兴趣分数产生任务推荐列表;
C)基于顾及多源数据不一致性的任务重排序方法计算各个所述众包任务区的不一致性系数,以基于所述不一致性系数对所述任务推荐列表中的任务进行排序获得最终推荐列表。
2.根据权利要求1所述的地表覆盖更新众包任务推荐方法,其特征在于,所述地表覆盖众包任务划分的步骤包括:利用网格划分,将所述空间区域等分成包括多个网格单元的所述网格空间,每个所述网格单元代表一个待推荐的地表覆盖众包任务区。
3.根据权利要求2所述的地表覆盖更新众包任务推荐方法,其特征在于,所述基于用户多元兴趣画像的偏好模型的构建步骤包括计算时空兴趣偏好、贡献活跃度和覆盖类型偏好。
4.根据权利要求3所述的地表覆盖更新众包任务推荐方法,其特征在于,所述时空兴趣偏好的计算过程包括:
B11)基于用户的历史贡献信息,对于用户u采用三角核函数
Figure 923870DEST_PATH_IMAGE001
构建待推荐任务区i和已标报任务区j之间的地理相似度:
Figure 372169DEST_PATH_IMAGE002
其中,d(i, j)为所述待推荐任务区i的质心和所述已标报任务区j的质心之间的球面距离;d为所述三角核函数的宽度参数,I为指示函数,表示当所述待推荐任务区i和所述已标报任务区j之间的距离超过d时,地理相似度为0;当所述待推荐任务区i和所述已标报任务区j之间的距离小于d时,距离越近,地理相似度越大;
B12)利用非线性逐步遗忘函数
Figure 417486DEST_PATH_IMAGE003
度量用户对所述待推荐任务区i的兴趣随时间动 态下降的程度:
Figure 78274DEST_PATH_IMAGE004
其中,θ为遗忘率;
Figure 158225DEST_PATH_IMAGE005
为所述已标报任务区j的最后时间戳,
Figure 246267DEST_PATH_IMAGE006
为用户最早标报的时间 戳,
Figure 778880DEST_PATH_IMAGE007
为用户最后标报的时间戳;
B13)基于内容协同过滤方法量化用户u对所述待推荐任务区
Figure 243359DEST_PATH_IMAGE008
的时空偏好:
Figure 177817DEST_PATH_IMAGE009
其中,
Figure 436760DEST_PATH_IMAGE010
为用户u贡献过数据的所述众包任务区的集合,
Figure 456669DEST_PATH_IMAGE011
为用户u贡献过数据的所 述众包任务区的数量。
5.根据权利要求4所述的地表覆盖更新众包任务推荐方法,其特征在于,所述贡献活跃度的计算步骤包括:
B21)统计用户u在各个所述众包任务区的标注频数
Figure 459260DEST_PATH_IMAGE012
,采用MIN-MAX方法归一化用户对 所述已标报任务区j的贡献活跃度
Figure 248224DEST_PATH_IMAGE013
Figure 943648DEST_PATH_IMAGE014
其中,
Figure 450852DEST_PATH_IMAGE015
为统计结果的最大值,
Figure 991555DEST_PATH_IMAGE016
为统计结果的最小值;
B22)基于所述时空兴趣偏好,结合贡献频率,以得到顾及用户贡献活跃度差异的所述 时空偏好分数
Figure 900605DEST_PATH_IMAGE017
Figure 501351DEST_PATH_IMAGE018
其中α为用户活跃频率影响权重因子。
6.根据权利要求5所述的地表覆盖更新众包任务推荐方法,其特征在于,所述覆盖类型偏好的计算步骤包括:
B31)统计用户u对覆盖类型c的贡献次数占贡献总数的比率
Figure 495852DEST_PATH_IMAGE019
,如果用户u对某一覆盖 类型c贡献为零,则赋值
Figure 840245DEST_PATH_IMAGE019
为0,根据
Figure 603802DEST_PATH_IMAGE019
填充得到用户类型矩阵
Figure 641028DEST_PATH_IMAGE020
并对所述用户类 型矩阵
Figure 857246DEST_PATH_IMAGE020
进行矩阵分解:
Figure 5331DEST_PATH_IMAGE021
其中,
Figure 623394DEST_PATH_IMAGE022
为用户总数量,
Figure 565942DEST_PATH_IMAGE023
为地物类型的数量,
Figure 269456DEST_PATH_IMAGE024
为用户特征矩阵,
Figure 955652DEST_PATH_IMAGE025
为类 型特征矩阵,f为隐特征维数;
B32)根据现有的地表覆盖数据反映的地球表面地物类型的分类情况,将覆盖类型一一 映射到相应的所述众包任务区,并提取每一类所述覆盖类型c在对应的所述众包任务区的 面积占比
Figure 693801DEST_PATH_IMAGE026
,若所述众包任务区未包含相应的覆盖类型c,则所述众包任务区对该覆盖类 型c的面积占比
Figure 72830DEST_PATH_IMAGE026
为0,以得到任务区类型特征矩阵D,并结合类型特征矩阵
Figure 263640DEST_PATH_IMAGE025
以得到 目标矩阵T
Figure 753527DEST_PATH_IMAGE027
需要注意的是,
Figure 80603DEST_PATH_IMAGE028
中的T是矩阵转置的符号;
B33)通过所述用户特征矩阵
Figure 630533DEST_PATH_IMAGE024
和所述目标矩阵T,解算出用户u对所述待推荐任务 区i的所述隐语义偏好分数
Figure 308639DEST_PATH_IMAGE029
Figure 336638DEST_PATH_IMAGE030
7.根据权利要求6所述的地表覆盖更新众包任务推荐方法,其特征在于,所述任务推荐列表的获取步骤包括:
B41)计算综合兴趣分数
Figure 783800DEST_PATH_IMAGE031
Figure 239052DEST_PATH_IMAGE032
B42)基于所述综合兴趣分数
Figure 404454DEST_PATH_IMAGE031
的值,对所述待推荐任务区i进行降序排序,并选 取前k个所述待推荐任务区作为所述任务推荐列表。
8.根据权利要求7所述的地表覆盖更新众包任务推荐方法,其特征在于,所述不一致性系数的计算步骤包括:
C1)获取地表覆盖参考数据;
C2)将各所述地表覆盖参考数据基于设定的转换方法转化为设定标准下的标准地表覆盖数据;
C3)根据分类准确像元数在总像元数中的比例,获取不一致性系数。
9.根据权利要求8所述的地表覆盖更新众包任务推荐方法,其特征在于,所述不一致性 系数
Figure 236144DEST_PATH_IMAGE033
的计算步骤包括:
Figure 803391DEST_PATH_IMAGE034
其中
Figure 429545DEST_PATH_IMAGE035
为所述分类准确像元数,Num为所述总像元数,n为不同地表覆盖类型种类数目。
10.根据权利要求9所述的地表覆盖更新众包任务推荐方法,其特征在于,所述任务推 荐列表中的所述待推荐任务区i基于所述不一致性系数
Figure 82243DEST_PATH_IMAGE036
进行降序排序以得到所述最终推 荐列表。
CN202211432498.XA 2022-11-16 2022-11-16 地表覆盖更新众包任务推荐方法 Active CN115495665B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211432498.XA CN115495665B (zh) 2022-11-16 2022-11-16 地表覆盖更新众包任务推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211432498.XA CN115495665B (zh) 2022-11-16 2022-11-16 地表覆盖更新众包任务推荐方法

Publications (2)

Publication Number Publication Date
CN115495665A true CN115495665A (zh) 2022-12-20
CN115495665B CN115495665B (zh) 2023-04-25

Family

ID=85115847

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211432498.XA Active CN115495665B (zh) 2022-11-16 2022-11-16 地表覆盖更新众包任务推荐方法

Country Status (1)

Country Link
CN (1) CN115495665B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130018685A1 (en) * 2011-07-14 2013-01-17 Parnaby Tracey J System and Method for Tasking Based Upon Social Influence
CN109460929A (zh) * 2018-11-15 2019-03-12 平安科技(深圳)有限公司 基于地理位置作业的众包任务的推送方法及相关设备
US20210286708A1 (en) * 2020-03-16 2021-09-16 Institute Of Software, Chinese Academy Of Sciences Method and electronic device for recommending crowdsourced tester and crowdsourced testing
CN114048391A (zh) * 2022-01-13 2022-02-15 中国测绘科学研究院 一种基于地理格网的兴趣活动推荐方法
CN115018322A (zh) * 2022-06-07 2022-09-06 山东京德智汇科技有限公司 一种智能的众包任务分配方法与系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130018685A1 (en) * 2011-07-14 2013-01-17 Parnaby Tracey J System and Method for Tasking Based Upon Social Influence
CN109460929A (zh) * 2018-11-15 2019-03-12 平安科技(深圳)有限公司 基于地理位置作业的众包任务的推送方法及相关设备
US20210286708A1 (en) * 2020-03-16 2021-09-16 Institute Of Software, Chinese Academy Of Sciences Method and electronic device for recommending crowdsourced tester and crowdsourced testing
CN114048391A (zh) * 2022-01-13 2022-02-15 中国测绘科学研究院 一种基于地理格网的兴趣活动推荐方法
CN115018322A (zh) * 2022-06-07 2022-09-06 山东京德智汇科技有限公司 一种智能的众包任务分配方法与系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LASO BAYAS J C等: "Crowdsourcing in-situ data on land cover and land use using gamification and mobile technology", 《REMOTE SENSING》 *
张宇航: "综合多要素的地理空间数据众包任务推荐方法", 《测绘通报》 *
曹见飞: "《基于移动终端的地表覆盖众包标报方法研究》", 《中国优秀硕士论文全文数据库 自然科学辑》 *

Also Published As

Publication number Publication date
CN115495665B (zh) 2023-04-25

Similar Documents

Publication Publication Date Title
Stehman et al. Key issues in rigorous accuracy assessment of land cover products
CN108446293B (zh) 一种基于城市多源异构数据构建城市画像的方法
Fonte et al. Assessing VGI data quality
Radoux et al. Thematic accuracy assessment of geographic object-based image classification
Gaughan et al. High resolution population distribution maps for Southeast Asia in 2010 and 2015
Ran et al. Large-scale land cover mapping with the integration of multi-source information based on the Dempster–Shafer theory
CN108268597B (zh) 一种动目标活动概率图谱构建及行为意图识别方法
de Souza et al. A data based model to predict landslide induced by rainfall in Rio de Janeiro city
Doupe et al. Equitable development through deep learning: The case of sub-national population density estimation
DomaÇ et al. Integration of environmental variables with satellite images in regional scale vegetation classification
Wittich et al. Recommending plant taxa for supporting on-site species identification
Gervasoni et al. Convolutional neural networks for disaggregated population mapping using open data
CN108345662B (zh) 一种考虑用户分布区域差异的签到微博数据加权统计方法
Wu et al. Research themes of geographical information science during 1991–2020: a retrospective bibliometric analysis
Hazell et al. The impact of spatial scale: exploring urban butterfly abundance and richness patterns using multi-criteria decision analysis and principal component analysis
CN111125553A (zh) 一种支持多源数据的城市建成区智能提取方法
Tanton Spatial microsimulation: developments and potential future directions
Márquez et al. A methodological framework to quantify the spatial quality of biological databases
Martini et al. Database-supported change analysis and quality evaluation of OpenStreetMap Data
CN115495665A (zh) 地表覆盖更新众包任务推荐方法
CN105160065A (zh) 基于拓扑关系的遥感信息相似度评价方法
CN115393148A (zh) 自然资源用数据监测系统、监测方法、设备、介质及终端
Burnicki Spatio-temporal errors in land–cover change analysis: Implications for accuracy assessment
Barzin et al. Where Are All the Jobs
Goodman Filling in the Gaps: Applications of Deep Learning, Satellite Imagery, and High Performance Computing for the Estimation and Distribution of Geospatial Data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant