CN104615740B - 一种志愿者地理信息信誉度计算方法 - Google Patents
一种志愿者地理信息信誉度计算方法 Download PDFInfo
- Publication number
- CN104615740B CN104615740B CN201510072815.5A CN201510072815A CN104615740B CN 104615740 B CN104615740 B CN 104615740B CN 201510072815 A CN201510072815 A CN 201510072815A CN 104615740 B CN104615740 B CN 104615740B
- Authority
- CN
- China
- Prior art keywords
- msub
- mrow
- version
- similarity
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Remote Sensing (AREA)
- Quality & Reliability (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种志愿者地理信息信誉度计算方法,该方法通过VGI贡献者的信誉来计算VGI目标的信誉度。贡献者信誉由通过用户注册信息计算获得的初始信誉和在系统行为贡献中获得的评价信誉两部分组成;将每个志愿者对某个地理空间目标的一次编辑结果定义为一个版本,当其他用户编辑该目标版本时,通过计算版本相似度来获得其他用户对该志愿者这个目标版本的支持度;然后通过计算出其他贡献者对某志愿者所贡献的每个目标的支持度,并对各个支持度进行加权计算获得该志愿者的综合评价信誉度。该方法不需要用户对其他志愿者进行直接打分评价,即可较客观地评价出志愿者地理信息可信度,为志愿者地理信息清洗与筛选提供科学依据。
Description
技术领域
本发明属于众源地理信息(VGI)应用技术领域,具体涉及一种志愿者地理信息信誉度计算方法。
背景技术
数据质量问题一直是地理信息行业的一个基础性问题,由于志愿者地理信息(Volunteered Geographic Information,VGI)或众源信息(Crowd-sourcing data)是由大众志愿者自发标报,其中存在大量恶意、虚假、低质量数据,与传统专业人员获取数据相比,其可信度具有诸多不确定性,需进行可信性评价后方可放心使用【武汉大学学报:信息科学版,2010.李德仁,钱新林,浅论自发地理信息的数据管理】。但目前这方面的研究工作还刚刚起步,研究成果包括定性分析和定量计算两方面。
在定性评价和分析方面,许多众源信息系统采用类似专家评审方式,评审人员由专家或者普通大众(非专业人士)组成。Van Exel和Dias研究众源地理信息系统与一般协作知识平台的区别,提出了评价众源数据质量的概念模型Crowd Quality【Proceedings ofthe 6th GIScience international conference on geographic information science,2010.Van Exel,M.,E.Dias and S.Fruijtier,The impact of crowdsourcing onspatial data quality indicators】,该模型影响众源地理信息质量的因素包括:用户经验、本地知识、要素来源等。Goodchild&Li(2012)深入分析了确保VGI数据质量的三种途径:众源方法(Crowd-sourcing approach)、社会方法(Social approach)及地理方法(Geographic approach)【Spatial statistics,2012.Goodchild,M.F.and L.Li(2012),Assuring the quality of volunteered geographic information】。另外还有Bishr和Janowicz(2010)提出信息信任(Informational trust)概念等。上述定性分析研究成果对VGI数据质量控制与可信性度量具有重要参考价值,但是由于缺少对影响因素的定量化计算方法,不能直接用于VGI数据质量的自动检查与评价。
在VGI数据质量定量评价方面,目前的研究工作主要集中在将VGI数据与已有专业数据库比较评价方面。多位学者对感兴趣区域的VGI数据与专业数据进行了对比分析【Transactions in GIS,2010,Girres,J.F.and G.Touya.Quality assessment of theFrench OpenStreetMap dataset】,通过对比分析学者们普遍认为在欧洲城市区域众源数据的平均位置精度优于7m,现势性与丰富程度甚至超过专业数据,但VGI存在严重的不完整性和各地区不均匀问题。由于这类方法需要高精度专业数据集,难以在VGI数据质量评价普遍应用。
总之,目前尽管志愿者地理信息系统已发展多年,收集了大量的志愿者地理信息,但由于缺少可定量评价志愿者地理信息信誉度的方法与系统,不能全面评价每个志愿者、每个志愿者地理信息版本的可信度(或可靠性),不能科学地对其进行全面清洗或筛选,使得当前志愿者地理信息的数据质量参差不齐、存在大量恶意、虚假、低质量数据;系统采用的目标版本仅看编辑生成时间,不做质量评价,导致了系统服务使用目标版本并非最佳版本等问题。
发明内容
本发明所解决的技术问题是,针对现有技术方法存在的不足,提供了一种志愿者地理信息信誉度计算方法,可较客观地评价出志愿者地理信息可信度,为志愿者地理信息清洗与筛选提供科学依据。
本发明的技术方案为:
一种志愿者地理信息信誉度计算方法,VGI(志愿者地理信息)目标的版本vi的信誉度计算方法为:
其中,i为某VGI目标的版本vi的序号,R(ci)表示版本vi的贡献者ci的信誉度,表示版本vi-1的信誉度,表示取和R(ci)中的较大值;ER(vi,vi-1)表示版本vi对版本vi-1的编辑比例,ER(vi,vi-1)的计算方法为:
ER(vi,vi-1)=1-VerSim(vi,vi-1)
其中VerSim(vi,vi-1)表示版本vi与vi-1的相似度。
所述贡献者ci的信誉度R(ci)的计算方法为;
R(ci)=R0(ci)·e-m/M+Re(ci)·(1-e-m/M)
其中,R0(ci)为贡献者ci的初始信誉度,Re(ci)为贡献者ci的评价信誉度,e是自然常数,m表示贡献者ci被评价的次数,M为正的自然数常量。
所述贡献者ci的初始信誉度R0(ci)根据贡献者ci注册信息中的诚信维和能力维元素的分值计算,诚信维的元素包括真实姓名、身份ID、手机号码和email信息;能力维的元素包括用来确定贡献者贡献能力的信息,如年龄、受教育程度和专业水平;具体地,贡献者ci的初始信誉R0(ci)根据下式计算:
其中,fa表示诚信维的第a个元素的分值(1≤a≤A),Max(fa)表示A个诚信维元素的分值中的最大值;Ob表示能力维元素b的分值(1≤b≤B),表示各个能力维元素的分值的平均值,B表示能力维的元素总数,α表示诚信维的权值。
所述真实姓名、身份ID、手机号码和email的分值根据四者的认证情况确定;
真实姓名、身份ID和手机号码的认证方法包括形式认证和基于联网数据库的真实性认证,若形式认证和基于联网数据库的真实性认证都通过,则分值为“1”;若无法进行基于联网数据库的真实性认证,只能进行形式认证,则形式正确,分值为“0.5”;否则分值为“0”;
若使用本发明方法的主体为政府部门,因为政府部门能够使用联网数据库,有能力根据联网数据库中贡献者相应的个人信息,判断贡献者填写的真实姓名、身份ID和手机是否真实匹配,即能够基于联网数据库进行真实性认证;若使用本发明方法的主体为普通商业机构,无法使用包含贡献者的个人信息联网数据库,只能进行形式认证,则根据形式认证的结果对真实姓名、身份ID和手机号码进行打分;
email信息的认证方法包括形式认证和有效性验证;形式认证即根据邮箱形式判断email是单位邮箱还是可任意申请的邮箱;有效性验证即根据系统自动发送的认证邮件是否有回复判断email是否为有效邮箱;若认证结果为有效的单位邮箱,则分值为“0.8”;若认证结果为有效的可任意申请的邮箱,其分值为“0.5”;否则分值为“0”;
Email是否为单位邮箱的认定方法为:首先在系统建立可任意申请的邮箱清单,然后由计算机系统自动判断,判断用户邮箱是否属于这一清单里的邮箱,如果是,则为可任意申请的邮箱;如果不是,则为单位邮箱;
能力维各个元素的分值,根据信息填写的完整程度确定,若能力维元素b已被贡献者填写了,且形式正确,则其分值Ob为“1”,否则分值Ob为“0”。
所述贡献者ci的评价信誉Re(ci)根据下式计算:
其中,1≤h≤m,m为贡献者ci被评价的次数,wh为第h个评价值的权值;Eh(ci,cj)为贡献者ci因编辑生成某VGI目标的版本vi而得到此VGI目标的后续版本vj的贡献者cj的评价值;Eh(ci,cj)通过以下公式计算:
其中,ti和tj分别为VGI目标的版本vi和vj的生成时间;τ为时间跨度阈值,用于控制参与评价的两版本之间的时间跨度;c∈[0,1],用于控制评价者的信誉度影响其评价结果程度;N为评价版本跨度阈值,用于控制当版本vj生成时,有N个小于j的版本被评价;VerSim(vi,vj)为版本vi与vj的相似度。
所述wh=1/m。
某VGI目标的版本vj和vi的相似度VerSim(vi,vj)计算方法为:
VerSim(vi,vj)=w·VerSpatioSim(vi,vj)+(1-w)VerAttrSim(vi,vj)
其中,w为空间相似度的权值;VerSpatioSim(vi,vj),VerAttrSim(vi,vj)分别表示VGI目标的版本vi和vj的空间相似度和属性相似度,分别通过以下方法计算;
其中,SpatioSimk(vi,vj)∈[0,1]表示VGI目标的版本vi和vj之间的第k个空间相似度评价因素的值,1≤k≤K,K表示空间相似度评价因素的数量,空间相似度评价因素包括位置相似度、形状相似度和大小相似度;AttrSiml(vi,vj)∈[0,1]表示VGI目标的版本vi和vj之间的第l个属性相似度评价因素的值,1≤l≤L,L表示属性相似度评价因素的数量,属性相似度评价因素包括名称相似度、类型相似度;wk和wl分别表示版本间各空间相似度评价因素和属性相似度评价因素的权值。
所述VGI目标为面目标时,令空间相似度的权值w=1,则面目标版本vj和vi的相似度VerSimpolygon(vi,vj)等于其空间相似度,通过大小相似度和形状相似度来计算,即:
其中,PolygonSimarea(vi,vj)和PolygonSimshape(vi,vj)分别表示面目标版本vi与vj的大小相似度和形状相似度,warea和wshape分别表示二者的权重;
面目标版本vi与vj的大小相似度PolygonSimarea(vi,vj)通过面积重叠率来计算,计算方法为:
其中,和分别表示面目标版本vi、vj和vi∩vj的面积,函数Areamax表示面目标版本vi和vj面积中的较大值;
面目标版本vi与vj的形状相似度PolygonSimshape(vi,vj)采用旋转角度函数距离法来计算,即:
其中,和分别表示面目标版本vi和vj中各顶点的最大累计旋转角和最小累计旋转角;TFD(vi,vj)表示面目标版本vi和vj的旋转角度函数距离:
其中,函数||·||p表示Lp范式,式中p值取2;和分别表示目标版本vi与vj的旋转角度函数;
对于旋转角度函数Θ(l),其中l表示多边形,即面目标版本上的顶点P0沿着此面目标版本的周长到其上各顶点Pk的归一化距离lk(1≤k≤n)为面目标版本上边Pk-1Pk的长度,n为面目标版本的顶点个数,为面目标版本的周长;
Θ(lk)=θk=θk-1+ωk,θk和θk-1分别表示顶点Pk-1和顶点Pk沿着周边,以逆时针方向为正方向的累计转角,ωk表示顶点Pk的旋转角,即边Pk-1Pk旋转至边PkPk+1的旋转角度,1≤k≤n。
所述VGI目标为线目标时,令空间相似度的权值w=1,则线目标版本vj和vi的相似度VerSimline(vi,vj)等于其空间相似度,根据线目标版本长度相似度、缓冲区面积重叠率和形状相似度计算,即:
其中,函数LineSimlen(vi,vj)、LineSimbuff(vi,vj)和LineSimshape(vi,vj)分别表示线目标的版本vi与vj的长度相似度、缓冲区面积重叠度和形状相似度,wlen、wbuff和wshape分别表示三者的权重;
线目标版本长度相似度LineSimlen(vi,vj)计算方法为:
其中,和分别表示线目标版本vi和vj的长度,函数Lenmax表示取线目标版本长度中的较大值;
缓冲区面积重叠率LineSimbuff(vi,vj)的计算方法为:
其中,BuffArAe和aBuffAreaB分别表示线目标版本vi和vj缓冲区面积,BuffAreaA∩BuffAreaB表示线目标版本vi和vj缓冲区重叠面积,函数BuffAreamax表示线目标版本vi和vj缓冲区面积中的最大值;
线目标版本的形状相似度LineSimshape(vi,vj)采用旋转角度函数距离法进行计算。
有益效果:
本发明为解决当前VGI应用的关键问题---VGI数据的可信度评价提供了一种新的方法和思路。通过VGI贡献者的信誉来计算VGI目标的信誉度。通过贡献者注册信息和贡献版本被他人编辑修改的情况来计算贡献者信誉度,即贡献者的信誉由通过用户注册信息计算获得的初始信誉和在系统贡献行为中获得的评价信誉两部分组成。贡献行为评价信誉是将每个志愿者对某个地理空间目标的一次编辑结果定义为一个版本,当其他用户编辑该目标版本时,通过计算版本相似度来获得其他用户对该志愿者贡献的这个目标版本的支持度;然后通过计算出其他贡献者对某志愿者所贡献的每个目标的支持度,并对各个支持度进行加权平均获得该志愿者的综合信誉度。地理目标的信誉度则根据参与编辑该目标的用户个数、各用户的贡献大小及其信誉度计算确定。该方法不需要用户对其他志愿者进行直接打分评价,即可较客观地评价出志愿者地理信息可信度,为志愿者地理信息清洗与筛选提供科学依据。
本发明的有益效果主要包括如下三个方面:1)该方法不需要用户对其他志愿者或其贡献直接打分评价,避免了繁琐的评分过程,减少了志愿者的工作量,在提高志愿者地理信息系统效率的同时使得评价结果更具客观性。2)可全铺盖计算每个目标版本的信誉度,由于志愿者信誉度计算是结合根据注册信息生成的初始信誉和其在系统中的表现来动态确定的,每个进入系统的志愿者都具有信誉值;而系统中志愿者贡献目标仅有一个版本时,其信誉度直接采用其贡献者信誉度;当目标具有多个版本时,各个版本的信誉度是根据参与贡献该版本的所有志愿者的信誉度确定的,所有目标版本均可计算其信誉度,因此该方法可为剔除恶意、虚假、低质量数据的志愿者地理信息清洗与筛选提供全铺盖的科学依据,为志愿者地理信息应用奠定基础。3)该方法可用于志愿者地理信息系统挑选、发布每个目标的最佳版本,提高志愿者地理信息服务水平、拓宽应用领域等。
附图说明
图1为志愿者(群众)、目标版本、信誉度之间的关系图;
图2为以面目标为例的版本空间相似度实例图;其中图2(a)为用户1贡献的版本1;图2(b)为用户2贡献的版本2;图2(c)为用户3贡献的版本3;图2(d)版本1和版本2的叠加;图2(e)为版本1和版本3的叠加图2(f)版本2和版本3的叠加;
图3为面目标形状相似度计算中的旋转角度函数定义图,图3(a)为面目标形状,图3(b)为面目标的旋转角度函数;
图4为线目标各版本缓冲区间比较实例图;图4(a)为用户1贡献的版本L1及缓冲区;图4(b)为用户2贡献的版本L2及缓冲区;图4(c)为用户3贡献的版本L3及缓冲区;图4(d)为版本L1和L2的缓冲区叠加;图4(e)为版本L1和L3的缓冲区叠加;图4(f)为版本L2和L3的缓冲区叠加;
图5 OpenStreetMap中Berlin面对象按信誉值区间分布图(2013年2月15日);
图6 OpenStreetMap中Berlin线面对象按信誉值区间分布图(2013年2月15日)。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步说明。
实施例1:
本发明方法为:对于新增地理对象,该地理对象仅由单个贡献者贡献,其信誉值为该贡献者的信誉值;对于含多个版本的地理对象,该对象编辑过程中包含多个编辑者,其信誉值由参与编辑的贡献者以及编辑情况决定。
贡献者的当前信誉通过加权综合贡献者的初始信誉和评价信誉得出。
贡献者在VGI系统中注册,填写相关的注册资料,根据用户信息完整度和身份认证程度来确定用户的初始信誉。
初始信誉计算中,将贡献者注册信息分为诚信维和能力维,根据天地图、OSM等用户注册信息情况,真实姓名、身份ID、email和手机号码等信息可用于确定用户真实性,属于诚信维;专业、职业、年龄信息,可用于确定用户的贡献能力所以称为能力维。由于身份认证各要素有一定的等同作用,而且任何一项的认证都有很重要的意义,所以诚信维的值等于维内各要素认证取值的最大值(最大值为1),即如果真实姓名和身份ID通过认证,该要素的值为1,诚信维的值也为1;能力维的值为维内各要素值的加权平均,通过系统设计,能力维的值可通过用户对点、线、面目标的增加、修改和删除操作的学习训练得到提升。贡献者c的初始信誉R0(c)根据式1计算。
其中,fa表示诚信维的第a个元素的分值(1≤a≤A),Max(fa)表示A个诚信维元素的分值中的最大值;Ob表示能力维元素b的分值(1≤b≤n),表示各个能力维元素的分值的平均值,B表示能力维的元素总数,α表示诚信维的权值。在志愿者地理信息系统运行初始阶段,因为暂无数据参考,参考电子商务系统调研结果α的取值暂设为0.6;随着VGI系统的运行,用户的信誉基本由其评价信誉确定,此时将贡献者信誉对应其注册信息的完整性,从总体上来确定注册完整性和用户信誉之间的关系,从而调整α的取值。
注册的贡献者可以在VGI系统中贡献地理信息,包含增加、修改和删除地理对象,地理对象包含点对象、线对象和面对象;地理对象版本经历修改后,根据修改情况对该对象的前述版本进行评分,也即对前述版本的贡献者进行评价,评价方法采用基于版本相似度的方法进行,版本相似度是指VGI中同一地理对象的多个版本之间的空间特征和属性特征的相似程度。贡献者通过不断地贡献地理对象,获得多次评价,综合全部或者一段时间的评价值得出贡献者的评价信誉。
图1为贡献者/志愿者(群众)、目标版本、信誉度之间的关系图;图中描述了多个志愿者编辑同一状态下的目标形成多个目标版本的过程,图中Cg创建了该目标的第一个版本V1,Cj-2通过编辑V1得到版本Vi-2,Cj-1通过编辑Vi-2得到版本Vi-1,Cj-1、Cj、Ck通过编辑Vi-1分别得到版本Vi0、Vi1、Vi2,Cn通过编辑Vi1得到版本Vm。版本Vi-2与V1间的相似程度隐含了Cj-2对Cg的信誉评价;同理Cj-1通过版本Vi-1隐式评价了Cg和Cj-2;Cn通过其参与贡献版本Vm隐式评价了之前的其他版本的贡献者,即Cg、Cj-2、Cj-1、Cj、Ck。
志愿者某次贡献的隐式评分由版本相似度计算。图2为OSM【openstreetmap开源地图】提供数据中id为4839528的面目标的三个版本A1、A2和A3,贡献者分别为用户1、2和3,都将目标标注为游泳池,三个版本形成时间分别是2011年的1月15日、1月18日和3月17日,三次编辑发生在大约2个月内,该目标本身发生变化的可能性非常小,从图中可以看出,经历了3次编辑后,目标的细节更清晰,质量有所提高。如图2所示,贡献用户1新建了一个空间面目标A1,设为A目标的版本1;贡献用户2认为A1不准确,在A1的基础上进行编辑修改得到A2,设为版本2;贡献用户3认为A2仍不够准确,在A2的基础上编辑修改得到A3,设为版本3。将A1、A2、A3叠加,从A1∩A2、A2∩A3、A1∩A3,和A1、A2、A3的形状中可以看出,该编辑修改的结果本身隐含了用户2对用户1的评价、用户3对用户2和用户1的评价。如A1∩A2的面积较A2∩A3的面目标并集的面积比例小,A1与A2的形状差异较A2与A3大,因此一般认为用户2对用户1的支持度小于用户3对用户2的支持度。也就是说用户3对用户2的贡献评价较高,用户2对用户1的贡献评价较低。从上述分析可看出,A1、A2、A3三个版本的相似程度中隐含了参与编辑的后继用户对之前用户的评价。该评价表现为对之前目标版本的修改,即后继用户对之前版本修改越小,说明该用户对之前版本编辑用户的支持度越高;反之亦然。
为了更好地度量图2中自发地理空间对象编辑过程中隐含的信誉评价,我们将版本间的相似程度定义为版本相似度。版本相似度为地理空间对象任意两个版本之间的相似程度,可通过空间相似度(空间特征的相似程度和属性相似度(语义特征的相似程度)来度量。
假设A为自发地理信息环境下的某空间对象,贡献者ci的编辑ei:vi-1→vi为对A的第i次编辑,其中i>0,用户cj编辑A生成后续版本vj(0<i<j≤n),根据版本相似度的定义,对象A的版本vj和vi之间的版本相似度VerSim(vi,vj)可以采用式2进行计算。
VerSim(vi,vj)=w·VerSpatioSim(vi,vj)+(1-w)VerAttrSim(vi,vj) (2)
其中分别表示空间特征和语义特征的相似程度,不同类型的对象(点、线、面)的空间相似度因子不同,其影响因素主要包括位置、形状、大小等;属性相似度指不同版本间属性特征的相似程度,包括名称、类型等语义相似性。其中SpatioSimk(vi,vj)∈[0,1]表示空间对象A的vi和vj两个版本的第k个空间因素的相似度(1≤k≤K,K表示参与空间相似度评价因素的数量),包括位置、形状、大小等;AttrSiml(vi,vj)∈[0,1]表示空间对象A的vi和vj两个版本之间的第l个属性因素的相似度(1≤l≤L,L表示参与属性相似度评价因素的数量),属性特征主要包括名称、类型等等语义特征;wk和wl分别表示版本间各因素空间相似度和属性相似度的权值。VGI环境下编辑过程中,信誉评价是在目标有新的版本生成时发生,即当某用户贡献一个新目标版本时,此时对该目标之前版本贡献用户的信誉进行评价。具体方法是,当贡献者cj对某对象L编辑生成版本vj时,设ti和tj分别为对象版本vi和vj的生成时间,对于所有的0<i<j且j-i≤N,如果编辑的原因是由于目标变化,则不参与信誉计算;如果编辑原因为目标修正,则参与信誉计算;如果编辑原因不明,则当tj-ti≤τ时参与信誉计算;设E(Ci,Cj)表示贡献者Ci因版本vi得到贡献者Cj通过版本vj的评价信誉值,则E(Ci、Cj)通过式(5)计算:
其中τ为时间阈值,用于控制参与评价的两版本之间的时间跨度,如果超过时间阈值,则不执行评价,这样可将评价时间控制在短期范围内,当编辑原因不明时用以区别目标修正和目标变化两种情况;N为评价版本数的阈值,用于控制当版本vj生成时,有N个小于j的版本被评价。对于所有的0<i<j且j-i≤N,如果编辑的原因是“目标变化”,则不参与信誉计算;如果编辑原因为“表达不准”,则参与信誉计算;如果编辑原因不清楚,则当tj-ti≤τ时参与信誉计算。
但是,为避免用户自评、用户贡献被同一用户多次评价等情况出现,有些版本不参与评价,共有下列三种情况:
1)不评价自己的贡献
2)当被评价者贡献了多个版本,只评价最接近评价者的一个版本,以前的版本均不被评价;
3)当评价者贡献多个版本时,不评价自己已经评价过的版本。
在自发地理信息中,用户Ci可能贡献多个目标版本,并得到多个用户的评价信誉。假设贡献者Ci在最近的某个时间段内编辑空间目标版本被评价次数为m,设Re(Ci)贡献者Ci表示的总体评价信誉,则Re(Ci)可取m次评价信誉的加权计算值。各评价信誉的权值确定可以采用两种方式:1)等权方式,选取近期评价值平均计算;2)根据时间的衰减确定,近期评价支持度获得的权值高,而久远的支持度权值低。
初始信誉和评价信誉的权值确定的依据是,当某用户注册VGI系统,尚未贡献地理要素之前,该用户没有获得其他用户对他的评价,所以评价信誉部分的值为0,用户信誉仅由初始信誉确定;随着用户参与贡献,开始获得评价,当评价较少的时候,评价信誉并不一定能真正地反映用户的真实信誉值,此时,用户信誉的组成情况为初始信誉为主,评价信誉为辅;随着贡献的增多,评价信誉会越来越逼近用户的真实信誉,此时,用户信誉应该由评价信誉为主,初始信誉为辅;最终基本由评价信誉决定;采用指数函数作为权值可以达到这种效果。因此设R(c)表示志愿者当前信誉值,R0(c)表示志愿者初始信誉,Re(c)表示其评价信誉,则志愿者当前信誉值根据式(6)综合计算获得。
R(c)=R0(c)·e-m/M+Re(c)·(1-e-m/M) (6)
上式中,e是自然常数,m表示被评价的次数,M为正的自然数常量,用来控制R0(c)和Re(c)对用户信誉影响的权重,其中M值可由用户信誉值收敛的平均次数决定。
当版本为v1时,该目标为新建目标,仅有一个版本,则该目标的可信度为其贡献用户信誉度;如果版本号大于1,由于目标当前版本vi是在版本vi-1基础之编辑而成,因此vi的可信度受到前一版本vi-1的可信度值、当前版本vi的贡献者的信誉和对vi-1的编辑程度等因素的影响。为计算版本vi的可信度,将版本vi-1的分为两个部分,即vi对vi-1的编辑部分和未编辑部分;其中编辑部分可信度值根据编辑者Ci的信誉值确定,未编辑部分虽然是编辑者没有修改的比例,极可能表示用户的认可部分,所以这部分的可信度值由前一版本的可信度值和编辑者信誉的较大值决定;将两部分信誉值相加得到当前版本vi的可信度值,所以当版本vi的可信度值计算如式(7)所示。
式(7)中的表示版本vi的贡献者ci的信誉值,表示和的较大值,表示版本vi-1的可信度值;式中ER(vi,vi-1)表示版本vi对vi-1的编辑比例,可以看作编辑部分,1-ER(vi,vi-1)可以视为未编辑部分,编辑比例采用版本相似度来进行计算。版本相似度是两个版本的相似程度,与编辑比例呈反比,相似程度越大,说明编辑比例越小;反之亦然。版本间的编辑比例计算方法如式(8)所示。
ER(vi,vi-1)=1-VerSim(vi,vi-1) (8)
上式中的VerSim(vi,vi-1)表示版本的版本相似度,计算方法如式2所示。
实施例2:
本发明的实施主要包括三项内容:1)志愿者信息收集(即用户注册),2)版本相似度的计算,3)志愿者及目标信誉度计算系统的实现与验证。下面分别阐述这三个环节的具体实施方式。
1)志愿者信息收集(即用户注册)
为了建立志愿者信任数据库,需要收集志愿者的注册信息情况,如真实姓名、身份ID、email、手机号码、专业、职业、年龄信息。发明人在Eclipse开发环境下,采用JAVA语言,利用JSP、JavaScript二次开发、Baidu Map API等技术,实现了服务端志愿者信息注册。在服务端注册志愿者所在位置信息时弹出Baidu Map,在该地图上点击某一位置点即可获取到该点的经纬度位置信息作为其常住地信息。
2)版本相似度的计算
本发明涉及的地理空间目标为二维空间中点、线、面目标,故版本相似度计算包括点、线、面目标的相似度计算。版本相似度包括空间相似度和语义相似度,由于在志愿者系统中,语义信息复杂且表达极不规范,其相似度难以计算。根据发明人的观察与分析,目标的空间相似度能较好地反映出目标相似度,且能够直接计算,因此本发明用目标版本间的空间相似度来表达其版本相似度。
由于在VGI系统中,点目标无形状、无大小,难以计算两个版本间的空间相似度,因此本发明中点目标的信誉度直接等于其编辑贡献者的信誉度。下面重点阐述线、面目标的相似度计算方法。
①面目标相似度计算
面目标的空间特征主要包括大小、形状,面目标空间相似度可通过大小、形状相似度来组合表达。面目标在大小方面的特征一般用面积表达,其相似度可通过面积重叠率来计算。具体计算方法如下:
上式中AreaA、AreaB和AreaA∩B分别表示面目标版本A、B和A∩B的面积,函数Areamax表示面目标A和B面积的最大值。
在形状相似度计算方面,发明人在分析现有面目标形状相似度计算方法的基础上,采用旋转函数距离法来计算面目标形状相似度。该方法直接采用面目标边界形状点来进行计算,能较好区分面目标形状的细节及旋转等变化情况。
基于旋转角度函数的面目标形状描述方法如图3所示,设P0,P1,…,Pn为闭合多边形A(面目标版本)的边界点,边界点依次相连组成闭合多边形A的顶点,取顶点P0为起始点,θ0表示起始边P0P1的方位角,ωk(1≤k≤n)表示点Pk的旋转角【即边Pk-1Pk旋转至边PkPk+1的旋转角度】,多边形A的旋转角度函数表示为Θ(l),其中l【x轴】表示点P0沿着多边形周长到多边形上各顶点Pk的归一化距离其中lk(1≤k≤n)表示边Pk-1Pk的长度,表示多边形vi的周长,Θ(l)【y轴】表示各顶点沿着周边的累计转角(逆时针为正方向)θk=θk-1+ωk(1≤k≤n)。多边形A和B的旋转函数距离计算方法如下式所示。
上式中函数||·||p表示Lp范式,式中p值取2,形状相似度与旋转函数距离成反比,即距离越小,相似性越大,所以形状相似度的定义如下式所示。
PolygonSimshape(A,B)=1-TFD(A,B)/(MaxAngleA,B-MinAngleA,B)
上式中MaxAngleA,B和MinAngleA,B分别表示A和B的最大累计旋转角和最小累计旋转角。
组合面积相似度和形状相似度即可得到面目标版本vi与vj的版本相似度,具体计算公式如下:
上式中PolygonSimarea(vi,vj)和PolygonSimshape(vi,vj)分别表示面目标的版本vi与版本vj的面积相似度和形状相似度,warea和wshape分别表示二者的权重。
②线目标相似度计算
线目标相似度计算方面,由于线目标长度、缓冲区面积重叠率和形状相似度(如图4所示)常被用作判断两个线目标接近程度的指标,本发明根据VGI环境中线目标的特点,采用组合上述三方面因素来计算线目标相似度。
长度相似度采用下式计算:
上式中LenA和LenB分别表示线目标版本A和B的长度,函数Lenmax表示取线目标版本A和B长度的最大值。
线目标版本间缓冲区重叠率的计算方法如式:
上式中BuffAreaA和BuffAreaB分别表示线目标版本A和B缓冲区面积,BuffAreaA∩BuffAreaB表示线目标版本A和B缓冲区重叠面积,函数BuffAreamax表示线目标版本A和B缓冲区面积的最大值。图4为线目标各版本缓冲区间比较实例图,图中L1、L2、L3为目标L的三个版本,(a)、(b)、(c)分别为L1、L2、L3的缓冲区,(d)、(e)、(f)分别为L1、L2、L3缓冲区的叠加结果。
线目标版本间形状相似度采用旋转角度距离进行计算。
线目标版本vi与vj的版本相似度计算公式如下:
上式中函数LineSimlen、LineSimbuff和LineSimshape(vi,vj)分别表示线目标的版本vi与版本vj的长度相似度、缓冲区面积重叠度和形状相似度,wlen、wbuff和wshape分别表示三者的权重。
发明人采用微软Win7操作系统,以MyEclipse作为开发平台,利用Java语言编程,实现了线、面目标的相似度计算。
志愿者及目标信誉度计算系统的实现与验证:
发明人采用微软Win7操作系统,以MyEclipse作为开发平台,利用Java语言编程,实现了整个志愿者地理信息信誉计算。采用OpenStreetMap中的Berlin城市历史对象的编辑历史现势数据(2006年1月28日至2013年2月15日),文件格式为XML,大小约为1.96G,面对象版本数469080个、线目标共有104040个。采用本发明方法,根据志愿者贡献目标空间相似度计算分别得到了2013年2月15日面、线对象按信誉值区间分布图,在ArcGIS上按照信誉值分布区间以不同颜色显示(图5-6)。
为了验证本发明的有效性,发明人对信誉评价结果进行了抽样验证,按照可信度区间(分别为0-0.4、0.4-0.5、0.5-0.6、0.6-0.7、0.7-0.8、0.8-0.9和0.9-1,共7个区间)分别采样,由于区间0-0.4、0.4-0.5、0.8-0.9和0.9-1样本较少,全部采样;其他3个区间分别分成10个0.01的可信度区间间隔分别采样。为了分散各采样对象,采样依据(图5-6)所示网格区域进行,首先创建网格线,然后将上述30个区间依次按照网格顺序采样,每个信誉区间在每个网格各提取一个要素样本。采样结果如表1-2所示。
表1图5数据抽样验证结果分析表
表2图6数据抽样验证结果分析表
从表1-2可看出,自发地理信息中对象的质量和其可信度值呈正相关关系,错误对象基本上都分布在可信度较低区间。验证了本发明的有效性。
应该说明的是以上实施方法仅用来说明本发明的技术方案而非限制。
Claims (9)
1.一种志愿者地理信息信誉度计算方法,其特征在于,VGI目标的版本vi的信誉度计算方法为:
<mrow>
<msub>
<mi>T</mi>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
</msub>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<mi>R</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>c</mi>
<mn>1</mn>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mi>E</mi>
<mi>R</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>v</mi>
<mrow>
<mi>i</mi>
<mo>-</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mo>&CenterDot;</mo>
<mi>R</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>c</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>+</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>-</mo>
<mi>E</mi>
<mi>R</mi>
<mo>(</mo>
<mrow>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>v</mi>
<mrow>
<mi>i</mi>
<mo>-</mo>
<mn>1</mn>
</mrow>
</msub>
</mrow>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>&CenterDot;</mo>
<mi>M</mi>
<mi>a</mi>
<mi>x</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>T</mi>
<msub>
<mi>v</mi>
<mrow>
<mi>i</mi>
<mo>-</mo>
<mn>1</mn>
</mrow>
</msub>
</msub>
<mo>,</mo>
<mi>R</mi>
<mo>(</mo>
<msub>
<mi>c</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>i</mi>
<mo>></mo>
<mn>1</mn>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
</mrow>
其中,i为某VGI目标的版本vi的序号,R(ci)表示版本vi的贡献者ci的信誉度,表示版本vi-1的信誉度,表示取和R(ci)中的较大值;ER(vi,vi-1)表示版本vi对版本vi-1的编辑比例,ER(vi,vi-1)的计算方法为:
ER(vi,vi-1)=1-VerSim(vi,vi-1)
其中VerSim(vi,vi-1)表示版本vi与vi-1的相似度。
2.根据权利要求1所述的志愿者地理信息信誉度计算方法,其特征在于,所述贡献者ci的信誉度R(ci)的计算方法为;
<mrow>
<mi>R</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>c</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<msub>
<mi>R</mi>
<mn>0</mn>
</msub>
<mrow>
<mo>(</mo>
<msub>
<mi>c</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>&CenterDot;</mo>
<msup>
<mi>e</mi>
<mrow>
<mo>-</mo>
<mi>m</mi>
<mo>/</mo>
<mi>M</mi>
</mrow>
</msup>
<mo>+</mo>
<msub>
<mi>R</mi>
<mi>e</mi>
</msub>
<mrow>
<mo>(</mo>
<msub>
<mi>c</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>&CenterDot;</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>-</mo>
<msup>
<mi>e</mi>
<mrow>
<mo>-</mo>
<mi>m</mi>
<mo>/</mo>
<mi>M</mi>
</mrow>
</msup>
<mo>)</mo>
</mrow>
</mrow>
其中,R0(ci)为贡献者ci的初始信誉度,Re(ci)为贡献者ci的评价信誉度,e是自然常数,m表示贡献者ci被评价的次数,M为正的自然数常量。
3.根据权利要求2所述的志愿者地理信息信誉度计算方法,其特征在于,所述贡献者ci的初始信誉度R0(ci)根据贡献者ci注册信息中的诚信维和能力维元素的分值计算,诚信维的元素包括真实姓名、身份ID、手机号码和email信息;能力维的元素包括用来确定贡献者贡献能力的信息;具体地,贡献者ci的初始信誉R0(ci)根据下式计算:
<mrow>
<msub>
<mi>R</mi>
<mn>0</mn>
</msub>
<mrow>
<mo>(</mo>
<msub>
<mi>c</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mi>&alpha;</mi>
<mo>&CenterDot;</mo>
<mi>M</mi>
<mi>a</mi>
<mi>x</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>f</mi>
<mi>a</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>+</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>-</mo>
<mi>&alpha;</mi>
<mo>)</mo>
</mrow>
<mo>&CenterDot;</mo>
<mrow>
<mo>(</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>b</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>B</mi>
</munderover>
<msub>
<mi>O</mi>
<mi>b</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>/</mo>
<mi>B</mi>
</mrow>
其中,fa表示诚信维的第a个元素的分值,1≤a≤A;Max(fa)表示A个诚信维元素的分值中的最大值;Ob表示能力维元素b的分值,1≤b≤B;表示各个能力维元素的分值的平均值,B表示能力维的元素总数,α表示诚信维的权值。
4.根据权利要求3所述的志愿者地理信息信誉度计算方法,其特征在于,所述真实姓名、身份ID、手机号码和email的分值根据四者的认证情况确定;
真实姓名、身份ID和手机号码的认证方法包括形式认证和基于联网数据库的真实性认证,若形式认证和基于联网数据库的真实性认证都通过,则分值为“1”;若无法进行基于联网数据库的真实性认证,只能进行形式认证,则形式正确,分值为“0.5”;否则分值为“0”;
email信息的认证方法包括形式认证和有效性验证;形式认证即根据邮箱形式判断email是单位邮箱还是可任意申请的邮箱;有效性验证即根据系统自动发送的认证邮件是否有回复判断email是否为有效邮箱;若认证结果为有效的单位邮箱,则分值为“0.8”;若认证结果为有效的可任意申请的邮箱,其分值为“0.5”;否则分值为“0”;
能力维各个元素的分值,根据信息填写的完整程度确定,若能力维元素b已被贡献者填写了,且形式正确,则其分值Ob为“1”,否则分值Ob为“0”。
5.根据权利要求1所述的志愿者地理信息信誉度计算方法,其特征在于,所述贡献者ci的评价信誉Re(ci)根据下式计算:
<mrow>
<msub>
<mi>R</mi>
<mi>e</mi>
</msub>
<mrow>
<mo>(</mo>
<msub>
<mi>c</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>h</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>m</mi>
</munderover>
<msub>
<mi>w</mi>
<mi>h</mi>
</msub>
<msub>
<mi>E</mi>
<mi>h</mi>
</msub>
<mrow>
<mo>(</mo>
<msub>
<mi>c</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>c</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
其中,1≤h≤m,m为贡献者ci被评价的次数,wh为第h个评价值的权值;Eh(ci,cj)为贡献者ci因编辑生成某VGI目标的版本vi而得到此VGI目标的后续版本vj的贡献者cj的评价值;Eh(ci,cj)通过以下公式计算:
其中,ti和tj分别为VGI目标的版本vi和vj的生成时间;τ为时间跨度阈值,用于控制参与评价的两版本之间的时间跨度;c∈[0,1],用于控制贡献者的信誉度影响其评价结果的程度;N为评价版本跨度阈值,用于控制当版本vj生成时,有N个小于j的版本被评价;VerSim(vi,vj)为版本vi与vj的相似度。
6.根据权利要求5所述的志愿者地理信息信誉度计算方法,其特征在于,所述wh=1/m。
7.根据权利要求5所述的志愿者地理信息信誉度计算方法,其特征在于,某VGI目标的版本vj和vi的相似度VerSim(vi,vj)计算方法为:
VerSim(vi,vj)=w·VerSpatioSim(vi,vj)+(1-w)VerAttrSim(vi,vj)
其中,w为空间相似度的权值;VerSpatioSim(vi,vj),VerAttrSim(vi,vj)分别表示VGI目标的版本vi和vj的空间相似度和属性相似度,分别通过以下方法计算;
<mrow>
<mi>V</mi>
<mi>e</mi>
<mi>r</mi>
<mi>S</mi>
<mi>p</mi>
<mi>a</mi>
<mi>t</mi>
<mi>i</mi>
<mi>o</mi>
<mi>S</mi>
<mi>i</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>v</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>k</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>K</mi>
</munderover>
<msub>
<mi>w</mi>
<mi>k</mi>
</msub>
<mo>&CenterDot;</mo>
<msub>
<mi>SpatioSim</mi>
<mi>k</mi>
</msub>
<mrow>
<mo>(</mo>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>v</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>/</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>k</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>K</mi>
</munderover>
<msub>
<mi>w</mi>
<mi>k</mi>
</msub>
</mrow>
<mrow>
<mi>V</mi>
<mi>e</mi>
<mi>r</mi>
<mi>A</mi>
<mi>t</mi>
<mi>t</mi>
<mi>r</mi>
<mi>S</mi>
<mi>i</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>v</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>l</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>L</mi>
</munderover>
<msub>
<mi>w</mi>
<mi>l</mi>
</msub>
<mo>&CenterDot;</mo>
<msub>
<mi>AttrSim</mi>
<mi>l</mi>
</msub>
<mrow>
<mo>(</mo>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>v</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>/</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>l</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>L</mi>
</munderover>
<msub>
<mi>w</mi>
<mi>l</mi>
</msub>
</mrow>
其中,SpatioSimk(vi,vj)∈[0,1]表示VGI目标的版本vi和vj之间的第k个空间相似度评价因素的值,1≤k≤K,K表示空间相似度评价因素的数量;AttrSiml(vi,vj)∈[0,1]表示VGI目标的版本vi和vj之间的第l个属性相似度评价因素的值,1≤l≤L,L表示属性相似度评价因素的数量;wk和wl分别表示版本间各空间相似度评价因素和属性相似度评价因素的权值。
8.根据权利要求7所述的志愿者地理信息信誉度计算方法,其特征在于,所述VGI目标为面目标时,令空间相似度的权值w=1,则面目标版本vj和vi的相似度VerSimpolygon(vi,vj)等于其空间相似度,通过大小相似度和形状相似度来计算,即:
<mrow>
<msub>
<mi>VerSim</mi>
<mrow>
<mi>p</mi>
<mi>o</mi>
<mi>l</mi>
<mi>y</mi>
<mi>g</mi>
<mi>o</mi>
<mi>n</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>v</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mrow>
<msub>
<mi>w</mi>
<mrow>
<mi>a</mi>
<mi>r</mi>
<mi>e</mi>
<mi>a</mi>
</mrow>
</msub>
<mo>&CenterDot;</mo>
<msub>
<mi>PolygonSim</mi>
<mrow>
<mi>a</mi>
<mi>r</mi>
<mi>e</mi>
<mi>a</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>v</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>+</mo>
<msub>
<mi>w</mi>
<mrow>
<mi>s</mi>
<mi>h</mi>
<mi>a</mi>
<mi>p</mi>
<mi>e</mi>
</mrow>
</msub>
<mo>&CenterDot;</mo>
<msub>
<mi>PolygonSim</mi>
<mrow>
<mi>s</mi>
<mi>h</mi>
<mi>a</mi>
<mi>p</mi>
<mi>e</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>v</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msub>
<mi>w</mi>
<mrow>
<mi>a</mi>
<mi>r</mi>
<mi>e</mi>
<mi>a</mi>
</mrow>
</msub>
<mo>+</mo>
<msub>
<mi>w</mi>
<mrow>
<mi>s</mi>
<mi>h</mi>
<mi>a</mi>
<mi>p</mi>
<mi>e</mi>
</mrow>
</msub>
</mrow>
</mfrac>
</mrow>
其中,PolygonSimarea(vi,vj)和PolygonSimshape(vi,vj)分别表示面目标版本vi与vj的大小相似度和形状相似度,warea和wshape分别表示二者的权重;
面目标版本vi与vj的大小相似度PolygonSimarea(vi,vj)通过面积重叠率来计算,计算方法为:
<mrow>
<msub>
<mi>PolygonSim</mi>
<mrow>
<mi>a</mi>
<mi>r</mi>
<mi>e</mi>
<mi>a</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>v</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mrow>
<msub>
<mi>Area</mi>
<mrow>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mo>&cap;</mo>
<msub>
<mi>v</mi>
<mi>j</mi>
</msub>
</mrow>
</msub>
</mrow>
<mrow>
<msub>
<mi>Area</mi>
<mrow>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<msub>
<mi>Area</mi>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
</msub>
<mo>,</mo>
<msub>
<mi>Area</mi>
<msub>
<mi>v</mi>
<mi>j</mi>
</msub>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
</mrow>
其中,和分别表示面目标版本vi、vj和vi∩vj的面积,函数Areamax表示面目标版本vi和vj面积中的较大值;
面目标版本vi与vj的形状相似度PolygonSimshape(vi,vj)采用旋转角度函数距离法来计算,即:
<mrow>
<msub>
<mi>PolygonSim</mi>
<mrow>
<mi>s</mi>
<mi>h</mi>
<mi>a</mi>
<mi>p</mi>
<mi>e</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mrow>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>v</mi>
<mi>j</mi>
</msub>
</mrow>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mn>1</mn>
<mo>-</mo>
<mi>T</mi>
<mi>F</mi>
<mi>D</mi>
<mrow>
<mo>(</mo>
<mrow>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>v</mi>
<mi>j</mi>
</msub>
</mrow>
<mo>)</mo>
</mrow>
<mo>/</mo>
<mrow>
<mo>(</mo>
<mrow>
<msub>
<mi>MaxAngle</mi>
<mrow>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>v</mi>
<mi>j</mi>
</msub>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mi>MinAngle</mi>
<mrow>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>v</mi>
<mi>j</mi>
</msub>
</mrow>
</msub>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
其中,和分别表示面目标版本vi和vj中各顶点的最大累计旋转角和最小累计旋转角;TFD(vi,vj)表示面目标版本vi和vj的旋转角度函数距离:
<mrow>
<mi>T</mi>
<mi>F</mi>
<mi>D</mi>
<mrow>
<mo>(</mo>
<mrow>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>v</mi>
<mi>j</mi>
</msub>
</mrow>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mo>|</mo>
<mo>|</mo>
<mi>&Theta;</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>l</mi>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
</msub>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mi>&Theta;</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>l</mi>
<msub>
<mi>v</mi>
<mi>j</mi>
</msub>
</msub>
<mo>)</mo>
</mrow>
<mo>|</mo>
<msub>
<mo>|</mo>
<mi>p</mi>
</msub>
<mo>=</mo>
<msup>
<mrow>
<mo>(</mo>
<mrow>
<mo>&Integral;</mo>
<mo>|</mo>
<mi>&Theta;</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>l</mi>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
</msub>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mi>&Theta;</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>l</mi>
<msub>
<mi>v</mi>
<mi>j</mi>
</msub>
</msub>
<mo>)</mo>
</mrow>
<msup>
<mo>|</mo>
<mi>p</mi>
</msup>
<mi>d</mi>
<mi>l</mi>
</mrow>
<mo>)</mo>
</mrow>
<mfrac>
<mn>1</mn>
<mi>p</mi>
</mfrac>
</msup>
</mrow>
其中,函数||·||p表示Lp范式,式中p值取2;和分别表示目标版本vi与vj的旋转角度函数;
对于旋转角度函数Θ(l),其中l表示多边形,即面目标版本上的顶点P0沿着此面目标版本的周长到其上各顶点Pk的归一化距离lk为面目标版本上边Pk-1Pk的长度,1≤k≤n,n为面目标版本的顶点个数,为面目标版本的周长;
Θ(lk)=θk=θk-1+ωk,θk和θk-1分别表示顶点Pk-1和顶点Pk沿着周边,以逆时针方向为正方向的累计转角,ωk表示顶点Pk的旋转角,即边Pk-1Pk旋转至边PkPk+1的旋转角度,1≤k≤n。
9.根据权利要求7所述的志愿者地理信息信誉度计算方法,其特征在于,所述VGI目标为线目标时,令空间相似度的权值w=1,则线目标版本vj和vi的相似度VerSimline(vi,vj)等于其空间相似度,根据线目标版本长度相似度、缓冲区面积重叠率和形状相似度计算,即:
<mrow>
<msub>
<mi>VerSim</mi>
<mrow>
<mi>l</mi>
<mi>i</mi>
<mi>n</mi>
<mi>e</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mrow>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>v</mi>
<mi>j</mi>
</msub>
</mrow>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mrow>
<msub>
<mi>w</mi>
<mrow>
<mi>l</mi>
<mi>e</mi>
<mi>n</mi>
</mrow>
</msub>
<mo>&CenterDot;</mo>
<msub>
<mi>LineSim</mi>
<mrow>
<mi>l</mi>
<mi>e</mi>
<mi>n</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mrow>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>v</mi>
<mi>j</mi>
</msub>
</mrow>
<mo>)</mo>
</mrow>
<mo>+</mo>
<msub>
<mi>w</mi>
<mrow>
<mi>b</mi>
<mi>u</mi>
<mi>f</mi>
<mi>f</mi>
</mrow>
</msub>
<mo>&CenterDot;</mo>
<msub>
<mi>LineSim</mi>
<mrow>
<mi>b</mi>
<mi>u</mi>
<mi>f</mi>
<mi>f</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mrow>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>v</mi>
<mi>j</mi>
</msub>
</mrow>
<mo>)</mo>
</mrow>
<mo>+</mo>
<msub>
<mi>w</mi>
<mrow>
<mi>s</mi>
<mi>h</mi>
<mi>a</mi>
<mi>p</mi>
<mi>e</mi>
</mrow>
</msub>
<mo>&CenterDot;</mo>
<msub>
<mi>LineSim</mi>
<mrow>
<mi>s</mi>
<mi>h</mi>
<mi>a</mi>
<mi>p</mi>
<mi>e</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mrow>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>v</mi>
<mi>j</mi>
</msub>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msub>
<mi>w</mi>
<mrow>
<mi>l</mi>
<mi>e</mi>
<mi>n</mi>
</mrow>
</msub>
<mo>+</mo>
<msub>
<mi>w</mi>
<mrow>
<mi>b</mi>
<mi>u</mi>
<mi>f</mi>
<mi>f</mi>
</mrow>
</msub>
<mo>+</mo>
<msub>
<mi>w</mi>
<mrow>
<mi>s</mi>
<mi>h</mi>
<mi>a</mi>
<mi>p</mi>
<mi>e</mi>
</mrow>
</msub>
</mrow>
</mfrac>
</mrow>
其中,函数LineSimlen(vi,vj)、LineSimbuff(vi,vj)和LineSimshape(vi,vj)分别表示线目标的版本vi与vj的长度相似度、缓冲区面积重叠度和形状相似度,wlen、wbuff和wshape分别表示三者的权重;
线目标版本长度相似度LineSimlen(vi,vj)计算方法为:
<mrow>
<msub>
<mi>LineSim</mi>
<mrow>
<mi>l</mi>
<mi>e</mi>
<mi>n</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>v</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mn>1</mn>
<mo>-</mo>
<mfrac>
<mrow>
<mo>|</mo>
<msub>
<mi>Len</mi>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
</msub>
<mo>-</mo>
<msub>
<mi>Len</mi>
<msub>
<mi>v</mi>
<mi>j</mi>
</msub>
</msub>
<mo>|</mo>
</mrow>
<mrow>
<msub>
<mi>Len</mi>
<mrow>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<msub>
<mi>Len</mi>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
</msub>
<mo>,</mo>
<msub>
<mi>Len</mi>
<msub>
<mi>v</mi>
<mi>j</mi>
</msub>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
</mrow>
其中,和分别表示线目标版本vi和vj的长度,函数Lenmax表示取线目标版本长度中的较大值;
缓冲区面积重叠率LineSimbuff(vi,vj)的计算方法为:
<mrow>
<msub>
<mi>LineSim</mi>
<mrow>
<mi>b</mi>
<mi>u</mi>
<mi>f</mi>
<mi>f</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>v</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mrow>
<msub>
<mi>BuffArea</mi>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
</msub>
<mo>&cap;</mo>
<msub>
<mi>BuffArea</mi>
<msub>
<mi>v</mi>
<mi>j</mi>
</msub>
</msub>
</mrow>
<mrow>
<msub>
<mi>BuffArea</mi>
<mi>max</mi>
</msub>
<mrow>
<mo>(</mo>
<mrow>
<msub>
<mi>BuffArea</mi>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
</msub>
<mo>,</mo>
<msub>
<mi>BuffArea</mi>
<msub>
<mi>v</mi>
<mi>j</mi>
</msub>
</msub>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
</mrow>
其中,和分别表示线目标版本vi和vj缓冲区面积,表示线目标版本vi和vj缓冲区重叠面积,函数BuffAreamax表示线目标版本vi和vj缓冲区面积中的最大值;
线目标版本的形状相似度LineSimshape(vi,vj)采用旋转角度函数距离法进行计算。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510072815.5A CN104615740B (zh) | 2015-02-11 | 2015-02-11 | 一种志愿者地理信息信誉度计算方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510072815.5A CN104615740B (zh) | 2015-02-11 | 2015-02-11 | 一种志愿者地理信息信誉度计算方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104615740A CN104615740A (zh) | 2015-05-13 |
CN104615740B true CN104615740B (zh) | 2017-08-18 |
Family
ID=53150182
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510072815.5A Active CN104615740B (zh) | 2015-02-11 | 2015-02-11 | 一种志愿者地理信息信誉度计算方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104615740B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106407335A (zh) * | 2016-09-05 | 2017-02-15 | 中国地质大学(武汉) | 一种志愿者编辑能力的评估方法及系统 |
CN110892738B (zh) * | 2017-10-23 | 2023-01-17 | 深圳配天智能技术研究院有限公司 | 一种交通数据的处理方法及服务器 |
CN110059521B (zh) * | 2018-01-18 | 2022-05-13 | 浙江宇视科技有限公司 | 目标跟踪方法及装置 |
CN108710644A (zh) * | 2018-04-23 | 2018-10-26 | 江苏达科信息科技有限公司 | 一种关于政务大数据处理方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010040018A3 (en) * | 2008-10-03 | 2010-08-05 | Ninth Wave Media, Llc | Geographic information system and method of use thereof |
CN103390225A (zh) * | 2013-08-05 | 2013-11-13 | 天津勤达科贸有限公司 | 公正信用信息保存系统 |
CN104035964A (zh) * | 2014-05-16 | 2014-09-10 | 北京百度网讯科技有限公司 | 一种用于提供信誉相关信息的方法和设备 |
-
2015
- 2015-02-11 CN CN201510072815.5A patent/CN104615740B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010040018A3 (en) * | 2008-10-03 | 2010-08-05 | Ninth Wave Media, Llc | Geographic information system and method of use thereof |
CN103390225A (zh) * | 2013-08-05 | 2013-11-13 | 天津勤达科贸有限公司 | 公正信用信息保存系统 |
CN104035964A (zh) * | 2014-05-16 | 2014-09-10 | 北京百度网讯科技有限公司 | 一种用于提供信誉相关信息的方法和设备 |
Non-Patent Citations (3)
Title |
---|
志愿者地理信息数据应用事例浅析;张雪晨等;《信息系统工程》;20130720;第144-145页 * |
志愿者地理信息研究与应用初探;张红平等;《地理信息世界》;20120831;第67-71页 * |
探讨志愿者地理信息数据精度提升所面临的问题;张雪晨;《信息与电脑》;20130630;第24-25页 * |
Also Published As
Publication number | Publication date |
---|---|
CN104615740A (zh) | 2015-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI712981B (zh) | 風險辨識模型訓練方法、裝置及伺服器 | |
Spinellis et al. | The carbon footprint of conference papers | |
Zuo et al. | Residents’ support for red tourism in China: The moderating effect of central government | |
Li et al. | National distances, international experience, and venture capital investment performance | |
Zavadskas et al. | Multi-attribute decision-making model by applying grey numbers | |
Finkel | Confronting Uncertainty | |
Zheng et al. | Understanding the tourist mobility using GPS: How similar are the tourists? | |
CN104615740B (zh) | 一种志愿者地理信息信誉度计算方法 | |
CN107330100A (zh) | 基于多视图联合嵌入空间的图像‑文本双向检索方法 | |
US8862492B1 (en) | Identifying unreliable contributors of user-generated content | |
McGowen et al. | Evaluating the potential to predict activity types from GPS and GIS data | |
WO2021253758A1 (zh) | 一种基于技术图谱的关键点识别方法 | |
US9552552B1 (en) | Identification of over-clustered map features | |
US11868914B2 (en) | Moderation of user-generated content | |
CN110110155B (zh) | 基于元社会关系圈的人物知识图谱属性获取方法及装置 | |
CN110941638B (zh) | 应用分类规则库构建方法、应用分类方法及装置 | |
Poon et al. | Employment outcomes and patterns of real estate graduates: is gender a matter? | |
Khojasteh et al. | A study of the influencing technological and technical factors successful implementation of business intelligence system in internet service providers companies | |
Heo et al. | Spatial computing goes to education and beyond: Can semantic trajectory characterize students? | |
Zhang et al. | Research on application of frequent pattern growth algorithm in academic early warning | |
Kaur et al. | An automated approach for quality assessment of openstreetmap data | |
Li et al. | Decision tree based station-level rail transit ridership forecasting | |
CN104598613A (zh) | 一种用于垂直领域的概念关系构建方法和装置 | |
CN114372518A (zh) | 一种基于解题思路和知识点的试题相似度计算方法 | |
Ochilbek | Development of a method for evaluating quality of education in secondary schools using ML algorithms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |