CN104199938A - 基于rss的农用土地信息发送方法和系统 - Google Patents

基于rss的农用土地信息发送方法和系统 Download PDF

Info

Publication number
CN104199938A
CN104199938A CN201410455932.5A CN201410455932A CN104199938A CN 104199938 A CN104199938 A CN 104199938A CN 201410455932 A CN201410455932 A CN 201410455932A CN 104199938 A CN104199938 A CN 104199938A
Authority
CN
China
Prior art keywords
information
keyword
rss
user
interest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410455932.5A
Other languages
English (en)
Other versions
CN104199938B (zh
Inventor
岳建伟
关茜
刘方
陈云浩
宫阿都
李京
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Normal University
Original Assignee
Beijing Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Normal University filed Critical Beijing Normal University
Priority to CN201410455932.5A priority Critical patent/CN104199938B/zh
Publication of CN104199938A publication Critical patent/CN104199938A/zh
Application granted granted Critical
Publication of CN104199938B publication Critical patent/CN104199938B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Marine Sciences & Fisheries (AREA)
  • General Health & Medical Sciences (AREA)
  • Agronomy & Crop Science (AREA)
  • Animal Husbandry (AREA)
  • General Engineering & Computer Science (AREA)
  • Mining & Mineral Resources (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于RSS的农用土地信息发送方法,以解决在提供RSS信息推送服务时,为使用者提供更准确更全面的农用土地信息。其特征在于包括步骤:用于发布农用土地信息的服务器根据XML生成至少一种RSS Feed信息;服务器根据用户在订阅该RSS Feed信息时,接收该用户所输入的至少一个关注区域信息;服务器根据地名匹配算法筛选出该关注区域内所包含的地名信息;以及,服务器将包含有该地名信息的RSS Feed信息推送给用户。本发明还涉及一种基于RSS的农用土地信息发送系统。

Description

基于RSS的农用土地信息发送方法和系统
技术领域
本发明涉及一种土地信息的发送方法,特别涉及一种基于RSS机制的农用土地信息发送方法和系统。 
背景技术
RSS(Really Simple Syndication,真正简易的聚合)是目前较为成熟和成功的信息推送技术之一。RSS信息推送技术具有实时性强、无垃圾信息、信息获取高效便捷、成本低、跨平台性好等特点。它是基于XML(Extensible Markup Language,可扩展标记语言)的一种格式,并且所有的RSS文件都必须遵守W3C(万维网联盟)发布的XML2.0规范。XML是一种标准通用语言(SGML,Standard Generalized Markup Language)。XML存储简单,数据采用创建简易、扩展便捷的一系列标记描述。 
RSS在人性化服务方面探索了一个全新的信息服务理念,在跟踪用户浏览行为的基础上,对用户浏览的信息进行统计和整理,并通过一系列数学方法建立用户兴趣模型,利用用户兴趣模型挖掘出用户可能感兴趣的信息,将这些信息主动推送给用户。 
RSS Feed是RSS技术中的核心部分,每一个RSS Feed文件就是一个RSS数据源,里面封装了符合特定XML格式的数据。网站通过RSS Feed将信息传播给用户,网站提供RSS Feed服务是用户能够订阅网站信息的先决条件。 
常规的基于RSS信息推送技术的农用土地流转信息发送流程如图1所示,可以分为以下几步: 
1)RSS Feed信息生成过程:农地流转的网站提供者根据XML生成算法发布RSS Feed。网站的信息提供者将每一个类别信息的内容,比如农地转出信息,写入到一个XML文件中,这个XML文件也就是RSS Feed,每个RSS Feed都遵照RSS2.0标准,之后将这个RSS Feed的链接发布在网站上,并以一定的方式对RSS Feed进行更新。网站有几个提供这种服务的信息类别,就发布几个对应的RSS Feed文件。 
2)RSS Feed信息推送过程:信息浏览者使用客户端,对相应的RSS Feed进行订阅查看。根据浏览者需要,服务者将信息推送给客户,客户从而获取相应类别的信息内容。客户端软件负责对相应的RSS Feed进行解析,将RSS Feed中的内容以 列表的形式展现给用户,用户根据自己的需要点击相应的内容条目浏览信息。 
(3)RSS Feed信息推荐过程:有些网站还提供用户兴趣信息推荐的功能,即根据用户日常的浏览行为记录,通过模型计算出用户潜在的可能感兴趣的信息,将这些信息也推荐给用户。具体的,通常RSS信息模型采用的是三层结构的树状用户兴趣模型,该模型由用户根节点、信息类别和用户兴趣子集三层构成,通过获取用户点击等隐式信息,将这些信息根据文本分词算法进行分析处理,得到关键词,将这些关键词进行权值计算,将权值较高的关键词作为用户感兴趣关键词放入到用户兴趣子集中,提供服务者按该用户兴趣子集中的关键词为用户推荐信息。 
这种常规的基于RSS的信息推送机制还存在以下不足: 
1)在进行RSS Feed信息推送时,由于只涉及到信息分类过程,而对每个类别中信息内容没有进一步的筛选,因而每个类别中仍包含一些用户并不关心的信息,信息冗余程度较高。 
2)在进行RSS Feed信息推荐时,RSS兴趣模型也没有考虑到农地流转用户对地名信息的关注度,忽略了信息推荐的地域性差异,RSS用户兴趣模型将地名信息与其它关键词“一视同仁”,显然不满足用户的需求。因为,地名信息常常不是孤立的而是有内在联系的,原始的RSS用户兴趣模型没有考虑到地名信息之间的内在联系,因而降低了信息推荐的准确度。 
发明内容
针对现有技术中的不足,本发明提供了一种基于RSS机制的农用土地信息发送方法,以解决在提供RSS信息推送服务时,为使用者提供更准确更全面的农用土地信息。 
进一步地,在此基础上,本发明中的方法还可解决在提供RSS信息推荐服务时,为使用者提供更准确的用户感兴趣农用土地信息。 
为了解决上述问题,该种基于RSS的农用土地信息发送方法,其包括步骤: 
用于发布农用土地信息的服务器根据XML生成至少一种RSS Feed信息; 
服务器根据用户在订阅该RSS Feed信息时,接收该用户所输入的至少一个关注区域信息; 
服务器根据地名匹配算法筛选出该关注区域内所包含的地名信息;以及 
服务器将包含有该地名信息的RSS Feed信息推送给用户。 
优选地,所述地名匹配算法包括步骤: 
a)将所述关注区域在基准行政区划数据库中进行匹配,找到该关注区域所对应 的行政区划编码并存储; 
b)根据该行政区划编码查找是否包含有下级行政区; 
c)若有,则存储该行政区划代码并返回步骤b); 
d)将所有存储的行政区划代码转换成对应的区域地名;以及 
e)输出该区域地名信息。 
优选地,还包括步骤: 
服务器获取来自于客户的浏览信息; 
将该浏览信息根据文本分词算法进行分词处理,得到至少一个关键词; 
从该关键词中获取至少一个地名关键词,根据所述关注区域获取该地名关键词所对应的空间临近度因子,该空间临近度因子与所述关注区域到该地名地区之间的距离相关; 
将各关键词进行TF-IDF权值计算,将地名关键词的TF-IDF权值乘以其所对应的空间临近度因子; 
将TF-IDF权值满足一定条件的关键词放入到RSS Feed模型中的用户兴趣子集中;以及 
服务器根据该用户兴趣子集中的关键词为用户推荐信息。 
优选地,还包括步骤: 
所述服务器建立地名数据库并在RSS Feed信息模型中建立地名数据层; 
将所述地名关键词和空间临近度因子放入该地名数据库中;以及 
将地名关键词放入该地名数据层中并且所述用户兴趣子集中不包括该地名关键词,从而形成个性化RSS Feed信息模型。 
更优选地,所述TF-IDF权值由公式:TFIDFi,j=TFi,j×IDFi获得,其中: ni,j是该关键词在文件中的出现次数;|D|表示的是总的文件数量,表示的是包含词语ti的文件数量。 
更优选地,所述TF值进一步由公式: TF = ∂ × p title + β × p des + γ × p text 获得,其中:、β、γ分别表示关键词出现在标题、摘要和信息体原文中的频率,ptitle、pdes、ptext分别代表关键词出现在标题、摘要和信息体原文时的权重值。 
优选地,所述空间临近度因子Q(z)=exp(-ax),其中a是拉伸系数,当a等于0时Q(z)等于1,表示不考虑空间位置对关键词权重计算结果的影响,当a不等于0 时,x为两地区之间的距离。 
优选地,还包括步骤: 
所述服务器对所述包含有该地名信息的RSS Feed信息进行查全率和/或查准率验证,如果该查全率和/或查准率满足一定阙值时,服务器将包含有该地名信息的RSS Feed信息推送给用户; 
所述RSS Feed模型分为四层,分别为:用户信息层、信息类别层、用户兴趣子集层和地名数据层;该信息类别层包括:农地转出信息、农地转入信息、行政法规信息和/或交易流程信息。 
本发明的一种基于RSS的农用土地信息发送方法,其包括步骤: 
客户端接收自农用土地服务器根据XML生成至少一种RSS Feed信息; 
客户端的用户在订阅该RSS Feed信息时,输入至少一个关注区域信息,客户端将该信息发送至服务器; 
服务器根据地名匹配算法筛选出该关注区域内所包含的地名信息;以及 
客户端接收自包含有该地名信息的RSS Feed信息。 
本发明的一种基于RSS的农用土地信息发送系统,其包括如下模块: 
RSS信息发布模块:用于发布农用土地信息的服务器根据XML生成至少一种RSS Feed信息; 
信息接收模块:用于根据用户在订阅该RSS Feed信息时,接收该用户所输入的至少一个关注区域信息; 
信息匹配模块:用于根据地名匹配算法筛选出该关注区域内所包含的地名信息; 
RSS信息推送模块:用于将包含有该地名信息的RSS Feed信息推送给用户; 
信息反馈模块:用于获取来自于客户的浏览信息; 
关键词处理模块:用于将该浏览信息根据文本分词算法进行分词处理,得到至少一个关键词;从该关键词中获取至少一个地名关键词,根据所述关注区域获取该地名关键词所对应的空间临近度因子,该空间临近度因子与所述关注区域到该地名地区之间的距离相关;将各关键词进行TF-IDF权值计算,将地名关键词的TF-IDF权值乘以其所对应的空间临近度因子;将TF-IDF权值满足一定条件的关键词放入到RSS Feed模型中的用户兴趣子集中;以及 
信息推荐模块:用于根据该用户兴趣子集中的关键词为用户推荐信息。 
本发明的有益效果是:本发明由于将地名匹配技术结合到RSS信息推送技术中,并将改进后的RSS信息推送技术应用到农地流转信息推送领域,使得农地流转信息推送的准确性有显著提高,因而有益于促进农地流转业务发展的速度和规模。 
附图说明
图1为现有技术中基于RSS的农用土地信息发送方法的流程图; 
图2为本发明的基于RSS的农用土地信息发送方法的流程图; 
图3为本发明的地名匹配方法流程图; 
图4为本发明的涉及空间临近度因子的个性化RSS模型方框图; 
图5为我国县级及以上的行政区划代码图; 
图6为我国县级以下行政区划代码图。 
具体实施方式
下面结合附图对本发明做进一步地说明。 
本发明主要涉及两部分:一部分是基于地名匹配步骤的RSS的农用土地信息推送方法的改进,另一部分是在该基础上,对基于地名匹配步骤的RSS的农用土地信息推荐方法的改进。该RSS信息推送和信息推荐方法在这里统称为信息发送方法。 
如图1所示,该种基于RSS的农用土地信息发送方法,包括如下步骤: 
步骤101,建立农用土地信息网站,该网站服务器用于发布农用土地信息。步骤102,网站服务器根据XML生成算法生成至少一种RSS Feed信息。具体的:农地流转的网站提供者,将每一个类别的内容,例如所有的农地转出信息,按照RSS2.0的标准,将这部分信息写入到一个XML文件中,也就是RSS Feed中,之后将这个RSS Feed的链接发布在网站上,并以一定的方式对这个RSS Feed进行实时的更新,网站有几个提供订阅服务的信息类别,就发布几个对应类别的RSS Feed文件。 
步骤103,服务器根据用户在订阅该RSS Feed信息时,接收该用户所输入的至少一个关注区域信息。用户在订阅RSS信息时,除了订阅信息类别,还需要用户指明或输入所关心的行政区域范围,例如:重庆市长寿区和/或重庆市双龙区。该步骤的功能通常可以由安装在电脑或手机上的客户端软件实现。 
步骤104,服务器根据地名匹配算法筛选出该关注区域内所包含的地名信息。由于地名信息是土地流转信息中非常重要的一部分,大多数用户会通过地名来寻找土地。而且地名之间存在包含与被包含的空间关系,所以在进行土地流转信息推送时要着重关注地名信息。 
该地名匹配算法如图2所示,地名匹配即将地名与基准行政区划数据库中的地名属性做比较,找到其对应的行政区划编码,根据编码规则判断是否含有下级行政区划。如果含有,则返回下级行政区划名,并根据这些行政区划名排除干扰信息的过程,最后输出所有匹配出的地名信息。若对一组地名进行匹配分析,则找到对应行政区划编码后选取较小行政区域的行政区划编码进行判断。 
其中,行政区划代码标准是支我国经济发展和社会发展必不可少的基础标准之一,已经被广泛应用到各个政府部门和企事业单位的信息化工作中。中华人民共和国行政区划代码也称为行政代码,是国家各级行政机关的识别符号。目前描述全国行政区划代码的国家标准有两个,一个是《中华人名共和国行政区划代码》(GB/T2260),另一个是《县级以下行政区划代码编制规则》(GB/T 10114)。GB/T 2260规定了我国县级及以上的行政区划代码,由中华人名共和国国家统计局公布,其中前两位代表省(自治区、直辖市、特别行政区),第三、四位代表市(地区、自治州、盟及国家直属市所属市辖区和县的汇总码)、第五六位代表县(市辖区、县级市、旗)。如图5所示 
《GB/T 10114》规定了县级以下行政区代码的编码规则,在规则中规定县级及以下的行政区代码分为两段,由九位阿拉伯数字构成,前一段使用《GB/T 2260》中规定的六位数字代码,用来表示县级及县级以上的行政区划,后一段的三位阿拉伯数字表示县级以下的行政区划,其中以“0”开头表示街道或地区,以“1”开头表示镇或民族镇,以“2”或“3”开头表示民族乡、苏木,具体表示为: 
001~099表征的是街道(地区) 
100~199表征的是镇(民族镇) 
200~399表征的是乡、民族乡、苏木 
县级以下行政区划代码如图6所示 
县级以下的行政区划代码根据行政从属关系和上面列出的区划类型,经过统一排序后再进行编码。 
步骤105,服务器将包含有该地名信息的RSS Feed信息推送给用户。通过地名匹配步骤筛选出包含用户订阅的行政区范围下地名信息的信息条目,将这些信息条目推送给用户。 
最后,步骤106,通过XML解析算法,该RSS Feed信息在用户的客户端展示,用户通过客户端浏览信息。 
在此基础之上,本发明拟针对农地流转业务流程,对原RSS的用户兴趣模型进行改进,在地名匹配的基础上,将空间位置邻近度因子引入到推荐模型中,通过空 间位置邻近度因子对不同的地名关键词赋予不同的权重。 
该个性化RSS模型如图4所示,RSS的三层用户兴趣模型是一个树状的层次结构,树冠是用户模型的标识(用户名或设备ID),只是一个虚节点;第二层是频道类别,就是信息体归属的大抵种类(主题);第三层是用户兴趣的子集,这一层通过文本的相似度判断后利用自动聚类生成。本发明的农地流转信息的三层用户兴趣模型,树冠为移动设备的ID;第二层为信息的类别,与流转信息网站的信息归类相对应;第三层为主题信息的子类;最下面一层是用户兴趣地名数据层,这是本发明中新加的一层。 
RSS用户兴趣模型可基于TF-IDF算法计算关键词权重,从而挖掘用户潜在的感兴趣的信息,是系统信息推荐的基础。分词是TF-IDF算法的前期准备工作,经过分词步骤提取出关键词后,使用TF-IDF计算每个关键词的权重,权重值越大的关键词则更能代表用户感兴趣的信息内容,系统就可以将包含这些关键词的类似信息推送给用户了。 
本发明在RSS的TF-IDF关键词权重计算方法中,对地名关键词添加空间位置邻近度因子,体现信息推荐的地域性特点。新模型的基本思想是: 
1)在现有的RSS三层用户兴趣模型的基础上,引入地名数据层,构成基于RSS数据源的四层用户模型结构。 
2)在关键词权重TF-IDF算法中添加空间位置邻近度因子,在横向上,地名关键词权重与空间邻近度成正相关关系;从纵向上,地名之间属于包含关系,则空间位置邻近度因子为1。 
现结合图1和图4,该方法进一步包括:步骤107,服务器获取来自于客户的浏览信息,该浏览信息可以通过日常用户点击或用户反馈等方式获取。 
步骤108,将该浏览信息根据文本分词算法进行分词处理,得到至少一个关键词;从该关键词中获取至少一个地名关键词,根据所述关注区域信息获取该地名关键词所对应的空间临近度因子,该空间临近度因子与关注区域到该地名地区之间的距离相关,将各关键词进行TF-IDF权值计算,将地名关键词的TF-IDF权值乘以空间临近度因子,之后,将TF-IDF权值满足一定条件的关键词放入到RSS Feed模型中的用户兴趣子集中形成个性化RSS Feed。这里TF-IDF的满足条件可以为大于一个阙值或者将所有关键词进行排序,选择TF-IDF权值靠前的关键词。TF-IDF权值的满足条件可以由用户自己定义,这里不再额外举例。 
其中,基于RSS数据源的用户兴趣模型关键词权重TF-IDF算法: 
TF i , j = n i , j Σ kn k , j - - - ( 1 )
其中,ni,j是该关键词在文件dj中的出现次数,关键词就是将文件dj文本分词后,删除当中对于用户兴趣建模没有帮助的词(如感叹词、介词、连词、拟声词和助词等)之后剩下的词,分母则是在文件dj中所有关键词的出现次数之和。考虑到关键词出现的位置,那么: 
TF = ∂ × p title + β × p des + γ × p text - - - ( 2 )
式中,、β、γ分别表示关键词出现在标题、摘要和信息体原文中的频率,ptitle、pdes、ptext分别代表关键词出现在标题、摘要和信息体原文时的权重值,其取值范围为[0,1] 
其中,|D|表示的是总的文件数量;表示的是包含词语ti的文件数量。 
TFIDFi,j=TFi,j×IDFi        (4) 
转入和转出地块信息包含共同的关键信息:地块所在行政区域、地块面积、地块价格和土地利用类型,提取以上四类关键词作为农地转入用户和农地转出用户的兴趣信息模型关键词;就组织管理者而言,需要可能对农地转入、农地转出、交易动态、法律法规等一个类别或多个类别感兴趣,因此使用行政区区域关键词构建该类用户的用户兴趣信息模型。进行分词时,构建行政区域、地块面积、地块价格和土地类型词库样本,准确提取上述四类信息,并对四类关键词赋予较高的权重值,对于行政区域关键词,还需要在原权重值的基础上考虑空间邻近度因子。考虑空间位置邻近度因子的关键词权重TF-IDF算法: 
TFIDFi,j=TFi,j×IDFi×Q(z)      (5) 
式(5)中,Q(z)代表空间位置邻近度因子,是行政区之间距离的归一化函数,满足Q(z)=exp(-ax),其中a是拉伸系数,当a等于0时Q(z)等于1,表示不考虑空间位置对关键词权重计算结果的影响,当a不等于0时,x为行政区间距离,x值越大,则Q(z)值越小。 
在初始阶段,系统根据用户的类别按照上述用户兴趣信息模型提取关键词,计算关键词的权重并将相关信息推送给用户;通过用户浏览反馈积累一定数量的用户兴趣样本后,可以对某个用户的兴趣数据进行TF-IDF关键词权重计算,得到该用户感兴趣的其他关键词加入该用户的兴趣信息关键词模型,从而更新该用户兴趣信 息关键词模型。 
其中,所述服务器可以建立地名数据库并在RSS Feed信息模型中建立地名数据层;将所述地名关键词和空间临近度因子放入该地名数据库中;将地名关键词放入该地名数据层中并且所述用户兴趣子集中可以不包括该地名关键词,从而形成个性化RSS Feed信息模型。在生成个性化RSS Feed时,需要计算提取出的关键词的权重值。由于农地流转信息对地名信息十分敏感,所以在进行分词提取关键词时,应建立相应的地名词库,以便分词程序能准确提取出地名信息。 
该个性化RSS Feed模型分为四层:分别为:用户信息层、信息类别层、用户兴趣子集层和地名数据层,其中该信息类别层可包括:农地转出信息、农地转入信息、行政法规信息和交易流程等信息。 
最后,该服务器还可对所述包含有该地名信息的RSS Feed信息进行查全率和/或查准率验证,如果该查全率和/或查准率满足一定阙值时,服务器将包含有该地名信息的RSS Feed信息推送给用户。 
实施例: 
本发明以重庆市长寿区为例,建立基于RSS和地名匹配的农地流转信息推送机制。流程包括: 
1)建立农地流转网站,在网站中设置农地转入、农地转出、最新动态、政策法规四个频道,在每个频道下面录入包含地名信息的信息体,并给每一个频道发布添加地名匹配步骤的RSS服务。 
2)开发基于Android的RSS客户端软件,在软件登录时,模拟买方、卖方和组织管理者三类用户,分别订阅农地转出信息(A)、农地转入信息(B)和最新动态信息(C)三类信息,并假定三类用户关心的行政区范围为重庆市长寿区。 
3)计算空间位置邻近度因子,开发系统的信息推荐模块。根据重庆市长寿区各乡镇间距离计算得出空间位置临近度因子,结果如下表所示。 
重庆市长寿区各乡镇间空间位置临近度因子 
4)采用信息获取中的监测评估标准:查准率(Rprecision)、召回率(Rrecall)和F1综合分类率进行模型验证。 
查准率、召回率和F1测试值的计算公式如下: 
R precision = m 1 - - - ( 6 )
R recall = m n - - - ( 7 )
F 1 = R precision × R recall × 2 R precision + R recall - - - ( 8 )
式中,m为系统推送的相关信息体数目,l为系统总的推送的信息体数目,n为 所有相关的信息体数目。 
经试验,改进前后的RSS信息推送及推荐模型的实验结果比对如下:(表中以斜线分隔改进前后的数据) 
改进的RSS信息推送及推荐模型测试结果前后对比 
注:实验中,公式(2)的、β、γ均设为1,即不考虑关键词出现位置的影响 
原RSS信息推送模型只是粗略的对信息类别提供定制和聚合,并没有对信息内容提供进一步的筛选和过滤,信息推荐时也没有根据信息推送对象建立用户兴趣信息模型,由实验结果可以看出其应用于农地流转信息推送领域存在了大量的信息冗余,信息的查全率、查准率和综合分类率不高;在原RSS信息推送模型中添加地名匹配步骤,应用于农地流转领域得到了较好的查全率、查准率和综合分类率,说明添加地名匹配步骤的信息推送模型改进是有效的。 
本发明还涉及一种基于RSS的农用土地信息发送方法,其包括步骤:客户端接收自农用土地服务器根据XML生成至少一种RSS Feed信息。客户端的用户在订阅该RSS Feed信息时,输入至少一个关注区域信息,客户端将该信息发送至服务器。服务器根据地名匹配算法筛选出该关注区域内所包含的地名信息。客户端接收自包含有该地名信息的RSS Feed信息。 
与上述方法对应的,本发明还涉及一种基于RSS的农用土地信息发送系统,其包括如下模块: 
RSS信息发布模块:用于发布农用土地信息的服务器根据XML生成至少一种RSS Feed信息。 
信息接收模块:用于根据用户在订阅该RSS Feed信息时,接收该用户所输入的至少一个关注区域信息。 
信息匹配模块:用于根据地名匹配算法筛选出该关注区域内所包含的地名信息。 
RSS信息推送模块:用于将包含有该地名信息的RSS Feed信息推送给用户。 
信息反馈模块:用于获取来自于客户的浏览信息。 
关键词处理模块:用于将该浏览信息根据文本分词算法进行分词处理,得到至少一个关键词;从该关键词中获取至少一个地名关键词,根据所述关注区域获取该 地名关键词所对应的空间临近度因子,该空间临近度因子与所述关注区域到该地名地区之间的距离相关;将各关键词进行TF-IDF权值计算,将地名关键词的TF-IDF权值乘以其所对应的空间临近度因子;将TF-IDF权值满足一定条件的关键词放入到RSS Feed模型中的用户兴趣子集中。 
信息推荐模块:用于根据该用户兴趣子集中的关键词为用户推荐信息。 
需要注意的是,具体实施方式仅仅是对本发明技术方案的解释和说明,不应将其理解为对本发明技术方案的限定,任何采用本发明的技术方案而仅作局部改变的,仍应落入本发明的保护范围内。 

Claims (10)

1.一种基于RSS的农用土地信息发送方法,其特征在于包括步骤:
用于发布农用土地信息的服务器根据XML生成至少一种RSS Feed信息;
服务器根据用户在订阅该RSS Feed信息时,接收该用户所输入的至少一个关注区域信息;
服务器根据地名匹配算法筛选出该关注区域内所包含的地名信息;以及
服务器将包含有该地名信息的RSS Feed信息推送给用户。
2.根据权利要求1所述的基于RSS的农用土地信息发送方法,其特征在于:
所述地名匹配算法包括步骤:
a)将所述关注区域在基准行政区划数据库中进行匹配,找到该关注区域所对应的行政区划编码并存储;
b)根据该行政区划编码查找是否包含有下级行政区;
c)若有,则存储该行政区划代码并返回步骤b);
d)将所有存储的行政区划代码转换成对应的区域地名;以及
e)输出该区域地名信息。
3.根据权利要求1或2所述的基于RSS的农用土地信息发送方法,其特征在于还包括步骤:
服务器获取来自于客户的浏览信息;
将该浏览信息根据文本分词算法进行分词处理,得到至少一个关键词;
从该关键词中获取至少一个地名关键词,根据所述关注区域获取该地名关键词所对应的空间临近度因子,该空间临近度因子与所述关注区域到该地名地区之间的距离相关;
将各关键词进行TF-IDF权值计算,将地名关键词的TF-IDF权值乘以其所对应的空间临近度因子;
将TF-IDF权值满足一定条件的关键词放入到RSS Feed模型中的用户兴趣子集中;以及
服务器根据该用户兴趣子集中的关键词为用户推荐信息。
4.根据权利要求3所述的基于RSS的农用土地信息发送方法,其特征在于还包括步骤:
所述服务器建立地名数据库并在RSS Feed信息模型中建立地名数据层;
将所述地名关键词和空间临近度因子放入该地名数据库中;以及
将地名关键词放入该地名数据层中并且所述用户兴趣子集中不包括该地名关键词,从而形成个性化RSS Feed信息模型。
5.根据权利要求3或4所述的基于RSS的农用土地信息发送方法,其特征在于:所述TF-IDF权值由公式:TFIDFi,j=TFi,j×IDFi获得,其中:ni,j是该关键词在文件中的出现次数;|D|表示的是总的文件数量,表示的是包含词语ti的文件数量。
6.根据权利要求5所述的基于RSS的农用土地信息发送方法,其特征在于:所述TF值进一步由公式: TF = ∂ × p title + β × p des + γ × p text 获得,其中:β、γ分别表示关键词出现在标题、摘要和信息体原文中的频率,ptitle、pdes、ptext分别代表关键词出现在标题、摘要和信息体原文时的权重值。
7.根据权利要求3或4所述的基于RSS的农用土地信息发送方法,其特征在于:所述空间临近度因子Q(z)=exp(-ax),其中a是拉伸系数,当a等于0时Q(z)等于1,表示不考虑空间位置对关键词权重计算结果的影响,当a不等于0时,x为两地区之间的距离。
8.根据权利要求3或4所述的基于RSS的农用土地信息发送方法,其特征在于还包括步骤:
所述服务器对所述包含有该地名信息的RSS Feed信息进行查全率和/或查准率验证,如果该查全率和/或查准率满足一定阙值时,服务器将包含有该地名信息的RSS Feed信息推送给用户;
所述RSS Feed模型分为四层,分别为:用户信息层、信息类别层、用户兴趣子集层和地名数据层;该信息类别层包括:农地转出信息、农地转入信息、行政法规信息和/或交易流程信息。
9.一种基于RSS的农用土地信息发送方法,其特征在于包括步骤:
客户端接收自农用土地服务器根据XML生成至少一种RSS Feed信息;
客户端的用户在订阅该RSS Feed信息时,输入至少一个关注区域信息,客户端将该信息发送至服务器;
服务器根据地名匹配算法筛选出该关注区域内所包含的地名信息;以及
客户端接收自包含有该地名信息的RSS Feed信息。
10.一种基于RSS的农用土地信息发送系统,其特征在于包括如下模块:
RSS信息发布模块:用于发布农用土地信息的服务器根据XML生成至少一种RSS Feed信息;
信息接收模块:用于根据用户在订阅该RSS Feed信息时,接收该用户所输入的至少一个关注区域信息;
信息匹配模块:用于根据地名匹配算法筛选出该关注区域内所包含的地名信息;
RSS信息推送模块:用于将包含有该地名信息的RSS Feed信息推送给用户;
信息反馈模块:用于获取来自于客户的浏览信息;
关键词处理模块:用于将该浏览信息根据文本分词算法进行分词处理,得到至少一个关键词;从该关键词中获取至少一个地名关键词,根据所述关注区域获取该地名关键词所对应的空间临近度因子,该空间临近度因子与所述关注区域到该地名地区之间的距离相关;将各关键词进行TF-IDF权值计算,将地名关键词的TF-IDF权值乘以其所对应的空间临近度因子;将TF-IDF权值满足一定条件的关键词放入到RSS Feed模型中的用户兴趣子集中;以及
信息推荐模块:用于根据该用户兴趣子集中的关键词为用户推荐信息。
CN201410455932.5A 2014-09-09 2014-09-09 基于rss的农用土地信息发送方法和系统 Expired - Fee Related CN104199938B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410455932.5A CN104199938B (zh) 2014-09-09 2014-09-09 基于rss的农用土地信息发送方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410455932.5A CN104199938B (zh) 2014-09-09 2014-09-09 基于rss的农用土地信息发送方法和系统

Publications (2)

Publication Number Publication Date
CN104199938A true CN104199938A (zh) 2014-12-10
CN104199938B CN104199938B (zh) 2017-11-14

Family

ID=52085231

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410455932.5A Expired - Fee Related CN104199938B (zh) 2014-09-09 2014-09-09 基于rss的农用土地信息发送方法和系统

Country Status (1)

Country Link
CN (1) CN104199938B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105991407A (zh) * 2015-02-12 2016-10-05 腾讯科技(深圳)有限公司 一种消息处理方法、装置及处理服务器
CN107590190A (zh) * 2017-08-11 2018-01-16 中南民族大学 一种路网中空间文本发布订阅方法及其组合索引
CN108205545A (zh) * 2016-12-16 2018-06-26 百度在线网络技术(北京)有限公司 一种为用户提供推荐信息的方法与设备
CN109063065A (zh) * 2018-07-20 2018-12-21 政和科技股份有限公司 一种政策信息推送的方法及装置
CN109165367A (zh) * 2018-07-02 2019-01-08 昆明理工大学 一种基于rss订阅的新闻推荐方法
CN109388649A (zh) * 2018-09-28 2019-02-26 湖南土流信息有限公司 一种土地智能推荐方法及系统
CN112632376A (zh) * 2020-12-18 2021-04-09 张家港市鸿嘉数字科技有限公司 一种科技奖励申报信息推送方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100058196A1 (en) * 2008-09-04 2010-03-04 Quallcomm Incorporated Integrated display and management of data objects based on social, temporal and spatial parameters

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100058196A1 (en) * 2008-09-04 2010-03-04 Quallcomm Incorporated Integrated display and management of data objects based on social, temporal and spatial parameters

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘丽等: "省级国土资源数据中心数据库命名规则研究", 《地理信息世界》 *
曾慧敏等: "RSS信息推送技术在农村信息化中的应用", 《中国农村小康科技》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105991407A (zh) * 2015-02-12 2016-10-05 腾讯科技(深圳)有限公司 一种消息处理方法、装置及处理服务器
CN108205545A (zh) * 2016-12-16 2018-06-26 百度在线网络技术(北京)有限公司 一种为用户提供推荐信息的方法与设备
CN108205545B (zh) * 2016-12-16 2022-06-10 百度在线网络技术(北京)有限公司 一种为用户提供推荐信息的方法与设备
CN107590190A (zh) * 2017-08-11 2018-01-16 中南民族大学 一种路网中空间文本发布订阅方法及其组合索引
CN107590190B (zh) * 2017-08-11 2019-12-03 中南民族大学 一种路网中空间文本发布订阅方法及其组合索引
CN109165367A (zh) * 2018-07-02 2019-01-08 昆明理工大学 一种基于rss订阅的新闻推荐方法
CN109165367B (zh) * 2018-07-02 2021-09-14 昆明理工大学 一种基于rss订阅的新闻推荐方法
CN109063065A (zh) * 2018-07-20 2018-12-21 政和科技股份有限公司 一种政策信息推送的方法及装置
CN109388649A (zh) * 2018-09-28 2019-02-26 湖南土流信息有限公司 一种土地智能推荐方法及系统
CN112632376A (zh) * 2020-12-18 2021-04-09 张家港市鸿嘉数字科技有限公司 一种科技奖励申报信息推送方法及装置

Also Published As

Publication number Publication date
CN104199938B (zh) 2017-11-14

Similar Documents

Publication Publication Date Title
Waters Tobler’s first law of geography
CN104199938A (zh) 基于rss的农用土地信息发送方法和系统
CN101408886B (zh) 通过分析文档的段落来选择该文档的标签
CN103294781B (zh) 一种用于处理页面数据的方法与设备
CN101430695B (zh) 用于计算单词之间的差相关度的系统和方法
CN102880623B (zh) 同名人物搜索方法及系统
CN103023714B (zh) 基于网络话题的活跃度与集群结构分析系统及方法
CN111324602A (zh) 一种实现面向金融大数据分析可视化方法
CN105740366A (zh) 微博用户兴趣推理方法及装置
US20110153683A1 (en) Method and system for generating visual representations of data
Chapman Principles and methods of data cleaning
CN105930469A (zh) 基于Hadoop的个性化旅游推荐系统及方法
CN108710663A (zh) 一种基于本体模型的数据匹配方法及系统
CN105069122A (zh) 一种基于用户行为的个性化推荐方法及其推荐装置
CN110110156A (zh) 行业舆情监控方法、装置、计算机设备及存储介质
CN106156135A (zh) 查询数据的方法及装置
CN104978314A (zh) 媒体内容推荐方法及装置
CN103838798A (zh) 页面分类系统及页面分类方法
CN105677828A (zh) 基于大数据的用户信息处理方法
CN114896423A (zh) 一种企业基本信息知识图谱的构建方法及系统
CN104536957B (zh) 农用土地流转信息检索方法和系统
CN102799586B (zh) 一种用于搜索结果排序的转义度确定方法和装置
CN102254025B (zh) 信息回忆检索方法
CN105677825A (zh) 客户端浏览操作的分析方法
CN106874368A (zh) 一种rtb竞价广告位价值分析方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20171114

Termination date: 20180909