CN110119453A - 一种基于WebGIS的地方志文献可视化方法及系统 - Google Patents
一种基于WebGIS的地方志文献可视化方法及系统 Download PDFInfo
- Publication number
- CN110119453A CN110119453A CN201910184369.5A CN201910184369A CN110119453A CN 110119453 A CN110119453 A CN 110119453A CN 201910184369 A CN201910184369 A CN 201910184369A CN 110119453 A CN110119453 A CN 110119453A
- Authority
- CN
- China
- Prior art keywords
- local chronicle
- module
- webgis
- local
- chronicle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/44—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/45—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/048—Fuzzy inferencing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Fuzzy Systems (AREA)
- Automation & Control Theory (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于地方志文献可视化技术领域,公开了一种基于WebGIS的地方志文献可视化方法及系统,基于WebGIS的地方志文献可视化系统包括扫描模块、主控模块、地方志数据分类模块、地理位置匹配模块、数图转换模块、融合模块、搜索优化模块、数据存储模块、显示模块。本发明通过融合模块结合了模糊集理论,融合效率较高;添加了先验知识,结果更可靠;同时,通过搜索优化模块在进行搜索前对默认词库进行了针对性的词汇补充,提高了词法分析的准确度;优化了搜索算法匹配度的计算公式,使得搜索结果更加精确,并对中间间隔的词语进行了标注,极大限度的保护了用户输入的语义特征,大大提高了地方志知识搜索结果可靠性。
Description
技术领域
本发明属于地方志文献可视化技术领域,尤其涉及一种基于WebGIS的地 方志文献可视化方法及系统。
背景技术
WebGIS(网络地理信息系统)是指工作在Web网上的GIS可以实现空间 数据的检索、查询、制图输出、编辑等GIS基本功能,同时也是Internet上地 理信息发布、共享和交流协作的基础。WebGIS:通过互联网对地理空间数据进 行发布和应用,以实现空间数据的共享和互操作,如GIS信息的在线查询和业 务处理等。GIS通过Web功能得以扩展,真正成为一种大众使用的工具。使GIS 进入千家万户。GIS地理信息系统(Geographic InformationSystem,GIS)有时 又称为“地学信息系统”。它是在计算机硬、软件系统支持下,对整个或部分 地球表层(包括大气层)空间中的有关地理分布数据进行采集、储存、管理、 运算、分析、显示和描述的技术系统。地方志,古称地志、地记、图经、方志 等,是指全面、系统地记述本行政区域自然、政治、经济、文化、社会的历史 与现状的资料性文献。然而,现有由于地方志知识库庞杂,其运算量随知识源 数的增加而呈指数增长趋势;其次,融合过程复杂,限制条件较多,在融合处 理中往往给出过高估计,其判别决策含有更多的主观性;同时,对地方志知识 搜索结果可靠性差。
综上所述,现有技术存在的问题是:
现有由于地方志知识库庞杂,其运算量随知识源数的增加而呈指数增长趋 势;其次,融合过程复杂,限制条件较多,在融合处理中往往给出过高估计, 其判别决策含有更多的主观性;同时,对地方志知识搜索结果可靠性差。现有 扫描仪测量模型参数估计不准,同时噪音大。
现有数据分类软件出错率高,分类功能不强。
发明内容
针对现有技术存在的问题,本发明提供了一种基于WebGIS的地方志文献 可视化方法及系统。
本发明是这样实现的,一种基于WebGIS的地方志文献可视化方法包括:
利用扫描仪将地方志文献书籍转换成可编辑的电子数据;
利用数据分类软件将转换的电子数据进行主题分类;
利用匹配程序将电子数据中的地理信息与WebGIS中的经纬度坐标进行匹 配并标注;
利用制图软件将电子数据制作成表格、图形、图标、视频可视化信息;
对地方志知识进行融合操作;利用优化算法对地方志知识搜索进行优化;
利用存储器将地方志电子数据、可视化数据进行存储;利用显示器显示地 方志数据。
进一步,融合方法包括:
(1)建立地方志本体库,根据地方志特征进行分类,为每个类别建立本体库, 包括地名本体库、人物本体库、事件本体库、景观本体库;
(2)知识模糊化,调用知识模糊化接口,将输入的精确量转化成模糊量,即 将知识元名称、属性、关系三个维度中对应相似元素的个数分别转化为对应模 糊集合的隶属度;
(3)知识模糊推理,用模糊量去适配融合规则得到融合量,该推理过程是基 于模糊逻辑中的蕴含关系及推理规则来进行的,规则库包括了用模糊语言变量 表示的一系列融合规则,反映了领域专家的经验和知识;
(4)知识清晰化,将融合量变换为实际用于相似度判断的清晰量,把分布范 围概括合并成单点的输出值,同时消除具有歧义的输出结果;
(5)知识可视化,运用可视化工具对融合结果进行布局、颜色调整、大小设 定,为用户提供一个可视化知识界面。
进一步,所述步骤(1)中所述建立地方志本体库的具体过程包括:
地方志资源包括文本文档、或地方志图像、或地方志音视频片段,采用URI 来进行定位处理,通过使用路径进行表示;
建立地方志领域本体,运用本体构建工具,依据地名、人物、事件、景观 地方志类别划分结构,从而形成本体类的树状结构,本体中的最小单元为知识 元,通过名称、属性、关系三元组表示。
进一步,所述搜索优化方法包括:
1)调用地方志分词算法,用于统计生成地方志的补充词汇,将默认词库中 没有的词汇补充在自定义词库中,提高分词的准确性;
2)调用融合词语序列特征的搜索优化算法,通过比对词语序列特征,修正 默认搜索算法的评分值,返回更加符合用户的语义的搜索结果,进而提高搜索 的精确度。
进一步,所述地方志分词算法,是结合词频统计和聚类算法,筛选出搜索 文献集合中出现的高频词汇,然后经过过滤,将默认词库中没有的词汇补充在 自定义词库中;其中,自定义词库包括扩展词汇和禁用词汇,用来调整当前搜 索的需求;
所述融合词语序列特征的搜索优化算法用于优化搜索评分规则,通过对词 序相似度的量化计算公式,反映出句子之间的词序关系,进行评分,修正BM25 算法或VSM算法,最终计算出修正后的分值;词序相似度计算函数公式包括:
其中1≤OrderSeq(q,d)≤Set(q,d)其中SeqScore(q,d)表示用户输入的查 询语句q与文档d中相似语句的词序相似度得分;Set(q,d)表示在q、d中都出 现的词语的数量。
本发明的另一目的在于提供一种基于WebGIS的地方志文献可视化程序,运 行与终端,所述基于WebGIS的地方志文献可视化程序实现所述的基于WebGIS 的地方志文献可视化方法。
本发明的另一目的在于提供一种终端,所述终端搭载实现所述基于WebGIS 的地方志文献可视化方法的处理器。
本发明的另一目的在于提供一种计算机可读存储介质,包括指令,当其在 计算机上运行时,使得计算机执行所述的基于WebGIS的地方志文献可视化方法。
本发明的另一目的在于提供一种基于WebGIS的地方志文献可视化系统包 括:
扫描模块,与主控模块连接,用于通过扫描仪将地方志文献书籍转换成可 编辑的电子数据;
主控模块,与扫描模块、地方志数据分类模块、地理位置匹配模块、数图 转换模块、融合模块、搜索优化模块、数据存储模块、显示模块连接,用于通 过单片机控制各个模块正常工作;
地方志数据分类模块,与主控模块连接,用于通过数据分类软件将转换的 电子数据进行主题分类;
地理位置匹配模块,与主控模块连接,用于通过匹配程序将电子数据中的 地理信息与WebGIS中的经纬度坐标进行匹配并标注;
数图转换模块,与主控模块连接,用于通过制图软件将电子数据制作成表 格、图形、图标、视频等可视化信息;
融合模块,与主控模块连接,用于对地方志知识进行融合操作;
搜索优化模块,与主控模块连接,用于通过优化算法对地方志知识搜索进 行优化;
数据存储模块,与主控模块连接,用于通过存储器将地方志电子数据、可 视化数据进行存储;
显示模块,与主控模块连接,用于通过显示器显示地方志电子数据、可视 化数据。
本发明的另一目的在于提供一种搭载所述基于WebGIS的地方志文献可视 化系统的基于WebGIS的地方志文献可视化显示设备。
本发明的优点及积极效果为:
本发明通过融合模块结合了模糊集理论,融合效率较高;添加了先验知识, 结果更可靠;同时,通过搜索优化模块在进行搜索前对默认词库进行了针对性 的词汇补充,提高了词法分析的准确度;优化了搜索算法匹配度的计算公式, 使得搜索结果更加精确,将最接近的文章排序在列表最顶端,这正是用户希望 搜索到的结果;提取搜索语句对应文本中所有相同的词语,量化计算序列特征, 并对中间间隔的词语进行了标注,极大限度的保护了用户输入的语义特征,大 大提高了地方志知识搜索结果可靠性。
本发明利用基于空间球的模型参数标定算法根据球状标定物上各扫描点与 标定球球心的距离约束条件,建立扫描仪模型参数和标定球参数的非线性目标 函数;综合采用入侵性杂草优化算法和Levenberg-Marquar dt算法优化该目标函数,以实现扫描仪模型参数标定;通过增加标定球上的 扫描点数,能够减弱扫描仪测量噪声对标定精度的影响,从而提高算法的模型 参数标定精度。
本发明采用的基于聚类融合欠抽样改进AdaBoost算法的数据分类软件首先 聚类融合,相比单一聚类算法,聚类效果更好、更稳定;再使用欠抽样平衡训 练集的样本分布,相比随机欠抽样,基于聚类的欠抽样可以更好地抽取具有代 表性的样本,抽取的样本能较好地反映原始样本分布;然后,模型借鉴Ada Boost算法框架,算法根据分类器对正类和负类不同的分类情况,调整其 权值,并使得错分类的正类具有更大的权重,以便让后续训练过程更加关注这 类正类样本的分类;最后使用选择性集成策略,得到最后的强分类器。
附图说明
图1是本发明实施例提供的基于WebGIS的地方志文献可视化方法流程图。
图2是本发明实施例提供的基于WebGIS的地方志文献可视化系统结构框 图。
图中:1、扫描模块;2、主控模块;3、地方志数据分类模块;4、地理位 置匹配模块;5、数图转换模块;6、融合模块;7、搜索优化模块;8、数据存 储模块;9、显示模块。
具体实施方式
为能进一步了解本发明的发明内容、特点及功效,兹例举以下实施例,并 配合附图详细说明包括。
现有由于地方志知识库庞杂,其运算量随知识源数的增加而呈指数增长趋 势;其次,融合过程复杂,限制条件较多,在融合处理中往往给出过高估计, 其判别决策含有更多的主观性;同时,对地方志知识搜索结果可靠性差。现有 扫描仪测量模型参数估计不准,同时噪音大。现有数据分类软件出错率高,分 类功能不强。
为解决上述技术问题,下面结合附图对本发明的结构作详细的描述。
如图1所示,本发明实施例提供的基于WebGIS的地方志文献可视化方法 包括以下步骤:
S101,利用基于IWO算法和LM算法进行优化的扫描仪将地方志文献书籍 转换成可编辑的电子数据。
S102,利用基于聚类融合欠抽样改进AdaBoost算法的数据分类软件将转换 的电子数据进行主题分类。
S103,利用匹配程序将电子数据中的地理信息与WebGIS中的经纬度坐标 进行匹配并标注。
S104,利用制图软件将电子数据制作成表格、图形、图标、视频等可视化 信息。
S105,对地方志知识进行融合操作。利用优化算法对地方志知识搜索进行 优化。
S106,利用存储器将地方志电子数据、可视化数据进行存储。并利用显示 器显示地方志数据。
步骤S101中,本发明实施例提供的基于IWO算法和LM算法进行优化具 体步骤包括:
(1)将标定球放置于扫描仪前方,其球心Os的坐标记为ps=(xs,ys,zs)T, 半径记为R,通过云台的偏转运动,对该标定球进行扫描。假设标定球上扫描 点Pi,j(i=1,2,…,N;j=1,2,…,Ni)的扫描仪测量值为其中表示云台偏转角,βi,j为测量角度,ρi,j为测量距离。
(2)初始化IWO算法,给定解空间维数D=6、初始种群数m0和最大种群 数mmax、单个杂草产生的最小种子数smin和最大种子数smax、最大迭代次数 kmax、非线性调制指数p、种子正态扩散的各维最小标准差σmin,i(i=1,2,…, D)以及式(1)可行解的取值范围[qmin,qmax]。计算种子正态随机扩散的 各维最大标准差其中i=1,2,…,D。令迭代次 数k为0,当前种群数mk为m0,将式(1)作为杂草的适应度函数,随机初始化 由m0个杂草组成的原始种群
式(1)包括:
其中,N为标定球上扫描位置数。Ni为第i次扫描时标定球上的扫描点数。
(3)根据式(2)计算种群Ωk中各个杂草α=1,2,…,mk产生的种子数式(2)包括:
式中,为第k次迭代后杂草α的位置。为杂草的适应度。和分别为第k次迭代后种群中所有杂草的最小和最大适应度。smin和smax分别为单个杂草所能产生的最小和最大种子数。为下取整函数。 mk为第k次迭代后的种群数。
(4)根据式(3)计算种子正态随机扩散的各维标准差 并对各种子在其父代杂草个体附近进行正态随机扩散。按照可行 解的取值范围,对空间扩散后的各个种子进行箝位操作。
式(3)包括:
式中:kmax为最大迭代次数。上标p为非线性调制指数。σmin,i和σmax,i分 别为解空间的第i维分量的最小和最大标准差。
(5)计算第k+1次迭代中生成的种子总数若Wk+1+ mk≤mmax,则由种群Ωk中所有杂草及其后代组成第k+1次迭代后的种群 Ωk+1,并且令mk+1=Wk+1+mk。否则,将种群Ωk中各个杂草及其后代按照适 应度大小排序,将适应度最小的前mmax个个体组成种群Ωk+1,并且令mk+1= mmax。
(6)迭代次数k增加1,若k<kmax成立,则转到步骤(3)。否则,IWO 算法终止迭代,转到步骤(7)。
(7)将IWO算法第kmax次迭代后的种群中具有最小适应度的杂草位置作为LM算法的初值,利用LM算法对式(1)进行优化,所求得的Δx 和Δy的最优解即为扫描仪模型参数的标定值。
步骤S102中,本发明实施例提供的基于聚类融合欠抽样改进AdaBoost算法 具体包括:
给定训练集S={(x1,y1),(x2,y2),…,(xN,yN)}和预定的 迭代次数T,ωt(i)表示第t轮迭代中样本xi的权值。
(1)重复使用K均值算法产生h个聚类结果,共识函数使用Fred提出的 Co-association矩阵方法,将训练样本聚成c个簇,分别记为C1,C2,…,Cc。
(2)按照下式初始化样本权重。
(3)For t=1,2,3,…,T。
1)根据各个簇中负类数与正类的比率,从每个簇中抽取部分负类与所有正类合并成1∶1平衡数据集用于下面的分类 器训练。每个簇中负类样本被抽中的概率与样本权重相关,MajSize为负类样本 总数,则每个簇中抽取的负类样本数:
2)使用弱学习算法训练得到分类器ht。
3)按照下式计算ht在当前样本分布上的训练误差。
4)按照下式计算弱分类器ht的权值。
5)样本被正确分类:
负类样本被错误分类:
正类样本被错误分类:
(4)通过遗传算法选择出差异度比较大的分类器,选择性集成得到最后的 强分类器:
其中,NUM为最后集成的分类器数目。
如图2所示,本发明实施例提供的基于WebGIS的地方志文献可视化系统 包括:扫描模块1、主控模块2、地方志数据分类模块3、地理位置匹配模块4、 数图转换模块5、融合模块6、搜索优化模块7、数据存储模块8、显示模块9。
扫描模块1,与主控模块2连接,用于通过扫描仪将地方志文献书籍转换成 可编辑的电子数据。
主控模块2,与扫描模块1、地方志数据分类模块3、地理位置匹配模块4、 数图转换模块5、融合模块6、搜索优化模块7、数据存储模块8、显示模块9 连接,用于通过单片机控制各个模块正常工作。
地方志数据分类模块3,与主控模块2连接,用于通过数据分类软件将转换 的电子数据进行主题分类。
地理位置匹配模块4,与主控模块2连接,用于通过匹配程序将电子数据中 的地理信息与WebGIS中的经纬度坐标进行匹配并标注。
数图转换模块5,与主控模块2连接,用于通过制图软件将电子数据制作成 表格、图形、图标、视频等可视化信息。
融合模块6,与主控模块2连接,用于对地方志知识进行融合操作。
搜索优化模块7,与主控模块2连接,用于通过优化算法对地方志知识搜索 进行优化。
数据存储模块8,与主控模块2连接,用于通过存储器将地方志电子数据、 可视化数据进行存储。
显示模块9,与主控模块2连接,用于通过显示器显示地方志电子数据、可 视化数据。
本发明提供的融合模块6融合方法包括:
(1)建立地方志本体库,根据地方志特征进行分类,为每个类别建立本体库, 包括地名本体库、人物本体库、事件本体库、景观本体库。
(2)知识模糊化,调用知识模糊化接口,将输入的精确量转化成模糊量,即 将知识元名称、属性、关系三个维度中对应相似元素的个数分别转化为对应模 糊集合的隶属度。
(3)知识模糊推理,用模糊量去适配融合规则得到融合量,该推理过程是基 于模糊逻辑中的蕴含关系及推理规则来进行的,规则库包括了用模糊语言变量 表示的一系列融合规则,反映了领域专家的经验和知识。
(4)知识清晰化,将融合量变换为实际用于相似度判断的清晰量,把分布范 围概括合并成单点的输出值,同时消除具有歧义的输出结果。
(5)知识可视化,运用可视化工具对融合结果进行布局、颜色调整、大小设 定,为用户提供一个可视化知识界面。
本发明提供的步骤(1)中所述建立地方志本体库的具体过程包括:
针对实际的地方志资源,该资源是文本文档、或地方志图像、或地方志音 视频片段,采用URI来进行定位处理,通过使用路径来进行表示。
建立地方志领域本体,运用本体构建工具,依据地名、人物、事件、景观 地方志类别划分结构,从而形成本体类的树状结构,本体中的最小单元为知识 元,通过名称、属性、关系三元组表示。
本发明提供的搜索优化模块7优化方法包括:
1)调用地方志分词算法,用于统计生成地方志的补充词汇,将默认词库中 没有的词汇补充在自定义词库中,提高分词的准确性。
2)调用融合词语序列特征的搜索优化算法,通过比对词语序列特征,修正 默认搜索算法的评分值,返回更加符合用户的语义的搜索结果,进而提高搜索 的精确度。
本发明提供的地方志分词算法,是结合词频统计和聚类算法,筛选出搜索 文献集合中出现的高频词汇,然后经过过滤,将默认词库中没有的词汇补充在 自定义词库中。其中,自定义词库包括扩展词汇和禁用词汇,用来调整当前搜 索的需求。
本发明提供的融合词语序列特征的搜索优化算法,是用于优化搜索评分规 则,通过对词序相似度的量化计算公式,有效反映出句子之间的词序关系,进 行评分,修正BM25算法或VSM算法,最终计算出修正后的分值。本算法的词序 相似度计算函数公式包括:
其中1≤OrderSeq(q,d)≤Set(q,d)其中SeqScore(q,d)表示用户输入的查 询语句q与文档d中相似语句的词序相似度得分。Set(q,d)表示在q、d中都出 现的词语的数量。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组 合来实现。当使用全部或部分地以计算机程序产品的形式实现,所述计算机程 序产品包括一个或多个计算机指令。在计算机上加载或执行所述计算机程序指 令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可 以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算 机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向 另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、 计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL)或 无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据 中心进行传输)。所述计算机可读取存储介质可以是计算机能够存取的任何可用 介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。 所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、 或者半导体介质(例如固态硬盘Solid State Disk(SSD)等。
以上所述仅是对本发明的较佳实施例而已,并非对本发明作任何形式上的 限制,凡是依据本发明的技术实质对以上实施例所做的任何简单修改,等同变 化与修饰,均属于本发明技术方案的范围内。
Claims (10)
1.一种基于WebGIS的地方志文献可视化方法,其特征在于,所述基于WebGIS的地方志文献可视化方法包括:
利用扫描仪将地方志文献书籍转换成可编辑的电子数据;
利用数据分类软件将转换的电子数据进行主题分类;
利用匹配程序将电子数据中的地理信息与WebGIS中的经纬度坐标进行匹配并标注;
利用制图软件将电子数据制作成表格、图形、图标、视频可视化信息;
对地方志知识进行融合操作;利用优化算法对地方志知识搜索进行优化;
利用存储器将地方志电子数据、可视化数据进行存储;利用显示器显示地方志数据。
2.如权利要求1所述基于WebGIS的地方志文献可视化方法,其特征在于,融合方法包括:
(1)建立地方志本体库,根据地方志特征进行分类,为每个类别建立本体库,包括地名本体库、人物本体库、事件本体库、景观本体库;
(2)知识模糊化,调用知识模糊化接口,将输入的精确量转化成模糊量,即将知识元名称、属性、关系三个维度中对应相似元素的个数分别转化为对应模糊集合的隶属度;
(3)知识模糊推理,用模糊量去适配融合规则得到融合量,该推理过程是基于模糊逻辑中的蕴含关系及推理规则来进行的,规则库包括了用模糊语言变量表示的一系列融合规则,反映了领域专家的经验和知识;
(4)知识清晰化,将融合量变换为实际用于相似度判断的清晰量,把分布范围概括合并成单点的输出值,同时消除具有歧义的输出结果;
(5)知识可视化,运用可视化工具对融合结果进行布局、颜色调整、大小设定,为用户提供一个可视化知识界面。
3.如权利要求2所述基于WebGIS的地方志文献可视化方法,其特征在于,所述步骤(1)中所述建立地方志本体库的具体过程包括:
地方志资源包括文本文档、或地方志图像、或地方志音视频片段,采用URI来进行定位处理,通过使用路径进行表示;
建立地方志领域本体,运用本体构建工具,依据地名、人物、事件、景观地方志类别划分结构,从而形成本体类的树状结构,本体中的最小单元为知识元,通过名称、属性、关系三元组表示。
4.如权利要求1所述基于WebGIS的地方志文献可视化方法,其特征在于,所述搜索优化方法包括:
1)调用地方志分词算法,用于统计生成地方志的补充词汇,将默认词库中没有的词汇补充在自定义词库中,提高分词的准确性;
2)调用融合词语序列特征的搜索优化算法,通过比对词语序列特征,修正默认搜索算法的评分值,返回更加符合用户的语义的搜索结果,进而提高搜索的精确度。
5.如权利要求4所述基于WebGIS的地方志文献可视化方法,其特征在于,所述地方志分词算法,是结合词频统计和聚类算法,筛选出搜索文献集合中出现的高频词汇,然后经过过滤,将默认词库中没有的词汇补充在自定义词库中;其中,自定义词库包括扩展词汇和禁用词汇,用来调整当前搜索的需求;
所述融合词语序列特征的搜索优化算法用于优化搜索评分规则,通过对词序相似度的量化计算公式,反映出句子之间的词序关系,进行评分,修正BM25算法或VSM算法,最终计算出修正后的分值;词序相似度计算函数公式包括:
其中1≤OrderSeq(q,d)≤Set(q,d)其中SeqScore(q,d)表示用户输入的查询语句q与文档d中相似语句的词序相似度得分;Set(q,d)表示在q、d中都出现的词语的数量。
6.一种基于WebGIS的地方志文献可视化程序,运行与终端,其特征在于,所述基于WebGIS的地方志文献可视化程序实现权利要求1~5任意一项所述的基于WebGIS的地方志文献可视化方法。
7.一种终端,其特征在于,所述终端搭载实现权利要求1~5任意一项所述基于WebGIS的地方志文献可视化方法的处理器。
8.一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行如权利要求1-5任意一项所述的基于WebGIS的地方志文献可视化方法。
9.一种基于WebGIS的地方志文献可视化系统,其特征在于,所述基于WebGIS的地方志文献可视化系统包括:
扫描模块,与主控模块连接,用于通过扫描仪将地方志文献书籍转换成可编辑的电子数据;
主控模块,与扫描模块、地方志数据分类模块、地理位置匹配模块、数图转换模块、融合模块、搜索优化模块、数据存储模块、显示模块连接,用于通过单片机控制各个模块正常工作;
地方志数据分类模块,与主控模块连接,用于通过数据分类软件将转换的电子数据进行主题分类;
地理位置匹配模块,与主控模块连接,用于通过匹配程序将电子数据中的地理信息与WebGIS中的经纬度坐标进行匹配并标注;
数图转换模块,与主控模块连接,用于通过制图软件将电子数据制作成表格、图形、图标、视频可视化信息;
融合模块,与主控模块连接,用于对地方志知识进行融合操作;
搜索优化模块,与主控模块连接,用于通过优化算法对地方志知识搜索进行优化;
数据存储模块,与主控模块连接,用于通过存储器将地方志电子数据、可视化数据进行存储;
显示模块,与主控模块连接,用于通过显示器显示地方志电子数据、可视化数据。
10.一种搭载权利要求9所述基于WebGIS的地方志文献可视化系统的基于WebGIS的地方志文献可视化显示设备。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910184369.5A CN110119453A (zh) | 2019-03-12 | 2019-03-12 | 一种基于WebGIS的地方志文献可视化方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910184369.5A CN110119453A (zh) | 2019-03-12 | 2019-03-12 | 一种基于WebGIS的地方志文献可视化方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110119453A true CN110119453A (zh) | 2019-08-13 |
Family
ID=67520484
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910184369.5A Pending CN110119453A (zh) | 2019-03-12 | 2019-03-12 | 一种基于WebGIS的地方志文献可视化方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110119453A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112434117A (zh) * | 2020-11-05 | 2021-03-02 | 广州和辰信息科技有限公司 | 一种基于Vue的WebGIS的可视化配置方法和系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030084105A1 (en) * | 2001-10-31 | 2003-05-01 | Wiley Jeffrey G. | Methods for providing a remote document history repository and multifunction device therefor |
US20140108901A1 (en) * | 2012-10-17 | 2014-04-17 | International Business Machines Corporation | Web Browser Bookmark Reconciliation |
CN103838833A (zh) * | 2014-02-24 | 2014-06-04 | 华中师范大学 | 基于相关词语语义分析的全文检索系统 |
CN107545034A (zh) * | 2017-07-24 | 2018-01-05 | 华中师范大学 | 一种地方志知识融合方法 |
CN107562450A (zh) * | 2017-07-24 | 2018-01-09 | 华中师范大学 | 一种地方志资源跨平台可视化方法 |
CN107562451A (zh) * | 2017-07-24 | 2018-01-09 | 华中师范大学 | 一种基于WebGIS的地方志文献可视化方法 |
CN107609006A (zh) * | 2017-07-24 | 2018-01-19 | 华中师范大学 | 一种基于地方志研究的搜索优化方法 |
-
2019
- 2019-03-12 CN CN201910184369.5A patent/CN110119453A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030084105A1 (en) * | 2001-10-31 | 2003-05-01 | Wiley Jeffrey G. | Methods for providing a remote document history repository and multifunction device therefor |
US20140108901A1 (en) * | 2012-10-17 | 2014-04-17 | International Business Machines Corporation | Web Browser Bookmark Reconciliation |
CN103838833A (zh) * | 2014-02-24 | 2014-06-04 | 华中师范大学 | 基于相关词语语义分析的全文检索系统 |
CN107545034A (zh) * | 2017-07-24 | 2018-01-05 | 华中师范大学 | 一种地方志知识融合方法 |
CN107562450A (zh) * | 2017-07-24 | 2018-01-09 | 华中师范大学 | 一种地方志资源跨平台可视化方法 |
CN107562451A (zh) * | 2017-07-24 | 2018-01-09 | 华中师范大学 | 一种基于WebGIS的地方志文献可视化方法 |
CN107609006A (zh) * | 2017-07-24 | 2018-01-19 | 华中师范大学 | 一种基于地方志研究的搜索优化方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112434117A (zh) * | 2020-11-05 | 2021-03-02 | 广州和辰信息科技有限公司 | 一种基于Vue的WebGIS的可视化配置方法和系统 |
CN112434117B (zh) * | 2020-11-05 | 2021-07-30 | 广州和辰信息科技有限公司 | 一种基于Vue的WebGIS的可视化配置方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111753060B (zh) | 信息检索方法、装置、设备及计算机可读存储介质 | |
Mousavi et al. | Designing a model of intuitionistic fuzzy VIKOR in multi-attribute group decision-making problems | |
CN101315663B (zh) | 一种基于区域潜在语义特征的自然场景图像分类方法 | |
CN114841257B (zh) | 一种基于自监督对比约束下的小样本目标检测方法 | |
CN108288067A (zh) | 图像文本匹配模型的训练方法、双向搜索方法及相关装置 | |
CN108959305A (zh) | 一种基于互联网大数据的事件抽取方法及系统 | |
CN109697289A (zh) | 一种改进的用于命名实体识别的主动学习方法 | |
CN108710894A (zh) | 一种基于聚类代表点的主动学习标注方法和装置 | |
CN113032613B (zh) | 一种基于交互注意力卷积神经网络的三维模型检索方法 | |
CN117390497B (zh) | 基于大语言模型的类目预测方法、装置和设备 | |
CN113569895A (zh) | 图像处理模型训练方法、处理方法、装置、设备及介质 | |
CN109271546A (zh) | 图像检索特征提取模型建立、数据库建立及检索方法 | |
CN107305565A (zh) | 信息处理装置、信息处理方法以及信息处理设备 | |
CN113934835B (zh) | 结合关键词和语义理解表征的检索式回复对话方法及系统 | |
CN116701734B (zh) | 地址文本的处理方法、设备及计算机可读存储介质 | |
CN111339258B (zh) | 基于知识图谱的大学计算机基础习题推荐方法 | |
CN110119453A (zh) | 一种基于WebGIS的地方志文献可视化方法及系统 | |
CN113723111B (zh) | 一种小样本意图识别方法、装置、设备及存储介质 | |
CN116030302A (zh) | 基于表征数据增强和损失再平衡的长尾图像识别方法 | |
CN111768214A (zh) | 产品属性的预测方法、系统、设备和存储介质 | |
CN112507912B (zh) | 一种识别违规图片的方法及装置 | |
CN114708462A (zh) | 多数据训练的检测模型生成方法、系统、设备及存储介质 | |
CN113535945B (zh) | 文本类别的识别方法、装置、设备及计算机可读存储介质 | |
CN116842936A (zh) | 关键词识别方法、装置、电子设备和计算机可读存储介质 | |
CN113535820A (zh) | 一种基于卷积神经网络的电气操作人员属性推测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190813 |
|
WD01 | Invention patent application deemed withdrawn after publication |