CN103150632A - 基于水利云平台的防汛防旱简报生成系统的构建方法 - Google Patents
基于水利云平台的防汛防旱简报生成系统的构建方法 Download PDFInfo
- Publication number
- CN103150632A CN103150632A CN2013100808682A CN201310080868A CN103150632A CN 103150632 A CN103150632 A CN 103150632A CN 2013100808682 A CN2013100808682 A CN 2013100808682A CN 201310080868 A CN201310080868 A CN 201310080868A CN 103150632 A CN103150632 A CN 103150632A
- Authority
- CN
- China
- Prior art keywords
- bulletin
- flood control
- precautions against
- against drought
- paragraph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A10/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
- Y02A10/40—Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping
Landscapes
- Information Transfer Between Computers (AREA)
Abstract
本发明公开一种基于水利云平台的防汛防旱简报生成系统的构建方法,以水利云平台为基础,结合防汛防旱业务需求,根据已有的防汛防旱业务简报,实现了如下功能:自动从简报文档数据库中检索出符合要求的段落,并选择匹配度最高的段落,然后按预先定义的格式组合成完整简报初稿;对于简报内容中往往需要包含实时水雨情、灾情、险情、气象等内容,系统利用云服务获取相关数据,并生成对应图表,自动插入文档;若用户需要替换某些段落或章节,系统具有内容自动推荐功能,可推荐多个内容相关的或相似段落供用户选择。本发明能快速地帮助防办工作人员准备防汛防旱简报,显著地提高了防汛防旱指挥、决策工作的效率。
Description
技术领域
本发明涉及一种基于水利云平台的防汛防旱简报生成系统的构建方法,属于云计算领域的服务应用技术研究。
背景技术
水利事业事关国家命脉,防汛防旱又是水利事业的重中之重,关系重大。能够更高效,更方便,更快速地将实时的天气、水雨情、灾情等状况详细地反映出来,并做出及时的应急措施,会大大减少汛情或旱情带来的巨大损失。
传统的水利防汛防旱简报写作过程,需要多名工作人员合作,要从多个遗产系统中查询相关数据、编写相关报告、手动绘制图表等相关工作,存在以下主要问题:
1)传统防汛防旱简报均以文件的方式保存在文件系统中,难以分类查找;
2)防汛防旱简报中涉及如气象、水文、灾害等多项实时数据,需要从多个相关遗产系统中获取数据,耗费时间多、操作繁琐;
3)数据的分析和处理,图标的生成需要人为手工完成,计算复杂;
4)要求工作人员有多年的工作经验。
显然传统撰写防汛防旱简报的方式耗费人力较多,且实时性较差,造成不必要的损失。随着云计算的发展和“水利云”平台的建设成功,充分利用云服务带来的安全、快捷、准确的实时数据,构建一套云环境中的防汛防旱简报自动生成系统,成为一种趋势。
发明内容
发明目的:针对上述现有防汛防旱简报编写所存在的问题和不足,本发明的目的是提供一种基于水利云平台的防汛防旱简报自动生成系统的构建方法。
技术方案:一种基于水利云平台的防汛防旱简报生成系统的构建方法,根据用户的相关需求以及防汛防旱简报类型,自动从防汛防旱简报数据库中检索出相关段落,并自动选择匹配度最高的段落组合生成一篇完整防汛防旱简报,系统分为防汛防旱简报录入过程和防汛防旱简报生成过程,录入过程包括:
步骤11:对已有的历年防汛防旱简报的分类,如按年份、旱涝年、紧要程度、报送级别等分类,然后添加相应的分类标签;
步骤12:录入文章标题和标签;
步骤13:判断是否已录入文章标题和标签,若未录入或文章已存在返回步骤11,否则跳到步骤14;
步骤14:为历年的防汛防旱简报的每个章节添加章节标签,标记章节内的重要关键词语;
步骤15:录入章节标题和标签;
步骤16:判断是否已录入章节标题和标签,若未录入,跳到步骤15,否则跳到步骤17;
步骤17:给未录入的章节添加章节段落,并为段落录入标题、内容、标签,并保存;
步骤18:若所有段落已录入跳到步骤19,否则返回步骤17;
步骤19:保存至文档数据库并返回操作结果。
当有足量的相关历史防汛防旱简报被录入,生成系统就能够灵活,快捷地根据用户需求生成防汛防旱简报,防汛防旱简报生成过程包括:
步骤21:根据现有防汛防旱简报标签库中标签的搜索热度,降序生成推荐标签列表,以供用户选择;
步骤22:用户点选一个或多个标签;
步骤23:若需要进行补充,用户输入更多需要查询的标签;
步骤24:判断用户是否提交标签集,或未提交返回步骤22,否则跳到步骤25;
步骤25:获取用户输入的标签集,并从防汛防旱简报库中检索;
步骤26:根据多模式防汛防旱简报标签匹配算法(Multi-Mode LabelMatching Algorithm)计算文章匹配度,降序输出文章列表;
步骤27:选择匹配度最高的作为模板,展开文章章节和段落;
步骤28:若段落中含有实时数据,跳到步骤29,否则跳到步骤211;
步骤29:从云平台中选择符合标签的云服务获取相关数据,并将段落中的数据替换;
步骤210:将数云服务获取的数据以柱状图、饼图、折线图或数据表等形式插入至实时段落之后,用户也可根据需要添加和删除;
步骤211:判断用户是否选择修改章节或段落,若需要修改跳到步骤212,否则跳到步骤214;
步骤212:根据需要修改的章节/段落标签,根据MLMA算法检索与内容相似的章节/段落作为备选;
步骤213:用户选择并修改相关段落内容,并保存;
步骤214:生成完整的防汛防旱简报草稿,并预览。
本发明采用上述技术方案,具有以下有益效果:基于水利云平台的防汛防旱简报自动生成系统的构建方法,基于淮安防办的水利云平台,考虑到防汛防旱简报生成过程的特点,充分利用云平台资源共享的优势,快速、准确、高效地为段落获取实时数据;同时将文件形式的防汛防旱简报抽象为离散的防汛防旱简报、章节和段落3类对象,同一篇文章会相互关联;对象分别用标签对其内容进行描述或概况,以便能够进行检索;设计了多模式标签匹配算法(MLMA)完成对这3类对象的检索工作。从而能够高效、快捷地生成符合需求的水利防汛防旱简报。
附图说明
图1为本发明实施例的防汛防旱简报录入流程图;
图2为本发明实施例的防汛防旱简报检索流程图。
具体实施方式
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
基于水利云平台的防汛防旱简报生成系统的构建方法:首先,利用基于标签的防汛防旱简报描述模型,将文件形式的防汛防旱简报抽象为离散的防汛防旱简报、章节和段落3类对象。
防汛防旱简报描述模型规则如下:
1)防汛防旱简报结构:在本模型下,传统防汛防旱简报被分为3类对象,分别是防汛防旱简报对象(Doc),章节对象(Section),段落对象(Para);每一篇实际防汛防旱简报由3种对象实体进行描述;每类对象实体又同时由一个或多个标签对象(Label)进行描述;这4类对象构成该模型下的防汛防旱简报组成结构;document={D,S,P,L}
2)防汛防旱简报对象:防汛防旱简报对象是记录该防汛防旱简报的标题,防汛防旱简报日期,防汛防旱简报章节结构;一个防汛防旱简报对象包含多个章节,任意一个防汛防旱简报对象实体都可以根据防汛防旱简报-章节关系、章节-段落关系还原一篇实际防汛防旱简报;d={title,date,S,L}
3)章节对象:每篇防汛防旱简报会有多个章节,章节对象描述该章节的名称;一个章节包含多个段落;s={name,P,L}
4)段落对象:段落是组成防汛防旱简报的基本对象,段落对象记录防汛防旱简报中对应段落的名称,段落内容。p={name,content,L}
5)标签对象:标签对象是用于描述上述3中对象的元对象,该对象主要用于描述防汛防旱简报、章节、段落的基本内容,便于进行分类、检索;l={name,describe}
本模型中,主要是将防汛防旱简报内容进行分类,并将各类信息进行抽象、定义和使用,使原本文件化的防汛防旱简报离散化,抽象为可被记录和检索的数据对象,这种描述方式不仅保留了原防汛防旱简报的全部信息,同时又可以对其进行不同对象的数据检索,增加了数据检索的灵活性。
系统在投入使用前,必须将历史防汛防旱简报在上述防汛防旱简报描述模型下进行描述,并录入系统中。
当有足量的相关历史防汛防旱简报被录入,生成系统就能够灵活,快捷地根据用户需求生成。依据防汛防旱简报描述模型,被发明设计了一套在该模型下的多模式防汛防旱简报标签匹配算法(MLMA算法),算法如下:
1)等待用户输入的标签集,标签集中包含一个或多个用户需要检索的标签;
2)单个标签匹配:单个标签匹配就是根据某一个特定的标签,检索出与该标签匹配的防汛防旱简报、章节或段落对象;单个标签匹配需要按顺序使用以下XXX类匹配模式进行匹配(以搜索防汛防旱简报为例):
A,完全匹配,即所输入的内容与描述该防汛防旱简报的标签内容完全一致,匹配成功,匹配度match_degree=1;
B,语义等价匹配,这种匹配需要借助已建立的语义等价表,在实际应用中如“未来计划”、“未来打算”、“下阶段计划”、“下阶段打算”在语义上是一致的,若用户输入的是“未来计划”,则“未来计划”为完全匹配,“下阶段打算”等为语义等价匹配,match_degree=1;
C,部分联想匹配,当完全匹配和语义等价匹配都失效,采用部分联想匹配,这种匹配针对用户输入的标签与实际标签的部分内容完成一致,例如用户输入“雨情”,与“全市雨情”实际上语义相近,可作为近似联想匹配。联想后字数为n,匹配字数为m,match_degree=m/n;
D,破坏匹配,这种匹配为标签匹配的最坏情况,当标签匹配都不满足上面3种情况时,可以尝试使用破坏匹配。这种匹配需要将被匹配的两个标签中都破坏掉部分文字后达到完全匹配或语义等价匹配。这类匹配的目的是防止用户在检索时输入错误,但是有时候会造成语义上的偏差。最终匹配字数为n,破坏字数总是为k,match_degree=(n-k)/k;若搜索“雨情”,则标签“水情”与其的破坏匹配度为(2-2)/2=0;这样就防止了在破坏语义的情况下,使破坏匹配的匹配度会尽量低。
根据上面的匹配规则,选择匹配度最高的一组标签组作为匹配结果,显然完全匹配和语义等价匹配会优先被选择。当匹配度低到一定程度后就认为匹配失败。
3)全集合匹配:枚举库中的防汛防旱简报,将防汛防旱简报的标签与用户的输入标签集合一一匹配,计算防汛防旱简报与标签集合相似度,相似度由如下公式计算:
similarity_degree=Σmatch_degree
根据相似度降序排序,选择前10个防汛防旱简报作为检索结果返回,而显然相似度最高的防汛防旱简报则很可能满足用户的搜索需求。
该算法不仅可以用于用户搜索防汛防旱简报时使用,同时可以检索防汛防旱简报之间、章节之间、段落之间的相似度。当用户需要替换某个章节或段落时,就可以用该算法匹配出相似度最高的章节或段落作为推荐。
实时数据的替换:防汛防旱简报中有不少段落是包含实时数据的,这些实时数据需要根据现实情况进行替换。替换算法如下:
1)获取替换规则编号;
2)根据替换规则编号,从数据库中获取替换规则类;
3)运行替换规则类方法,方法中进行数据对应云服务的安全认证,并数据获取;
4)将原文中的数据替换为对应占位符;
5)将文中的站位符依次替换,得到实时数据段落;
6)返回段落内容。
实时数据在处理结束后,得到的数据信息还将传递给图表生成类进行图表的生成,根据需求的不同生成不同的图表,返回到前台,并实时插入至对应段落后。
所有工作完成后,就得到了自动生成的一篇新的防汛防旱简报。
Claims (3)
1.一种基于水利云平台的防汛防旱简报生成系统的构建方法,其特征在于,该方法以水利云平台为基础,结合防汛防旱业务需求,根据已有的防汛防旱业务简报,自动从文档数据库中检索出相关段落,并自动选择匹配度最高的段落组合生成一篇完整防汛防旱简报,整个方法具体可分为防汛防旱简报录入过程和生成过程,录入过程包括如下步骤:
步骤11:对已有的历年防汛防旱简报的分类,然后添加相应的分类标签;
步骤12:录入文章标题和标签;
步骤13:判断是否已录入文章标题和标签,若未录入或文章已存在返回步骤11,否则跳到步骤14;
步骤14:为历年的防汛防旱简报的每个章节添加章节标签,标记章节内的重要关键词语;
步骤15:录入章节标题和标签;
步骤16:判断是否已录入章节标题和标签,若未录入,跳到步骤15,否则跳到步骤17;
步骤17:为段落录入标题、内容标签,并保存;
步骤18:若所有段落已录入跳到步骤19,否则返回步骤17;
步骤19:保存至文档数据库并返回操作结果。
防汛防旱简报生成过程包括如下步骤:
步骤21:根据现有防汛防旱简报标签库中标签的搜索热度,降序生成推荐标签列表,以供用户选择;
步骤22:用户点选一个或多个标签;
步骤23:若需要进行补充,用户输入更多需要查询的标签;
步骤24:判断用户是否提交标签集,或未提交返回步骤22,否则跳到步骤25;
步骤25:获取用户输入的标签集,并从防汛防旱简报库中检索;
步骤26:根据多模式防汛防旱简报标签匹配算法计算文章匹配度,降序输出文章列表;
步骤27:选择匹配度最高的作为模板,展开文章章节和段落;
步骤28:若段落中含有实时数据,跳到步骤29,否则跳到步骤211;
步骤29:从云平台中选择符合标签的云服务获取相关数据,并将段落中的数据替换;
步骤210:将数云服务获取的数据以柱状图、饼图、折线图或数据表等形式插入至实时段落之后,用户也可根据需要添加和删除;
步骤211:判断用户是否选择修改章节或段落,若需要修改跳到步骤212,否则跳到步骤214;
步骤212:根据需要修改的章节/段落标签,根据MLMA算法检索与内容相似的章节/段落作为备选;
步骤213:用户选择并修改相关段落内容,并保存;
步骤214:生成完整的防汛防旱简报草稿,并预览。
2.如权利要求1所述的基于水利云平台的防汛防旱简报生成系统的构建方法,其特征在于,步骤11中用户可自定义分类标签。
3.如权利要求1所述的基于水利云平台的防汛防旱简报生成系统的构建方法,其特征在于,步骤14中用户可自定义章节标签。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310080868.2A CN103150632B (zh) | 2013-03-13 | 2013-03-13 | 基于水利云平台的防汛防旱简报生成系统的构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310080868.2A CN103150632B (zh) | 2013-03-13 | 2013-03-13 | 基于水利云平台的防汛防旱简报生成系统的构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103150632A true CN103150632A (zh) | 2013-06-12 |
CN103150632B CN103150632B (zh) | 2016-03-16 |
Family
ID=48548691
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310080868.2A Active CN103150632B (zh) | 2013-03-13 | 2013-03-13 | 基于水利云平台的防汛防旱简报生成系统的构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103150632B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107315728A (zh) * | 2017-05-31 | 2017-11-03 | 民政部国家减灾中心 | 基于灾情表单自动生成灾情报告的方法及系统 |
CN109189836A (zh) * | 2018-08-22 | 2019-01-11 | 北京旷视科技有限公司 | 简报发布方法、装置、战果展示系统及存储介质 |
CN109460481A (zh) * | 2018-11-13 | 2019-03-12 | 北京中网易企秀科技有限公司 | 一种多媒体文件生成方法及装置 |
CN111274799A (zh) * | 2020-01-09 | 2020-06-12 | 天津车之家数据信息技术有限公司 | 一种文章标题生成方法、装置及存储介质 |
CN113743075A (zh) * | 2021-09-08 | 2021-12-03 | 北京超图软件股份有限公司 | 气象灾害图文服务产品生成方法、装置、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1999042940A1 (en) * | 1998-02-18 | 1999-08-26 | H.B. Fuller Licensing & Financing, Inc. | Computer aided system for compliance with chemical control laws |
CN1536483A (zh) * | 2003-04-04 | 2004-10-13 | 陈文中 | 网络信息抽取及处理的方法及系统 |
CN101470728A (zh) * | 2007-12-25 | 2009-07-01 | 北京大学 | 一种中文新闻网页正文的自动抽取方法及装置 |
CN101615193A (zh) * | 2009-07-07 | 2009-12-30 | 北京大学 | 一种基于百科数据提取集成的查询系统 |
-
2013
- 2013-03-13 CN CN201310080868.2A patent/CN103150632B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1999042940A1 (en) * | 1998-02-18 | 1999-08-26 | H.B. Fuller Licensing & Financing, Inc. | Computer aided system for compliance with chemical control laws |
CN1536483A (zh) * | 2003-04-04 | 2004-10-13 | 陈文中 | 网络信息抽取及处理的方法及系统 |
CN101470728A (zh) * | 2007-12-25 | 2009-07-01 | 北京大学 | 一种中文新闻网页正文的自动抽取方法及装置 |
CN101615193A (zh) * | 2009-07-07 | 2009-12-30 | 北京大学 | 一种基于百科数据提取集成的查询系统 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107315728A (zh) * | 2017-05-31 | 2017-11-03 | 民政部国家减灾中心 | 基于灾情表单自动生成灾情报告的方法及系统 |
CN109189836A (zh) * | 2018-08-22 | 2019-01-11 | 北京旷视科技有限公司 | 简报发布方法、装置、战果展示系统及存储介质 |
CN109460481A (zh) * | 2018-11-13 | 2019-03-12 | 北京中网易企秀科技有限公司 | 一种多媒体文件生成方法及装置 |
CN111274799A (zh) * | 2020-01-09 | 2020-06-12 | 天津车之家数据信息技术有限公司 | 一种文章标题生成方法、装置及存储介质 |
CN111274799B (zh) * | 2020-01-09 | 2023-06-23 | 天津车之家数据信息技术有限公司 | 一种文章标题生成方法、装置及存储介质 |
CN113743075A (zh) * | 2021-09-08 | 2021-12-03 | 北京超图软件股份有限公司 | 气象灾害图文服务产品生成方法、装置、设备及存储介质 |
CN113743075B (zh) * | 2021-09-08 | 2023-10-31 | 北京超图软件股份有限公司 | 气象灾害图文服务产品生成方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN103150632B (zh) | 2016-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Mühlroth et al. | A systematic literature review of mining weak signals and trends for corporate foresight | |
Rattenbury et al. | Principles of data wrangling: Practical techniques for data preparation | |
CN104239501B (zh) | 一种基于Spark的海量视频语义标注方法 | |
CN107787491B (zh) | 用于重新使用文档中的内容的文档存储 | |
CN110162644B (zh) | 一种图像集建立方法、装置和存储介质 | |
Varini et al. | ClimaText: A dataset for climate change topic detection | |
CN107609052A (zh) | 一种基于语义三角的领域知识图谱的生成方法及装置 | |
CN102890698B (zh) | 微博话题标签自动化描述方法 | |
CN106250385A (zh) | 用于文档的自动化信息抽象处理的系统和方法 | |
Hong et al. | Comparing natural language processing methods to cluster construction schedules | |
CN106716402A (zh) | 以实体为中心的知识发现 | |
CN103150632B (zh) | 基于水利云平台的防汛防旱简报生成系统的构建方法 | |
CN107016001A (zh) | 一种数据查询方法及装置 | |
CN102880687A (zh) | 基于标签技术的个人交互数据检索方法及其系统 | |
US8935239B2 (en) | Knowledge management for solution design during sales and pre-sales | |
CN104915449A (zh) | 一种基于水利对象分类标签的分面检索系统及方法 | |
Xue et al. | Ontology alignment based on instance using NSGA-II | |
Feng et al. | Practical duplicate bug reports detection in a large web-based development community | |
Jurek-Loughrey et al. | Semi-supervised and unsupervised approaches to record pairs classification in multi-source data linkage | |
CN103942266A (zh) | 一种基于olap能自定义复杂业务计算逻辑的数据分析方法 | |
CN117609468A (zh) | 生成检索语句的方法及装置 | |
CN112948510A (zh) | 一种媒体行业知识图谱的构建方法 | |
Kim et al. | Customer preference analysis based on SNS data | |
EP3306540A1 (en) | System and method for content affinity analytics | |
Krueger et al. | Prolix-visual prediction analysis for box office success |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |