CN108829698A - 政务系统发文方法、装置、计算机设备及存储介质 - Google Patents
政务系统发文方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN108829698A CN108829698A CN201810351738.0A CN201810351738A CN108829698A CN 108829698 A CN108829698 A CN 108829698A CN 201810351738 A CN201810351738 A CN 201810351738A CN 108829698 A CN108829698 A CN 108829698A
- Authority
- CN
- China
- Prior art keywords
- dispatch
- full
- history
- information
- dispatch information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000003860 storage Methods 0.000 title claims abstract description 14
- 238000012550 audit Methods 0.000 claims abstract description 32
- 230000004048 modification Effects 0.000 claims abstract description 20
- 238000012986 modification Methods 0.000 claims abstract description 20
- 238000012508 change request Methods 0.000 claims abstract description 17
- 238000007726 management method Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 description 11
- 230000011218 segmentation Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 230000014509 gene expression Effects 0.000 description 8
- 235000012054 meals Nutrition 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 238000005520 cutting process Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Operations Research (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种政务系统发文方法、装置、计算机设备及存储介质。该政务系统发文方法包括:获取用户发文请求,用户发文请求包括搜索条件;基于搜索条件调用政务系统上内置的全文搜索引擎,获取与搜索条件对应的至少一个历史发文信息;在政务系统的发文编辑界面上显示与信息选择请求相对应的历史发文信息;在发文编辑界面上基于发文信息修改请求对历史发文信息进行修改,获取原始发文信息,原始发文信息中突出显示对历史发文信息进行修改的修改内容;将原始发文信息发送给与政务系统相连的审核平台,并接收审核平台反馈的审核通过的目标发文信息,基于目标发文信息完成发文。该政务系统发文方法进行发文具有提高效率且可用度高的优点。
Description
技术领域
本发明涉及电子政务技术领域,尤其涉及一种政务系统发文方法、装置、计算机设备及存储介质。
背景技术
目前,电子政务办公系统(以下简称“政务系统”)在发文时只包括在线拟稿和附件上传的功能,使得拟稿人每次发文时需要重新编辑发文内容以完成发文,耗费时间,尤其在发文量较大时,大大增加了任务量。并且,当前政务系统只能进行关键词检索,使得用户在查询某些信息时,可能查询获取到较多的查询结果,使得用户查询的可用度低,降低查询效率。
发明内容
本发明实施例提供一种政务系统发文方法、装置、计算机设备及存储介质,以解决政务系统在发文时不能对历史发文信息进行二次编辑的问题。
本发明实施例提供一种政务系统发文方法,包括:
获取用户发文请求,所述用户发文请求包括搜索条件;
基于所述搜索条件调用政务系统上内置的全文搜索引擎,基于所述全文搜索引擎获取与所述搜索条件对应的至少一个历史发文信息;
获取信息选择请求,在所述政务系统的发文编辑界面上显示与所述信息选择请求相对应的所述历史发文信息;
在所述发文编辑界面上获取发文信息修改请求,基于所述发文信息修改请求对所述历史发文信息进行修改,获取原始发文信息,所述原始发文信息中突出显示对所述历史发文信息进行修改的修改内容;
将所述原始发文信息发送给与所述政务系统相连的审核平台,并接收所述审核平台反馈的审核通过的目标发文信息,基于所述目标发文信息完成发文。
本发明实施例提供一种政务系统发文装置,包括:
用户发文请求获取模块,用于获取用户发文请求,所述用户发文请求包括搜索条件;
历史发文信息获取模块,用于基于所述搜索条件调用政务系统上内置的全文搜索引擎,基于所述全文搜索引擎获取与所述搜索条件对应的至少一个历史发文信息;
信息选择请求获取模块,用于获取信息选择请求,在所述政务系统的发文编辑界面上显示与所述信息选择请求相对应的所述历史发文信息;
原始发文信息系获取模块,用于在所述发文编辑界面上获取发文信息修改请求,基于所述发文信息修改请求对所述历史发文信息进行修改,获取原始发文信息,所述原始发文信息中突出显示对所述历史发文信息进行修改的修改内容;
目标发文信息获取模块,用于将所述原始发文信息发送给与所述政务系统相连的审核平台,并接收所述审核平台反馈的审核通过的目标发文信息,基于所述目标发文信息完成发文。
本发明实施例提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述政务系统发文方法的步骤。
本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述政务系统发文方法的步骤。
本发明实施例提供的政务系统发文方法、装置、计算机设备及存储介质中,通过获取用户发文请求,该用户发文请求包括搜索条件,以便基于搜索条件启动政务系统上内置的全文搜索引擎,然后,基于全文搜索引擎获取与搜索条件对应的至少一个历史发文信息,并在政务系统的发文编辑界面上显示用户所选择的历史发文信息,以供用户编辑,实现对历史发文信息进行二次编辑的目的。在发文编辑界面上通过发文信息修改请求获取修改内容,并基于修改内容对历史发文信息进行修改,获取原始发文信息,以便将原始发文信息发送给与政务系统相连的审核平台,并接收审核平台反馈的审核通过的目标发文信息以完成发文,该发文过程无需用户重新编辑发文信息进行发文,只需对历史发文信息进行二次编辑即可完成发文,节省时间,提高效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中政务系统发文方法的应用环境图;
图2是本发明一实施例中提供的政务系统发文方法的一流程图;
图3是本发明一实施例中提供的政务系统发文方法的另一流程图;
图4是图3中步骤S62的一具体流程图;
图5是图4中步骤S621的一具体流程图;
图6是本发明一实施例中提供的政务系统发文装置的一示意图;
图7是本发明一实施例中提供的计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请提供的政务系统发文方法,可应用在如图1的应用环境中,其中,政务系统发文方法可通过计算机设备与服务器进行通信。计算机设备可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器来实现。
图2示出本实施例中政务系统发文方法的流程图。该政务系统发文方法可应用在政府机构的计算机设备中,例如可应用在政务系统中,用于对政务发文进行全文查询和二次编辑,以提高办公效率。如图2所示,该政务系统发文方法包括如下步骤:
S10:获取用户发文请求,用户发文请求包括搜索条件。
其中,用户发文请求是用于触发政务系统发文功能的请求。该用户发文请求包括搜索条件。搜索条件包括但不限用户所需文章的文章标题、文章发布时间或文章内容。具体地,用户可在政务系统的查询界面上的输入框中输入所需的搜索条件以使服务器获取用户发文请求,或者由服务器自动获取政务系统智能推荐的搜索次数排在前n位的搜索条件。本实施例中,政务系统会定时对存储的文章进行搜索次数统计,并在政务系统中自动更新推荐的搜索条件,以达到智能推荐的目的,提高工作效率。
S20:基于搜索条件调用政务系统上内置的全文搜索引擎,基于全文搜索引擎获取与搜索条件对应的至少一个历史发文信息。
其中,全文搜索引擎是目前广泛应用的主流搜索引擎。它的工作原理是计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置。当用户输入搜索条件进行查询时,全文搜索引擎中的检索程序就根据该搜索条件对事先建立的索引进行查找,并将查找的结果反馈给用户。该检索程序是预先设置在全文搜索引擎中的用于进行查询操作的程序。其中,历史发文信息是当前时间以前在政务系统中发布过的文章信息。该历史发文信息包括文章标题、文章发布时间和文章内容。
具体地,服务器基于用户输入或选择的搜索条件调用政务系统上内置的全文搜索引擎进行查询,以获取与搜索条件对应的至少一个历史发文信息,以使用户能够根据文章的文章标题、文章发布时间或文章全文内容进行查询,方便用户使用,避免出现用户在不知道文章关键词的情况下,无法查找所需的历史发文信息的问题。
S30:获取信息选择请求,在政务系统的发文编辑界面上显示与信息选择请求相对应的历史发文信息。
其中,信息选择请求是用户对历史发文信息进行选择的请求。政务系统的发文编辑界面是用于对历史发文信息进行编辑的可视化界面。具体地,服务器基于信息选择请求,在政务系统的发文编辑界面上显示用户所选择的历史发文信息,以供用户编辑,以实现对历史发文信息进行二次编辑的目的。
进一步地,在政务系统的发文编辑界面上显示与信息选择请求相对应的历史发文信息可采取相关性打分的方式进行显示,按照分值的大小进行显示。具体地,搜索条件包括用户输入的关键词,服务器通过关键字查找数据库可搜索到N个历史发文信息,通过公式Wt,d=tft,d*log(N/dft)计算每个关键词在搜索到的N个历史发文信息中的权重,以形成第一向量(即由每个关键词在搜索到的N个历史发文信息中的权重组成的向量)。其中,Wt,d表示关键词t在历史发文信息d中的权重,tft,d表示关键词t在历史发文信息d中出现的频率,dft表示有多少历史发文信息中出现过关键词t。然后,可将搜索条件中包括的关键词看做一个简单的文档,每个关键词都有本身对应的权重,该关键词对应的权重可根据用户输入关键词的顺序进行自动设定也可按照用户的需求自行设定每个关键词的权重,基于关键词对应的权重获取第二向量。最后,服务器采用相关性打分公式
(其中,score(t,d)是指查询输入关键词t和历史发文信息d的相关性得分,n为搜索条件中所包含的关键词的数量)搜索到的N个历史发文信息与关键词的相关性进行打分,按照分值从高到低的顺序在政务系统的发文编辑界面上显示历史发文信息。
S40:在发文编辑界面上获取发文信息修改请求,基于发文信息修改请求对历史发文信息进行修改,获取原始发文信息,原始发文信息中突出显示对历史发文信息进行修改的修改内容。
其中,发文信息修改请求是用户对历史发文信息进行更改的请求。该发文信息修改请求包括修改内容。具体地,在发文编辑界面上获取用户对历史发文信息进行更改的请求,以便服务器基于发文信息修改请求获取修改内容,然后基于修改内容对历史发文信息进行修改,获取原始发文信息,并且会在原始发文信息中突出显示对历史发文信息进行修改的修改内容,以便用户能够直观地察看所修改的内容,并检查修改内容中是否出现错别字或其他书写上存在的失误,提高发文效率。
具体地,突出显示可以体现为:将修改内容进行高亮,或者,将修改内容在原始发文信息中的某个集中区域进行显示,并对该集中区域进行标识或突出提醒。例如,对该集中区域采用不同的颜色进行标识或者用文字进行提醒等。
本实施例中,对于含有固定格式这一类的发文信息,例如撤销公告或召开会议通知等,政务系统中会预先存储这类的发文信息模板,该发文信息模板包括发文格式和发文内容。用户也可基于发文信息模板进行编辑,获取原始发文信息,该过程无需查找历史发文信息进行修改,对于一些简单的发文信息可直接调用发文信息模板,提高发文效率。
S50:将原始发文信息发送给与政务系统相连的审核平台,并接收审核平台反馈的审核通过的目标发文信息,基于目标发文信息完成发文。
其中,目标发文信息是指审核通过的原始发文信息。审核平台是用于对原始发文信息进行审核的平台。具体地,服务器将原始发文信息发送给与政务系统相连的审核平台进行审核,并接收审核平台反馈的审核通过的目标发文信息,然后基于目标发文信息进行发文操作,以完成发文。
具体地,用户在将原始发文信息发送给与政务系统相连的审核平台进行审核之前,还可对原始发文信息进行审核人员的配置,选择与该原始发文信息对应的审核人员进行审核。本实施例中,政务系统中会预先存储有发文信息类型的关键字表,该关键字表包括发文信息类型和对应的审核人员。在对原始发文信息进行审核人员的配置时,政务系统会对原始发文信息的信息内容进行初步识别,即与政务系统中预存储的关键字表进行匹配,基于关键字表为用户智能推荐对应的审核人员,以供用户选择。
本实施例中,服务器先获取用户发文请求,该用户发文请求包括搜索条件,以便基于搜索条件启动政务系统上内置的全文搜索引擎。然后,服务器基于全文搜索引擎获取与搜索条件对应的至少一个历史发文信息,以使用户能够根据文章的文章标题、文章发布时间或文章全文内容进行查询,方便用户使用,避免出现用户在不知道文章关键词的情况下,无法查找所需的历史发文信息的问题。然后,服务器获取信息选择请求,以便基于信息选择请求在政务系统的发文编辑界面上显示用户所选择的历史发文信息,以供用户编辑,以实现对历史发文信息进行二次编辑的目的。在发文编辑界面上获取发文信息修改请求,以便获取修改内容,然后服务器基于修改内容对历史发文信息进行修改,获取原始发文信息,并且会在原始发文信息中突出显示对历史发文信息进行修改的修改内容,以便用户能够直观地察看修改内容,并检查修改内容中是否出现错别字或其他书写上存在的失误,提高发文效率。最后,服务器将原始发文信息发送给与政务系统相连的审核平台,并接收审核平台反馈的审核通过的目标发文信息,基于目标发文信息完成发文,该发文过程无需用户重新编辑发文信息进行发文,只需对历史发文信息进行二次编辑即可完成发文,节省时间,提高效率。
在一个实施例中,步骤S10之前,该政务系统发文方法还包括:在政务系统上创建全文搜索引擎。由于后续采用全文索引查找对应的历史发文信息,而全文索引需要在全文搜索引擎中建立,因此需在政务系统上创建全文搜索引擎,以便采用全文搜索引擎建立全文索引。
如图3所示,在政务系统上创建全文搜索引擎,具体包括如下步骤:
S61:在基于历史发文信息完成发文之后,生成全文索引创建任务,全文索引创建任务包括索引建立接口和文档管理模块。
其中,全文索引创建任务是在历史发文信息完成发文后,由系统自动分配的用于创建全文索引的任务。该全文索引创建任务包括索引建立接口和文档管理模块。索引建立接口是用于创建全文索引的接口。文档管理模块是用于存储全文索引的模块。
S62:调用索引建立接口,基于历史发文信息建立全文索引,并将全文索引存储在文档管理模块中。
其中,索引建立接口是全文搜索引擎中用于创建全文索引的接口。全文索引是全文搜索引擎中,基于文章的全部内容建立的索引。基于全文索引查询信息能够提升查询精度,以使查询结果更加准确。具体地,在基于历史发文信息完成发文之后,政务系统通过调用全文索引创建任务中的索引建立接口,并根据历史发文信息建立全文索引,并将全文索引存储在文档管理模块中,以便后续用户在查询历史发文信息时能够基于全文索引快速查询到所需的历史发文信息。
相应地,步骤S20具体为:基于全文搜索引擎,获取与搜索条件相对应的全文索引,根据全文索引获取的至少一个历史发文信息。
具体地,在基于用户自身需求输入搜索条件之后,政务系统会基于该搜索条件启动全文搜索引擎,并基于搜索条件读取全文搜索引擎中与搜索条件相对应的全文索引,以便根据全文索引能够快速获取至少一个历史发文信息,节省搜索时间,提高搜索效率。
本实施例中,在基于历史发文信息完成发文之后,生成全文索引创建任务,该全文索引创建任务包括索引建立接口和文档管理模块,以便调用索引建立接口,基于历史发文信息建立全文索引,并将全文索引存储在文档管理模块中,以便后续用户在查询历史发文信息时,能够基于全文索引快速查询到所需的历史发文信息,以提高用户查询的可用度。
进一步地,步骤S30中的在政务系统的发文编辑界面上显示与信息请求相对应的历史发文信息,具体包括:在政务系统的发文编辑界面上显示至少一个历史发文信息和每一历史发文信息对应的被引用次数,基于被引用次数的顺序显示历史发文信息。
其中,被引用次数是政务系统中的每一历史发文信息的被用户选取的次数。具体地,在政务系统的发文编辑界面上会显示至少一个历史发文信息和每一历史发文信息对应的被引用次数。然后,政务系统基于被引用次数的顺序即按照被引用次数从大到小的顺序显示历史发文信息,以使用户能够被引用次数选择历史发文信息,避免查询结果过多,用户不易查看的情况。
在一个实施例中,如图4所示,步骤S62中,即基于历史发文信息建立全文索引,具体包括如下步骤:
S621:对历史发文信息的内容进行预处理,获取词元。
其中,词元是对历史发文信息进行预处理所获取到的用于创建全文索引的词元素。具体地,对历史发文信息进行预处理包括对历史发文信息进行分词处理和自然语言处理。分词处理是指按照词典将句子中的词进行切分的处理。自然语言处理是对分词的结果做一些同语言相关的处理。例如,将英文字符变为小写。
S622:基于全文搜索引擎中的索引组件对词元进行处理,建立全文索引。
其中,索引组件是全文搜索引擎中基于词元创建全文索引的组件。具体地,全文搜索引擎中的索引组件会基于词元创建一个字典,然后按字母顺序进行对字典排序,合并相同的词成为索引链表,该索引链表包括至少一个词元对应的索引链,该索引链包括与词元对应的文档频次和词频率。文档频次表示总共有多少文件包含用户所查找的目标词(词元)。词频率表示此文件中包含了多少个目标词(词元)。
本实施例中,先对历史发文信息进行预处理包括对历史发文信息进行分词处理和自然语言处理,获取词元,以便基于全文搜索引擎中的索引组件对词元进行处理,建立全文索引,以便后续用户在查询历史发文信息时能够基于全文索引快速查询到所需的历史发文信息,节省时间,提高效率。
在一个实施例中,如图5所示,步骤S621中,即对历史发文信息的内容进行预处理,获取词元,具体包括如下步骤:
S6211:若历史发文信息的内容为英文字符,则采用全文搜索引擎中的分词组件对历史发文信息的内容进行分词,获取词次。
其中,词次是对历史发文信息进行分词后所得到的英文单词。由于在建立全文索引时可能会出现中文字符和英文字符。而中文分词和英文分词的操作是不同的,因此需要对历史发文信息的内容进行判断,以便对历史发文信息的内容分别进行分词处理。本实施例中,采用但不限于正则表达式对历史发文信息的中英文内容进行区分的方法如下:匹配中文字符的正则表达式为[u4e00-u9fa5],匹配英文字符的正则表达式为[a-zA-Z]。基于中文字符的正则表达式和英文字符的正则表达式对历史发文信息进行中英文区分,以获取对应的待分词文本(包括中文字符和英文字符),以便服务器对该待分词文本进行快速分词操作,提高获取词次的效率。
具体地,采用全文搜索引擎中的分词组件对历史发文信息中的英文字符进行分词,即先对历史发文信息的内容进行去除标点符号处理和去除停词处理,最后按照英文词典库将历史发文信息分成单独的单词即为词次,获取纯净文本,以排除干扰,以便后续采用语言处理组件对词次进行处理。
具体地,去除停词处理是指是指在信息检索中,为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些停用词(如“我”“个”“下”)的处理。本实施例中,去除标点符号处理包括但不限于采用正则表达式进行处理。该正则表达式可由开发人员预先设定好的表达式,如语句System.out.println(str.replaceAll("\\pP","")),即可删除文本中的标点符号。
S6212:采用全文搜索引擎中的语言处理组件对词次进行处理,获取词元。
具体地,语言处理组件是用于对词次进行语言相关的处理组件。例如将英文字符变为小写。具体地,采用全文搜索引擎中的语言处理组件对词次进行处理具体包括如下内容:首先,指将英文字符变为小写;然后,将单词缩减为词根形式,如“cars”到“car”等;最后,将单词转变为词根形式,如“drove”到“drive”等。通过采用语言处理组件对词次进行处理,得到词元,为创建全文索引提供技术支持。
在一个实施例中,步骤S621中,即对历史发文信息的内容进行预处理,获取词元,具体包括如下步骤:
S6213:若历史发文信息的内容为中文字符,则采用全文搜索引擎中的词典库对历史发文信息的内容进行处理,获取纯净文本。
其中,词典库是包含大量以中文字符为基础的停用词的词库。该词典库可以是开发人员预先定义好的,也可以是从第三方平台中获取的开源数据。其中,纯净文本是指去除停用词干扰后所得到的本文。具体地,若历史发文信息的内容为中文字符,则采用全文搜索中的词典库对历史发文信息的内容进行处理,即对历史发文信息的内容进行去除停用词处理,获取纯净文本。本步骤中的去除停用词处理与步骤S6211中的去除停用词处理的处理过程相同,此处不再赘述。
S6214:采用全文搜索引擎中的词库分词法对纯净文本进行处理,获取词元。
具体地,对于中文字符来说,可采用词库分词法进行分词,即按照某种算法构造词,然后去匹配已建好的词库集合,如果匹配到就切分出来成为词元,其分词过程简单,容易实现。其中,词库分词法包括最大正向匹配的算法和最大逆向匹配的算法。本实施例中,采用但不限于采用最大逆向匹配的算法对纯净文本进行分词,获取词元。最大逆向匹配的算法是用于对中文进行分词的算法,该算法具有准确率高、算法复杂度低的优点。
具体地,在采用词库分词法对纯净文本进行分词之前,开发人员会预先设定好中文词库,为分词提供技术支持。其中,中文词库(以下简称“词库”)是用于对中文字符进行分词的词库。采用最大逆向匹配的算法对历史发文信息的内容(或者纯净文本)进行分词的具体步骤为:首先需设定句子分割的最大长度MAX;然后将历史发文信息拆分为至少一个句子,具体可按照句子的结束符进行划拆分(如:?。,!);再对每一句子按照从右往左的顺序开始切分,获取单字串;然后将该单字串和词库进行比对,若词库中包含有该词就记录下来,形成一词元,否则通过减少一个单字,继续比较,直至剩下一个单字则停止。
例如,句子分割的最大长度MAX=5,输入的句子为“我一个人吃饭”,首先按照从右往左的顺序开始切分,获取单字串即“一个人吃饭”;在词库中没有该词,则减少一个单字即“一”变为“个人吃饭”;在词库中没有该词,则继续减少一个单字“个”,变为“人吃饭”;在词库中没有该词则减少一个单字即“人”,变为“吃饭”;在词库中存在该词即“吃饭”,将该词记录下来,获取一词元。此时,句子变为“我一个人”,在词库中没有该词,则减少一个单字即“我”,变为“一个人”;在词库中没有该词,则继续减少一个单字“一”,变为“个人”;在词库中存在该词即“个人”,将该词记录下来,获取另一词元。此时句子变为“我一”,在词库中没有该词,则减少一个单字即“我”,变为“一”;在词库中存在该词即“一”,将该词记录下来,获取另一词元。此时句子只剩下一个单字“我”,算法终止。最终,采用最大逆向匹配的算法对于句子“我一个人吃饭”的分词结果为“我/一/个人/吃饭”。
本实施例中,服务器先对历史发文信息的内容进行中英文区分,若历史发文信息的内容为英文字符,则采用全文搜索引擎中的分词组件对历史发文信息的内容进行去除标点符号处理和去除停词处理,最后按照英文词典库将历史发文信息分成单独的单词即词次,获取纯净文本,以排除干扰,便于服务器采用全文搜索引擎中的语言处理组件对词次进行处理,获取词元,为创建全文索引提供技术支持。若历史发文信息的内容为中文字符,则采用全文搜索引擎中的词典库对历史发文信息的内容进行去除停用词处理,获取纯净文本,以便服务器采用最大逆向匹配的算法对纯净文本进行处理,获取词元,提高了分词效率和分词准确率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一个实施例中,提供一种政务系统发文装置,该政务系统发文装置与上述实施例中政务系统发文方法一一对应。如图6所示,该政务系统发文装置包括用户发文请求获取模块10、历史发文信息获取模块20、信息选择请求获取模块30、原始发文信息系获取模块40、全文搜索引擎创建模块60和历史发文信息显示模块70。各功能模块详细说明如下:
用户发文请求获取模块10,用于获取用户发文请求,用户发文请求包括搜索条件。
历史发文信息获取模块20,用于基于搜索条件调用政务系统上内置的全文搜索引擎,基于全文搜索引擎获取与搜索条件对应的至少一个历史发文信息。
信息选择请求获取模块30,用于获取信息选择请求,在政务系统的发文编辑界面上显示与信息选择请求相对应的历史发文信息。
原始发文信息获取模块40,用于在发文编辑界面上获取发文信息修改请求,基于发文信息修改请求对历史发文信息进行修改,获取原始发文信息,原始发文信息中突出显示对历史发文信息进行修改的修改内容。
目标发文信息获取模块50,用于将原始发文信息发送给与政务系统相连的审核平台,并接收审核平台反馈的审核通过的目标发文信息,基于目标发文信息完成发文。
具体地,该政务系统发文装置还包括历史发文信息显示模块70,在政务系统的发文编辑界面上显示至少一个历史发文信息和每一历史发文信息对应的被引用次数,基于被引用次数的顺序显示历史发文信息。
具体地,该政务系统发文装置还包括全文搜索引擎创建模块60,用于在所述政务系统上创建全文搜索引擎。
全文搜索引擎创建模块60包括全文索引创建任务生成单元61和全文索引建立单元62。
全文索引创建任务生成单元61,用于在基于历史发文信息完成发文之后,生成全文索引创建任务,全文索引创建任务包括索引建立接口和文档管理模块。
全文索引建立单元62,用于调用索引建立接口,基于历史发文信息建立全文索引,并将全文索引存储在文档管理模块中。
相应地,历史发文信息获取模块20,用于基于全文搜索引擎,获取与搜索条件相对应的全文索引,根据全文索引获取的至少一个历史发文信息。
具体地,全文索引建立单元62包括词元获取单元621和全文索引建立单元622。
词元获取单元621,用于对历史发文信息的内容进行预处理,获取词元。
全文索引建立单元622,用于基于全文搜索引擎中的索引组件对词元进行处理,建立全文索引。
具体地,词元获取单元621包括词次获取子单元6211和词元获取子单元6212。
词次获取子单元6211,用于若历史发文信息的内容为英文字符,则采用全文搜索引擎中的分词组件对历史发文信息的内容进行分词,获取词次。
词元获取子单元6212,用于采用全文搜索引擎中的语言处理组件对词次进行处理,获取词元。
具体地,词元获取单元621包括纯净文本获取子单元6213和词元获取子单元6214。
纯净文本获取子单元6213,用于若历史发文信息的内容为中文字符,则采用全文搜索引擎中词典库对历史发文信息的内容进行处理,获取纯净文本。
词元获取子单元6214,用于采用词库分词法对纯净文本进行处理,获取词元。
具体地,信息选择请求获取模块30,用于在所述政务系统的发文编辑界面上显示至少一个所述历史发文信息和每一所述历史发文信息对应的被引用次数,基于所述被引用次数的顺序显示所述历史发文信息。
在一实施例中,提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中政务系统发文方法,为避免重复,这里不再赘述。或者,该计算机程序被处理器执行时实现上述实施例中政务系统发文装置中各模块/单元的功能,为避免重复,这里不再赘述。
在一实施例中,提供了一种计算机设备。如图7所示,该实施例的计算机设备80包括:处理器81、存储器82以及存储在存储器82中并可在处理器81上运行的计算机程序83。处理器81执行计算机程序83时实现上述实施例中政务系统发文方法的步骤,例如图1所示的步骤S10至S50。或者,处理器81执行计算机程序83时实现上述实施例中政务系统发文装置中各模块/单元的功能,例如图6所示的用户发文请求获取模块10、历史发文信息获取模块20、信息选择请求获取模块30、原始发文信息系获取模块40和历史发文信息显示模块70的功能。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种政务系统发文方法,其特征在于,包括:
获取用户发文请求,所述用户发文请求包括搜索条件;
基于所述搜索条件调用政务系统上内置的全文搜索引擎,基于所述全文搜索引擎获取与所述搜索条件对应的至少一个历史发文信息;
获取信息选择请求,在所述政务系统的发文编辑界面上显示与所述信息选择请求相对应的所述历史发文信息;
在所述发文编辑界面上获取发文信息修改请求,基于所述发文信息修改请求对所述历史发文信息进行修改,获取原始发文信息,所述原始发文信息中突出显示对所述历史发文信息进行修改的修改内容;
将所述原始发文信息发送给与所述政务系统相连的审核平台,并接收所述审核平台反馈的审核通过的目标发文信息,基于所述目标发文信息完成发文。
2.如权利要求1所述的政务系统发文方法,其特征在于,在所述获取用户发文请求的步骤之前,所述政务系统发文方法包括:在所述政务系统上创建全文搜索引擎;
所述在所述政务系统上创建全文搜索引擎,包括:
在基于历史发文信息完成发文之后,生成全文索引创建任务,所述全文索引创建任务包括索引建立接口和文档管理模块;
调用所述索引建立接口,基于历史发文信息建立全文索引,并将所述全文索引存储在所述文档管理模块中;
所述基于所述全文搜索引擎获取与所述搜索条件对应的至少一个历史发文信息,包括:基于所述全文搜索引擎,获取与所述搜索条件相对应的全文索引,根据所述全文索引获取的至少一个历史发文信息。
3.如权利要求2所述的政务系统发文方法,其特征在于,所述基于历史发文信息建立全文索引,包括:
对所述历史发文信息的内容进行预处理,获取词元;
基于所述全文搜索引擎中的索引组件对所述词元进行处理,建立所述全文索引。
4.如权利要求3所述的政务系统发文方法,其特征在于,所述对所述历史发文信息的内容进行预处理,获取词元,包括:
若所述历史发文信息的内容为英文字符,则采用所述全文搜索引擎中的分词组件对所述历史发文信息的内容进行分词,获取词次;
采用所述全文搜索引擎中的语言处理组件对所述词次进行处理,获取词元。
5.如权利要求3所述的政务系统发文方法,其特征在于,所述对所述历史发文信息的内容进行预处理,获取词元,包括:
若所述历史发文信息的内容为中文字符,则采用所述全文搜索引擎中词典库对所述历史发文信息的内容进行处理,获取纯净文本;
采用词库分词法对所述纯净文本进行处理,获取词元。
6.如权利要求1所述的政务系统发文方法,其特征在于,在所述基于所述全文搜索引擎获取与所述搜索条件对应的至少一个历史发文信息的步骤之后,所述政务系统发文方法还包括:
在所述政务系统的发文编辑界面上显示至少一个所述历史发文信息和每一所述历史发文信息对应的被引用次数,基于所述被引用次数的顺序显示所述历史发文信息。
7.一种政务系统发文装置,其特征在于,包括:
用户发文请求获取模块,用于获取用户发文请求,所述用户发文请求包括搜索条件;
历史发文信息获取模块,用于基于所述搜索条件调用政务系统上内置的全文搜索引擎,基于所述全文搜索引擎获取与所述搜索条件对应的至少一个历史发文信息;
信息选择请求获取模块,用于获取信息选择请求,在所述政务系统的发文编辑界面上显示与所述信息选择请求相对应的所述历史发文信息;
原始发文信息系获取模块,用于在所述发文编辑界面上获取发文信息修改请求,基于所述发文信息修改请求对所述历史发文信息进行修改,获取原始发文信息,所述原始发文信息中突出显示对所述历史发文信息进行修改的修改内容;
目标发文信息获取模块,用于将所述原始发文信息发送给与所述政务系统相连的审核平台,并接收所述审核平台反馈的审核通过的目标发文信息,基于所述目标发文信息完成发文。
8.如权利要求7所述的政务系统发文装置,其特征在于,所述政务系统发文装置还包括全文搜索引擎创建模块,用于在所述政务系统上创建全文搜索引擎;
所述全文搜索引擎创建模块包括:
全文索引创建任务生成单元,用于在基于历史发文信息完成发文之后,生成全文索引创建任务,所述全文索引创建任务包括索引建立接口和文档管理模块;
全文索引建立单元,用于调用所述索引建立接口,基于历史发文信息建立全文索引,并将所述全文索引存储在所述文档管理模块中;
所述历史发文信息获取模块,用于基于所述全文搜索引擎,获取与所述搜索条件相对应的全文索引,根据所述全文索引获取的至少一个历史发文信息。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述政务系统发文方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述政务系统发文方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810351738.0A CN108829698A (zh) | 2018-04-19 | 2018-04-19 | 政务系统发文方法、装置、计算机设备及存储介质 |
PCT/CN2018/092555 WO2019200699A1 (zh) | 2018-04-19 | 2018-06-25 | 政务系统发文方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810351738.0A CN108829698A (zh) | 2018-04-19 | 2018-04-19 | 政务系统发文方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108829698A true CN108829698A (zh) | 2018-11-16 |
Family
ID=64154812
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810351738.0A Withdrawn CN108829698A (zh) | 2018-04-19 | 2018-04-19 | 政务系统发文方法、装置、计算机设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN108829698A (zh) |
WO (1) | WO2019200699A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109918407A (zh) * | 2019-01-28 | 2019-06-21 | 平安科技(深圳)有限公司 | 搜索信息处理方法和装置 |
CN110705285A (zh) * | 2019-09-20 | 2020-01-17 | 北京市计算中心 | 一种政务文本主题词库构建方法、装置、服务器及可读存储介质 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110852091B (zh) * | 2019-11-11 | 2023-08-15 | 杭州安恒信息技术股份有限公司 | 错别字的监测方法、装置、电子设备和计算机可读介质 |
CN115271686B (zh) * | 2022-09-28 | 2023-04-07 | 北京长河数智科技有限责任公司 | 政务数据智能审核方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101520800B (zh) * | 2009-03-27 | 2010-09-01 | 华中科技大学 | 一种基于密文的安全全文索引和检索系统 |
-
2018
- 2018-04-19 CN CN201810351738.0A patent/CN108829698A/zh not_active Withdrawn
- 2018-06-25 WO PCT/CN2018/092555 patent/WO2019200699A1/zh active Application Filing
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109918407A (zh) * | 2019-01-28 | 2019-06-21 | 平安科技(深圳)有限公司 | 搜索信息处理方法和装置 |
CN109918407B (zh) * | 2019-01-28 | 2024-06-04 | 平安科技(深圳)有限公司 | 搜索信息处理方法和装置 |
CN110705285A (zh) * | 2019-09-20 | 2020-01-17 | 北京市计算中心 | 一种政务文本主题词库构建方法、装置、服务器及可读存储介质 |
CN110705285B (zh) * | 2019-09-20 | 2022-11-22 | 北京市计算中心有限公司 | 一种政务文本主题词库构建方法、装置、服务器及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2019200699A1 (zh) | 2019-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110399457B (zh) | 一种智能问答方法和系统 | |
CN103365925B (zh) | 获取多音字拼音、基于拼音检索的方法及其相应装置 | |
CN107798123B (zh) | 知识库及其建立、修改、智能问答方法、装置及设备 | |
CN107392143A (zh) | 一种基于svm文本分类的简历精确解析方法 | |
CN108829698A (zh) | 政务系统发文方法、装置、计算机设备及存储介质 | |
EP2833271A1 (en) | Multimedia question and answer system and method | |
JPH04127370A (ja) | 情報収集システム | |
CN103440232A (zh) | 一种科技论文标准化自动检测编辑方法 | |
US20200210441A1 (en) | System and method of database creation through form design | |
US20150026159A1 (en) | Digital Resource Set Integration Methods, Interfaces and Outputs | |
CN103440233A (zh) | 一种科技论文标准化自动检测编辑系统 | |
CN109508448A (zh) | 基于长篇文章生成短资讯方法、介质、装置和计算设备 | |
CN110362596A (zh) | 一种文本抽取信息结构化数据处理的控制方法及装置 | |
CN111104437A (zh) | 基于对象模型的试验数据统一检索方法和系统 | |
CN108829651A (zh) | 一种公文处理的方法、装置、终端设备及存储介质 | |
CN102591897A (zh) | 文件检索装置以及文件检索方法 | |
EP2544100A2 (en) | Method and system for making document modules | |
CN111753042A (zh) | 一种基于人工智能辅助写作系统 | |
CN110362694A (zh) | 基于人工智能的文献数据检索方法、设备及可读存储介质 | |
CN110147358B (zh) | 自动问答知识库的建设方法及建设系统 | |
CN105426490A (zh) | 一种基于树形结构的索引方法 | |
JPH06215035A (ja) | テキスト検索装置 | |
CN111309773A (zh) | 一种车辆信息的查询方法、装置、系统及存储介质 | |
CN112905752A (zh) | 一种智能交互方法、装置、设备以及存储介质 | |
CN106844329A (zh) | 一种基于邮件列表的开源软件问答信息抽取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20181116 |
|
WW01 | Invention patent application withdrawn after publication |