CN108563734B - 制度信息查询方法、装置、计算机设备和存储介质 - Google Patents

制度信息查询方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN108563734B
CN108563734B CN201810312749.8A CN201810312749A CN108563734B CN 108563734 B CN108563734 B CN 108563734B CN 201810312749 A CN201810312749 A CN 201810312749A CN 108563734 B CN108563734 B CN 108563734B
Authority
CN
China
Prior art keywords
information
splitting
file
applicable object
tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810312749.8A
Other languages
English (en)
Other versions
CN108563734A (zh
Inventor
韩梅
张安元
邓华威
王科
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201810312749.8A priority Critical patent/CN108563734B/zh
Priority to PCT/CN2018/095449 priority patent/WO2019196226A1/zh
Publication of CN108563734A publication Critical patent/CN108563734A/zh
Application granted granted Critical
Publication of CN108563734B publication Critical patent/CN108563734B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • Quality & Reliability (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种制度信息查询方法、装置、计算机设备和存储介质。该方法包括:监测第一终端发布的制度信息;制度信息包括制度描述信息及关联的制度文件;制度文件包括多个制度条款及分别对应的适用对象标识;对制度信息进行分类,将制度信息添加至预设的一个或多个目标信息树;获取目标信息树对应的多个关联信息树及分别对应的适用对象标识;对制度文件进行拆分,利用每个适用对象标识对应的制度条款生成相应的制度子文件;根据制度描述信息生成信息节点,将相应制度子文件关联至信息节点,将信息节点添加至相同适用对象标识对应的关联信息树;基于关联信息树响应制度查询请求。该方法能够信息查询效率。

Description

制度信息查询方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种制度信息查询方法、装置、计算机设备和存储介质。
背景技术
企业制度化是对企业生产经营与管理等活动中的重复性事物和概念,通过制订、发布和实施制度规范达到统一,以提高企业管理水平。制度规范(以下简称“制度”)是员工在生产经营活动中须共同遵守的规定和准则,包括法律与政策、企业组织结构、管理制度、岗位职责、技术制度、工作流程等制度文件。为了满足所有岗位的工作需求,企业可能将适用于不同岗位的制度信息全部记录至同一个制度文件中,使得用户只能基于制度文件全部信息内容进行制度查询,进而使制度信息查询效率降低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高制度信息查询效率的制度信息查询方法、装置、计算机设备和存储介质。
一种制度信息查询方法,所述方法包括:监测第一终端发布的制度信息;所述制度信息包括制度描述信息及关联的制度文件;所述制度文件包括多个制度条款以及分别对应的适用对象标识;对所述制度信息进行分类,根据分类结果将所述制度信息添加至预设的一个或多个目标信息树;获取所述目标信息树对应的多个关联信息树;每个所述关联信息树具有对应的适用对象标识;对所述制度文件进行拆分,利用每个适用对象标识对应的制度条款生成相应适用对象标识对应的制度子文件;根据所述制度描述信息生成信息节点,将相应所述制度子文件关联至所述信息节点,将所述信息节点添加至相同适用对象标识对应的关联信息树;当接收到第二终端发送的制度查询请求时,基于所述关联信息树响应所述制度查询请求。
在其中一个实施例中,对所述制度信息进行分类,将所述制度信息添加至预设的一个或多个目标信息树包括:对所述制度信息进行分词得到对应的原始词语集合;所述原始词语集合包括多个原始词语;对各个原始词语进行同义扩展,生成每个原始词语对应的扩展词语集合;根据各个扩展词语集合形成所述制度信息对应的扩展制度信息集合;将所述扩展制度信息集合输入预设的制度管理模型,得到所述制度信息对应的目标类别;获取多个所述目标信息树分别对应的类别标注,筛选包含与所述目标类别对应类别标注的目标信息树,将所述制度信息添加至筛选得到的目标信息树。
在其中一个实施例中,所述对所述制度文件进行拆分包括:识别所述制度文件的文件类型;当所述制度文件的文件类型为第一类型时,调用预设的拆分接口对所述制度文件进行拆分;当所述制度文件的文件类型为第二类型时,获取预设的多个适用对象标识分别对应的拆分表达式,对所述制度文件进行遍历,将每个拆分表达式与所述制度文件进行匹配,根据匹配结果对所述制度文件进行拆分。
在其中一个实施例中,所述对所述制度文件进行拆分包括:计算所述制度文件的数据量,检测所述数据量是否超过阈值;当所述数据量超过阈值时,获取预设的目标数据量,根据所述目标数据量确定所述制度文件的拆分位置;检测所述拆分位置是否位于相邻分隔符之间;当所述拆分位置位于一个分隔符处时,在所述拆分位置将所述制度文件拆分为多个中间文件;当所述拆分位置位于相邻分隔符之间时,在所述相邻分隔符中任意一个分隔符处将所述制度文件拆分为多个中间文件;按照预设的拆分规则,对多个所述中间文件进行拆分。
在其中一个实施例中,根据所述制度描述信息生成信息节点,将相应所述制度子文件关联至所述信息节点,将所述信息节点添加至相同适用对象标识对应的关联信息树包括:对拆分得到的多个制度子文件的总数据量进行校验;对拆分得到的多个制度子文件分别对应制度条款的总数量进行校验;获取预设的多个关键字段,在拆分得到的多个制度子文件提取关键字段,对提取到的关键字段与预设的关键字段进行匹配;当多个制度子文件的总数据量以及对应制度条款的总数量分别校验通过,且提取到的关键字段与预设的关键字段匹配成功时,根据所述制度描述信息生成信息节点,将相应所述制度子文件关联至所述信息节点,将所述信息节点添加至相同适用对象标识对应的关联信息树。
在其中一个实施例中,所述关联信息树包括多个信息节点;每个信息节点关联有对应的信息摘要;所述制度查询请求携带了员工标识和查询条件;基于所述关联信息树响应所述制度查询请求包括:获取所述员工标识对应的适用对象标识;根据所述适用对象标识,在对应的关联信息树中查找是否存在满足所述查询条件的信息节点;若存在,获取满足所述查询条件的信息节点关联的信息摘要,将所述信息摘要返回至所述第二终端;当接收到所述第二终端发送的制度阅读请求时,所述制度阅读请求携带了信息节点标识;获取所述信息节点标识对应的制度文件,将所述制度文件返回至所述第二终端。
在其中一个实施例中,所述方法还包括:按照预设规则生成所述制度信息对应的爬虫标签;根据所述爬虫标签,在数据库空闲时间从预设网站爬取与所述制度信息相关的时事政治信息;对爬取到的所述时事政治信息与多个所述制度条款进行语义解析,判断是否存在所述制度条款的语义与所述时事政治信息的语义相悖;若存在与所述时事政治信息语义相悖的制度条款,生成所述制度条款对应的复审提示,将所述复审提示发送至所述第一终端。检测与所述时事政治信息语义相悖的制度条款是否存在对应的子条款;若存在,生成所述子条款对应的联动复审提示,将所述联动复审提示发送至所述第一终端。
一种制度信息查询装置,所述装置包括:信息分类模块,用于监测第一终端发布的制度信息;所述制度信息包括制度描述信息及关联的制度文件;所述制度文件包括多个制度条款以及分别对应的适用对象标识;对所述制度信息进行分类,根据分类结果将所述制度信息添加至预设的一个或多个目标信息树;信息拆分模块,用于获取所述目标信息树对应的多个关联信息树;每个所述关联信息树具有对应的适用对象标识;对所述制度文件进行拆分,利用每个适用对象标识对应的制度条款生成相应适用对象标识对应的制度子文件;信息归档模块,用于根据所述制度描述信息生成信息节点,将相应所述制度子文件关联至所述信息节点,将所述信息节点添加至相同适用对象标识对应的关联信息树;信息查询模块,用于当接收到第二终端发送的制度查询请求时,基于所述关联信息树响应所述制度查询请求。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:监测第一终端发布的制度信息;所述制度信息包括制度描述信息及关联的制度文件;所述制度文件包括多个制度条款以及分别对应的适用对象标识;对所述制度信息进行分类,根据分类结果将所述制度信息添加至预设的一个或多个目标信息树;获取所述目标信息树对应的多个关联信息树;每个所述关联信息树具有对应的适用对象标识;对所述制度文件进行拆分,利用每个适用对象标识对应的制度条款生成相应适用对象标识对应的制度子文件;根据所述制度描述信息生成信息节点,将相应所述制度子文件关联至所述信息节点,将所述信息节点添加至相同适用对象标识对应的关联信息树;当接收到第二终端发送的制度查询请求时,基于所述关联信息树响应所述制度查询请求。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:监测第一终端发布的制度信息;所述制度信息包括制度描述信息及关联的制度文件;所述制度文件包括多个制度条款以及分别对应的适用对象标识;对所述制度信息进行分类,根据分类结果将所述制度信息添加至预设的一个或多个目标信息树;获取所述目标信息树对应的多个关联信息树;每个所述关联信息树具有对应的适用对象标识;对所述制度文件进行拆分,利用每个适用对象标识对应的制度条款生成相应适用对象标识对应的制度子文件;根据所述制度描述信息生成信息节点,将相应所述制度子文件关联至所述信息节点,将所述信息节点添加至相同适用对象标识对应的关联信息树;当接收到第二终端发送的制度查询请求时,基于所述关联信息树响应所述制度查询请求。
上述制度信息查询方法、装置、计算机设备和存储介质,在监测到新发布的制度信息时,对制度信息分类,可以根据分类结果将制度信息添加至预设的一个或多个目标信息树;制度文件中每个制度条款对应的适用对象标识,对制度文件中多个制度条款进行拆分,可以得到每个适用对象标识对应的制度子文件;根据所述目标信息树中适用对象标识,可以获取对应的关联信息树,进而可以将根据制度描述信息生成关联有不同制度子文件的信息节点添加至相同适用对象标识对应的关联信息树;在接收到第二终端发送的制度查询请求时,可以基于关联信息树响应制度查询请求。在制度信息发布时,将记录来了适用于不同岗位的制度信息的制度文件拆分,将每个岗位需要执行或了解的制度条款挑选出来,满足不同岗位个性化需求,为不同岗位分别构建只包含相应岗位需求内容的关联信息树,且所有关联信息树的生成过程全自动进行,省时省力;后续用户只需基于适用于自己的关联信息树进行制度查询,也可以提高制度查询效率。
附图说明
图1为一个实施例中制度信息查询方法的应用场景图;
图2为一个实施例中制度信息查询方法的流程示意图;
图3为一个实施例中制度信息查询方法中目标信息树的示意图;
图4为一个实施例中制度信息查询方法中关联信息树的示意图;
图5为一个实施例中对制度信息分类归档步骤的流程示意图;
图6为一个实施例中制度信息查询装置的结构框图;
图7为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的制度信息查询方法,可以应用于如图1所示的应用环境中。其中,第一终端102与服务器104通过网络进行通信。第二终端106与服务器104通过网络进行通信。其中,第一终端102和第二终端106可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。第一终端102为制度管理终端,用户可以在第一终端102进行制度起草、意见征集、审批和发布等。第二终端106为业务终端,用户可以在第二终端106进行制度学习等操作。第一终端102与第二终端106可以同一终端,也可以是不同的终端。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
服务器104中存储了多种目标信息树。每种目标信息树具有对应的类别标注。服务器104对第一终端102是否发布新的制度信息进行监测。制度信息包括制度描述信息及关联的制度文件。当监测到第一终端102发布了新的制度信息时,服务器104对制度信息进行分类,根据分类结果将制度信息纳入相应的一种或多种目标信息树。每种目标信息树具有对应的多个关联信息树。每种关联信息树具有对应的适用对象标识。服务器104将制度信息纳入相应的关联信息树。具体的,将制度信息添加至相应的目标信息树后,服务器104获取目标信息树对应的多个关联信息树。制度文件包括多个制度条款以及分别对应的适用对象标识。服务器104根据制度文件中每个制度条款对应的适用对象标识,对制度文件进行拆分,利用每个适用对象标识对应的制度条款生成相应适用对象标识对应的制度子文件。服务器104根据制度描述信息生成信息节点,将拆分得到的多个制度子文件分别关联至信息节点。服务器104将多个关联有不同制度子文件的信息节点分别添加至相同适用对象标识对应的关联信息树。当接收到第二终端106发送的制度查询请求时,服务器104基于关联信息树响应该制度查询请求。在制度信息发布时,将记录来了适用于不同岗位的制度信息的制度文件拆分,为不同岗位分别构建专门的关联信息树,后续用户只需基于适用于自己的内容进行制度查询,提高制度查询效率。
在一个实施例中,如图2所示,提供了一种制度信息查询方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤202,监测第一终端发布的制度信息;制度信息包括制度描述信息及关联的制度文件;制度文件包括多个制度条款以及分别对应的适用对象标识。
服务器对第一终端是否发布新的制度信息进行监测。制度信息包括制度描述信息及关联的制度文件。制度描述信息包括制度编码、制度名称、制度级别、发布单位、发布日期、适用对象标识或信息摘要等。制度信息可以是文本信息,也可以是语音信息、图像信息、视频信息等。如果是语音信息、图像信息或视频信息,则可先通过语音识别或图像处理,将语音信息、图像信息和视频信息转化为文本信息。制度文件包括多项制度条款以及每项制度条款对应的适用对象标识。适用对象标识是指需要执行或了解该制度的对象的标识信息,可以是岗位标识或机构标识等。
步骤204,对制度信息进行分类,根据分类结果将制度信息添加至预设的一个或多个目标信息树。
当监测到第一终端发布了新的制度信息时,服务器对制度信息进行分类。具体的,服务器对制度信息进行分词得到对应的原始词语集合。原始词语集合包括多个原始词语。服务器对各个原始词语进行同义扩展,生成每个原始词语对应的扩展词语集合。服务器根据各个扩展词语集合形成制度信息对应的扩展制度信息集合,将扩展制度信息集合输入预设的制度管理模型,得到制度信息对应的目标类别。
服务器中存储了多种目标信息树。不同目标信息树可以理解为不同的制度体系,用于存储不同类别和用途的制度信息。如图3所示,每种目标信息树包括多个信息节点及每个信息节点关联的制度文件。制度文件可以是多种类型的文件,如pdf文档、jpg图像、xls表格、mp3音频或avi视频等。不同的信息节点在目标信息树中可以按照发布时间先后排列。容易理解,一项制度信息也可以不具有关联的制度文件,也还可以具有多个关联的制度文件,对此不作限制。
每种目标信息树具有对应的类别标注。类别标注用于标识相应目标信息树能够包含的信息节点的类别,如行政管理类、销售管理类或风险管理类等。服务器获取与目标类别对应的类别标注,筛选包含获取到的类别标注的一种或多种目标信息树。服务器根据制度描述信息生成信息节点。例如,可以将制度编号和/或制度名称作为信息节点。服务器将制度文件关联至该信息节点,将关联有制度文件的信息节点添加至筛选得到的目标信息树。
步骤206,获取目标信息树对应的多个关联信息树;每个关联信息树具有对应的适用对象标识。
每种目标信息树具有对应的多个关联信息树。目标信息树中每个信息节点具有对应的一个或多个适用对象标识。目标信息树中不同适用对象标识分别具有对应的一个关联信息树。换言之,目标信息树中包含适用对象标识的数量与对应的关联信息树的数量相等,从而每个适用对象标识对应岗位具有对应的关联信息树。
目标信息树用于记录适用于企业全部岗位的制度信息。而关联信息树则只需记录适用于一个岗位的制度信息。每种关联信息树具有对应的适用对象标识。如图4所示,岗位1无需执行或了解信息节点4和信息节点9对应的制度,则适用对象标识“岗位1”对应的关联信息树,相对图3目标信息树不存在信息节点4和信息节点9。容易理解,关联信息树中多个信息节点的目录层级,并非一定与目标信息树一致,可以自适应调整。关联信息树仍存在的其他信息节点关联的制度文件记录的内容,与目标信息树中相应信息节点关联的制度文件记录的内容可以不同。
步骤208,对制度文件进行拆分,利用每个适用对象标识对应的制度条款生成相应适用对象标识对应的制度子文件。
服务器根据制度文件中每个制度条款对应的适用对象标识,对制度文件中多个制度条款进行拆分,生成每个适用对象标识分别对应的制度子文件。例如,制度文件A包括X1~X4四项制度条款。其中,X1对应适用对象标识包括甲和乙,X2对应适用对象标识包括甲,X3对应适用对象标识包括甲、乙、丙、丁和戊,X4对应适用对象标识包括甲和丁。制度文件A共包括甲、乙、丙、丁和戊五个适用对象标识,对应的拆分得到五个制度子文件A1~A5。其中,适用对象标识甲对应的制度子文件A1包括X1~X4四项制度条款;适用对象标识乙对应的制度子文件A2包括X1和X3两项制度条款;如此类推。
步骤210,根据制度描述信息生成信息节点,将相应制度子文件关联至信息节点,将信息节点添加至相同适用对象标识对应的关联信息树。
服务器将制度信息添加至相应的目标信息树后,服务器根据制度文件记录的适用对象标识,获取目标信息树对应的相应关联信息树。容易理解,服务器只需获取制度文件记录的适用对象标识对应的关联信息树。例如,制度信息分类添加至三种目标信息树,其中包括目标信息树M。目标信息树M对应适用对象标识包括甲、乙、丙、丁、戊和己,假设依上述举例制度文件只包括适用于甲、乙、丙、丁和戊的信息内容,则服务器只需获取目标信息树M对应的甲、乙、丙、丁和戊分别对应的关联信息树。
服务器根据制度描述信息生成信息节点,将拆分得到的多个制度子文件分别关联至信息节点。服务器将多个关联有不同制度子文件的信息节点分别添加至相同适用对象标识对应的关联信息树。例如,在上述举例中,将关联有制度子文件A1的信息节点添加至目标信息树M中适用对象标识甲对应的关联信息树M;将关联有制度子文件A2的信息节点添加至目标信息树M中适用对象标识乙对应的关联信息树M,如此类推。
步骤212,当接收到第二终端发送的制度查询请求时,基于关联信息树响应制度查询请求。
当接收到第二终端发送的制度查询请求时,服务器获取适用对象标识对应的关联信息树。制度查询请求携带了适用对象标识和查询条件。服务器在关联信息树中查找满足查询条件的信息节点,获取与满足查询条件的信息节点关联的制度子文件,将制度子文件发送至第二终端。传统的目标信息树为了满足所有用户的需求,需要将所有制度信息都包含到相应目标信息树中,这样导致目标信息树缺乏针对性。本实施例为不同岗位分别构建专门的关联信息树,方便用户基于适用于自己的信息内容进行查询,提高制度查询效率。
本实施例中,在监测到新发布的制度信息时,对制度信息分类,可以根据分类结果将制度信息添加至预设的一个或多个目标信息树;制度文件中每个制度条款对应的适用对象标识,对制度文件中多个制度条款进行拆分,可以得到每个适用对象标识对应的制度子文件;根据目标信息树中适用对象标识,可以获取对应的关联信息树,进而可以将根据制度描述信息生成关联有不同制度子文件的信息节点添加至相同适用对象标识对应的关联信息树;在接收到第二终端发送的制度查询请求时,可以基于关联信息树响应制度查询请求。在制度信息发布时,将记录来了适用于不同岗位的制度信息的制度文件拆分,将每个岗位需要执行或了解的制度条款挑选出来,满足不同岗位个性化需求,为不同岗位分别构建只包含相应岗位需求内容的关联信息树,且所有关联信息树的生成过程全自动进行,省时省力;后续用户只需基于适用于自己的关联信息树进行制度查询,也可以提高制度查询效率。
在一个实施例中,如图5所示,对制度信息分类归档的步骤,即对制度信息进行分类,将制度信息添加至预设的一个或多个目标信息树包括:
步骤502,对制度信息进行分词得到对应的原始词语集合;原始词语集合包括多个原始词语。
当监测到第一终端发布的制度信息,服务器通过分词算法对制度信息进行分词,得到原始词语集合。原始词语集合包括多个原始词语。在一个实施例中,得到各个原始词语后,去除停用词、语气词、标点符号等对分类影响作用小的词语,从而提高后续特征提取的效率。停用词指的是制度信息中出现频率超过预设阈值但实际意义不大的词,如我,的,他等。
终端在发布制度信息时,也可以预先标明制度信息的类别信息,以便服务器可以根据该类别信息,将制度信息纳入相应的目标信息树。若制度描述信息已包含制度信息的类别信息,可以根据类别信息将制度信息添加至相应的目标信息树。若制度描述信息并未包含制度信息的类别信息,则可以按照本申请提供的制度信息处理方法对制度信息进行分类管理。
步骤504,对各个原始词语进行同义扩展,生成每个原始词语对应的扩展词语集合。
服务器分别获取原始词语集合中各个原始词语对应的同义词,将原始词语与对应的同义词形成扩展词语集合。每个原始词语都存在对应的扩展词语集合。同义词是指与原始词语含义相同或相近的词语,如原始词语为“不得”,同义词可为“切勿”、“禁止”、“避免”、“杜绝”等,将原始词语与对应的同义词形成扩展词语集合,如原始词语“不得”对应的扩展词语集合为{不得,切勿,禁止,避免,杜绝}。如原始词语集合为{a,b,c},则原始词语集合中的每个原始词语都存在对应的扩展词语集合,如a对应的扩展词语集合为{a,a1,a2},b对应的扩展词语集合为{b,b1,b2,b3},c对应的扩展词语集合为{c,c1,c2}。
步骤506,根据各个扩展词语集合形成制度信息对应的扩展制度信息集合。
服务器按照与制度信息中各个原始词语出现的顺序,从各个原始词语对应的扩展词语集合中任意选择一个词语,按顺序形成一个扩展制度信息。当从扩展词语集合中选择不同的词语时,则形成不同的扩展制度信息,不同的扩展制度信息组成扩展制度信息集合。在一个实施例中,服务器对各个原始词语对应的扩展词语集合求笛卡尔积,形成由不同的扩展制度信息组成的扩展制度信息集合。两个集合X和Y的笛卡尔积,又称直积,表示为X×Y。第一个对象是X的成员而第二个对象是Y的所有可能有序对的其中一个成员。
步骤508,将扩展制度信息集合输入预设的制度管理模型,得到制度信息对应的目标类别。
制度管理模型用于根据输入从多个候选类型中确定与输入对应的目标类别。制度管理模型可以是通过逻辑回归算法、支持向量机算法等训练得到的模型。制度管理模型内部可以由多个子管理模型连接形成。由于制度管理模型的输入是经过扩展了的扩展制度信息集合,扩展后的各个扩展制度信息表达了与制度信息相同或相近的含义,提高了制度信息的有效覆盖范围,从而在后续输入已训练的制度管理模型后,可提高目标类别的精准性。
步骤510,获取多个目标信息树分别对应的类别标注,筛选包含与目标类别对应类别标注的目标信息树,将制度信息添加至筛选得到的目标信息树。
服务器获取与目标类别对应的类别标注,筛选包含获取到的类别标注的一种或多种目标信息树。服务器根据制度描述信息生成信息节点,检测筛选得到的目标信息树中是否已存在相同的信息节点。若不存在,服务器将制度文件关联至该信息节点,将关联有制度文件的信息节点添加至筛选得到的目标信息树。
若筛选得到的目标信息树中已经存在相应的信息节点,则服务器只需将制度文件关联至已存在相应的信息节点。在另一个实施例中,服务器根据制度描述信息判断生成的信息节点与已存在的相同信息节点属于并列节点还是父子节点。当生成的信息节点与已存在的相同信息节点属于并列节点时,服务器对生成的信息节点与已存在的相同信息节点进行区别标记,将区别标记后的信息节点添加至相应的目标信息树,将制度文件关联至区别标记后的信息节点。
当生成的信息节点与已存在的相同信息节点属于并列节点时,服务器根据制度描述信息对生成的信息节点进行描述限定,即在制度描述信息中提取关键词,利用提取到的关键词对生成的信息节点进行语义扩充。例如,根据制度名称生成的信息节点为“公司福利管理制度”,在制度描述信息中提取关键词“研发部”,则语义扩充后的信息节点可以是“公司研发部福利管理制度”。服务器将语义扩充后的信息节点作为已存在的相同信息节点的子节点添加至相应的目标信息树,将制度文件关联至该子节点。
本实施例中,先形成每个原始词语对应的扩展词语集合,再通过扩展词语集合形成扩展制度信息集合,大大提高了扩展制度信息的扩展度,扩展后的各个扩展制度信息表达了与制度信息相同或相近的含义,提高了制度信息的有效覆盖范围,从而在后续输入已训练的制度管理模型后,可提高目标类别的精准性,进而可以准确将制度信息纳入相应的目标信息树,提高制度信息分类效率和准确率。
在一个实施例中,对制度文件进行拆分包括:识别制度文件的文件类型;当制度文件的文件类型为第一类型时,调用预设的拆分接口对制度文件进行拆分;当制度文件的文件类型为第二类型时,获取预设的多个适用对象标识分别对应的拆分表达式,对制度文件进行遍历,将每个拆分表达式与制度文件进行匹配,根据匹配结果对制度文件进行拆分。
不同文件类型对应的拆分规则可以包含相同的拆分维度,但包含不同的拆分方式。具体的,当制度文件的文件类型为第一类型时,对应的拆分方式可以是利用预设的拆分接口进行拆分。例如,当第一类型的制度文件为dbf.数据库表文件时,预设的拆分接口可以是OLEDB(一种应用程序接口)。当制度文件的文件类型为第二类型时,对应的拆分方式可以是利用预设的多个拆分表达式进行拆分。服务器预存储了多个适用对象标识分别对应的拆分表达式,每个拆分表达式包括一个或多个拆分字段。服务器对制度文件进行逐行遍历,将每个适用对象标识对应的拆分表达式与制度文件中多项制度条款分别进行匹配,将制度文件中与每个拆分表达式匹配成功的制度条款拆分为一个相应适用对象标识对应的制度子文件,从而得到制度文件在多个拆分维度的制度子文件。
本实施例中,针对不同类型的文件配置包含不同拆分方式的拆分规则,从而可以支持多种类型文件的拆分。
在一个实施例中,对制度文件进行拆分包括:计算制度文件的数据量,检测数据量是否超过阈值;当数据量超过阈值时,获取预设的目标数据量,根据目标数据量确定制度文件的拆分位置;检测拆分位置是否位于相邻分隔符之间;当拆分位置位于一个分隔符处时,在拆分位置将制度文件拆分为多个中间文件;当拆分位置位于相邻分隔符之间时,在相邻分隔符中任意一个分隔符处将制度文件拆分为多个中间文件;按照预设的拆分规则,对多个中间文件进行拆分。
服务器计算制度文件的数据量,检测数据量是否超过阈值。该阈值可以是预先设定的,也可以是根据服务器的负载监测结果临时生成的。当数据量超过阈值时,服务器可以将制度文件预先拆分为多个数据量小的中间文件,再将中间文件分别拆分为多个制度子文件。具体的,服务器获取预设的目标数据量,根据目标数据量确定制度文件的拆分位置。目标数据量可以是预先设定的,也可以是根据对多个集群内其他服务器的负载监测结果临时生成的。例如,制度文件A的数据量为720M,假设目标数据量为80M,则将制度文件的第80M大小的位置标记为第一个拆分位置,第160M大小的位置标记为第二个拆分位置,以此类推。
服务器识别每个拆分位置是否位于相邻分隔符之间。当拆分位置位于一个分隔符所在的位置时,服务器在该拆分位置对制度文件进行拆分,得到该制度文件对应的多个中间文件。当拆分位置位于相邻分隔符之间时,服务器在相邻分隔符中任意一个分隔符处对相应制度文件进行拆分,即对该相邻分隔符中的前一个分隔符或后一个分隔符处进行拆分,得到制度文件对应的多个中间文件。服务器调用多线程按照上述方式将中间文件拆分为多个制度子文件,或者将中间文件发送至集群内其他服务器进行拆分,以提高文件拆分效率。将数据量较大的制度文件拆分为数据量较小的中间文件后传输至集群内其他服务器进行拆分,还可以提高数据传输效率。
本实施例中,对于数据量较大的制度文件进行两级拆分:其中,第一层级的拆分是根据数据量进行拆分,第二层级的拆分是根据预设的拆分维度进行拆分;将数据量较大的制度文件拆分为数据量较小的中间文件,可以并行将中间文件拆分为多个制度子文件,进而可以提高文件拆分效率。
在一个实施例中,根据制度描述信息生成信息节点,将相应制度子文件关联至信息节点,将信息节点添加至相同适用对象标识对应的关联信息树包括:对拆分得到的多个制度子文件的总数据量进行校验;对拆分得到的多个制度子文件分别对应制度条款的总数量进行校验;获取预设的多个关键字段,在拆分得到的多个制度子文件提取关键字段,对提取到的关键字段与预设的关键字段进行匹配;当多个制度子文件的总数据量以及对应制度条款的总数量分别校验通过,且提取到的关键字段与预设的关键字段匹配成功时,根据制度描述信息生成信息节点,将相应制度子文件关联至信息节点,将信息节点添加至相同适用对象标识对应的关联信息树。
为了提高文件拆分的准确性,在将拆分得到的多个制度子文件添加至相应关联信息树之前,对拆分后的多个制度子文件与拆分前的制度文件的数据一致性进行校验。具体的,服务器获取拆分前制度文件的数据量,记作第一数据量;计算拆分得到的多个制度子文件的总数据量,记作第二数据量。服务器对第一数据量与第二数据量的差值是否超过阈值进行校验。
服务器根据制度描述信息测算拆分前制度文件包含制度条款的总数量,记作第一数量。服务器统计拆分得到的多个制度子文件分别对应制度条款的总数量,记作第二数量。服务器对第一数量与第二数量是否相等进行校验。
制度描述信息包括信息摘要。服务器在信息摘要中提取多个关键字段。服务器在拆分得到的多个制度子文件提取关键字段,对提取到的关键字段与预设的关键字段进行匹配。当第一数据量与第二数据量的差值未超过阈值,第一数量与第二数量相等,且提取到的关键字段与预设的关键字段匹配成功时,表示数据一致性校验通过,服务器按照上述方式将多个制度子文件分别添加至相应关联信息树。
本实施例中,每个制度文件在拆分完成后,对拆分得到的多个制度子文件与拆分之前的制度文件进行数据一致性校验,可以保证文件拆分的准确性,避免文件拆分造成数据缺失对关联信息树的信息准确性造成影响,进而可以提高制度查询准确率。
在一个实施例中,关联信息树包括多个信息节点;每个信息节点关联有对应的信息摘要;制度查询请求携带了员工标识和查询条件;基于关联信息树响应制度查询请求包括:获取员工标识对应的适用对象标识;根据适用对象标识,在对应的关联信息树中查找是否存在满足查询条件的信息节点;若存在,获取满足查询条件的信息节点关联的信息摘要,将信息摘要返回至第二终端;当接收到第二终端发送的制度阅读请求时,制度阅读请求携带了信息节点标识;获取信息节点标识对应的制度文件,将制度文件返回至第二终端。
服务器在生成每个适用对象标识对应的关联信息树后,将关联信息树推送至相应岗位对应的第二终端,供相应岗位用户参考查询学习。第二终端根据用户对关联信息树的查询操作,触发制度查询请求或制度阅读请求,将制度查询请求或制度阅读请求发送至服务器。例如,第二终端检测到鼠标停留在某个信息节点的时间超过阈值,则向服务器发送制度查询请求。第二终端检测到鼠标在某个信息节点的鼠标点击操作,则向服务器发送制度阅读请求。
制度查询请求携带了员工标识和查询条件。服务器根据制度查询请求,获取员工标识对应的适用对象标识,根据适用对象标识获取对应的关联信息树,在获取到的关联信息树中查找是否存在满足查询条件的信息节点。关联信息树中每个信息节点关联有对应的信息摘要。信息摘要记录了相应制度信息的用途、主要内容简介或适用范围等。当信息节点或其关联的信息摘要中包含查询条件中多个关键词则表示该信息节点满足查询条件。
当存在满足查询条件的信息节点时,服务器获取该信息节点关联的信息摘要,将信息摘要返回至第二终端。信息摘要可以是根据制度描述信息生成的。第二终端弹窗展示该目录节点对应的信息摘要,以便用户判断该信息节点是否为自己需要查找的制度信息。如果是,再通过制度阅读请求向服务器进一步获取对应的条款详细信息,以减少第二终端与服务器之间不必要的数据传输。条款详细信息可以是被点击信息节点对应的制度文件。
本实施例中,在第二终端进行制度查询时,服务器向第二终端反馈信息摘要后,再反馈对应的制度文件,以减少第二终端与服务器之间不必要的数据传输,进而可以节约服务器资源。
在一个实施例中,方法还包括:按照预设规则生成制度信息对应的爬虫标签;根据爬虫标签,在数据库空闲时间从预设网站爬取与制度信息相关的时事政治信息;对爬取到的时事政治信息与多个制度条款进行语义解析,判断是否存在制度条款的语义与时事政治信息的语义相悖;若存在与时事政治信息语义相悖的制度条款,生成制度条款对应的复审提示,将复审提示发送至第一终端。检测与时事政治信息语义相悖的制度条款是否存在对应的子条款;若存在,生成子条款对应的联动复审提示,将联动复审提示发送至第一终端。
服务器在将信息节点添加至目标信息树之前,针对信息节点关联对应的爬虫标签。爬虫标签可以是制度信息中一个或多个与法律法规或时事政治相关的制度关键词。为了缓解服务器的资源消耗,服务器在数据库的空闲时间根据爬虫标签,在预设网站爬取相关的时事政治信息。因而,服务器进行爬虫操作之前,需要提前分析出数据库的空闲时间。
具体的,服务器运行监控脚本,通过监控脚本对预设时间段内数据库中的批处理任务执行状况和资源消耗状况进行监控,得到在预设时间段内批处理任务的执行时间和资源消耗时间。批处理任务包括对制度信息进行分类以及基于关联信息树相应制度查询请求等。为了能够充分缓解数据库资源消耗的压力,可以将预设时间段设置为整个非工作时间的时间段或者部分非工作时间的时间段。例如,根据爬虫标签,在预设网站爬取相关的时事政治信息之前的一个月内1号~5号的晚上9:00~凌晨5:30的时间段等。服务器将在预设时间段内资源消耗时间进行统计,得到资源消耗统计表。服务器提取资源消耗统计表中的资源消耗时间与多个批处理任务的执行时间进行比对,筛选出能够避开多个批处理任务执行时间的资源消耗时间。由于批处理任务执行时会消耗较多的数据库资源,因此避开多个批处理任务执行时间的资源消耗时间,可以作为数据库的空闲时间。由于数据库的空闲时间是在预设时间段内的,预设时间段可以是非工作时间的时间段,因此通过上述方式得到的数据库的空闲时间可以视为数据库性能最优的空闲时间。
服务器在数据库的空闲时间根据爬虫标签,在预设网站爬取相关的时事政治信息,对爬取到的时事政治信息和相应制度文件中多个制度条款进行语义解析,判断是否存在语义相悖的制度条款。若存在,服务器生成该制度条款对应的复审提示,将复审提示发送至第一终端。服务器检测与时事政治信息语义相悖的制度条款是否存在对应的子条款。若存在,服务器生成该子条款对应的联动复审提示,将联动复审提示发送至第一终端。
在另一个实施例中,可以对目标信息树中每个信息节点分别设定对应的有效期和复审提醒时限。服务器在将制度添加至相应的目标信息树后,开始计时,在达到有效期的复审提醒时限生成复审提示,将复审提示发送至第一终端。在又一个实施例中,第一终端随时可以向服务器发起对已发布制度的监控请求,以主动对信息节点对应的制度信息进行复审。服务器根据监控请求,在存储的多个目标信息树提取对应的信息节点返回至第一终端。
传统的,在制度信息发布之后缺乏对制度信息及时进行复审提示的方法,主要是以人工翻阅文件及人工记录的方式进行检查,耗费大量人力和时间成本。对于大型企业,其工作量更大。本实施例,便于第一终端对已经发布的大量制度信息有全局的了解,进而方便对已发布的制度信息进行跟踪修订或废止等管理。
应该理解的是,虽然图2和图5的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2和图5中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图6所示,提供了一种制度信息查询装置,包括:信息分类信息拆分模块604、信息归档模块606和信息查询模块608,其中:
信息分类模块602,用于监测第一终端发布的制度信息;制度信息包括制度描述信息及关联的制度文件;制度文件包括多个制度条款以及分别对应的适用对象标识;对制度信息进行分类,根据分类结果将制度信息添加至预设的一个或多个目标信息树。
信息拆分模块604,用于获取目标信息树对应的多个关联信息树;每个关联信息树具有对应的适用对象标识;对制度文件进行拆分,利用每个适用对象标识对应的制度条款生成相应适用对象标识对应的制度子文件。
信息归档模块606,用于根据制度描述信息生成信息节点,将相应制度子文件关联至信息节点,将信息节点添加至相同适用对象标识对应的关联信息树。
信息查询模块608,用于当接收到第二终端发送的制度查询请求时,基于关联信息树响应制度查询请求。
在一个实施例中,信息分类模块602还用于对制度信息进行分词得到对应的原始词语集合;原始词语集合包括多个原始词语;对各个原始词语进行同义扩展,生成每个原始词语对应的扩展词语集合;根据各个扩展词语集合形成制度信息对应的扩展制度信息集合;将扩展制度信息集合输入预设的制度管理模型,得到制度信息对应的目标类别;获取多个目标信息树分别对应的类别标注,筛选包含与目标类别对应类别标注的目标信息树,将制度信息添加至筛选得到的目标信息树。
在一个实施例中,信息拆分模块604还用于识别制度文件的文件类型;当制度文件的文件类型为第一类型时,调用预设的拆分接口对制度文件进行拆分;当制度文件的文件类型为第二类型时,获取预设的多个适用对象标识分别对应的拆分表达式,对制度文件进行遍历,将每个拆分表达式与制度文件进行匹配,根据匹配结果对制度文件进行拆分。
在一个实施例中,信息拆分模块604还用于计算制度文件的数据量,检测数据量是否超过阈值;当数据量超过阈值时,获取预设的目标数据量,根据目标数据量确定制度文件的拆分位置;检测拆分位置是否位于相邻分隔符之间;当拆分位置位于一个分隔符处时,在拆分位置将制度文件拆分为多个中间文件;当拆分位置位于相邻分隔符之间时,在相邻分隔符中任意一个分隔符处将制度文件拆分为多个中间文件;按照预设的拆分规则,对多个中间文件进行拆分。
在一个实施例中,信息归档模块606还用于对拆分得到的多个制度子文件的总数据量进行校验;对拆分得到的多个制度子文件分别对应制度条款的总数量进行校验;获取预设的多个关键字段,在拆分得到的多个制度子文件提取关键字段,对提取到的关键字段与预设的关键字段进行匹配;当多个制度子文件的总数据量以及对应制度条款的总数量分别校验通过,且提取到的关键字段与预设的关键字段匹配成功时,根据制度描述信息生成信息节点,将相应制度子文件关联至信息节点,将信息节点添加至相同适用对象标识对应的关联信息树。
在一个实施例中,关联信息树包括多个信息节点;每个信息节点关联有对应的信息摘要;制度查询请求携带了员工标识和查询条件;信息查询模块608还用于获取员工标识对应的适用对象标识;根据适用对象标识,在对应的关联信息树中查找是否存在满足查询条件的信息节点;若存在,获取满足查询条件的信息节点关联的信息摘要,将信息摘要返回至第二终端;当接收到第二终端发送的制度阅读请求时,制度阅读请求携带了信息节点标识;获取信息节点标识对应的制度文件,将制度文件返回至第二终端。
在一个实施例中,该装置还包括复审提示模块610,用于按照预设规则生成制度信息对应的爬虫标签;根据爬虫标签,在数据库空闲时间从预设网站爬取与制度信息相关的时事政治信息;对爬取到的时事政治信息与多个制度条款进行语义解析,判断是否存在制度条款的语义与时事政治信息的语义相悖;若存在与时事政治信息语义相悖的制度条款,生成制度条款对应的复审提示,将复审提示发送至第一终端。检测与时事政治信息语义相悖的制度条款是否存在对应的子条款;若存在,生成子条款对应的联动复审提示,将联动复审提示发送至第一终端。
关于制度信息查询装置的具体限定可以参见上文中对于制度信息查询方法的限定,在此不再赘述。上述制度信息查询装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储制度信息。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种制度信息查询方法。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:监测第一终端发布的制度信息;制度信息包括制度描述信息及关联的制度文件;制度文件包括多个制度条款以及分别对应的适用对象标识;对制度信息进行分类,根据分类结果将制度信息添加至预设的一个或多个目标信息树;获取目标信息树对应的多个关联信息树;每个关联信息树具有对应的适用对象标识;对制度文件进行拆分,利用每个适用对象标识对应的制度条款生成相应适用对象标识对应的制度子文件;根据制度描述信息生成信息节点,将相应制度子文件关联至信息节点,将信息节点添加至相同适用对象标识对应的关联信息树;当接收到第二终端发送的制度查询请求时,基于关联信息树响应制度查询请求。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:对制度信息进行分词得到对应的原始词语集合;原始词语集合包括多个原始词语;对各个原始词语进行同义扩展,生成每个原始词语对应的扩展词语集合;根据各个扩展词语集合形成制度信息对应的扩展制度信息集合;将扩展制度信息集合输入预设的制度管理模型,得到制度信息对应的目标类别;获取多个目标信息树分别对应的类别标注,筛选包含与目标类别对应类别标注的目标信息树,将制度信息添加至筛选得到的目标信息树。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:识别制度文件的文件类型;当制度文件的文件类型为第一类型时,调用预设的拆分接口对制度文件进行拆分;当制度文件的文件类型为第二类型时,获取预设的多个适用对象标识分别对应的拆分表达式,对制度文件进行遍历,将每个拆分表达式与制度文件进行匹配,根据匹配结果对制度文件进行拆分。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:计算制度文件的数据量,检测数据量是否超过阈值;当数据量超过阈值时,获取预设的目标数据量,根据目标数据量确定制度文件的拆分位置;检测拆分位置是否位于相邻分隔符之间;当拆分位置位于一个分隔符处时,在拆分位置将制度文件拆分为多个中间文件;当拆分位置位于相邻分隔符之间时,在相邻分隔符中任意一个分隔符处将制度文件拆分为多个中间文件;按照预设的拆分规则,对多个中间文件进行拆分。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:对拆分得到的多个制度子文件的总数据量进行校验;对拆分得到的多个制度子文件分别对应制度条款的总数量进行校验;获取预设的多个关键字段,在拆分得到的多个制度子文件提取关键字段,对提取到的关键字段与预设的关键字段进行匹配;当多个制度子文件的总数据量以及对应制度条款的总数量分别校验通过,且提取到的关键字段与预设的关键字段匹配成功时,根据制度描述信息生成信息节点,将相应制度子文件关联至信息节点,将信息节点添加至相同适用对象标识对应的关联信息树。
在一个实施例中,关联信息树包括多个信息节点;每个信息节点关联有对应的信息摘要;制度查询请求携带了员工标识和查询条件;处理器执行计算机程序时还实现以下步骤:获取员工标识对应的适用对象标识;根据适用对象标识,在对应的关联信息树中查找是否存在满足查询条件的信息节点;若存在,获取满足查询条件的信息节点关联的信息摘要,将信息摘要返回至第二终端;当接收到第二终端发送的制度阅读请求时,制度阅读请求携带了信息节点标识;获取信息节点标识对应的制度文件,将制度文件返回至第二终端。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:按照预设规则生成制度信息对应的爬虫标签;根据爬虫标签,在数据库空闲时间从预设网站爬取与制度信息相关的时事政治信息;对爬取到的时事政治信息与多个制度条款进行语义解析,判断是否存在制度条款的语义与时事政治信息的语义相悖;若存在与时事政治信息语义相悖的制度条款,生成制度条款对应的复审提示,将复审提示发送至第一终端。检测与时事政治信息语义相悖的制度条款是否存在对应的子条款;若存在,生成子条款对应的联动复审提示,将联动复审提示发送至第一终端。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:监测第一终端发布的制度信息;制度信息包括制度描述信息及关联的制度文件;制度文件包括多个制度条款以及分别对应的适用对象标识;对制度信息进行分类,根据分类结果将制度信息添加至预设的一个或多个目标信息树;获取目标信息树对应的多个关联信息树;每个关联信息树具有对应的适用对象标识;对制度文件进行拆分,利用每个适用对象标识对应的制度条款生成相应适用对象标识对应的制度子文件;根据制度描述信息生成信息节点,将相应制度子文件关联至信息节点,将信息节点添加至相同适用对象标识对应的关联信息树;当接收到第二终端发送的制度查询请求时,基于关联信息树响应制度查询请求。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:对制度信息进行分词得到对应的原始词语集合;原始词语集合包括多个原始词语;对各个原始词语进行同义扩展,生成每个原始词语对应的扩展词语集合;根据各个扩展词语集合形成制度信息对应的扩展制度信息集合;将扩展制度信息集合输入预设的制度管理模型,得到制度信息对应的目标类别;获取多个目标信息树分别对应的类别标注,筛选包含与目标类别对应类别标注的目标信息树,将制度信息添加至筛选得到的目标信息树。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:识别制度文件的文件类型;当制度文件的文件类型为第一类型时,调用预设的拆分接口对制度文件进行拆分;当制度文件的文件类型为第二类型时,获取预设的多个适用对象标识分别对应的拆分表达式,对制度文件进行遍历,将每个拆分表达式与制度文件进行匹配,根据匹配结果对制度文件进行拆分。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:计算制度文件的数据量,检测数据量是否超过阈值;当数据量超过阈值时,获取预设的目标数据量,根据目标数据量确定制度文件的拆分位置;检测拆分位置是否位于相邻分隔符之间;当拆分位置位于一个分隔符处时,在拆分位置将制度文件拆分为多个中间文件;当拆分位置位于相邻分隔符之间时,在相邻分隔符中任意一个分隔符处将制度文件拆分为多个中间文件;按照预设的拆分规则,对多个中间文件进行拆分。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:对拆分得到的多个制度子文件的总数据量进行校验;对拆分得到的多个制度子文件分别对应制度条款的总数量进行校验;获取预设的多个关键字段,在拆分得到的多个制度子文件提取关键字段,对提取到的关键字段与预设的关键字段进行匹配;当多个制度子文件的总数据量以及对应制度条款的总数量分别校验通过,且提取到的关键字段与预设的关键字段匹配成功时,根据制度描述信息生成信息节点,将相应制度子文件关联至信息节点,将信息节点添加至相同适用对象标识对应的关联信息树。
在一个实施例中,关联信息树包括多个信息节点;每个信息节点关联有对应的信息摘要;制度查询请求携带了员工标识和查询条件;计算机程序被处理器执行时还实现以下步骤:获取员工标识对应的适用对象标识;根据适用对象标识,在对应的关联信息树中查找是否存在满足查询条件的信息节点;若存在,获取满足查询条件的信息节点关联的信息摘要,将信息摘要返回至第二终端;当接收到第二终端发送的制度阅读请求时,制度阅读请求携带了信息节点标识;获取信息节点标识对应的制度文件,将制度文件返回至第二终端。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:按照预设规则生成制度信息对应的爬虫标签;根据爬虫标签,在数据库空闲时间从预设网站爬取与制度信息相关的时事政治信息;对爬取到的时事政治信息与多个制度条款进行语义解析,判断是否存在制度条款的语义与时事政治信息的语义相悖;若存在与时事政治信息语义相悖的制度条款,生成制度条款对应的复审提示,将复审提示发送至第一终端。检测与时事政治信息语义相悖的制度条款是否存在对应的子条款;若存在,生成子条款对应的联动复审提示,将联动复审提示发送至第一终端。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (9)

1.一种制度信息查询方法,所述方法包括:
监测第一终端发布的制度信息;所述制度信息包括制度描述信息及关联的制度文件;所述制度文件包括多个制度条款以及分别对应的适用对象标识;
对所述制度信息进行分类,根据分类结果将所述制度信息添加至预设的一个或多个目标信息树;
获取所述目标信息树对应的多个关联信息树;每个所述关联信息树具有对应的适用对象标识;
对所述制度文件进行拆分,利用每个所述适用对象标识对应的制度条款生成相应适用对象标识对应的制度子文件;
根据所述制度描述信息生成信息节点,将相应所述制度子文件关联至所述信息节点,将所述信息节点添加至相同适用对象标识对应的关联信息树;
当接收到第二终端发送的制度查询请求时,基于所述关联信息树响应所述制度查询请求;
其中,所述对所述制度信息进行分类,将所述制度信息添加至预设的一个或多个目标信息树,包括:
对所述制度信息进行分词得到对应的原始词语集合;所述原始词语集合包括多个原始词语;
对各个原始词语进行同义扩展,生成每个原始词语对应的扩展词语集合;
根据各个扩展词语集合形成所述制度信息对应的扩展制度信息集合;
将所述扩展制度信息集合输入预设的制度管理模型,得到所述制度信息对应的目标类别;
获取多个所述目标信息树分别对应的类别标注,筛选包含与所述目标类别对应类别标注的目标信息树,将所述制度信息添加至筛选得到的目标信息树。
2.根据权利要求1所述的方法,其特征在于,所述对所述制度文件进行拆分包括:
识别所述制度文件的文件类型;
当所述制度文件的文件类型为第一类型时,调用预设的拆分接口对所述制度文件进行拆分;
当所述制度文件的文件类型为第二类型时,获取预设的多个适用对象标识分别对应的拆分表达式,对所述制度文件进行遍历,将每个拆分表达式与所述制度文件进行匹配,根据匹配结果对所述制度文件进行拆分。
3.根据权利要求1所述的方法,其特征在于,所述对所述制度文件进行拆分包括:
计算所述制度文件的数据量,检测所述数据量是否超过阈值;
当所述数据量超过阈值时,获取预设的目标数据量,根据所述目标数据量确定所述制度文件的拆分位置;
检测所述拆分位置是否位于相邻分隔符之间;
当所述拆分位置位于一个分隔符处时,在所述拆分位置将所述制度文件拆分为多个中间文件;
当所述拆分位置位于相邻分隔符之间时,在所述相邻分隔符中任意一个分隔符处将所述制度文件拆分为多个中间文件;
按照预设的拆分规则,对多个所述中间文件进行拆分。
4.根据权利要求1所述的方法,其特征在于,根据所述制度描述信息生成信息节点,将相应所述制度子文件关联至所述信息节点,将所述信息节点添加至相同适用对象标识对应的关联信息树包括:
对拆分得到的多个制度子文件的总数据量进行校验;
对拆分得到的多个制度子文件分别对应制度条款的总数量进行校验;
获取预设的多个关键字段,在拆分得到的多个制度子文件提取关键字段,对提取到的关键字段与预设的关键字段进行匹配;
当多个制度子文件的总数据量以及对应制度条款的总数量分别校验通过,且提取到的关键字段与预设的关键字段匹配成功时,根据所述制度描述信息生成信息节点,将相应所述制度子文件关联至所述信息节点,将所述信息节点添加至相同适用对象标识对应的关联信息树。
5.根据权利要求1所述的方法,其特征在于,所述关联信息树包括多个信息节点;每个信息节点关联有对应的信息摘要;所述制度查询请求携带了员工标识和查询条件;基于所述关联信息树响应所述制度查询请求包括:
获取所述员工标识对应的适用对象标识;
根据所述适用对象标识,在对应的关联信息树中查找是否存在满足所述查询条件的信息节点;
若存在,获取满足所述查询条件的信息节点关联的信息摘要,将所述信息摘要返回至所述第二终端;
当接收到所述第二终端发送的制度阅读请求时,所述制度阅读请求携带了信息节点标识;获取所述信息节点标识对应的制度文件,将所述制度文件返回至所述第二终端。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
按照预设规则生成所述制度信息对应的爬虫标签;
根据所述爬虫标签,在数据库空闲时间从预设网站爬取与所述制度信息相关的时事政治信息;
对爬取到的所述时事政治信息与多个所述制度条款进行语义解析,判断是否存在所述制度条款的语义与所述时事政治信息的语义相悖;
若存在与所述时事政治信息语义相悖的制度条款,生成所述制度条款对应的复审提示,将所述复审提示发送至所述第一终端;
检测与所述时事政治信息语义相悖的制度条款是否存在对应的子条款;
若存在,生成所述子条款对应的联动复审提示,将所述联动复审提示发送至所述第一终端。
7.一种制度信息查询装置,其特征在于,所述装置包括:
信息分类模块,用于监测第一终端发布的制度信息;所述制度信息包括制度描述信息及关联的制度文件;所述制度文件包括多个制度条款以及分别对应的适用对象标识;对所述制度信息进行分类,根据分类结果将所述制度信息添加至预设的一个或多个目标信息树;
信息拆分模块,用于获取所述目标信息树对应的多个关联信息树;每个所述关联信息树具有对应的适用对象标识;对所述制度文件进行拆分,利用每个适用对象标识对应的制度条款生成相应适用对象标识对应的制度子文件;
信息归档模块,用于根据所述制度描述信息生成信息节点,将相应所述制度子文件关联至所述信息节点,将所述信息节点添加至相同适用对象标识对应的关联信息树;
信息查询模块,用于当接收到第二终端发送的制度查询请求时,基于所述关联信息树响应所述制度查询请求;
所述信息分类模块在对所述制度信息进行分类,将所述制度信息添加至预设的一个或多个目标信息树时,具体用于:对所述制度信息进行分词得到对应的原始词语集合;所述原始词语集合包括多个原始词语;对各个原始词语进行同义扩展,生成每个原始词语对应的扩展词语集合;根据各个扩展词语集合形成所述制度信息对应的扩展制度信息集合;将所述扩展制度信息集合输入预设的制度管理模型,得到所述制度信息对应的目标类别;获取多个所述目标信息树分别对应的类别标注,筛选包含与所述目标类别对应类别标注的目标信息树,将所述制度信息添加至筛选得到的目标信息树。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN201810312749.8A 2018-04-09 2018-04-09 制度信息查询方法、装置、计算机设备和存储介质 Active CN108563734B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810312749.8A CN108563734B (zh) 2018-04-09 2018-04-09 制度信息查询方法、装置、计算机设备和存储介质
PCT/CN2018/095449 WO2019196226A1 (zh) 2018-04-09 2018-07-12 制度信息查询方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810312749.8A CN108563734B (zh) 2018-04-09 2018-04-09 制度信息查询方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN108563734A CN108563734A (zh) 2018-09-21
CN108563734B true CN108563734B (zh) 2023-04-18

Family

ID=63534391

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810312749.8A Active CN108563734B (zh) 2018-04-09 2018-04-09 制度信息查询方法、装置、计算机设备和存储介质

Country Status (2)

Country Link
CN (1) CN108563734B (zh)
WO (1) WO2019196226A1 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110070114B (zh) * 2019-04-03 2020-11-10 奇安信科技集团股份有限公司 多规范融合的处理方法、装置、计算机设备和存储介质
CN110222286A (zh) * 2019-05-21 2019-09-10 平安普惠企业管理有限公司 信息获取方法、装置、终端和计算机可读存储介质
CN111428967A (zh) * 2020-03-02 2020-07-17 四川宝石花鑫盛油气运营服务有限公司 基于岗位为基本单元的文件管理方法及装置
CN112488642B (zh) * 2020-11-20 2024-03-12 中国电建集团华东勘测设计研究院有限公司 一种基于结构化标签并以对象为核心的云端文件管理方法
CN112199475A (zh) * 2020-12-07 2021-01-08 远光软件股份有限公司 一种基于电价条款数据的内容解析方法
CN112597349A (zh) * 2020-12-25 2021-04-02 中国农业银行股份有限公司 一种规章制度处理方法、制度信息获取及装置
CN112905246B (zh) * 2021-01-25 2022-06-14 厦门立林科技有限公司 设备识别方法、系统、移动终端及存储介质
CN113643506B (zh) * 2021-05-21 2022-09-23 北京深度制耀科技有限公司 一种遗传资源处理的预警方法和装置
CN116775958B (zh) * 2023-08-21 2023-11-21 宇文道静 信息查询数据处理方法及装置
CN117708202A (zh) * 2024-01-09 2024-03-15 南京雄风清角劲大数据有限公司 云数据库服务系统
CN117573620B (zh) * 2024-01-10 2024-04-02 中电数据产业有限公司 一种大文件拆分并发读取方法和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101083608A (zh) * 2006-05-30 2007-12-05 华为技术有限公司 设备管理树节点信息的查询方法及其终端设备
CN101488213A (zh) * 2008-01-17 2009-07-22 新奥(廊坊)燃气技术研究发展有限公司 城镇燃气管道风险评价和安全管理决策支持系统
CN105096023A (zh) * 2014-05-22 2015-11-25 肖彦君 工作标准相关数据的推送系统和方法
CN107247722A (zh) * 2017-04-25 2017-10-13 北京金山安全软件有限公司 一种文件扫描方法、装置及智能终端

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19706419A1 (de) * 1997-02-19 1998-08-27 Ibm Verfahren und Vorrichtung zur Steuerung von Prozessen unter Verwendung einer Technologie zur maschinellen Sprachverarbeitung
CN102521223A (zh) * 2011-09-02 2012-06-27 天津市道本科技有限公司 三词合一的企业知识关联存储、搜索与呈现方法
CN106776851A (zh) * 2016-11-28 2017-05-31 国网上海市电力公司 文档结构化方法和设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101083608A (zh) * 2006-05-30 2007-12-05 华为技术有限公司 设备管理树节点信息的查询方法及其终端设备
CN101488213A (zh) * 2008-01-17 2009-07-22 新奥(廊坊)燃气技术研究发展有限公司 城镇燃气管道风险评价和安全管理决策支持系统
CN105096023A (zh) * 2014-05-22 2015-11-25 肖彦君 工作标准相关数据的推送系统和方法
CN107247722A (zh) * 2017-04-25 2017-10-13 北京金山安全软件有限公司 一种文件扫描方法、装置及智能终端

Also Published As

Publication number Publication date
WO2019196226A1 (zh) 2019-10-17
CN108563734A (zh) 2018-09-21

Similar Documents

Publication Publication Date Title
CN108563734B (zh) 制度信息查询方法、装置、计算机设备和存储介质
CN108509424B (zh) 制度信息处理方法、装置、计算机设备和存储介质
US11663254B2 (en) System and engine for seeded clustering of news events
US7912816B2 (en) Adaptive archive data management
CN108460582B (zh) 制度信息处理方法、装置、计算机设备和存储介质
CN109376237B (zh) 客户稳定性的预测方法、装置、计算机设备和存储介质
CN102741803B (zh) 用于促进数据发现的系统和方法
US20120246154A1 (en) Aggregating search results based on associating data instances with knowledge base entities
CN111310427A (zh) 业务数据配置处理方法、装置、计算机设备和存储介质
US20120290927A1 (en) Data Classifier
WO2019061991A1 (zh) 多元通用模型平台建模方法、电子设备及计算机可读存储介质
CN111934899B (zh) 物联网用户信息的配置方法、装置、计算机设备
US20190095439A1 (en) Content pattern based automatic document classification
US11023551B2 (en) Document processing based on proxy logs
US9552415B2 (en) Category classification processing device and method
CN110659297A (zh) 数据处理方法、装置、计算机设备和存储介质
CN113221535B (zh) 情报处理方法、装置、计算机设备和存储介质
CA2956627A1 (en) System and engine for seeded clustering of news events
CN112883030A (zh) 数据收集方法、装置、计算机设备和存储介质
CN111324687A (zh) 知识库中数据处理方法、装置、计算机设备和存储介质
CA3051919C (en) Machine learning (ml) based expansion of a data set
CN109656947B (zh) 数据查询方法、装置、计算机设备和存储介质
CN111460268B (zh) 数据库查询请求的确定方法、装置和计算机设备
CN108021696B (zh) 一种数据关联分析方法及系统
JP2018013819A (ja) ビジネスマッチング支援システムおよびビジネスマッチング支援方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant