CN116737870B - 上报信息存储方法、装置、电子设备和计算机可读介质 - Google Patents

上报信息存储方法、装置、电子设备和计算机可读介质 Download PDF

Info

Publication number
CN116737870B
CN116737870B CN202310995915.XA CN202310995915A CN116737870B CN 116737870 B CN116737870 B CN 116737870B CN 202310995915 A CN202310995915 A CN 202310995915A CN 116737870 B CN116737870 B CN 116737870B
Authority
CN
China
Prior art keywords
information
organization
leaf
determining
tissue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310995915.XA
Other languages
English (en)
Other versions
CN116737870A (zh
Inventor
王欣
冯东
郭振华
孙艳青
王战杰
张庆贺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Information and Telecommunication Co Ltd
Beijing Guodiantong Network Technology Co Ltd
Original Assignee
State Grid Information and Telecommunication Co Ltd
Beijing Guodiantong Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Information and Telecommunication Co Ltd, Beijing Guodiantong Network Technology Co Ltd filed Critical State Grid Information and Telecommunication Co Ltd
Priority to CN202310995915.XA priority Critical patent/CN116737870B/zh
Publication of CN116737870A publication Critical patent/CN116737870A/zh
Application granted granted Critical
Publication of CN116737870B publication Critical patent/CN116737870B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F16/322Trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开的实施例公开了上报信息存储方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:对任务信息进行实体关系抽取,得到实体信息集和关系特征词集,以及构建目标组织路径树;确定各个叶子组织信息的状态信息;确定各个叶子组织信息的叶子人员信息;确定发生变更的至少一个组织信息;确定至少一个变更组织信息对应的至少一个变更组织路径;根据至少一个变更组织路径、至少一个变更任务信息、目标组织路径树和叶子人员信息集,生成上报信息集;生成变更后组织路径树,将上报信息集和变更后组织路径树存储至图数据库中。该实施方式对发生变更的组织路径进行更新和存储,可以确保上报信息的准确性,减少存储和内存资源的浪费。

Description

上报信息存储方法、装置、电子设备和计算机可读介质
技术领域
本公开的实施例涉及计算机技术领域,具体涉及上报信息存储方法、装置、电子设备和计算机可读介质。
背景技术
组织架构是组织进行管理的基础,可以通过记录节点隶属关系和变化时间,支持组织架构的构建和回溯。对于上报信息的存储,通常采用的方式为:对接收的任务信息进行实体识别和关系提取,构建组织路径树,在组织路径树发生变更前,根节点组织收回下发的任务信息,组织路径树整体完成变更之后,各个叶子节点接收下发的任务信息,并将上报信息全量加密后进行发送和存储。
然而,发明人发现,当采用上述方式来存储上报信息,经常会存在如下技术问题:
第一,由于对组织路径树进行整体变更,造成未变化的部分也进行了变更,导致内存资源的浪费,由于对未变化的部分进行重复存储,存在冗余数据,导致存储资源的浪费和查询效率较低。
第二,由于将实体识别和关系提取作为分割的两个单独的步骤,无法在关系提取步骤对实体识别步骤中出现的错误进行识别和纠正,易造成错误积累、存在冗余数据和提取准确率较低,导致存储资源的浪费。
第三,由于对上报信息进行全量加密,没有体现不同类型数据的重要程度,容易造成重要数据泄露,导致数据安全性较低和增大加密内存开销。
该背景技术部分中所公开的以上信息仅用于增强对本发明构思的背景的理解,并因此,其可包含并不形成本国的本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
本公开的一些实施例提出了上报信息存储方法、装置、电子设备和计算机可读介质,来解决以上背景技术部分提到的技术问题中的一项或多项。
第一方面,本公开的一些实施例提供了一种上报信息存储方法,包括:响应于接收到任务信息,对上述任务信息进行实体关系抽取,得到实体信息集和关系特征词集,以及根据上述实体信息集和上述关系特征词集,构建目标组织路径树;确定上述目标组织路径树对应的各个叶子组织信息的状态信息,得到状态信息集;根据上述状态信息集,确定上述各个叶子组织信息对应的叶子人员信息,得到叶子人员信息集;响应于确定上述目标组织路径树发生变更,确定发生变更的至少一个组织信息,作为变更组织信息集;响应于确定上述变更组织信息集对应的变更组织集接收到变更任务信息,确定接收到变更任务信息的至少一个变更组织信息对应的至少一个变更组织路径,其中,上述变更任务信息是变更组织信息的父级组织信息对应的父级组织发送的任务信息;根据上述至少一个变更组织路径、与上述至少一个变更组织路径对应的至少一个变更任务信息、上述目标组织路径树和上述叶子人员信息集,生成上报信息集;根据上述目标组织路径树和上述至少一个变更组织路径,生成变更后组织路径树,以及将上述上报信息集和上述变更后组织路径树存储至图数据库中。
第二方面,本公开的一些实施例提供了一种上报信息存储装置,包括:实体关系抽取单元,被配置成响应于接收到任务信息,对上述任务信息进行实体关系抽取,得到实体信息集和关系特征词集,以及根据上述实体信息集和上述关系特征词集,构建目标组织路径树;第一确定单元,被配置成确定上述目标组织路径树对应的各个叶子组织信息的状态信息,得到状态信息集;第二确定单元,被配置成根据上述状态信息集,确定上述各个叶子组织信息对应的叶子人员信息,得到叶子人员信息集;第三确定单元,被配置成响应于确定上述目标组织路径树发生变更,确定发生变更的至少一个组织信息,作为变更组织信息集;第四确定单元,被配置成响应于确定上述变更组织信息集对应的变更组织集接收到变更任务信息,确定接收到变更任务信息的至少一个变更组织信息对应的至少一个变更组织路径,其中,上述变更任务信息是变更组织信息的父级组织信息对应的父级组织发送的任务信息;生成单元,被配置成根据上述至少一个变更组织路径、与上述至少一个变更组织路径对应的至少一个变更任务信息、上述目标组织路径树和上述叶子人员信息集,生成上报信息集;存储单元,被配置成根据上述目标组织路径树和上述至少一个变更组织路径,生成变更后组织路径树,以及将上述上报信息集和上述变更后组织路径树存储至图数据库中。
第三方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。
第四方面,本公开的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。
本公开的上述各个实施例中具有如下有益效果:本公开的一些实施例的上报信息存储方法对发生变更的组织路径进行更新和存储,可以确保上报信息的准确性,减少存储和内存资源的浪费。具体来说,造成相关的存储资源的浪费和查询效率较低的原因在于:由于对组织路径树进行整体变更,造成未变化的部分也进行了变更,导致内存资源的浪费,由于对未变化的部分进行重复存储,存在冗余数据,导致存储资源的浪费和查询效率较低。基于此,本公开的一些实施例的上报信息存储方法可以首先,响应于接收到任务信息,对上述任务信息进行实体关系抽取,得到实体信息集和关系特征词集,以及根据上述实体信息集和上述关系特征词集,构建目标组织路径树。在这里,可以提高构建目标组织路径树的准确率,也便于后续以目标组织路径树为基础,仅仅对变更部分进行更新,从而可以减少内存资源的浪费。其次,确定上述目标组织路径树对应的各个叶子组织信息的状态信息,得到状态信息集。在这里,得到的状态信息集便于后续确定叶子人员信息集。再次,根据上述状态信息集,确定上述各个叶子组织信息对应的叶子人员信息,得到叶子人员信息集。在这里,得到的叶子人员信息集是变更之前确定的叶子人员信息集,可以避免组织路径树变更后对未变更部分进行重复运算,便于后续仅更新变更部分,从而,可以减少冗余数据的更新、内存资源和存储资源的浪费。接着,响应于确定上述目标组织路径树发生变更,确定发生变更的至少一个组织信息,作为变更组织信息集。在这里,可以对目标组织路径树进行部分更新,减少冗余数据的更新和内存资源的浪费。随后,响应于确定上述变更组织信息集对应的变更组织集接收到变更任务信息,确定接收到变更任务信息的至少一个变更组织信息对应的至少一个变更组织路径,其中,上述变更任务信息是变更组织信息的父级组织信息对应的父级组织发送的任务信息。在这里,仅确定发生变更后的变更人员信息,可以减少确定变更的人员信息量,提高人员信息确定的准确性。然后,根据上述至少一个变更组织路径、与上述至少一个变更组织路径对应的至少一个变更任务信息、上述目标组织路径树和上述叶子人员信息集,生成上报信息集。在这里,通过确定变更前和变更后两部分的人员信息,可以避免因组织路径树变更前后人员信息数据不一致的问题,以及避免变更之前叶子人员信息重复统计。最后,根据上述目标组织路径树和上述至少一个变更组织路径,生成变更后组织路径树,以及将上述上报信息集和上述变更后组织路径树存储至图数据库中。在这里,将变更后组织路径树存储至图数据库中,相较于将未变化部分的重复存储,可以减少冗余数据,进而减少存储资源的浪费和提高查询效率。由此可得,该上报信息存储方法对发生变更的组织路径进行更新和存储,可以确保上报信息的准确性,减少存储和内存资源的浪费。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,元件和元素不一定按照比例绘制。
图1是根据本公开的上报信息存储方法的一些实施例的流程图;
图2是根据本公开的上报信息存储装置的一些实施例的结构示意图;
图3是适于用来实现本公开的一些实施例的电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
本公开中所涉及的用户个人信息(例如用户历史行为)的收集、存储、使用等操作,在执行相应操作之前,相关组织或个人尽到包括开展个人信息安全影响评估、向个人信息主体履行告知义务、事先征得个人信息主体的授权同意等义务,以及符合相关法律法规的规定。
下面将参考附图并结合实施例来详细说明本公开。
图1示出了根据本公开的上报信息存储方法的一些实施例的流程100。该上报信息存储方法,包括以下步骤:
步骤101,响应于接收到任务信息,对任务信息进行实体关系抽取,得到实体信息集和关系特征词集,以及根据实体信息集和关系特征词集,构建目标组织路径树。
在一些实施例中,上述上报信息存储方法的执行主体(例如,电子设备)可以响应于接收到任务信息,对上述任务信息进行实体关系抽取,得到实体信息集和关系特征词集,以及根据上述实体信息集和上述关系特征词集,构建目标组织路径树。其中,上述任务信息可以是将非正式人员发展成正式人员的发展任务信息。上述任务信息可以包括:人员信息、人员信息所属组织信息和状态信息。上述人员信息可以表征人员身份的信息。上述人员信息可以包括以下至少一项:人员姓名、人员身份证号、人员家庭成员信息。上述状态信息可以表征人员是否具备发展成为正式人员的信息。上述实体信息集中的实体信息可以是实体的信息。上述实体可以是人员姓名或者组织名称。上述关系特征词集中的关系特征词可以表征各个实体之间的关系的特征词。例如,上述关系特征词可以是隶属关系特征词、上下级关系特征词和同级关系特征词。上述隶属关系特征词可以是某一人员属于某一节点组织的关系特征词。上述上下级特征词可以是某一节点组织是另一节点组织的上下级或者同级的关系特征词。上述目标组织路径树可以是在接收到人员发展任务信息时、依据节点之间的上下级关系和同级关系构建的多叉树。上述目标组织路径树中的每个节点代表一个组织。例如,上述组织可以是市级工程构建组织。上述目标组织路径树中的每个节点可以包括多个属性值。上述多个属性中的属性可以表征节点的基础信息。上述多个属性值可以包括:从根节点对应的组织至本节点对应的组织的路径信息、本节点对应的组织包括的人员信息、人员的状态信息。
作为示例,上述执行主体可以首先,对上述任务信息进行实体识别,得到实体信息集。其次,对上述任务信息进行关系抽取,得到关系特征词集。再次,对上述实体信息集和上述关系特征词集进行匹配处理,得到三元组集。其中,上述三元组集中的三元组可以是用于描述实体信息之间关系的组。例如,上述单元组可以是(叶子组织信息,上级关系,父级组织信息)。然后,将上述实体信息集和上述关系特征词集存储至图数据库中,得到目标组织路径树。其中,上述图数据库可以是Neo4j图形数据库。在Neo4j中组织信息对应数据库中的节点。组织信息集之间的关系通过Neo4j图数据库中的边来表示。当两个组织之间有多重关系时可以用多条边表示。
在一些实施例的一些可选的实现方式中,上述响应于接收到任务信息,对上述任务信息进行实体关系抽取,得到实体信息集和关系特征词集,以及根据上述实体信息集和上述关系特征词集,构建目标组织路径树,可以包括以下步骤:
第一步,对上述任务信息进行预处理,得到预处理后任务信息。其中,上述预处理可以包括以下至少一项:去停用词和文本填充。
第二步,对上述预处理后任务信息进行字向量提取,得到字向量序列。其中,上述字向量序列中的字向量可以是字的向量化表示。
作为示例,上述执行主体可以首先,采用动态字节编码模型中的WordPiece算法,对上述预处理后任务信息进行中文语句切分处理,得到字序列。上述动态字节编码模型可以是编码各个分句间的逻辑关系的模型。然后,通过查询字向量表,将上述字序列中的每个字转换为一维向量,得到字向量序列。其中,上述字向量序列中的字向量由字向量、分段向量和位置向量组成。上述分段向量可以是在模型训练过程中自动学习,用于划分子句,并与字向量的语义信息相融合的向量。上述位置向量用于表征文本不同位置的词语所携带的语义信息存在差异。
第三步,将上述字向量序列进行头实体识别处理,得到头实体向量序列。其中,上述头实体向量序列中的头实体向量可以是三元组中位于初始位置的实体对应的向量。上述三元组可以表征两个实体之间关系的实体关系组。上述头实体向量可以表征头实体的实体类型和位置信息。上述实体类型可以包括以下至少一项:人名、地名、组织名、机构名、时间、日期、货币和百分比。需要说明的是,如果一个句子中出现多个头实体时,采用就近原则解决出现的交叉问题,即将两个距离最近的头实体初始位置和结尾位置标记的范围作为一个头实体。上述头实体识别处理可以是将字向量序列输入至头实体解码器进行识别处理。上述头实体解码器可以是采用指针标注的方法,将头实体的起始标签和终止子标签以矩阵的形式表示,不同行代表在不同实体类型上可能存在实体的位置的解码器。在头实体的起始标签中,“1”代表头实体在句子中的起始位置,“1”在终止标签中代表头实体在句子中的结束位置。
作为示例,上述执行主体可以利用二分类器,对上述字向量序列中的每个字向量的起始位置或者结尾位置进行二分类,以生成分类概率数值,得到分类概率数值序列。然后,将分类概率数值序列中为分类概率数值大于等于预设概率阈值的分类概率数值对应的字向量,确定为头实体向量集。
第四步,对上述头实体向量序列输入至自注意力模型,得到权重头实体向量序列。其中,上述权重头实体向量序列中的权重头实体向量可以是具有不同权重的头实体向量。
第五步,将上述权重头实体向量序列与对应的字向量的和,确定为融合向量,得到融合向量序列。
第六步,将上述融合向量序列进行尾实体识别处理,得到初始三元组集。其中,上述初始三元组集中的初始三元组可以是表征头实体和尾实体关系的实体关系组。例如,上述初始三元组可以是(头实体,关系特征词,尾实体)。上述尾实体可以是位于三元组的终止位置的实体。上述尾实体识别处理可以是将融合向量序列输入至尾实体解码器中进行的识别处理。上述尾实体解码器可以是用于解析给定头实体后尾实体存在的范围和实体类型的解码器。上述尾实体解码器可以是包括两层双向LSTM(Long Short-Term Memory,长短期记忆)模型和全连接层的解码器。
第七步,通过预设数据似然目标函数,对上述初始三元组集进行筛选处理,得到目标三元组集。其中,上述预设数据似然目标函数可以是用于表征头实体和特征关系词、与尾实体匹配程度的函数。上述目标三元组集中的目标三元组可以是头实体和尾实体匹配度数值大于等于预设匹配度数值的初始三元组。例如,上述预设匹配度数值可以是0.8。
第八步,将上述目标三元组集存储至图数据库中,得到目标组织架构。其中,上述图数据库可以是Neo4j数据库。
作为示例,上述执行主体可以首先,将三元组集中的实体集,确定为图数据库中的节点集。其次,将三元组集中的关系特征词集,确定为图数据库中节点集之间的关系。然后,通过上述节点集和上述节点集之间的关系,构建目标组织路径树。
上述第一步至第八步及其相关内容作为本公开的实施例的一个发明点,解决了背景技术提及的技术问题二“由于将实体识别和关系提取作为分割的两个单独的步骤,无法在关系提取步骤对实体识别步骤中出现的错误进行识别和纠正,易造成错误积累、存在冗余数据和提取准确率较低,导致存储资源的浪费”。导致存储资源的浪费的因素往往如下:由于将实体识别和关系提取作为分割的两个单独的步骤,无法在关系提取步骤对实体识别步骤中出现的错误进行识别和纠正,易造成错误积累、存在冗余数据和提取准确率较低,导致存储资源的浪费。如果解决了上述因素,就能达到减少存储资源的浪费的效果。为了达到这一效果,本公开首先,对上述任务信息进行预处理,得到预处理后任务信息。对上述预处理后任务信息进行字向量提取,得到字向量序列。在这里,字向量提取可以将任务信息映射到低纬度的向量空间,可以提高实体识别的准确性。其次,将上述字向量序列进行头实体识别处理,得到头实体向量序列。在这里,头实体识别处理可以解决一个实体中嵌套多个实体的问题,可以提高头实体识别的准确性。再次,对上述头实体向量序列输入至自注意力模型,得到权重头实体向量序列。将上述权重头实体向量序列与对应的字向量的和,确定为融合向量,得到融合向量序列。在这里,对头实体赋予不同权重和字向量融合可以更加准确地表述头实体的语义信息,从而可以提高特征关系词抽取的准确性。随后,将上述融合向量序列进行尾实体识别处理,得到初始三元组集。在这里,尾实体识别处理可以将头实体和尾实体的关系作为两者的关系映射函数,可以减少头实体和尾实体关系传递的错误率,避免实体嵌套问题,从而可以提高三元组的准确性。然后,通过预设数据似然目标函数,对上述初始三元组集进行筛选处理,得到目标三元组集。在这里,筛选处理可以进一步提高三元组的准确率。最后,将上述目标三元组集存储至图数据库中,得到目标组织架构。在这里,由于图数据库比关系型数据库处理关系数据更具优势,故将目标三元组集存储至图数据库中可以更好的展示实体间的关系,以及提高实体查询效率。由于提取的三元组比较准确,可以减少冗余数据,从而减少存储资源的浪费。因此,该组织路径树构建方法可以在识别出头实体的同时识别出对应关系和与之关联的尾实体,将关系作为头实体和尾实体的映射函数,可以减少在生成三元组过程中的累计误差和信息冗余,从而减少存储资源的浪费。
步骤102,确定目标组织路径树对应的各个叶子组织信息的状态信息,得到状态信息集。
在一些实施例中,上述执行主体可以确定上述目标组织路径树对应的各个叶子组织信息的状态信息,得到状态信息集。其中,上述叶子组织信息可以是位于上述目标组织路径树中的叶子节点位置的组织信息。上述状态信息可以是在发展成正式人员之前、人员所处的发展流程中的某一个阶段的信息。上述发展流程可以包括:非正式人员、待考核人员和正式人员。上述状态信息可以包括:未提交状态信息、提交状态信息、上报状态信息、驳回状态信息、退回状态信息、转入状态信息和无效状态信息。上述未提交状态信息可以是将人员信息集添加至考核名单,但是人员所在组织未将人员信息集提交至父级组织的状态信息。上述提交状态信息可以是将人员信息集添加至考核名单,并且人员所在组织将人员信息集提交至父级组织的状态信息。上述上报状态信息可以是父级组织将人员信息提交至对应的父级组织的状态信息。上述驳回状态信息可以是父级组织对应的父级组织驳回了父级组织提交的人员信息的状态信息。上述退回状态信息可以是从待考核人员阶段回退至非正式人员的状态信息。上述转入状态信息可以是从待考核人员阶段发展成正式人员的状态信息。上述无效状态可以是废除待考核人员成为正式人员的状态。
步骤103,根据状态信息集,确定各个叶子组织信息对应的叶子人员信息,得到叶子人员信息集。
在一些实施例中,上述执行主体可以根据上述状态信息集,确定上述各个叶子组织信息对应的叶子人员信息,得到叶子人员信息集。其中,上述叶子人员信息集中的叶子人员信息可以是变更之前的叶子组织中可以发展成为正式人员的人员信息。
作为示例,上述执行主体可以通过状态信息集,从各个叶子组织信息中选取出可以发展成为正式人员的至少一个人员的至少一个人员信息,作为叶子人员信息集。
在一些实施例的一些可选的实现方式中,上述根据上述状态信息集,确定上述各个叶子组织信息对应的叶子人员信息,得到叶子人员信息集,可以包括以下步骤:
第一步,从上述状态信息集中筛选出满足预设状态信息的状态信息,作为目标状态信息,得到目标状态信息集。其中,上述预设状态信息是叶子人员信息被父级组织信息对应的父级组织确认的状态信息。
第二步,对上述目标状态信息集进行去重处理,得到去重后状态信息集。其中,上述去重处理可以是通过人员的身份证号进行的去重处理。
第三步,将上述去重后状态信息集,确定为叶子人员信息集。
步骤104,响应于确定目标组织路径树发生变更,确定发生变更的至少一个组织信息,作为变更组织信息集。
在一些实施例中,上述执行主体可以响应于确定上述目标组织路径树发生变更,确定发生变更的至少一个组织信息,作为变更组织信息集。其中,上述变更组织信息集中的变更组织信息可以是组织关系发生变更的组织的信息。例如,上述变更可以包括:新增、裁撤、拆分、合并和转移。
作为示例,上述执行主体可以响应于确定变更为增加,将新增的组织信息确定为变更组织信息。响应于确定变更为裁撤,将裁撤后的组织信息确定为变更组织信息。响应于确定变更为拆分,将拆分后得到的新的组织信息,确定为变更组织信息。响应于确定变更为合并,将合并之后得到的组织信息,确定为变更组织信息。响应于确定变更为转移,将发生转移的组织信息,确定为变更组织信息。
步骤105,响应于确定变更组织信息集对应的变更组织集接收到变更任务信息,确定接收到变更任务信息的至少一个变更组织信息对应的至少一个变更组织路径。
在一些实施例中,上述执行主体可以响应于确定上述变更组织信息集对应的变更组织集接收到变更任务信息,确定接收到变更任务信息的至少一个变更组织信息对应的至少一个变更组织路径。其中,上述变更任务信息是变更组织信息的父级组织信息对应的父级组织发送的任务信息。上述变更任务信息可以是变更后、发送至变更组织的、发展成为正式人员的信息。上述变更组织路径可以是从根节点对应的组织信息至变更组织信息的最短路径。
作为示例,上述执行主体可以首先,对上述变更组织信息进行实体识别,得到变更实体信息集,作为变更组织信息集。然后,将上述变更组织信息集添加至上述目标组织路径树,得到添加后组织路径树。最后,利用最短路径规划算法,确定接收到变更任务信息的至少一个变更组织信息对应的至少一个变更组织路径。其中,上述最短路径规划算法可以是以下至少一项:A星算法、Floyd(Floyd-Warshall,弗洛伊德算法)和DFS(Depth FirstSearch,深度优先搜索)算法。
在一些实施例的一些可选的实现方式中,上述响应于确定上述变更组织信息集对应的变更组织集接收到变更任务信息,确定接收到变更任务信息的至少一个变更组织信息对应的至少一个变更组织路径,可以包括以下步骤:
第一步,响应于确定上述变更组织信息集中存在变更组织信息是非叶子组织信息,确定至少一个非叶子组织信息中每个非叶子组织信息对应的至少一个叶子组织信息,作为至少一个目标叶子组织信息,得到至少一个目标叶子组织信息集。其中,上述非叶子组织信息可以是上述目标组织路径树中去除根节点和叶子节点后的任一节点对应的组织信息。
第二步,确定上述至少一个目标叶子组织信息集中每个目标叶子组织信息对应的叶子组织路径,得到至少一个叶子组织路径集,作为至少一个变更组织路径。其中,上述叶子组织路径可以是从根节点对应的组织至叶子节点对应的组织的最短路径。
可选地,上述方法还可以包括以下步骤:
响应于确定上述变更组织信息集中存在变更组织信息是叶子组织信息,确定至少一个叶子组织信息对应的至少一个变更组织路径。
步骤106,根据至少一个变更组织路径、与至少一个变更组织路径对应的至少一个变更任务信息、目标组织路径树和叶子人员信息集,生成上报信息集。
在一些实施例中,上述执行主体可以根据上述至少一个变更组织路径、与上述至少一个变更组织路径对应的至少一个变更任务信息、上述目标组织路径树和上述叶子人员信息集,生成上报信息集。其中,上述上报信息集中的上报信息可以是叶子组织和变更组织将可以发展给正式人员信息的人员信息发送至根节点对应的组织的信息。
作为示例,上述执行主体可以通过目标组织路径树和至少一个变更组织路径,分别将上述至少一个变更任务信息和叶子人员信息集发送至根节点组织信息,得到上报信息集。
在一些实施例的一些可选的实现方式中,上述根据上述至少一个变更组织路径、与上述至少一个变更组织路径对应的至少一个变更任务信息、上述目标组织路径树和上述叶子人员信息集,生成上报信息集,可以包括以下步骤:
第一步,通过上述目标组织路径树,生成上述叶子人员信息集中每个叶子人员信息对应的目标组织路径,得到目标组织路径集。其中,上述目标组织路径集中的目标组织路径可以是从根节点组织至任一叶子节点组织的最短路径。
作为示例,上述执行主体可以利用最短路径规划算法,通过上述目标组织路径树,生成上述叶子人员信息集中每个叶子人员信息对应的目标组织路径,得到目标组织路径集。
第二步,根据上述目标组织路径集和上述叶子人员信息集,生成第一上报信息集。其中,上述第一上报信息集可以是变更前的、目标组织路径树中的叶子组织发送至根节点组织得到的上报信息集。
作为示例,上述执行主体可以首先,对于上述目标组织路径集中的每个目标组织路径,执行以下发送步骤:确定上述目标组织路径对应的叶子人员信息。通过上述目标组织路径,将上述叶子人员信息发送至根节点组织信息对应的根节点组织,得到上报信息。然后,将所得到的上报信息集,确定为第一上报信息集。
第三步,根据上述至少一个变更任务信息和上述至少一个变更组织路径,生成第二上报信息集。其中,上述第二上报信息集可以是变更后得到的变更组织集发送至根节点组织得到的上报信息集。
作为示例,上述执行主体可以通过上述至少一个变更组织路径,将上述至少一个变更任务信息发送至根节点组织,得到第二上报信息集。
第四步,将第一上报信息集和上述第二发上报信息集,确定为上报信息集。
在一些实施例的一些可选的实现方式中,上述根据上述目标组织路径集和上述叶子人员信息集,生成第一上报信息集,可以包括以下步骤:
第一步,对于上述叶子人员信息集中的每个叶子人员信息,执行以下第一确定步骤:
第一子步骤,确定上述叶子人员信息对应的叶子组织信息的父级组织信息。
第二子步骤,基于上述父级组织信息,执行以下第二确定步骤:
子步骤1,确定上述父级组织信息对应的至少一个子级组织信息和上述至少一个子级组织信息对应的人员信息,作为至少一个子级人员信息。
子步骤2,将上述至少一个子级人员信息,确定为上述父级组织信息的上报信息。
子步骤3,响应于确定上述父级组织信息是根节点组织信息,将上述上报信息确定为第一上报信息。其中,上述根节点组织信息可以是上述目标组织路径树中位于根节点的组织信息。
第三子步骤,响应于确定上述父级组织信息不是根节点组织信息,确定上述父级组织信息的父级组织信息,作为目标父级组织信息,以及将上述目标父级组织信息确定为父级组织信息,以再次执行上述第二确定步骤。
在一些实施例的一些可选的实现方式中,上述确定上述父级组织信息对应的至少一个子级组织信息和上述至少一个子级组织信息对应的人员信息,作为至少一个子级人员信息,可以包括以下步骤:
第一步,响应于确定上述至少一个子级组织信息中存在子级组织是非叶子组织信息,确定至少一个非叶子组织信息对应的子级组织信息集,作为第一子级组织信息集。
第二步,确定上述第一子级组织信息集中每个第一子级组织信息对应的叶子组织信息组,作为第一目标叶子组织信息组,得到第一目标叶子组织信息组集。
第三步,确定上述第一目标叶子组织信息组集中每个第一目标叶子组织信息对应的叶子人员信息集,得到多个第一子级人员信息组集。
第四步,响应于确定上述至少一个子级组织信息中存在子级组织信息是叶子组织信息,将至少一个叶子组织信息,确定为第二子级组织信息集。
第五步,将上述第二子级组织信息集对应的叶子人员信息组,确定为第二子级人员信息组集。
第六步,将上述多个第一子级人员信息组集、或者上述第二子级人员信息组集、或者上述多个第一子级人员信息组集与上述第二子级人员信息组集的和,确定为至少一个子级人员信息。
步骤107,根据目标组织路径树和至少一个变更组织路径,生成变更后组织路径树,以及将上报信息集和变更后组织路径树存储至图数据库中。
在一些实施例中,上述执行主体可以根据上述目标组织路径树和上述至少一个变更组织路径,生成变更后组织路径树,以及将上述上报信息集和上述变更后组织路径树存储至图数据库中。其中,上述变更后组织路径树可以是对上述目标组织路径树进行更新后的组织路径树。上述图数据库可以是用于存储变更后组织路径树和上报信息集的数据库。例如,上述图数据库可以是Neo4j数据库。
作为示例,上述执行主体可以首先,将上述至少一个变更组织路径中的每个变更组织路径与上述目标组织路径树进行匹配,得到匹配结果集。其次,对于上述匹配结果集中表征匹配成功的匹配结果,将上述目标组织路径树中对应的目标组织路径子集替换为变更组织路径子集,得到目标变更组织路径树。然后,对于上述匹配结果集中表征匹配失败的匹配结果,将表征匹配失败的、位于上述目标组织路径树中的目标组织路径子集删除。最后,将表征匹配失败的、位于上述至少一个变更组织路径中的变更组织路径子集添加至上述目标变更组织路径树,得到变更后组织路径树。
可选地,上述执行主体在107之后,还可以执行以下步骤:
第一步,对上述上报信息集进行敏感数据识别,得到敏感数据集。其中,上述敏感数据集可以是数据泄露后会给个人或者社会带来危害的数据。例如,上述敏感数据可以是个人身份信息。
作为示例,上述执行主体可以将上述发展人员上报信息集输入至敏感数据识别模型,得到敏感数据集。其中,上述敏感数据识别模型可以包括:基于深度学习的无监督的双向语言模型、全连接层和CRF(Conditional Random Field,条件随机场)层。上述双向语言模型可以是BERT(Bidirectional Encoder Representation from Transformers,基于Transformers的双向编码表示模型)、ELMo(Embedding from Language Model)、GPT(Generative Pre-training Transformer,生成式预训练变压器)。
第二步,确定上述敏感数据集的字节集,得到敏感字节集。其中,上述敏感字节集可以是上述敏感数据集中各个类型数据对应的总字节集。
作为示例,上述执行主体可以首先,对上述敏感数据集进行聚类处理,得到各个数据类型的敏感数据集。然后,利用单向函数,确定上述各个数据类型的敏感数据集对应的字节子集。最后,将所得到的多个字节子集进行拼接,得到敏感字节集。
第三步,通过预设密钥生成函数,生成针对上述敏感字节集的密钥矢量矩阵。其中,上述预设密钥生成函数可以是维尔斯特拉斯方程。上述密钥矢量矩阵可以是将敏感数据转换成密文的参数矩阵。
第四步,对上述密钥矢量矩阵进行加密处理,得到针对敏感字节集的通信数据密钥。其中,上述通信数据密钥可以是用于确保敏感数据在传输过程不被窃取的无序校验码。
作为示例,上述执行主体可以利用椭圆方程曲线的加密算法,对上述密钥矢量矩阵进行加密处理,得到针对敏感字节集的通信数据密钥。
第五步,对上述通信数据密钥进行散列值映射处理,得到针对敏感数据传输的编码散列值。其中,上述编码散列值可以是征加密后敏感数据在传输过程中的编码位置信息的散列值,上述执行主体可以利用logistic map(逻辑斯谛映射),对上述通信数据密钥进行散列值映射处理,得到针对敏感数据传输的编码散列值。
第六步,通过上述编码散列值,生成针对敏感字节集的传输密钥排列图。其中,上述传输密钥排列图可以是用于表征敏感数据传输顺序的二维排列图。
作为示例,上述执行主体可以通过编码散列值,确定编码后每个敏感数据对应的编码位置,得到编码位置集。然后,通过上述编码位置集,生成针对敏感字节集的传输密钥排列图。
第七步,通过上述传输密钥排列图,将上述敏感数据集和剩余数据集发送至目标终端,以便上述目标终端进行存储,其中,上述剩余数据集可以是从上述上报信息集中去除上述敏感数据集得到的数据集。
上述第一步至第七步及其相关内容作为本公开的实施例的一个发明点,解决了背景技术提及的技术问题三“由于对上报信息进行全加密,没有体现不同类型数据的重要程度,容易造成重要数据泄露,导致数据安全性较低和增大加密内存开销”。导致数据安全性较低和增大加密内存开销的因素往往如下:由于对上报信息进行全加密,没有体现不同类型数据的重要程度,容易造成重要数据泄露,导致数据安全性较低和增大加密内存开销。如果解决了上述因素,就能达到提高数据安全性和减少加密内存开销。为了达到这一效果,本公开首先,对上述上报信息集进行敏感数据识别,得到敏感数据集。在这里,敏感数据识别可以从上报信息集中提取需要加密的敏感数据,可以减少需要加密的数据量。其次,确定上述敏感数据集的字节集,得到敏感字节集。在这里,得到的敏感字节集便于后续进行加密处理,保证敏感数据的安全性。再次,通过预设密钥生成函数,生成针对上述敏感字节集的密钥矢量矩阵。接着,对上述密钥矢量矩阵进行加密处理,得到针对敏感字节集的通信数据密钥。在这里,加密处理可以提高数据传输的安全性,保证传输的稳定性。随后,对上述通信数据密钥进行散列值映射处理,得到针对敏感数据传输的编码散列值。然后,根据上述编码散列值,生成针对敏感字节集的传输密钥排列图。在这里,生成的传输密钥排列图可以对传输的加密数据进行传输顺序的更改,可以进一步提高敏感数据加密传输的安全性。最后,通过上述传输密钥排列图,将上述敏感数据集和剩余数据集发送至目标终端,以便上述目标终端进行存储,其中,上述剩余数据集是从上述上报信息集中去除上述敏感数据集得到的数据集。在这里,仅对敏感数据进行加密,可以减少加密数据量,减少加密内存开销,保证敏感数据的安全性。因此,上述数据加密方法通过对敏感数据的提取和加密,可以减少加密传输过程中的数据量,并可以保证数据的安全性,减少了加密资源的开销。
本公开的上述各个实施例中具有如下有益效果:本公开的一些实施例的上报信息存储方法对发生变更的组织路径进行更新和存储,可以确保上报信息的准确性,减少存储和内存资源的浪费。具体来说,造成相关的存储资源的浪费和查询效率较低的原因在于:由于对组织路径树进行整体变更,造成未变化的部分也进行了变更,导致内存资源的浪费,由于对未变化的部分进行重复存储,存在冗余数据,导致存储资源的浪费和查询效率较低。基于此,本公开的一些实施例的上报信息存储方法可以首先,响应于接收到任务信息,对上述任务信息进行实体关系抽取,得到实体信息集和关系特征词集,以及根据上述实体信息集和上述关系特征词集,构建目标组织路径树。在这里,可以提高构建目标组织路径树的准确率,也便于后续以目标组织路径树为基础,仅仅对变更部分进行更新,从而可以减少内存资源的浪费。其次,确定上述目标组织路径树对应的各个叶子组织信息的状态信息,得到状态信息集。在这里,得到的状态信息集便于后续确定叶子人员信息集。再次,根据上述状态信息集,确定上述各个叶子组织信息对应的叶子人员信息,得到叶子人员信息集。在这里,得到的叶子人员信息集是变更之前确定的叶子人员信息集,可以避免组织路径树变更后对未变更部分进行重复运算,便于后续仅更新变更部分,从而,可以减少冗余数据的更新、内存资源和存储资源的浪费。接着,响应于确定上述目标组织路径树发生变更,确定发生变更的至少一个组织信息,作为变更组织信息集。在这里,可以对目标组织路径树进行部分更新,减少冗余数据的更新和内存资源的浪费。随后,响应于确定上述变更组织信息集对应的变更组织集接收到变更任务信息,确定接收到变更任务信息的至少一个变更组织信息对应的至少一个变更组织路径,其中,上述变更任务信息是变更组织信息的父级组织信息对应的父级组织发送的任务信息。在这里,仅确定发生变更后的变更人员信息,可以减少确定变更的人员信息量,提高人员信息确定的准确性。然后,根据上述至少一个变更组织路径、与上述至少一个变更组织路径对应的至少一个变更任务信息、上述目标组织路径树和上述叶子人员信息集,生成上报信息集。在这里,通过确定变更前和变更后两部分的人员信息,可以避免因组织路径树变更前后人员信息数据不一致的问题,以及避免变更之前叶子人员信息重复统计。最后,根据上述目标组织路径树和上述至少一个变更组织路径,生成变更后组织路径树,以及将上述上报信息集和上述变更后组织路径树存储至图数据库中。在这里,将变更后组织路径树存储至图数据库中,相较于将未变化部分的重复存储,可以减少冗余数据,进而减少存储资源的浪费和提高查询效率。由此可得,该上报信息存储方法对发生变更的组织路径进行更新和存储,可以确保上报信息的准确性,减少存储和内存资源的浪费。
进一步参考图2,作为对上述各图所示方法的实现,本公开提供了一种上报信息存储装置的一些实施例,这些装置实施例与图1所示的那些方法实施例相对应,该上报信息存储装置具体可以应用于各种电子设备中。
如图2所示,一种上报信息存储装置200包括:实体关系抽取单元201、第一确定单元202、第二确定单元203、第三确定单元204、第四确定单元205、生成单元206和存储单元207。其中,实体关系抽取单元201被配置成:响应于接收到任务信息,对上述任务信息进行实体关系抽取,得到实体信息集和关系特征词集,以及根据上述实体信息集和上述关系特征词集,构建目标组织路径树。第一确定单元202被配置成:确定上述目标组织路径树对应的各个叶子组织信息的状态信息,得到状态信息集。第二确定单元203被配置成:根据上述状态信息集,确定上述各个叶子组织信息对应的叶子人员信息,得到叶子人员信息集。第三确定单元204被配置成:响应于确定上述目标组织路径树发生变更,确定发生变更的至少一个组织信息,作为变更组织信息集。第四确定单元205被配置成:响应于确定上述变更组织信息集对应的变更组织集接收到变更任务信息,确定接收到变更任务信息的至少一个变更组织信息对应的至少一个变更组织路径,其中,上述变更任务信息是变更组织信息的父级组织信息对应的父级组织发送的任务信息。生成单元206被配置成:根据上述至少一个变更组织路径、与上述至少一个变更组织路径对应的至少一个变更任务信息、上述目标组织路径树和上述叶子人员信息集,生成上报信息集。存储单元207被配置成:根据上述目标组织路径树和上述至少一个变更组织路径,生成变更后组织路径树,以及将上述上报信息集和上述变更后组织路径树存储至图数据库中。
可以理解的是,上报信息存储装置200中记载的诸单元与参考图1描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作、特征以及产生的有益效果同样适用于上报信息存储装置200及其中包含的单元,在此不再赘述。
下面参考图3,其示出了适于用来实现本公开的一些实施例的电子设备(例如,电子设备)300的结构示意图。图3示出的电子设备仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
如图3所示,电子设备300可以包括处理装置(例如中央处理器、图形处理器等)301,其可以根据存储在只读存储器(ROM)302中的程序或者从存储装置308加载到随机访问存储器(RAM)303中的程序而执行各种适当的动作和处理。在RAM 303中,还存储有电子设备300操作所需的各种程序和数据。处理装置301、ROM 302以及RAM 303通过总线304彼此相连。输入/输出(I/O)接口305也连接至总线304。
通常,以下装置可以连接至I/O接口305:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置306;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置307;包括例如磁带、硬盘等的存储装置308;以及通信装置309。通信装置309可以允许电子设备300与其他设备进行无线或有线通信以交换数据。虽然图3示出了具有各种装置的电子设备300,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图3中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本公开的一些实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的一些实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的一些实施例中,该计算机程序可以通过通信装置309从网络上被下载和安装,或者从存储装置308被安装,或者从ROM 302被安装。在该计算机程序被处理装置301执行时,执行本公开的一些实施例的方法中限定的上述功能。
需要说明的是,本公开的一些实施例上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的一些实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的一些实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(Hyper Text TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:响应于接收到任务信息,对上述任务信息进行实体关系抽取,得到实体信息集和关系特征词集,以及根据上述实体信息集和上述关系特征词集,构建目标组织路径树;确定上述目标组织路径树对应的各个叶子组织信息的状态信息,得到状态信息集;根据上述状态信息集,确定上述各个叶子组织信息对应的叶子人员信息,得到叶子人员信息集;响应于确定上述目标组织路径树发生变更,确定发生变更的至少一个组织信息,作为变更组织信息集;响应于确定上述变更组织信息集对应的变更组织集接收到变更任务信息,确定接收到变更任务信息的至少一个变更组织信息对应的至少一个变更组织路径,其中,上述变更任务信息是变更组织信息的父级组织信息对应的父级组织发送的任务信息;根据上述至少一个变更组织路径、与上述至少一个变更组织路径对应的至少一个变更任务信息、上述目标组织路径树和上述叶子人员信息集,生成上报信息集;根据上述目标组织路径树和上述至少一个变更组织路径,生成变更后组织路径树,以及将上述上报信息集和上述变更后组织路径树存储至图数据库中。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的一些实施例的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开的一些实施例中的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括实体关系抽取单元、第一确定单元、第二确定单元、第三确定单元、第四确定单元、生成单元和存储单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,实体关系抽取单元还可以被描述为“响应于接收到任务信息,对上述任务信息进行实体关系抽取,得到实体信息集和关系特征词集,以及根据上述实体信息集和上述关系特征词集,构建目标组织路径树的单元”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
以上描述仅为本公开的一些较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开的实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (10)

1.一种上报信息存储方法,包括:
响应于接收到任务信息,对所述任务信息进行实体关系抽取,得到实体信息集和关系特征词集,以及根据所述实体信息集和所述关系特征词集,构建目标组织路径树;
确定所述目标组织路径树对应的各个叶子组织信息的状态信息,得到状态信息集;
根据所述状态信息集,确定所述各个叶子组织信息对应的叶子人员信息,得到叶子人员信息集;
响应于确定所述目标组织路径树发生变更,确定发生变更的至少一个组织信息,作为变更组织信息集;
响应于确定所述变更组织信息集对应的变更组织集接收到变更任务信息,确定接收到变更任务信息的至少一个变更组织信息对应的至少一个变更组织路径,其中,所述变更任务信息是变更组织信息的父级组织信息对应的父级组织发送的任务信息;
根据所述至少一个变更组织路径、与所述至少一个变更组织路径对应的至少一个变更任务信息、所述目标组织路径树和所述叶子人员信息集,生成上报信息集;
根据所述目标组织路径树和所述至少一个变更组织路径,生成变更后组织路径树,以及将所述上报信息集和所述变更后组织路径树存储至图数据库中。
2.根据权利要求1所述的方法,其中,所述根据所述状态信息集,确定所述各个叶子组织信息对应的叶子人员信息,得到叶子人员信息集,包括:
从所述状态信息集中筛选出满足预设状态信息的状态信息,作为目标状态信息,得到目标状态信息集,其中,所述预设状态信息是叶子人员信息被父级组织信息对应的父级组织确认的状态信息;
对所述目标状态信息集进行去重处理,得到去重后状态信息集;
将所述去重后状态信息集,确定为叶子人员信息集。
3.根据权利要求1所述的方法,其中,所述响应于确定所述变更组织信息集对应的变更组织集接收到变更任务信息,确定接收到变更任务信息的至少一个变更组织信息对应的至少一个变更组织路径,包括:
响应于确定所述变更组织信息集中存在变更组织信息是非叶子组织信息,确定至少一个非叶子组织信息中每个非叶子组织信息对应的至少一个叶子组织信息,作为至少一个目标叶子组织信息,得到至少一个目标叶子组织信息集;
确定所述至少一个目标叶子组织信息集中每个目标叶子组织信息对应的叶子组织路径,得到至少一个叶子组织路径集,作为至少一个变更组织路径。
4.根据权利要求3所述的方法,其中,所述方法还包括:
响应于确定所述变更组织信息集中存在变更组织信息是叶子组织信息,确定至少一个叶子组织信息对应的至少一个变更组织路径。
5.根据权利要求1所述的方法,其中,所述根据所述至少一个变更组织路径、与所述至少一个变更组织路径对应的至少一个变更任务信息、所述目标组织路径树和所述叶子人员信息集,生成上报信息集,包括:
通过所述目标组织路径树,生成所述叶子人员信息集中每个叶子人员信息对应的目标组织路径,得到目标组织路径集;
根据所述目标组织路径集和所述叶子人员信息集,生成第一上报信息集;
根据所述至少一个变更任务信息和所述至少一个变更组织路径,生成第二上报信息集;
将第一上报信息集和所述第二上报信息集,确定为上报信息集。
6.根据权利要求5所述的方法,其中,所述根据所述目标组织路径集和所述叶子人员信息集,生成第一上报信息集,包括:
对于所述叶子人员信息集中的每个叶子人员信息,执行以下第一确定步骤:
确定所述叶子人员信息对应的叶子组织信息的父级组织信息;
基于所述父级组织信息,执行以下第二确定步骤:
确定所述父级组织信息对应的至少一个子级组织信息和所述至少一个子级组织信息对应的人员信息,作为至少一个子级人员信息;
将所述至少一个子级人员信息,确定为所述父级组织信息的上报信息;
响应于确定所述父级组织信息是根节点组织信息,将所述上报信息确定为第一上报信息,其中,所述根节点组织信息是所述目标组织路径树中位于根节点的组织信息;
响应于确定所述父级组织信息不是根节点组织信息,确定所述父级组织信息的父级组织信息,作为目标父级组织信息,以及将所述目标父级组织信息确定为父级组织信息,以再次执行所述第二确定步骤。
7.根据权利要求6所述的方法,其中,所述确定所述父级组织信息对应的至少一个子级组织信息和所述至少一个子级组织信息对应的人员信息,作为至少一个子级人员信息,包括:
响应于确定所述至少一个子级组织信息中存在子级组织是非叶子组织信息,确定至少一个非叶子组织信息对应的子级组织信息集,作为第一子级组织信息集;
确定所述第一子级组织信息集中每个第一子级组织信息对应的叶子组织信息组,作为第一目标叶子组织信息组,得到第一目标叶子组织信息组集;
确定所述第一目标叶子组织信息组集中每个第一目标叶子组织信息对应的叶子人员信息集,得到多个第一子级人员信息组集;
响应于确定所述至少一个子级组织信息中存在子级组织是叶子组织信息,将至少一个叶子组织信息,确定为第二子级组织信息集;
将所述第二子级组织信息集对应的叶子人员信息组,确定为第二子级人员信息组集;
将所述多个第一子级人员信息组集、或者所述第二子级人员信息组集、或者所述多个第一子级人员信息组集与所述第二子级人员信息组集的和,确定为至少一个子级人员信息。
8.一种上报信息存储装置,包括:
实体关系抽取单元,被配置成响应于接收到任务信息,对所述任务信息进行实体关系抽取,得到实体信息集和关系特征词集,以及根据所述实体信息集和所述关系特征词集,构建目标组织路径树;
第一确定单元,被配置成确定所述目标组织路径树对应的各个叶子组织信息的状态信息,得到状态信息集;
第二确定单元,被配置成根据所述状态信息集,确定所述各个叶子组织信息对应的叶子人员信息,得到叶子人员信息集;
第三确定单元,被配置成响应于确定所述目标组织路径树发生变更,确定发生变更的至少一个组织信息,作为变更组织信息集;
第四确定单元,被配置成响应于确定所述变更组织信息集对应的变更组织集接收到变更任务信息,确定接收到变更任务信息的至少一个变更组织信息对应的至少一个变更组织路径,其中,所述变更任务信息是变更组织信息的父级组织信息对应的父级组织发送的任务信息;
生成单元,被配置成根据所述至少一个变更组织路径、与所述至少一个变更组织路径对应的至少一个变更任务信息、所述目标组织路径树和所述叶子人员信息集,生成上报信息集;
存储单元,被配置成根据所述目标组织路径树和所述至少一个变更组织路径,生成变更后组织路径树,以及将所述上报信息集和所述变更后组织路径树存储至图数据库中。
9.一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1-7中任一所述的方法。
CN202310995915.XA 2023-08-09 2023-08-09 上报信息存储方法、装置、电子设备和计算机可读介质 Active CN116737870B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310995915.XA CN116737870B (zh) 2023-08-09 2023-08-09 上报信息存储方法、装置、电子设备和计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310995915.XA CN116737870B (zh) 2023-08-09 2023-08-09 上报信息存储方法、装置、电子设备和计算机可读介质

Publications (2)

Publication Number Publication Date
CN116737870A CN116737870A (zh) 2023-09-12
CN116737870B true CN116737870B (zh) 2023-10-27

Family

ID=87909883

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310995915.XA Active CN116737870B (zh) 2023-08-09 2023-08-09 上报信息存储方法、装置、电子设备和计算机可读介质

Country Status (1)

Country Link
CN (1) CN116737870B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110163506A (zh) * 2019-05-22 2019-08-23 北京字节跳动网络技术有限公司 组织架构图的构建方法、装置、介质、服务器及用户终端
WO2022198868A1 (zh) * 2021-03-26 2022-09-29 深圳壹账通智能科技有限公司 开放式实体关系的抽取方法、装置、设备及存储介质
CN115858487A (zh) * 2022-06-19 2023-03-28 深圳前海微众银行股份有限公司 一种数据迁移方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2718701A1 (en) * 2010-10-29 2011-01-10 Ibm Canada Limited - Ibm Canada Limitee Using organizational awareness in locating business intelligence
CN107491534B (zh) * 2017-08-22 2020-11-20 北京百度网讯科技有限公司 信息处理方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110163506A (zh) * 2019-05-22 2019-08-23 北京字节跳动网络技术有限公司 组织架构图的构建方法、装置、介质、服务器及用户终端
WO2022198868A1 (zh) * 2021-03-26 2022-09-29 深圳壹账通智能科技有限公司 开放式实体关系的抽取方法、装置、设备及存储介质
CN115858487A (zh) * 2022-06-19 2023-03-28 深圳前海微众银行股份有限公司 一种数据迁移方法及装置

Also Published As

Publication number Publication date
CN116737870A (zh) 2023-09-12

Similar Documents

Publication Publication Date Title
CN112149400B (zh) 一种数据处理方法、装置、设备及存储介质
US11494559B2 (en) Hybrid in-domain and out-of-domain document processing for non-vocabulary tokens of electronic documents
CN110851546B (zh) 一种验证、模型的训练、模型的共享方法、系统及介质
CN111177367B (zh) 案件分类方法、分类模型训练方法及相关产品
US11507747B2 (en) Hybrid in-domain and out-of-domain document processing for non-vocabulary tokens of electronic documents
US11775759B2 (en) Systems and methods for training and evaluating machine learning models using generalized vocabulary tokens for document processing
US20220100772A1 (en) Context-sensitive linking of entities to private databases
CN114817553A (zh) 知识图谱构建方法、知识图谱构建系统和计算设备
CN114661861A (zh) 文本匹配方法及装置、存储介质、终端
US20210073257A1 (en) Logical document structure identification
CN113377740A (zh) 铁路元数据管理方法、应用方法及装置
CN115114419A (zh) 问答处理方法、装置、电子设备和计算机可读介质
CN116562255B (zh) 表单信息生成方法、装置、电子设备和计算机可读介质
CN116151967A (zh) 一种基于交易知识图谱的欺诈团伙识别系统
EP4222635A1 (en) Lifecycle management for customized natural language processing
US20220100967A1 (en) Lifecycle management for customized natural language processing
JP2023517518A (ja) ヌル値又は同等の値を有するリレーショナル・テーブルのためのベクトル埋込モデル
CN114036921A (zh) 一种政策信息匹配方法和装置
CN116737870B (zh) 上报信息存储方法、装置、电子设备和计算机可读介质
CN109726398B (zh) 一种实体识别及属性判断方法、系统、设备及介质
CN117291722A (zh) 对象管理方法、相关设备及计算机可读介质
CN115129885A (zh) 实体链指方法、装置、设备及存储介质
CN114579876A (zh) 虚假信息检测方法、装置、设备及介质
CN114328818A (zh) 文本语料处理方法、装置、存储介质及电子设备
CN117172220B (zh) 文本相似信息生成方法、装置、设备和计算机可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant