CN109933800A - 数据机构体系的创建方法、信息查询方法及装置 - Google Patents
数据机构体系的创建方法、信息查询方法及装置 Download PDFInfo
- Publication number
- CN109933800A CN109933800A CN201910221724.1A CN201910221724A CN109933800A CN 109933800 A CN109933800 A CN 109933800A CN 201910221724 A CN201910221724 A CN 201910221724A CN 109933800 A CN109933800 A CN 109933800A
- Authority
- CN
- China
- Prior art keywords
- sequence
- segmentation
- data structures
- node
- level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000011218 segmentation Effects 0.000 claims abstract description 171
- 230000007246 mechanism Effects 0.000 claims abstract description 128
- 230000008520 organization Effects 0.000 claims abstract description 66
- 238000012545 processing Methods 0.000 claims abstract description 36
- 238000013507 mapping Methods 0.000 claims abstract description 12
- 241000933832 Broussonetia Species 0.000 claims description 36
- 238000007726 management method Methods 0.000 claims description 25
- 230000008569 process Effects 0.000 claims description 12
- 238000004458 analytical method Methods 0.000 claims description 5
- 238000004519 manufacturing process Methods 0.000 claims description 5
- 230000008901 benefit Effects 0.000 claims description 3
- 238000010168 coupling process Methods 0.000 abstract description 8
- 238000005859 coupling reaction Methods 0.000 abstract description 8
- 230000008878 coupling Effects 0.000 abstract description 7
- 230000008859 change Effects 0.000 abstract description 6
- 238000012423 maintenance Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 13
- 238000013475 authorization Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 244000131316 Panax pseudoginseng Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000008531 maintenance mechanism Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Abstract
本发明提供了数据机构体系的创建方法、信息查询方法及装置,首先确定出待处理的用户机构的机构名称,然后,对该机构名称进行分词处理得到分词序列,再对分词序列中机构层级由高到低的顺序创建机构树,该机构树中包括用户机构信息与对应层级的数据机构信息之间的映射关系,即该机构树中包含了用户机构体系与数据机构体系之间的对应关系。创建的机构树基于中文分词算法建立,通过各个机构的中文名称能够得到节点之间的对照关系,避免了传统紧耦合存储策略中存在的机构信息变更开销大,以及异构机构体系之间的节点对照维护成本大的问题。
Description
技术领域
本发明属于计算机技术领域,尤其涉及数据机构体系的创建方法、信息查询方法及装置。
背景技术
机构体系是各类组织机构的一种组织架构方式,根据各类组织的实际业务需要建立不同的机构体系,例如,银行机构会建立各地的分行、支行等分支机构。本文涉及的机构体系包括用户机构体系和数据机构体系,用户机构体系是用户管理系统中的机构体系;数据机构体系是数据加工系统中采用的机构体系。
传统的机构体系通常以数据表的方式存储,通过在子节点记录中存放父节点信息维护机构树的层次关系。这种机构组织方式存在一个较大的问题,即在机构信息发生调整时,例如,某个机构的从属关系从一个机构节点改变到另一个机构节点,往往需要耗费巨大的工作量对相关节点的层次信息进行变更,而且很容易出错。
此外,由于各类系统对数据加工及汇总的要求、上游数据格式等均存在差异,导致各种信息管理及分析型应用系统中所接入的数据存在依赖机构体系的结构往往不同,即,异构系统。在异构系统中进行用户数据授权时,需要开发专门的模块以及安排专门的授权管理人员对系统用户可以访问的资源的权限依据该用户所属的机构层级进行授权。如果系统中存在n个来自不同机构系统所加工出的数据,则需要对同一个用户进行n次机构授权,一方面造成权限信息的冗余,另一方面给授权管理员的工作效率造成较大影响。
发明内容
有鉴于此,本发明的目的在于提供数据机构体系的创建方法、信息查询方法及装置,以解决传统紧耦合存储方式中存在的机构信息变更开销大的技术问题。其具体的技术方案如下:
第一方面,本发明提供了一种数据机构体系创建方法,包括:
获取当前用户管理系统中全部用户机构的机构名称,所述用户机构为用户管理系统的机构体系,所述用户机构的机构名称中包括该用户机构对应的完整的上级机构名称;
对各个所述机构名称进行分词处理得到对应的分词序列;
针对每一分词序列,分析该分词序列所对应的用户机构层级,得到与该分词序列相匹配的数据机构节点,所述数据机构节点是数据机构体系中的节点,数据机构体系是数据加工系统的机构体系;
将全部分词序列相匹配的数据机构节点,按照机构层级由高到低的顺序创建得到数据机构树。
可选地,所述针对每一分词序列,分析该分词序列所对应的用户机构的机构层级,得到与该分词序列相匹配的数据机构节点,包括:
针对每一分词序列,基于各个预设机构层级的层级关键词,分析该分词序列所包含的预设机构层级;
将该分词序列所包含的各个预设机构层级中的最末级的预设机构层级,确定为该分词序列对应的用户机构相匹配的数据机构节点。
可选地,所述将该分词序列所包含的各个预设机构层级中的最末级的预设机构层级,确定为该分词序列对应的用户机构相匹配的数据机构节点,包括:
将所述分词序列所包含的各个预设机构层级按照机构层级由高到低的顺序,依次将所述机构层级对应的机构名称转换为对应的字符名称,直到所述分词序列所包含的全部预设机构层级均转换完成得到字符名称序列;
将所述分词序列对应的字符名称确定为该分词序列对应的用户机构相匹配的数据机构节点。
第二方面,本发明还提供了一种数据机构体系的信息查询方法,包括:
获取待查询用户机构名称;
对所述待查询用户机构名称进行分词处理得到分词序列;
获取所述分词序列中包含的各个机构层级的字符名称序列;
查询已创建的数据机构树,得到与所述字符名称序列对应的根节点,所述数据机构树利用权利要求1-3所述的方法创建得到;
从所述数据机构树中获取所述根节点的全部子节点,得到与所述待查询机构名称对应的数据机构信息。
可选地,所述查询已创建的机构树得到所述数据机构树中与所述字符名称序列对应的根节点,包括:
按照所述字符名称序列中包含的预设机构层级由高到低的顺序,从所述数据机构树中查询出与所述字符名称序列完全匹配的节点,得到与所述字符名称序列对应的根节点。
第三方面,本发明还提供了一种数据机构体系创建装置,其特征在于,包括:
获取模块,用于获取当前用户管理系统中全部用户机构的机构名称;
分词处理模块,用于对各个所述机构名称进行分词处理得到对应的分词序列;
映射关系建立模块,用于针对每一分词序列,分析该分词序列所对应的用户机构层级,得到与该分词序列相匹配的数据机构节点,所述数据机构节点是数据机构体系中的节点,数据机构体系是数据加工系统的机构体系;
机构树创建模块,用于将全部分词序列相匹配的数据机构节点,按照机构层级由高到低的顺序创建得到数据机构树。
可选地,所述映射关系建立模块,包括:
层级分析子模块,用于针对每一分词序列,基于各个预设机构层级的层级关键词,分析该分词序列所包含的预设机构层级;
确定子模块,用于将该分词序列所包含的各个预设机构层级中的最末级的预设机构层级,确定为该分词序列对应的用户机构相匹配的数据机构节点。
可选地,所述确定子模块具体用于:
将所述分词序列所包含的各个预设机构层级按照机构层级由高到低的顺序,依次将所述机构层级对应的机构名称转换为对应的字符名称,直到所述分词序列所包含的全部预设机构层级均转换完成得到字符名称序列;
将所述分词序列对应的字符名称确定为该分词序列对应的用户机构相匹配的数据机构节点。
第四方面,本发明还提供了一种数据机构体系的信息查询装置,包括:
第一获取模块,用于获取待查询用户机构名称;
分词处理模块,用于对所述待查询用户机构名称进行分词处理得到分词序列;
第二获取模块,用于获取所述分词序列中包含的各个机构层级的字符名称序列;
查询模块,用于查询已创建的数据机构树,得到与所述字符名称序列对应的根节点,所述数据机构树利用权利要求1-3所述的方法创建得到;
第三获取模块,用于从所述数据机构树中获取所述根节点的全部子节点,得到与所述待查询用户机构名称对应的数据机构信息。
可选地,所述查询模块具体用于:
按照所述字符名称序列中包含的预设机构层级由高到低的顺序,从所述数据机构树中查询出与所述字符名称序列完全匹配的节点,得到与所述字符名称序列对应的根节点。
本发明提供的数据机构体系创建方法,首先确定出待处理的用户机构的机构名称,然后,对该机构名称进行分词处理得到分词序列,再对分词序列中机构层级由高到低的顺序创建机构树,该机构树中包括用户机构信息与对应层级的数据机构信息之间的映射关系,即该机构树中包含了用户机构体系与数据机构体系之间的对应关系。创建的机构树基于中文分词算法建立,通过各个机构的中文名称能够得到节点之间的对照关系,避免了传统紧耦合存储策略中存在的机构信息变更开销大,以及异构机构体系之间的节点对照维护成本大的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的一种数据机构体系创建方法的流程图;
图2是本发明提供的一种用户机构体系的示意图;
图3是本发明提供的一种行政区域名称词典的示意图;
图4是本发明提供的一种数据机构体系的示意图;
图5是本发明提供的一种创建机构树过程的流程图;
图6是本发明提供的一种有限状态自动机的状态转换示意图;
图7a是本发明提供的一种机构树的示意图;
图7b是本发明提供的另一种机构树的示意图;
图7c是本发明提供的再一种机构树的示意图;
图8是本发明提供的一种数据机构体系的信息查询方法的流程图;
图9是本发明提供的一种数据机构体系创建装置的框图;
图10是本发明提供的一种数据机构体系的信息查询装置的框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参见图1,示出了本发明实施例提供的一种数据机构体系创建方法的流程图,该方法应用于组织机构系统中,如图1所示,该方法可以包括以下步骤:
S110,获取当前用户管理系统中全部用户机构的机构名称。
其中,对于某个集团而言,当前用户管理系统是该集团对应的用户管理系统。用户机构是用户管理系统中的机构体系,例如,图2是本发明实施例提供的一种用户机构体系的示意图。
依据当前用户管理系统中的全部用户机构的机构名称,创建对应的数据机构树。
此处的用户是指使用该组织机构系统的管理员或其它人等。
其中,为了使本发明提供的方案顺利实施,各个用户机构体系中的各个用户机构节点需要完整标注其上级机构名称,以机构层次由高到低的顺序作为当前机构名称的前缀。
例如,命名总行某机构节点时,基本格式如下:
某银行总行
某银行总行本部
某银行总行本部管理信息部
某银行总行本部管理信息部监测分析处,等等。
例如,命名分(支)行某机构节点时,基本格式如下:
某银行北京分行
某银行北京分行本部
某银行北京分行西城支行
某银行北京分行西城支行新街口支行
某银行北京分行西城支行新街口支行本部
某银行北京分行西城支行新街口支行本部行长室,等等。
S120,对各个机构名称进行分词处理得到对应的分词序列。
对任一用户机构进行分词处理,即进行中文词法分析,进行中文词法分析时,以“总行”、“分行”、“支行”、“营业部”、“分理处”作为关键字,识别出输入的用户机构中包含的关键字,采用字符串匹配的方式完成中文分词处理,例如,待处理的用户机构是“某银行北京分行西城支行”进行分词处理后得到的分词序列是“某银行北京分行|西城支行”。
在本发明的一个实施例中,用户机构与行政区域名称词典及组织机构词典进行逐一匹配分析得到用户机构的分词序列。
建立行政区域名称词典的过程:通过分析我国行政区名称的特点,发现我国行政区名称中关键字重复出现频率较高,为了提高检索及匹配效率,构建一种双字哈希结构进行行政机构名称的识别。
例如,如图3所示,该哈希词典包含两层哈希链表,第一层中保存地名中使用的第一个字,每个字后面连接第二层哈希链表,其中保存地名中该字之后的第二个字,若地名长度大于2,则将其它字符统一存于第二个字之后的下级链表中。此时需要注意,若某个长度大于2的地名中包含另一个地名,在第二层哈希链表的下级节点中需要为该被包含地名预留扫描标记空位,例如,“大兴”和“大兴安岭”,同时属于“兴”字的下级链表,需要分别为这两个地名创建两个节点。
以银行机构为例,通过分析银行机构设置信息,将各级银行机构常用名称抽取出来建立机构词典,其中的关键词包括“总行”、“分行”、“支行”、“营业部”、“营业室”、“分理处”等。
例如,要对“黑龙江分行大兴安岭分行”进行分词,首先读入“黑”字,在第一层哈希表中定位之后,继续读入第二个“龙”字,在“黑”字的下级列表中进一步检索定位,之后进一步读入第三个字“江”,在“龙”的下级列表中检索定位,此时读入下一个“分”字,发现没有与“江”匹配的后续子节点,则结束识别,将“黑龙江”作为一个完整的地名。之后,开始进入组织机构识别,用“分”字与组织机构词典中的“分行”进行匹配,且检查发现下一个读入的字符确实为“行”,则认定此次匹配成功,将“黑龙江分行”作为一个被识别的机构词。对后续的“大兴安岭分行”的匹配过程完全一致,此处不再赘述。
利用行政区域名称词典和组织机构词典能够得到该用户机构对应的分词序列。
例如,用户机构是某银行的“总行本部信息管理部”对应的分词处理后的分词序列是“总行本部|信息管理部”;又如,待处理的用户机构是“北京分行西城支行新街口支行”,对应的分词处理后的分词序列是“北京分行|西城支行|新街口支行”。
S130,针对每一分词序列,分析该分词序列所对应的用户机构层级,得到与该分词序列相匹配的数据机构节点。
所述数据机构是数据加工系统的机构体系,如图4所示,为本发明实施例提供的一种数据机构体系的示意图。
在一种可能的实现方式中,如图5所示,S130具体可以包括以下步骤:
S131,针对每一分词序列,基于各个预设机构层级的层级关键词,分析该分词序列所包含的预设机构层级。
预设机构层级是指用户机构体系中包含的与数据机构体系中的机构名称相同的用户机构层级,例如,如图4所示,银行机构对应的数据机构体系中包括总行、各级分行、各级支行、分理处等,预设机构层级的层级关键词包括“总行”、“分行”、“支行”等。
例如,对于分词序列“XX银行总行|本部信息管理部”,其包含的预设机构层级的层级关键词为“总行”;又如,对于分词序列“XX银行北京分行|西城支行|新街口支行”,其包含的预设机构层级的层级关键词为“分行”和“支行”。
S132,将该分词序列所包含的各个预设机构层级中的最末级的预设机构层级,确定为该分词序列对应的用户机构相匹配的数据机构节点。
例如,分词序列“XX银行总行|本部信息管理部”中仅包含“总行”这一预设机构层级的层级关键词,因此,其对应的数据机构是“XX银行总行”;又如,对于分词序列“XX银行北京分行|西城支行|新街口支行”,与之相匹配的数据机构节点是“新街口支行”;但是,在表示该数据结构节点时,还需要包括该支行的完整的上级机构名称,即XX银行北京分行西城支行新街口支行。
在本发明一种可能的实现方式中,将分词序列所包含的各个预设机构层级按照机构层级由高到低的顺序,依次将机构层级对应的机构名称转换为对应的字符名称,直到分词序列所包含的全部预设机构层级均转换完成,得到字符名称序列;并将分词序列对应的字符名称确定为该分词序列对应的用户机构相匹配的数据机构节点。
其中,因为用户机构体系中的各个用户机构节点在命名时完整标注了其上级机构名称,并以机构层次由高到低的顺序作为当前机构的前缀,所以该机构名称从左至右的顺序即机构层级由高到低顺序。
在一种可能的实现方式中,为了便于直观地根据字符名称就能知道对应的机构名称,字符名称可以选用机构名称的拼音首字母缩写,例如,可以约定两个字母表示一个节点,如“北京分行”对应的字符名称为“BJ”,“西城支行”对应的字符名称为“XC”。如果某层级机构名称多于两个字母则以后两个字的拼音首字母缩写作为字符名称,例如,新街口对应的字符名称是“JK”。
当然,也可以根据用户的实际需求采用其它转换方式,只要满足读入字符时能够自动识别出哪些字符表示一个机构节点即可。
在本发明另一种可能的实现方式中,可以利用有限状态自动机将用户机构转换为对应的数据机构节点,即,利用有限状态自动机建立用户机构与数据机构节点之间的映射关系。其中,可以根据实际需求设定有限状态自动机,即,根据实际的业务需求建立不同的映射关系。
其中,有限状态自动机具有有限个状态以及在这些状态之间转换的数学模型,其中的一个应用场景是用于识别具有一定模式的字符序列。
请参见图6,示出了以银行机构为例的有限状态自动机的状态转换示意图。
以“XX银行总行本部信息管理部”为例,首先对该用户机构进行分词处理得到相应的分词序列“XX银行总行本部|信息管理部”。
从左至右读入分词序列中的第一个机构名称“XX银行总行本部”并输入至有限状态自动机内,有限状态自动机识别出该机构名称包含预设机构层级的层级关键词“总行”,有限状态自动机从A节点跳转至结束节点,并输出字符名称“ZH”,标记层级为L=0;然后转入结束状态,最终输出“ZH”这一字符名称序列,并确定该字符名称序列为与该分词序列对应的数据机构节点。
以“XX银行北京分行西城支行新街口支行”为例,首先进行分词处理得到分词序列“XX银行北京分行|西城支行|新街口支行”。
然后,读入“XX银行北京分行”并输入至有限状态自动机内,有限状态自动机识别出该结构名称中包含“分行”这一层级关键词,有限状态自动机从A节点转至B节点,输出字符名称“BJ”,标记层级为L=1;然后,读入“西城支行”,该机构名称包含层级关键词“支行”,有限状态自动机从B节点转至C节点,输出对应的字符名称“BJXC”,并标记层级为L=2;然后,读入“新街口支行”,该机构名称包含“支行”,有限状态自动机从C节点跳转至C节点,输出“BJXCJK”,标记层级为L=3。最终输出的字符名称序列是“BJXCJK”,并确定该字符名称序列为与该分词序列对应的数据机构节点。如果继续读入的是“营业部”,则有限状态自动机从C节点跳转至C节点,输出“BJXC”,并标记层级为L=3。继续读入发现后续无待读入字符,转入结束状态。
S140,将全部分词序列相匹配的数据机构节点,按照机构层级由高到低的顺序创建得到数据机构树。
在一种可能的实现方式中,创建机构树时,从左向右扫描字符名称序列,每次读入两个字符,根据节点的层级构造机构树,具体的规则如下:
1)对于层级L为1的名称,查看总行节点“ZH”之下是否已经挂载该名称对应的节点,若已挂载,则返回读取下一个名称;若没有挂载,将其挂载在总行节点“ZH”之下;
2)对于层级L大于1的名称,首先读取前两个字符,以总行节点为初始父节点,在读入后续字符不为空的情况下,重复以下操作:在父节点P的子节点中遍历,若找到与当前读取的名称匹配的节点,则以该节点为新的父节点,继续读取该节点之后的两个字符,将其作为新的名称与当前父节点中的子节点进行匹配,若当前父节点的子节点中不存在与该名称匹配的节点,则需要新建节点,并挂载在当前父节点之下;
例如,对于字符名称序列“BJXCJK”,以图7a所示的机构树为例进行说明,首先读入“BJ”,其层级L=1,在当前父节点“ZH”的子节点中发现已经存在“BJ”对应的子节点,则以“BJ”对应的节点为当前父节点,继续读入“XC”,其层级L=2,遍历“BJ”节点的子节点,发现“XC”对应的节点不在其中,则新建“XC”节点,将其挂载在当前父节点“BJ”之下,如图7b所示。之后,以“XC”对应的节点为当前父节点,继续读入“JK”,其L=3,遍历“XC”节点的所有子节点,发现“JK”对应的节点不在其中,则新建“JK”节点,并将其挂载在“XC”节点之下,如图7c所示。然后,以“JK”对应的节点为当前父节点,继续读入时发现后续没有字符,则对应该分词序列的机构节点构造完毕。
本实施例提供的数据机构体系创建方法,获取当前用户管理系统中的全部用户机构的机构名称,然后,针对各个机构名称进行分词处理得到对应的分词序列。针对每一个分词序列,分析该分词序列对应的用户机构层级得到相匹配的数据机构节点。最后,将全部分词序列相匹配的数据机构节点按照机构层级由高到低的顺序创建得到数据机构树。该数据机构树中包括用户机构信息与对应层级的数据机构信息之间的映射关系,即该数据机构树中包含了用户机构体系与数据机构体系之间的对应关系。利用该方法创建的数据机构树,当用户机构变更时,只需要调整与该用户机构对应的数据机构节点,避免了传统紧耦合存储策略中存在的机构信息变更开销大,以及异构机构体系之间的节点对照维护成本大的问题。
创建完成机构树之后,建立了用户机构体系与数据机构体系之间的关系,根据输入的用户机构体系中的机构名称,能够即时获取对应的数据机构树中的节点及各级子节点,具体流程请参见图8所示的数据机构体系的信息查询方法的流程图,如图8所示,该方法包括以下步骤:
S210,获取待查询用户机构名称。
待查询用户机构名称是指要查询的某个用户所属机构的机构名称,该机构名称包含其完整的上级机构,例如,用户所属机构是XX支行,则对应的待查询机构名称是“XX银行XX分行XX支行”。
S220,对待查询用户机构名称进行分词处理得到分词序列。
然后,根据行政区域名称词典和机构名称词典,将待查询机构名称进行中文分词处理,得到待查询机构名称对应的分词序列。例如,待查询机构名称为“XX银行北京分行西城支行新街口支行”,进行分词处理后得到的分词序列是“XX银行北京分行|西城支行|新街口支行”。
S230,获取分词序列中包含的各个机构层级的字符名称序列。
其中,基于分词序列转换得到对应的字符名称序列的过程与上述的数据机构体系创建方法实施例中的相应步骤相同,此处不再赘述。
S240,查询已创建的数据机构树得到与字符名称序列对应的根节点。
其中,该数据机构树即利用上述数据机构体系创建方法实施例创建得到的数据机构树。
在本发明的一个实施例中,将分词序列转换对应的字符名称序列,然后,遍历数据机构树得到该字符名称序列对应的根节点。例如,字符名称序列“BJXCJK”,遍历图7(c)所示的数据机构树,从该数据机构树的总行节点开始依次根据对应层级的机构名称对机构树进行深度遍历,得到该分词序列对应的根节点是“JK”节点。
S250,从所述数据机构树中获取根节点的全部子节点,得到与待查询机构名称对应的数据机构信息。
获得分词序列对应的“JK”节点后,获取该根节点的全部子节点,得到与待查询机构名称对应的全部数据机构信息。
获取分词序列对应的根节点后,点击该根节点的信息后,获取该根节点的下一级的所有节点(例如,下级分行、支行等)进行展示,例如,展示以“JK”节点为根节点的子树。
本实施例提供的数据机构体系的信息查询方法,输入要查询的待查询用户机构名称之后,对该待查询用户机构名称进行中文分词处理得到分词序列;以及,获取分词序列中包含的各个机构层级的字符名称序列。然后,查询机构树得到与该字符名称序列对应的根节点,并显示该根节点的所有下级节点,至此完成机构树显示,得到该用户机构对应的所有数据机构信息,从而实现利用用户机构查询对应的数据机构的目的。
相应于上述的数据机构体系创建方法实施例,本发明还提供了数据机构体系创建装置实施例。
请参见图9,示出了本发明实施例提供的一种数据机构体系创建装置的框图,该装置应用于组织机构系统中,如图9所示,该装置包括获取模块110、分词处理模块120、映射关系建立模块130和机构树创建模块140。
获取模块110,用于获取当前用户管理系统中全部用户机构的机构名称。
分词处理模块120,用于对各个机构名称进行分词处理得到分词序列。
例如,待处理用户机构是某银行的“总行本部信息管理部”对应的分词处理后的分词序列是“总行本部|信息管理部”;又如,待处理的用户机构是“北京分行西城支行新街口支行”,对应的分词处理后的分词序列是“北京分行|西城支行|新街口支行”。
映射关系建立模块130,用于针对每一分词序列,分析该分词序列所对应的用户机构层级,得到与该分词序列相匹配的数据机构节点。
所述数据机构节点是数据机构体系中的节点,数据机构体系是数据加工系统的机构体系。
在一种可能的实现方式中,映射关系建立模块130包括层级分析子模块和确定子模块;
该层级分析子模块,用于针对每一分词序列,基于各个预设机构层级的层级关键词,分析该分词序列所包含的预设机构层级。
该确定子模块,用于将该分词序列所包含的各个预设机构层级中的最末级的预设机构层级,确定为该分词序列对应的用户机构相匹配的数据机构节点。
在一种可能的实现方式中,该确定子模块,具体用于将所述分词序列所包含的各个预设机构层级按照机构层级由高到低的顺序,依次将所述机构层级对应的机构名称转换为对应的字符名称,直到所述分词序列所包含的全部预设机构层级均转换完成得到字符名称序列。并将所述分词序列对应的字符名称确定为该分词序列对应的用户机构相匹配的数据机构节点。
机构树创建模块140,用于将全部分词序列相匹配的数据机构节点,按照机构层级由高到低的顺序创建得到数据机构树。
本实施例提供的数据机构体系创建装置,利用该方法创建的数据机构树,当用户机构变更时,只需要调整与该用户机构对应的数据机构节点,避免了传统紧耦合存储策略中存在的机构信息变更开销大,以及异构机构体系之间的节点对照维护成本大的问题。
另一方面,本发明实施例还提供了一种数据机构体系的信息查询装置实施例,如图10所示,该机构体系的信息查询装置包括:第一获取模块210、分词处理模块220、第二获取模块230、查询模块240和第三获取模块250。
第一获取模块210,用于获取待查询用户机构名称。
分词处理模块220,用于对所述待查询机构名称进行分词处理得到分词序列。
第二获取模块230,用于获取所述分词序列中包含的各个机构层级的字符名称序列。
查询模块240,用于查询已创建的机构树得到与所述字符名称序列对应的根节点。
在本发明一种可能的实现方式中,该查询模块240具体用于:按照所述字符名称序列中包含的预设机构层级由高到低的顺序,从所述数据机构树中查询出与所述字符名称序列完全匹配的节点,得到与所述字符名称序列对应的根节点。
例如,字符名称序列“BJXCJK”,遍历图7(c)所示的机构树,从该机构树的总行节点开始依次根据对应层级的机构名称对机构树进行深度遍历,得到该分词序列对应的根节点是“JK”节点。
第三获取模块250,用于从数据机构树中获取根节点的全部子节点,得到与待查询用户机构名称对应的数据机构信息。
获得分词序列对应的“JK”节点后,获取该根节点的全部子节点,得到与待查询机构名称对应的全部数据机构信息。
获取分词序列对应的根节点后,点击该根节点的信息后,获取该根节点的下一级的所有节点(例如,下级分行、支行等)进行展示,例如,展示以“JK”节点为根节点的子树。
本实施例提供的数据机构体系的信息查询装置,输入要查询的待查询用户机构名称之后,对该待查询机构名称进行中文分词处理得到分词序列;以及,获取分词序列中包含的各个机构层级的字符名称序列。然后,查询机构树得到与该字符名称序列对应的根节点,并显示该根节点的所有下级节点,至此完成机构树显示,得到该用户机构对应的所有数据机构信息,从而实现利用用户机构查询对应的数据机构的目的。
对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请各实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本申请各实施例中的装置及终端中的模块和子模块可以根据实际需要进行合并、划分和删减。
本申请所提供的几个实施例中,应该理解到,所揭露的终端,装置和方法,可以通过其它的方式实现。例如,以上所描述的终端实施例仅仅是示意性的,例如,模块或子模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个子模块或模块可以结合或者可以集成到另一个模块,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的模块或子模块可以是或者也可以不是物理上分开的,作为模块或子模块的部件可以是或者也可以不是物理模块或子模块,即可以位于一个地方,或者也可以分布到多个网络模块或子模块上。可以根据实际的需要选择其中的部分或者全部模块或子模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块或子模块可以集成在一个处理模块中,也可以是各个模块或子模块单独物理存在,也可以两个或两个以上模块或子模块集成在一个模块中。上述集成的模块或子模块既可以采用硬件的形式实现,也可以采用软件功能模块或子模块的形式实现。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种数据机构体系创建方法,其特征在于,包括:
获取当前用户管理系统中全部用户机构的机构名称,所述用户机构为用户管理系统的机构体系,所述用户机构的机构名称中包括该用户机构对应的完整的上级机构名称;
对各个所述机构名称进行分词处理得到对应的分词序列;
针对每一分词序列,分析该分词序列所对应的用户机构层级,得到与该分词序列相匹配的数据机构节点,所述数据机构节点是数据机构体系中的节点,数据机构体系是数据加工系统的机构体系;
将全部分词序列相匹配的数据机构节点,按照机构层级由高到低的顺序创建得到数据机构树。
2.根据权利要求1所述的方法,其特征在于,所述针对每一分词序列,分析该分词序列所对应的用户机构的机构层级,得到与该分词序列相匹配的数据机构节点,包括:
针对每一分词序列,基于各个预设机构层级的层级关键词,分析该分词序列所包含的预设机构层级;
将该分词序列所包含的各个预设机构层级中的最末级的预设机构层级,确定为该分词序列对应的用户机构相匹配的数据机构节点。
3.根据权利要求2所述的方法,其特征在于,所述将该分词序列所包含的各个预设机构层级中的最末级的预设机构层级,确定为该分词序列对应的用户机构相匹配的数据机构节点,包括:
将所述分词序列所包含的各个预设机构层级按照机构层级由高到低的顺序,依次将所述机构层级对应的机构名称转换为对应的字符名称,直到所述分词序列所包含的全部预设机构层级均转换完成得到字符名称序列;
将所述分词序列对应的字符名称确定为该分词序列对应的用户机构相匹配的数据机构节点。
4.一种数据机构体系的信息查询方法,其特征在于,包括:
获取待查询用户机构名称;
对所述待查询用户机构名称进行分词处理得到分词序列;
获取所述分词序列中包含的各个机构层级的字符名称序列;
查询已创建的数据机构树,得到与所述字符名称序列对应的根节点,所述数据机构树利用权利要求1-3所述的方法创建得到;
从所述数据机构树中获取所述根节点的全部子节点,得到与所述待查询机构名称对应的数据机构信息。
5.根据权利要求4所述的方法,其特征在于,所述查询已创建的机构树得到所述数据机构树中与所述字符名称序列对应的根节点,包括:
按照所述字符名称序列中包含的预设机构层级由高到低的顺序,从所述数据机构树中查询出与所述字符名称序列完全匹配的节点,得到与所述字符名称序列对应的根节点。
6.一种数据机构体系创建装置,其特征在于,包括:
获取模块,用于获取当前用户管理系统中全部用户机构的机构名称;
分词处理模块,用于对各个所述机构名称进行分词处理得到对应的分词序列;
映射关系建立模块,用于针对每一分词序列,分析该分词序列所对应的用户机构层级,得到与该分词序列相匹配的数据机构节点,所述数据机构节点是数据机构体系中的节点,数据机构体系是数据加工系统的机构体系;
机构树创建模块,用于将全部分词序列相匹配的数据机构节点,按照机构层级由高到低的顺序创建得到数据机构树。
7.根据权利要求6所述的装置,其特征在于,所述映射关系建立模块,包括:
层级分析子模块,用于针对每一分词序列,基于各个预设机构层级的层级关键词,分析该分词序列所包含的预设机构层级;
确定子模块,用于将该分词序列所包含的各个预设机构层级中的最末级的预设机构层级,确定为该分词序列对应的用户机构相匹配的数据机构节点。
8.根据权利要求7所述的装置,其特征在于,所述确定子模块具体用于:
将所述分词序列所包含的各个预设机构层级按照机构层级由高到低的顺序,依次将所述机构层级对应的机构名称转换为对应的字符名称,直到所述分词序列所包含的全部预设机构层级均转换完成得到字符名称序列;
将所述分词序列对应的字符名称确定为该分词序列对应的用户机构相匹配的数据机构节点。
9.一种数据机构体系的信息查询装置,其特征在于,包括:
第一获取模块,用于获取待查询用户机构名称;
分词处理模块,用于对所述待查询用户机构名称进行分词处理得到分词序列;
第二获取模块,用于获取所述分词序列中包含的各个机构层级的字符名称序列;
查询模块,用于查询已创建的数据机构树,得到与所述字符名称序列对应的根节点,所述数据机构树利用权利要求1-3所述的方法创建得到;
第三获取模块,用于从所述数据机构树中获取所述根节点的全部子节点,得到与所述待查询用户机构名称对应的数据机构信息。
10.根据权利要求9所述的装置,其特征在于,所述查询模块具体用于:
按照所述字符名称序列中包含的预设机构层级由高到低的顺序,从所述数据机构树中查询出与所述字符名称序列完全匹配的节点,得到与所述字符名称序列对应的根节点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910221724.1A CN109933800A (zh) | 2019-03-22 | 2019-03-22 | 数据机构体系的创建方法、信息查询方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910221724.1A CN109933800A (zh) | 2019-03-22 | 2019-03-22 | 数据机构体系的创建方法、信息查询方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109933800A true CN109933800A (zh) | 2019-06-25 |
Family
ID=66988132
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910221724.1A Pending CN109933800A (zh) | 2019-03-22 | 2019-03-22 | 数据机构体系的创建方法、信息查询方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109933800A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111026787A (zh) * | 2019-11-22 | 2020-04-17 | 中国银行股份有限公司 | 网点检索方法、装置及系统 |
CN111159752A (zh) * | 2019-12-05 | 2020-05-15 | 武汉达梦数据技术有限公司 | 一种机构间信息共享方法和装置 |
CN111447268A (zh) * | 2020-03-24 | 2020-07-24 | 中国建设银行股份有限公司 | 文件结构转换方法、装置、设备和存储介质 |
CN112559580A (zh) * | 2021-02-19 | 2021-03-26 | 北京宇信科技集团股份有限公司 | 一种数据查询方法、装置及设备 |
CN115774793A (zh) * | 2023-01-29 | 2023-03-10 | 上海蜜度信息技术有限公司 | 机构时效性的检测方法、系统、电子设备及存储介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5930746A (en) * | 1996-03-20 | 1999-07-27 | The Government Of Singapore | Parsing and translating natural language sentences automatically |
CN101930435A (zh) * | 2009-10-27 | 2010-12-29 | 深圳市北科瑞声科技有限公司 | 机构名称检索方法及系统 |
CN102289467A (zh) * | 2011-07-22 | 2011-12-21 | 浙江百世技术有限公司 | 确定目标网点的方法和装置 |
CN104657440A (zh) * | 2015-01-30 | 2015-05-27 | 欧阳江 | 结构化查询语句生成系统及方法 |
CN105095391A (zh) * | 2015-06-30 | 2015-11-25 | 北京奇虎科技有限公司 | 利用分词程序识别机构名称的装置及方法 |
CN106649464A (zh) * | 2016-09-26 | 2017-05-10 | 深圳市数字城市工程研究中心 | 一种中文地址树的构建方法及装置 |
CN107357779A (zh) * | 2017-06-27 | 2017-11-17 | 北京神州泰岳软件股份有限公司 | 一种获取机构名称的方法及装置 |
CN108170672A (zh) * | 2017-12-22 | 2018-06-15 | 武汉数博科技有限责任公司 | 一种中文机构名称实时分析方法及系统 |
CN108595435A (zh) * | 2018-05-03 | 2018-09-28 | 鹏元征信有限公司 | 一种机构名称识别处理方法、智能终端及存储介质 |
CN109145073A (zh) * | 2018-08-28 | 2019-01-04 | 成都市映潮科技股份有限公司 | 一种基于分词算法的地址解析方法及装置 |
CN109271625A (zh) * | 2018-08-28 | 2019-01-25 | 江苏省基础地理信息中心 | 一种汉语地名的拼音拼写规范化方法 |
-
2019
- 2019-03-22 CN CN201910221724.1A patent/CN109933800A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5930746A (en) * | 1996-03-20 | 1999-07-27 | The Government Of Singapore | Parsing and translating natural language sentences automatically |
CN101930435A (zh) * | 2009-10-27 | 2010-12-29 | 深圳市北科瑞声科技有限公司 | 机构名称检索方法及系统 |
CN102289467A (zh) * | 2011-07-22 | 2011-12-21 | 浙江百世技术有限公司 | 确定目标网点的方法和装置 |
CN104657440A (zh) * | 2015-01-30 | 2015-05-27 | 欧阳江 | 结构化查询语句生成系统及方法 |
CN105095391A (zh) * | 2015-06-30 | 2015-11-25 | 北京奇虎科技有限公司 | 利用分词程序识别机构名称的装置及方法 |
CN106649464A (zh) * | 2016-09-26 | 2017-05-10 | 深圳市数字城市工程研究中心 | 一种中文地址树的构建方法及装置 |
CN107357779A (zh) * | 2017-06-27 | 2017-11-17 | 北京神州泰岳软件股份有限公司 | 一种获取机构名称的方法及装置 |
CN108170672A (zh) * | 2017-12-22 | 2018-06-15 | 武汉数博科技有限责任公司 | 一种中文机构名称实时分析方法及系统 |
CN108595435A (zh) * | 2018-05-03 | 2018-09-28 | 鹏元征信有限公司 | 一种机构名称识别处理方法、智能终端及存储介质 |
CN109145073A (zh) * | 2018-08-28 | 2019-01-04 | 成都市映潮科技股份有限公司 | 一种基于分词算法的地址解析方法及装置 |
CN109271625A (zh) * | 2018-08-28 | 2019-01-25 | 江苏省基础地理信息中心 | 一种汉语地名的拼音拼写规范化方法 |
Non-Patent Citations (3)
Title |
---|
杜萍等: "基于本体的中文地名识别", 《西北师范大学学报(自然科学版)》 * |
沈嘉懿等: "中文组织机构名称与简称的识别", 《中文信息学报》 * |
赵捷等: "中文词库在组织机构基础信息检索引擎中的应用", 《标准科学》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111026787A (zh) * | 2019-11-22 | 2020-04-17 | 中国银行股份有限公司 | 网点检索方法、装置及系统 |
CN111159752A (zh) * | 2019-12-05 | 2020-05-15 | 武汉达梦数据技术有限公司 | 一种机构间信息共享方法和装置 |
CN111159752B (zh) * | 2019-12-05 | 2022-02-01 | 武汉达梦数据技术有限公司 | 一种机构间信息共享方法和装置 |
CN111447268A (zh) * | 2020-03-24 | 2020-07-24 | 中国建设银行股份有限公司 | 文件结构转换方法、装置、设备和存储介质 |
CN112559580A (zh) * | 2021-02-19 | 2021-03-26 | 北京宇信科技集团股份有限公司 | 一种数据查询方法、装置及设备 |
CN112559580B (zh) * | 2021-02-19 | 2021-05-14 | 北京宇信科技集团股份有限公司 | 一种数据查询方法、装置及设备 |
CN115774793A (zh) * | 2023-01-29 | 2023-03-10 | 上海蜜度信息技术有限公司 | 机构时效性的检测方法、系统、电子设备及存储介质 |
CN115774793B (zh) * | 2023-01-29 | 2023-05-30 | 上海蜜度信息技术有限公司 | 机构时效性的检测方法、系统、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109933800A (zh) | 数据机构体系的创建方法、信息查询方法及装置 | |
US7574413B2 (en) | System and method of discovering information | |
CN102395965B (zh) | 用于在数据库中搜索对象的方法 | |
CN109101652B (zh) | 一种标签创建和管理系统 | |
CN104346377B (zh) | 一种基于唯一标识的数据集成和交换方法 | |
US7516157B2 (en) | Relational directory | |
CN103020158B (zh) | 一种报表创建方法、装置和系统 | |
CN107402927A (zh) | 一种基于图模型的企业关联关系拓扑建立方法及查询方法 | |
US20040158562A1 (en) | Data quality system | |
JP5410514B2 (ja) | X500データモデルをリレーショナル・データベースにマッピングするための方法 | |
CN105162627B (zh) | 发现与呈现网络应用访问信息的方法和系统 | |
CN107786355A (zh) | 一种智慧城市信息共享的方法和装置 | |
CN111813956A (zh) | 知识图谱构建方法、装置、信息穿透方法和系统 | |
CN112559704A (zh) | 一种用户自定义配置的知识图谱生成工具 | |
CN105095369A (zh) | 网址匹配方法及装置 | |
CN106796607A (zh) | 用于基于模型的搜索及网络数据检索的系统和方法 | |
CN115858513A (zh) | 数据治理方法、装置、计算机设备和存储介质 | |
CN106168949B (zh) | 数据库拆分的方法及装置 | |
CN110413708A (zh) | 一种面向业务术语的数据分析系统 | |
CN110825919B (zh) | Id数据处理方法和装置 | |
US20100161671A1 (en) | System and method for generating hierarchical categories from collection of related terms | |
CN113495945A (zh) | 一种文本搜索方法、装置及存储介质 | |
Christen et al. | A probabilistic deduplication, record linkage and geocoding system | |
JP3838857B2 (ja) | 辞書装置 | |
KR100327722B1 (ko) | 지식관리시스템의지식체계등록및검색방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190625 |