CN112182312A - 一种机构名称匹配方法、装置、电子设备及可读存储介质 - Google Patents
一种机构名称匹配方法、装置、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN112182312A CN112182312A CN202011009912.7A CN202011009912A CN112182312A CN 112182312 A CN112182312 A CN 112182312A CN 202011009912 A CN202011009912 A CN 202011009912A CN 112182312 A CN112182312 A CN 112182312A
- Authority
- CN
- China
- Prior art keywords
- name
- organization
- knowledge base
- target
- retrieval
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/027—Frames
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及计算机数据处理技术领域,具体涉及一种机构名称匹配方法、装置、电子设备及计算机可读存储介质。所述方法包括接收用户输入的机构名称检索式;根据所述检索式,在预存的目标组织机构名称知识库中进行检索;其中所述目标组织中至少包括一个机构名称;输出检索结果,其中所述检索结果包括根据检索词为用户匹配标准机构名称集合,其中所述标准机构名称集合至少包括一个标准机构名称。本申请提供的机构名称匹配方案,实现了将机构名称的标准匹配,可以将多个历史名称不同但机构实质相同的机构实现机构名称的更新和统一,提高了机构名称匹配的准确性。
Description
技术领域
本发明涉及计算机数据处理技术领域,具体涉及一种机构名称匹配方法、装置、电子设备及可读存储介质。
背景技术
大型机构的组织架构和机构变化频繁,以政府为例,全国,省,市,县都有自己的系统,跨系统交互时,都涉及机构的匹配映射,这种映射目前通常都依赖人工维护,人力成本高,准确性难以保证。机构调整涉及新增,拆分,合并,撤销,变更管辖机构,变更机构名称等,新老机构名称并存需要判断不同表示的机构名称是否实质是同一机构,不同系统的命名也不同,一个系统下的机构的名称也可能有多个叫法,上下级机构间也存在一对多,多对一情况,如何根据检索信息匹配出满足用户需求的机构,或对名称不一致但实质机构或实体相同的名称进行分析归类以匹配出最新的标准机构名称,对于一个大型组织展开对组织内部机构的管理来说十分重要,而且对于开展一些情报分析业务或业务办理确定机构也很重要,但是目前的名称匹配大都是利用常规的关键词识别等自然语言处理技术,在处理过程中因为缺少对组织架构形成历史和逻辑的判断和智能分析,而无法解决上述提到的问题。
发明内容
本申请的目的旨在至少能解决上述的技术缺陷之一。本申请所采用的用户技术方案如下:
第一方面,本申请实施例公开了一种机构名称匹配方法,所述方法包括:
接收用户输入的机构名称检索式;
根据所述检索式,在预存的目标组织机构名称知识库中进行检索;其中所述目标组织中至少包括一个机构名称;
输出检索结果,其中所述检索结果包括根据检索词为用户匹配标准机构名称集合,其中所述标准机构名称集合至少包括一个标准机构名称。
可选地,所述预存的机构名称知识库包括:
根据所述目标组织的基本信息和知识库构建规则,构建目标组织的机构名称知识库;
将所述构建的机构名称知识库预存于终端本地,或,云服务器平台。
可选地,根据所述目标组织的基本信息和知识库构建规则,构建目标组织的机构名称知识库包括:
获取目标组织的组织机构框架图信息;
为每一个机构配置一个唯一的ID信息;
获取每一个机构的历史机构名称和当前机构名称;
建立每一个机构的历史机构名称与该机构的ID信息/当前机构名称的映射关系;
根据所述映射关系和知识库构建规则,构建所述目标组织的标准机构名称知识库。
可选地,所述根据所述目标组织的基本信息和知识库构建规则,构建目标组织的机构名称知识库还包括:
根据所述目标组织的组织机构框架图信息;
提取每一个机构的上下级关联关系;
根据所述提取的关联关系、建立的映射关系和知识库构建规则,构建所述目标组织的标准机构名称知识库。
可选地,所述机构名称检索式包括:机构名称检索要素和检索逻辑运算符;
其中所述机构名称检索要素包括但不限于:地域要素、职能要素、职级要素、业务要素、历史名称要素。
可选地,所述在预存的目标组织机构名称知识库中进行检索包括:
基于自然语言处理技术在预存的目标组织机构名称知识库中进行检索。
可选地,所述基于自然语言处理技术在预存的目标组织机构名称知识库中进行检索包括:
利用以下至少一种算法进行检索:逐词遍历法、最大正向匹配法、逆向最大匹配法、最少切分法、双向匹配法。
可选地,所述方法还包括:
接收用户指令,对所述检索结果进行修正。
可选地,所述输出检索结果包括:
当输出的匹配标准机构名称集合中包括至少两个标准机构名称;
则按照预设排序规则显示所述至少两个标准机构名称。
可选地,所述方法还包括:
接收用户对所述检索结果中每一个标准机构名称的操作指令,显示所述标准机构的上下级关联机构。
另一方面本申请实施例提供了一种机构名称匹配装置,所述装置包括:接口模块和检索模块,其中,
所述接口模块,用于接收用户输入的机构名称检索式;
所述检索模块,用于根据所述检索式,在预存的目标组织机构名称知识库中进行检索;其中所述目标组织中至少包括一个机构名称;
所述接口模块,还用于输出检索结果,其中所述检索结果包括根据检索词为用户匹配标准机构名称集合,其中所述标准机构名称集合至少包括一个标准机构名称。
可选地,所述装置还包括存储模块和构建模块,其中,
所述存储模块用于存储目标组织机构名称知识库;
所述构建模块用于根据所述目标组织的基本信息和知识库构建规则,构建目标组织的机构名称知识库。
可选地,所述构建模块还包括接口单元、配置单元、映射单元和构建单元,其中,
所述接口单元,用于获取目标组织的组织机构框架图信息;
所述配置单元,用于为每一个机构配置一个唯一的ID信息;
所述接口单元,用于获取每一个机构的历史机构名称和当前机构名称;
所述映射单元,用于建立每一个机构的历史机构名称与该机构的ID信息/当前机构名称的映射关系;
所述构建单元,用于根据所述映射关系和知识库构建规则,构建所述目标组织的标准机构名称知识库。
第三方面,本申请实施例提供了一种电子设备,包括处理器和存储器;
所述存储器,用于存储操作指令;
所述处理器,用于通过调用所述操作指令,执行上述任一实施例中所述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一实施例所述的方法。
本申请实施例提供的机构名称匹配方案,在构建机构名称知识库中为每一个机构配置专属的ID信息,将该机构所有的历史名称都关联映射至该ID信息,并在知识库中维护了每一个机构的上下级关联机构。基于构架的机构名称知识库,再利用自然语言处理技术进行检索,实现了将机构名称的标准匹配,本申请实施例提供的技术方案带来的有益效果是可以将多个历史名称不同但机构实质相同的机构实现机构名称的更新和统一;而且可以允许用户根据实际情况的判断对匹配的机构名称进行修正,以进一步完善构架的机构名称知识库,以正向循环的方式提高了机构名称匹配的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1为本申请实施例提供的一种机构名称匹配方法的流程示意图;
图2为本申请实施例提供的一种机构名称匹配装置的结构示意图;
图3为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式,其中的“第一”“第二”等只是为了介绍清楚方案而进行的对象区分定义,并不对对象本身进行限制,当然“第一”和“第二”限定的对象可能是同一个终端、设备和用户等,也可能是同一种终端、设备和用户。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
此外应理解,本申请实施例中“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A、B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一(项)个”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a、b或c中的至少一项(个),可以表示:a,b,c,a和b,a和c,b和c,或a、b和c,其中a、b、c可以是单个,也可以是多个。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
目前现有技术中的机构名称匹配方案如背景技术中介绍的存在的无法判断两个机构名称是否同一个机构问题外而且无法解决上下级机构的关联关系问题;对于映射不上的机构的异常没有对应的处理解决措施,基于此本申请
为了更清楚地介绍本申请的技术方案,以下介绍一些下述实施例可能涉及到的概念、术语或装置,以帮助理解本申请公开的机构名称匹配方案:
NLP(Natural Language Processing)是人工智能(AI)的一个子领域。统计自然语言处理运用了推测学、机率、统计的方法来解决上述,尤其是针对容易高度模糊的长串句子,当套用实际文法进行分析产生出成千上万笔可能性时所引发之难题。处理这些高度模糊句子所采用消歧的方法通常运用到语料库以及马可夫模型(Markov models)。统计自然语言处理的技术主要由同样自人工智能下与学习行为相关的子领域:机器学习及资料采掘所演进而成。
图1示出了本申请实施例提供的一种机构名称匹配的流程示意图,如图1所示,该方法主要可以包括:
S101、接收用户输入的机构名称检索式;
在本申请可选实施例中,所述机构名称检索式包括:机构名称检索要素和检索逻辑运算符;
其中所述机构名称检索要素包括但不限于:地域要素、职能要素、职级要素、业务要素、历史名称要素。例如位于吉林省的用户需要办理一项财政退税业务,但是不知道具体去哪个机构什么级别的机构去办理,那么用户可以根据业务信息提取自己能确定的机构检索要素构成检索式,检索式示例:吉林and(省or市)and财政and退税。
S102、根据所述检索式,在预存的目标组织机构名称知识库中进行检索;其中所述目标组织中至少包括一个机构名称;
S103、输出检索结果,其中所述检索结果包括根据检索词为用户匹配标准机构名称集合,其中所述标准机构名称集合至少包括一个标准机构名称。
在本申请可选实施例中,所述预存的机构名称知识库包括:根据所述目标组织的基本信息和知识库构建规则,构建目标组织的机构名称知识库;将所述构建的机构名称知识库预存于终端本地,或,云服务器平台。
在进一步可选实施例中,当所述构建的目标组织的机构名称知识库存储于云服务器平台,那么所述方法还包括,将S101步骤中接收的机构名称检索式发送至云服务器平台,在云服务器平台端完成步骤S102后,云服务器平台将所述检索结果再发送至终端。
在本申请可选实施例中,根据所述目标组织的基本信息和知识库构建规则,构建目标组织的机构名称知识库包括:
步骤1、获取目标组织的组织机构框架图信息;
步骤2、为每一个机构配置一个唯一的ID信息;
步骤3、获取每一个机构的历史机构名称和当前机构名称;对于历史名称只需要给出历史名称或当前名称的关键词即可,实现方式为设置机构的关键字(如公安,卫生,环境等)词向量,标识该关键字与机构间的近义程度。
可选步骤4、建立每一个机构的历史机构名称与该机构的ID信息/当前机构名称的映射关系;例如,一个机构当前名称为A,则为所述机构配置ID信息(ID号码:001),历史名称B、C,则在机构名称知识库中将所述B和C均映射至A(ID号码:001);那么当用户输入B或C,或B和C名称中的关键词时,输出的标准机构名称会自动为A(ID号码:001)。
可选步骤5、根据所述映射关系和知识库构建规则,构建所述目标组织的标准机构名称知识库。
在本申请可选的进一步地实施例中,所述根据所述目标组织的基本信息和知识库构建规则,构建目标组织的机构名称知识库还包括:
可选步骤4、根据所述目标组织的组织机构框架图信息;提取每一个机构的上下级关联关系;
可选步骤5、根据所述提取的关联关系、建立的映射关系和知识库构建规则,构建所述目标组织的标准机构名称知识库。
在本申请可选实施例中,所述在预存的目标组织机构名称知识库中进行检索包括:
基于自然语言处理技术在预存的目标组织机构名称知识库中进行检索。
在本申请可选实施例中,所述基于自然语言处理技术在预存的目标组织机构名称知识库中进行检索包括:
利用以下至少一种算法进行检索:逐词遍历法、最大正向匹配法、逆向最大匹配法、最少切分法、双向匹配法。以下以政府机构为例对具体实现过程说明示例如下:
(1)构建政府机构名称知识库;其中可选地,在构建过程中可将机构名称的地域要素以管辖范围大小和部门按上下级排序,同级按字段长短排序,地域要素可从政府官方网站获取。
(2)输入机构名称检索式,在机构名称知识库中进行检索。示例性地,采用逐词遍历法进行匹配检索过程为:将检索式中的检索要素切分为字符串,如“A省and B市and C区and D部”,可以匹配出A省、B市、C区、D部,前面3个是地区,最后一个是部门。
(3)输出检索结果,即匹配的标准机构名称;例如上述检索结果为A省B市C区D+S部(标准机构名称,或当前最新的机构名称),其中S就是用于补足或修正输入的检索要素的修正量。
在本申请可选实施例中,所述方法还包括:接收用户指令,对所述检索结果进行修正。在可选实施例中,如果检索结果是空集,即没有匹配出任何合适的机构名称,则将所述检索式记录并发送机构名称知识库构建者或维护管理者以提示更新机构表和近义词表来完善构建的机构名称知识库,同时提示用户修改检索要素。
在本申请可选实施例中,所述输出检索结果包括:当输出的匹配标准机构名称集合中包括至少两个标准机构名称;则按照预设排序规则显示所述至少两个标准机构名称,其中所述预设排序规则为检索结果与检索要素的相关性来确定的相关度或相似度来排序,例如“卫生”,与卫生局相关度高,与环卫所的相关度低一些,“应急”与应急管理局相关度高,与消防应急救援队低一些,“吉林”可能是吉林省,也可能是吉林市,但通常省更频繁一些,所以吉林省相关度高点,吉林市相关度低些。
在本申请可选实施例中,所述方法还包括:
接收用户对所述检索结果中每一个标准机构名称的操作指令,显示所述标准机构的上下级关联机构,其中显示方式可以是折叠下拉显示,也可以是以透明置于上层的悬浮框的方式进行显示。
基于图1所示的机构名称匹配方法,另一方面本申请实施例提供了一种机构名称匹配装置,如图2所示,装置可以包括:201接口模块和202检索模块,其中,
所述201接口模块,用于接收用户输入的机构名称检索式;
所述202检索模块,用于根据所述检索式,在预存的目标组织机构名称知识库中进行检索;其中所述目标组织中至少包括一个机构名称;
所述201接口模块,还用于输出检索结果,其中所述检索结果包括根据检索词为用户匹配标准机构名称集合,其中所述标准机构名称集合至少包括一个标准机构名称。
可选地,所述装置还包括203存储模块和204构建模块,其中,
所述203存储模块用于存储目标组织机构名称知识库;
所述204构建模块用于根据所述目标组织的基本信息和知识库构建规则,构建目标组织的机构名称知识库。
可选地,所述构建模块还包括接口单元、配置单元、映射单元和构建单元,其中,
所述接口单元,用于获取目标组织的组织机构框架图信息;
所述配置单元,用于为每一个机构配置一个唯一的ID信息;
所述接口单元,用于获取每一个机构的历史机构名称和当前机构名称;
所述映射单元,用于建立每一个机构的历史机构名称与该机构的ID信息/当前机构名称的映射关系;
所述构建单元,用于根据所述映射关系和知识库构建规则,构建所述目标组织的标准机构名称知识库。
可以理解的是,本实施例中的机构名称匹配装置的上述各组成设备具有实现图1中所示的实施例中的方法相应步骤的功能。该功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块或装置。上述模块和装置可以是软件和/或硬件,上述各模块和装置可以单独实现,也可以多个模块和装置集成实现。对于上述各模块和装置的功能描述具体可以参见图1中所示实施例中的方法的对应描述,因此,其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果,此处不再赘述。
可以理解的是,本发明实施例示意的结构并不构成对机构名称匹配装置的具体结构的具体限定。在本申请另一些实施例中,机构名称匹配装置可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
本申请实施例提供了一种电子设备,包括处理器和存储器;
存储器,用于存储操作指令;
处理器,用于通过调用操作指令,执行本申请任一实施方式中所提供的机构名称匹配方法。
作为一个示例,图3示出了本申请实施例所适用的一种电子设备的结构示意图,如图3所示,该电子设备2000包括:处理器2001和存储器2003。其中,处理器2001和存储器2003相连,如通过总线2002相连。可选的,电子设备2000还可以包括收发器2004。需要说明的是,实际应用中收发器2004不限于一个。可以理解的是,本发明实施例示意的结构并不构成对电子设备2000的具体结构的具体限定。在本申请另一些实施例中,电子设备2000可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实。可选地,电子设备还可以包括显示屏2005,用于显示图像,或需要时接收用户的操作指令。
其中,处理器2001应用于本申请实施例中,用于实现上述方法实施例所示的方法。收发器2004可以包括接收机和发射机,收发器2004应用于本申请实施例中,用于执行时实现本申请实施例的电子设备与其他设备通信的功能。
处理器2001可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application SpecificIntegrated Circuit,专用集成电路),FPGA(Field Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器2001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
处理器2001也可以包括一个或多个处理单元,例如:处理器2001可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphicsprocessingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,存储器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(Neural-network Processing Unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。其中,控制器可以是电子设备2000的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。处理器2001中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器2001中的存储器为高速缓冲存储器。该存储器可以保存处理器2001刚用过或循环使用的指令或数据。如果处理器2001需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器2001的等待时间,因而提高了系统的效率。
处理器2001可以运行本申请实施例提供的机构名称匹配方法,以便于降低用户的操作复杂度、提高终端设备的智能化程度,提升用户的体验。处理器2001可以包括不同的器件,比如集成CPU和GPU时,CPU和GPU可以配合执行本申请实施例提供的机构名称匹配方法,比如机构名称匹配方法中部分算法由CPU执行,另一部分算法由GPU执行,以得到较快的处理效率。
总线2002可包括一通路,在上述组件之间传送信息。总线2002可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。总线2002可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器2003可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact DiscRead Only Memory,只读光盘),也可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flashstorage,UFS),或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
可选的,存储器2003用于存储执行本申请方案的应用程序代码,并由处理器2001来控制执行。处理器2001用于执行存储器2003中存储的应用程序代码,以实现本申请任一实施方式中所提供的机构名称匹配方法。
存储器2003可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。处理器2001通过运行存储在存储器2003的指令,从而执行电子设备2000的各种功能应用以及数据处理。存储器2003可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,应用程序的代码等。存储数据区可存储电子设备2000使用过程中所创建的数据(比如相机应用采集的图像、视频等)等。
存储器2003还可以存储本申请实施例提供的机构名称匹配方法对应的一个或多个计算机程序。该一个或多个计算机程序被存储在上述存储器2003中并被配置为被该一个或多个处理器2001执行,该一个或多个计算机程序包括指令,上述指令可以用于执行上述相应实施例中的各个步骤。
当然,本申请实施例提供的机构名称匹配方法的代码还可以存储在外部存储器中。这种情况下,处理器2001可以通过外部存储器接口运行存储在外部存储器中的机构名称匹配方法的代码,处理器2001可以控制运行机构名称匹配流程。
显示屏2005包括显示面板。显示面板可以采用液晶显示屏(liquid crystaldisplay,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode的,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。在一些实施例中,电子设备2000可以包括1个或N个显示屏2005,N为大于1的正整数。显示屏2005可用于显示由用户输入的信息或提供给用户的信息以及各种图形用户界面(graphical userinterface,GUI)。例如,显示屏2005可以显示照片、视频、网页、或者文件等。
本申请实施例提供的电子设备,适用于上述方法任一实施例,因此,其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果,此处不再赘述。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现上述方法实施例所示的机构名称匹配方法。
本申请实施例提供的计算机可读存储介质,适用于上述方法任一实施例,因此,其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果,此处不再赘述。
本申请实施例还提供了一种计算机程序产品,当该计算机程序产品在计算机上运行时,使得计算机执行上述相关步骤,以实现上述实施例中的方法。本申请实施例提供的计算机程序产品,适用于上述方法任一实施例,因此,其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果,此处不再赘述。
本申请实施例提供的机构名称匹配方案,包括接收用户输入的机构名称检索式;根据所述检索式,在预存的目标组织机构名称知识库中进行检索;其中所述目标组织中至少包括一个机构名称;输出检索结果,其中所述检索结果包括根据检索词为用户匹配标准机构名称集合,其中所述标准机构名称集合至少包括一个标准机构名称。本申请实施例提供的机构名称匹配方案,在构建机构名称知识库中为每一个机构配置专属的ID信息,将该机构所有的历史名称都关联映射至该ID信息,并在知识库中维护了每一个机构的上下级关联机构。基于构架的机构名称知识库,再利用自然语言处理技术进行检索,实现了将机构名称的标准匹配,可以将多个历史名称不同但机构实质相同的机构实现机构名称的更新和统一;而且可以允许用户根据实际情况的判断对匹配的机构名称进行修正,以进一步完善构架的机构名称知识库,以正向循环的方式提高了机构名称匹配的准确性。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其他的方式实现。例如,以上所描述的装置实施例仅是示意性的,例如,模块或单元的划分,仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以丢弃,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其他的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上内容,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,还可以做出若干改进和润饰,这些变化、替换、改进和润饰也应视为都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (15)
1.一种机构名称匹配方法,其特征在于,所述方法包括:
接收用户输入的机构名称检索式;
根据所述检索式,在预存的目标组织机构名称知识库中进行检索;其中所述目标组织中至少包括一个机构名称;
输出检索结果,其中所述检索结果包括根据检索词为用户匹配标准机构名称集合,其中所述标准机构名称集合至少包括一个标准机构名称。
2.根据权利要求1所述的机构名称匹配方法,其特征在于,所述预存的机构名称知识库包括:
根据所述目标组织的基本信息和知识库构建规则,构建目标组织的机构名称知识库;
将所述构建的机构名称知识库预存于终端本地,或,云服务器平台。
3.根据权利要求2所述的机构名称匹配方法,其特征在于,根据所述目标组织的基本信息和知识库构建规则,构建目标组织的机构名称知识库包括:
获取目标组织的组织机构框架图信息;
为每一个机构配置一个唯一的ID信息;
获取每一个机构的历史机构名称和当前机构名称;
建立每一个机构的历史机构名称与该机构的ID信息/当前机构名称的映射关系;
根据所述映射关系和知识库构建规则,构建所述目标组织的标准机构名称知识库。
4.根据权利要求3所述的机构名称匹配方法,其特征在于,所述根据所述目标组织的基本信息和知识库构建规则,构建目标组织的机构名称知识库还包括:
根据所述目标组织的组织机构框架图信息;
提取每一个机构的上下级关联关系;
根据所述提取的关联关系、建立的映射关系和知识库构建规则,构建所述目标组织的标准机构名称知识库。
5.根据权利要求1或4所述的机构名称匹配方法,其特征在于,所述机构名称检索式包括:机构名称检索要素和检索逻辑运算符;
其中所述机构名称检索要素包括但不限于:地域要素、职能要素、职级要素、业务要素、历史名称要素。
6.根据权利要求5所述的机构名称匹配方法,其特征在于,所述在预存的目标组织机构名称知识库中进行检索包括:
基于自然语言处理技术在预存的目标组织机构名称知识库中进行检索。
7.根据权利要求6所述的机构名称匹配方法,其特征在于,所述基于自然语言处理技术在预存的目标组织机构名称知识库中进行检索包括:
利用以下至少一种算法进行检索:逐词遍历法、最大正向匹配法、逆向最大匹配法、最少切分法、双向匹配法。
8.根据权利要求7所述的机构名称匹配方法,其特征在于,所述方法还包括:
接收用户指令,对所述检索结果进行修正。
9.根据权利要求8所述的机构名称匹配方案,其特征在于,所述输出检索结果包括:
当输出的匹配标准机构名称集合中包括至少两个标准机构名称;
则按照预设排序规则显示所述至少两个标准机构名称。
10.根据权利要求9所述的机构名称匹配方法,其特征在于,所述方法还包括:
接收用户对所述检索结果中每一个标准机构名称的操作指令,显示所述标准机构的上下级关联机构。
11.一种机构名称匹配装置,其特征在于,所述装置包括:接口模块和检索模块,其中,
所述接口模块,用于接收用户输入的机构名称检索式;
所述检索模块,用于根据所述检索式,在预存的目标组织机构名称知识库中进行检索;其中所述目标组织中至少包括一个机构名称;
所述接口模块,还用于输出检索结果,其中所述检索结果包括根据检索词为用户匹配标准机构名称集合,其中所述标准机构名称集合至少包括一个标准机构名称。
12.根据权利要求11所述的机构名称匹配装置,其特征在于,所述装置还包括存储模块和构建模块,其中,
所述存储模块用于存储目标组织机构名称知识库;
所述构建模块用于根据所述目标组织的基本信息和知识库构建规则,构建目标组织的机构名称知识库。
13.根据权利要求12所述的机构名称匹配装置,其特征在于,所述构建模块还包括接口单元、配置单元、映射单元和构建单元,其中,
所述接口单元,用于获取目标组织的组织机构框架图信息;
所述配置单元,用于为每一个机构配置一个唯一的ID信息;
所述接口单元,用于获取每一个机构的历史机构名称和当前机构名称;
所述映射单元,用于建立每一个机构的历史机构名称与该机构的ID信息/当前机构名称的映射关系;
所述构建单元,用于根据所述映射关系和知识库构建规则,构建所述目标组织的标准机构名称知识库。
14.一种电子设备,其特征在于,包括处理器和存储器;
所述存储器,用于存储操作指令;
所述处理器,用于通过调用所述操作指令,执行权利要求1-10中任一项所述的方法。
15.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-10中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011009912.7A CN112182312A (zh) | 2020-09-23 | 2020-09-23 | 一种机构名称匹配方法、装置、电子设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011009912.7A CN112182312A (zh) | 2020-09-23 | 2020-09-23 | 一种机构名称匹配方法、装置、电子设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112182312A true CN112182312A (zh) | 2021-01-05 |
Family
ID=73955436
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011009912.7A Pending CN112182312A (zh) | 2020-09-23 | 2020-09-23 | 一种机构名称匹配方法、装置、电子设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112182312A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114547404A (zh) * | 2022-01-10 | 2022-05-27 | 普瑞纯证医疗科技(苏州)有限公司 | 一种大数据平台 |
CN115774793A (zh) * | 2023-01-29 | 2023-03-10 | 上海蜜度信息技术有限公司 | 机构时效性的检测方法、系统、电子设备及存储介质 |
CN116258138A (zh) * | 2023-03-15 | 2023-06-13 | 北京百度网讯科技有限公司 | 知识库构建方法、实体链接方法、装置及设备 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002197114A (ja) * | 2000-12-27 | 2002-07-12 | Beacon Information Technology:Kk | データベース管理システム、顧客管理システム、記録媒体 |
CN101930435A (zh) * | 2009-10-27 | 2010-12-29 | 深圳市北科瑞声科技有限公司 | 机构名称检索方法及系统 |
CN104281570A (zh) * | 2013-07-01 | 2015-01-14 | 富士通株式会社 | 信息处理方法和装置以及机构名规范化方法和设备 |
CN105975623A (zh) * | 2016-05-30 | 2016-09-28 | 中国能源建设集团湖南火电建设有限公司 | 一种通过查询表达式获取组织机构信息的方法及系统 |
CN107967300A (zh) * | 2017-11-07 | 2018-04-27 | 平安科技(深圳)有限公司 | 机构名称的检索方法、装置、设备及存储介质 |
US20180218066A1 (en) * | 2017-01-31 | 2018-08-02 | Unifi Software, Inc. | Method and system for information retreival |
CN109933708A (zh) * | 2019-01-25 | 2019-06-25 | 平安科技(深圳)有限公司 | 信息检索方法、装置、存储介质及计算机设备 |
CN110134893A (zh) * | 2019-04-03 | 2019-08-16 | 广州朗国电子科技有限公司 | 一种基于云端信息发布系统的多机构检索显示方法及装置 |
CN111144121A (zh) * | 2019-12-27 | 2020-05-12 | 北大方正集团有限公司 | 地名识别方法、装置、电子设备及可读存储介质 |
CN111694823A (zh) * | 2020-05-15 | 2020-09-22 | 平安科技(深圳)有限公司 | 机构标准化方法、装置、电子设备及存储介质 |
-
2020
- 2020-09-23 CN CN202011009912.7A patent/CN112182312A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002197114A (ja) * | 2000-12-27 | 2002-07-12 | Beacon Information Technology:Kk | データベース管理システム、顧客管理システム、記録媒体 |
CN101930435A (zh) * | 2009-10-27 | 2010-12-29 | 深圳市北科瑞声科技有限公司 | 机构名称检索方法及系统 |
CN104281570A (zh) * | 2013-07-01 | 2015-01-14 | 富士通株式会社 | 信息处理方法和装置以及机构名规范化方法和设备 |
CN105975623A (zh) * | 2016-05-30 | 2016-09-28 | 中国能源建设集团湖南火电建设有限公司 | 一种通过查询表达式获取组织机构信息的方法及系统 |
US20180218066A1 (en) * | 2017-01-31 | 2018-08-02 | Unifi Software, Inc. | Method and system for information retreival |
CN107967300A (zh) * | 2017-11-07 | 2018-04-27 | 平安科技(深圳)有限公司 | 机构名称的检索方法、装置、设备及存储介质 |
CN109933708A (zh) * | 2019-01-25 | 2019-06-25 | 平安科技(深圳)有限公司 | 信息检索方法、装置、存储介质及计算机设备 |
CN110134893A (zh) * | 2019-04-03 | 2019-08-16 | 广州朗国电子科技有限公司 | 一种基于云端信息发布系统的多机构检索显示方法及装置 |
CN111144121A (zh) * | 2019-12-27 | 2020-05-12 | 北大方正集团有限公司 | 地名识别方法、装置、电子设备及可读存储介质 |
CN111694823A (zh) * | 2020-05-15 | 2020-09-22 | 平安科技(深圳)有限公司 | 机构标准化方法、装置、电子设备及存储介质 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114547404A (zh) * | 2022-01-10 | 2022-05-27 | 普瑞纯证医疗科技(苏州)有限公司 | 一种大数据平台 |
CN115774793A (zh) * | 2023-01-29 | 2023-03-10 | 上海蜜度信息技术有限公司 | 机构时效性的检测方法、系统、电子设备及存储介质 |
CN115774793B (zh) * | 2023-01-29 | 2023-05-30 | 上海蜜度信息技术有限公司 | 机构时效性的检测方法、系统、电子设备及存储介质 |
CN116258138A (zh) * | 2023-03-15 | 2023-06-13 | 北京百度网讯科技有限公司 | 知识库构建方法、实体链接方法、装置及设备 |
CN116258138B (zh) * | 2023-03-15 | 2024-01-02 | 北京百度网讯科技有限公司 | 知识库构建方法、实体链接方法、装置及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022007823A1 (zh) | 一种文本数据处理方法及装置 | |
CN112182312A (zh) | 一种机构名称匹配方法、装置、电子设备及可读存储介质 | |
US20220253631A1 (en) | Image processing method, electronic device and storage medium | |
EP3926531A1 (en) | Method and system for visio-linguistic understanding using contextual language model reasoners | |
WO2021233031A1 (zh) | 图像处理方法、装置、设备、存储介质以及图像分割方法 | |
US20220405928A1 (en) | Predictive data analysis using image representations of categorical and scalar feature data | |
US11321370B2 (en) | Method for generating question answering robot and computer device | |
CN107690634A (zh) | 自动查询模式生成 | |
US20230057414A1 (en) | Machine learning techniques for generating string-based database mapping prediction | |
WO2023040742A1 (zh) | 文本数据的处理方法、神经网络的训练方法以及相关设备 | |
CN112612845A (zh) | 一种组织机构视图实现方法、装置、电子设备及可读存储介质 | |
US20210312173A1 (en) | Method, apparatus and device for recognizing bill and storage medium | |
JP2023543964A (ja) | 画像処理方法、画像処理装置、電子機器、記憶媒体およびコンピュータプログラム | |
CN115062617A (zh) | 基于提示学习的任务处理方法、装置、设备及介质 | |
CN112486947A (zh) | 一种知识库构建方法、装置、电子设备及可读存储介质 | |
US11881044B2 (en) | Method and apparatus for processing image, device and storage medium | |
CN113204698A (zh) | 新闻主题词生成方法、装置、设备及介质 | |
US20170116550A1 (en) | System and method for enterprise data management | |
WO2023137903A1 (zh) | 基于粗糙语义的回复语句确定方法、装置及电子设备 | |
CN112256168A (zh) | 一种手写内容电子化的方法、装置、电子设备及存储介质 | |
US20240020485A1 (en) | Systems and methods for unsupervised paraphrase mining | |
US20240144189A1 (en) | Method and system for automated masking of targeted information in resumes | |
CN113779225B (zh) | 实体链接模型的训练方法、实体链接方法及装置 | |
CN114036313B (zh) | 一种族谱展示方法、装置及电子设备 | |
CN113221578B (zh) | 疾病实体检索方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |