CN116450717B - 一种跨业务模块的数据整合方法及信息管理系统 - Google Patents
一种跨业务模块的数据整合方法及信息管理系统 Download PDFInfo
- Publication number
- CN116450717B CN116450717B CN202310283007.8A CN202310283007A CN116450717B CN 116450717 B CN116450717 B CN 116450717B CN 202310283007 A CN202310283007 A CN 202310283007A CN 116450717 B CN116450717 B CN 116450717B
- Authority
- CN
- China
- Prior art keywords
- entity
- attribute
- integrated
- name
- class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010354 integration Effects 0.000 title claims abstract description 109
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000013507 mapping Methods 0.000 claims abstract description 16
- 238000007726 management method Methods 0.000 claims description 48
- 238000004364 calculation method Methods 0.000 claims description 24
- 238000004458 analytical method Methods 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 4
- 238000011161 development Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000013068 supply chain management Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/256—Integrating or interfacing systems involving database management systems in federated or virtual databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/13—File access structures, e.g. distributed indices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/107—Computer-aided management of electronic mailing [e-mailing]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出了一种跨业务模块的数据整合方法及信息管理系统,通过构建整合实体对象以及整合映射器接口,解析类代码文件以获取实体对象或者业务对象的对象信息,建立实体对象与整合实体对象的对应关系,解析映射器接口代码文件以获取实体对象中的每一个对象属性与目标业务模块数据库中的数据表字段的对应关系,建立整合对象属性与目标业务模块数据库中的数据表字段的对应关系,在整合数据库中生成对应的业务数据表,构建用于将业务对象映射到所述业务数据表的业务数据映射器接口,通过整合映射器接口、业务数据映射器接口与目标业务模块程序对接以将目标业务模块程序产生的数据写入整合数据库,能够安全高效地实现多个业务模块的数据整合。
Description
技术领域
本发明涉及电子信息技术领域,特别涉及一种跨业务模块的数据整合方法及信息管理系统。
背景技术
随着电子信息技术以及互联网技术的发展,信息化、流程化和自动化的现代化办公模式逐步替代了传统的办公模式成为了主流办公模式。信息管理系统是承载现代化办公模式的主体,根据企业信息化办公需求的不同,目前市面上充斥着大量的通用或专用的信息管理系统。在信息化办公刚刚起步的阶段,企业对信息化办公的需求较为简单,因此大多采用一些集成了简单的人事、行政、财务和客户管理的通用的OA(Office Automation,办公自动化)系统。随着企业职能和业务模块的细分,面向不同业务模块的信息管理需求越来越全面,办公自动化的专业性要求越来越强,传统的通用信息管理系统已经难适应所有的信息化办公需求,因而开始出现大量的针对具体业务模块开发的专用信息管理系统如财务管理系统、人事行政管理系统、知识产权管理系统、营销管理系统、供应链管理系统以及生产管理系统等等。面向不同业务模块的信息管理系统的开发对开发商在相关领域专业性要求远高于通用信息管理系统的开发,因而目前大多数系统开发商所开发的系统仅集中在一个或少量几个领域,所带来的后果是当一家企业在多个业务模块上都需要引入信息管理系统时,只能进行独立搭建和分别使用。在这种情况下,有些企业会在多个不同业务模块的信息管理系统的基础上开发统一的门户以及统一的登录验证模块,但这种在系统入口上进行优化的做法只是在表现形式上的整合,由于各个业务模块的信息管理系统在数据层面上相互独立,在涉及一些跨部门协作业务的功能上,不可避免地存在大量重复的数据和业务流程,不利于企业执行跨业务模块的协同和决策,也增加了企业在这些信息管理系统上进行二次开发的难度。
发明内容
本发明正是基于上述问题,提出了一种跨业务模块的数据整合方法及信息管理系统,能够安全高效地实现多个业务模块的数据整合。
有鉴于此,本发明的第一方面提出了一种跨业务模块的数据整合方法,包括:
建立用于存放整合数据的整合数据库,所述整合数据库包括使用通用数据表模板生成的多个通用数据表;
构建对应所述通用数据表的整合实体对象以及用于将所述整合实体对象映射到所述通用数据表以实现所述通用数据表读写的整合映射器接口;
获取预先配置的代码文件路径;
从所述代码文件路径指向的目录读取目标业务模块的类代码文件和映射器接口代码文件;
解析所述类代码文件以获取实体对象或者业务对象的对象信息,所述对象信息包括对象名称和对象属性;
根据所述实体对象的对象信息建立一个或多个所述实体对象与所述整合实体对象的对应关系;
解析所述映射器接口代码文件以获取所述实体对象中的每一个对象属性与目标业务模块数据库中的数据表字段的对应关系;
建立所述整合实体对象的整合对象属性与所述目标业务模块数据库中的数据表字段的对应关系;
根据所述业务对象的对象信息在所述整合数据库中生成对应的业务数据表;
构建用于将所述业务对象映射到所述业务数据表以实现所述业务数据表读写的业务数据映射器接口;
通过所述整合映射器接口、所述业务数据映射器接口与所述目标业务模块程序对接以将所述目标业务模块程序产生的数据写入所述整合数据库。
进一步的,在上述的数据整合方法中,解析所述类代码文件以获取实体对象或者业务对象的对象信息的步骤包括:
根据所述类代码文件的扩展名识别所述类代码的程序语言类型;
根据所述程序语言类型的类代码文件结构从所述类代码文件中提取对象名称和对象属性;
根据所述类对象的对象名称识别所述类代码文件包含的类对象的对象类型,所述对象类型包括实体对象和业务对象。
进一步的,在上述的数据整合方法中,根据所述类对象的对象名称识别所述类代码文件包含的类对象的对象类型的步骤具体包括:
获取预先配置的实体对象名称清单;
将所述类对象的对象名称与所述实体对象名称清单中的每个名称进行语义匹配;
当所述类对象的对象名称与所述实体对象清单中的一个或一个以上的名称的语义相匹配时,将所述对象名称对应的类对象确定为实体对象;
否则,将所述对象名称对应的类对象确定为业务对象。
进一步的,在上述的数据整合方法中,在将所述类对象的对象名称与所述实体对象名称清单中的每个名称进行语义匹配的步骤之前,还包括:
将所述类对象的对象名称输入预设的英文单词词典中进行单词匹配;
当所述类对象的对象名称不是独立完整的英文单词时,将所述类对象的对象名称输入预设的英文单词缩写词典中进行缩写单词匹配以识别所述对象名称是否为一个缩写英文单词或多个缩写英文单词的组合,或者完整英文单词与缩写英文单词的组合;
当所述类对象的对象名称为独立完整的英文单词、缩写英文单词、多个缩写英文单词的组合或者完整英文单词与缩写英文单词的组合时,执行将所述类对象的对象名称与所述实体对象名称清单中的每个名称进行语义匹配的步骤。
进一步的,在上述的数据整合方法中,在将所述类对象的对象名称与所述实体对象名称清单中的每个名称进行语义匹配的步骤之前,还包括:
当所述类对象的对象名称不是独立完整的英文单词、缩写英文单词、多个缩写英文单词的组合或者完整英文单词与缩写英文单词的组合中的任一种时,获取所述整合实体对象的整合对象属性;
将所述类对象的对象属性与所述整合对象属性进行语义匹配;
当一个类对象的多个对象属性与任一所述整合实体对象中的多个整合对象属性的语义相匹配时,将所述类对象确定为实体对象,并建立所述实体对象与所述整合实体对象的对应关系;
否则,将所述类对象确定为业务对象。
进一步的,在上述的数据整合方法中,将所述类对象的对象名称与所述实体对象名称清单中的每个名称进行语义匹配或者将所述类对象的对象属性与所述整合对象属性进行语义匹配的步骤具体包括:
获取需要执行语义匹配的类对象的对象名称与实体对象名称清单中的名称,或者所述类对象的对象属性与所述整合对象属性对应的完整英文单词或者完整英文单词的组合;
当需要执行语义匹配的对象名称与实体对象名称清单中的名称,或者所述类对象的对象属性与所述整合对象属性均对应一个完整英文单词或者一个缩写英文单词时,将其对应的两个完整英文单词输入语义相似度计算模型中计算语义相似度;
当两个完整英文单词的语义相似度大于预设的第一阈值时,确定所述完整英文单词对应的所述类对象的对象名称与所述实体对象清单中的名称的语义相匹配,或者确定所述完整英文单词对应的所述类对象的对象属性与所述整合对象属性的语义相匹配。
进一步的,在上述的数据整合方法中,根据所述实体对象的对象信息建立一个或多个所述实体对象与所述整合实体对象的对应关系的步骤具体包括:
将所述实体对象的对象名称与所述整合实体对象的整合对象名称输入语义相似度计算模型中计算语义相似度;
当所述实体对象的对象名称与所述整合实体对象的整合对象名称的语义相似度大于预设的第二阈值时,将所述实体对象的对象属性与所述整合实体对象的整合对象属性输入语义相似度计算模型中计算语义相似度;
获取所述实体对象与所述整合实体对象之间语义相似度大于预设的第三阈值的对象属性的数量;
当所述实体对象与所述整合实体对象之间语义相似度大于预设的第三阈值的对象属性的数量大于预设的第四阈值时,建立所述实体对象与所述整合实体对象之间的对应关系。
进一步的,在上述的数据整合方法中,在根据所述实体对象的对象信息建立一个或多个所述实体对象与所述整合实体对象的对应关系的步骤之后,还包括:
根据所述实体对象的对象属性与所述整合实体对象的整合对象属性的语义相似度建立所述实体对象的对象属性与所述整合实体对象的整合对象属性的关联关系;
当所述实体对象存在一个或一个以上的对象属性未与任一整合实体对象的整合对象属性建立关联关系时,将未与整合对象属性建立关联关系的对象属性以及所述实体对象的对象名称与待定属性列表中的待定属性及其对应的对象名称进行语义匹配,所述待定属性为其它业务模块程序的类代码文件中被确定为实体对象的类对象的与整合对象属性建立关联关系的对象属性,所述待定属性列表包括所述待定属性以及所述待定属性对应的对象名称;
当所述未与整合对象属性建立关联关系的对象属性与所述待定属性列表中预设数量的待定属性的语义相匹配,并且所述未与整合对象属性建立关联关系的对象属性对应的对象名称与其相匹配的待定属性对应的对象名称的语义相匹配时,将所述未与整合对象属性建立关联关系的对象属性添加到所述整合对象;
否则,将所述未与整合对象属性建立关联关系的对象属性以及所述实体对象的对象名称写入所述待定属性列表。
进一步的,在上述的数据整合方法中,在将所述未与整合对象属性建立关联关系的对象属性添加到所述整合对象的步骤之后,还包括:
在所述通用数据表中添加对应所述未与整合对象属性建立关联关系的对象属性的数据字段;
在所述整合映射器接口中添加读写对应所述未与整合对象属性建立关联关系的对象属性的数据字段的方法函数。
本发明的第二方面提出了一种信息管理系统,包括:
整合数据库建立模块,用于建立用于存放整合数据的整合数据库,所述整合数据库包括使用通用数据表模板生成的多个通用数据表;
整合对象构建模块,用于构建对应所述通用数据表的整合实体对象以及用于将所述整合实体对象映射到所述通用数据表以实现所述通用数据表读写的整合映射器接口;
代码路径获取模块,用于获取预先配置的代码文件路径;
代码文件读取模块,用于从所述代码文件路径指向的目录读取目标业务模块的类代码文件和映射器接口代码文件;
对象代码解析模块,用于解析所述类代码文件以获取实体对象或者业务对象的对象信息,所述对象信息包括对象名称和对象属性;
对象关系建立模块,用于根据所述实体对象的对象信息建立一个或多个所述实体对象与所述整合实体对象的对应关系;
接口代码解析模块,用于解析所述映射器接口代码文件以获取所述实体对象中的每一个对象属性与目标业务模块数据库中的数据表字段的对应关系;
属性关系建立模块,用于建立所述整合实体对象的整合对象属性与所述目标业务模块数据库中的数据表字段的对应关系;
数据表生成模块,用于根据所述业务对象的对象信息在所述整合数据库中生成对应的业务数据表;
业务数据接口构建模块,用于构建用于将所述业务对象映射到所述业务数据表以实现所述业务数据表读写的业务数据映射器接口;
数据写入模块,用于通过所述整合映射器接口、所述业务数据映射器接口与所述目标业务模块程序对接以将所述目标业务模块程序产生的数据写入所述整合数据库。
进一步的,在上述的信息管理系统中,所述对象代码解析模块包括:
语言类型识别模块,用于根据所述类代码文件的扩展名识别所述类代码的程序语言类型;
对象信息提取模块,用于根据所述程序语言类型的类代码文件结构从所述类代码文件中提取对象名称和对象属性;
对象类型识别模块,用于根据所述类对象的对象名称识别所述类代码文件包含的类对象的对象类型,所述对象类型包括实体对象和业务对象。
进一步的,在上述的信息管理系统中,所述对象类型识别模块包括:
对象清单获取模块,用于获取预先配置的实体对象名称清单;
对象名称匹配模块,用于将所述类对象的对象名称与所述实体对象名称清单中的每个名称进行语义匹配;
实体对象确定模块,用于当所述类对象的对象名称与所述实体对象清单中的一个或一个以上的名称的语义相匹配时,将所述对象名称对应的类对象确定为实体对象;
业务对象确定模块,用于将所述对象名称对应的类对象确定为业务对象。
进一步的,在上述的信息管理系统中,所述对象类型识别模块还包括:
英文词典匹配模块,用于将所述类对象的对象名称输入预设的英文单词词典中进行单词匹配;
缩写词典匹配模块,用于当所述类对象的对象名称不是独立完整的英文单词时,将所述类对象的对象名称输入预设的英文单词缩写词典中进行缩写单词匹配以识别所述对象名称是否为一个缩写英文单词或多个缩写英文单词的组合,或者完整英文单词与缩写英文单词的组合;
所述对象名称匹配模块还用于当所述类对象的对象名称为独立完整的英文单词、缩写英文单词、多个缩写英文单词的组合或者完整英文单词与缩写英文单词的组合时,执行将所述类对象的对象名称与所述实体对象名称清单中的每个名称进行语义匹配的步骤。
进一步的,在上述的信息管理系统中,所述对象类型识别模块还包括:
整合属性获取模块,用于当所述类对象的对象名称不是独立完整的英文单词、缩写英文单词、多个缩写英文单词的组合或者完整英文单词与缩写英文单词的组合中的任一种时,获取所述整合实体对象的整合对象属性;
对象属性匹配模块,用于将所述类对象的对象属性与所述整合对象属性进行语义匹配;
所述实体对象确定模块还用于当一个类对象的多个对象属性与任一所述整合实体对象中的多个整合对象属性的语义相匹配时,将所述类对象确定为实体对象,并建立所述实体对象与所述整合实体对象的对应关系。
进一步的,在上述的信息管理系统中,所述对象名称匹配模块包括:
英文单词获取模块,用于获取需要执行语义匹配的类对象的对象名称与实体对象名称清单中的名称,或者所述类对象的对象属性与所述整合对象属性对应的完整英文单词或者完整英文单词的组合;
语义相似度计算模块,用于当需要执行语义匹配的对象名称与实体对象名称清单中的名称,或者所述类对象的对象属性与所述整合对象属性均对应一个完整英文单词或者一个缩写英文单词时,将其对应的两个完整英文单词输入语义相似度计算模型中计算语义相似度;
语义匹配确定模块,用于当两个完整英文单词的语义相似度大于预设的第一阈值时,确定所述完整英文单词对应的所述类对象的对象名称与所述实体对象清单中的名称的语义相匹配,或者确定所述完整英文单词对应的所述类对象的对象属性与所述整合对象属性的语义相匹配。
进一步的,在上述的信息管理系统中,所述语义相似度计算模块还用于将所述实体对象的对象名称与所述整合实体对象的整合对象名称输入语义相似度计算模型中计算语义相似度,以及当所述实体对象的对象名称与所述整合实体对象的整合对象名称的语义相似度大于预设的第二阈值时,将所述实体对象的对象属性与所述整合实体对象的整合对象属性输入语义相似度计算模型中计算语义相似度,所述对象关系建立模块包括:
属性数量获取模块,用于获取所述实体对象与所述整合实体对象之间语义相似度大于预设的第三阈值的对象属性的数量;
所述对象关系建立模块用于当所述实体对象与所述整合实体对象之间语义相似度大于预设的第三阈值的对象属性的数量大于预设的第四阈值时,建立所述实体对象与所述整合实体对象之间的对应关系。
进一步的,在上述的信息管理系统中,所述语义相似度计算模块还用于当所述实体对象存在一个或一个以上的对象属性未与任一整合实体对象的整合对象属性建立关联关系时,将未与整合对象属性建立关联关系的对象属性以及所述实体对象的对象名称与待定属性列表中的待定属性及其对应的对象名称进行语义匹配,所述待定属性为其它业务模块程序的类代码文件中被确定为实体对象的类对象的与整合对象属性建立关联关系的对象属性,所述待定属性列表包括所述待定属性以及所述待定属性对应的对象名称,所述对象关系建立模块还包括:
属性关系建立模块,用于根据所述实体对象的对象属性与所述整合实体对象的整合对象属性的语义相似度建立所述实体对象的对象属性与所述整合实体对象的整合对象属性的关联关系;
对象属性添加模块,用于当所述未与整合对象属性建立关联关系的对象属性与所述待定属性列表中预设数量的待定属性的语义相匹配,并且所述未与整合对象属性建立关联关系的对象属性对应的对象名称与其相匹配的待定属性对应的对象名称的语义相匹配时,将所述未与整合对象属性建立关联关系的对象属性添加到所述整合对象;
待定属性模块,用于将所述未与整合对象属性建立关联关系的对象属性以及所述实体对象的对象名称写入所述待定属性列表。
进一步的,在上述的信息管理系统中,所述对象关系建立模块还包括:
数据字段添加模块,用于在所述通用数据表中添加对应所述未与整合对象属性建立关联关系的对象属性的数据字段;
映射函数添加模块,用于在所述整合映射器接口中添加读写对应所述未与整合对象属性建立关联关系的对象属性的数据字段的方法函数。
本发明提出了一种跨业务模块的数据整合方法及信息管理系统,通过构建整合实体对象以及整合映射器接口,解析类代码文件以获取实体对象或者业务对象的对象信息,建立实体对象与整合实体对象的对应关系,解析映射器接口代码文件以获取实体对象中的每一个对象属性与目标业务模块数据库中的数据表字段的对应关系,建立整合对象属性与目标业务模块数据库中的数据表字段的对应关系,在整合数据库中生成对应的业务数据表,构建用于将业务对象映射到所述业务数据表的业务数据映射器接口,通过整合映射器接口、业务数据映射器接口与目标业务模块程序对接以将目标业务模块程序产生的数据写入整合数据库,能够安全高效地实现多个业务模块的数据整合。
附图说明
图1是本发明一个实施例提供的一种跨业务模块的数据整合方法的流程图;
图2是本发明一个实施例提供的一种信息管理系统的示意框图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
在本发明的描述中,术语“多个”则指两个或两个以上,除非另有明确的限定,术语“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。术语“连接”、“安装”、“固定”等均应做广义理解,例如,“连接”可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”等的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
在本说明书的描述中,术语“一个实施例”、“一些实施方式”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实例。而且,描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
下面参照附图来描述根据本发明一些实施方式提供的一种跨业务模块的数据整合方法及信息管理系统。
如图1所示,本发明的第一方面提供一种跨业务模块的数据整合方法,包括:
建立用于存放整合数据的整合数据库,所述整合数据库包括使用通用数据表模板生成的多个通用数据表;
构建对应所述通用数据表的整合实体对象以及用于将所述整合实体对象映射到所述通用数据表以实现所述通用数据表读写的整合映射器接口;
获取预先配置的代码文件路径;
从所述代码文件路径指向的目录读取目标业务模块的类代码文件和映射器接口代码文件;
解析所述类代码文件以获取实体对象或者业务对象的对象信息,所述对象信息包括对象名称和对象属性;
根据所述实体对象的对象信息建立一个或多个所述实体对象与所述整合实体对象的对应关系;
解析所述映射器接口代码文件以获取所述实体对象中的每一个对象属性与目标业务模块数据库中的数据表字段的对应关系;
建立所述整合实体对象的整合对象属性与所述目标业务模块数据库中的数据表字段的对应关系;
根据所述业务对象的对象信息在所述整合数据库中生成对应的业务数据表;
构建用于将所述业务对象映射到所述业务数据表以实现所述业务数据表读写的业务数据映射器接口;
通过所述整合映射器接口、所述业务数据映射器接口与所述目标业务模块程序对接以将所述目标业务模块程序产生的数据写入所述整合数据库。
采用上述实施方式的技术方案,业务模块系统开发商仅需提供不含业务实现逻辑的类代码文件和映射器接口代码文件,不存在泄密的问题,且类代码文件和映射器接口代码文件内容少结构单一,解析方式简单易于实现。
进一步的,在上述的数据整合方法中,所述通用数据表包括企业信息表、组织架构表、员工信息表、考勤信息表。
进一步的,在上述的数据整合方法中,所述业务数据表包括业务事件表、业务流程表、业务文件表。
进一步的,在上述的数据整合方法中,解析所述类代码文件以获取实体对象或者业务对象的对象信息的步骤包括:
根据所述类代码文件的扩展名识别所述类代码的程序语言类型;
根据所述程序语言类型的类代码文件结构从所述类代码文件中提取对象名称和对象属性;
根据所述类对象的对象名称识别所述类代码文件包含的类对象的对象类型,所述对象类型包括实体对象和业务对象。
进一步的,在上述的数据整合方法中,根据所述类对象的对象名称识别所述类代码文件包含的类对象的对象类型的步骤具体包括:
获取预先配置的实体对象名称清单;
将所述类对象的对象名称与所述实体对象名称清单中的每个名称进行语义匹配;
当所述类对象的对象名称与所述实体对象清单中的一个或一个以上的名称的语义相匹配时,将所述对象名称对应的类对象确定为实体对象;
否则,将所述对象名称对应的类对象确定为业务对象。
进一步的,在上述的数据整合方法中,在将所述类对象的对象名称与所述实体对象名称清单中的每个名称进行语义匹配的步骤之前,还包括:
将所述类对象的对象名称输入预设的英文单词词典中进行单词匹配;
当所述类对象的对象名称不是独立完整的英文单词时,将所述类对象的对象名称输入预设的英文单词缩写词典中进行缩写单词匹配以识别所述对象名称是否为一个缩写英文单词或多个缩写英文单词的组合,或者完整英文单词与缩写英文单词的组合;
当所述类对象的对象名称为独立完整的英文单词、缩写英文单词、多个缩写英文单词的组合或者完整英文单词与缩写英文单词的组合时,执行将所述类对象的对象名称与所述实体对象名称清单中的每个名称进行语义匹配的步骤。
进一步的,在上述的数据整合方法中,在将所述类对象的对象名称与所述实体对象名称清单中的每个名称进行语义匹配的步骤之前,还包括:
当所述类对象的对象名称不是独立完整的英文单词、缩写英文单词、多个缩写英文单词的组合或者完整英文单词与缩写英文单词的组合中的任一种时,获取所述整合实体对象的整合对象属性;
将所述类对象的对象属性与所述整合对象属性进行语义匹配;
当一个类对象的多个对象属性与任一所述整合实体对象中的多个整合对象属性的语义相匹配时,将所述类对象确定为实体对象,并建立所述实体对象与所述整合实体对象的对应关系;
否则,将所述类对象确定为业务对象。
进一步的,在上述的数据整合方法中,将所述类对象的对象名称与所述实体对象名称清单中的每个名称进行语义匹配或者将所述类对象的对象属性与所述整合对象属性进行语义匹配的步骤具体包括:
获取需要执行语义匹配的类对象的对象名称与实体对象名称清单中的名称,或者所述类对象的对象属性与所述整合对象属性对应的完整英文单词或者完整英文单词的组合;
当需要执行语义匹配的对象名称与实体对象名称清单中的名称,或者所述类对象的对象属性与所述整合对象属性均对应一个完整英文单词或者一个缩写英文单词时,将其对应的两个完整英文单词输入语义相似度计算模型中计算语义相似度;
当两个完整英文单词的语义相似度大于预设的第一阈值时,确定所述完整英文单词对应的所述类对象的对象名称与所述实体对象清单中的名称的语义相匹配,或者确定所述完整英文单词对应的所述类对象的对象属性与所述整合对象属性的语义相匹配。
进一步的,在上述的数据整合方法中,将所述类对象的对象名称与所述实体对象名称清单中的每个名称进行语义匹配或者将所述类对象的对象属性与所述整合对象属性进行语义匹配的步骤还包括:
当需要执行语义匹配的对象名称与实体对象名称清单中的名称,或者所述类对象的对象属性与所述整合对象属性中的一个或者两个均为多个缩写英文单词的组合或者完整英文单词与缩写英文单词的组合时,生成对应的完整英文单词组合;
将需要执行语义匹配的所述完整英文单词组合之间的完整英文单词两两输入语义相似度计算模型中计算语义相似度;
取所述完整英文单词组合中相似度最大的完整英文单词的相似度作为完整英文单词组合的语义相似度。
进一步的,在上述的数据整合方法中,根据所述实体对象的对象信息建立一个或多个所述实体对象与所述整合实体对象的对应关系的步骤具体包括:
将所述实体对象的对象名称与所述整合实体对象的整合对象名称输入语义相似度计算模型中计算语义相似度;
当所述实体对象的对象名称与所述整合实体对象的整合对象名称的语义相似度大于预设的第二阈值时,将所述实体对象的对象属性与所述整合实体对象的整合对象属性输入语义相似度计算模型中计算语义相似度;
获取所述实体对象与所述整合实体对象之间语义相似度大于预设的第三阈值的对象属性的数量;
当所述实体对象与所述整合实体对象之间语义相似度大于预设的第三阈值的对象属性的数量大于预设的第四阈值时,建立所述实体对象与所述整合实体对象之间的对应关系。
采用上述实施方式的技术方案,目标业务模块的系统开发商仅需将类代码文件和映射器接口代码文件直接打包提供即可,将这些代码文件一起放到解析目录中即可直接进行解析,无需提前进行分类或其它处理。
进一步的,在上述的数据整合方法中,在根据所述实体对象的对象信息建立一个或多个所述实体对象与所述整合实体对象的对应关系的步骤之后,还包括:
根据所述实体对象的对象属性与所述整合实体对象的整合对象属性的语义相似度建立所述实体对象的对象属性与所述整合实体对象的整合对象属性的关联关系;
当所述实体对象存在一个或一个以上的对象属性未与任一整合实体对象的整合对象属性建立关联关系时,将未与整合对象属性建立关联关系的对象属性以及所述实体对象的对象名称与待定属性列表中的待定属性及其对应的对象名称进行语义匹配,所述待定属性为其它业务模块程序的类代码文件中被确定为实体对象的类对象的与整合对象属性建立关联关系的对象属性,所述待定属性列表包括所述待定属性以及所述待定属性对应的对象名称;
当所述未与整合对象属性建立关联关系的对象属性与所述待定属性列表中预设数量的待定属性的语义相匹配,并且所述未与整合对象属性建立关联关系的对象属性对应的对象名称与其相匹配的待定属性对应的对象名称的语义相匹配时,将所述未与整合对象属性建立关联关系的对象属性添加到所述整合对象;
否则,将所述未与整合对象属性建立关联关系的对象属性以及所述实体对象的对象名称写入所述待定属性列表。
进一步的,在上述的数据整合方法中,在将所述未与整合对象属性建立关联关系的对象属性添加到所述整合对象的步骤之后,还包括:
在所述通用数据表中添加对应所述未与整合对象属性建立关联关系的对象属性的数据字段;
在所述整合映射器接口中添加读写对应所述未与整合对象属性建立关联关系的对象属性的数据字段的方法函数。
进一步的,在上述的数据整合方法中,解析所述类代码文件以获取实体对象或者业务对象的对象信息的步骤还包括:
根据所述程序语言类型的类代码文件结构从所述类代码文件中提取对象方法。
进一步的,在上述的数据整合方法中,解析所述映射器接口代码文件以获取所述实体对象中的每一个对象属性与目标业务模块数据库中的数据表字段的对应关系的步骤具体包括:
根据所述映射器接口代码中的实体对象调用方法识别关联的实体对象;
根据所述映射器接口代码中的注解符号、类属性或者类方法的调用识别所述实体对象的对象属性以及目标业务模块数据库中的数据表字段;
建立所述实体对象的对象属性与所述目标业务模块数据库中的数据表字段的关联关系。
本发明的第二方面提供一种信息管理系统,包括:
整合数据库建立模块,用于建立用于存放整合数据的整合数据库,所述整合数据库包括使用通用数据表模板生成的多个通用数据表;
整合对象构建模块,用于构建对应所述通用数据表的整合实体对象以及用于将所述整合实体对象映射到所述通用数据表以实现所述通用数据表读写的整合映射器接口;
代码路径获取模块,用于获取预先配置的代码文件路径;
代码文件读取模块,用于从所述代码文件路径指向的目录读取目标业务模块的类代码文件和映射器接口代码文件;
对象代码解析模块,用于解析所述类代码文件以获取实体对象或者业务对象的对象信息,所述对象信息包括对象名称和对象属性;
对象关系建立模块,用于根据所述实体对象的对象信息建立一个或多个所述实体对象与所述整合实体对象的对应关系;
接口代码解析模块,用于解析所述映射器接口代码文件以获取所述实体对象中的每一个对象属性与目标业务模块数据库中的数据表字段的对应关系;
属性关系建立模块,用于建立所述整合实体对象的整合对象属性与所述目标业务模块数据库中的数据表字段的对应关系;
数据表生成模块,用于根据所述业务对象的对象信息在所述整合数据库中生成对应的业务数据表;
业务数据接口构建模块,用于构建用于将所述业务对象映射到所述业务数据表以实现所述业务数据表读写的业务数据映射器接口;
数据写入模块,用于通过所述整合映射器接口、所述业务数据映射器接口与所述目标业务模块程序对接以将所述目标业务模块程序产生的数据写入所述整合数据库。
进一步的,在上述的信息管理系统中,所述通用数据表包括企业信息表、组织架构表、员工信息表、考勤信息表。
进一步的,在上述的信息管理系统中,所述业务数据表包括业务事件表、业务流程表、业务文件表。
进一步的,在上述的信息管理系统中,所述对象代码解析模块包括:
语言类型识别模块,用于根据所述类代码文件的扩展名识别所述类代码的程序语言类型;
对象信息提取模块,用于根据所述程序语言类型的类代码文件结构从所述类代码文件中提取对象名称和对象属性;
对象类型识别模块,用于根据所述类对象的对象名称识别所述类代码文件包含的类对象的对象类型,所述对象类型包括实体对象和业务对象。
进一步的,在上述的信息管理系统中,所述对象类型识别模块包括:
对象清单获取模块,用于获取预先配置的实体对象名称清单;
对象名称匹配模块,用于将所述类对象的对象名称与所述实体对象名称清单中的每个名称进行语义匹配;
实体对象确定模块,用于当所述类对象的对象名称与所述实体对象清单中的一个或一个以上的名称的语义相匹配时,将所述对象名称对应的类对象确定为实体对象;
业务对象确定模块,用于将所述对象名称对应的类对象确定为业务对象。
进一步的,在上述的信息管理系统中,所述对象类型识别模块还包括:
英文词典匹配模块,用于将所述类对象的对象名称输入预设的英文单词词典中进行单词匹配;
缩写词典匹配模块,用于当所述类对象的对象名称不是独立完整的英文单词时,将所述类对象的对象名称输入预设的英文单词缩写词典中进行缩写单词匹配以识别所述对象名称是否为一个缩写英文单词或多个缩写英文单词的组合,或者完整英文单词与缩写英文单词的组合;
所述对象名称匹配模块还用于当所述类对象的对象名称为独立完整的英文单词、缩写英文单词、多个缩写英文单词的组合或者完整英文单词与缩写英文单词的组合时,执行将所述类对象的对象名称与所述实体对象名称清单中的每个名称进行语义匹配的步骤。
进一步的,在上述的信息管理系统中,所述对象类型识别模块还包括:
整合属性获取模块,用于当所述类对象的对象名称不是独立完整的英文单词、缩写英文单词、多个缩写英文单词的组合或者完整英文单词与缩写英文单词的组合中的任一种时,获取所述整合实体对象的整合对象属性;
对象属性匹配模块,用于将所述类对象的对象属性与所述整合对象属性进行语义匹配;
所述实体对象确定模块还用于当一个类对象的多个对象属性与任一所述整合实体对象中的多个整合对象属性的语义相匹配时,将所述类对象确定为实体对象,并建立所述实体对象与所述整合实体对象的对应关系。
进一步的,在上述的信息管理系统中,所述对象名称匹配模块包括:
英文单词获取模块,用于获取需要执行语义匹配的类对象的对象名称与实体对象名称清单中的名称,或者所述类对象的对象属性与所述整合对象属性对应的完整英文单词或者完整英文单词的组合;
语义相似度计算模块,用于当需要执行语义匹配的对象名称与实体对象名称清单中的名称,或者所述类对象的对象属性与所述整合对象属性均对应一个完整英文单词或者一个缩写英文单词时,将其对应的两个完整英文单词输入语义相似度计算模型中计算语义相似度;
语义匹配确定模块,用于当两个完整英文单词的语义相似度大于预设的第一阈值时,确定所述完整英文单词对应的所述类对象的对象名称与所述实体对象清单中的名称的语义相匹配,或者确定所述完整英文单词对应的所述类对象的对象属性与所述整合对象属性的语义相匹配。
进一步的,在上述的信息管理系统中,所述语义相似度计算模块还用于将需要执行语义匹配的所述完整英文单词组合之间的完整英文单词两两输入语义相似度计算模型中计算语义相似度,所述对象名称匹配模块还包括:
单词组合生成模块,用于当需要执行语义匹配的对象名称与实体对象名称清单中的名称,或者所述类对象的对象属性与所述整合对象属性中的一个或者两个均为多个缩写英文单词的组合或者完整英文单词与缩写英文单词的组合时,生成对应的完整英文单词组合;
语义相似度确定模块,用于取所述完整英文单词组合中相似度最大的完整英文单词的相似度作为完整英文单词组合的语义相似度。
进一步的,在上述的信息管理系统中,所述语义相似度计算模块还用于将所述实体对象的对象名称与所述整合实体对象的整合对象名称输入语义相似度计算模型中计算语义相似度,以及当所述实体对象的对象名称与所述整合实体对象的整合对象名称的语义相似度大于预设的第二阈值时,将所述实体对象的对象属性与所述整合实体对象的整合对象属性输入语义相似度计算模型中计算语义相似度,所述对象关系建立模块包括:
属性数量获取模块,用于获取所述实体对象与所述整合实体对象之间语义相似度大于预设的第三阈值的对象属性的数量;
所述对象关系建立模块用于当所述实体对象与所述整合实体对象之间语义相似度大于预设的第三阈值的对象属性的数量大于预设的第四阈值时,建立所述实体对象与所述整合实体对象之间的对应关系。
进一步的,在上述的信息管理系统中,所述语义相似度计算模块还用于当所述实体对象存在一个或一个以上的对象属性未与任一整合实体对象的整合对象属性建立关联关系时,将未与整合对象属性建立关联关系的对象属性以及所述实体对象的对象名称与待定属性列表中的待定属性及其对应的对象名称进行语义匹配,所述待定属性为其它业务模块程序的类代码文件中被确定为实体对象的类对象的与整合对象属性建立关联关系的对象属性,所述待定属性列表包括所述待定属性以及所述待定属性对应的对象名称,所述对象关系建立模块还包括:
属性关系建立模块,用于根据所述实体对象的对象属性与所述整合实体对象的整合对象属性的语义相似度建立所述实体对象的对象属性与所述整合实体对象的整合对象属性的关联关系;
对象属性添加模块,用于当所述未与整合对象属性建立关联关系的对象属性与所述待定属性列表中预设数量的待定属性的语义相匹配,并且所述未与整合对象属性建立关联关系的对象属性对应的对象名称与其相匹配的待定属性对应的对象名称的语义相匹配时,将所述未与整合对象属性建立关联关系的对象属性添加到所述整合对象;
待定属性模块,用于将所述未与整合对象属性建立关联关系的对象属性以及所述实体对象的对象名称写入所述待定属性列表。
进一步的,在上述的信息管理系统中,所述对象关系建立模块还包括:
数据字段添加模块,用于在所述通用数据表中添加对应所述未与整合对象属性建立关联关系的对象属性的数据字段;
映射函数添加模块,用于在所述整合映射器接口中添加读写对应所述未与整合对象属性建立关联关系的对象属性的数据字段的方法函数。
进一步的,在上述的信息管理系统中,所述对象代码解析模块还包括:
对象方法提取模块,用于根据所述程序语言类型的类代码文件结构从所述类代码文件中提取对象方法。
进一步的,在上述的信息管理系统中,所述接口代码解析模块包括:
实体对象识别模块,用于根据所述映射器接口代码中的实体对象调用方法识别关联的实体对象;
属性字段识别模块,用于根据所述映射器接口代码中的注解符号、类属性或者类方法的调用识别所述实体对象的对象属性以及目标业务模块数据库中的数据表字段;
字段关系建立模块,用于建立所述实体对象的对象属性与所述目标业务模块数据库中的数据表字段的关联关系。
应当说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
依照本发明的实施例如上文所述,这些实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施例。显然,根据以上描述,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地利用本发明以及在本发明基础上的修改使用。本发明仅受权利要求书及其全部范围和等效物的限制。
Claims (8)
1.一种跨业务模块的数据整合方法,其特征在于,包括:
建立用于存放整合数据的整合数据库,所述整合数据库包括使用通用数据表模板生成的多个通用数据表;
构建对应所述通用数据表的整合实体对象以及用于将所述整合实体对象映射到所述通用数据表以实现所述通用数据表读写的整合映射器接口;
获取预先配置的代码文件路径;
从所述代码文件路径指向的目录读取目标业务模块的类代码文件和映射器接口代码文件;
解析所述类代码文件以获取实体对象或者业务对象的对象信息,所述对象信息包括对象名称和对象属性;
根据所述实体对象的对象信息建立一个或多个所述实体对象与所述整合实体对象的对应关系;
解析所述映射器接口代码文件以获取所述实体对象中的每一个对象属性与目标业务模块数据库中的数据表字段的对应关系;
建立所述整合实体对象的整合对象属性与所述目标业务模块数据库中的数据表字段的对应关系;
根据所述业务对象的对象信息在所述整合数据库中生成对应的业务数据表;
构建用于将所述业务对象映射到所述业务数据表以实现所述业务数据表读写的业务数据映射器接口;
通过所述整合映射器接口、所述业务数据映射器接口与所述目标业务模块的程序对接以将所述目标业务模块的程序产生的数据写入所述整合数据库;
解析所述类代码文件以获取实体对象或者业务对象的对象信息的步骤包括:
根据所述类代码文件的扩展名识别所述类代码的程序语言类型;
根据所述程序语言类型的类代码文件结构从所述类代码文件中提取对象名称和对象属性;
根据所述对象名称识别所述类代码文件包含的类对象的对象类型,所述对象类型包括实体对象和业务对象;
根据所述对象名称识别所述类代码文件包含的类对象的对象类型的步骤具体包括:
获取预先配置的实体对象名称清单;
将所述类对象的对象名称与所述实体对象名称清单中的每个名称进行语义匹配;
当所述类对象的对象名称与所述实体对象名称清单中的一个或多个的名称的语义相匹配时,将所述对象名称对应的类对象确定为实体对象;
否则,将所述对象名称对应的类对象确定为业务对象。
2.根据权利要求1所述的数据整合方法,其特征在于,在将所述类对象的对象名称与所述实体对象名称清单中的每个名称进行语义匹配的步骤之前,还包括:
将所述类对象的对象名称输入预设的英文单词词典中进行单词匹配;
当所述类对象的对象名称不是独立完整的英文单词时,将所述类对象的对象名称输入预设的英文单词缩写词典中进行缩写单词匹配以识别所述对象名称是否为一个缩写英文单词或多个缩写英文单词的组合,或者完整英文单词与缩写英文单词的组合;
当所述类对象的对象名称为独立完整的英文单词、缩写英文单词、多个缩写英文单词的组合或者完整英文单词与缩写英文单词的组合时,执行将所述类对象的对象名称与所述实体对象名称清单中的每个名称进行语义匹配的步骤。
3.根据权利要求2所述的数据整合方法,其特征在于,在将所述类对象的对象名称与所述实体对象名称清单中的每个名称进行语义匹配的步骤之前,还包括:
当所述类对象的对象名称不是独立完整的英文单词、缩写英文单词、多个缩写英文单词的组合或者完整英文单词与缩写英文单词的组合中的任一种时,获取所述整合实体对象的整合对象属性;
将所述类对象的对象属性与所述整合对象属性进行语义匹配;
当一个类对象的多个对象属性与任一所述整合实体对象中的多个整合对象属性的语义相匹配时,将所述类对象确定为实体对象,并建立所述实体对象与所述整合实体对象的对应关系;
否则,将所述类对象确定为业务对象。
4.根据权利要求3所述的数据整合方法,其特征在于,将所述类对象的对象名称与所述实体对象名称清单中的每个名称进行语义匹配或者将所述类对象的对象属性与所述整合对象属性进行语义匹配的步骤具体包括:
获取需要执行语义匹配的类对象的对象名称与实体对象名称清单中的名称,或者所述类对象的对象属性与所述整合对象属性对应的完整英文单词或者完整英文单词的组合;
当需要执行语义匹配的对象名称与实体对象名称清单中的名称,或者所述类对象的对象属性与所述整合对象属性均对应一个完整英文单词或者一个缩写英文单词时,将其对应的两个完整英文单词输入语义相似度计算模型中计算语义相似度;
当两个完整英文单词的语义相似度大于预设的第一阈值时,确定所述完整英文单词对应的所述类对象的对象名称与所述实体对象名称清单中的名称的语义相匹配,或者确定所述完整英文单词对应的所述类对象的对象属性与所述整合对象属性的语义相匹配。
5.根据权利要求1所述的数据整合方法,其特征在于,根据所述实体对象的对象信息建立一个或多个所述实体对象与所述整合实体对象的对应关系的步骤具体包括:
将所述实体对象的对象名称与所述整合实体对象的整合对象名称输入语义相似度计算模型中计算语义相似度;
当所述实体对象的对象名称与所述整合实体对象的整合对象名称的语义相似度大于预设的第二阈值时,将所述实体对象的对象属性与所述整合实体对象的整合对象属性输入语义相似度计算模型中计算语义相似度;
获取所述实体对象与所述整合实体对象之间语义相似度大于预设的第三阈值的对象属性的数量;
当所述实体对象与所述整合实体对象之间语义相似度大于预设的第三阈值的对象属性的数量大于预设的第四阈值时,建立所述实体对象与所述整合实体对象之间的对应关系。
6.根据权利要求5所述的数据整合方法,其特征在于,在根据所述实体对象的对象信息建立一个或多个所述实体对象与所述整合实体对象的对应关系的步骤之后,还包括:
根据所述实体对象的对象属性与所述整合实体对象的整合对象属性的语义相似度建立所述实体对象的对象属性与所述整合实体对象的整合对象属性的关联关系;
当所述实体对象存在一个或多个的对象属性未与任一整合实体对象的整合对象属性建立关联关系时,将未与整合对象属性建立关联关系的对象属性以及所述实体对象的对象名称与待定属性列表中的待定属性及其对应的对象名称进行语义匹配,所述待定属性为其它业务模块程序的类代码文件中被确定为实体对象的类对象的与整合对象属性建立关联关系的对象属性,所述待定属性列表包括所述待定属性以及所述待定属性对应的对象名称;
当所述未与整合对象属性建立关联关系的对象属性与所述待定属性列表中预设数量的待定属性的语义相匹配,并且所述未与整合对象属性建立关联关系的对象属性对应的对象名称与其相匹配的待定属性对应的对象名称的语义相匹配时,将所述未与整合对象属性建立关联关系的对象属性添加到所述整合对象;
否则,将所述未与整合对象属性建立关联关系的对象属性以及所述实体对象的对象名称写入所述待定属性列表。
7.根据权利要求6所述的数据整合方法,其特征在于,在将所述未与整合对象属性建立关联关系的对象属性添加到所述整合对象的步骤之后,还包括:
在所述通用数据表中添加对应所述未与整合对象属性建立关联关系的对象属性的数据字段;
在所述整合映射器接口中添加读写对应所述未与整合对象属性建立关联关系的对象属性的数据字段的方法函数。
8.一种信息管理系统,其特征在于,包括:
整合数据库建立模块,用于建立用于存放整合数据的整合数据库,所述整合数据库包括使用通用数据表模板生成的多个通用数据表;
整合对象构建模块,用于构建对应所述通用数据表的整合实体对象以及用于将所述整合实体对象映射到所述通用数据表以实现所述通用数据表读写的整合映射器接口;
代码路径获取模块,用于获取预先配置的代码文件路径;
代码文件读取模块,用于从所述代码文件路径指向的目录读取目标业务模块的类代码文件和映射器接口代码文件;
对象代码解析模块,用于解析所述类代码文件以获取实体对象或者业务对象的对象信息,所述对象信息包括对象名称和对象属性;
对象关系建立模块,用于根据所述实体对象的对象信息建立一个或多个所述实体对象与所述整合实体对象的对应关系;
接口代码解析模块,用于解析所述映射器接口代码文件以获取所述实体对象中的每一个对象属性与目标业务模块数据库中的数据表字段的对应关系;
属性关系建立模块,用于建立所述整合实体对象的整合对象属性与所述目标业务模块数据库中的数据表字段的对应关系;
数据表生成模块,用于根据所述业务对象的对象信息在所述整合数据库中生成对应的业务数据表;
业务数据接口构建模块,用于构建用于将所述业务对象映射到所述业务数据表以实现所述业务数据表读写的业务数据映射器接口;
数据写入模块,用于通过所述整合映射器接口、所述业务数据映射器接口与所述目标业务模块的程序对接以将所述目标业务模块的程序产生的数据写入所述整合数据库;
所述对象代码解析模块包括:
语言类型识别模块,用于根据所述类代码文件的扩展名识别所述类代码的程序语言类型;
对象信息提取模块,用于根据所述程序语言类型的类代码文件结构从所述类代码文件中提取对象名称和对象属性;
对象类型识别模块,用于根据所述对象名称识别所述类代码文件包含的类对象的对象类型,所述对象类型包括实体对象和业务对象;
所述对象类型识别模块包括:
对象清单获取模块,用于获取预先配置的实体对象名称清单;
对象名称匹配模块,用于将所述类对象的对象名称与所述实体对象名称清单中的每个名称进行语义匹配;
实体对象确定模块,用于当所述类对象的对象名称与所述实体对象名称清单中的一个或多个的名称的语义相匹配时,将所述对象名称对应的类对象确定为实体对象;
业务对象确定模块,用于将所述对象名称对应的类对象确定为业务对象。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310283007.8A CN116450717B (zh) | 2023-03-14 | 2023-03-14 | 一种跨业务模块的数据整合方法及信息管理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310283007.8A CN116450717B (zh) | 2023-03-14 | 2023-03-14 | 一种跨业务模块的数据整合方法及信息管理系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116450717A CN116450717A (zh) | 2023-07-18 |
CN116450717B true CN116450717B (zh) | 2023-10-20 |
Family
ID=87121144
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310283007.8A Active CN116450717B (zh) | 2023-03-14 | 2023-03-14 | 一种跨业务模块的数据整合方法及信息管理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116450717B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102571720A (zh) * | 2010-12-27 | 2012-07-11 | 中国移动通信集团辽宁有限公司 | 一种异构信息内容处理方法及装置 |
CN111080479A (zh) * | 2019-12-12 | 2020-04-28 | 北京中电普华信息技术有限公司 | 一种电网统一数据模型的创建方法及装置 |
CN111382314A (zh) * | 2020-03-20 | 2020-07-07 | 山东浪潮通软信息科技有限公司 | 一种实现异构系统业务集成灵活配置的方法 |
CN113064866A (zh) * | 2021-03-02 | 2021-07-02 | 深圳供电局有限公司 | 一种电力业务数据整合系统 |
CN115562635A (zh) * | 2022-09-30 | 2023-01-03 | 深圳复临科技有限公司 | 初始化示例数据生成方法、装置、计算机设备及存储介质 |
CN115630066A (zh) * | 2022-10-20 | 2023-01-20 | 广东电网有限责任公司 | 一种动态本体语义融合模型的多源异构数据映射的方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7761478B2 (en) * | 2005-11-23 | 2010-07-20 | International Business Machines Corporation | Semantic business model management |
US8417593B2 (en) * | 2008-02-28 | 2013-04-09 | Sap Ag | System and computer-readable medium for managing consistent interfaces for business objects across heterogeneous systems |
US8645913B2 (en) * | 2010-12-21 | 2014-02-04 | Sap Ag | Web-service based generation of business objects |
-
2023
- 2023-03-14 CN CN202310283007.8A patent/CN116450717B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102571720A (zh) * | 2010-12-27 | 2012-07-11 | 中国移动通信集团辽宁有限公司 | 一种异构信息内容处理方法及装置 |
CN111080479A (zh) * | 2019-12-12 | 2020-04-28 | 北京中电普华信息技术有限公司 | 一种电网统一数据模型的创建方法及装置 |
CN111382314A (zh) * | 2020-03-20 | 2020-07-07 | 山东浪潮通软信息科技有限公司 | 一种实现异构系统业务集成灵活配置的方法 |
CN113064866A (zh) * | 2021-03-02 | 2021-07-02 | 深圳供电局有限公司 | 一种电力业务数据整合系统 |
CN115562635A (zh) * | 2022-09-30 | 2023-01-03 | 深圳复临科技有限公司 | 初始化示例数据生成方法、装置、计算机设备及存储介质 |
CN115630066A (zh) * | 2022-10-20 | 2023-01-20 | 广东电网有限责任公司 | 一种动态本体语义融合模型的多源异构数据映射的方法 |
Non-Patent Citations (1)
Title |
---|
基于XML的钢铁企业综合生产管理系统设计与应用;刘迪成;赖旭芝;吴敏;向婕;;计算机与应用化学(第07期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116450717A (zh) | 2023-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ghose et al. | Process discovery from model and text artefacts | |
CN116628172A (zh) | 基于知识图谱的政务服务领域多策略融合的对话方法 | |
US9280569B2 (en) | Schema matching for data migration | |
US7536634B2 (en) | Frame-slot architecture for data conversion | |
US20120303661A1 (en) | Systems and methods for information extraction using contextual pattern discovery | |
US10089390B2 (en) | System and method to extract models from semi-structured documents | |
AU2019204444B2 (en) | System and method for enrichment of ocr-extracted data | |
US11727213B2 (en) | Automatic conversation bot generation using input form | |
RU2544739C1 (ru) | Способ преобразования структурированного массива данных | |
CN113678118A (zh) | 数据提取系统 | |
CN112651218A (zh) | 一种标书自动生成方法、管理方法、介质以及计算机 | |
RU61442U1 (ru) | Система автоматизированного упорядочения неструктурированного информационного потока входных данных | |
Shah et al. | Towards benchmarking feature type inference for automl platforms | |
CN112507089A (zh) | 一种基于知识图谱的智能问答引擎及其实现方法 | |
CN117648093A (zh) | 基于大模型和自定制需求模板的rpa流程自动化生成方法 | |
Melo et al. | A strategy for archives metadata representation on CIDOC-CRM and knowledge discovery | |
Annervaz et al. | Natural language requirements quality analysis based on business domain models | |
Agrawal et al. | An enhanced extract-transform-load system for migrating data in telecom billing | |
Buey et al. | Automatic legal document analysis: Improving the results of information extraction processes using an ontology | |
CN112883202A (zh) | 一种基于知识图谱的多组件建模方法和系统 | |
CN116450717B (zh) | 一种跨业务模块的数据整合方法及信息管理系统 | |
CN113052544A (zh) | 工作流依用户行为智能适配方法、装置以及存储介质 | |
Rashmi et al. | Qualitative and quantitative study of syntactic structure: a grammar checker using part of speech tags | |
Rajbhoj et al. | DocToModel: automated authoring of models from diverse requirements specification documents | |
JP2021086400A (ja) | 情報処理装置、指示書データ生成方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |