CN112214557B - 数据匹配分类方法及装置 - Google Patents

数据匹配分类方法及装置 Download PDF

Info

Publication number
CN112214557B
CN112214557B CN202011130450.4A CN202011130450A CN112214557B CN 112214557 B CN112214557 B CN 112214557B CN 202011130450 A CN202011130450 A CN 202011130450A CN 112214557 B CN112214557 B CN 112214557B
Authority
CN
China
Prior art keywords
data
analysis
standard
element information
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011130450.4A
Other languages
English (en)
Other versions
CN112214557A (zh
Inventor
刘霏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN202011130450.4A priority Critical patent/CN112214557B/zh
Publication of CN112214557A publication Critical patent/CN112214557A/zh
Application granted granted Critical
Publication of CN112214557B publication Critical patent/CN112214557B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • G06F16/287Visualization; Browsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种数据匹配分类方法及装置,该方法包括:获取需求分析的要素信息;根据需求分析的要素信息,从数据矩阵全景图中抽取需求分析所需要的原始数据;对原始数据进行数据清洗或格式化,转换得到具有关系型数据特征的标准数据;利用预设的关键字,将标准数据与多类型数据库表中的数据匹配后进行映射,得到映射后的关联数据;将映射后的关联数据,按照所属类目,进行可视化展示。该方法基于关键字驱动来定位关联数据,相较于手工检索,能够减少工作人员的工作量,提高工作效率。利用可视化的方式进行展示,能够快速协助工作人员进行后续的汇总、统计等工作,以便开展后续决策分析,从而提高了工作效率。

Description

数据匹配分类方法及装置
技术领域
本发明涉及数据处理技术领域,尤其涉及一种数据匹配分类方法及装置。
背景技术
在对银行系统进行需求分析时,由于系统间联系密切,功能极其复杂,流程较长,分支路径繁多,功能名称有较多类似情况,这就导致分析过程中需要从全局数据中匹配查找本次需要做变更的功能点,以在矩阵中定位出与该功能点相关联的所有信息并进行分类。
由于此过程中涉及的数据表涉及不同的岗位的人员,数据矩阵的数据量大,格式也不统一,很难整合到一个数据库中,现有技术中只能通过手工方式完成,造成工作人员工作量大,工作效率低。
发明内容
本发明实施例提供一种数据匹配分类方法,用以减少工作人员的工作量,提高工作效率,该方法包括:
获取需求分析的要素信息;
根据需求分析的要素信息,从数据矩阵全景图中抽取需求分析所需要的原始数据;
对原始数据进行数据清洗或格式化,转换得到具有关系型数据特征的标准数据;
利用预设的关键字,将标准数据与多类型数据库表中的数据匹配后进行映射,得到映射后的关联数据;
将映射后的关联数据,按照所属类目,进行可视化展示。
本发明实施例还提供一种数据匹配分类装置,用以减少工作人员的工作量,提高工作效率,该装置包括:
要求获取模块,用于获取需求分析的要素信息;
数据抽取模块,用于根据需求分析的要素信息,从数据矩阵全景图中抽取需求分析所需要的原始数据;
数据预处理模块,用于对原始数据进行数据清洗或格式化,转换得到具有关系型数据特征的标准数据;
关键字映射模块,用于利用预设的关键字,将标准数据与多类型数据库表中的数据匹配后进行映射,得到映射后的关联数据;
分类目展示模块,用于将映射后的关联数据,按照所属类目,进行可视化展示。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述数据匹配分类方法。
本发明实施例也提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述数据匹配分类方法的计算机程序。
本发明实施例中,通过获取需求分析的要素信息;根据需求分析的要素信息,从数据矩阵全景图中抽取需求分析所需要的原始数据;对原始数据进行数据清洗或格式化,转换得到具有关系型数据特征的标准数据;利用预设的关键字,将标准数据与多类型数据库表中的数据匹配后进行映射,得到映射后的关联数据;将映射后的关联数据,按照所属类目,进行可视化展示。基于关键字驱动来定位关联数据,相较于手工检索,能够减少工作人员的工作量,提高工作效率。利用可视化的方式进行展示,能够快速协助工作人员进行后续的汇总、统计等工作,以便开展后续决策分析,从而提高了工作效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中数据匹配分类方法的示意图。
图2为本发明具体实施例中步骤102的具体实现方法示意图。
图3为本发明具体实施例中步骤104的具体实现方法示意图。
图4为本发明实施例中数据匹配分类装置的示意图。
图5为本发明具体实施例中数据抽取模块402的结构示意图。
图6为本发明一具体实施例中关键字映射模块404的结构示意图。
图7为本发明另一具体实施例中关键字映射模块404的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种数据匹配分类方法,用以减少工作人员的工作量,提高工作效率,如图1所示,该方法包括:
步骤101:获取需求分析的要素信息;
步骤102:根据需求分析的要素信息,从数据矩阵全景图中抽取需求分析所需要的原始数据;
步骤103:对原始数据进行数据清洗或格式化,转换得到具有关系型数据特征的标准数据;
步骤104:利用预设的关键字,将标准数据与多类型数据库表中的数据匹配后进行映射,得到映射后的关联数据;
步骤105:将映射后的关联数据,按照所属类目,进行可视化展示。
由图1所示流程可以得知,本发明实施例中,通过获取需求分析的要素信息;根据需求分析的要素信息,从数据矩阵全景图中抽取需求分析所需要的原始数据;对原始数据进行数据清洗或格式化,转换得到具有关系型数据特征的标准数据;利用预设的关键字,将标准数据与多类型数据库表中的数据匹配后进行映射,得到映射后的关联数据;将映射后的关联数据,按照所属类目,进行可视化展示。基于关键字驱动来定位关联数据,相较于手工检索,能够减少工作人员的工作量,提高工作效率。利用可视化的方式进行展示,能够快速协助工作人员进行后续的汇总、统计等工作,以便开展后续决策分析,从而提高了工作效率。
具体实施时,首先获取需求分析的要素信息,需求分析的要素信息是用于描述用户进行需求分析时需求分析关系图中要求,如需要的功能点、业务流程、影响域和分支路径等。
获取需求分析的要素信息后,根据需求分析的要素信息,从数据矩阵全景图中抽取需求分析所需要的原始数据。其中,数据矩阵全景图是指包含用于需求分析的多个非直接关联的数据表的集合。
具体实施过程,如图2所示,包括:
步骤201:根据需求分析的要素信息,从数据矩阵全景图中抽取分析所需要的全量数据;
步骤202:按照预设的数据偏好参数,处理全量数据,得到与分析相关联的数据二维表,作为原始数据。
其中,预设的数据偏好参数是指在全量数据中,需求分析人员更需要或更希望得到的是哪一方面的数据。举例说明,银行系统中网金部需求分析人员,决定对收单渠道进行功能优化,如对网联平台快捷支付功能进行优化。该功能涉及多个后台系统、多个卡种、币种、对账、清算、手续费、接口以及不同的交易分支等等的全量数据。通过设置风险系数,耦合程度,匹配精度等参数,需求分析人员希望知晓的数据内容排序在前,得到与分析相关联的数据二维表,作为原始数据。
得到原始数据后,对原始数据进行数据清洗或格式化,转换得到具有关系型数据特征的标准数据。其中,数据清洗可以是整合、拼接和去重等操作,通过数据清洗或格式化的过程,将不规范、不满足要求的原始数据剔除,并转换成具有关系型数据特点的标准数据。其中,关系型数据是指采用了关系模型来组织的数据,关系模型本质上是若干个存储数据的二维表。
利用预设的关键字,将标准数据与多类型数据库表中的数据匹配后进行映射,得到映射后的关联数据。具体实施过程,如图3所示,包括:
步骤301:将预设的关键字与标准数据中的序号或者关键信息进行字符拼接,得到主键,作为唯一标识;
步骤302:利用唯一标识,将标准数据与多类型数据库表中的数据匹配后,建立映射关系,得到映射后的关联数据。
其中,多类型数据库表,至少包括:
业务数据表、业务流程数据表、代码分支数据表及路径覆盖数据表。
具体实施例中,得到主键后,还包括:
利用SUBSTITUTE方法,将主键中的空格去除,以保证数据是非空格字符串,防止格式不正确的脏数据出现;
利用COUNTIF方法,将主键相同的标准数据进行去重操作,保证数据的唯一性,消除数据重复对后续分析工作的影响。
相应地,得到主键,作为唯一标识,包括:
将去除空格和去重操作后的主键,作为唯一标识。
其中,SUBSTITUTE方法是指利用EXCEL中的SUBSTITUTE函数来替代指定文本的方法。COUNTIF方法利用EXCEL中的COUNTIF函数,对指定区域内符合指定条件的单元格进行计数,即当存在主键相同的标准数据时,应用COUNTIF函数后,计数超过1,可将重复的数据删除。
得到映射后的关联数据后,将映射后的关联数据,按照所属类目,进行可视化展示。其中,所属类目是指银行内对数据进行分类后的类别项目,例如系统、卡种、清算文件、接口或者分支等类目。具体实施时,对于关联性单一的数据可以使用EXCEL中的ADDRESS(MATCH())函数嵌套获取数据所在位置,使用INDIRECT函数将数据可视化。对于关联性较强的功能点,使用EXCEL中的VLOOKUP函数,在多类型数据库表中通过关键字定位到的是一组相关联的数据,可以从中再次根据特征进行二次定位,得到映射后的关联数据。
下面给出一具体实例说明本发明实施例如何进行数据匹配分类。
银行网金部的需求分析人员决定对收单渠道进行功能优化,如对网联平台快捷支付功能进行优化。该功能涉及多个后台系统,多个卡种,币种,对账,清算,手续费,接口以及不同的交易分支等等的全量数据。通过EXCEL中提供的强大的脚本API,使用FORMATTING函数实现从数据矩阵将所需数据抽取,并格式化。使用FileName、SheetNO、RowNO、ColNO、TableArray等参数定位所需全量数据。
上述全量数据都保存在不同的数据库中以及Excel表中,从这些数据库中搜索关键字“快捷支付”会得到匹配结果,这些结果是各种维度的包含关键字的数据条目,将这些数据条目统称为原始数据。再对这些原始数据进行整合,拼接,去重等格式化操作形成一个标准的数据集。再通过设置风险系数、耦合程度、匹配精度等参数,对标准数据进行优先级排序和分类,最后以柱状图,散点图等可视化方式展现出,与快捷支付最相关的系统,卡种,清算文件,接口或者分支等。
这样需要关注相关系统的业务人员只需要调高系统耦合度和匹配精度和系统相关联的数据分类会靠前展示,如果关注账务的业务人员就调高相应耦合度和匹配精度,相关数据分类就会靠前显示。还可以从业务人员扩展到开发人员,测试人员等,只需要调高各类人员关注点的相关参数,就能展示出所需数据分类,开发人员可以快速的知道需要修改哪些接口和代码,测试人员知道能覆盖哪些功能点和路径分支。
由于全局矩阵数据并不是简单的关系型数据,也并没有在专业的数据库维护,都是靠人工积累不断完善进行维护,数据涵盖多个EXCEL文件并包含多个SHEET页中。本具体实例使用EXCEL宏中的VBS脚本及公式的方式相结合,对数据进行处理、整理、格式化、统一化、拼接、去重、跨多表进行定位,建立映射,确定关联关系和筛选等操作,达到将复杂的非关系型数据矩阵,转化成直观可视化的功能点分布视图。
在庞大的全景数据矩阵中,数据全而广,但是对需求分析来讲,会产生没有切入点,无从着手的影响。本发明所提供的数据匹配分类方法,将工作人员从海量数据中解放出来,将维度较多的数据矩阵转为直观可视的二维关系型数据,使不同岗位的人员有更多的时间关注需求分析本身,而不是数据提炼过程中操作。既能保证避免人工操作过程中容易产生遗漏的问题,又能快速的展示出可直观分析的数据关系,节省了大量的时间,提高需求分析和关联分析的准确度和效率。
本例提供的方案,能够实现自动根据关键驱动定位数据,并通过算法将功能点,业务流程,代码分支,影响域等进行相关联。而后再将其通过特征归分到已知类目中,分类结束后以可视化方式展示,快速协助需求分析人员汇总,统计等工作,以便开展后续决策。
上述具体应用的实施仅为举例,其余实施方式不再一一赘述。
基于同一发明构思,本发明实施例还提供一种数据匹配分类装置,由于数据匹配分类装置所解决问题的原理与数据匹配分类方法相似,因此数据匹配分类装置的实施可以参见数据匹配分类方法的实施,重复之处不再赘述,具体结构如图4所示:
要求获取模块401,用于获取需求分析的要素信息;
数据抽取模块402,用于根据需求分析的要素信息,从数据矩阵全景图中抽取需求分析所需要的原始数据;
数据预处理模块403,用于对原始数据进行数据清洗或格式化,转换得到具有关系型数据特征的标准数据;
关键字映射模块404,用于利用预设的关键字,将标准数据与多类型数据库表中的数据匹配后进行映射,得到映射后的关联数据;
分类目展示模块405,用于将映射后的关联数据,按照所属类目,进行可视化展示。
具体实施例中,多类型数据库表,至少包括:
业务数据表、业务流程数据表、代码分支数据表及路径覆盖数据表。
具体实施例中,数据抽取模块402,如图5所示,包括:
原始数据抽取单元501,用于根据需求分析的要素信息,从数据矩阵全景图中抽取分析所需要的全量数据;
基础数据确定单元502,用于按照预设的数据偏好参数,处理全量数据,得到与分析相关联的数据二维表,作为原始数据。
具体实施时,关键字映射模块404,如图6所示,包括:
标识确定单元601,用于将预设的关键字与标准数据中的序号或者关键信息进行字符拼接,得到主键,作为唯一标识;
映射单元602,用于利用唯一标识,将标准数据与多类型数据库表中的数据匹配后,建立映射关系,得到映射后的关联数据。
具体实施例中,关键字映射模块404的结构,如图7所示,在图6的基础上,还包括:
格式校正单元701,用于利用SUBSTITUTE方法,将主键中的空格去除;
数据去重单元702,用于利用COUNTIF方法,将主键相同的标准数据进行去重操作;
相应地,标识确定单元601具体用于:
将去除空格和去重操作后的主键,作为唯一标识。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述数据匹配分类方法。
本发明实施例还提供一种计算机可读存储介质,存储有执行上述数据匹配分类方法的计算机程序。
综上所述,本发明实施例提供的数据匹配分类方法及装置具有如下优点:
通过获取需求分析的要素信息;根据需求分析的要素信息,从数据矩阵全景图中抽取需求分析所需要的原始数据;对原始数据进行数据清洗或格式化,转换得到具有关系型数据特征的标准数据;利用预设的关键字,将标准数据与多类型数据库表中的数据匹配后进行映射,得到映射后的关联数据;将映射后的关联数据,按照所属类目,进行可视化展示。基于关键字驱动来定位关联数据,相较于手工检索,能够减少工作人员的工作量,提高工作效率。利用可视化的方式进行展示,能够快速协助工作人员进行后续的汇总、统计等工作,以便开展后续决策分析,从而提高了工作效率。
本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、装置和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明实施例可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种数据匹配分类方法,其特征在于,包括:
获取需求分析的要素信息;
根据需求分析的要素信息,从数据矩阵全景图中抽取需求分析所需要的原始数据;
对原始数据进行数据清洗或格式化,转换得到具有关系型数据特征的标准数据;
利用预设的关键字,将标准数据与多类型数据库表中的数据匹配后进行映射,得到映射后的关联数据;
将映射后的关联数据,按照所属类目,进行可视化展示。
2.如权利要求1所述的方法,其特征在于,所述多类型数据库表,至少包括:
业务数据表、业务流程数据表、代码分支数据表及路径覆盖数据表。
3.如权利要求1所述的方法,其特征在于,根据需求分析的要素信息,从数据矩阵全景图中抽取分析所需要的原始数据,包括:
根据需求分析的要素信息,从数据矩阵全景图中抽取分析所需要的全量数据;
按照预设的数据偏好参数,处理全量数据,得到与分析相关联的数据二维表,作为原始数据。
4.如权利要求1所述的方法,其特征在于,利用预设的关键字,将标准数据与多类型数据库表中的数据匹配后进行映射,得到映射后的关联数据,包括:
将预设的关键字与标准数据中的序号或者关键信息进行字符拼接,得到主键,作为唯一标识;
利用唯一标识,将标准数据与多类型数据库表中的数据匹配后,建立映射关系,得到映射后的关联数据。
5.如权利要求4所述的方法,其特征在于,得到主键后,还包括:
利用SUBSTITUTE方法,将主键中的空格去除;
利用COUNTIF方法,将主键相同的标准数据进行去重操作;
得到主键,作为唯一标识,包括:
将去除空格和去重操作后的主键,作为唯一标识。
6.一种数据匹配分类装置,其特征在于,包括:
要求获取模块,用于获取需求分析的要素信息;
数据抽取模块,用于根据需求分析的要素信息,从数据矩阵全景图中抽取需求分析所需要的原始数据;
数据预处理模块,用于对原始数据进行数据清洗或格式化,转换得到具有关系型数据特征的标准数据;
关键字映射模块,用于利用预设的关键字,将标准数据与多类型数据库表中的数据匹配后进行映射,得到映射后的关联数据;
分类目展示模块,用于将映射后的关联数据,按照所属类目,进行可视化展示。
7.如权利要求6所述的装置,其特征在于,所述多类型数据库表,至少包括:
业务数据表、业务流程数据表、代码分支数据表及路径覆盖数据表。
8.如权利要求6所述的装置,其特征在于,所述数据抽取模块,包括:
原始数据抽取单元,用于根据需求分析的要素信息,从数据矩阵全景图中抽取分析所需要的全量数据;
基础数据确定单元,用于按照预设的数据偏好参数,处理全量数据,得到与分析相关联的数据二维表,作为原始数据。
9.如权利要求6所述的装置,其特征在于,所述关键字映射模块,包括:
标识确定单元,用于将预设的关键字与标准数据中的序号或者关键信息进行字符拼接,得到主键,作为唯一标识;
映射单元,用于利用唯一标识,将标准数据与多类型数据库表中的数据匹配后,建立映射关系,得到映射后的关联数据。
10.如权利要求9所述的装置,其特征在于,所述关键字映射模块还包括:
格式校正单元,用于利用SUBSTITUTE方法,将主键中的空格去除;
数据去重单元,用于利用COUNTIF方法,将主键相同的标准数据进行去重操作;
所述标识确定单元具体用于:
将去除空格和去重操作后的主键,作为唯一标识。
11.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5任一所述方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至5任一所述方法的计算机程序。
CN202011130450.4A 2020-10-21 2020-10-21 数据匹配分类方法及装置 Active CN112214557B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011130450.4A CN112214557B (zh) 2020-10-21 2020-10-21 数据匹配分类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011130450.4A CN112214557B (zh) 2020-10-21 2020-10-21 数据匹配分类方法及装置

Publications (2)

Publication Number Publication Date
CN112214557A CN112214557A (zh) 2021-01-12
CN112214557B true CN112214557B (zh) 2023-08-22

Family

ID=74056197

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011130450.4A Active CN112214557B (zh) 2020-10-21 2020-10-21 数据匹配分类方法及装置

Country Status (1)

Country Link
CN (1) CN112214557B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113407287A (zh) * 2021-06-29 2021-09-17 中国平安人寿保险股份有限公司 可视化页面的快速生成方法、装置、设备及存储介质
CN115017251B (zh) * 2022-08-05 2022-10-25 山东省计算中心(国家超级计算济南中心) 一种用于智慧城市的标准映射地图建立方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103714479A (zh) * 2012-10-09 2014-04-09 四川欧润特软件科技有限公司 银行个人业务欺诈行为实时智能化集中监控的方法和系统
CN103777928A (zh) * 2012-10-17 2014-05-07 神州数码融信软件有限公司 一种用作银行前台操作界面的图形前端系统
CN105893574A (zh) * 2016-03-31 2016-08-24 联想(北京)有限公司 一种数据处理方法及电子设备
CN108595858A (zh) * 2018-04-28 2018-09-28 成都希盟科技有限公司 基于bim的轻量化深度处理工作方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103714479A (zh) * 2012-10-09 2014-04-09 四川欧润特软件科技有限公司 银行个人业务欺诈行为实时智能化集中监控的方法和系统
CN103777928A (zh) * 2012-10-17 2014-05-07 神州数码融信软件有限公司 一种用作银行前台操作界面的图形前端系统
CN105893574A (zh) * 2016-03-31 2016-08-24 联想(北京)有限公司 一种数据处理方法及电子设备
CN108595858A (zh) * 2018-04-28 2018-09-28 成都希盟科技有限公司 基于bim的轻量化深度处理工作方法

Also Published As

Publication number Publication date
CN112214557A (zh) 2021-01-12

Similar Documents

Publication Publication Date Title
CN111428599B (zh) 票据识别方法、装置和设备
CN112214557B (zh) 数据匹配分类方法及装置
CN104077407B (zh) 一种智能数据搜索系统及方法
CN111444793A (zh) 基于ocr的票据识别方法、设备、存储介质及装置
CN105653647B (zh) Sql语句的信息采集方法及系统
CN110928903A (zh) 数据提取方法及装置、设备和存储介质
US20190149344A1 (en) Intelligent search system for service cost and method thereof
CN111127068A (zh) 一种工程量清单自动组价方法和装置
CN107908733A (zh) 一种全球贸易数据的查询方法,装置及系统
CN108734021B (zh) 一种基于去隐私数据的金融贷款大数据风险评估方法与系统
CN102982421A (zh) 基于银行对账单的集团合并现金流量表的编制方法及系统
CN111444792A (zh) 票据识别方法、电子设备、存储介质及装置
CN109636303B (zh) 一种半自动提取和结构化文档信息的存储方法及系统
KR101671890B1 (ko) 거래관계 분석 장치 및 방법
CN116484084B (zh) 基于应用信息挖掘的元数据血缘分析方法、介质及系统
TWM646715U (zh) 自動化股權蒐集及實質受益人分析系統
CN111913962A (zh) 一种多维度年度明细资金计划编制系统及方法
CN115238033A (zh) 一种实现医疗机构手术业务数据标准化的方法和系统
JPWO2019123704A1 (ja) データ分析支援装置、データ分析支援方法およびデータ分析支援プログラム
CN113780716A (zh) 一种业务台账生成系统
CN111930815A (zh) 一种基于行业属性和经营属性构建企业画像的方法及系统
CN112612893A (zh) 一种电子卷宗随案生成系统
CN113674115B (zh) 一种基于数据治理技术的高校数据管理辅助系统及方法
CN113342830A (zh) 一种数据处理方法及装置
CN114610791B (zh) 数据血缘关系的分析方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant