CN116861331A - 一种融合专家模型决策的数据识别方法及系统 - Google Patents
一种融合专家模型决策的数据识别方法及系统 Download PDFInfo
- Publication number
- CN116861331A CN116861331A CN202310724350.1A CN202310724350A CN116861331A CN 116861331 A CN116861331 A CN 116861331A CN 202310724350 A CN202310724350 A CN 202310724350A CN 116861331 A CN116861331 A CN 116861331A
- Authority
- CN
- China
- Prior art keywords
- data
- risk
- business
- feature
- historical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 101
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 123
- 238000004458 analytical method Methods 0.000 claims abstract description 77
- 230000002452 interceptive effect Effects 0.000 claims abstract description 56
- 230000004927 fusion Effects 0.000 claims abstract description 55
- 238000012545 processing Methods 0.000 claims abstract description 54
- 230000000694 effects Effects 0.000 claims abstract description 44
- 238000005070 sampling Methods 0.000 claims abstract description 31
- 239000011159 matrix material Substances 0.000 claims abstract description 27
- 238000007418 data mining Methods 0.000 claims abstract description 20
- 230000000007 visual effect Effects 0.000 claims abstract description 13
- 238000004364 calculation method Methods 0.000 claims description 53
- 239000013598 vector Substances 0.000 claims description 46
- 238000012502 risk assessment Methods 0.000 claims description 41
- 238000003066 decision tree Methods 0.000 claims description 29
- 238000001514 detection method Methods 0.000 claims description 24
- 238000013079 data visualisation Methods 0.000 claims description 20
- 230000006399 behavior Effects 0.000 claims description 19
- 238000000605 extraction Methods 0.000 claims description 17
- 230000010354 integration Effects 0.000 claims description 17
- 238000013528 artificial neural network Methods 0.000 claims description 14
- 238000013135 deep learning Methods 0.000 claims description 13
- 230000002159 abnormal effect Effects 0.000 claims description 12
- 238000012407 engineering method Methods 0.000 claims description 12
- 238000011176 pooling Methods 0.000 claims description 12
- 238000007405 data analysis Methods 0.000 claims description 10
- 238000013507 mapping Methods 0.000 claims description 9
- 238000005520 cutting process Methods 0.000 claims description 8
- 238000009826 distribution Methods 0.000 claims description 8
- 238000007621 cluster analysis Methods 0.000 claims description 7
- 125000004122 cyclic group Chemical group 0.000 claims description 5
- 238000013500 data storage Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 3
- 230000002787 reinforcement Effects 0.000 claims description 3
- 238000004891 communication Methods 0.000 claims 1
- 238000005516 engineering process Methods 0.000 description 22
- 238000007726 management method Methods 0.000 description 15
- 238000011156 evaluation Methods 0.000 description 12
- 238000010801 machine learning Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 10
- 230000009286 beneficial effect Effects 0.000 description 9
- 238000012549 training Methods 0.000 description 7
- 238000004140 cleaning Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000010606 normalization Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 238000013178 mathematical model Methods 0.000 description 4
- 238000007500 overflow downdraw method Methods 0.000 description 4
- 238000012800 visualization Methods 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000013523 data management Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000005065 mining Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 206010000117 Abnormal behaviour Diseases 0.000 description 2
- 239000000090 biomarker Substances 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000011217 control strategy Methods 0.000 description 2
- 238000005315 distribution function Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 230000001364 causal effect Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000011985 exploratory data analysis Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000010223 real-time analysis Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/251—Fusion techniques of input or preprocessed data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
- G06Q20/401—Transaction verification
- G06Q20/4016—Transaction verification involving fraud or risk level assessment in transaction processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Entrepreneurship & Innovation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Accounting & Taxation (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Tourism & Hospitality (AREA)
- Databases & Information Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- Computational Linguistics (AREA)
- Technology Law (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及数据处理技术领域,尤其涉及一种融合专家模型决策的数据识别方法及系统,该方法包括以下步骤:利用大数据挖掘法获取用户业务活动数据及业务风险历史数据;利用智能传感器获取用户实时业务数据;对第一业务特征风险数据进行风险识别,生成业务特征风险矩阵;利用大数据风险识别分析法对业务风险历史数据进行风险概率预测,生成历史风险概率数据;对第二业务特征风险数据进行交互式可视化处理,生成业务特征风险数据可交互视图;对业务特征风险数据可交互视图进行多层采样,生成历史风险决策模型;利用组合分类器权重算法对业务风险专家决策模型进行模型融合,生成业务风险专家决策融合模型,本发明实现了对数据识别的高效,准确的优点。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种融合专家模型决策的数据识别方法及系统。
背景技术
传统的数据处理方法往往需要人工进行数据的分类和处理,在数据量大的情况下效率低、准确性差,为此,近年来,越来越多的专家系统和机器学习算法被引入到数据处理领域,以提高数据识别和处理的准确性和效率,其中,融合专家模型决策的数据识别方法和系统,成为了研究热点之一,利用机器学习算法和卷积算法对用户业务数据进行识别与处理,可以大大简化业务数据的信息管理及数据分析流程,结合数据挖掘、智能识别、风险预测等专业技术,建立融合专家决策模型,融合专家模型决策的数据识别方法极大地提高了数据处理和决策的效率,对提高企业竞争力和核心能力具有重要意义。
发明内容
本发明为解决上述技术问题,提出了一种融合专家模型决策的数据识别方法及系统,以解决至少一个上述技术问题。
为实现上述目的,本发明提供一种融合专家模型决策的数据识别方法,包括以下步骤:
步骤S1:利用大数据挖掘法获取用户业务活动数据及业务风险历史数据;利用智能传感器获取用户实时业务数据;利用数据仓库集成法对用户业务活动数据及用户实时业务数据进行数据集成,构建专家数据库;
步骤S2:利用特征工程法对专家数据库进行特征提取,生成用户业务特征数据;利用关联规则分析法对用户业务特征数据进行业务风险分析,生成第一业务特征风险数据;
步骤S3:利用事件树分析法对第一业务特征风险数据进行风险识别,生成业务特征风险矩阵;利用大数据风险识别分析法对业务风险历史数据进行风险概率预测,生成历史风险概率数据;对业务特征风险矩阵及历史风险概率数据进行数据融合,生成第二业务特征风险数据;
步骤S4:利用深度学习算法对第二业务特征风险数据进行交互式可视化处理,生成业务特征风险数据可交互视图;
步骤S5:利用决策树算法对业务特征风险数据可交互视图进行膨胀卷积,生成业务风险专家决策模型;利用神经网络算法对业务特征风险数据可交互视图进行历史风险数据多层采样,生成历史风险决策模型。
步骤S6:利用组合分类器权重算法对业务风险专家决策模型及历史风险决策模型进行模型融合,生成业务风险专家决策融合模型;
本发明提供了一种融合专家模型决策的数据识别方法,通过大数据挖掘法获取用户业务活动数据及业务风险历史数据,利用智能传感器获取用户实时业务数据并将其集成于数据仓库,可以使决策者在分析和决策时拥有更多的数据支持和背景资料,更好地预测业务风险和趋势,减少风险损失,通过决策树算法进行特征提取可以帮助决策者更好地理解数据,并在分析中更准确地区分不同的业务风险,从而更加针对性地制定决策方案,使用事件树分析法和大数据风险识别分析法对业务风险进行评估和预测,能够快速准确地识别业务中的风险点和隐患,为制定决策提供支持和指导,通过深度学习算法进行交互式可视化处理,可以帮助决策者更好地理解业务风险数据的内在关系,从而更准确地识别潜在的风险因素,更富有创新性地提出解决方案,决策树算法和神经网络算法在业务风险识别和预测中都拥有很高的可靠性和精度,通过这两种算法能够快速准确地进行业务风险识别、处理和评估,提高决策的准确性和效率,利用组合分类器权重算法将多个模型进行融合,其决策结果更接近实际情况,从而更好地指导企业的经营和决策,利用组合分类器权重算法将多个模型进行融合,其决策结果更接近实际情况,从而更好地指导企业的经营和决策。
优选地,步骤S1包括以下步骤:
步骤S11:利用大数据挖掘法获取用户业务活动数据及业务风险历史数据;用户业务活动数据包括用户交易记录数据、用户账户信息数据、用户行为轨迹数据及用户异常数据;
步骤S12:利用智能传感器获取用户实时业务数据;用户实时业务数据包括用户实时业务活动数据及用户实时位置数据;
步骤S13:利用数据仓库集成法对用户业务活动数据及用户实时业务数据进行数据集成,生成用户业务仓库数据;
步骤S14:利用关系型数据库法对用户业务仓库数据进行数据存储,构建专家数据库。
本发明通过大数据挖掘法获取用户业务活动数据及业务风险历史数据,包括用户交易记录数据、用户账户信息数据、用户行为轨迹数据及用户异常数据,这些数据可以帮助企业更全面地了解用户的业务行为,进而对风险进行识别和预防,例如,通过分析用户的交易记录和账户信息,可以检测出非法的交易行为;通过分析用户的行为轨迹和异常数据,可以及时发现用户的不正常行为,以便采取相应的安全措施,利用智能传感器获取用户实时业务数据,包括用户实时业务活动数据及用户实时位置数据,这些数据可以帮助企业更及时地了解用户的业务行为,从而采取更快速、更准确的决策,例如,通过分析用户的实时交易数据,可以及时调整交易策略;通过分析用户的实时位置数据,可以更精准地定位用户并提供相应的服务,用数据仓库集成法对用户业务活动数据及用户实时业务数据进行数据集成,生成用户业务仓库数据,这个步骤可以将用户的多个相关数据源集成起来,构建一个完整、一致的数据仓库,这个仓库可以为后续的数据分析和决策提供数据基础,从而更好地识别和预防业务风险,利用关系型数据库法对用户业务仓库数据进行数据存储,构建专家数据库,这个专家数据库包含了企业的核心业务数据,可以为后续的决策提供数据支持,例如,通过查询专家数据库,可以快速了解某个用户近期的交易记录和账户信息,从而更好地预测该用户的风险,另外,关系型数据库还支持数据管理和保护,可以有效确保数据安全和完整性。
优选地,步骤S2包括以下步骤:
步骤S21:利用特征点检测算法对专家数据库进行特征检测,生成用户业务特征编码;
步骤S22:利用特征工程法对用户业务特征编码进行特征提取,生成用户业务特征数据;
步骤S23:利用关联规则分析法对用户业务特征数据进行业务风险分析,生成业务风险数据;
步骤S24:利用聚类分析法对用户业务特征数据及业务风险数据进行数据聚类分析,生成第一业务特征风险数据。
本发明通过特征点检测算法对专家数据库进行特征检测,生成用户业务特征编码,该步骤的目的是提取出用户业务数据的特征,以便后续分析和分类,例如,在银行业务中,特征点可以是用户的交易金额、交易次数、交易时间等,用特征工程法对用户业务特征编码进行特征提取,生成用户业务特征数据,该步骤的目的是从用户业务特征编码中提取出有用的信息,以便进行后续分析和分类,例如,在银行业务中,决策树算法可以通过分析用户交易金额和交易次数之间的关系,判断用户是否存在异常交易行为,利用关联规则分析法对用户业务特征数据进行业务风险分析,生成业务风险数据,该步骤的目的是分析用户业务特征数据之间的关系,找出其中的规律和异常,以便识别业务风险,例如,在银行业务中,可以通过关联规则分析来判断哪些用户的交易行为存在异常风险,利用聚类分析法对用户业务特征数据及业务风险数据进行数据聚类分析,生成第一业务特征风险数据,该步骤的目的是将用户业务特征数据和业务风险数据进行分类,以便识别出不同风险水平的用户和业务,例如,在银行业务中,可以将用户按照交易金额和交易次数分类,以识别出不同风险水平的用户,因此,通过这个流程对用户业务特征数据进行分析和分类,可以帮助企业识别出不同风险水平的用户和业务,从而采取不同的风险预测和控制策略,这样可以大大提高企业的风险管理水平,保护企业和用户的利益。
优选地,步骤S21包括以下步骤:
步骤S211:利用特征点检测算法对专家数据库进行特征检测,生成专家数据库特征数据;
步骤S212:对专家数据库特征数据进行特征数据二值化,生成专家数据库特征二值化数据;
步骤S213:对专家数据库特征二值化数据进行特征编码,生成用户业务特征编码。
本发明通过特征点检测算法对专家数据库进行特征检测,生成专家数据库特征数据,该步骤的目的是从专家数据库记录中提取出与目标分类任务相关的重要特征,例如,在医学领域,可能会提取出受试者的年龄、性别、体重、身高、生物标记物等特征,对专家数据库特征数据进行特征数据二值化,生成专家数据库特征二值化数据,该步骤的目的是将专家数据库特征数据转换为数字形式,以便机器学习模型可以对其进行处理,对专家数据库特征二值化数据进行特征编码,生成用户业务特征编码,该步骤的目的是将专家数据库特征数据转换为一组特征编码,以便用于机器学习模型的训练,使用独热编码将分类任务中不同类别的特征值进行编码,用于支持一些机器学习算法训练,如逻辑回归算法,通过这个流程,可以从专家数据库中提取出以有意义的特征,将其转换为可用于训练机器学习模型的数字格式,并将其编码为特征向量,这样,企业可以使用这些特征向量来训练分类模型,该模型可以成功地将未知数据分类为前述任务操作所指定的类别,从而帮助企业进行自动分类并进行更好的决策。
优选地,步骤S3包括以下步骤:
步骤S31:利用事件树分析法对第一业务特征风险数据进行风险识别,生成业务特征风险数据;
步骤S32:利用业务特征风险预测计算公式对业务特征风险数据进行风险预测计算,生成业务特征风险矩阵;
步骤S33:利用大数据风险识别分析法对业务风险历史数据进行风险评估,生成历史风险评估数据;
步骤S34:利用历史业务风险概率计算公式对历史风险评估数据进行风险概率计算,生成历史风险概率数据;
步骤S35:利用元学习融合算法对业务特征风险矩阵及历史风险概率数据进行数据融合,生成第二业务特征风险数据。
本发明通过事件树分析法对第一业务特征风险数据进行风险识别,生成业务特征风险数据,该步骤的目标是通过风险评估和风险分析方法,识别第一业务特征中存在的潜在风险因素,并将它们转换为业务特征风险数据,利用业务特征风险预测计算公式对业务特征风险数据进行风险预测计算,生成业务特征风险矩阵,该步骤的目标是运用数学模型和风险预测方法,预测业务特征风险数据在未来的变化趋势,并生成业务特征风险矩阵以便于后续的风险评估,利用大数据风险识别分析法对业务风险历史数据进行风险评估,生成历史风险评估数据,该步骤的目标是通过大数据技术和统计分析方法,对历史业务数据进行挖掘和分析,识别历史业务数据中存在的潜在风险因素,并转换为历史风险评估数据,利用历史业务风险概率计算公式对历史风险评估数据进行风险概率计算,生成历史风险概率数据,该步骤的目标是运用数学模型和风险计算方法,计算历史业务风险评估数据的概率,预测未来业务风险的可能性,并生成历史风险概率数据,利用元学习融合算法对业务特征风险矩阵及历史风险概率数据进行数据融合,生成第二业务特征风险数据,该步骤的目标是对第一业务特征风险数据和历史风险概率数据进行集成和融合,形成第二业务特征风险数据,该数据能够更准确地反映出当前业务存在的风险状态,企业可以利用各种风险预测和分析方法来识别关键风险因素并预测未来的风险发展趋势,此外,融合不同类型的数据,更好地反映现实情况,提高模型的预测准确性,从而帮助企业更好地应对风险问题。
优选地,步骤S32中的业务特征风险预测计算公式具体为:
其中,R为预测的业务特征风险系数值,i为第i个业务特征因素,n为n个业务特征因素的总和,wi为第i个业务特征因素的权重,fi为第i个业务特征的市场份额保有量,xi为第i个业务特征的预测结果的概率值,maxg为市场业务量的最大值,ming为市场业务量的最小值。为第i个业务特征因素的加权和,/>为该业务特征因素的均值的立方根;
本发明通过考虑业务特征因素的加权和,通过/>将加权后的业务特征因素转换为风险的概率值,从0到1,对多个因素进行综合评估,反映它们对业务风险的综合影响,提高评估准确性,可以将多个因素的线性组合转化为非线性形式,从而更好地捕捉变量之间的关系和相互作用,将结果映射到[0,1]的特点,因此可以将彼此不同的因素进行加权和计算,再映射到[0,1]之间进行标准化,使得结果更容易被解释和比较,将上述概率值转换为风险的估计值,通过/>表示业务特征因素均值的立方根,作为风险预测的指标之一,通过/>反映了市场业务量的范围,使得大范围的业务量变化更容易被捕捉到,从而更全面地反映市场情况,使评估结果更具可信度,考虑多个业务特征因素,使用标准化技术,考虑市场业务量的范围和分布,采用科学合理的数学运算方法,从而使评估结果更准确、可靠、科学。
优选地,步骤S34中的历史业务风险概率计算公式具体为:
其中,P为历史业务风险概率值,T0为历史业务风险的基准水平值,为第i个业务特征因素,n为n个业务特征因素的总和,wi为第i个业务特征因素的权重,fi为第i个业务特征的市场份额保有量,j为第j个历史时间点业务特征因素,n为n个历史时间点业务特征因素的总和,Tj为第j个历史时间点历史业务风险概率值,kj为第j个历史时间点的业务份额占市场份额的权重,x为当前时间点的业务风险概率值,σ为历史风险的波动值。
本发明通过将历史业务数据和实时业务数据的加权和转换为风险的概率值,定量化历史业务风险概率,通过考虑历史业务特征因素和历史时间点业务特征因素的权重,计算出历史业务风险概率值。这有助于企业更具体地了解历史业务风险的波动情况,为后续风险管理决策提供准确的基础数据,通过(x-T0)2表示当前业务风险概率值x与历史业务风险的基准水平值,这个差异平方后,除以历史风险的波动值σ的平方,得到指数部分的值,当前业务风险概率值与历史水平的差异越大,指数部分的值就越大,说明当前业务风险概率值的不确定性越高,反之则越低,虑了当前业务特征因素的影响,还考虑了历史时间点业务特征因素的权重。这有助于企业了解历史业务风险的发展趋势和规律,为制定更加科学的风险管理策略提供有益参考,采用历史风险的波动情况作为分母,通过将当前时间点的业务风险概率值带入高斯分布函数,计算出当前风险概率值的大小。这有助于企业了解历史风险的波动情况和风险规律,为制定更加科学的风险管理策略提供有益参考,该公式不仅考虑了市场份额保有量对历史业务风险的影响,还考虑了历史时间点业务份额占市场份额的权重。
优选地,步骤S4包括以下步骤:
步骤S41:利用主成分算法对第二业务特征风险数据进行特征提取,生成第二业务特征风险向量数据;
步骤S42:利用深度学习算法对第二业务特征风险向量数据进行数据可视化处理,生成业务特征风险数据可视化视图;
步骤S43:用JavaScript库对业务特征风险数据可视化视图进行交互化处理,生成业务特征风险数据可交互视图。
本发明通过主成分算法对第二业务特征风险数据进行特征提取,生成第二业务特征风险向量数据,该步骤的目标是将业务特征风险数据中的冗余或相关特征提取出来,形成更少但更有意义的主成分,以简化数据分析的复杂度,利用深度学习算法对第二业务特征风险向量数据进行数据可视化处理,生成业务特征风险数据可视化视图,该步骤的目标是将主成分的数据表示可视化,以便更清楚地展示业务特征风险数据的关键特征和相互关系,以帮助分析师和决策者更好地理解数据,用JavaScript库对业务特征风险数据可视化视图进行交互化处理,生成业务特征风险数据可交互视图,该步骤的目标是将可视化视图转换为可交互式的界面,以便用户更好地与数据进行互动分析、探索和以图表的形式展现不同场景的数据报告,企业可以将复杂的业务特征风险数据转换为易于理解和使用的可视化和交互式视图,以便更好地识别、评估和应对业务风险问题,此外,可视化和交互化的数据表示方式有助于加强对数据的沟通和协作,提高企业的决策效率和质量。
优选地,步骤S5包括以下步骤:
步骤S51:利用循环卷积算法对业务特征风险数据可交互视图进行卷积数据切割,生成业务风险特征网络;
步骤S52:利用决策树算法对业务风险特征网络进行边缘特征加强处理,生成业务风险特征序列;
步骤S53:利用超像素卷积算法对业务风险特征序列进行膨胀卷积,生成业务风险专家决策模型;
步骤S54:利用神经网络算法对业务特征风险数据可交互视图进行历史风险数据分析,生成历史风险决策分析图;
步骤S55:利用多尺度采样算法对历史风险决策分析图进行空间金字塔池化多层采样,生成历史风险决策模型。
本发明通过循环卷积算法对业务特征风险数据可交互视图进行卷积数据切割,生成业务风险特征网络,该步骤旨在通过卷积数据切割,将数据可交互视图转换为业务特征风险数据的特征网络表示,以便更好地理解和使用数据,利用决策树算法对业务风险特征网络进行边缘特征加强处理,生成业务风险特征序列,该步骤旨在利用决策树算法对业务风险特征网络进行特征选择和边缘特征加强处理,以得到更为准确和有价值的业务风险特征序列,利用决策树算法对业务风险特征网络进行边缘特征加强处理,生成业务风险特征序列,该步骤旨在利用决策树算法对业务风险特征网络进行特征选择和边缘特征加强处理,以得到更为准确和有价值的业务风险特征序列,利用决策树算法对业务风险特征网络进行边缘特征加强处理,生成业务风险特征序列,该步骤旨在利用决策树算法对业务风险特征网络进行特征选择和边缘特征加强处理,以得到更为准确和有价值的业务风险特征序列,利用多尺度采样算法对历史风险决策分析图进行空间金字塔池化多层采样,生成历史风险决策模型,该步骤旨在利用多尺度采样算法对历史风险决策分析图进行处理,以得到历史风险决策模型,为企业决策者提供了更细致、更准确和可靠的历史风险数据分析报告。
优选地,步骤S55包括以下步骤:
步骤S551:利用多尺度采样算法对历史风险决策分析图进行空间金字塔池化多层采样,生成历史风险决策卷积特征数据;
步骤S552:对历史风险决策卷积特征数据进行卷积特征映射,生成历史风险决策卷积特征向量;
步骤S553:对历史风险决策卷积特征向量进行向量拼接,生成历史风险决策模型。
本发明通过,利用多尺度采样算法对历史风险决策分析图进行空间金字塔池化多层采样,生成历史风险决策卷积特征数据,这个步骤的目的是为了从历史风险决策分析图中提取出有用的特征信息,多尺度采样算法能够在不同尺度下对图像进行采样,并通过金字塔池化和多层采样来获取更全面的特征信息,这样可以获得更准确、更全面的历史风险决策卷积特征数据,为后续的处理提供更加丰富和有用的信息,对历史风险决策卷积特征数据进行卷积特征映射,生成历史风险决策卷积特征向量,这个步骤的目的是将历史风险决策卷积特征数据进行压缩和变换,得到更加简洁、抽象化的卷积特征向量,卷积特征映射使用卷积核将卷积特征数据进行变换,得到新的特征向量,能够更好地表达历史风险决策卷积特征数据和提高模型的泛化能力,对历史风险决策卷积特征数据进行卷积特征映射,生成历史风险决策卷积特征向量,这个步骤的目的是将历史风险决策卷积特征数据进行压缩和变换,得到更加简洁、抽象化的卷积特征向量,卷积特征映射使用卷积核将卷积特征数据进行变换,得到新的特征向量,能够更好地表达历史风险决策卷积特征数据和提高模型的泛化能力。
优选地,步骤S6包括以下步骤:
步骤S61:利用组合分类器权重算法对业务风险专家决策模型及历史风险决策模型进行分类器权重分配,生成决策模型权重数据;
步骤S62:基于决策模型权重数据利用组合分类器模型权重计算公式对业务风险专家决策模型及历史风险决策模型进行权重计算,生成多个组合分类器权重子模型;
步骤S63:利用堆叠泛化法对组合分类器权重子模型进行模型融合,生成业务风险专家决策融合模型。
本发明通过组合分类器权重算法对业务风险专家决策模型及历史风险决策模型进行分类器权重分配,生成决策模型权重数据,这个步骤的目的是为了对业务风险专家决策模型及历史风险决策模型进行分配权重,以达到更好的融合效果,组合分类器权重算法会根据每个分类器的准确性和可信度来分配权重,使得准确度更高、可信度更高的分类器在融合中占据更大的权重,基于决策模型权重数据利用组合分类器模型权重计算公式对业务风险专家决策模型及历史风险决策模型进行权重计算,生成多个组合分类器权重子模型,这个步骤的目的是根据分配的权重,对业务风险专家决策模型及历史风险决策模型进行权重计算,生成多个组合分类器权重子模型,在计算过程中,权重高的分类器会被分配更大的权重,从而对决策结果产生更大的影响,利用堆叠泛化法对组合分类器权重子模型进行模型融合,生成业务风险专家决策融合模型,这个步骤的目的是通过堆叠泛化法对多个组合分类器权重子模型进行集成和融合,得到更加精确和准确的业务风险专家决策融合模型,在堆叠泛化法中,将多个组合分类器权重子模型集成到一个超级模型中,通过学习这个超级模型,可以让整个融合模型的准确性和稳定性得到显著提高,从而更好地支持企业决策者做出精准的业务决策。
优选地,步骤S62中的组合分类器模型权重计算公式具体为:
其中,f(x)为组合分类器权重系数,n为基分类器的数量,ti为第i个基分类器在组合分类器中的权重,hi为第i个基分类器对权重的预测值,(x)为输入初始基分类器的样本值,m为基分类器对结果值的预测结果的和,vi为第i个基分类器对结果值的预测结果,gi为第i个基分类器对结果值的实际结果,N为分类结果的数量,vjk为第j个基分类器对第k个基分类器的权重,hk为第k个基分类器对样本的分类结果,为第i个基分类器对结果值预测的最大实际结果值,/>为第i个基分类器对结果值预测的最小实际结果值。
本发明通过表示多个基分类器预测结果的加权和,表示所有基分类器预测结果和实际结果之间的差异程度。该部分计算得到的值越小,表示基分类器的预测结果越接近于实际结果,对权重系数的影响越大,基于多个基分类器的预测结果来计算组合分类器的权重系数,从而提高分类器的准确性。通过将多个基分类器的预测结果组合,可以有效地降低基分类器的预测误差,提高分类器的精度,通过/>表示n个基分类器对于当前样本的预测结果和预测权重的加权和。该部分计算结果越大,说明基分类器对于当前样本的影响越大,对权重值的影响也越大,考虑了不同的基分类器对分类器准确性的贡献程度。这有助于区分不同基分类器对分类器性能的贡献,从而更好地利用基分类器的优点,进一步提高分类器的准确性,通过/>表示预测结果之间的距离。这有助于更好地利用预测结果的范围,提高分类器的准确性。
在本说明书的一个实施例中,提供一种融合专家模型决策的数据识别方法及系统,包括至少一个处理器;
与至少一个处理器通信连接的存储器;
存储器存储有可被至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器能够执行如上所述的融合专家模型决策的数据识别方法。
本发明通过建立融合专家模型决策系统,通过大数据挖掘法获取用户业务活动数据及业务风险历史数据,对数据进行预分类处理,能够基于过去的经验和领域知识对数据进行自动分类,从而可以有效地将数据进行初步筛选,减少人工操作的工作量,提高整个识别过程的效率和准确性,利用机器学习方法对预分类处理后的数据进行训练和测试,机器学习方法能够利用大量数据进行模型的训练和测试,对数据进行更深层次的分析和处理,从而进一步提高数据识别的准确性和效率,采用多元分类器技术,对数据进行综合判断和评估,通过综合多个分类器的结果,可以得出更为准确和可靠的数据识别结果,从而能够更好地支持企业决策者做出正确的决策,利用模型融合技术对多个分类器的结果进行融合处理,生成综合评估结果,过模型融合技术,可以将多个分类器的优点进行集成和整合,得到更为精准和稳定的综合评估结果,从而能够更好地支持企业决策者做出更加明智的决策,通过模型融合技术,可以将多个分类器的优点进行集成和整合,得到更为精准和稳定的综合评估结果,从而能够更好地支持企业决策者做出更加明智的决策。
附图说明
图1为本发明一种融合专家模型决策的数据识别方法的步骤流程示意图;
图2为步骤S1的详细实施步骤流程示意图;
图3为步骤S2的详细实施步骤流程示意图;
图4为步骤S3的详细实施步骤流程示意图。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本申请实例提供一种融合专家模型决策的数据识别方法及系统。所述融合专家模型决策的数据识别方法及系统的执行主体包括但不限于搭载该系统的:机械设备、数据处理平台、云服务器节点、网络上传设备等可看作本申请的通用计算节点,所述数据处理平台包括但不限于:音频图像管理系统、信息管理系统、云端数据管理系统至少一种。
请参阅图1至图4,本发明提供了一种融合专家模型决策的数据识别方法,所述方法包括以下步骤:
步骤S1:利用大数据挖掘法获取用户业务活动数据及业务风险历史数据;利用智能传感器获取用户实时业务数据;利用数据仓库集成法对用户业务活动数据及用户实时业务数据进行数据集成,构建专家数据库;
步骤S2:利用特征工程法对专家数据库进行特征提取,生成用户业务特征数据;利用关联规则分析法对用户业务特征数据进行业务风险分析,生成第一业务特征风险数据;
步骤S3:利用事件树分析法对第一业务特征风险数据进行风险识别,生成业务特征风险矩阵;利用大数据风险识别分析法对业务风险历史数据进行风险概率预测,生成历史风险概率数据;对业务特征风险矩阵及历史风险概率数据进行数据融合,生成第二业务特征风险数据;
步骤S4:利用深度学习算法对第二业务特征风险数据进行交互式可视化处理,生成业务特征风险数据可交互视图;
步骤S5:利用决策树算法对业务特征风险数据可交互视图进行膨胀卷积,生成业务风险专家决策模型;利用神经网络算法对业务特征风险数据可交互视图进行历史风险数据多层采样,生成历史风险决策模型。
步骤S6:利用组合分类器权重算法对业务风险专家决策模型及历史风险决策模型进行模型融合,生成业务风险专家决策融合模型;
本发明提供了一种融合专家模型决策的数据识别方法,通过大数据挖掘法获取用户业务活动数据及业务风险历史数据,利用智能传感器获取用户实时业务数据并将其集成于数据仓库,可以使决策者在分析和决策时拥有更多的数据支持和背景资料,更好地预测业务风险和趋势,减少风险损失,通过决策树算法进行特征提取可以帮助决策者更好地理解数据,并在分析中更准确地区分不同的业务风险,从而更加针对性地制定决策方案,使用事件树分析法和大数据风险识别分析法对业务风险进行评估和预测,能够快速准确地识别业务中的风险点和隐患,为制定决策提供支持和指导,通过深度学习算法进行交互式可视化处理,可以帮助决策者更好地理解业务风险数据的内在关系,从而更准确地识别潜在的风险因素,更富有创新性地提出解决方案,决策树算法和神经网络算法在业务风险识别和预测中都拥有很高的可靠性和精度,通过这两种算法能够快速准确地进行业务风险识别、处理和评估,提高决策的准确性和效率,利用组合分类器权重算法将多个模型进行融合,其决策结果更接近实际情况,从而更好地指导企业的经营和决策,利用组合分类器权重算法将多个模型进行融合,其决策结果更接近实际情况,从而更好地指导企业的经营和决策。
本发明实施例中,参考图1所述,为本发明一种融合专家模型的数据识别方法及系统的步骤流程示意图,在本实例中,所述基于融合专家模型的数据识别方法的步骤包括:
步骤S1:利用大数据挖掘法获取用户业务活动数据及业务风险历史数据;利用智能传感器获取用户实时业务数据;利用数据仓库集成法对用户业务活动数据及用户实时业务数据进行数据集成,构建专家数据库。
在本发明实施例中,利用大数据挖掘法获取用户业务活动数据及业务风险历史数据,确认需要采集的数据,比如订单数据、交易数据、客户数据等,确认需要采集的数据,比如订单数据、交易数据、客户数据,利用大数据挖掘技术对数据进行分析和挖掘,比如聚类分析、关联规则挖掘等,利用智能传感器获取用户实时业务数据,这一步需要实时监测用户的业务活动数据,以便及时发现和应对业务风险,具体操作包括:安装智能传感器,用于监测用户的业务活动数据,利用物联网技术将传感器采集的数据传输到服务器,对实时数据进行清洗和处理,利用数据仓库集成法对用户业务活动数据及用户实时业务数据进行数据集成,构建专家数据库,这一步需要将采集到的所有数据进行合并和整理,生成专家数据库,具体操作包括,利用数据仓库技术对各种数据进行清洗、整合、归档和存储,构建专家库,将业务活动数据、风险历史数据和实时数据存入专家库中,设定数据访问权限,确保数据的安全性和机密性,通过上述步骤的处理,可以建立一个包含用户业务活动数据,业务风险历史数据和实时业务数据的综合性专家数据库,为后续的业务决策提供可靠的数据支持。
步骤S2:利用特征工程法对专家数据库进行特征提取,生成用户业务特征数据;利用关联规则分析法对用户业务特征数据进行业务风险分析,生成第一业务特征风险数据。
在本发明实施例中,利用特征工程法、对专家数据库进行特征提取,对所有数据进行预处理和清洗,如去重、填充缺失值、归一化,利用特征工程技术对数据进行特征选择,选取最具代表性的特征数据,生成用户业务特征数据,利用关联规则分析法对用户业务特征数据进行业务风险分析,对用户业务特征数据进行关联规则分析,以发现业务风险,利用关联规则分析技术,从业务特征数据中挖掘潜在的业务风险,生成第一业务特征风险数据,用于后续风险管控和决策支持。
步骤S3:利用事件树分析法对第一业务特征风险数据进行风险识别,生成业务特征风险矩阵;利用大数据风险识别分析法对业务风险历史数据进行风险概率预测,生成历史风险概率数据;利用元学习融合算法对业务特征风险矩阵及历史风险概率数据进行数据融合,生成第二业务特征风险数据。
在本发明实施例中,通过用事件树分析法对第一业务特征风险数据进行预处理和清洗,利用事件树分析法对业务特征风险数据进行分类和分析,以识别出各种可能的风险事件,生成业务特征风险矩阵,包括每种风险事件的概率、影响程度和出现概率,收集和整理历史业务风险数据,利用大数据分析技术对历史业务风险数据进行分析和处理,预测出各种业务风险事件的概率,生成历史风险概率数据,用于后续风险管控和决策支持,用元学习融合算法对业务特征风险矩阵及历史风险概率数据进行数据融合,利用元学习算法,融合业务特征风险矩阵和历史风险概率数据,生成第二业务特征风险数据。
步骤S4:利用深度学习算法对第二业务特征风险数据进行交互式可视化处理,生成业务特征风险数据可交互视图。
在本发明实施例中,利用深度学习算法对第二业务特征风险数据进行可视化处理,对第二业务特征风险数据进行预处理和清洗,选择适当的深度学习模型,利用可交互可视化技术,将业务特征风险数据可视化展示,设计易于使用和理解的用户界面,使用户可以方便地操作和交互提供各种交互式操作和信息显示功能,帮助用户深入理解业务特征风险数据。
步骤S5:利用决策树算法对业务特征风险数据可交互视图进行膨胀卷积,生成业务风险专家决策模型;利用神经网络算法对业务特征风险数据可交互视图进行历史风险数据多层采样,生成历史风险决策模型。
在本发明实施例中,利用决策树算法对业务特征风险数据可交互视图进行膨胀卷积,选择适当的决策树算法,利用决策树算法,对业务特征风险数据可交互视图进行膨胀卷积,生成业务风险专家决策模型。对业务特征风险数据可交互视图进行预处理和清洗,选择适当的神经网络算法,利用神经网络算法,对业务特征风险数据可交互视图进行历史风险数据多层采样,生成历史风险决策模型。
步骤S6:利用组合分类器权重算法对业务风险专家决策模型及历史风险决策模型进行模型融合,生成业务风险专家决策融合模型。
在本发明实施例中,选择适当的组合分类器权重算法,比如Boosting、Bagging、Stacking等,用于对模型进行融合,将业务风险专家决策模型和历史风险决策模型进行融合,并调整各个模型的权重,生成业务风险专家决策融合模型,用于后续风险管控和决策支持。
本发明实施例中,参考图2所述,为步骤S1的详细实施步骤流程示意图,在本说明书的一个实施例中,所述步骤S1的详细实施步骤包括:
步骤S11:利用大数据挖掘法获取用户业务活动数据及业务风险历史数据;用户业务活动数据包括用户交易记录数据、用户账户信息数据、用户行为轨迹数据及用户异常数据;
步骤S12:利用智能传感器获取用户实时业务数据;用户实时业务数据包括用户实时业务活动数据及用户实时位置数据;
步骤S13:利用数据仓库集成法对用户业务活动数据及用户实时业务数据进行数据集成,生成用户业务仓库数据;
步骤S14:利用关系型数据库法对用户业务仓库数据进行数据存储,构建专家数据库。
本发明通过大数据挖掘法获取用户业务活动数据及业务风险历史数据,包括用户交易记录数据、用户账户信息数据、用户行为轨迹数据及用户异常数据,这些数据可以帮助企业更全面地了解用户的业务行为,进而对风险进行识别和预防,例如,通过分析用户的交易记录和账户信息,可以检测出非法的交易行为;通过分析用户的行为轨迹和异常数据,可以及时发现用户的不正常行为,以便采取相应的安全措施,利用智能传感器获取用户实时业务数据,包括用户实时业务活动数据及用户实时位置数据,这些数据可以帮助企业更及时地了解用户的业务行为,从而采取更快速、更准确的决策,例如,通过分析用户的实时交易数据,可以及时调整交易策略;通过分析用户的实时位置数据,可以更精准地定位用户并提供相应的服务,用数据仓库集成法对用户业务活动数据及用户实时业务数据进行数据集成,生成用户业务仓库数据,这个步骤可以将用户的多个相关数据源集成起来,构建一个完整、一致的数据仓库,这个仓库可以为后续的数据分析和决策提供数据基础,从而更好地识别和预防业务风险,利用关系型数据库法对用户业务仓库数据进行数据存储,构建专家数据库,这个专家数据库包含了企业的核心业务数据,可以为后续的决策提供数据支持,例如,通过查询专家数据库,可以快速了解某个用户近期的交易记录和账户信息,从而更好地预测该用户的风险,另外,关系型数据库还支持数据管理和保护,可以有效确保数据安全和完整性。
在本发明实施例中,利用大数据挖掘法获取用户业务活动数据及业务风险历史数据,从各个业务系统中收集用户的交易记录数据、账户信息数据、行为轨迹数据及异常数据,这些数据可以来自不同的渠道,如移动应用、网站、ATM等,对于收集到的数据进行清洗、去重、转换、归一化等处理,以确保数据质量符合要求,通过数据挖掘技术,对用户行为数据进行建模、分析和挖掘,以发现其中的规律、异常和趋势,并提取有价值的信息,通过专业的风险管理模型,对用户的风险历史数据进行分析,预测用户可能出现的风险,在用户进行业务活动的场所中安装智能传感器设备,如POS机、智能手机等,收集用户的实时业务数据和位置信息,将收集到的实时数据通过网络传输到数据中心,通过数据处理技术进行数据清洗、转换、存储等,并进行实时分析和建模,利用数据仓库集成法对用户业务活动数据及用户实时业务数据进行数据集成收集来自不同渠道的用户业务活动数据、用户实时业务数据以及其他相关数据,并进行预处理,根据业务需求,设计出合适的数据仓库模型,包括逻辑模型和物理模型,以方便数据的集成、存储与查询分析,对收集到的数据进行数据清洗、转换和集成,确保数据的一致性、完整性和准确性,生成用户业务仓库数据,利用关系型数据库技术,实现数据库的创建、数据导入、查询处理和数据备份等功能,并定期进行数据库优化、维护和监控基于专家数据库,利用数据挖掘技术和分析工具,对用户业务数据进行查询分析、数据可视化等操作,帮助业务领域的专家和决策者做出更科学的决策。
本发明实施例中,参考图3所述,为步骤S2的详细实施步骤流程示意图,在本说明书的一个实施例中,所述步骤S2的详细实施步骤包括:
步骤S21:利用特征点检测算法对专家数据库进行特征检测,生成用户业务特征编码;
步骤S22:用特征工程法对用户业务特征编码进行特征提取,生成用户业务特征数据;
步骤S23:利用关联规则分析法对用户业务特征数据进行业务风险分析,生成业务风险数据;
步骤S24:利用聚类分析法对用户业务特征数据及业务风险数据进行数据聚类分析,生成第一业务特征风险数据。
本发明通过特征点检测算法对专家数据库进行特征检测,生成用户业务特征编码,该步骤的目的是提取出用户业务数据的特征,以便后续分析和分类,例如,在银行业务中,特征点可以是用户的交易金额、交易次数、交易时间等,用特征工程法对用户业务特征编码进行特征提取,生成用户业务特征数据,该步骤的目的是从用户业务特征编码中提取出有用的信息,以便进行后续分析和分类,例如,在银行业务中,决策树算法可以通过分析用户交易金额和交易次数之间的关系,判断用户是否存在异常交易行为,利用关联规则分析法对用户业务特征数据进行业务风险分析,生成业务风险数据,该步骤的目的是分析用户业务特征数据之间的关系,找出其中的规律和异常,以便识别业务风险,例如,在银行业务中,可以通过关联规则分析来判断哪些用户的交易行为存在异常风险,利用聚类分析法对用户业务特征数据及业务风险数据进行数据聚类分析,生成第一业务特征风险数据,该步骤的目的是将用户业务特征数据和业务风险数据进行分类,以便识别出不同风险水平的用户和业务,例如,在银行业务中,可以将用户按照交易金额和交易次数分类,以识别出不同风险水平的用户,因此,通过这个流程对用户业务特征数据进行分析和分类,可以帮助企业识别出不同风险水平的用户和业务,从而采取不同的风险预测和控制策略,这样可以大大提高企业的风险管理水平,保护企业和用户的利益。
在本发明实施例中,利用特征点检测算法,对预处理后的数据进行特征点检测,并提取出关键的、有区分度的业务特征点,根据特征点检测的结果,对每个用户的业务特征进行编码,生成用户业务特征编码,根据业务需求和数据特征性,采用特征工程法,对用户业务特征编码进行特征选择,筛选出重要特征并剔除无关特征,利用特征工程法对用户业务特征编码进行特征提取,根据特征选择得到的结果,对选定的业务特征进行提取,构建高维特征数据集,生成用户业务特征数据,利用关联规则分析法对用户业务特征数据进行业务风险分析,对用户业务特征数据进行可视化展示和探索性分析,挖掘其潜在的业务风险信息,利用关联规则分析技术,对业务特征数据中存在的关联规则进行挖掘和分析,提取业务风险数据,对用户业务特征数据及业务风险数据进行聚类分析,将相似业务特征和业务风险数据分到同一簇中,根据聚类分析的结果,将同一簇中的业务特征和业务风险数据统计,并生成第一业务特征风险数据,为用户的风险评估和决策提供可靠的数据依据。
在本说明书的一个实施例中,步骤S21的具体步骤:
步骤S211:利用特征点检测算法对专家数据库进行特征检测,生成专家数据库特征数据;
步骤S212:对专家数据库特征数据进行特征数据二值化,生成专家数据库特征二值化数据;
步骤S213:对专家数据库特征二值化数据进行特征编码,生成用户业务特征编码。
本发明通过特征点检测算法对专家数据库进行特征检测,生成专家数据库特征数据,该步骤的目的是从专家数据库记录中提取出与目标分类任务相关的重要特征,例如,在医学领域,可能会提取出受试者的年龄、性别、体重、身高、生物标记物等特征,对专家数据库特征数据进行特征数据二值化,生成专家数据库特征二值化数据,该步骤的目的是将专家数据库特征数据转换为数字形式,以便机器学习模型可以对其进行处理,对专家数据库特征二值化数据进行特征编码,生成用户业务特征编码,该步骤的目的是将专家数据库特征数据转换为一组特征编码,以便用于机器学习模型的训练,使用独热编码将分类任务中不同类别的特征值进行编码,用于支持一些机器学习算法训练,如逻辑回归算法,通过这个流程,可以从专家数据库中提取出以有意义的特征,将其转换为可用于训练机器学习模型的数字格式,并将其编码为特征向量,这样,企业可以使用这些特征向量来训练分类模型,该模型可以成功地将未知数据分类为前述任务操作所指定的类别,从而帮助企业进行自动分类并进行更好的决策。
在本发明实施例中,利用特征点检测算法,对预处理后的业务数据进行特征点检测,并提取出关键的、有区分度的特征点,根据特征点检测的结果,对每个业务样本进行特征描述,生成专家数据库特征数据,对专家数据库特征数据进行规范化处理,确保数据的统一性和可比性,对规范化后的专家数据库特征数据进行二值化处理,将每个特征的取值转化为0或1,将每个业务样本的特征二值化后,生成专家数据库特征二值化数据,根据业务需求和数据特征性,采用特征工程法,对专家数据库特征二值化数据进行特征选择,筛选出重要的特征并剔除无关特征,根据特征选择得到的结果,对选定的业务特征进行提取,生成用户业务特征数据,根据特征提取的结果,对每个用户的业务特征进行编码,生成用户业务特征编码,为用户的风险评估和决策提供可靠的数据依据。
本发明实施例中,参考图4所述,为步骤S3的详细实施步骤流程示意图,在本说明书的一个实施例中,所述步骤S3的详细实施步骤包括:
步骤S31:利用事件树分析法对第一业务特征风险数据进行风险识别,生成业务特征风险数据;
步骤S32:利用业务特征风险预测计算公式对业务特征风险数据进行风险预测计算,生成业务特征风险矩阵;
步骤S33:利用大数据风险识别分析法对业务风险历史数据进行风险评估,生成历史风险评估数据;
步骤S34:利用历史业务风险概率计算公式对历史风险评估数据进行风险概率计算,生成历史风险概率数据;
步骤S35:利用元学习融合算法对业务特征风险矩阵及历史风险概率数据进行数据融合,生成第二业务特征风险数据;
本发明通过事件树分析法对第一业务特征风险数据进行风险识别,生成业务特征风险数据,该步骤的目标是通过风险评估和风险分析方法,识别第一业务特征中存在的潜在风险因素,并将它们转换为业务特征风险数据,利用业务特征风险预测计算公式对业务特征风险数据进行风险预测计算,生成业务特征风险矩阵,该步骤的目标是运用数学模型和风险预测方法,预测业务特征风险数据在未来的变化趋势,并生成业务特征风险矩阵以便于后续的风险评估,利用大数据风险识别分析法对业务风险历史数据进行风险评估,生成历史风险评估数据,该步骤的目标是通过大数据技术和统计分析方法,对历史业务数据进行挖掘和分析,识别历史业务数据中存在的潜在风险因素,并转换为历史风险评估数据,利用历史业务风险概率计算公式对历史风险评估数据进行风险概率计算,生成历史风险概率数据,该步骤的目标是运用数学模型和风险计算方法,计算历史业务风险评估数据的概率,预测未来业务风险的可能性,并生成历史风险概率数据,利用元学习融合算法对业务特征风险矩阵及历史风险概率数据进行数据融合,生成第二业务特征风险数据,该步骤的目标是对第一业务特征风险数据和历史风险概率数据进行集成和融合,形成第二业务特征风险数据,该数据能够更准确地反映出当前业务存在的风险状态,企业可以利用各种风险预测和分析方法来识别关键风险因素并预测未来的风险发展趋势,此外,融合不同类型的数据,更好地反映现实情况,提高模型的预测准确性,从而帮助企业更好地应对风险问题。
在本发明实施例中,根据第一业务特征风险数据,构建事件树模型,将可能发生的风险事件按照因果关系排列在树形结构中,通过对事件树进行分析,识别出各个事件节点对应的风险概率,将风险概率与对应的业务特征数据结合,生成业务特征风险数据,根据第一业务特征风险数据、历史风险数据等信息,设计业务特征风险预测计算公式,利用业务特征风险预测计算公式,对每个业务样本进行风险预测计算,得到业务特征风险矩阵,利用大数据分析技术,对历史业务风险数据进行风险识别和分析,通过大数据风险识别分析法,得到历史风险评估数据,包括历史风险事件、每个事件对应的风险概率等信息,利用历史业务风险概率计算公式,对历史风险评估数据进行风险概率计算,得到历史风险概率数据,将业务特征风险矩阵和历史风险概率数据作为元数据,设计元学习融合算法,将两个数据集融合成一个综合的特征风险数据集,利用元学习融合算法,对业务特征风险矩阵和历史风险概率数据进行融合,得到第二业务特征风险数据。
在本说明书的一个实施例中,步骤S32中的业务特征风险预测计算公式具体为:
其中,R为预测的业务特征风险系数值,i为第i个业务特征因素,n为n个业务特征因素的总和,wi为第i个业务特征因素的权重,fi为第i个业务特征的市场份额保有量,xi为第i个业务特征的预测结果的概率值,maxg为市场业务量的最大值,ming为市场业务量的最小值。为第i个业务特征因素的加权和,/>为该业务特征因素的均值的立方根;
本发明通过考虑业务特征因素的加权和,通过/>将加权后的业务特征因素转换为风险的概率值,从0到1,对多个因素进行综合评估,反映它们对业务风险的综合影响,提高评估准确性,可以将多个因素的线性组合转化为非线性形式,从而更好地捕捉变量之间的关系和相互作用,将结果映射到[0,1]的特点,因此可以将彼此不同的因素进行加权和计算,再映射到[0,1]之间进行标准化,使得结果更容易被解释和比较,将上述概率值转换为风险的估计值,通过/>表示业务特征因素均值的立方根,作为风险预测的指标之一,通过/>反映了市场业务量的范围,使得大范围的业务量变化更容易被捕捉到,从而更全面地反映市场情况,使评估结果更具可信度,考虑多个业务特征因素,使用标准化技术,考虑市场业务量的范围和分布,采用科学合理的数学运算方法,从而使评估结果更准确、可靠、科学。
在本说明书的一个实施例中,步骤S34中的历史业务风险概率计算公式具体为:
其中,P为历史业务风险概率值,T0为历史业务风险的基准水平值,为第i个业务特征因素,n为n个业务特征因素的总和,wi为第i个业务特征因素的权重,fi为第i个业务特征的市场份额保有量,j为第j个历史时间点业务特征因素,n为n个历史时间点业务特征因素的总和,Tj为第j个历史时间点历史业务风险概率值,kj为第j个历史时间点的业务份额占市场份额的权重,x为当前时间点的业务风险概率值,σ为历史风险的波动值。
本发明通过将历史业务数据和实时业务数据的加权和转换为风险的概率值,定量化历史业务风险概率,通过考虑历史业务特征因素和历史时间点业务特征因素的权重,计算出历史业务风险概率值。这有助于企业更具体地了解历史业务风险的波动情况,为后续风险管理决策提供准确的基础数据,通过(x-T0)2表示当前业务风险概率值x与历史业务风险的基准水平值,这个差异平方后,除以历史风险的波动值σ的平方,得到指数部分的值,当前业务风险概率值与历史水平的差异越大,指数部分的值就越大,说明当前业务风险概率值的不确定性越高,反之则越低,虑了当前业务特征因素的影响,还考虑了历史时间点业务特征因素的权重。这有助于企业了解历史业务风险的发展趋势和规律,为制定更加科学的风险管理策略提供有益参考,采用历史风险的波动情况作为分母,通过将当前时间点的业务风险概率值带入高斯分布函数,计算出当前风险概率值的大小。这有助于企业了解历史风险的波动情况和风险规律,为制定更加科学的风险管理策略提供有益参考,该公式不仅考虑了市场份额保有量对历史业务风险的影响,还考虑了历史时间点业务份额占市场份额的权重。
在本说明书的一个实施例中,步骤S4的具体步骤:
步骤S41:利用主成分算法对第二业务特征风险数据进行特征提取,生成第二业务特征风险向量数据;
步骤S42:利用深度学习算法对第二业务特征风险向量数据进行数据可视化处理,生成业务特征风险数据可视化视图;
步骤S43:用JavaScript库对业务特征风险数据可视化视图进行交互化处理,生成业务特征风险数据可交互视图。
本发明通过主成分算法对第二业务特征风险数据进行特征提取,生成第二业务特征风险向量数据,该步骤的目标是将业务特征风险数据中的冗余或相关特征提取出来,形成更少但更有意义的主成分,以简化数据分析的复杂度,利用深度学习算法对第二业务特征风险向量数据进行数据可视化处理,生成业务特征风险数据可视化视图,该步骤的目标是将主成分的数据表示可视化,以便更清楚地展示业务特征风险数据的关键特征和相互关系,以帮助分析师和决策者更好地理解数据,用JavaScript库对业务特征风险数据可视化视图进行交互化处理,生成业务特征风险数据可交互视图,该步骤的目标是将可视化视图转换为可交互式的界面,以便用户更好地与数据进行互动分析、探索和以图表的形式展现不同场景的数据报告,企业可以将复杂的业务特征风险数据转换为易于理解和使用的可视化和交互式视图,以便更好地识别、评估和应对业务风险问题,此外,可视化和交互化的数据表示方式有助于加强对数据的沟通和协作,提高企业的决策效率和质量。
在本发明实施例中,利用主成分算法对第二业务特征风险数据进行特征提取,对第二业务特征风险数据进行规范化处理,确保不同特征数据之间的量纲一致,例如将数据归一化到[0,1]之间,利用主成分分析算法对规范化后的数据进行降维处理,提取数据的主要特征,生成第二业务特征风险向量数据,利用深度学习算法对第二业务特征风险向量数据进行数据可视化处理,生成业务特征风险数据可视化视图,根据需求选择适合的JavaScript库,例如D3.js、Echarts等,用于对业务特征风险数据可视化视图进行交互化处理,使用选择的JavaScript库,对业务特征风险数据可视化视图进行交互化处理,实现用户交互和数据动态展示,生成业务特征风险数据可交互视图。
在本说明书的一个实施例中,步骤S5的具体步骤:
步骤S51:利用循环卷积算法对业务特征风险数据可交互视图进行卷积数据切割,生成业务风险特征网络;
步骤S52:利用决策树算法对业务风险特征网络进行边缘特征加强处理,生成业务风险特征序列;
步骤S53:利用超像素卷积算法对业务风险特征序列进行膨胀卷积,生成业务风险专家决策模型;
步骤S54:利用神经网络算法对业务特征风险数据可交互视图进行历史风险数据分析,生成历史风险决策分析图;
步骤S55:利用多尺度采样算法对历史风险决策分析图进行空间金字塔池化多层采样,生成历史风险决策模型。
本发明通过循环卷积算法对业务特征风险数据可交互视图进行卷积数据切割,生成业务风险特征网络,该步骤旨在通过卷积数据切割,将数据可交互视图转换为业务特征风险数据的特征网络表示,以便更好地理解和使用数据,利用决策树算法对业务风险特征网络进行边缘特征加强处理,生成业务风险特征序列,该步骤旨在利用决策树算法对业务风险特征网络进行特征选择和边缘特征加强处理,以得到更为准确和有价值的业务风险特征序列,利用决策树算法对业务风险特征网络进行边缘特征加强处理,生成业务风险特征序列,该步骤旨在利用决策树算法对业务风险特征网络进行特征选择和边缘特征加强处理,以得到更为准确和有价值的业务风险特征序列,利用决策树算法对业务风险特征网络进行边缘特征加强处理,生成业务风险特征序列,该步骤旨在利用决策树算法对业务风险特征网络进行特征选择和边缘特征加强处理,以得到更为准确和有价值的业务风险特征序列,利用多尺度采样算法对历史风险决策分析图进行空间金字塔池化多层采样,生成历史风险决策模型,该步骤旨在利用多尺度采样算法对历史风险决策分析图进行处理,以得到历史风险决策模型,为企业决策者提供了更细致、更准确和可靠的历史风险数据分析报告。
在本发明实施例中,利用循环卷积算法对业务特征风险数据可交互视图进行数据切割,生成多个数据块,利用循环卷积算法对数据块进行卷积处理,生成业务风险特征网络,该网络为多层卷积神经网络,利用决策树算法对业务风险特征网络进行边缘特征提取处理,提高网络的特征选择能力,将提取的边缘特征按照一定规则进行聚合,生成业务风险特征序列,对业务风险特征序列进行膨胀卷积处理,增强网络对数据局部特征和全局特征的感知能力,利用超像素卷积算法对序列进行卷积提取特征,生成业务风险专家决策模型,从业务特征风险数据可交互视图中选取相关的历史风险数据,构建历史风险数据集,利用神经网络对历史风险数据集进行建模,学习历史数据的规律和特点,利用学习到的模型对历史风险数据集进行分析,生成历史风险决策分析图,利用多尺度采样算法对历史风险决策分析图进行空间金字塔池化多层采样,从而得到具有空间多尺度分辨率的特征图,利用多尺度采样算法对历史风险决策分析图进行空间金字塔池化多层采样,从而得到具有空间多尺度分辨率的特征图。
在本说明书的一个实施例中,步骤S55的具体步骤:
步骤S551:利用多尺度采样算法对历史风险决策分析图进行空间金字塔池化多层采样,生成历史风险决策卷积特征数据;
步骤S552:对历史风险决策卷积特征数据进行卷积特征映射,生成历史风险决策卷积特征向量;
步骤S553:对历史风险决策卷积特征向量进行向量拼接,生成历史风险决策模型。
本发明通过,利用多尺度采样算法对历史风险决策分析图进行空间金字塔池化多层采样,生成历史风险决策卷积特征数据,这个步骤的目的是为了从历史风险决策分析图中提取出有用的特征信息,多尺度采样算法能够在不同尺度下对图像进行采样,并通过金字塔池化和多层采样来获取更全面的特征信息,这样可以获得更准确、更全面的历史风险决策卷积特征数据,为后续的处理提供更加丰富和有用的信息,对历史风险决策卷积特征数据进行卷积特征映射,生成历史风险决策卷积特征向量,这个步骤的目的是将历史风险决策卷积特征数据进行压缩和变换,得到更加简洁、抽象化的卷积特征向量,卷积特征映射使用卷积核将卷积特征数据进行变换,得到新的特征向量,能够更好地表达历史风险决策卷积特征数据和提高模型的泛化能力,对历史风险决策卷积特征数据进行卷积特征映射,生成历史风险决策卷积特征向量,这个步骤的目的是将历史风险决策卷积特征数据进行压缩和变换,得到更加简洁、抽象化的卷积特征向量,卷积特征映射使用卷积核将卷积特征数据进行变换,得到新的特征向量,能够更好地表达历史风险决策卷积特征数据和提高模型的泛化能力。
在本发明实施例中,对历史风险决策分析图进行多尺度采样,然后进行空间金字塔池化多层采样,得到多个不同尺度的池化特征,将不同尺度的池化特征进行组合生成历史风险决策卷积特征数据,对历史风险决策卷积特征数据进行卷积特征映射,提取出历史风险决策的卷积特征,将卷积特征映射得到的历史风险决策卷积特征转化为卷积特征向量,将历史风险决策卷积特征向量按照一定的规则进行拼接,得到完整的历史风险决策特征向量,利用得到的完整历史风险决策特征向量进行模型的训练,从而生成历史风险决策模型,用于进行实时风险决策预测和分析。
在本说明书的一个实施例中,步骤S6的具体步骤:
步骤S61:利用组合分类器权重算法对业务风险专家决策模型及历史风险决策模型进行分类器权重分配,生成决策模型权重数据;
步骤S62:基于决策模型权重数据利用组合分类器模型权重计算公式对业务风险专家决策模型及历史风险决策模型进行权重计算,生成多个组合分类器权重子模型;
步骤S63:利用堆叠泛化法对组合分类器权重子模型进行模型融合,生成业务风险专家决策融合模型。
本发明通过组合分类器权重算法对业务风险专家决策模型及历史风险决策模型进行分类器权重分配,生成决策模型权重数据,这个步骤的目的是为了对业务风险专家决策模型及历史风险决策模型进行分配权重,以达到更好的融合效果,组合分类器权重算法会根据每个分类器的准确性和可信度来分配权重,使得准确度更高、可信度更高的分类器在融合中占据更大的权重,基于决策模型权重数据利用组合分类器模型权重计算公式对业务风险专家决策模型及历史风险决策模型进行权重计算,生成多个组合分类器权重子模型,这个步骤的目的是根据分配的权重,对业务风险专家决策模型及历史风险决策模型进行权重计算,生成多个组合分类器权重子模型,在计算过程中,权重高的分类器会被分配更大的权重,从而对决策结果产生更大的影响,利用堆叠泛化法对组合分类器权重子模型进行模型融合,生成业务风险专家决策融合模型,这个步骤的目的是通过堆叠泛化法对多个组合分类器权重子模型进行集成和融合,得到更加精确和准确的业务风险专家决策融合模型,在堆叠泛化法中,将多个组合分类器权重子模型集成到一个超级模型中,通过学习这个超级模型,可以让整个融合模型的准确性和稳定性得到显著提高,从而更好地支持企业决策者做出精准的业务决策。
在本发明实施例中,对业务风险专家决策模型和历史风险决策模型进行相应的初始权重分配,对分类器预测错误的样本进行权重调整,增加分类器对错误预测样本的关注度,将对应的分类器权重数据记录在权重表中,利用组合分类器权重计算公式计算业务风险专家决策模型和历史风险决策模型的权重值,得到多个组合分类器权重子模型,将每个组合分类器模型的权重数据和模型存储在数据库中,以便后续合并和使用,将多个组合分类器权重子模型堆叠起来,形成类似于多层神经网络的结构,其中每一层都是一个组合分类器模型,对于测试样本,对业务风险专家决策模型和历史风险决策模型分别生成特征向量,将特征向量输入到模型堆叠中,通过各个层次的组合分类器进行预测,得到最终的业务风险专家决策融合模型的预测结果,根据实际预测效果和需求,对模型进行参数调整和优化,以达到更好的预测效果,将调整后的业务风险专家决策融合模型发布在生产环境中,用于实时风险决策分析和预测。
在本发明实施例中,步骤S62中的组合分类器模型权重计算公式具体为:
其中,f(x)为组合分类器权重系数,n为基分类器的数量,ti为第i个基分类器在组合分类器中的权重,hi为第i个基分类器对权重的预测值,(x)为输入初始基分类器的样本值,m为基分类器对结果值的预测结果的和,vi为第i个基分类器对结果值的预测结果,gi为第i个基分类器对结果值的实际结果,N为分类结果的数量,vjk为第j个基分类器对第k个基分类器的权重,hk为第k个基分类器对样本的分类结果,为第i个基分类器对结果值预测的最大实际结果值,/>为第i个基分类器对结果值预测的最小实际结果值。
本发明通过表示多个基分类器预测结果的加权和,表示所有基分类器预测结果和实际结果之间的差异程度。该部分计算得到的值越小,表示基分类器的预测结果越接近于实际结果,对权重系数的影响越大,基于多个基分类器的预测结果来计算组合分类器的权重系数,从而提高分类器的准确性。通过将多个基分类器的预测结果组合,可以有效地降低基分类器的预测误差,提高分类器的精度,通过/>表示n个基分类器对于当前样本的预测结果和预测权重的加权和。该部分计算结果越大,说明基分类器对于当前样本的影响越大,对权重值的影响也越大,考虑了不同的基分类器对分类器准确性的贡献程度。这有助于区分不同基分类器对分类器性能的贡献,从而更好地利用基分类器的优点,进一步提高分类器的准确性,通过/>表示预测结果之间的距离。这有助于更好地利用预测结果的范围,提高分类器的准确性。
在本说明书的一个实施例中,提供一种融合专家模型决策的数据识别方法及系统,包括至少一个处理器;
与至少一个处理器通信连接的存储器;
存储器存储有可被至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器能够执行如上所述的融合专家模型决策的数据识别方法。
本发明通过建立融合专家模型决策系统,通过大数据挖掘法获取用户业务活动数据及业务风险历史数据,对数据进行预分类处理,能够基于过去的经验和领域知识对数据进行自动分类,从而可以有效地将数据进行初步筛选,减少人工操作的工作量,提高整个识别过程的效率和准确性,利用机器学习方法对预分类处理后的数据进行训练和测试,机器学习方法能够利用大量数据进行模型的训练和测试,对数据进行更深层次的分析和处理,从而进一步提高数据识别的准确性和效率,采用多元分类器技术,对数据进行综合判断和评估,通过综合多个分类器的结果,可以得出更为准确和可靠的数据识别结果,从而能够更好地支持企业决策者做出正确的决策,利用模型融合技术对多个分类器的结果进行融合处理,生成综合评估结果,过模型融合技术,可以将多个分类器的优点进行集成和整合,得到更为精准和稳定的综合评估结果,从而能够更好地支持企业决策者做出更加明智的决策,通过模型融合技术,可以将多个分类器的优点进行集成和整合,得到更为精准和稳定的综合评估结果,从而能够更好地支持企业决策者做出更加明智的决策。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在申请文件的等同要件的含义和范围内的所有变化涵括在本发明内。
应当理解的是,虽然在这里可能使用了术语“第一”、“第二”等等来描述各个单元,但是这些单元不应当受这些术语限制。使用这些术语仅仅是为了将一个单元与另一个单元进行区分。举例来说,在不背离示例性实施例的范围的情况下,第一单元可以被称为第二单元,并且类似地第二单元可以被称为第一单元。这里所使用的术语“和/或”包括其中一个或更多所列出的相关联项目的任意和所有组合。
上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所发明的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种融合专家模型的数据识别方法,其特征在于,包括以下步骤:
步骤S1:利用大数据挖掘法获取用户业务活动数据及业务风险历史数据;利用智能传感器获取用户实时业务数据;利用数据仓库集成法对用户业务活动数据及用户实时业务数据进行数据集成,构建专家数据库;
步骤S2:利用特征工程法对专家数据库进行特征提取,生成用户业务特征数据;利用关联规则分析法对用户业务特征数据进行业务风险分析,生成第一业务特征风险数据;
步骤S3:利用事件树分析法对第一业务特征风险数据进行风险识别,生成业务特征风险矩阵;利用大数据风险识别分析法对业务风险历史数据进行风险概率预测,生成历史风险概率数据;对业务特征风险矩阵及历史风险概率数据进行数据融合,生成第二业务特征风险数据;
步骤S4:利用深度学习算法对第二业务特征风险数据进行交互式可视化处理,生成业务特征风险数据可交互视图;
步骤S5:利用决策树算法对业务特征风险数据可交互视图进行膨胀卷积,生成业务风险专家决策模型;利用神经网络算法对业务特征风险数据可交互视图进行历史风险数据多层采样,生成历史风险决策模型;
步骤S6:利用组合分类器权重算法对业务风险专家决策模型及历史风险决策模型进行模型融合,生成业务风险专家决策融合模型。
2.根据权利要求1所述的方法,其特征在于,步骤S1的具体步骤为:
步骤S11:利用大数据挖掘法获取用户业务活动数据及业务风险历史数据;用户业务活动数据包括用户交易记录数据、用户账户信息数据、用户行为轨迹数据及用户异常数据;
步骤S12:利用智能传感器获取用户实时业务数据;用户实时业务数据包括用户实时业务活动数据及用户实时位置数据;
步骤S13:利用数据仓库集成法对用户业务活动数据及用户实时业务数据进行数据集成,生成用户业务仓库数据;
步骤S14:利用关系型数据库法对用户业务仓库数据进行数据存储,构建专家数据库。
3.根据权利要求2所述的方法,其特征在于,步骤S2的具体步骤为:
步骤S21:利用特征点检测算法对专家数据库进行特征检测,生成用户业务特征编码;
步骤S22:利用特征工程法对用户业务特征编码进行特征提取,生成用户业务特征数据;
步骤S23:利用关联规则分析法对用户业务特征数据进行业务风险分析,生成业务风险数据;
步骤S24:利用聚类分析法对用户业务特征数据及业务风险数据进行数据聚类分析,生成第一业务特征风险数据。
4.根据权利要求3所述的方法,其特征在于,步骤S21的具体步骤为:
步骤S211:利用特征点检测算法对专家数据库进行特征检测,生成专家数据库特征数据;
步骤S212:对专家数据库特征数据进行特征数据二值化,生成专家数据库特征二值化数据;
步骤S213:对专家数据库特征二值化数据进行特征编码,生成用户业务特征编码。
5.根据权利要求4所述的方法,其特征在于,步骤S3的具体步骤为:
步骤S31:利用事件树分析法对第一业务特征风险数据进行风险识别,生成业务特征风险数据;
步骤S32:利用业务特征风险预测计算公式对业务特征风险数据进行风险预测计算,生成业务特征风险矩阵;
步骤S33:利用大数据风险识别分析法对业务风险历史数据进行风险评估,生成历史风险评估数据;
步骤S34:利用历史业务风险概率计算公式对历史风险评估数据进行风险概率计算,生成历史风险概率数据;
步骤S35:利用元学习融合算法对业务特征风险矩阵及历史风险概率数据进行数据融合,生成第二业务特征风险数据;
其中,步骤S32中的业务特征风险预测计算公式具体为:
其中,R为预测的业务特征风险系数值,i为第i个业务特征因素,n为n个业务特征因素的总和,wi为第i个业务特征因素的权重,fi为第i个业务特征的市场份额保有量,xi为第i个业务特征的预测结果的概率值,maxg为市场业务量的最大值,ming为市场业务量的最小值。为第i个业务特征因素的加权和,/>为该业务特征因素的均值的立方根;
其中,步骤S34中的历史业务风险概率计算公式具体为:
其中,P为历史业务风险概率值,T0为历史业务风险的基准水平值,为第i个业务特征因素,n为n个业务特征因素的总和,wi为第i个业务特征因素的权重,fi为第i个业务特征的市场份额保有量,j为第j个历史时间点业务特征因素,n为n个历史时间点业务特征因素的总和,Tj为第j个历史时间点历史业务风险概率值,kj为第j个历史时间点的业务份额占市场份额的权重,x为当前时间点的业务风险概率值,σ为历史风险的波动值。
6.根据权利要求3所述的方法,其特征在于,步骤S4的具体步骤为:
步骤S41:利用主成分算法对第二业务特征风险数据进行特征提取,生成第二业务特征风险向量数据;
步骤S42:利用深度学习算法对第二业务特征风险向量数据进行数据可视化处理,生成业务特征风险数据可视化视图;
步骤S43:用JavaScript库对业务特征风险数据可视化视图进行交互化处理,生成业务特征风险数据可交互视图。
7.根据权利要求6所述的方法,其特征在于,步骤S5的具体步骤为:
步骤S51:利用循环卷积算法对业务特征风险数据可交互视图进行卷积数据切割,生成业务风险特征网络;
步骤S52:利用决策树算法对业务风险特征网络进行边缘特征加强处理,生成业务风险特征序列;
步骤S53:利用超像素卷积算法对业务风险特征序列进行膨胀卷积,生成业务风险专家决策模型;
步骤S54:利用神经网络算法对业务特征风险数据可交互视图进行历史风险数据分析,生成历史风险决策分析图;
步骤S55:利用多尺度采样算法对历史风险决策分析图进行空间金字塔池化多层采样,生成历史风险决策模型。
8.根据权利要求7所述的方法,其特征在于,步骤S55的具体步骤为:
步骤S551:利用多尺度采样算法对历史风险决策分析图进行空间金字塔池化多层采样,生成历史风险决策卷积特征数据;
步骤S552:对历史风险决策卷积特征数据进行卷积特征映射,生成历史风险决策卷积特征向量;
步骤S553:对历史风险决策卷积特征向量进行向量拼接,生成历史风险决策模型。
9.根据权利要求8所述的方法,其特征在于,步骤S6的具体步骤为:
步骤S61:利用组合分类器权重算法对业务风险专家决策模型及历史风险决策模型进行分类器权重分配,生成决策模型权重数据;
步骤S62:基于决策模型权重数据利用组合分类器模型权重计算公式对业务风险专家决策模型及历史风险决策模型进行权重计算,生成多个组合分类器权重子模型;
步骤S63:利用堆叠泛化法对组合分类器权重子模型进行模型融合,生成业务风险专家决策融合模型;
其中,步骤S62中的组合分类器模型权重计算公式具体为:
其中,f(x)为组合分类器权重系数,n为基分类器的数量,ti为第i个基分类器在组合分类器中的权重,hi为第i个基分类器对权重的预测值,(x)为输入初始基分类器的样本值,m为基分类器对结果值的预测结果的和,vi为第i个基分类器对结果值的预测结果,gi为第i个基分类器对结果值的实际结果,N为分类结果的数量,vjk为第j个基分类器对第k个基分类器的权重,hk为第k个基分类器对样本的分类结果,为第i个基分类器对结果值预测的最大实际结果值,/>为第i个基分类器对结果值预测的最小实际结果值。
10.一种融合专家模型决策的数据识别系统,其特征在于,包括:
至少一个处理器;
至少一个处理器通信连接的存储器;
存储器存储有可被至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器能够执行如权利要求1至9中任一项所述的融合专家模型决策的数据识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310724350.1A CN116861331A (zh) | 2023-06-16 | 2023-06-16 | 一种融合专家模型决策的数据识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310724350.1A CN116861331A (zh) | 2023-06-16 | 2023-06-16 | 一种融合专家模型决策的数据识别方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116861331A true CN116861331A (zh) | 2023-10-10 |
Family
ID=88222517
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310724350.1A Pending CN116861331A (zh) | 2023-06-16 | 2023-06-16 | 一种融合专家模型决策的数据识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116861331A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117556225A (zh) * | 2024-01-12 | 2024-02-13 | 杭银消费金融股份有限公司 | 一种人行征信数据风险管理系统 |
CN117632905A (zh) * | 2023-11-28 | 2024-03-01 | 广州视声智能科技有限公司 | 基于云端使用记录的数据库管理方法及系统 |
CN117852980A (zh) * | 2024-01-16 | 2024-04-09 | 深圳市快金数据技术服务有限公司 | 基于MoE模型融合技术的智能物流服务管理系统及方法 |
CN117875724A (zh) * | 2024-03-12 | 2024-04-12 | 深圳市晟晟科技有限公司 | 一种基于云计算的采购风险管控方法及系统 |
-
2023
- 2023-06-16 CN CN202310724350.1A patent/CN116861331A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117632905A (zh) * | 2023-11-28 | 2024-03-01 | 广州视声智能科技有限公司 | 基于云端使用记录的数据库管理方法及系统 |
CN117632905B (zh) * | 2023-11-28 | 2024-05-17 | 广州视声智能科技有限公司 | 基于云端使用记录的数据库管理方法及系统 |
CN117556225A (zh) * | 2024-01-12 | 2024-02-13 | 杭银消费金融股份有限公司 | 一种人行征信数据风险管理系统 |
CN117556225B (zh) * | 2024-01-12 | 2024-04-05 | 杭银消费金融股份有限公司 | 一种人行征信数据风险管理系统 |
CN117852980A (zh) * | 2024-01-16 | 2024-04-09 | 深圳市快金数据技术服务有限公司 | 基于MoE模型融合技术的智能物流服务管理系统及方法 |
CN117852980B (zh) * | 2024-01-16 | 2024-08-20 | 深圳市快金数据技术服务有限公司 | 基于MoE模型融合技术的智能物流服务管理系统及方法 |
CN117875724A (zh) * | 2024-03-12 | 2024-04-12 | 深圳市晟晟科技有限公司 | 一种基于云计算的采购风险管控方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116861331A (zh) | 一种融合专家模型决策的数据识别方法及系统 | |
CN111143838B (zh) | 数据库用户异常行为检测方法 | |
CN117611015B (zh) | 一种建筑工程质量实时监测系统 | |
CN117235524A (zh) | 自动估值模型的学习训练平台 | |
CN116993504B (zh) | 一种钢材交易信息服务平台及交易数据处理方法 | |
CN117094184B (zh) | 基于内网平台的风险预测模型的建模方法、系统及介质 | |
CN115358155A (zh) | 一种电力大数据异常预警方法、装置、设备及可读存储介质 | |
CN118211169A (zh) | 基于深度学习的桥梁健康状态智能监测方法及系统 | |
CN117495109B (zh) | 一种基于神经网络的窃电用户识别系统 | |
CN117934035A (zh) | 一种房建工程造价预估方法、装置及存储介质 | |
CN113935413A (zh) | 一种基于卷积神经网的配网录波文件波形识别方法 | |
CN117782198A (zh) | 一种基于云边端架构的公路机电设备运行监测方法及系统 | |
CN117372723A (zh) | 一种智能化变电站违章作业预警系统 | |
CN114580472B (zh) | 工业互联网中因果与注意力并重的大型设备故障预测方法 | |
CN117632313B (zh) | 一种基于人工智能的软件驱动处理方法及系统 | |
CN118052558B (zh) | 基于人工智能的风控模型决策方法及系统 | |
CN117828280B (zh) | 基于物联网的消防信息智能采集及管理方法 | |
CN117539920B (zh) | 基于房产交易多维度数据的数据查询方法及系统 | |
CN113744081B (zh) | 窃电行为分析方法 | |
CN118447459B (zh) | 基于深度学习的滑坡堆积体监控方法及系统 | |
CN117391626A (zh) | 一种基于大数据的工程造价数据处理方法 | |
Zhou et al. | Identification of Strong Motion Record Baseline Drift Based on Bayesian Optimized Transformer Network | |
CN117235444A (zh) | 一种融合深度学习与专家经验的金融风控方法及系统 | |
Dalla Torre | Unsupervised Learning for Efficient Underwriting | |
CN118537144A (zh) | 一种农业保险核保风险预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |