CN115187153B - 应用于业务风险溯源的数据处理方法及系统 - Google Patents
应用于业务风险溯源的数据处理方法及系统 Download PDFInfo
- Publication number
- CN115187153B CN115187153B CN202211114298.XA CN202211114298A CN115187153B CN 115187153 B CN115187153 B CN 115187153B CN 202211114298 A CN202211114298 A CN 202211114298A CN 115187153 B CN115187153 B CN 115187153B
- Authority
- CN
- China
- Prior art keywords
- risk monitoring
- monitoring data
- data
- historical
- participle word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供的应用于业务风险溯源的数据处理方法及系统,涉及数据处理技术领域。在本发明中,对目标业务风险监控数据进行数据特征识别操作,以输出对应的目标数据特征信息。对于每一条历史业务风险监控数据,依据该历史业务风险监控数据对应的历史数据特征信息和目标业务风险监控数据对应的目标数据特征信息,进行数据相关性确定操作,以输出该历史业务风险监控数据和目标业务风险监控数据之间的数据相关系数。依据历史业务风险监控数据和目标业务风险监控数据之间的数据相关系数,对目标业务风险监控数据进行数据关联存储操作。基于上述方法,可以提高应用于业务风险溯源的业务风险监控数据的存储可靠性。
Description
技术领域
本发明涉及数据处理技术领域,具体而言,涉及一种应用于业务风险溯源的数据处理方法及系统。
背景技术
对于业务进行监控,使得可以形成业务风险监控数据,是对于业务风险进行溯源的重要依据。因此,在形成业务风险监控数据之后,对于业务风险监控数据的存储是非常重要的一个环节,使得在需要进行风险溯源的时候,可以从存储设备中提取出对应的业务风险监控数据,以进行分析处理。但是,在现有技术中,一般是直接对形成的业务风险监控数据进行存储,使得存在业务风险监控数据的存储可靠性不高的问题。
发明内容
有鉴于此,本发明的目的在于提供一种应用于业务风险溯源的数据处理方法及系统,以提高业务风险监控数据的存储可靠性。
为实现上述目的,本发明实施例采用如下技术方案:
一种应用于业务风险溯源的数据处理方法,应用于数据处理服务器,所述应用于业务风险溯源的数据处理方法包括:
对于任意一个数据采集终端设备,在获取到该数据采集终端设备采集的目标业务风险监控数据之后,对所述目标业务风险监控数据进行数据特征识别操作,以输出所述目标业务风险监控数据对应的目标数据特征信息;
对于存储的多条历史业务风险监控数据中的每一条历史业务风险监控数据,依据该历史业务风险监控数据对应的历史数据特征信息和所述目标业务风险监控数据对应的目标数据特征信息,对该历史业务风险监控数据和所述目标业务风险监控数据进行数据相关性确定操作,以输出该历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数;
依据所述多条历史业务风险监控数据中的每一条历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数,对所述目标业务风险监控数据进行数据关联存储操作。
在一些优选的实施例中,在上述应用于业务风险溯源的数据处理方法中,所述对于任意一个数据采集终端设备,在获取到该数据采集终端设备采集的目标业务风险监控数据之后,对所述目标业务风险监控数据进行数据特征识别操作,以输出所述目标业务风险监控数据对应的目标数据特征信息的步骤,包括:
对于任意一个数据采集终端设备,在该数据采集终端设备采集形成目标业务风险监控数据之后,对该目标业务风险监控数据进行获取操作,所述获取操作包括,对所述数据采集终端设备下发监控数据获取指令,所述数据采集终端设备依据该监控数据获取指令上报目标业务风险监控数据;
对所述目标业务风险监控数据进行数据特征识别操作,以输出所述目标业务风险监控数据对应的目标数据特征信息。
在一些优选的实施例中,在上述应用于业务风险溯源的数据处理方法中,所述对所述目标业务风险监控数据进行数据特征识别操作,以输出所述目标业务风险监控数据对应的目标数据特征信息的步骤,包括:
对所述目标业务风险监控数据进行数据特征识别操作,以输出所述目标业务风险监控数据对应的多个数据子特征;
依据所述目标业务风险监控数据对应的多个数据子特征进行子特征序列化操作,以形成所述目标业务风险监控数据对应的目标数据特征信息,所述目标数据特征信息属于子特征序列。
在一些优选的实施例中,在上述应用于业务风险溯源的数据处理方法中,所述对所述目标业务风险监控数据进行数据特征识别操作,以输出所述目标业务风险监控数据对应的多个数据子特征的步骤,包括:
对所述目标业务风险监控数据进行文本转换操作,以输出所述目标业务风险监控数据对应的业务风险监控文本,所述目标业务风险监控数据属于语音数据,且所述目标业务风险监控数据基于所述数据采集终端设备对目标业务对应的业务用户在办理该目标业务的过程中进行语音监控形成;
对所述业务风险监控文本进行分词操作,以形成所述业务风险监控文本对应的分词词语集合,所述分词词语集合包括多个文本分词词语;
依据所述多个文本分词词语,对所述目标业务进行业务领域确定操作,以输出所述目标业务对应的目标业务领域,再从通信连接的目标数据库中,筛查出预先针对所述目标业务领域配置的目标关键词集合;
依据所述目标关键词集合,对所述分词词语集合包括的多个文本分词词语进行筛查操作,以形成所述分词词语集合对应的分词词语筛查集合,所述分词词语筛查集合包括至少一个文本分词词语;
将所述分词词语筛查集合包括的至少一个文本分词词语中的每一个文本分词词语分别标记为所述目标业务风险监控数据对应的数据子特征。
在一些优选的实施例中,在上述应用于业务风险溯源的数据处理方法中,所述对于存储的多条历史业务风险监控数据中的每一条历史业务风险监控数据,依据该历史业务风险监控数据对应的历史数据特征信息和所述目标业务风险监控数据对应的目标数据特征信息,对该历史业务风险监控数据和所述目标业务风险监控数据进行数据相关性确定操作,以输出该历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数的步骤,包括:
对于存储的多条历史业务风险监控数据中的每一条历史业务风险监控数据,对该历史业务风险监控数据对应的历史数据特征信息和所述目标业务风险监控数据对应的目标数据特征信息进行相似度计算操作,以输出该历史业务风险监控数据和所述目标业务风险监控数据之间的特征相似度;
对于所述多条历史业务风险监控数据中的每一条历史业务风险监控数据,依据该历史业务风险监控数据和所述目标业务风险监控数据之间的特征相似度,对该历史业务风险监控数据和所述目标业务风险监控数据进行数据相关性确定操作,以输出该历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数。
在一些优选的实施例中,在上述应用于业务风险溯源的数据处理方法中,所述历史数据特征信息属于历史文本分词词语序列,所述目标数据特征信息属于文本分词词语序列,所述对于存储的多条历史业务风险监控数据中的每一条历史业务风险监控数据,对该历史业务风险监控数据对应的历史数据特征信息和所述目标业务风险监控数据对应的目标数据特征信息进行相似度计算操作,以输出该历史业务风险监控数据和所述目标业务风险监控数据之间的特征相似度的步骤,包括:
对于所述目标业务风险监控数据对应的目标数据特征信息对应的文本分词词语序列包括的每一个文本分词词语,确定所述历史业务风险监控数据对应的历史数据特征信息对应的历史文本分词词语序列中是否存在与该文本分词词语相同的历史文本分词词语,并在存在相同的历史文本分词词语的情况下,将该文本分词词语标记为第一文本分词词语、将该历史文本分词词语标记为该第一文本分词词语对应的第一历史文本分词词语,在不存在相同的历史文本分词词语的情况下,确定所述历史文本分词词语序列中是否存在与该文本分词词语之间的语义相关度满足预设条件的历史文本分词词语,并在存在语义相关度满足预设条件的历史文本分词词语的情况下,将该文本分词词语标记为第二文本分词词语、将该历史文本分词词语标记为该第二文本分词词语对应的第二历史文本分词词语;
对于所述文本分词词语序列中的每一个第一文本分词词语,以该第一文本分词词语为起点,按照预设序列长度对所述文本分词词语序列进行截取操作,以形成该第一文本分词词语对应的第一文本分词词语子序列,对于所述文本分词词语序列中的每一个第二文本分词词语,以该第二 文本分词词语为起点,按照预设序列长度对所述文本分词词语序列进行截取操作,以形成该第二文本分词词语对应的第二文本分词词语子序列;
对于所述历史文本分词词语序列中的每一个第一历史文本分词词语,以该第一历史文本分词词语为起点,按照预设序列长度对所述历史文本分词词语序列进行截取操作,以形成该第一历史文本分词词语对应的第一历史文本分词词语子序列,对于所述历史文本分词词语序列中的每一个第二历史文本分词词语,以该第二 历史文本分词词语为起点,按照预设序列长度对所述历史文本分词词语序列进行截取操作,以形成该第二历史文本分词词语对应的第二历史文本分词词语子序列;
对于所述文本分词词语序列中的每一个第一文本分词词语,对该第一文本分词词语对应的第一文本分词词语子序列和该第一文本分词词语对应的第一历史文本分词词语应的第一历史文本分词词语子序列进行序列相似度计算操作,以输出该第一文本分词词语对应的第一子序列相似度,对于所述文本分词词语序列中的每一个第二文本分词词语,对该第二文本分词词语对应的第二文本分词词语子序列和该第二文本分词词语对应的第二历史文本分词词语应的第二历史文本分词词语子序列进行序列相似度计算操作,以输出该第二文本分词词语对应的第二子序列相似度;
依据所述文本分词词语序列中的每一个第一文本分词词语对应的第一子序列相似度和每一个第二文本分词词语对应的第二子序列相似度进行相似度融合操作,以输出所述历史业务风险监控数据和所述目标业务风险监控数据之间的特征相似度。
在一些优选的实施例中,在上述应用于业务风险溯源的数据处理方法中,所述依据所述文本分词词语序列中的每一个第一文本分词词语对应的第一子序列相似度和每一个第二文本分词词语对应的第二子序列相似度进行相似度融合操作,以输出所述历史业务风险监控数据和所述目标业务风险监控数据之间的特征相似度的步骤,包括:
对于所述文本分词词语序列中的每一个第一文本分词词语,对该第一文本分词词语对应的第一文本分词词语子序列进行序列长度确定操作,以输出该第一文本分词词语对应的第一序列长度,再依据每一个第一文本分词词语对应的第一序列长度,对每一个所述第一文本分词词语进行融合系数确定操作,以输出每一个所述第一文本分词词语对应的融合系数,再依据每一个所述第一文本分词词语对应的融合系数,对每一个所述第一文本分词词语对应的第一子序列相似度进行融合操作,以输出第一相似度;
对于所述文本分词词语序列中的每一个第二文本分词词语,对该第二文本分词词语对应的第二文本分词词语子序列进行序列长度确定操作,以输出该第二文本分词词语对应的第二序列长度,再依据每一个第二文本分词词语对应的第二序列长度,并结合每一个第二文本分词词语与对应的第二历史文本分词词语之间的语义相关度,对每一个所述第二文本分词词语进行融合系数确定操作,以输出每一个第二文本分词词语对应的融合系数,再依据每一个第二文本分词词语对应的融合系数,对每一个第二文本分词词语对应的第二子序列相似度进行融合操作,以输出第二相似度;
对所述第一相似度和所述第二相似度进行加权均值计算,以输出所述历史业务风险监控数据和所述目标业务风险监控数据之间的特征相似度。
在一些优选的实施例中,在上述应用于业务风险溯源的数据处理方法中,所述依据所述多条历史业务风险监控数据中的每一条历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数,对所述目标业务风险监控数据进行数据关联存储操作的步骤,包括:
依据所述多条历史业务风险监控数据中的每一条历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数,从所述多条历史业务风险监控数据中筛查出至少一条历史业务风险监控数据,再将该至少一条历史业务风险监控数据分别定义为相关历史业务风险监控数据,以形成至少一条相关历史业务风险监控数据;
分别将所述至少一条相关历史业务风险监控数据中分每一条相关历史业务风险数据与所述目标业务风险监控数据之间建立数据关联关系;
对所述目标业务风险监控数据和所述数据关联关系进行存储操作,以实现对所述目标业务风险监控数据进行数据关联存储操作。
在一些优选的实施例中,在上述应用于业务风险溯源的数据处理方法中,所述依据所述多条历史业务风险监控数据中的每一条历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数,从所述多条历史业务风险监控数据中筛查出至少一条历史业务风险监控数据,再将该至少一条历史业务风险监控数据分别定义为相关历史业务风险监控数据,以形成至少一条相关历史业务风险监控数据的步骤,包括:
对于所述多条历史业务风险监控数据中的每一条历史业务风险监控数据,对该历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数与预先设置的相关系数对比值进行大小对比操作;
对于所述多条历史业务风险监控数据中的每一条历史业务风险监控数据,在该历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数大于或等于所述相关系数对比值的情况下,将该历史业务风险监控数据定义为所述目标业务风险监控数据对应的相关历史业务风险监控数据,再统计当前定义出的相关历史业务风险监控数据的数量;
在当前定义出的相关历史业务风险监控数据的数量小于或等于目标数量参考值的情况下,依据所述目标数量参考值,从所述多条历史业务风险监控数据中,筛查出对应的数据相关系数最大的至少一条历史业务风险监控数据,以作为相关历史业务风险监控数据。
本发明实施例还提供一种应用于业务风险溯源的数据处理系统,应用于数据处理服务器,所述应用于业务风险溯源的数据处理系统包括:
数据特征识别模块,用于对于任意一个数据采集终端设备,在获取到该数据采集终端设备采集的目标业务风险监控数据之后,对所述目标业务风险监控数据进行数据特征识别操作,以输出所述目标业务风险监控数据对应的目标数据特征信息;
数据相关性确定模块,用于对于存储的多条历史业务风险监控数据中的每一条历史业务风险监控数据,依据该历史业务风险监控数据对应的历史数据特征信息和所述目标业务风险监控数据对应的目标数据特征信息,对该历史业务风险监控数据和所述目标业务风险监控数据进行数据相关性确定操作,以输出该历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数;
数据关联存储模块,用于依据所述多条历史业务风险监控数据中的每一条历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数,对所述目标业务风险监控数据进行数据关联存储操作。
本发明实施例提供的一种应用于业务风险溯源的数据处理方法及系统,对目标业务风险监控数据进行数据特征识别操作,以输出对应的目标数据特征信息。对于每一条历史业务风险监控数据,依据该历史业务风险监控数据对应的历史数据特征信息和目标业务风险监控数据对应的目标数据特征信息,进行数据相关性确定操作,以输出该历史业务风险监控数据和目标业务风险监控数据之间的数据相关系数。依据历史业务风险监控数据和目标业务风险监控数据之间的数据相关系数,对目标业务风险监控数据进行数据关联存储操作。基于前述的内容,由于可以依据与历史业务风险监控数据之间的数据相关系数,对目标业务风险监控数据进行关联存储,使得在需要进行业务风险溯源时,在查找到目标业务风险监控数据时,还可以便利地对关联的历史业务风险监控数据进行查找,以进行对比分析,从而实现业务风险溯源的目的,使得可以在一定程度上提高应用于业务风险溯源的业务风险监控数据的存储可靠性。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
图1为本发明实施例提供的数据处理服务器的结构框图。
图2为本发明实施例提供的应用于业务风险溯源的数据处理方法包括的各步骤的流程示意图。
图3为本发明实施例提供的应用于业务风险溯源的数据处理系统包括的各模块的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本发明的一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1所示,本发明实施例提供了一种数据处理服务器。
需要说明的是,在一些具体的实施方式中,所述数据处理服务器可以包括存储器和处理器。详细地,所述存储器和处理器之间直接或间接地电性连接,以实现数据的传输或交互。例如,相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述存储器中可以存储有至少一个可以以软件或固件(firmware)的形式,存在的软件功能模块(计算机程序)。所述处理器可以用于执行所述存储器中存储的可执行的计算机程序,从而实现本发明实施例提供的应用于业务风险溯源的数据处理方法。
需要说明的是,在一些具体的实施方式中,所述存储器可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-Only Memory,PROM),可擦除只读存储器(ErasableProgrammable Read-Only Memory,EPROM),电可擦除只读存储器(Electric ErasableProgrammable Read-Only Memory,EEPROM)等。
需要说明的是,在一些具体的实施方式中,所述处理器可以是一种通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)、片上系统(System on Chip,SoC)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
需要说明的是,在一些具体的实施方式中,图1所示的结构仅为示意,所述数据处理服务器还可包括比图1中所示更多或者更少的组件,或具有与图1所示不同的配置,例如,可以包括用于与其它设备(如手机、电脑等数据采集终端设备)进行信息交互的通信单元。
参照图2所示,本发明实施例还提供一种应用于业务风险溯源的数据处理方法,该数据处理方法可应用于上述数据处理服务器。
其中,所述应用于业务风险溯源的数据处理方法有关的流程所定义的方法步骤,可以由所述数据处理服务器实现。为便于理解所述应用于业务风险溯源的数据处理方法,下面将对图2所示的具体流程,进行详细阐述。
步骤S110,对于任意一个数据采集终端设备,在获取到该数据采集终端设备采集的目标业务风险监控数据之后,对所述目标业务风险监控数据进行数据特征识别操作,以输出所述目标业务风险监控数据对应的目标数据特征信息。
在本发明实施例中,所述数据处理服务器可以,对于任意一个数据采集终端设备,在获取到该数据采集终端设备采集的目标业务风险监控数据之后,对所述目标业务风险监控数据进行数据特征识别操作,以输出所述目标业务风险监控数据对应的目标数据特征信息。
步骤S120,对于存储的多条历史业务风险监控数据中的每一条历史业务风险监控数据,依据该历史业务风险监控数据对应的历史数据特征信息和所述目标业务风险监控数据对应的目标数据特征信息,对该历史业务风险监控数据和所述目标业务风险监控数据进行数据相关性确定操作,以输出该历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数。
在本发明实施例中,所述数据处理服务器可以,对于存储的多条历史业务风险监控数据中的每一条历史业务风险监控数据,依据该历史业务风险监控数据对应的历史数据特征信息和所述目标业务风险监控数据对应的目标数据特征信息,对该历史业务风险监控数据和所述目标业务风险监控数据进行数据相关性确定操作,以输出该历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数。
步骤S130,依据所述多条历史业务风险监控数据中的每一条历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数,对所述目标业务风险监控数据进行数据关联存储操作。
在本发明实施例中,所述数据处理服务器可以,依据所述多条历史业务风险监控数据中的每一条历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数,对所述目标业务风险监控数据进行数据关联存储操作。
基于上述的内容(如步骤S110、步骤S120和步骤S130),由于可以依据与历史业务风险监控数据之间的数据相关系数,对目标业务风险监控数据进行关联存储,使得在需要进行业务风险溯源时,在查找到目标业务风险监控数据时,还可以便利地对关联的历史业务风险监控数据进行查找,以进行对比分析,从而实现业务风险溯源的目的,使得可以在一定程度上提高应用于业务风险溯源的业务风险监控数据的存储可靠性。
需要说明的是,在一些具体的实施方式中,前文描述的步骤S110,可以进一步包括以下具体的实施步骤:
对于任意一个数据采集终端设备,在该数据采集终端设备采集形成目标业务风险监控数据之后,对该目标业务风险监控数据进行获取操作,所述获取操作包括,对所述数据采集终端设备下发监控数据获取指令,所述数据采集终端设备依据该监控数据获取指令上报目标业务风险监控数据;
对所述目标业务风险监控数据进行数据特征识别操作,以输出所述目标业务风险监控数据对应的目标数据特征信息。
需要说明的是,在一些具体的实施方式中,所述对所述目标业务风险监控数据进行数据特征识别操作,以输出所述目标业务风险监控数据对应的目标数据特征信息的步骤,可以进一步包括以下具体的实施步骤:
对所述目标业务风险监控数据进行数据特征识别操作,以输出所述目标业务风险监控数据对应的多个数据子特征;
依据所述目标业务风险监控数据对应的多个数据子特征进行子特征序列化操作,以形成所述目标业务风险监控数据对应的目标数据特征信息,所述目标数据特征信息属于子特征序列。
需要说明的是,在一些具体的实施方式中,所述对所述目标业务风险监控数据进行数据特征识别操作,以输出所述目标业务风险监控数据对应的多个数据子特征的步骤,可以进一步包括以下具体的实施步骤:
对所述目标业务风险监控数据进行文本转换操作,以输出所述目标业务风险监控数据对应的业务风险监控文本,所述目标业务风险监控数据属于语音数据,且所述目标业务风险监控数据基于所述数据采集终端设备对目标业务对应的业务用户在办理该目标业务的过程中进行语音监控形成;
对所述业务风险监控文本进行分词操作,以形成所述业务风险监控文本对应的分词词语集合,所述分词词语集合包括多个文本分词词语;
依据所述多个文本分词词语,对所述目标业务进行业务领域确定操作,以输出所述目标业务对应的目标业务领域,再从通信连接的目标数据库中,筛查出预先针对所述目标业务领域配置的目标关键词集合;
依据所述目标关键词集合,对所述分词词语集合包括的多个文本分词词语进行筛查操作,以形成所述分词词语集合对应的分词词语筛查集合,所述分词词语筛查集合包括至少一个文本分词词语;
将所述分词词语筛查集合包括的至少一个文本分词词语中的每一个文本分词词语分别标记为所述目标业务风险监控数据对应的数据子特征。
需要说明的是,在一些具体的实施方式中,前文描述的步骤S120,可以进一步包括以下具体的实施步骤:
对于存储的多条历史业务风险监控数据中的每一条历史业务风险监控数据,对该历史业务风险监控数据对应的历史数据特征信息和所述目标业务风险监控数据对应的目标数据特征信息进行相似度计算操作,以输出该历史业务风险监控数据和所述目标业务风险监控数据之间的特征相似度;
对于所述多条历史业务风险监控数据中的每一条历史业务风险监控数据,依据该历史业务风险监控数据和所述目标业务风险监控数据之间的特征相似度,对该历史业务风险监控数据和所述目标业务风险监控数据进行数据相关性确定操作,以输出该历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数(例如,可以依据所述特征相似度,确定出具有正相关的对应关系的数据相关系数)。
需要说明的是,在一些具体的实施方式中,所述历史数据特征信息属于历史文本分词词语序列,所述目标数据特征信息属于文本分词词语序列,所述对于存储的多条历史业务风险监控数据中的每一条历史业务风险监控数据,对该历史业务风险监控数据对应的历史数据特征信息和所述目标业务风险监控数据对应的目标数据特征信息进行相似度计算操作,以输出该历史业务风险监控数据和所述目标业务风险监控数据之间的特征相似度的步骤,可以进一步包括以下具体的实施步骤:
对于所述目标业务风险监控数据对应的目标数据特征信息对应的文本分词词语序列包括的每一个文本分词词语,确定所述历史业务风险监控数据对应的历史数据特征信息对应的历史文本分词词语序列中是否存在与该文本分词词语相同的历史文本分词词语,并在存在相同的历史文本分词词语的情况下,将该文本分词词语标记为第一文本分词词语、将该历史文本分词词语标记为该第一文本分词词语对应的第一历史文本分词词语,在不存在相同的历史文本分词词语的情况下,确定所述历史文本分词词语序列中是否存在与该文本分词词语之间的语义相关度(该语义相关度可以是指在目标语料数据库中的相关度,计算方式可以参照现有技术)满足预设条件的历史文本分词词语,并在存在语义相关度满足预设条件的历史文本分词词语的情况下,将该文本分词词语标记为第二文本分词词语、将该历史文本分词词语标记为该第二文本分词词语对应的第二历史文本分词词语;
对于所述文本分词词语序列中的每一个第一文本分词词语,以该第一文本分词词语为起点,按照预设序列长度对所述文本分词词语序列进行截取操作(截取的最大长度为预设序列长度,其中,在起点之后的文本分词词语的数量不足时,对应的第一文本分词词语子序列的长度小于所述预设序列长度),以形成该第一文本分词词语对应的第一文本分词词语子序列,对于所述文本分词词语序列中的每一个第二文本分词词语,以该第二 文本分词词语为起点,按照预设序列长度对所述文本分词词语序列进行截取操作,以形成该第二文本分词词语对应的第二文本分词词语子序列;
对于所述历史文本分词词语序列中的每一个第一历史文本分词词语,以该第一历史文本分词词语为起点,按照预设序列长度对所述历史文本分词词语序列进行截取操作,以形成该第一历史文本分词词语对应的第一历史文本分词词语子序列,对于所述历史文本分词词语序列中的每一个第二历史文本分词词语,以该第二 历史文本分词词语为起点,按照预设序列长度对所述历史文本分词词语序列进行截取操作,以形成该第二历史文本分词词语对应的第二历史文本分词词语子序列;
对于所述文本分词词语序列中的每一个第一文本分词词语,对该第一文本分词词语对应的第一文本分词词语子序列和该第一文本分词词语对应的第一历史文本分词词语应的第一历史文本分词词语子序列进行序列相似度计算操作(可以确定对应序列位置的词语是否相同,再统计相同的词语对应的序列位置的占比),以输出该第一文本分词词语对应的第一子序列相似度,对于所述文本分词词语序列中的每一个第二文本分词词语,对该第二文本分词词语对应的第二文本分词词语子序列和该第二文本分词词语对应的第二历史文本分词词语应的第二历史文本分词词语子序列进行序列相似度计算操作,以输出该第二文本分词词语对应的第二子序列相似度;
依据所述文本分词词语序列中的每一个第一文本分词词语对应的第一子序列相似度和每一个第二文本分词词语对应的第二子序列相似度进行相似度融合操作(例如,可以先计算第一子序列相似度的平均值,再计算第二子序列相似度的平均值,再计算两个平均值的加权均值),以输出所述历史业务风险监控数据和所述目标业务风险监控数据之间的特征相似度。
需要说明的是,在一些具体的实施方式中,所述依据所述文本分词词语序列中的每一个第一文本分词词语对应的第一子序列相似度和每一个第二文本分词词语对应的第二子序列相似度进行相似度融合操作,以输出所述历史业务风险监控数据和所述目标业务风险监控数据之间的特征相似度的步骤,可以进一步包括以下具体的实施步骤:
对于所述文本分词词语序列中的每一个第一文本分词词语,对该第一文本分词词语对应的第一文本分词词语子序列进行序列长度确定操作,以输出该第一文本分词词语对应的第一序列长度,再依据每一个第一文本分词词语对应的第一序列长度,对每一个所述第一文本分词词语进行融合系数确定操作,以输出每一个所述第一文本分词词语对应的融合系数(所述融合系数可以与所述第一序列长度正相关),再依据每一个所述第一文本分词词语对应的融合系数,对每一个所述第一文本分词词语对应的第一子序列相似度进行融合操作(例如,可以有对应的融合系数进行加权求和计算操作),以输出第一相似度;
对于所述文本分词词语序列中的每一个第二文本分词词语,对该第二文本分词词语对应的第二文本分词词语子序列进行序列长度确定操作,以输出该第二文本分词词语对应的第二序列长度,再依据每一个第二文本分词词语对应的第二序列长度,并结合每一个第二文本分词词语与对应的第二历史文本分词词语之间的语义相关度,对每一个所述第二文本分词词语进行融合系数确定操作,以输出每一个第二文本分词词语对应的融合系数,再依据每一个第二文本分词词语对应的融合系数,对每一个第二文本分词词语对应的第二子序列相似度进行融合操作,以输出第二相似度;
对所述第一相似度和所述第二相似度进行加权均值计算,以输出所述历史业务风险监控数据和所述目标业务风险监控数据之间的特征相似度。
需要说明的是,在一些具体的实施方式中,所述历史数据特征信息属于历史文本分词词语序列,所述目标数据特征信息属于文本分词词语序列,所述对于存储的多条历史业务风险监控数据中的每一条历史业务风险监控数据,对该历史业务风险监控数据对应的历史数据特征信息和所述目标业务风险监控数据对应的目标数据特征信息进行相似度计算操作,以输出该历史业务风险监控数据和所述目标业务风险监控数据之间的特征相似度的步骤,也可以进一步包括以下具体的实施步骤:
对于所述目标业务风险监控数据对应的目标数据特征信息对应的文本分词词语序列包括的每一个文本分词词语,确定所述历史业务风险监控数据对应的历史数据特征信息对应的历史文本分词词语序列中是否存在与该文本分词词语相同的历史文本分词词语,并在存在相同的历史文本分词词语的情况下,将该文本分词词语标记为第一文本分词词语、将该历史文本分词词语标记为该第一文本分词词语对应的第一历史文本分词词语;
对于所述文本分词词语序列中的每一个第一文本分词词语,以该第一文本分词词语为起点,按照预设序列长度对所述文本分词词语序列进行截取操作,以形成该第一文本分词词语对应的第一文本分词词语子序列,对于所述历史文本分词词语序列中的每一个第一历史文本分词词语,以该第一历史文本分词词语为起点,按照所述预设序列长度对所述历史文本分词词语序列进行截取操作,以形成该第一历史文本分词词语对应的第一历史文本分词词语子序列;
对于每一个所述第一文本分词词语对应的第一文本分词词语子序列,分别对该第一文本分词词语子序列中的每相邻两个文本分词词语进行语义相关度的确定操作,以输出每相邻两个文本分词词语之间的语义相关度,再对该第一文本分词词语子序列中的每相邻两个文本分词词语之间的语义相关度的负相关值进行求和操作,以输出该第一文本分词词语子序列对应的语义差异度累计值;
对于每一个所述第一历史文本分词词语对应的第一历史文本分词词语子序列,分别对该第一历史文本分词词语子序列中的每相邻两个历史文本分词词语进行语义相关度的确定操作,以输出每相邻两个历史文本分词词语之间的语义相关度,再对该第一历史文本分词词语子序列中的每相邻两个历史文本分词词语之间的语义相关度的负相关值进行求和操作,以输出该第一历史文本分词词语子序列对应的语义差异度累计值;
对于每一个所述第一文本分词词语对应的第一文本分词词语子序列,对该第一文本分词词语子序列对应的语义差异度累计值和该第一文本分词词语对应的第一历史文本分词词语对应的第一历史文本分词词语子序列对应的语义差异度累计值进行数值相似度计算操作,以输出该第一文本分词词语子序列对应的数值相似度(所述数值相似度可以与,两个语义差异度累计值之间的差值具有负相关的对应关系);
对于每一个所述第一文本分词词语对应的第一文本分词词语子序列,对该第一文本分词词语子序列和该第一文本分词词语对应的第一历史文本分词词语对应的第一历史文本分词词语子序列进行序列相似度计算操作(如上所述,可以先确定对应序列位置的词语是否相同,再计算具有相同词语的序列位置的数量占比),以输出该第一文本分词词语子序列对应的第一子序列相似度;
依据每一个所述第一文本分词词语子序列对应的数值相似度,对每一个所述第一文本分词词语子序列对应的第一子序列相似度进行融合操作(例如,可以将所述数值相似度作为加权系数,或者所述数值相似度对应的正相关系数作为加权系数,对所述第一子序列相似度进行加权求和计算操作,以得到对应的特征相似度),以输出所述历史业务风险监控数据和所述目标业务风险监控数据之间的特征相似度。
需要说明的是,在一些具体的实施方式中,前文描述的步骤S130,可以进一步包括以下具体的实施步骤:
依据所述多条历史业务风险监控数据中的每一条历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数,从所述多条历史业务风险监控数据中筛查出至少一条历史业务风险监控数据,再将该至少一条历史业务风险监控数据分别定义为相关历史业务风险监控数据,以形成至少一条相关历史业务风险监控数据;
分别将所述至少一条相关历史业务风险监控数据中分每一条相关历史业务风险数据与所述目标业务风险监控数据之间建立数据关联关系;
对所述目标业务风险监控数据和所述数据关联关系进行存储操作,以实现对所述目标业务风险监控数据进行数据关联存储操。
需要说明的是,在一些具体的实施方式中,所述依据所述多条历史业务风险监控数据中的每一条历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数,从所述多条历史业务风险监控数据中筛查出至少一条历史业务风险监控数据,再将该至少一条历史业务风险监控数据分别定义为相关历史业务风险监控数据,以形成至少一条相关历史业务风险监控数据的步骤,可以进一步包括以下具体的实施步骤:
对于所述多条历史业务风险监控数据中的每一条历史业务风险监控数据,对该历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数与预先设置的相关系数对比值进行大小对比操作;
对于所述多条历史业务风险监控数据中的每一条历史业务风险监控数据,在该历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数大于或等于所述相关系数对比值的情况下,将该历史业务风险监控数据定义为所述目标业务风险监控数据对应的相关历史业务风险监控数据,再统计当前定义出的相关历史业务风险监控数据的数量;
在当前定义出的相关历史业务风险监控数据的数量小于或等于目标数量参考值的情况下,依据所述目标数量参考值,从所述多条历史业务风险监控数据中,筛查出对应的数据相关系数最大的至少一条历史业务风险监控数据,以作为相关历史业务风险监控数据。
参照图3所示,本发明实施例还提供一种应用于业务风险溯源的数据处理系统,该数据处理系统可应用于上述数据处理服务器。
其中,所述应用于业务风险溯源的数据处理系统可以包括数据特征识别模块、数据相关性确定模块和数据关联存储模块。
需要说明的是,在一些具体的实施方式中,所述数据特征识别模块,用于对于任意一个数据采集终端设备,在获取到该数据采集终端设备采集的目标业务风险监控数据之后,对所述目标业务风险监控数据进行数据特征识别操作,以输出所述目标业务风险监控数据对应的目标数据特征信息。所述数据相关性确定模块,用于对于存储的多条历史业务风险监控数据中的每一条历史业务风险监控数据,依据该历史业务风险监控数据对应的历史数据特征信息和所述目标业务风险监控数据对应的目标数据特征信息,对该历史业务风险监控数据和所述目标业务风险监控数据进行数据相关性确定操作,以输出该历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数。所述数据关联存储模块,用于依据所述多条历史业务风险监控数据中的每一条历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数,对所述目标业务风险监控数据进行数据关联存储操作。
综上所述,本发明提供的一种应用于业务风险溯源的数据处理方法及系统,对目标业务风险监控数据进行数据特征识别操作,以输出对应的目标数据特征信息。对于每一条历史业务风险监控数据,依据该历史业务风险监控数据对应的历史数据特征信息和目标业务风险监控数据对应的目标数据特征信息,进行数据相关性确定操作,以输出该历史业务风险监控数据和目标业务风险监控数据之间的数据相关系数。依据历史业务风险监控数据和目标业务风险监控数据之间的数据相关系数,对目标业务风险监控数据进行数据关联存储操作。基于前述的内容,由于可以依据与历史业务风险监控数据之间的数据相关系数,对目标业务风险监控数据进行关联存储,使得在需要进行业务风险溯源时,在查找到目标业务风险监控数据时,还可以便利地对关联的历史业务风险监控数据进行查找,以进行对比分析,从而实现业务风险溯源的目的,使得可以在一定程度上提高应用于业务风险溯源的业务风险监控数据的存储可靠性。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种应用于业务风险溯源的数据处理方法,其特征在于,应用于数据处理服务器,所述应用于业务风险溯源的数据处理方法包括:
对于任意一个数据采集终端设备,在获取到该数据采集终端设备采集的目标业务风险监控数据之后,对所述目标业务风险监控数据进行数据特征识别操作,以输出所述目标业务风险监控数据对应的目标数据特征信息;
对于存储的多条历史业务风险监控数据中的每一条历史业务风险监控数据,依据该历史业务风险监控数据对应的历史数据特征信息和所述目标业务风险监控数据对应的目标数据特征信息,对该历史业务风险监控数据和所述目标业务风险监控数据进行数据相关性确定操作,以输出该历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数;
依据所述多条历史业务风险监控数据中的每一条历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数,对所述目标业务风险监控数据进行数据关联存储操作;
其中,所述对于任意一个数据采集终端设备,在获取到该数据采集终端设备采集的目标业务风险监控数据之后,对所述目标业务风险监控数据进行数据特征识别操作,以输出所述目标业务风险监控数据对应的目标数据特征信息的步骤,包括:
对于任意一个数据采集终端设备,在该数据采集终端设备采集形成目标业务风险监控数据之后,对该目标业务风险监控数据进行获取操作,所述获取操作包括,对所述数据采集终端设备下发监控数据获取指令,所述数据采集终端设备依据该监控数据获取指令上报目标业务风险监控数据;
对所述目标业务风险监控数据进行数据特征识别操作,以输出所述目标业务风险监控数据对应的目标数据特征信息;
其中,所述对所述目标业务风险监控数据进行数据特征识别操作,以输出所述目标业务风险监控数据对应的目标数据特征信息的步骤,包括:
对所述目标业务风险监控数据进行数据特征识别操作,以输出所述目标业务风险监控数据对应的多个数据子特征;
依据所述目标业务风险监控数据对应的多个数据子特征进行子特征序列化操作,以形成所述目标业务风险监控数据对应的目标数据特征信息,所述目标数据特征信息属于子特征序列;
其中,所述对所述目标业务风险监控数据进行数据特征识别操作,以输出所述目标业务风险监控数据对应的多个数据子特征的步骤,包括:
对所述目标业务风险监控数据进行文本转换操作,以输出所述目标业务风险监控数据对应的业务风险监控文本,所述目标业务风险监控数据属于语音数据,且所述目标业务风险监控数据基于所述数据采集终端设备对目标业务对应的业务用户在办理该目标业务的过程中进行语音监控形成;
对所述业务风险监控文本进行分词操作,以形成所述业务风险监控文本对应的分词词语集合,所述分词词语集合包括多个文本分词词语;
依据所述多个文本分词词语,对所述目标业务进行业务领域确定操作,以输出所述目标业务对应的目标业务领域,再从通信连接的目标数据库中,筛查出预先针对所述目标业务领域配置的目标关键词集合;
依据所述目标关键词集合,对所述分词词语集合包括的多个文本分词词语进行筛查操作,以形成所述分词词语集合对应的分词词语筛查集合,所述分词词语筛查集合包括至少一个文本分词词语;
将所述分词词语筛查集合包括的至少一个文本分词词语中的每一个文本分词词语分别标记为所述目标业务风险监控数据对应的数据子特征。
2.如权利要求1所述的应用于业务风险溯源的数据处理方法,其特征在于,所述对于存储的多条历史业务风险监控数据中的每一条历史业务风险监控数据,依据该历史业务风险监控数据对应的历史数据特征信息和所述目标业务风险监控数据对应的目标数据特征信息,对该历史业务风险监控数据和所述目标业务风险监控数据进行数据相关性确定操作,以输出该历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数的步骤,包括:
对于存储的多条历史业务风险监控数据中的每一条历史业务风险监控数据,对该历史业务风险监控数据对应的历史数据特征信息和所述目标业务风险监控数据对应的目标数据特征信息进行相似度计算操作,以输出该历史业务风险监控数据和所述目标业务风险监控数据之间的特征相似度;
对于所述多条历史业务风险监控数据中的每一条历史业务风险监控数据,依据该历史业务风险监控数据和所述目标业务风险监控数据之间的特征相似度,对该历史业务风险监控数据和所述目标业务风险监控数据进行数据相关性确定操作,以输出该历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数。
3.如权利要求2所述的应用于业务风险溯源的数据处理方法,其特征在于,所述历史数据特征信息属于历史文本分词词语序列,所述目标数据特征信息属于文本分词词语序列,所述对于存储的多条历史业务风险监控数据中的每一条历史业务风险监控数据,对该历史业务风险监控数据对应的历史数据特征信息和所述目标业务风险监控数据对应的目标数据特征信息进行相似度计算操作,以输出该历史业务风险监控数据和所述目标业务风险监控数据之间的特征相似度的步骤,包括:
对于所述目标业务风险监控数据对应的目标数据特征信息对应的文本分词词语序列包括的每一个文本分词词语,确定所述历史业务风险监控数据对应的历史数据特征信息对应的历史文本分词词语序列中是否存在与该文本分词词语相同的历史文本分词词语,并在存在相同的历史文本分词词语的情况下,将该文本分词词语标记为第一文本分词词语、将该历史文本分词词语标记为该第一文本分词词语对应的第一历史文本分词词语,在不存在相同的历史文本分词词语的情况下,确定所述历史文本分词词语序列中是否存在与该文本分词词语之间的语义相关度满足预设条件的历史文本分词词语,并在存在语义相关度满足预设条件的历史文本分词词语的情况下,将该文本分词词语标记为第二文本分词词语、将该历史文本分词词语标记为该第二文本分词词语对应的第二历史文本分词词语;
对于所述文本分词词语序列中的每一个第一文本分词词语,以该第一文本分词词语为起点,按照预设序列长度对所述文本分词词语序列进行截取操作,以形成该第一文本分词词语对应的第一文本分词词语子序列,对于所述文本分词词语序列中的每一个第二文本分词词语,以该第二文本分词词语为起点,按照预设序列长度对所述文本分词词语序列进行截取操作,以形成该第二文本分词词语对应的第二文本分词词语子序列;
对于所述历史文本分词词语序列中的每一个第一历史文本分词词语,以该第一历史文本分词词语为起点,按照预设序列长度对所述历史文本分词词语序列进行截取操作,以形成该第一历史文本分词词语对应的第一历史文本分词词语子序列,对于所述历史文本分词词语序列中的每一个第二历史文本分词词语,以该第二历史文本分词词语为起点,按照预设序列长度对所述历史文本分词词语序列进行截取操作,以形成该第二历史文本分词词语对应的第二历史文本分词词语子序列;
对于所述文本分词词语序列中的每一个第一文本分词词语,对该第一文本分词词语对应的第一文本分词词语子序列和该第一文本分词词语对应的第一历史文本分词词语应的第一历史文本分词词语子序列进行序列相似度计算操作,以输出该第一文本分词词语对应的第一子序列相似度,对于所述文本分词词语序列中的每一个第二文本分词词语,对该第二文本分词词语对应的第二文本分词词语子序列和该第二文本分词词语对应的第二历史文本分词词语应的第二历史文本分词词语子序列进行序列相似度计算操作,以输出该第二文本分词词语对应的第二子序列相似度;
依据所述文本分词词语序列中的每一个第一文本分词词语对应的第一子序列相似度和每一个第二文本分词词语对应的第二子序列相似度进行相似度融合操作,以输出所述历史业务风险监控数据和所述目标业务风险监控数据之间的特征相似度。
4.如权利要求3所述的应用于业务风险溯源的数据处理方法,其特征在于,所述依据所述文本分词词语序列中的每一个第一文本分词词语对应的第一子序列相似度和每一个第二文本分词词语对应的第二子序列相似度进行相似度融合操作,以输出所述历史业务风险监控数据和所述目标业务风险监控数据之间的特征相似度的步骤,包括:
对于所述文本分词词语序列中的每一个第一文本分词词语,对该第一文本分词词语对应的第一文本分词词语子序列进行序列长度确定操作,以输出该第一文本分词词语对应的第一序列长度,再依据每一个第一文本分词词语对应的第一序列长度,对每一个所述第一文本分词词语进行融合系数确定操作,以输出每一个所述第一文本分词词语对应的融合系数,再依据每一个所述第一文本分词词语对应的融合系数,对每一个所述第一文本分词词语对应的第一子序列相似度进行融合操作,以输出第一相似度;
对于所述文本分词词语序列中的每一个第二文本分词词语,对该第二文本分词词语对应的第二文本分词词语子序列进行序列长度确定操作,以输出该第二文本分词词语对应的第二序列长度,再依据每一个第二文本分词词语对应的第二序列长度,并结合每一个第二文本分词词语与对应的第二历史文本分词词语之间的语义相关度,对每一个所述第二文本分词词语进行融合系数确定操作,以输出每一个第二文本分词词语对应的融合系数,再依据每一个第二文本分词词语对应的融合系数,对每一个第二文本分词词语对应的第二子序列相似度进行融合操作,以输出第二相似度;
对所述第一相似度和所述第二相似度进行加权均值计算,以输出所述历史业务风险监控数据和所述目标业务风险监控数据之间的特征相似度。
5.如权利要求1-4任意一项所述的应用于业务风险溯源的数据处理方法,其特征在于,所述依据所述多条历史业务风险监控数据中的每一条历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数,对所述目标业务风险监控数据进行数据关联存储操作的步骤,包括:
依据所述多条历史业务风险监控数据中的每一条历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数,从所述多条历史业务风险监控数据中筛查出至少一条历史业务风险监控数据,再将该至少一条历史业务风险监控数据分别定义为相关历史业务风险监控数据,以形成至少一条相关历史业务风险监控数据;
分别将所述至少一条相关历史业务风险监控数据中分每一条相关历史业务风险数据与所述目标业务风险监控数据之间建立数据关联关系;
对所述目标业务风险监控数据和所述数据关联关系进行存储操作,以实现对所述目标业务风险监控数据进行数据关联存储操作。
6.如权利要求5所述的应用于业务风险溯源的数据处理方法,其特征在于,所述依据所述多条历史业务风险监控数据中的每一条历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数,从所述多条历史业务风险监控数据中筛查出至少一条历史业务风险监控数据,再将该至少一条历史业务风险监控数据分别定义为相关历史业务风险监控数据,以形成至少一条相关历史业务风险监控数据的步骤,包括:
对于所述多条历史业务风险监控数据中的每一条历史业务风险监控数据,对该历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数与预先设置的相关系数对比值进行大小对比操作;
对于所述多条历史业务风险监控数据中的每一条历史业务风险监控数据,在该历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数大于或等于所述相关系数对比值的情况下,将该历史业务风险监控数据定义为所述目标业务风险监控数据对应的相关历史业务风险监控数据,再统计当前定义出的相关历史业务风险监控数据的数量;
在当前定义出的相关历史业务风险监控数据的数量小于或等于目标数量参考值的情况下,依据所述目标数量参考值,从所述多条历史业务风险监控数据中,筛查出对应的数据相关系数最大的至少一条历史业务风险监控数据,以作为相关历史业务风险监控数据。
7.一种应用于业务风险溯源的数据处理系统,其特征在于,应用于数据处理服务器,所述应用于业务风险溯源的数据处理系统包括:
数据特征识别模块,用于对于任意一个数据采集终端设备,在获取到该数据采集终端设备采集的目标业务风险监控数据之后,对所述目标业务风险监控数据进行数据特征识别操作,以输出所述目标业务风险监控数据对应的目标数据特征信息;
数据相关性确定模块,用于对于存储的多条历史业务风险监控数据中的每一条历史业务风险监控数据,依据该历史业务风险监控数据对应的历史数据特征信息和所述目标业务风险监控数据对应的目标数据特征信息,对该历史业务风险监控数据和所述目标业务风险监控数据进行数据相关性确定操作,以输出该历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数;
数据关联存储模块,用于依据所述多条历史业务风险监控数据中的每一条历史业务风险监控数据和所述目标业务风险监控数据之间的数据相关系数,对所述目标业务风险监控数据进行数据关联存储操作;
其中,所述对于任意一个数据采集终端设备,在获取到该数据采集终端设备采集的目标业务风险监控数据之后,对所述目标业务风险监控数据进行数据特征识别操作,以输出所述目标业务风险监控数据对应的目标数据特征信息,包括:
对于任意一个数据采集终端设备,在该数据采集终端设备采集形成目标业务风险监控数据之后,对该目标业务风险监控数据进行获取操作,所述获取操作包括,对所述数据采集终端设备下发监控数据获取指令,所述数据采集终端设备依据该监控数据获取指令上报目标业务风险监控数据;
对所述目标业务风险监控数据进行数据特征识别操作,以输出所述目标业务风险监控数据对应的目标数据特征信息;
其中,所述对所述目标业务风险监控数据进行数据特征识别操作,以输出所述目标业务风险监控数据对应的目标数据特征信息,包括:
对所述目标业务风险监控数据进行数据特征识别操作,以输出所述目标业务风险监控数据对应的多个数据子特征;
依据所述目标业务风险监控数据对应的多个数据子特征进行子特征序列化操作,以形成所述目标业务风险监控数据对应的目标数据特征信息,所述目标数据特征信息属于子特征序列;
其中,所述对所述目标业务风险监控数据进行数据特征识别操作,以输出所述目标业务风险监控数据对应的多个数据子特征,包括:
对所述目标业务风险监控数据进行文本转换操作,以输出所述目标业务风险监控数据对应的业务风险监控文本,所述目标业务风险监控数据属于语音数据,且所述目标业务风险监控数据基于所述数据采集终端设备对目标业务对应的业务用户在办理该目标业务的过程中进行语音监控形成;
对所述业务风险监控文本进行分词操作,以形成所述业务风险监控文本对应的分词词语集合,所述分词词语集合包括多个文本分词词语;
依据所述多个文本分词词语,对所述目标业务进行业务领域确定操作,以输出所述目标业务对应的目标业务领域,再从通信连接的目标数据库中,筛查出预先针对所述目标业务领域配置的目标关键词集合;
依据所述目标关键词集合,对所述分词词语集合包括的多个文本分词词语进行筛查操作,以形成所述分词词语集合对应的分词词语筛查集合,所述分词词语筛查集合包括至少一个文本分词词语;
将所述分词词语筛查集合包括的至少一个文本分词词语中的每一个文本分词词语分别标记为所述目标业务风险监控数据对应的数据子特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211114298.XA CN115187153B (zh) | 2022-09-14 | 2022-09-14 | 应用于业务风险溯源的数据处理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211114298.XA CN115187153B (zh) | 2022-09-14 | 2022-09-14 | 应用于业务风险溯源的数据处理方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115187153A CN115187153A (zh) | 2022-10-14 |
CN115187153B true CN115187153B (zh) | 2022-12-09 |
Family
ID=83524480
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211114298.XA Active CN115187153B (zh) | 2022-09-14 | 2022-09-14 | 应用于业务风险溯源的数据处理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115187153B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102214227A (zh) * | 2011-06-23 | 2011-10-12 | 华南理工大学 | 基于互联网层次结构存储的自动舆情监控方法 |
CN105743730A (zh) * | 2014-12-12 | 2016-07-06 | 阿里巴巴集团控股有限公司 | 为移动终端的网页服务提供实时监控的方法及其系统 |
CN107315731A (zh) * | 2016-04-27 | 2017-11-03 | 北京京东尚科信息技术有限公司 | 文本相似度计算方法 |
CN109885692A (zh) * | 2019-01-11 | 2019-06-14 | 平安科技(深圳)有限公司 | 知识数据存储方法、装置、计算机设备和存储介质 |
CN110019794A (zh) * | 2017-11-07 | 2019-07-16 | 腾讯科技(北京)有限公司 | 文本资源的分类方法、装置、存储介质及电子装置 |
CN110335115A (zh) * | 2019-07-01 | 2019-10-15 | 阿里巴巴集团控股有限公司 | 一种业务订单处理方法及装置 |
CN112613789A (zh) * | 2020-12-29 | 2021-04-06 | 太平金融科技服务(上海)有限公司 | 风险管控数据处理方法、风险预警规则前置数据监控方法 |
CN114726571A (zh) * | 2022-02-17 | 2022-07-08 | 李加福 | 一种网络安全预警管理平台和方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8838575B2 (en) * | 2011-08-03 | 2014-09-16 | Sap Ag | Generic framework for historical analysis of business objects |
CN112101520A (zh) * | 2020-08-10 | 2020-12-18 | 中国平安人寿保险股份有限公司 | 风险评估模型训练方法、业务风险评估方法及其他设备 |
CN112668886A (zh) * | 2020-12-29 | 2021-04-16 | 深圳前海微众银行股份有限公司 | 租赁业务的风险监控方法、装置、设备及可读存储介质 |
-
2022
- 2022-09-14 CN CN202211114298.XA patent/CN115187153B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102214227A (zh) * | 2011-06-23 | 2011-10-12 | 华南理工大学 | 基于互联网层次结构存储的自动舆情监控方法 |
CN105743730A (zh) * | 2014-12-12 | 2016-07-06 | 阿里巴巴集团控股有限公司 | 为移动终端的网页服务提供实时监控的方法及其系统 |
CN107315731A (zh) * | 2016-04-27 | 2017-11-03 | 北京京东尚科信息技术有限公司 | 文本相似度计算方法 |
CN110019794A (zh) * | 2017-11-07 | 2019-07-16 | 腾讯科技(北京)有限公司 | 文本资源的分类方法、装置、存储介质及电子装置 |
CN109885692A (zh) * | 2019-01-11 | 2019-06-14 | 平安科技(深圳)有限公司 | 知识数据存储方法、装置、计算机设备和存储介质 |
CN110335115A (zh) * | 2019-07-01 | 2019-10-15 | 阿里巴巴集团控股有限公司 | 一种业务订单处理方法及装置 |
CN112613789A (zh) * | 2020-12-29 | 2021-04-06 | 太平金融科技服务(上海)有限公司 | 风险管控数据处理方法、风险预警规则前置数据监控方法 |
CN114726571A (zh) * | 2022-02-17 | 2022-07-08 | 李加福 | 一种网络安全预警管理平台和方法 |
Non-Patent Citations (3)
Title |
---|
Research on data processing for condition monitoring of wind turbine based on Hadoop platform;Hongjun Wang;《2017 IEEE International Conference on Mechatronics and Automation (ICMA)》;20170824;全文 * |
关于云平台的电子银行业务交易风险监控系统;朱风华;《科技风》;20200604(第16期);全文 * |
基于电子溯源建立食品安全风险评估决策系统;任鹏程等;《中国食品卫生杂志》;20200330(第02期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN115187153A (zh) | 2022-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104756113A (zh) | 用于检测数据源中的偏差的方法、设备和计算机程序 | |
CN111651595A (zh) | 一种异常日志处理方法及装置 | |
CN111563382A (zh) | 文本信息的获取方法、装置、存储介质及计算机设备 | |
CN114647636B (zh) | 大数据异常检测方法及系统 | |
CN110807050B (zh) | 性能分析方法、装置、计算机设备及存储介质 | |
CN112836124A (zh) | 一种画像数据获取方法、装置、电子设备及存储介质 | |
CN116074183B (zh) | 一种基于规则引擎的c3超时分析方法、装置及设备 | |
CN115187153B (zh) | 应用于业务风险溯源的数据处理方法及系统 | |
CN115098548B (zh) | 一种数据决策方法、系统及云平台 | |
CN117170894A (zh) | 基于实时计算的事件中心管理方法和装置 | |
CN116955856A (zh) | 信息展示方法、装置、电子设备以及存储介质 | |
CN115550178A (zh) | 一种智慧网关管控方法及系统 | |
CN115017256A (zh) | 电力数据处理方法、装置、电子设备及存储介质 | |
CN115203758A (zh) | 一种数据安全存储方法、系统及云平台 | |
CN109885710B (zh) | 基于差分演化算法的用户画像刻画方法及服务器 | |
CN112598185A (zh) | 农业舆情分析方法、装置、设备及存储介质 | |
CN114625747B (zh) | 基于信息安全的风控更新方法及系统 | |
CN113392208A (zh) | It运维故障处理经验积累的方法、装置及存储介质 | |
CN117435640A (zh) | 一种用于定位相似实例的方法、装置和电子设备 | |
CN115314550B (zh) | 基于数字化的智慧医疗信息推送方法及系统 | |
CN110633430A (zh) | 事件发现方法、装置、设备和计算机可读存储介质 | |
CN114880298A (zh) | 一种智慧城市数据的共享方法及系统 | |
CN116662415B (zh) | 基于数据挖掘的智能匹配方法及系统 | |
CN114625786B (zh) | 一种基于风控技术的动态数据挖掘方法及系统 | |
CN113535770B (zh) | 数据查询的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |