CN111222585A - 数据处理方法、装置、设备及介质 - Google Patents

数据处理方法、装置、设备及介质 Download PDF

Info

Publication number
CN111222585A
CN111222585A CN202010046210.XA CN202010046210A CN111222585A CN 111222585 A CN111222585 A CN 111222585A CN 202010046210 A CN202010046210 A CN 202010046210A CN 111222585 A CN111222585 A CN 111222585A
Authority
CN
China
Prior art keywords
data
preset
target
data processing
acquiring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010046210.XA
Other languages
English (en)
Inventor
汤春峰
李�权
吴翟宁
陈天健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN202010046210.XA priority Critical patent/CN111222585A/zh
Publication of CN111222585A publication Critical patent/CN111222585A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数据处理方法、装置、设备及介质,涉及金融科技技术领域,该方法包括:接收各个数据端的各初始数据,对所述各初始数据进行预处理,得到各个预处理数据;获取各个预设指标,获取所述预处理数据在每个预设指标下的特征向量;在检测到数据处理指令时,获取所述数据处理指令中所携带的聚类类型,根据所述特征向量获取所述聚类类型对应的表示数据相似度的目标聚类数据;获取所述数据处理指令中携带的数据显示策略,根据所述数据显示策略,显示所述目标聚类数据。本发明解决现有技术中数据处理尤其是报表数据聚类分析处理效率低下的技术问题。

Description

数据处理方法、装置、设备及介质
技术领域
本发明涉及金融科技(Fintech)技术领域,尤其涉及一种数据处理方法、装置、设备及介质。
背景技术
随着金融科技(Fintech),尤其是互联网科技金融的不断发展,越来越多的技术应用在金融领域。其中,金融领域中的数据处理如报表数据聚类分析处理即涉及到众多技术应用,报表数据聚类分析处理包括分析各个监管指标在当前各个银行的聚类情况,或者是各个银行下同一监管指标的聚类情况等,然而目前,往往需要人工多次从海量报表数据中提炼数据的趋势或规律(多次是因为聚类分析类型不同),并通过人工多次标注后,才有可能准确实现对报表数据的分析如聚类分析并显示分析结果,这样很显然会过多耗费人力物力资源,致使报表数据的处理效率低下。
发明内容
本发明的主要目的在于提供一种数据处理方法、装置、设备及介质,旨在解决现有技术中数据处理尤其是报表数据聚类分析处理效率低下的技术问题。
为实现上述目的,本发明实施例提供一种数据处理方法,所述数据处理方法包括:
接收各个数据端的各初始数据,对所述各初始数据进行预处理,得到各个预处理数据;
获取各个预设指标,获取所述预处理数据在每个预设指标下的特征向量;
在检测到数据处理指令时,获取所述数据处理指令中所携带的聚类类型,根据所述特征向量获取所述聚类类型对应的表示数据相似度的目标聚类数据;
获取所述数据处理指令中携带的数据显示策略,根据所述数据显示策略,显示所述目标聚类数据。
可选地,所述聚类类型包括预设类目的聚类类型;
所述在检测到数据处理指令时,获取所述数据处理指令中所携带的聚类类型,根据所述特征向量获取所述聚类类型对应的表示数据相似度的目标聚类数据步骤包括:
获取各个预设指标所属预设类目的类型,以对所述特征向量进行分类,并得到向量分类结果;
在检测到数据处理指令时,获取所述数据处理指令对应的目标预设类目的聚类类型,将所述目标预设类目的聚类类型设为初始聚类类型;
从所述向量分类结果中提取所述初始聚类类型对应的目标特征向量;
根据所述目标特征向量获取所述初始聚类类型对应的表示各个数据端数据相似度的目标聚类数据。
可选地,所述根据所述目标特征向量获取所述初始聚类类型对应的表示各个数据端数据相似度的目标聚类数据步骤包括:
若所述初始聚类类型为同一目标预设类目的同一预设指标下,不同数据端的相似度聚类子类型时,基于所述目标特征向量,获取各个数据端在所述同一预设指标下的第一向量长度;
根据所述第一向量长度以及预设向量距离计算方式,计算每两个数据端在所述同一预设指标下的第一相似度;
根据多个所述第一相似度,确定表示各个数据端数据相似度的所述目标聚类数据。
可选地,所述根据多个所述第一相似度,确定表示各个数据端数据相似度的所述目标聚类数据步骤包括:
获取每两个数据端在所述同一目标预设类目的其他预设指标下的第二向量长度,其中,所述同一目标预设类目包括所述同一预设指标与所述其他预设指标;
根据所述第二向量长度以及预设向量距离计算方式,计算每两个数据端在所述其他预设指标下的第二相似度;
根据多个所述第一相似度以及多个所述第二相似度,确定每两个数据端在同一目标预设类目不同预设指标下的相似度关联矩阵;
根据多个所述相似度关联矩阵,确定所有数据端在同一目标预设类目不同预设指标下的相似度矩阵;
对所述相似度矩阵进行预设等距降维处理,得到表示所述各个数据端在所述同一目标预设类目下数据相似度的所述目标聚类数据。
可选地,所述获取所述数据处理指令中携带的数据显示策略,根据所述数据显示策略,显示所述目标聚类数据步骤包括:
获取所述数据处理指令中携带的数据显示策略,若所述数据显示策略为可视化显示策略时,获取所述各个数据端的各初始数据所关联的盈收额度;
根据所述盈收额度大小,确定所述目标聚类数据对应各个数据端显示标识的大小;
根据不同大小的所述各个数据端的显示标识,可视化显示所述表示所述各个数据端在所述同一目标预设类目下数据相似度的所述目标聚类数据。
可选地,所述在检测到数据处理指令时,获取所述数据处理指令对应目标预设类目的聚类类型步骤包括:
在检测到数据处理指令时,获取所述数据处理指令中所携带的年份信息以及所携带的目标预设类目信息;
根据所述年份信息以及所述目标预设类目信息,确定对应目标预设类目的聚类类型。
可选地,所述接收各个数据端的各初始数据,对所述各初始数据进行预处理,得到各个预处理数据步骤包括:
接收各个数据端的各初始数据,并启动预设OCR设备,以对所述各初始数据对应的各预设识别区域进行扫描,得到所述各初始数据对应的有效图像;
通过预设神经网络识别模型对所述有效图像进行字符特征提取,并根据所述字符特征得到所述各个预处理数据。
本发明还提供一种数据处理装置,所述数据处理方法应用于第一单位,所述数据处理装置包括:
接收模块,用于接收各个数据端的各初始数据,对所述各初始数据进行预处理,得到各个预处理数据;
第一获取模块,用于获取各个预设指标,获取所述预处理数据在每个预设指标下的特征向量;
检测模块,用于在检测到数据处理指令时,获取所述数据处理指令中所携带的聚类类型,根据所述特征向量获取所述聚类类型对应的表示数据相似度的目标聚类数据;
第二获取模块,用于获取所述数据处理指令中携带的数据显示策略,根据所述数据显示策略,显示所述目标聚类数据。
可选地,所述聚类类型包括预设类目的聚类类型;
所述检测模块包括:
第一获取单元,用于获取各个预设指标所属预设类目的类型,以对所述特征向量进行分类,并得到向量分类结果;
第二获取单元,用于在检测到数据处理指令时,获取所述数据处理指令对应的目标预设类目的聚类类型,将所述目标预设类目的聚类类型设为初始聚类类型;
提取单元,用于从所述向量分类结果中提取所述初始聚类类型对应的目标特征向量;
第三获取单元,用于根据所述目标特征向量获取所述初始聚类类型对应的表示各个数据端数据相似度的目标聚类数据。
可选地,所述第三获取单元包括:
第一获取子单元,用于若所述初始聚类类型为同一目标预设类目的同一预设指标下,不同数据端的相似度聚类子类型时,基于所述目标特征向量,获取各个数据端在所述同一预设指标下的第一向量长度;
计算子单元,用于根据所述第一向量长度以及预设向量距离计算方式,计算每两个数据端在所述同一预设指标下的第一相似度;
确定子单元,用于根据多个所述第一相似度,确定表示各个数据端数据相似度的所述目标聚类数据。
可选地,所述确定子单元用于实现:
获取每两个数据端在所述同一目标预设类目的其他预设指标下的第二向量长度,其中,所述同一目标预设类目包括所述同一预设指标与所述其他预设指标;
根据所述第二向量长度以及预设向量距离计算方式,计算每两个数据端在所述其他预设指标下的第二相似度;
根据多个所述第一相似度以及多个所述第二相似度,确定每两个数据端在同一目标预设类目不同预设指标下的相似度关联矩阵;
根据多个所述相似度关联矩阵,确定所有数据端在同一目标预设类目不同预设指标下的相似度矩阵;
对所述相似度矩阵进行预设等距降维处理,得到表示所述各个数据端在所述同一目标预设类目下数据相似度的所述目标聚类数据。
可选地,所述第二获取模块包括:
第四获取单元,用于获取所述数据处理指令中携带的数据显示策略,若所述数据显示策略为可视化显示策略时,获取所述各个数据端的各初始数据所关联的盈收额度;
确定单元,用于根据所述盈收额度大小,确定所述目标聚类数据对应各个数据端显示标识的大小;
可视化单元,用于根据不同大小的所述各个数据端的显示标识,可视化显示所述表示所述各个数据端在所述同一目标预设类目下数据相似度的所述目标聚类数据。
可选地,所述检测模块包括:
第五获取单元,用于在检测到数据处理指令时,获取所述数据处理指令中所携带的年份信息以及所携带的目标预设类目信息;
根据所述年份信息以及所述目标预设类目信息,确定对应目标预设类目的聚类类型。
可选地,所述接收各个数据端的各初始数据,对所述各初始数据进行预处理,得到各个预处理数据步骤包括:
接收各个数据端的各初始数据,并启动预设OCR设备,以对所述各初始数据对应的各预设识别区域进行扫描,得到所述各初始数据对应的有效图像;
通过预设神经网络识别模型对所述有效图像进行字符特征提取,并根据所述字符特征得到所述各个预处理数据。
本发明还提供一种介质,所述介质上存储有数据处理程序,所述数据处理程序被处理器执行时实现如上述的数据处理方法的步骤。
本发明通过接收各个数据端的各初始数据,对所述各初始数据进行预处理,得到各个预处理数据;获取各个预设指标,获取所述预处理数据在每个预设指标下的特征向量;在检测到数据处理指令时,获取所述数据处理指令中所携带的聚类类型,根据所述特征向量获取所述聚类类型对应的表示数据相似度的目标聚类数据;获取所述数据处理指令中携带的数据显示策略,根据所述数据显示策略,显示所述目标聚类数据。在本申请中,在接收各个数据端的各个初始数据并进行预处理后,能够自动得到待处理数据,并能够自动对该待处理数据按照预设指标进行有序整理,以得到预处理数据在每个预设指标下的特征向量,因而,在获取数据处理指令时,能够根据处理指令中的聚类类型,自动获取所述聚类类型对应的表示数据相似度的目标聚类数据,并根据指令中携带的数据显示策略进行显示,而不是需要人工获取各个数据端的数据,并人工进行数据聚类的分析,得到分析结果并显示,也即,很显然,本申请通过采集数据处理指令中的聚类类型,实现自动获取表示各个数据端数据相似度的目标聚类数据并进行显示,会减少因人工处理数据所造成的人力物力资源消耗,提升了数据处理尤其是报表数据聚类分析处理效率。
附图说明
图1为本发明数据处理方法第一实施例的流程示意图;
图2为本发明数据处理方法第二实施例中基于所述全部文件内容得到待处理节点步骤的细化流程示意图;
图3是本发明实施例方法涉及的硬件运行环境的设备结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种数据处理方法,在数据处理方法一实施例中,参照图1,所述数据处理方法应用于第一单位,所述数据处理方法包括:
步骤S10接收各个数据端的各初始数据,对所述各初始数据进行预处理,得到各个预处理数据;
步骤S20,获取各个预设指标,获取所述预处理数据在每个预设指标下的特征向量;
步骤S30,在检测到数据处理指令时,获取所述数据处理指令中所携带的聚类类型,根据所述特征向量获取所述聚类类型对应的表示数据相似度的目标聚类数据;
步骤S40,获取所述数据处理指令中携带的数据显示策略,根据所述数据显示策略,显示所述目标聚类数据。
具体步骤如下:
步骤S10,接收各个数据端的各初始数据,对所述各初始数据进行预处理,得到各个预处理数据;
在本实施例中,所述数据处理方法应用于数据处理系统,该数据处理系统属于数据处理设备,该数据处理系统可以安装手机,平板等移动终端上,另外,该数据处理系统也可以安装在电脑上,该数据处理系统与各个数据端进行通信连接,该各个数据端可以是微众银行、招商银行、中国人民银行等金融机构的数据端(一个数据端可以对应一个金融机构的全部报表数据),另外,该各个数据端也可以是第三方财务机构的数据端(一个数据端可以对应一个第三方财务机构的报表数据),需要说明的是,当该各个数据端是微众银行、招商银行、中国人民银行等金融机构的数据端时,该各个数据端往往指的是某一地区的全部金融机构的数据端如深圳市内全部金融机构的数据端(可以增加或者删除金融机构),或者是全国范围内各个金融机构的数据端,在本实施例中,以该数据端是银行的数据端,该数据处理系统安装在移动终端上为例进行具体说明。
接收各个数据端的各初始数据,对所述各初始数据进行预处理,得到各个预处理数据,具体地,每间隔预设时间段或者实时接收各个数据端的各初始数据,对所述各初始数据进行预处理,得到各个预处理数据,例如,接收深圳市内各个金融机构的数据端的各初始数据,对所述各初始数据进行预处理,得到各个预处理数据,在本实施例中,初始数据可以是excel表格形式的数据,另外,该初始数据也可以是图片形式或者语音形式的数据,也即,本实施例中初始数据的格式或者形式是不确定的,因而,在得到初始数据后,需要对初始数据进行预处理,得到各个预处理数据,即预处理过程可以为数据格式或者数据形式统一的过程,在数据格式或者数据形式统一的过程中,还包括通过OCR方式对初始数据中的图片数据进行识别处理的过程或者通过NLP(Natural Language Processing,自然语言处理)方式对初始数据中的语音数据进行识别的过程。
通过NLP(Natural Language Processing,自然语言处理)方式对初始数据中的语音数据进行识别的过程可以为:通过预设数据识别模型识别初始数据中的语音子数据,在得到语音子数据后,通过NLP中预设的语音识别模型对所述语音子数据进行识别处理,得到识别结果,将所述识别结果进行预设格式的转换,并添加至对应的预处理数据中,其中,预设的语音识别模型是通过训练后能够准确识别语音的模型。
其中,所述接收各个数据端的各初始数据,对所述各初始数据进行预处理,得到各个预处理数据步骤包括:
步骤S11,接收各个数据端的各初始数据,并启动预设OCR设备,以对所述各初始数据对应的各预设识别区域进行扫描,得到所述各初始数据对应的有效图像;
在本实施例中,数据处理系统中还设置预设OCR设备,或者该数据处理系统还与预设OCR设备进行通信连接,在接收到各个数据端的各初始数据后,通过预设数据识别模型识别初始数据中的各图片子数据,首先将各图片子数据发送至预设OCR设备,以对所述各图片子数据对应的各预设识别区域进行扫描,得到所述各初始数据对应的有效图像,具体地,数据处理系统在通过红外传感器(当然也可以是压力传感器、或者是其它的检测手段)检测到各图片子数据时,将启动OCR设备的扫描功能,对图片子数据对应的各预设识别区域进行扫描,划分出包括有效信息的有效区域,该有效区域的图像可称为有效图像,例如对财务报表图片而言,表格数据位于图片中下部,基于该规律,可对财务报表图片进行划分,从而获取出有效图像,获取出有效图像后,再对该部分的有效图像进行针对性的处理,从而减少了数据计算和处理量,提高识别效率。当然,得到所述各初始数据对应的有效图像后还可以执行其它步骤,例如图像二值化、字符切分等操作。其中,二值化是指将图像转化为只含两种黑白颜色的二值图像;字符切分则是指将一连串的字符分成单个具有确定含义的字(或是单词、数字),再对其进行识别。
步骤S12,通过预设神经网络识别模型对所述有效图像进行字符特征提取,并根据所述字符特征得到所述各个预处理数据。
在得到有效图像后,再针对该有效图像进行后续的字符特征提取和识别。并根据所述字符特征得到所述各个预处理数据,具体地,字符特征可分为两类:一为统计的特征,如文字区域内的黑/白点数比,当文字区分成好几个区域时,这一个个区域黑/白点数比联合,就成了空间的一个数值向量,在得到数值向量后,与字符库中备选统计的特征对应的数值向量进行比对,找到最接近的统计的特征,以确定该有效图像中统计的特征的含义;字符特征的另一类特征为结构的特征,如文字影像细线化后,取得字的笔划端点、交叉点之数量及位置,或笔划段的特征。在获取到有效图像后,即可配合对应的比对方法,将该有效图像的字符特征与字符库中的备选特征进行匹配,从而找到最接近的结构特征,并根据最接近结构特征的字符含义以及最接近的统计特征的含义确定该有效图像中字符的含义。
进一步地,对于该字符特征提取的过程,可以通过神经网络识别模型完成;即将有效图像输入到训练好的神经网络识别模型,由模型根据训练过程总结的逻辑经验进行字符特征提取,从而获取各个预处理数据。
步骤S20,获取各个预设指标,获取所述预处理数据在每个预设指标下的特征向量;
在本实施例中,在得到预处理数据后,获取各个预设指标,其中,该各个预设指标包括净利润,人均利润,不良贷款率,贷款余额,所得税,营业收入,营业支出等,需要说明的是,该各个预设指标可以分属不同的预设类目,具体预设指标属于何种预设类目,是预存的,其中,预设类目包括综合指标,盈利类指标,业务规模类,信用风险类等。
获取各个预设指标后,还获取所述预处理数据在每个预设指标下的特征向量,由于可以对预设指标进行预设类目的划分,因而获取各个预设指标后,还获取所述预处理数据在每个预设类目下的特征向量,具体地,特征向量指的是在每个指标维度下构建的使用向量长度代表该预设指标下对应数据大小的考量因子,也即,每个预处理数据在对应预设指标下的数据长度构成对应特征向量。
步骤S30,在检测到数据处理指令时,获取所述数据处理指令中所携带的聚类类型,根据所述特征向量获取所述聚类类型对应的表示数据相似度的目标聚类数据;
在得到数据处理指令时,获取所述数据处理指令中所携带的聚类类型,其中,该聚类类型包括至少包括:第一种,聚类类型为各个数据端在同一预设指标下的聚类类型,第二种,某一数据端在各个预设指标下的聚类类型等。需要说明的是,可以通过在移动终端上通过点击或者触摸操作进行聚类类型的选取,以对应生成数据处理指令,例如,通过点击或者触摸操作增加或删除数据端的个数,以对应生成数据处理指令,或者通过点击或者触摸操作增加或删除预设指标,以对应生成数据处理指令等。
在得到聚类类型后,根据所述特征向量获取所述聚类类型对应的表示数据相似度的目标聚类数据,若聚类类型为各个数据端在同一预设指标下的聚类类型时,则目标聚类数据为表示各个数据端在同一预设指标下的相似度的聚类数据,若聚类类型为某一数据端在各个预设指标下的聚类类型时,则目标聚类数据为某一数据端在各个预设指标下的相似度的聚类数据。
需要说明的是,在本实施例中,目标聚类数据可以指的是各个数据的相似度的聚类结果。
所述在检测到数据处理指令时,获取所述数据处理指令中所携带的聚类类型,根据所述特征向量获取所述聚类类型对应的表示数据相似度的目标聚类数据步骤包括:
步骤S31,获取各个预设指标所属预设类目的类型,以对所述特征向量进行分类,并得到向量分类结果;
在本实施例中,获取各个预设指标所属预设类目的类型,以对所述特征向量进行分类,并得到向量分类结果,例如,若各个预设指标所属预设类目的类型包括1,综合指标;2,盈利类指标;3,业务规模类;4,信用风险类等,获取各个预设指标所属预设类目的类型后,根据各个特征向量与各个预设指标的映射关系,对所述特征向量进行分类,并得到向量分类结果。
需要说明的是,在本实施例中,对于同一预设类目而言,还可以由该同一预设类目下各个预设指标对应的特征向量,以及预设指标对应的特征向量的影响力构建类目特征向量。
步骤S32,在检测到数据处理指令时,获取所述数据处理指令对应的目标预设类目的聚类类型,将所述目标预设类目的聚类类型设为初始聚类类型;
在检测到数据处理指令时,获取所述数据处理指令对应的目标预设类目的聚类类型,也即,在本实施例中,数据处理指令是以预设类目为聚类单位进行聚类,将所述目标预设类目的聚类类型设为初始聚类类型。需要说明的是,在本实施例中,还包括以预设年份或者预设数据端为聚类单位进行聚类,在此不做具体说明。
所述在检测到数据处理指令时,获取所述数据处理指令对应目标预设类目的聚类类型步骤包括:
步骤A1,在检测到数据处理指令时,获取所述数据处理指令中所携带的年份信息以及所携带的目标预设类目信息;
步骤A2,根据所述年份信息以及所述目标预设类目信息,确定对应目标预设类目的聚类类型。
在本实施例中,以预设类目为聚类单位进行聚类时,还包括以年份为子聚类单位的聚类类型,即以预设类目为聚类单位进行聚类时包括不同年份,各个数据端在同一预设类目的不同预设指标下的聚类类型。具体地,该聚类类型可以为:在2019年,以及2018年,微众银行,招商银行以及中国农业银行在预设盈利类类目的不同预设指标下的聚类类型。也即,在本实施例中,在检测到数据处理指令时,获取所述数据处理指令中所携带的年份信息以及所携带的目标预设类目信息,根据所述年份信息以及所述目标预设类目信息,确定对应目标预设类目的聚类类型。
步骤S33,从所述向量分类结果中提取所述初始聚类类型对应的目标特征向量;
在得到向量分类结果后,从所述向量分类结果中提取所述初始聚类类型对应的目标特征向量,具体地,若初始聚类类型为盈利类类目聚类类型时,从所述向量分类结果中提取所述盈利类类目聚类类型对应的盈利类类目特征向量,也即,在本实施例中,得到类目特征向量。
步骤S34,根据所述目标特征向量获取所述初始聚类类型对应的表示各个数据端数据相似度的目标聚类数据。
根据所述目标特征向量获取所述初始聚类类型对应的表示各个数据端数据相似度的目标聚类数据,具体地,如所述目标特征向量为盈利类类目特征向量,则提取各个数据端的该盈利类类目特征向量,得到可以表示各个数据端在该盈利类类目下数据相似度的目标聚类数据。
步骤S40,获取所述数据处理指令中携带的数据显示策略,根据所述数据显示策略,显示所述目标聚类数据。
获取所述数据处理指令中携带的数据显示策略,根据所述数据显示策略,显示所述目标聚类数据,其中,数据显示策略包括可视化图表显示策略或者文本显示策略。
其中,所述获取所述数据处理指令中携带的数据显示策略,根据所述数据显示策略,显示所述目标聚类数据步骤包括:
步骤S41,获取所述数据处理指令中携带的数据显示策略,若所述数据显示策略为可视化显示策略时,获取所述各个数据端的各初始数据所关联的盈收额度;
在本实施例中,获取所述数据处理指令中携带的数据显示策略,若所述数据显示策略为可视化显示策略特别是可视化图标显示策略时,获取所述各个数据端的各初始数据所关联的盈收额度,也即,获取各初始数据对应的全部盈收额度或者业务规模。
步骤S42,根据所述盈收额度大小,确定所述目标聚类数据对应各个数据端显示标识的大小;
根据所述盈收额度大小或者业务规模的大小,确定所述目标聚类数据对应各个数据端显示标识的大小,若各个数据端显示标识为圆圈时,该圆圈面积的大小,根据所述盈收额度大小,确定所述目标聚类数据对应圆圈面积的大小,其中,若盈收额度大,则所述目标聚类数据对应圆圈面积大,若盈收额度小,则所述目标聚类数据对应圆圈面积小。
步骤S43,根据不同大小的所述各个数据端的显示标识,可视化显示所述表示所述各个数据端在所述同一目标预设类目下数据相似度的所述目标聚类数据。
根据不同大小的所述各个数据端的显示标识,可视化显示入可视化图标显示所述表示所述各个数据端在所述同一目标预设类目下数据相似度的所述目标聚类数据。
本发明通过接收各个数据端的各初始数据,对所述各初始数据进行预处理,得到各个预处理数据;获取各个预设指标,获取所述预处理数据在每个预设指标下的特征向量;在检测到数据处理指令时,获取所述数据处理指令中所携带的聚类类型,根据所述特征向量获取所述聚类类型对应的表示数据相似度的目标聚类数据;获取所述数据处理指令中携带的数据显示策略,根据所述数据显示策略,显示所述目标聚类数据。在本申请中,在接收各个数据端的各个初始数据并进行预处理后,能够自动得到待处理数据,并能够自动对该待处理数据按照预设指标进行有序整理,以得到预处理数据在每个预设指标下的特征向量,因而,在获取数据处理指令时,能够根据处理指令中的聚类类型,自动获取所述聚类类型对应的表示各个数据端数据相似度的目标聚类数据,并根据指令中携带的数据显示策略进行显示,而不是需要人工获取各个数据端的数据,并人工进行数据聚类的分析,得到分析结果并显示,也即,很显然,本申请通过采集数据处理指令中的聚类类型,实现自动获取表示各个数据端数据相似度的目标聚类数据并进行显示,会减少因人工处理数据所造成的人力物力资源消耗,提升了数据处理尤其是报表数据聚类分析处理效率。
进一步地,在第一实施例的基础上,本发明提供数据处理方法另一实施例,在该实施例中,所述根据所述目标特征向量获取所述初始聚类类型对应的表示各个数据端数据相似度的目标聚类数据步骤包括:
步骤B1,若所述初始聚类类型为同一目标预设类目的同一预设指标下,不同数据端的相似度聚类子类型时,基于所述目标特征向量,获取各个数据端在所述同一预设指标下的第一向量长度;
在本实施例中,若所述初始聚类类型为同一目标预设类目的同一预设指标下,不同数据端的相似度聚类子类型时,基于所述目标特征向量,获取各个数据端在所述同一预设指标下如在净利润下的第一向量长度,即是获取各个数据端的净利润的大小。
步骤B2,根据所述第一向量长度以及预设向量距离计算方式,计算每两个数据端在所述同一预设指标下的第一相似度;
根据所述第一向量长度以及预设向量距离计算方式,计算每两个数据端在所述同一预设指标下的第一相似度,具体地,可以通过如下预设计算公式
Figure BDA0002368467010000141
进行计算,其中,P和Q分别代表不同数据端,n表示同一预设指标对应类目特征向量的长度,i表示当前的特征指标。
需要说明的是,在本实施例中可以得到多个第一相似度。具体地,例如,第一相似度可以是P1和Q1两个数据端在某一预设指标下对应的相似度,第一相似度也可以是P2和Q2两个数据端在该某一预设指标下的相似度。
步骤B3,根据多个所述第一相似度,确定表示各个数据端数据相似度的所述目标聚类数据。
根据多个所述第一相似度,确定表示各个数据端数据相似度的所述目标聚类数据,即是确定各个数据端在相同预设类目不同预设指标下的所述目标聚类数据。
在本实施例中,通过若所述初始聚类类型为同一目标预设类目的同一预设指标下,不同数据端的相似度聚类子类型时,基于所述目标特征向量,获取各个数据端在所述同一预设指标下的第一向量长度;根据所述第一向量长度以及预设向量距离计算方式,计算每两个数据端在所述同一预设指标下的第一相似度;根据多个所述第一相似度,确定表示各个数据端数据相似度的所述目标聚类数据。在本实施例中,实现自动获取表示各个数据端数据相似度的目标聚类数据。
进一步地,在第一实施例的基础上,在本发明提供数据处理方法另一实施例,在该实施例中,所述根据多个所述第一相似度,确定表示各个数据端数据相似度的所述目标聚类数据步骤包括:
步骤C1,获取每两个数据端在所述同一目标预设类目的其他预设指标下的第二向量长度,其中,所述同一目标预设类目包括所述同一预设指标与所述其他预设指标;
步骤C2,根据所述第二向量长度以及预设向量距离计算方式,计算每两个数据端在所述其他预设指标下的第二相似度;
在本实施例中,还可以获取每两个数据端在所述同一目标预设类目的其他预设指标下的第二向量长度,其中,所述同一目标预设类目包括所述同一预设指标与所述其他预设指标,也即,在本实施例中,还可以获取同一目标预设类目的不同预设指标下,不同数据端的相似度。
步骤C3,根据多个所述第一相似度以及多个所述第二相似度,确定每两个数据端在同一目标预设类目不同预设指标下的相似度关联矩阵;
根据多个所述第一相似度以及多个所述第二相似度,确定每两个数据端在同一目标预设类目不同预设指标下的相似度关联矩阵,具体地,相似度关联矩阵的横矩阵坐标、纵矩阵坐标分别为不同数据端,且相似度关联矩阵的对角线对应两端分别为相同数据端,相似度关联矩阵的另一三维坐标为预设指标。
步骤C4,根据多个所述相似度关联矩阵,确定所有数据端在同一目标预设类目不同预设指标下的相似度矩阵;
步骤C5,对所述相似度矩阵进行预设等距降维处理,得到表示所述各个数据端在所述同一目标预设类目下数据相似度的所述目标聚类数据。
在本实施例中,从多个所述相似度关联矩阵中,整合得到所有数据端在同一目标预设类目不同预设指标下的相似度矩阵,对所述相似度矩阵进行预设等距降维处理如对所述相似度矩阵进行预设流行学习算法(如tSNE)降维处理,得到表示所述各个数据端在所述同一目标预设类目下数据相似度的所述目标聚类数据。
在本实施例中,通过获取每两个数据端在所述同一目标预设类目的其他预设指标下的第二向量长度,其中,所述同一目标预设类目包括所述同一预设指标与所述其他预设指标;根据所述第二向量长度以及预设向量距离计算方式,计算每两个数据端在所述其他预设指标下的第二相似度;根据多个所述第一相似度以及多个所述第二相似度,确定每两个数据端在同一目标预设类目不同预设指标下的相似度关联矩阵;根据多个所述相似度关联矩阵,确定所有数据端在同一目标预设类目不同预设指标下的相似度矩阵;对所述相似度矩阵进行预设等距降维处理,得到表示所述各个数据端在所述同一目标预设类目下数据相似度的所述目标聚类数据。在本实施例中,实现自动得到表示所述各个数据端在所述同一目标预设类目下数据相似度的所述目标聚类数据。
参照图3,图3是本发明实施例方案涉及的硬件运行环境的设备结构示意图。
本发明实施例数据处理设备可以是PC,也可以是智能手机、平板电脑、便携计算机等终端设备。
如图3所示,该数据处理设备可以包括:处理器1001,例如CPU,存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。
可选地,该数据处理设备还可以包括目标用户接口、网络接口、摄像头、RF(RadioFrequency,射频)电路,传感器、音频电路、WiFi模块等等。目标用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选目标用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
本领域技术人员可以理解,图3中示出的数据处理设备结构并不构成对数据处理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图3所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及数据处理程序。操作系统是管理和控制数据处理设备硬件和软件资源的程序,支持数据处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以及与数据处理设备中其它硬件和软件之间通信。
在图3所示的数据处理设备中,处理器1001用于执行存储器1005中存储的数据处理程序,实现上述任一项所述的数据处理方法的步骤。
本发明数据处理设备具体实施方式与上述数据处理方法各实施例基本相同,在此不再赘述。
此外,本发明实施例还提出一种数据处理装置,所述数据处理装置包括:
判断模块,用于在接收到第二单位的第一流量接入指令时,判断发送所述第一流量接入指令的第二单位的第二网关与接收所述第一流量接入指令的第一单位的第一网关是否处于对应第一VPN通道的中断状态,其中,所述第一单位包括多个不同网关,所述第一单位的多个不同网关处于互相通信状态;
组网模块,用于若发送所述第一流量接入指令的第二单位的第二网关与接收所述第一流量接入指令的第一单位的第一网关处于第一VPN通道中断状态时,通过所述处于互相通信状态的所述第一单位的不同网关重新进行第二数据处理,以对所述第一流量接入指令进行切换接入处理。
可选地,所述组网模块包括:
切换单元,用于通过所述处于互相通信状态的所述第一单位的不同网关,运行预设动态路由协议,预设静态路由协议或者预设直连路由协议,重新进行第二数据处理,以对所述第一流量接入指令进行切换接入处理。
可选地,所述切换单元包括:
确定子单元,用于通过所述处于互相通信状态的所述第一单位的不同网关,运行预设动态路由协议,预设静态路由协议或者预设直连路由协议,并通过路由收敛方式确定与所述第二单位的第二网关进行通信的所述第一单位的第三网关;
第一重新组网子单元,用于根据所述第三网关重新进行第二数据处理;
发送子单元,用于基于所述第二数据处理将所述第一流量接入指令发送给第一单位的第三网关,以供所述第三网关进行所述第一流量接入指令的处理。
可选地,所述确定子单元用于实现:
获取所述第一单位第一网关外的其他网关待处理的第二流量接入指令的各个数目;
通过所述第二流量接入指令的各个数目与所述路由收敛方式确定与所述第二单位的第二网关进行通信的所述第一单位的第三网关。
可选地,所述判断模块包括:
调用单元,用于调用预设探测工具每间隔第一预设时间段对所述第一VPN通道进行网络延迟以及网络丢包的探测;
判定单元,用于若检测到所述所述第一VPN通道下存在网络延迟现象或者存在超过预设次数周期丢包现象时,判定所述对应第一VPN通道处于中断状态。
可选地,所述第二单位包括多个不同网关,所述第二单位的多个不同网关处于互相通信状态;
所述组网模块包括:
第二重新组网子单元,用于通过所述处于互相通信状态的所述的第一单位的不同网关,与所述处于互相通信状态的所述的第二单位的不同网关,重新进行第二数据处理,以对所述第一流量接入指令进行切换接入处理。
可选地,所述组网模块包括:
组网单元,用于所述第一单位包括多个不同网关,所述第一单位的多个不同网关处于预设路由域中,且所述第一单位的多个不同网关都配置有所述预设路由域中的全部IP网段,所述第一单位的多个不同网关处于互相通信状态。
所述数据处理装置具体实施方式与上述数据处理方法各实施例基本相同,在此不再赘述。
此外,本发明实施例还提出一种数据处理设备,设备包括:存储器109、处理器110及存储在存储器109上并可在处理器110上运行的数据处理程序,数据处理程序被处理器110执行时实现上述的数据处理方法各实施例的步骤。
此外,本发明还提供了一种计算机介质,所述计算机介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述数据处理方法各实施例的步骤。
本发明设备及介质(即计算机介质)的具体实施方式的拓展内容与上述数据处理方法各实施例基本相同,在此不做赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

Claims (10)

1.一种数据处理方法,其特征在于,所述数据处理方法包括:
接收各个数据端的各初始数据,对所述各初始数据进行预处理,得到各个预处理数据;
获取各个预设指标,获取所述预处理数据在每个预设指标下的特征向量;
在检测到数据处理指令时,获取所述数据处理指令中所携带的聚类类型,根据所述特征向量获取所述聚类类型对应的表示数据相似度的目标聚类数据;
获取所述数据处理指令中携带的数据显示策略,根据所述数据显示策略,显示所述目标聚类数据。
2.如权利要求1所述的数据处理方法,其特征在于,所述聚类类型包括预设类目的聚类类型;
所述在检测到数据处理指令时,获取所述数据处理指令中所携带的聚类类型,根据所述特征向量获取所述聚类类型对应的表示数据相似度的目标聚类数据步骤包括:
获取各个预设指标所属预设类目的类型,以对所述特征向量进行分类,并得到向量分类结果;
在检测到数据处理指令时,获取所述数据处理指令对应的目标预设类目的聚类类型,将所述目标预设类目的聚类类型设为初始聚类类型;
从所述向量分类结果中提取所述初始聚类类型对应的目标特征向量;
根据所述目标特征向量获取所述初始聚类类型对应的表示各个数据端数据相似度的目标聚类数据。
3.如权利要求2所述的数据处理方法,其特征在于,所述根据所述目标特征向量获取所述初始聚类类型对应的表示各个数据端数据相似度的目标聚类数据步骤包括:
若所述初始聚类类型为同一目标预设类目的同一预设指标下,不同数据端的相似度聚类子类型时,基于所述目标特征向量,获取各个数据端在所述同一预设指标下的第一向量长度;
根据所述第一向量长度以及预设向量距离计算方式,计算每两个数据端在所述同一预设指标下的第一相似度;
根据多个所述第一相似度,确定表示各个数据端数据相似度的所述目标聚类数据。
4.如权利要求3所述的数据处理方法,其特征在于,所述根据多个所述第一相似度,确定表示各个数据端数据相似度的所述目标聚类数据步骤包括:
获取每两个数据端在所述同一目标预设类目的其他预设指标下的第二向量长度,其中,所述同一目标预设类目包括所述同一预设指标与所述其他预设指标;
根据所述第二向量长度以及预设向量距离计算方式,计算每两个数据端在所述其他预设指标下的第二相似度;
根据多个所述第一相似度以及多个所述第二相似度,确定每两个数据端在同一目标预设类目不同预设指标下的相似度关联矩阵;
根据多个所述相似度关联矩阵,确定所有数据端在同一目标预设类目不同预设指标下的相似度矩阵;
对所述相似度矩阵进行预设等距降维处理,得到表示所述各个数据端在所述同一目标预设类目下数据相似度的所述目标聚类数据。
5.如权利要求4所述的数据处理方法,其特征在于,所述获取所述数据处理指令中携带的数据显示策略,根据所述数据显示策略,显示所述目标聚类数据步骤包括:
获取所述数据处理指令中携带的数据显示策略,若所述数据显示策略为可视化显示策略时,获取所述各个数据端的各初始数据所关联的盈收额度;
根据所述盈收额度大小,确定所述目标聚类数据对应各个数据端显示标识的大小;
根据不同大小的所述各个数据端的显示标识,可视化显示所述表示所述各个数据端在所述同一目标预设类目下数据相似度的所述目标聚类数据。
6.如权利要求2所述的数据处理方法,其特征在于,所述在检测到数据处理指令时,获取所述数据处理指令对应目标预设类目的聚类类型步骤包括:
在检测到数据处理指令时,获取所述数据处理指令中所携带的年份信息以及所携带的目标预设类目信息;
根据所述年份信息以及所述目标预设类目信息,确定对应目标预设类目的聚类类型。
7.如权利要求1-6任一项所述的数据处理方法,其特征在于,所述接收各个数据端的各初始数据,对所述各初始数据进行预处理,得到各个预处理数据步骤包括:
接收各个数据端的各初始数据,并启动预设OCR设备,以对所述各初始数据对应的各预设识别区域进行扫描,得到所述各初始数据对应的有效图像;
通过预设神经网络识别模型对所述有效图像进行字符特征提取,并根据所述字符特征得到所述各个预处理数据。
8.一种数据处理装置,其特征在于,所述数据处理装置包括:
接收模块,用于接收各个数据端的各初始数据,对所述各初始数据进行预处理,得到各个预处理数据;
第一获取模块,用于获取各个预设指标,获取所述预处理数据在每个预设指标下的特征向量;
检测模块,用于在检测到数据处理指令时,获取所述数据处理指令中所携带的聚类类型,根据所述特征向量获取所述聚类类型对应的表示数据相似度的目标聚类数据;
第二获取模块,用于获取所述数据处理指令中携带的数据显示策略,根据所述数据显示策略,显示所述目标聚类数据。
9.一种数据处理设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的数据处理程序,所述数据处理程序被所述处理器执行时实现如权利要求1至7中任一项所述的数据处理方法的步骤。
10.一种介质,其特征在于,所述介质上存储有数据处理程序,所述数据处理程序被处理器执行时实现如权利要求1至7中任一项所述的数据处理方法的步骤。
CN202010046210.XA 2020-01-15 2020-01-15 数据处理方法、装置、设备及介质 Pending CN111222585A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010046210.XA CN111222585A (zh) 2020-01-15 2020-01-15 数据处理方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010046210.XA CN111222585A (zh) 2020-01-15 2020-01-15 数据处理方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN111222585A true CN111222585A (zh) 2020-06-02

Family

ID=70831168

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010046210.XA Pending CN111222585A (zh) 2020-01-15 2020-01-15 数据处理方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN111222585A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112257744A (zh) * 2020-09-10 2021-01-22 浙江大华技术股份有限公司 数据获取的方法和相关装置、设备
CN113554514A (zh) * 2021-07-30 2021-10-26 中国建设银行股份有限公司 数据处理的方法、装置、设备和计算机可读介质
CN115797044A (zh) * 2022-11-15 2023-03-14 东方微银科技股份有限公司 基于聚类分析的信贷风控预警方法及系统
CN116705059A (zh) * 2023-08-08 2023-09-05 硕橙(厦门)科技有限公司 一种音频半监督自动聚类方法、装置、设备及介质

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150042575A1 (en) * 2013-08-08 2015-02-12 Lenovo (Beijing) Co., Ltd. Information processing method and electronic device
WO2018090535A1 (zh) * 2016-11-15 2018-05-24 平安科技(深圳)有限公司 累加检索处理方法和装置、终端和存储介质
CN108227564A (zh) * 2017-12-12 2018-06-29 深圳和而泰数据资源与云技术有限公司 一种信息处理方法、终端及计算机可读介质
CN108280477A (zh) * 2018-01-22 2018-07-13 百度在线网络技术(北京)有限公司 用于聚类图像的方法和装置
CN108364137A (zh) * 2018-03-12 2018-08-03 广东省科技创新监测研究中心 高新技术企业的监测方法、装置、计算机设备及存储介质
CN109523157A (zh) * 2018-11-14 2019-03-26 北京中电普华信息技术有限公司 一种业务流程的处理方法及系统
CN109598278A (zh) * 2018-09-20 2019-04-09 阿里巴巴集团控股有限公司 聚类处理方法、装置、电子设备及计算机可读存储介质
CN109935338A (zh) * 2019-03-07 2019-06-25 平安科技(深圳)有限公司 基于机器学习的数据预测处理方法、装置和计算机设备
CN110008250A (zh) * 2019-03-07 2019-07-12 平安科技(深圳)有限公司 基于数据挖掘的社保数据处理方法、装置和计算机设备
CN110263024A (zh) * 2019-05-20 2019-09-20 平安普惠企业管理有限公司 数据处理方法、终端设备及计算机存储介质
CN110390084A (zh) * 2019-06-19 2019-10-29 平安国际智慧城市科技股份有限公司 文本查重方法、装置、设备及存储介质
CN110399890A (zh) * 2019-07-29 2019-11-01 厦门美图之家科技有限公司 图像识别方法、装置、电子设备及可读存储介质
CN110569922A (zh) * 2019-09-17 2019-12-13 深圳前海微众银行股份有限公司 交互式层次聚类实现方法、装置、设备及可读存储介质

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150042575A1 (en) * 2013-08-08 2015-02-12 Lenovo (Beijing) Co., Ltd. Information processing method and electronic device
WO2018090535A1 (zh) * 2016-11-15 2018-05-24 平安科技(深圳)有限公司 累加检索处理方法和装置、终端和存储介质
CN108227564A (zh) * 2017-12-12 2018-06-29 深圳和而泰数据资源与云技术有限公司 一种信息处理方法、终端及计算机可读介质
CN108280477A (zh) * 2018-01-22 2018-07-13 百度在线网络技术(北京)有限公司 用于聚类图像的方法和装置
CN108364137A (zh) * 2018-03-12 2018-08-03 广东省科技创新监测研究中心 高新技术企业的监测方法、装置、计算机设备及存储介质
CN109598278A (zh) * 2018-09-20 2019-04-09 阿里巴巴集团控股有限公司 聚类处理方法、装置、电子设备及计算机可读存储介质
CN109523157A (zh) * 2018-11-14 2019-03-26 北京中电普华信息技术有限公司 一种业务流程的处理方法及系统
CN109935338A (zh) * 2019-03-07 2019-06-25 平安科技(深圳)有限公司 基于机器学习的数据预测处理方法、装置和计算机设备
CN110008250A (zh) * 2019-03-07 2019-07-12 平安科技(深圳)有限公司 基于数据挖掘的社保数据处理方法、装置和计算机设备
CN110263024A (zh) * 2019-05-20 2019-09-20 平安普惠企业管理有限公司 数据处理方法、终端设备及计算机存储介质
CN110390084A (zh) * 2019-06-19 2019-10-29 平安国际智慧城市科技股份有限公司 文本查重方法、装置、设备及存储介质
CN110399890A (zh) * 2019-07-29 2019-11-01 厦门美图之家科技有限公司 图像识别方法、装置、电子设备及可读存储介质
CN110569922A (zh) * 2019-09-17 2019-12-13 深圳前海微众银行股份有限公司 交互式层次聚类实现方法、装置、设备及可读存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112257744A (zh) * 2020-09-10 2021-01-22 浙江大华技术股份有限公司 数据获取的方法和相关装置、设备
CN113554514A (zh) * 2021-07-30 2021-10-26 中国建设银行股份有限公司 数据处理的方法、装置、设备和计算机可读介质
CN115797044A (zh) * 2022-11-15 2023-03-14 东方微银科技股份有限公司 基于聚类分析的信贷风控预警方法及系统
CN115797044B (zh) * 2022-11-15 2024-03-29 东方微银科技股份有限公司 基于聚类分析的信贷风控预警方法及系统
CN116705059A (zh) * 2023-08-08 2023-09-05 硕橙(厦门)科技有限公司 一种音频半监督自动聚类方法、装置、设备及介质
CN116705059B (zh) * 2023-08-08 2023-11-10 硕橙(厦门)科技有限公司 一种音频半监督自动聚类方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN111222585A (zh) 数据处理方法、装置、设备及介质
CN104023249B (zh) 电视频道识别方法和装置
US9754164B2 (en) Systems and methods for classifying objects in digital images captured using mobile devices
WO2019169772A1 (zh) 图片处理方法、电子装置及存储介质
CN111209827B (zh) 一种基于特征检测的ocr识别票据问题的方法及系统
CN109241861B (zh) 一种数学公式识别方法、装置、设备及存储介质
CN108564079B (zh) 一种便携式字符识别装置及方法
CN111475613A (zh) 案件分类方法、装置、计算机设备及存储介质
CN110874618A (zh) 基于小样本的ocr模板学习方法、装置、电子设备及介质
CN110751146A (zh) 文本区域检测方法、装置、电子终端和计算机可读存储介质
CN111881901A (zh) 截图内容检测方法、设备及计算机可读存储介质
CN114612743A (zh) 深度学习模型的训练方法、目标对象识别方法和装置
CN112381086A (zh) 一种结构化输出图像文字识别结果的方法及装置
CN112396079A (zh) 号码识别模型训练方法、号码识别方法及装置
WO2021218183A1 (zh) 证件边沿检测方法、装置、设备及介质
CN115082941A (zh) 表格文档影像的表格信息获取方法及装置
CN113673528B (zh) 文本处理方法、装置、电子设备和可读存储介质
CN109388935B (zh) 单证验证方法及装置、电子设备及可读存储介质
CN114937270A (zh) 古籍文字处理方法、装置及计算机可读存储介质
CN108090728B (zh) 一种基于智能终端的快递信息录入方法及录入系统
CN114581928A (zh) 一种表格识别方法及系统
CN111738252A (zh) 图像中的文本行检测方法、装置及计算机系统
CN113407696A (zh) 收集表处理方法、装置、设备以及存储介质
CN116994272A (zh) 一种针对目标图片的识别方法和装置
CN111213157A (zh) 一种基于智能终端的快递信息录入方法及录入系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination