CN115081554A - 一种实现货币类数据智能转换方法、系统及终端机 - Google Patents

一种实现货币类数据智能转换方法、系统及终端机 Download PDF

Info

Publication number
CN115081554A
CN115081554A CN202210977872.8A CN202210977872A CN115081554A CN 115081554 A CN115081554 A CN 115081554A CN 202210977872 A CN202210977872 A CN 202210977872A CN 115081554 A CN115081554 A CN 115081554A
Authority
CN
China
Prior art keywords
data
currency
formula
neural network
currency data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210977872.8A
Other languages
English (en)
Other versions
CN115081554B (zh
Inventor
王琪
朱效民
张新常
王新明
耿光刚
邹敏
延志伟
赵一宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Qilu Big Data Research Institute
Original Assignee
Shandong Qilu Big Data Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Qilu Big Data Research Institute filed Critical Shandong Qilu Big Data Research Institute
Priority to CN202210977872.8A priority Critical patent/CN115081554B/zh
Publication of CN115081554A publication Critical patent/CN115081554A/zh
Application granted granted Critical
Publication of CN115081554B publication Critical patent/CN115081554B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Character Discrimination (AREA)

Abstract

本发明提供一种实现货币类数据智能转换方法、系统及终端机,涉及货币类数据识别领域,创建BP神经网络模型,实现数据识别;隐层的输入用simgoid函数激活,输出层用线性函数激活;BP神经网络模型对预设字符进行识别,在融合神经网络的分类决策树模型中,融合两个BP神经网络模型,依次通过初始化图像、二值化处理、训练网络、识别完成对预设字符的识别;基于融合BP神经网络的分类决策树模型,对货币数据和非货币数据进行分类筛选;创建ICS模型,对货币数据进行智能化转换。本发明对货币类数据的智能化转换,提高数据预处理的效率,在进行货币数据单位转换时提高了效率,为生产生活提供便利。

Description

一种实现货币类数据智能转换方法、系统及终端机
技术领域
本发明涉及货币类数据识别领域,尤其涉及一种基于分类决策树实现货币类数据智能转换方法、系统及终端机。
背景技术
目前的数据预处理是使用数据进行一系列操作的前提,不管是在数据分析还是数据挖掘方面,对数据处理的结果是否一致、完整、规范都直接影响分析和实验的结果。现有技术中常用的数据预处理方法有缺失值插补、噪音处理、特征选择、空间变换、离散化、欠采样和过采样等方法,这些方法主要适用于处理具有不完整、冗余、实例减少等特征的数据,然而对于不规范数据,除将其作为噪声数据删除或人工改正之外,对其处理技术的研究却寥寥无几。实现数据的智能化转换,将有效提升数据预处理的效率,降低数据预处理的难度,是促进数据预处理技术发展的一个重要方向,也是促使数据分析和挖掘获得更有价值的信息的坚实基础。
目前在对处理过的数据忽略了对源数据的处理方式。也就是数据预处理主要存在以下几点问题:第一,当前数据预处理还存在数据量大而繁琐、数据存在冗余、数据形式杂乱无章等问题,所以在利用一定算法进行处理的基础上,在整个环节中,数据预处理往往花费更多人工处理数据的时间;第二,目前的数据预处理方法,存在一定的局限性,受所处理的数据种类和形式等内容的限制,数据预处理算法的研究还存在很大的发展空间;第三,直接将分类决策树应用于货币类数据与非货币类数据的分类容易出现过拟合或拟合不足等问题。
发明内容
本发明首先通过训练BP神经网络实现对特定数据的识别,其次将训练好的BP神经网络融入分类决策树中,通过决策树实现对货币类字符的筛选,并将非货币类字符存入非货币数据库中,最后将货币类字符传入ICS(Init-Computing-Select)计算模型中,实现数据的转换。
具体方法包括:
步骤一、创建BP神经网络模型,实现数据识别;
创建的BP神经网络模型包括:输入层、隐层以及输出层;
其中,隐层的输入用simgoid函数激活,输出层用线性函数激活;
BP神经网络模型对预设字符进行识别,在融合神经网络的分类决策树模型中,融合两个BP神经网络模型,依次通过初始化图像、二值化处理、训练网络、识别完成对预设字符的识别;
步骤二、基于融合BP神经网络的分类决策树模型,对货币数据和非货币数据进行分类筛选;
步骤三、创建ICS模型,对货币数据进行智能化转换。
本发明还提供一种基于分类决策树实现货币类数据智能转换系统,系统包括:网络模型创建识别模块、分类筛选模块以及货币数据转换模块;
网络模型创建识别模块,用于创建BP神经网络模型,实现数据识别;
创建的BP神经网络模型包括:输入层、隐层以及输出层;
其中,隐层的输入用simgoid函数激活,输出层用线性函数激活;
BP神经网络模型对预设字符进行识别,在融合神经网络的分类决策树模型中,融合两个BP神经网络模型,依次通过初始化图像、二值化处理、训练网络、识别完成对预设字符的识别;
分类筛选模块基于融合BP神经网络的分类决策树模型,对货币数据和非货币数据进行分类筛选;
货币数据转换模块创建ICS模型,对货币数据进行智能化转换。
本发明还提供一种终端机,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现基于分类决策树实现货币类数据智能转换方法的步骤。
从以上技术方案可以看出,本发明具有以下优点:
本发明提供的基于分类决策树实现货币类数据智能转换方法及系统实现不同形式、不同单位、不同内容的数据筛选与转换,为数据预处理、数据分析等提供了便利快捷的方法,节省了人工处理时间,提升了数据处理的效率;为数据分析和挖掘获得更有价值的信息奠定了基础,促进了算法模型的实际应用与发展,提高了其他有需求领域在进行货币数据单位转换时的效率,为生产生活提供便利,提高效率。
本发明提供的基于分类决策树实现货币类数据智能转换方法从技术角度来讲,将神经网络与分类决策树融合,为成熟算法的发展提供了思路;解决数据预处理过程中数据智能化转换的难题,尤其对货币类数据的智能化转换,提高数据预处理的效率,为数据分析和挖掘获得更有价值的信息奠定基础,促进算法模型的实际应用与发展,提高其他需求领域在进行货币数据单位转换时的效率,为生产生活提供便利,提高效率;另一方面,提出算法融合的思想,促进神经网络和分类树等成熟的机器算法的发展,为算法发展提供融合的新思想。
附图说明
为了更清楚地说明本发明的技术方案,下面将对描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为基于分类决策树实现货币类数据智能转换方法流程图;
图2为融合神经网络的分类决策流程图;
图3为ICS模型对货币数据进行智能化转换流程图;
图4为非货币数据类型示意图;
图5为基于分类决策树实现货币类数据智能转换系统示意图。
具体实施方式
如图1所示,本发明提供一种基于分类决策树实现货币类数据智能转换方法中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的模块数目,其实际实施时各模块的型态、数量及功能可为一种根据本发明中对源数据处理方式而改变,且其模块布局型态也可能更为复杂。
本发明中的BP(back propagation)神经网络:是一种按误差反向传播训练的多层前馈网络,其算法称为BP算法,它的基本思想是梯度下降法,利用梯度搜索技术,以期使网络的实际输出值和期望输出值的误差均方差为最小。基本BP算法包括信号的前向传播和误差的反向传播两个过程。
本发明中的分类决策树(Decision Tree):分类决策树是一种常用的机器学习方法,通常用来做分类和回归任务。它是一种监督学习,通过给定的样本数据集以及确定的特征对其进行训练,训练完成后,决策树可以对于新输入的样本给出正确的分类。
本发明实施例涉及的基于分类决策树实现货币类数据智能转换方法可以基于人工智能技术对关联的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,完成对特定字符的识别,实现数据的转换获得最佳结果的方法。
如图1示出了本发明的基于分类决策树实现货币类数据智能转换方法的较佳实施例的流程图。基于分类决策树实现货币类数据智能转换方法应用于一个或者多个终端机中,所述终端机是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
终端机可以是任何一种可与用户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant, PDA)、交互式网络电视(Internet Protocol Television,IPTV)、智能式穿戴式设备等。
终端机还可以包括网络设备和/或用户设备。其中,所述网络设备包括,但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量主机或网络服务器构成的云。
终端机所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network,VPN)等。
下面将结合图1至4来详细阐述本发明的基于分类决策树实现货币类数据智能转换方法,本发明通过训练BP神经网络实现对特定数据的识别,其次将训练好的BP神经网络融入分类决策树中,通过决策树实现对货币类字符的筛选,并将非货币类字符存入“非货币数据”库中,最后将货币类字符传入ICS(Init-Computing-Select)计算模型中,实现数据的转换。
请参阅图1至4所示是一具体实施例中基于分类决策树实现货币类数据智能转换方法的流程图,方法包括:
步骤一、创建BP神经网络模型,实现数据识别;
本发明的实施例,通过融入可以实现特定字符识别的BP神经网络,来提升某些特 征的等级。BP神经网络是一个由输入层、隐层、输出层构成的前馈神经网络,其中隐层的输 入用simgoid函数激活,输出层用线性函数激活。共有N个样本,每个样本分成4096个输入节 点,用
Figure 100002_DEST_PATH_IMAGE001
表示,隐层设置了70个节点,用
Figure 432445DEST_PATH_IMAGE002
表示,输入层到隐层的权重用
Figure 100002_DEST_PATH_IMAGE003
表示,隐层到输出层的权重用
Figure 811212DEST_PATH_IMAGE004
表示。
BP神经网络主要完成对特定字符的识别,在融合神经网络的分类决策树模型中,融合了两个BP神经网络,其中两个BP神经网络的原理相同,但对其训练识别的特定字符不同。通过初始化图像、二值化处理、训练网络、识别等步骤完成对特定字符的识别。
(1)为了实现对图像的识别,本发明给定N个训练集
Figure 100002_DEST_PATH_IMAGE005
首先对每个样本进行预处理,初始化为一个二值图像,并进行反色处理,以得到数值为0或1的图像像素值,所以第i个样本的初始矩阵为:
Figure 249146DEST_PATH_IMAGE006
公式(b)
根据0,1构成的图像矩阵可以形成一个输入向量,即:
Figure 100002_DEST_PATH_IMAGE007
公式(c)
因此根据每个样本形成的大小为
Figure 607446DEST_PATH_IMAGE008
的样本向量
Figure 100002_DEST_PATH_IMAGE009
,进行组合形成大小为
Figure 80016DEST_PATH_IMAGE010
的输入向量
Figure 100002_DEST_PATH_IMAGE011
,其中P的第一列全置为0,其他列为样本向量
Figure 131149DEST_PATH_IMAGE012
即:
Figure 100002_DEST_PATH_IMAGE013
公式(d)
Figure 994062DEST_PATH_IMAGE014
公式(e)
Figure 100002_DEST_PATH_IMAGE015
公式(f)
定义目标向量t为:
Figure 218370DEST_PATH_IMAGE016
公式(g)。
(2)根据输入向量和目标向量对BP神经网络进行构建,训练、仿真。
其中,根据公式
Figure 100002_DEST_PATH_IMAGE017
确定隐层节点数,其中n是隐层节点数,
Figure 736593DEST_PATH_IMAGE018
是 输入节点数,
Figure 100002_DEST_PATH_IMAGE019
是输出节点数,a是1到10之间的任意常数;
在隐层使用sigmoid激活函数作为传输函数公式为:
Figure 20944DEST_PATH_IMAGE020
公式(h)
在输出层使用线性函数作为传输函数,以提高识别的准确率和字符间的匹配性。
根据神经网络的输出和目标向量可以求得均方误差为:
Figure 100002_DEST_PATH_IMAGE021
公式(i)
当BP神经网络迭代
Figure 371154DEST_PATH_IMAGE022
次时,使用公式(j)对每层的权值和阈值进行修改:
Figure 100002_DEST_PATH_IMAGE023
公式(j)。
其中
Figure 477782DEST_PATH_IMAGE024
为第k次迭代各层之间的连接权向量或阈值向量,
Figure 100002_DEST_PATH_IMAGE025
为学习率,
Figure 659364DEST_PATH_IMAGE026
因为在训练之间定义最佳学习率是不现实的,所以使用自适应调整学习率的梯度下降算法,使用公式(k)使学习率根据局部误差曲面做出相应的调整:
Figure 100002_DEST_PATH_IMAGE027
公式(k)
其中
Figure 645775DEST_PATH_IMAGE028
为增量因子,
Figure 100002_DEST_PATH_IMAGE029
为减量因子;
当误差以减小的方式趋于目标时,说明修正方向正确,可使步长增加,因此学习率 乘以增量因子
Figure 545598DEST_PATH_IMAGE030
,使学习率增加;而当误差超过事先设定值时,说明修正过头,应减小步 长,因此学习率乘以减量因子
Figure 100002_DEST_PATH_IMAGE031
,使学习率减小,同时舍去使误差增加的前一步修正过 程。
步骤二、基于融合BP神经网络的分类决策树模型,对货币数据和非货币数据进行分类筛选;
具体来讲,通过步骤一中训练好的对特定字符具有识别功能的BP神经网络融入分类决策树模型对货币数据和非货币数据的分类,其中主要包括以下三个步骤:
Step1:判断数据值是否不存在无关字符的情况,例如“,”、“:”等,如果决策树结点返回“0”,则直接判定为“非货币数据”,如果返回“1”,则传入下一个结点继续判断即执行Step2。
Step2:对于传入的数据对其最后一个字符判断是否是特定字符,其中对于特定字符的判断识别通过融入的BP神经网络来完成,如果不是特定字符,则BP神经网络会返回0到结点中,如果是则会返回1到决策树结点中;分类决策树根据BP神经网络返回的结果进行决策。如果此节点返回0,则判定为非货币数据,如果返回1则传入下一个节点继续判断即执行Step3。
Step3:判断传入数据的第一个字符是否是数字,同样通过融入一个BP神经网络来完成识别,根据BP神经网络返回的结果进行判断从而得到最终的分类结果。
融合神经网络的优点是借助神经网络强大的计算和识别功能提升了分类决策树中特征的等级,从而解决了分类决策树容易产生过拟合和欠拟合的问题。
最终分类决策树由3个特征训练而成,分别是数据值中是否不存在其他无关标点符号、最后一个字符是否是特定字符、第一个字符是否是数字。为了选择最优的划分属性,首先根据公式(l)计算每个类别标签的信息熵:
根据公式(l)计算每个类别标签的信息熵:
Figure 547926DEST_PATH_IMAGE032
公式 (l)
根据公式(m)计算出的信息增益选择最优特性:
Figure 100002_DEST_PATH_IMAGE033
公式(m)
本发明使用M个数据集
Figure 787278DEST_PATH_IMAGE034
选择货币数据的3个特征 构成属性集
Figure 100002_DEST_PATH_IMAGE035
其中选择数据集中80%的数据作为训练集
Figure 147852DEST_PATH_IMAGE036
,选择20%的数据作为测试集
Figure 100002_DEST_PATH_IMAGE037
根据BP神经网络对训练集进行改进形成输入集
Figure 472654DEST_PATH_IMAGE038
,其中a表示由BP神经网络 形成的特征值。
步骤三、创建ICS模型,对货币数据进行智能化转换。
为实现数据转换,本发明提出了一种ICS(Init-Computing-Select)计算模型,可根据数据形式以及转换需求自定义参数,默认转换为万元形式。此模型主要分为三个步骤,分别是初始化阶段、计算阶段、选择阶段:
(1)初始化阶段。对输入数据的货币形式进行判断,根据存在的货币形式对其对应 的权重赋值,用w表示权重。若其形式存在事先定义的货币单位形式中的某一种,则对其相 应的权重赋值为1,其他不存在的权重赋值为0。从而实现将输入的货币数据按形式分配到 对应货币形式中,M表示货币形式,n为自定义参数;
Figure 100002_DEST_PATH_IMAGE039
公式(n)
Figure 842456DEST_PATH_IMAGE040
公式(o)。
(2)计算阶段。通过设置由汇率转换、单位转换组成的权重矩阵F,F的大小由参数n决定,对F的定义如公式(p)所示:
Figure 100002_DEST_PATH_IMAGE041
公式(p)
Figure 670734DEST_PATH_IMAGE042
公式(q)公式(q)是对常用货币形式以 及未来可能使用的形式进行了统计分类,其中包括元、万元、美元、欧元、韩元、日元、亿元等 转换形式,即参数n为7时根据权重矩阵
Figure 100002_DEST_PATH_IMAGE043
实现货币形式的任意统一转换。其中人民币 用y表示,美元用d表示,欧元用e表示,韩元用w表示,日元用h表示,例如:yd表示1元人民币 兑换成美元的实时汇率,而dy表示1美元兑换成人民币的实时汇率,we表示1韩元兑换成欧 元的实时汇率。
根据得到的权重赋值后的货币表达式
Figure 906937DEST_PATH_IMAGE044
以及实时权重矩阵
Figure 100002_DEST_PATH_IMAGE045
通过矩阵计 算,可以通过公式(q)计算得到转换后的数据:
Figure 515773DEST_PATH_IMAGE046
公式(r)。
Figure 100002_DEST_PATH_IMAGE047
表示事先自定义转换形式的一种,通过改变i的值进行多次计算,得到一种或 多种转换形式。
(3)选择输出阶段。首先根据转换需求,选择输出形式,为选择权重矩阵赋值,公式如下所示:
Figure 626948DEST_PATH_IMAGE048
公式(s)
其次根据选择权重矩阵b的值为步骤(2)中i赋值,将公式(r)的计算结果
Figure DEST_PATH_IMAGE049
作为 转换结果输出,同时存入转换结果库中。
通过以上三个阶段即可实现数据的转换,其算法实现的伪代码如表1所示。
表1 ICS计算模型伪代码
Figure 716258DEST_PATH_IMAGE050
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明对中标数据的成交金额数据进行转换,成交金额数据一般存在形式各异、单位不一等问题。以下实例描述取20个典型数据以及7个较为常用的转换单位,从数据传入、数据筛选、模型选择、数据转换四个方面进行详细描述。
数据传入
首先获取招投标数据中成交金额一列的数据值,并将其依次传入融合神经网络的分类决策树模型中,事先定义的非货币数据类型如图4所示:
部分代表性数据形式如下表所示:
表2 部分代表性数据
448万元 9512欧元+1250$+117250元 7456570.77 10600欧元+490000¥ 综合折扣率90%
25000元/课时 460000人民币+37700美元 480000美元 监理费费率3.00% 839800元
98% 46.7253万元,设计费率5.79% 0.078元/片 11206元+155碗 120元/人民币
详见附件 工时单价:10元/小时,配件加价率:10% 50%,49%,50% 综合单价65000.00元 45万元+141美元
(一) 数据筛选
取80%的数据作为训练集,将20%的数据作为测试集,具体流程如下:
S1.将数据传入模型中,首先判断数据中是否不存在其他无关符号(无关符号指除“.”和“+”之外的标点符号,例如“,”、“%”等符号),如果返回YES,则执行S3,否则,执行S2;
S2.将数据存入非货币数据库中;
S3.临时存储数据值,并获取数据的最后一个字符;
S4.判断数据的最后一个字符是否是特定字符(特定字符包括:表示货币单位的字符(例如:元,万等);各国货币的表示符号(例如:¥、$、€等);常写错的货币单位字符(例如:万写成碗的情况等)),如果返回YES,则执行S5,否则,执行S2;
S5.临时存储数据值,并获取数据的第一个字符;
S6.判断数据的第一个字符是否是特定字符(特定字符包括:从“0”到“9”的数字),如果返回YES,则执行S7,否则,执行S2;(特定字符的识别通过BP神经网络实现);
S7.输出货币类型数据,传入ICS计算模型中。
部分代表性数据判断结果如下表所示。
表3 代表性数据分类结果
编号 数据集 Other char Last char First char 货币数据
1 448万元 1 1 1 YES
2 98% 0 1 1 NO
3 7456570.77 1 0 1 NO
4 10600欧元+490000¥ 1 1 1 YES
5 综合折扣率90% 0 0 0 NO
6 25000元/课时 0 0 1 NO
7 460000人民币+37700美元 1 1 1 YES
8 480000美元 1 1 1 YES
9 监理费费率3.00% 0 0 0 NO
10 839800元 1 1 1 YES
11 9512欧元+1250$+117250元 1 1 1 YES
12 46.7253万元,设计费率5.79% 0 0 1 NO
13 0.078元/片 0 0 1 NO
14 11206元+155碗 1 1 1 YES
15 120元/人民币 1 1 1 YES
16 详见附件 1 0 0 NO
17 工时单价:10元/小时,配件加价率:10% 0 0 0 NO
18 综合单价65000.00元 1 1 0 NO
19 50%,49%,50% 0 0 1 NO
20 45万元+141美元 1 1 1 YES
(二) 模型选择
如果是非货币数据类型则存入数据库中,如果是货币数据类型,则将数据传入ICS计算模型中,代表性数据模型选择结果如下表所示。
表4 代表性数据模型选择结果
编号 数据集 “非货币数据”库 ICS模型
1 448万元 NO YES
2 98% YES NO
3 7456570.77 YES NO
4 10600欧元+490000¥ NO YES
5 综合折扣率90% YES NO
6 25000元/课时 YES NO
7 460000人民币+37700美元 NO YES
8 480000美元 NO YES
9 监理费费率3.00% YES NO
10 839800元 NO YES
11 9512欧元+1250$+117250元 NO YES
12 46.7253万元,设计费率5.79% YES NO
13 0.078元/片 YES NO
14 11206元+155碗 NO YES
15 120元/人民币 NO YES
16 详见附件 YES NO
17 工时单价:10元/小时,配件加价率:10% YES NO
18 综合单价65000.00元 YES NO
19 50%,49%,50% YES NO
20 45万元+141美元 NO YES
(三) 数据转换;
S1.将货币数据传入ICS模型中,首先初始化模型的权重w;
S2.实时更新汇率、转换的权重矩阵F;
S3.根据实时权重矩阵进行数据转换(可转换元、万元、亿元、美元、欧元、日元、韩元等7种形式);
根据权重矩阵转换的结果如下表所示:
表5 代表性数据转换结果
编号 数据集 万元 美元 欧元 韩元 日元 亿元
1 448万元 4480000 448 668796.46 641025.64 866924800 90866681.54 0.0448
4 10600欧元+490000¥ 564081.28 56.41 84208.83 80712.18 94963254.68 11441114.74 0.0056
7 460000人民币+37700美元 712537.22 71.25 106371.07 101954.16 89503284.77 14452208.18 0.0071
8 480000美元 3215328 321.53 480000 460068.68 6221981.21 65215666.39 0.032
10 839800元 839800 83.98 125369.48 120163.69 162509698 17033446.24 0.0083
11 9512欧元+1250$+117250元 192100.72 19.21 28677.74 27486.94 22833891.12 3896329.14 0.0019
14 11206元+155碗 1561206 156.12 233064.52 223386.85 302108973.06 31665537.59 0.0156
15 120元/人民币 120 0.01 17.91 17.17 23221.2 2433.93 0.0
20 45万元+141美元 450944.5 45.09 67319.22 64523.88 87081327.71 9146390.74 0.0045
(四) 输出结果
根据需求智能选择转换结果数据,默认选择万元进行转换;最后将转换结果存入转换结果库中。
这样,本发明提供的基于分类决策树实现货币类数据智能转换方法实现不同形式、不同单位、不同内容的数据筛选与转换,为数据预处理、数据分析等提供了便利快捷的方法,节省了人工处理时间,提升了数据处理的效率;为数据分析和挖掘获得更有价值的信息奠定了基础,促进了算法模型的实际应用与发展,提高了其他有需求领域在进行货币数据单位转换时的效率,为生产生活提供便利,提高效率。
基于上述方法本发明还提供一种基于分类决策树实现货币类数据智能转换系统,如图5所示,系统包括:网络模型创建识别模块、分类筛选模块以及货币数据转换模块;
网络模型创建识别模块,用于创建BP神经网络模型,实现数据识别;
创建的BP神经网络模型包括:输入层、隐层以及输出层;
其中,隐层的输入用simgoid函数激活,输出层用线性函数激活;
BP神经网络模型对预设字符进行识别,在融合神经网络的分类决策树模型中,融合两个BP神经网络模型,依次通过初始化图像、二值化处理、训练网络、识别完成对预设字符的识别;
分类筛选模块基于融合BP神经网络的分类决策树模型,对货币数据和非货币数据进行分类筛选;
货币数据转换模块创建ICS模型,对货币数据进行智能化转换。
本发明提供的基于分类决策树实现货币类数据智能转换系统将神经网络与分类决策树融合,为成熟算法的发展提供了思路;解决数据预处理过程中数据智能化转换的难题,尤其对货币类数据的智能化转换,提高数据预处理的效率,为数据分析和挖掘获得更有价值的信息奠定基础,促进算法模型的实际应用与发展,提高其他需求领域在进行货币数据单位转换时的效率,为生产生活提供便利,提高效率。
本发明提供的基于分类决策树实现货币类数据智能转换系统中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
本发明提供的基于分类决策树实现货币类数据智能转换方法及系统是结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种基于分类决策树实现货币类数据智能转换方法,其特征在于,方法包括:
步骤一、创建BP神经网络模型,实现数据识别;
创建的BP神经网络模型包括:输入层、隐层以及输出层;
其中,隐层的输入用simgoid函数激活,输出层用线性函数激活;
BP神经网络模型对预设字符进行识别,在融合神经网络的分类决策树模型中,融合两个BP神经网络模型,依次通过初始化图像、二值化处理、训练网络、识别完成对预设字符的识别;
步骤二、基于融合BP神经网络的分类决策树模型,对货币数据和非货币数据进行分类筛选;
步骤三、创建ICS模型,对货币数据进行智能化转换。
2.根据权利要求1所述的基于分类决策树实现货币类数据智能转换方法,其特征在于,
步骤一中,
设置N个样本,每个样本分成W个输入节点,用
Figure DEST_PATH_IMAGE001
表示,隐层设 置了70个节点,用
Figure 65960DEST_PATH_IMAGE002
表示,输入层到隐层的权重用
Figure DEST_PATH_IMAGE003
表示,隐层到输 出层的权重用
Figure 983101DEST_PATH_IMAGE004
表示;
设定N个训练集
Figure DEST_PATH_IMAGE005
对每个样本进行预处理,初始化为一个二值图像,并进行反色处理,以得到数值为0或1的图像像素值,第i个样本的初始矩阵为:
Figure 700521DEST_PATH_IMAGE006
公式(b)
根据0,1构成的图像矩阵可以形成一个输入向量,即:
Figure DEST_PATH_IMAGE007
公式(c)
根据每个样本形成的大小为
Figure 95730DEST_PATH_IMAGE008
的样本向量
Figure DEST_PATH_IMAGE009
,进行组合形成大小为
Figure 608970DEST_PATH_IMAGE010
的输入向量
Figure DEST_PATH_IMAGE011
,其中P的第一列全置为0,其他列为样本向 量
Figure 103536DEST_PATH_IMAGE012
即:
Figure DEST_PATH_IMAGE013
公式(d)
Figure 370570DEST_PATH_IMAGE014
公式(e)
Figure DEST_PATH_IMAGE015
公式(f)
定义目标向量t为:
Figure 507153DEST_PATH_IMAGE016
公式(g)。
3.根据权利要求2所述的基于分类决策树实现货币类数据智能转换方法,其特征在于,
根据输入向量和目标向量对BP神经网络进行构建,训练、仿真;
其中,根据公式
Figure DEST_PATH_IMAGE017
确定隐层节点数,其中n是隐层节点数,
Figure 379294DEST_PATH_IMAGE018
是输入 节点数,
Figure DEST_PATH_IMAGE019
是输出节点数,a是1到10之间的任意常数;
在隐层使用sigmoid激活函数作为传输函数公式为:
Figure 372658DEST_PATH_IMAGE020
公式(h)
根据神经网络的输出和目标向量可以求得均方误差为:
Figure DEST_PATH_IMAGE021
公式(i)
当BP神经网络迭代
Figure 563206DEST_PATH_IMAGE022
次时,使用公式(j)对每层的权值和阈值进行修改:
Figure DEST_PATH_IMAGE023
公式(j);
其中
Figure 300217DEST_PATH_IMAGE024
为第k次迭代各层之间的连接权向量或阈值向量,
Figure DEST_PATH_IMAGE025
为学习率,
Figure 761286DEST_PATH_IMAGE026
使用公式(k)使学习率根据局部误差曲面做出相应的调整:
Figure DEST_PATH_IMAGE027
公式(k)
其中
Figure 128813DEST_PATH_IMAGE028
为增量因子,
Figure DEST_PATH_IMAGE029
为减量因子;
当误差以减小的方式趋于目标时,说明修正方向正确,使步长增加,并将学习率乘以增 量因子
Figure 370439DEST_PATH_IMAGE030
,使学习率增加;
当误差超过事先设定值时,说明修正过头,减小步长,使学习率乘以减量因子
Figure DEST_PATH_IMAGE031
,将 学习率减小,同时舍去使误差增加的修正过程。
4.根据权利要求1或2所述的基于分类决策树实现货币类数据智能转换方法,其特征在于,
步骤二中,对货币数据和非货币数据进行分类筛选包括以下三个步骤:
Step1:判断数据值是否不存在无关字符的情况,如果决策树结点返回“0”,则直接判定为“非货币数据”,如果返回“1”,则传入下一个结点继续判断即执行Step2;
Step2:对于传入的数据对其最后一个字符判断是否是特定字符,其中对于特定字符的判断识别通过融入的BP神经网络来完成,如果不是特定字符,则BP神经网络会返回0到结点中,如果是则会返回1到决策树结点中;
如果此节点返回0,则判定为非货币数据,如果返回1则传入下一个节点继续判断即执行Step3;
Step3:判断传入数据的第一个字符是否是数字,同样通过融入一个BP神经网络来完成识别,根据BP神经网络返回的结果进行判断从而得到最终的分类结果。
5.根据权利要求4所述的基于分类决策树实现货币类数据智能转换方法,其特征在于,
步骤四还包括:
根据公式(l)计算每个类别标签的信息熵:
Figure 583245DEST_PATH_IMAGE032
公式(l)
根据公式(m)计算出的信息增益选择最优特性:
Figure DEST_PATH_IMAGE033
公式(m)
使用M个数据集
Figure 226716DEST_PATH_IMAGE034
选择货币数据的3个特征构成属 性集
Figure DEST_PATH_IMAGE035
其中选择数据集中80%的数据作为训练集
Figure 1031DEST_PATH_IMAGE036
,选 择20%的数据作为测试集
Figure DEST_PATH_IMAGE037
根据BP神经网络对训练集进行改进形成输入集
Figure 667635DEST_PATH_IMAGE038
,其中a表示由BP神经网络形成的 特征值。
6.根据权利要求1或2所述的基于分类决策树实现货币类数据智能转换方法,其特征在于,
步骤三中,
ICS模型对货币数据进行智能化转换包括三个步骤,分别是初始化阶段、计算阶段以及选择阶段:
初始化阶段:
对输入数据的货币形式进行判断,根据存在的货币形式对其对应的权重赋值,用w表示权重;
若存在事先定义的货币单位形式中的某一种,则对其相应的权重赋值为1,其他不存在 的权重赋值为0;实现将输入的货币数据按形式分配到对应货币形式中,M表示货币形式,n 为自定义参数;
Figure DEST_PATH_IMAGE039
公式(n)
Figure 746450DEST_PATH_IMAGE040
公式(o)。
7.根据权利要求6所述的基于分类决策树实现货币类数据智能转换方法,其特征在于,
计算阶段:通过设置由汇率转换、单位转换组成的权重矩阵F,F的大小由参数n决定,对F的定义如公式(p)所示:
Figure DEST_PATH_IMAGE041
公式(p)
Figure 182110DEST_PATH_IMAGE042
公式(q)
根据得到的权重赋值后的货币表达式
Figure DEST_PATH_IMAGE043
以及实时权重矩阵
Figure 953757DEST_PATH_IMAGE044
通过矩阵计算,通过公 式(q)计算得到转换后的数据:
Figure DEST_PATH_IMAGE045
公式(r);
Figure 842079DEST_PATH_IMAGE046
表示事先自定义转换形式的一种,通过改变i的值进行多次计算,得到一种或多种 转换形式。
8.根据权利要求7所述的基于分类决策树实现货币类数据智能转换方法,其特征在于,
选择输出阶段:
根据转换需求,选择输出形式,为选择权重矩阵赋值,公式如下所示:
Figure DEST_PATH_IMAGE047
公式(s)
其次根据选择权重矩阵b的值为步骤(2)中i赋值,将公式(r)的计算结果
Figure 160802DEST_PATH_IMAGE048
作为转换 结果输出,同时存入转换结果库中。
9.一种基于分类决策树实现货币类数据智能转换系统,其特征在于,系统采用如权利要求1至8任意一项所述的基于分类决策树实现货币类数据智能转换方法;
系统包括:网络模型创建识别模块、分类筛选模块以及货币数据转换模块;
网络模型创建识别模块,用于创建BP神经网络模型,实现数据识别;
创建的BP神经网络模型包括:输入层、隐层以及输出层;
其中,隐层的输入用simgoid函数激活,输出层用线性函数激活;
BP神经网络模型对预设字符进行识别,在融合神经网络的分类决策树模型中,融合两个BP神经网络模型,依次通过初始化图像、二值化处理、训练网络、识别完成对预设字符的识别;
分类筛选模块基于融合BP神经网络的分类决策树模型,对货币数据和非货币数据进行分类筛选;
货币数据转换模块创建ICS模型,对货币数据进行智能化转换。
10.一种终端机,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至8任一项所述基于分类决策树实现货币类数据智能转换方法的步骤。
CN202210977872.8A 2022-08-16 2022-08-16 一种实现货币类数据智能转换方法、系统及终端机 Active CN115081554B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210977872.8A CN115081554B (zh) 2022-08-16 2022-08-16 一种实现货币类数据智能转换方法、系统及终端机

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210977872.8A CN115081554B (zh) 2022-08-16 2022-08-16 一种实现货币类数据智能转换方法、系统及终端机

Publications (2)

Publication Number Publication Date
CN115081554A true CN115081554A (zh) 2022-09-20
CN115081554B CN115081554B (zh) 2023-04-07

Family

ID=83244693

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210977872.8A Active CN115081554B (zh) 2022-08-16 2022-08-16 一种实现货币类数据智能转换方法、系统及终端机

Country Status (1)

Country Link
CN (1) CN115081554B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030097318A1 (en) * 1999-03-08 2003-05-22 Christopher C. Yu Method and apparatus for converting, formatting, and displaying currency values
US20180204192A1 (en) * 2015-07-08 2018-07-19 Barclays Bank Plc Secure Digital Data Operations
CN109190698A (zh) * 2018-08-29 2019-01-11 西南大学 一种网络数字虚拟资产的分类识别系统及方法
CN112270322A (zh) * 2020-12-17 2021-01-26 恒银金融科技股份有限公司 一种利用神经网络模型实现对钞票冠字号识别的方法
CN113901942A (zh) * 2021-10-25 2022-01-07 广州广电运通金融电子股份有限公司 多模态货币识别系统、方法、存储介质和终端
CN114880590A (zh) * 2022-04-11 2022-08-09 深圳市网睿科技有限公司 多语言网站货币自动转换系统及其方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030097318A1 (en) * 1999-03-08 2003-05-22 Christopher C. Yu Method and apparatus for converting, formatting, and displaying currency values
US20180204192A1 (en) * 2015-07-08 2018-07-19 Barclays Bank Plc Secure Digital Data Operations
CN109190698A (zh) * 2018-08-29 2019-01-11 西南大学 一种网络数字虚拟资产的分类识别系统及方法
CN112270322A (zh) * 2020-12-17 2021-01-26 恒银金融科技股份有限公司 一种利用神经网络模型实现对钞票冠字号识别的方法
CN113901942A (zh) * 2021-10-25 2022-01-07 广州广电运通金融电子股份有限公司 多模态货币识别系统、方法、存储介质和终端
CN114880590A (zh) * 2022-04-11 2022-08-09 深圳市网睿科技有限公司 多语言网站货币自动转换系统及其方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
PIASECKI KRZYSZTOF: "Impact of Discretization Units on the Modelling Efficiency of Currency Exchange Rate in Binary Representation" *
蒋琳琼: "基于支持向量机的货币识别研究", 《知网》 *
郭艳平: "纸币币种与币值识别系统的研究" *

Also Published As

Publication number Publication date
CN115081554B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN110929697B (zh) 一种基于残差结构的神经网络目标识别方法及系统
CN110046656B (zh) 基于深度学习的多模态场景识别方法
CN109344288B (zh) 一种基于多模态特征结合多层注意力机制的结合视频描述方法
CN110674305B (zh) 一种基于深层特征融合模型的商品信息分类方法
Zhang et al. Active semi-supervised learning based on self-expressive correlation with generative adversarial networks
CN110428428A (zh) 一种图像语义分割方法、电子设备和可读存储介质
CN110533024B (zh) 基于多尺度roi特征的双二次池化细粒度图像分类方法
CN113628294A (zh) 一种面向跨模态通信系统的图像重建方法及装置
CN112784929B (zh) 一种基于双元组扩充的小样本图像分类方法及装置
CN110175248B (zh) 一种基于深度学习和哈希编码的人脸图像检索方法和装置
JP6908302B2 (ja) 学習装置、識別装置及びプログラム
CN113127737B (zh) 融合注意力机制的个性化搜索方法和搜索系统
CN112651940B (zh) 基于双编码器生成式对抗网络的协同视觉显著性检测方法
CN110210468A (zh) 一种基于卷积神经网络特征融合迁移的文字识别方法
CN109858972B (zh) 广告点击率的预测方法和装置
CN110245228A (zh) 确定文本类别的方法和装置
CN114283320B (zh) 基于全卷积的无分支结构目标检测方法
CN111274422A (zh) 模型训练方法、图像特征提取方法、装置及电子设备
CN113987236B (zh) 基于图卷积网络的视觉检索模型的无监督训练方法和装置
Lata et al. Data augmentation using generative adversarial network
CN114332519A (zh) 一种基于外部三元组和抽象关系的图像描述生成方法
CN116258990A (zh) 一种基于跨模态亲和力的小样本参考视频目标分割方法
JPH1115805A (ja) ニューラルネットワーク分析方法及び装置
CN113191450B (zh) 一种基于动态标签调整的弱监督目标检测算法
CN115081554B (zh) 一种实现货币类数据智能转换方法、系统及终端机

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant