CN1675657B

CN1675657B - 货币验证器

Info

Publication number: CN1675657B
Application number: CN03819439.2A
Authority: CN
Inventors: G·博达特
Original assignee: Mars Inc
Current assignee: Mars Inc
Priority date: 2002-06-19
Filing date: 2003-06-18
Publication date: 2010-06-16
Anticipated expiration: 2023-06-18
Also published as: DE60329596D1; JP4555078B2; CN1675657A; WO2004001683A1; US20060254876A1; EP1516293A1; ES2331066T3; US7648016B2; JP2005530271A; AU2003247029B2; EP1516293B1; AU2003247029A1

Abstract

一种推导用于流通品分类的函数的方法。所述方法包括处理对应于多个流通品的特征的训练数据向量，并推导包含多个支撑向量的支撑向量机分类函数。

Description

货币验证器

本发明涉及货币验证器以及用于调节和操作货币验证器的方法。在此说明书中，术语货币和流通品(currency item)旨在包括硬币，代币及类似物，钞票和帐单，诸如支票、票据、债券的其它有价单据，而且既包括真品也包括伪造品，诸如金属片和垫片。

有许多已知的方法用于确定流通品的面额并区别真品和伪造流通品。通常，一个或多个传感器、诸如电磁或光学传感器感测流通品，产生表示流通品的某些特征的信号，诸如硬币厚度、硬币材料或者钞票上的图案。然后将那些测量信号与所存储的表示已知流通品的参考数据比较，并且根据比较的结果，把被测流通品分类为例如特定面额的真流通品、已知的伪造品或者仅仅是未知的。

例如，已知以“窗口”集的形式存储用于已知流通品的参考数据，窗口由上限和下限构成。如果每个关于特定项的测量信号都落在每个特定面额的对应窗口内，它就被分类为属于该特定面额。这种方法通常被视为在具有对应于被测特征的轴的空间中利用边界，这种边界被称为接受边界，是线性的。

通常，特定面额的流通品的总体分布是非线性的，在该情况下，线性接受边界不能足够精确地区别不同面额。另一种已知方法存储描述对应于特定面额的流通品的椭圆形边界的参考数据。与上面提到的方法类似，根据被测特征落在那些椭圆形边界内部还是外部，对被测流通品进行分类。例如，在GB 2 254 949A中描述了这种方法。

在许多情况下，流通品的不同面额之间的边界是错综复杂的，并且不能通过线性或椭圆形边界足够准确地反映。用于发现非线性接受边界的已知技术不能为货币验证器带来理想的结果。显然，例如，在可能损失收入的自动售货机中，能够准确地分类并且验证流通品特别重要。

本发明提供一种推导并使用分类函数的备选方法，特别用于对流通品进行分类。

本发明提供一种利用数据集推导出分类函数的方法，数据集的元素对应于第一空间中的点，选择对应于第一空间到第二空间的映射的核函数，推导出数据集的子集，使得第二空间中映射下的子集的象代表第二空间中映射下的数据集的象，并且推导出以所述特征向量子集表达的支撑向量机分类函数形式的分类函数。

或者，本发明提供一种通过处理对应于第一空间中的点的训练数据来推导分类函数的方法，该方法包括利用所述训练数据推导支撑向量机分类函数，该方法还包括选择对应于从第一空间到第二空间的映射的核函数，该方法包括选择训练数据集的子集，其中第二空间中子集的象代表第二空间中训练数据集的象，并且以子集来表达支撑向量机分类函数。

例如，该方法可涉及从至少一个货币传感器和多个项得到多个测量结果，并且从测量结果形成数据集，数据集的元素对应于所述第一空间中的点。

本发明也提供相应的分类函数、分类方法和分类器(分类装置)。

本发明的这些方面最好用于推导供制造、调节或操作如货币验证器之类设备时使用的函数。

本发明特别为流通品相关使用而设计，用于推导流通品的分类函数，用于分类、记数或验证流通品(方法和装置)。在这种情况下，例如，数据可从流通品的一个或多个特征的测量结果中得出，或者从一个或多个用于感测流通品的传感器得出。

本发明还提供用于流通品的分类的支撑向量机的使用。

本发明的其它方面在从属权利要求中论述。

本发明的实施例将会参考附图进行描述，附图中：

图1是说明支撑向量机的图示；

图2是说明数据分布以及根据本发明的实施例推导的判别函数的图示；

图3是说明另一个判别函数的图示。

根据一个优选实施例，本发明使用核函数分析从流通品和货币传感器获取的分析数据，从而推导出用于验证器的分类函数或接受边界。更具体地说，数据是从流通品、诸如硬币和钞票获取的测量数据，数据表示流通品的特征，诸如硬币厚度、材料、重量、宽度或钞票上的图案。

为了清晰和易懂，我们将会参照相对简单的数据分布从本发明基础理论的一般性描述开始。然后将会结合涉及流通品分类和验证的实施例更具体地描述本发明。

本发明的一个方面涉及使用核函数从数据集选择子集，在核函数方法的上下文中，子集代表数据集。更具体地说，子集代表对应于核函数k的映射φ的象空间中的数据集。本发明的这个方面使得利用核函数的数据分析能够用较少数据来进行，这降低了分析的复杂性，因而例如降低了当推导用于货币验证器的分类函数时的计算工作量以及相应的成本。

本发明的另一方面涉及支撑向量机的使用，如下所述。

在下文中，加下划线用来表示向量，除了上下文中暗指向量的地方，并且术语向量通常要用来包括标量(即，1维向量)。

首先，要描述向量集的代表子集的选择。

令X是向量集，大小为M。

X＝{x ₁，x ₂，...，x _M}

假设通过非线性映射函数φ从输入空间X到希尔伯特空间F映射任何向量：

φ：X →F

x→φ(x)

核函数是遵守Mercer定理的标量值函数。

核函数提供仅利用输入空间数据计算F中的点积的直接方法。为了简化符号，假定用φ_i＝φ(x_i)。然后，可以证明，对于核函数k，存在对应的映射φ，使得：

{φ_{i}}^{T} φ_{j} = k (x_{i}, x_{j}) = k_{i, j}

核函数的例子有：

k_{i, j} = {({x_{i}}^{T} x_{j} + a)}^{d}

d∈N多项式

k_{i, j} = e^{- \frac{| | x_{i} - x_{j} | |}{σ^{2}}}

高斯(RBF)

k_{i, j} = \tanh (a {x_{i}}^{T} x_{j} + b)

双曲的

正切(S形)

这种属性的结果是，如果算法可以仅用点积表达，则F中数据的象可仅用输入空间X中的数据来分析，甚至不必知道φ(x)。

对于一些核，诸如高斯，F的维数是无穷大的。从X到F的变换是非线性的并且F的维数通常远大于X。

现在，令S为X的子集，大小为L。

S＝{x _S，1，x _S，2，...，x _S，L}

假设存在能够近似或重构F中X的元素的象的子集S。换句话说，S就象是F空间中表达X的基。

因此，

\hat{φ} ({\underset{&OverBar;}{x}}_{i}) = Σ_{j = 1}^{L} α_{ij} φ ({\underset{&OverBar;}{x}}_{s, j})

(是利用F中S的象的φ(x _i)的近似值)

为了简化，使用下面的符号：

φ _i＝φ(x _i)

φ _s，i＝φ(x _s，i)

然后等式(1)可写为：

{φ_{&OverBar;}^{^}}_{i} = Φ_{s} \cdot {\underset{&OverBar;}{a}}_{i}

其中

由F中S的象构成的矩阵。

a _i＝[a_i1，a_i2，...，a_iL]^t利用F中S的象表达φ _i的向量。

希望求出使X的第i元素的象φ _i与利用S集重构的之间的相对差δ_i最小化的a _i值。

{\underset{&OverBar;}{d}}_{i} = {\underset{&OverBar;}{φ}}_{i} - {φ_{&OverBar;}^{^}}_{i}

δ_{i} = \frac{{| | {\underset{&OverBar;}{d}}_{i} | |}^{2}}{{| | {\underset{&OverBar;}{φ}}_{i} | |}^{2}} = \frac{{({\underset{&OverBar;}{φ}}_{i} - Φ_{s} \cdot {\underset{&OverBar;}{a}}_{i})}^{t} \cdot ({\underset{&OverBar;}{φ}}_{i} - Φ_{s} \cdot {\underset{&OverBar;}{a}}_{i})}{{\underset{&OverBar;}{φ}}_{i}^{t} \cdot {\underset{&OverBar;}{φ}}_{i}}

δ_{i} = 1 + \frac{{\underset{&OverBar;}{a}}_{i}^{t} ({Φ_{s}}^{t} Φ_{s}) {\underset{&OverBar;}{a}}_{i} - 2 {{\underset{&OverBar;}{a}}_{i}^{t} Φ}_{s}^{t} {\underset{&OverBar;}{φ}}_{i}}{{\underset{&OverBar;}{φ}}_{i}^{t} \cdot {\underset{&OverBar;}{φ}}_{i}} - - - (3)

δ_i的最小化导致：

\frac{&PartialD; δ_{i}}{&PartialD; {\underset{&OverBar;}{a}}_{i}} = \frac{2 ({Φ_{s}}^{t} Φ_{s}) {\underset{&OverBar;}{a}}_{i} - 2 {Φ_{s}}^{t} {\underset{&OverBar;}{φ}}_{i}}{{\underset{&OverBar;}{φ}}_{i}^{t} \cdot {\underset{&OverBar;}{φ}}_{i}} = 0

或者

{\underset{&OverBar;}{a}}_{i} = {({Φ_{s}}^{t} Φ_{s})}^{- 1} {Φ_{s}}^{t} {\underset{&OverBar;}{φ}}_{i} - - - (4)

如果F中S的象的元素是线性无关的，则(Φ_s ^tΦ_s)^-1存在。换句话说，Φ_s的秩是L。

利用等式(3)和(4)，可以写出：

δ_{i} = 1 - \frac{{\underset{&OverBar;}{φ}}_{i}^{t} Φ_{s} {({Φ_{s}}^{t} Φ_{s})}^{- 1} {Φ_{s}}^{t} {\underset{&OverBar;}{φ}}_{i}}{{\underset{&OverBar;}{φ}}_{i}^{t} \cdot {\underset{&OverBar;}{φ}}_{i}} = {Sin}^{2} (β_{i}) - - - (5)

其中β_i是向量φ _i与

之间的角，这意味着也使|β_i|最小化了。

现在引入核符号：

k ({\underset{&OverBar;}{x}}_{p}, {\underset{&OverBar;}{x}}_{q}) = {\underset{&OverBar;}{φ}}_{p}^{t} \cdot {\underset{&OverBar;}{φ}}_{q}

然后等式(5)可表达为

δ_{i} = 1 - \frac{K_{s, i}^{t} \cdot K_{s, s}^{- 1} \cdot K_{s, i}}{k ({\underset{&OverBar;}{x}}_{i}, {\underset{&OverBar;}{x}}_{i})} - - - (6)

其中

K_{s, s} = {[k ({\underset{&OverBar;}{x}}_{s, p}, {\underset{&OverBar;}{x}}_{s, q})]}_{\begin{matrix} p = 1, . . ., L \\ q = 1, . . ., L \end{matrix}}

是F中S的象的点积的L×L方阵。

K_{s, i} = {[k ({\underset{&OverBar;}{x}}_{s, j}, {\underset{&OverBar;}{x}}_{i})]}_{j = 1, . . ., L}^{t}

是F中S的象和x _i之间点积的向量。

正如所知的并且如以上表达的那样，核函数k以X来表达F中的点积。

最小化δ_i可以通过最大化下式来实现：

J_{i} = \frac{K_{s, i}^{t} \cdot K_{s, s}^{- 1} \cdot K_{s, i}}{k ({\underset{&OverBar;}{x}}_{i}, {\underset{&OverBar;}{x}}_{i})} - - - (7)

J_i可被认为是估算元素x _i的重构质量的局部拟合度函数。

利用试探法构造合适的集合S。在一个例子中，这利用全局拟合度函数J_s完成，J_s代表S的象如何近似地表示F中X的全部象。全局拟合度函数的一个例子为：

J_{s} = \frac{1}{M} [\underset{x_{i} &Element; S}{Σ} (\frac{K_{s, i}^{t} \cdot K_{s, s}^{- 1} \cdot K_{s, i}}{k ({\underset{&OverBar;}{x}}_{i}, {\underset{&OverBar;}{x}}_{i})}) + L] - - - (8)

下面更具体地描述如何构造S的一个例子。

首先，选择给出最佳全局拟合度结果的X的元素。换句话说，本例中利用等式(8)选择具有最大全局拟合度值J_s的元素。或者，第一个元素可以随机地或者通过检查来选择，从而形成S的第一个元素x_s，1。

接着，选择X的另一个元素并生成S的临时成员，在该基础上对X的所有其它元素计算J_s值。然后用X的下一个成员替换S的临时成员并且再次计算J_s。对X的所有剩余元素重复那些步骤。选择全局拟合度函数最大时对应的X的元素作为S的永久第二成员。

重复前面段落中陈述的步骤，求出S的后续成员，每次搜索拟合度函数的最高值。当拟合度函数超过预定值时，程序终止。或者，当S具有预定数量的元素时，或者当S是F中X的象的完整基时，程序终止。有必要检查K_s，s矩阵的秩以确信它可逆。当K_s，s不再可逆时，程序可终止。

也可使用其它更复杂的试探法。还可使用备选的拟合度函数。例如，全局拟合度函数可使用局部拟合度函数的平均值、中间值或最小值或者其它策略。或者，全局的和局部的拟合度函数都可以例如基于“误差”，利用等式(6)，在这种情况下，通过全局误差的减少指示S的优化。然而，在每种情况下都采用了例如等式(7)中的核表达式。

以上技术是“前向”选择方案，但也可使用例如涉及“后向”选择的其它技术。作为另一个例子，可考虑给定大小L的所有子集，选择最佳拟合。一般来说，可使用任何适当的基于拟合度的选择算法。

通过这种方法，可以求出X的子集S，其中映射φ下的F中X的所有元素的象可以近似表达为F中S的元素的象的线性组合。

所选的集合S也许不是唯一的，但是它提供了给定大小L的集合，该集合保存F中数据的结构。可以证明，对于一些核、如多项式，仅仅通过少数所选向量就达到J_s的最优值。

X中的所有样本或训练数据可被投影到F中S的象上。

样本x _i的变换通过点积投影给出：

(9) - - - z_{i} = {Φ_{s}}^{t} φ_{i}

注意，z_i通过线性变换获得。也可考虑其它变换，特别是正交投影它需要更多的计算，并且应用于已变换数据的许多算法都不需要它。

集合S可用来减少用于数据分析的各种核函数方法中涉及的计算，诸如核PCA和核GDA，如我们的共同未决的申请EP00311253.9中所述，通过引用将其内容结合于此。根据以上用于各种数据分布以及核函数的技术，EP00311253.9给出了选择的数据子集的例子。

下面要描述支撑向量机(以下称为SVM)，并且随后讨论S如何与支撑向量机配合使用。

支撑向量机的使用是用于数据分类和分离的已知技术。基础理论的完整说明可以在教科书和学术论文中找到，诸如C.J.C.Burges的“用于模式识别的支撑向量机导论”，来自“Data mining and knowledgediscovery”1998，121-167页。下面简要描述一些关键特征。

支撑向量机(以下称为SVM)利用训练数据并且实现了已知的结构风险最小化(SRM)归纳方案。一般来说，SVM是两类线性分类器，涉及将两类数据分开一定余量的超平面，如图1所示。

图1说明了用于可分离数据的SVM的基本例子。

等式(10)提供了判别函数，其中w是到超平面(HP)的向量法线(normal)，b是偏移，而x是样本向量。

(10)g(x)＝w^Tx+b

属于簇#1的样本具有标记+1，而属于簇#2的样本标记为-1。

训练样本集以及它们的标记被定义为{(x_i，d_i)}_i＝1 ^N。然后对于最优HP(w ₀，b ₀)保持以下约束，假设数据是可分离的：

(11) - - - w_{0}^{T} x_{i} + b_{0} &GreaterEqual; + 1

对于d_i＝+1

w_{0}^{T} x_{i} + b_{0} \leq - 1

对于d_i＝-1

关系式(11)可重写为如下更紧凑的形式：

(12)d_i(w^Tx_i+b)≥+1 对于i＝1，2，3，...，N

第一个或第二个关系式(11)为等式时的特殊样本称为支撑向量(SV)。

给定具有N个元素的训练数据集以及通用关系式(12)，目标是求出使分开各簇的余量最大化的w值和b值。

下面进行陈述。

令x^s是与d^s其类别(+/-1)相关联的支撑向量。

(13) - - - g (x^{s}) = w_{0}^{T} x^{s} &PlusMinus; b_{0} = &PlusMinus; 1

对于d^s＝±1

通过(13)可以计算出从SV到HP的欧几里得距离||r||：

(14) - - - r = \frac{g (x^{s})}{| | w_{o} | |}

| | r | | = \frac{| | g (x^{s}) | |}{| | w_{o} | |} = \frac{1}{| | w_{o} | |}

因此余量变为：

(15) - - - ρ = \frac{2}{| | w_{o} | |}

在关系式(12)的约束下，使余量最大化导致w的长度最小化。

这个问题被称为二次优化(或二次规划QP)。这是非线性规划情况，其中成本函数在w上是二次的，而约束是线性的。问题可陈述如下：

对于给定的训练集{(x_i，d_i)_i＝1 ^N，求出使成本函数最小的权向量w和偏移量b：

(16) - - - L (w) = \frac{1}{2} w^{T} w

条件为：

d_i(w^Tx_i+b)≥+1 对于i＝1，2，3，...，N

这里因子1/2是为了表示(导出的)。这个问题被称为原始问题。它可与对偶问题相联系，这为我们提供一种仅通过输入样本的点积来表达解的方法。可利用拉格朗日乘子法解决原始问题。假设J为拉格朗日函数：

(17) - - - J (w, b, α) = \frac{1}{2} w^{T} w - Σ_{i = 1}^{N} α_{i} [d_{i} (w^{T} x_{i} + b) - 1]

α_i是非负拉格朗日乘子。可以对J进行论证：当w和b最小化时，α_i被最大化(鞍点)。微分并把结果设置为0之后，得到：

(18) - - - \frac{&PartialD; J (w, b, α)}{&PartialD; w} = 0 &RightArrow; w_{o} = Σ_{i = 1}^{N} α_{i} d_{i} x_{i}

(19) - - - \frac{&PartialD; J (w, b, α)}{&PartialD; b} = 0 &RightArrow; = Σ_{i = 1}^{N} α_{i} d_{i} = 0

解向量w_o以包括N个训练样本的展开式来定义。

但是仍然必须求出α_i系数，这可利用库恩-塔克条件[7]完成：

对于i＝1，2，3，...，N

因此仅满足等式11的拉格朗日乘子可以取非零值。现在可以使用对偶定理求出那些系数。通过(18)和(19)，式(17)可重写为：

(21) - - - Q (α) = Σ_{i = 1}^{N} α_{i} - \frac{1}{2} Σ_{i = 1}^{N} Σ_{j = 1}^{N} α_{i} α_{j} d_{i} d_{j} {x_{i}}^{T} x_{j}

这也是QP问题：

对于给定的训练集{(x_i，d_i)}_i＝1 ^N，求出使成本函数最大的拉格朗日乘子{α_i}_i＝1 ^N：

Q (α) = Σ_{i = 1}^{N} α_{i} - \frac{1}{2} Σ_{i = 1}^{N} Σ_{j = 1}^{N} α_{i} α_{j} d_{i} d_{j} {x_{i}}^{T} x_{j}

条件为：

- a - Σ_{i = 1}^{N} α_{i} d_{i} = 0

-b- α_i≥0 对于i＝1，2，3，...，N

对偶问题仅使用训练样本。成本函数仅依赖于样本的点积；这是非常重要的属性，能够将SVM一般化为非线性问题。当求出拉格朗日系数时，就可以如下表达最优权向量：

(22) - - - w_{o} = Σ_{i = 1}^{N} α_{0, i} d_{i} x_{i}

与非零拉格朗日乘子相关的x_i是SV。一般来说，SV比N少。因此，展开式13并不需要所有的项。利用任何SV和式(12)，可以求出最优的偏移量b：

(23) - - - b_{0} = 1 - w_{0}^{T} x^{s}

对于d^s＝+1以及

b_{0} = 1 + w_{0}^{T} x^{s}

对于d^s＝-1

然后判别函数变为：

g(x)＝w₀x^T+b₀；或

(24) - - - g (x) = x^{T} \underset{i &Element; SVS}{Σ} α_{0, i} d_{i} x_{i} + b_{0}

其中SVS是支撑向量集。

上面描述了数据可分离的情况。SVM也可以处理数据重叠的情况。相关文献中可以找到分析的细节，诸如上述的Burges论文，并且为了简明扼要，这里不再重复。

上面的SVM例子描述了线性分类。

为了建立非线性SVM，使用核函数，如上涉及到选择S时所述。

为了解决非线性问题，合并核函数和线性SVM。式(21)仅使用样本的点积。因此它可以用核重写，并且利用数据到特征空间F的暗含映射产生非线性SVM。

然后QP方法直接应用于F中，在那里寻找最优HP(线性分离)，如下：

(25) - - - Q (a) = Σ_{i = 1}^{N} α_{i} - \frac{1}{2} Σ_{i = 1}^{N} Σ_{j = 1}^{N} α_{i} α_{j} d_{i} d_{j} k_{i, j}

条件为：

- a - Σ_{i = 1}^{N} α_{i} d_{i} = 0

-b- 0≤α_i≤C

即使权向量w不能被明确地表达，也可以利用F中的任意样本计算它的点积。因此可以重新得到如下的判别函数(b ₀，如果有，通常利用式(23)估算)：

(26) - - - g (x) = Σ_{i = 1}^{N} α_{0, i} d_{i} k_{i, j} + b_{0}

记住展开式(26)受到非零拉格朗日乘子的限制。因此它仅在整个SV集(SVS)上定义，并且使用通常比学习集(N)更少的项：

(27) - - - g (x) = \underset{i &Element; SVS}{Σ} α_{0, i} d_{i} k_{i, j} + b_{0}

即使SVS的基数Ns通常来讲低于N，它仍然可以相当高，这种后果体现在成本、内存和计算能力方面。

本发明的一个关键特征是使用选择的子集S与SVM的组合。下面，S的元素描述为特征向量(FV)，S的选择描述为特征向量选择(FVS)。

在F中工作，利用S和根据(9)的训练数据的投影，可以修改式(27)，如下，记住：支撑向量属于训练数据，因此还可在F中使用S的象来表达。在F中工作，SVM是线性的SVM。

首先，式(27)以F来表达，或者换句话讲，以F中数据的象和支撑向量来表达。

(28) - - - g (x) = \underset{i &Element; {SVS}_{z}}{Σ} α_{0, i} d_{i} z_{i}^{T} z_{j} + b_{0}

其中SVSz表示F中每一个SVS的象。

拉格朗日乘子、d_i和z_i定义了明确的最优权向量w_z0。因此(28)可以仅用任何样本x在FVs上的投影z来表达，只要：

(29) - - - g (x) = w_{z 0}^{T} z + b_{0}

其中

w_{z 0} = \underset{i &Element; {SVS}_{z}}{Σ} α_{0, i} d_{i} z_{i}

使用按照上面式(6)的符号，这变为：

(30) - - - g (x_{i}) = w_{z 0}^{T} k_{si} + b_{0}

其中

w_{z 0} = \underset{j &Element; {SVS}_{z}}{Σ} α_{0, j} d_{j} K_{sj}

g (x_{i}) = Σ_{j = 1}^{L} w_{z 0, j} k (x_{j}, x_{i}) + b_{0}

注意，判别式(30)仅包括L项(即S的大小)，L通常远小于支撑向量的数量。这样，计算判别函数时所涉及的计算和处理被相当大地减少，并且更快。

图2和3均示出在输入空间中具有正态分布的两簇数据的例子。在图中，十字代表一簇中的数据，点代表另一簇中的数据，点或十字周围的圆圈指明样本中的特征向量。

上面的技术，组合FVS与SVM，使用稍微不同的准则应用于数据。更具体地说，在图2说明的情况中，设置拟合度值J_s＝0.8，选择12FV。在图3说明的情况中，设置拟合度值J_s＝0.999，选择38FV。

在这两种情况中，SV的数量是52。换句话讲，利用标准非线性SVM方法，判别函数包括52项的展开式。利用FVS，仅用12个FV就能足以表达判别函数。

黑色实线是判别函数(对于g(x)＝0)在输入空间X(F中HP的象)的轨迹。

有关各种数据的实验比较了使用上述的标准非线性SVM、SVM和FVS技术的判别性能。实验表明，使用SVM和FVS的判别一样好，并且在一些情况下比使用非线性SVM要好。

下面的表1给出在现实生活中表现的一些例子，使用高斯核以及广泛用来测试学习机的数据库中的数据。数据可以从下面的资料库获取：http://ida.first.gmd.de/～raetsch/data/benchmarks.htm。

表1：典型的SVM与FVS/SVM

测试数据的性能以及实现的减少量

有许多满足Mercer定理的核函数(参见WO 00/33262)表示F中的点积并且可在本发明中使用。下面给出更多的一些例子。

样条核，其中x和y是标量：

k (x, y) = 1 + x \cdot y + x \cdot y \cdot Min (x, y) - \frac{x + y}{2} \cdot {[Min (x, y)]}^{2} + \frac{Min {(x, y)}^{3}}{3}

S形核

k (x, y) = k (x, y) = \frac{1}{1 + e^{- \frac{x^{t} \cdot y}{a}}}

其中a＝1。

三阶多项式核：k(x，y)＝(x′·y)^d(d＝3，C＝0)，

概括起来，前面的例子表现了良好的性能，这意味着它们能够处理好不在原始数据集X中的新向量。

为了实现这个目的，有必要仔细地选择核、它的参数(比如σ)以及误差级别。

适当核的选择可以通过实验和反复试验、测试以了解哪个选择给出受分析的数据的最佳结果来完成。或者，选择可以通过实验和数据分布的检查来进行。

例如，对于具有多项式类型分布的数据，多项式核可以给出好的结果。还需要仔细选择各种参数、如高斯核中的σ以及拟合度函数的预定等级。再次引导数据的实验、经验和成型。

根据本发明的优选实施例，将上述方法的一般原理应用于流通品和货币验证器。换句话讲，将方法应用于从传感器获取的数据，用于推导出表示流通品特征的测量结果。参考图2，例如，图2的轴可以被视为代表两个不同面额的硬币的硬币厚度和硬币材料、或者一种真品和一种伪造品，尽管事实上显示的分布可能不一定代表现实生活中的分布。在许多情况下，诸如在钞票验证器中，从钞票的组合测量结果形成的特征向量的维数远高于3，因此不能用图形说明。

本发明的实施例涉及硬币验证器，如图4中框图所示。

在图4中，框1代表一个测量系统，该系统包括入口2、用于引入样本3的硬币入口和硬币传输通道形式的传输系统(未显示)以及用于测量样本的物理量的传感器系统(未显示)。测量系统1通过数据总线5连接到处理系统4。处理系统4通过数据总线7连接到分类器6。分类器6的输出通过数据输出总线9连接到应用系统8。本例中应用系统8是例如自动售货机，但是也可以是例如货币兑换机。

测量系统1测量所插入的硬币3的特征。所测特征被组成具有n个元素的特征向量，其中每个元素通过处理系统4对应于一个所测特征。在这个例子中，传感器系统使用已知的技术(参见例如GB 2 254949A)测量表示所插入硬币的材料、厚度和直径的值，并且那些值是对应的特征向量的三个元素。简要地说，每个传感器包括一个或多个自激振荡电路中的线圈。对直径和厚度传感器来说，由插入硬币的临近引起的每个线圈电感的改变使振荡器的频率改变，由此可以获取硬币的各个属性的数字表示。对电导率传感器来说，由插入硬币的临近引起的线圈的Q的改变使线圈上的电压改变，由此可获取硬币的电导率的数字输出表示。尽管如此安排每个硬币的结构、定位和取向以及加在其上的电压的频率，使得线圈提供主要取决于电导率、直径和厚度这些属性中的具体属性的输出，但是应该认识到每个测量结果都将受到来自其它硬币属性的一定程度的影响。

当然，利用诸如光学传感器、磁性传感器以及本领域技术人员所熟知的其它类型传感器的各种传感器，代表流通品的许多不同特征可以被测量并且用作特征向量的元素。例如，对钞票来说，被测特征可以包括例如钞票的宽度、钞票的长度以及整张或部分钞票反射或透射光的强度。作为一个例子，可以安排测量系统使用光学传感器沿N条线扫描钞票。每条扫描线包括L个依次被扫描的独立区域。在每个区域中，有M个不同特征的测量。更具体地说，对于每个区域，测量由红、绿和红外辐射的反射强度组成。因此钞票的测量总数为L×M×N。这些测量形成了用于各个样本的特征向量的各分量，因此特征向量具有L×M×N个分量。或者，测量可以用不同方式处理，从而获取代表测量样本的特征向量。例如，每个被测区域的局部特征向量可以由那个区域的M个测量结果组成，因此每个局部特征向量具有M个分量。然后局部特征向量可以在整个钞票区域上求和，从而获得代表整个样本的M维特征向量。

然后特征向量输入分类器6。分类器6使用特征向量以及包括分离函数的预定分类准则，判定样本是否属于任一种预定的类别。如果样本被识别为属于可接受的面额，它将被接受并且对应的值被记帐。如果样本被识别为属于已知的伪造品组，它将被拒绝。

在本例中，系统用于对两种面额的硬币和一种已知的伪造品进行分类。

分离函数的推导如下所述。

对面额的总体分布分析如下所述。

首先，测量每个感兴趣的货币面额和每个已知伪造品的样本，并且形成对应的特征向量。利用感兴趣的验证器的传感器系统可以形成样本，但在这个实施例中，考虑到在本领域已售和已安装的不同验证器的传感器系统中的变化和制造公差，样本从多个对应的传感器系统得出。来自样本的特征向量，当绘制在例如n维发散图(这里n是被测特征的数量)上时，大致形成若干簇。然后分析这些被测样本并用其推导出分离函数。在这个例子中，在10个传感器系统样本上，使用并测量每个面额的50个样本以及伪造品的50个样本。使用上面描述的方法，分析所得的簇数据并用其推导出分类函数或判别函数。更具体地说，处理样本或训练数据并用其推导出集合S或FVS以及w _z0，j和b ₀的值，从而产生式(30)中的判别函数g(x)。这里，阈值设为零。然后在具体验证器的处理系统4的存储器中存储分类函数。

然后未知面额的硬币的分类如下进行。插入硬币到验证器。检测插入的硬币，获取表示材料、厚度和直径的测量结果。然后处理系统执行以下步骤。从测量值推导出特征向量x。利用式(30)计算g(x)的值。在这个例子中，如果g(x)＞0，则硬币被分类为真品；如果g(x)＜0，硬币被分类为伪造品。

根据这个方法，验证器只需存储极少的数据(例如式(30)中要求的数据，即S、k、w_z0、b₀和阈值)就可以高精确度执行分类任务。这减少了成本和计算工作量，加快了分类速度。

SVM本质上是两类分类器。对于用于验证多种面额的货币验证器来说，可能需要多个SVM的组合。例如，对每个面额来说，可以使用SVM在两簇真品和该面额的伪造品之间分类，或者可以把SVM组合成二进制树结构。SVM可以与其它测试组合。例如，初始测试可以利用各种已知的区分流通品的技术，随后通过使用SVM的适当验证技术，判定流通品的面额。

在上面的例子中，判别阈值设为零，也可使用其它的阈值，诸如+/-0.5。

用于初始数据分析和分离函数推导的样本值分析可以例如利用微处理器来完成。类似地，分类器6可以是微处理器。

可以将上述实施例的方法同样应用于钞票或其它流通品，或者真正地应用于通过物品传感器检测而产生测量值的其它种类物品的分类。

在所述实施例中，感兴趣的面额的样本被用来推导分类函数。也可使用其它物品，诸如代币或垫片。

上面的技术也可用于其它数据类型，并且不限于从流通品推导的分类数据。

上面详细的讨论涉及可分的数据，但是本发明并不局限于这样的方案。本发明可以使用本领域已知的技术进行修改，例如当训练数据重叠时，采用“软”余量。

Claims

1.一种在货币分类器中对流通品进行分类的方法，包括：从至少一个货币传感器得出所述流通品的至少一个测量结果；使用分类函数对所述流通品进行分类，其中所述分类函数是由对应于多个流通品的特征的训练数据向量推导的；推导包含多个支撑向量的支撑向量机分类函数，其中所述支撑向量机分类函数包括核函数，所述核函数与从对应于输入数据空间的第一空间到第二空间的映射对应并且确定训练数据向量集的子集，所述子集在所述第二空间中的象代表所述训练数据在所述第二空间中的象，其中所述支撑向量机分类函数以所述子集来表达。

2.一种调节货币验证器的方法，包括：存储分类函数，其中所述分类函数是由对应于多个流通品的特征的训练数据向量推导的；推导包含多个支撑向量的支撑向量机分类函数，其中所述支撑向量机分类函数包括核函数，所述核函数与从对应于输入数据空间的第一空间到第二空间的映射对应并且确定训练数据向量集的子集，所述子集在所述第二空间中的象代表所述训练数据在所述第二空间中的象，其中所述支撑向量机分类函数以所述子集来表达。

3.如权利要求1或2所述的方法，其中推导分类函数包括以所述训练数据向量集的子集来表达所述支撑向量机分类函数，其中所述子集不同于支撑向量集。

4.如权利要求1或2所述的方法，其中推导分类函数包括以所述训练数据向量集的子集来表达所述支撑向量机分类函数，其中所述子集的大小小于支撑向量集的大小。

5.如权利要求1或2所述的方法，其中所述支撑向量机分类函数的形式为

其中x是样本向量，上标T表示转置，SVS是支撑向量集，α_0，i是拉格朗日乘子，d_i是样本向量x_i的类别，b₀是最优的偏移量。

6.如权利要求1或2所述的方法，其中所述子集使得所述训练数据向量集的每个元素的象可以近似地表达为所述子集的元素的象的线性组合。

7.如权利要求6所述的方法，其中所述子集使得近似的测量结果符合预定条件。

8.如权利要求1或2所述的方法，其中选择子集的步骤包括：

(a)推导临时子集；

(b)以所述临时子集的象计算拟合度函数的值，所述拟合度函数表示所述训练数据向量集的剩余元素的象的近似的接近程度；

(c)推导另一个临时子集并且重复步骤(b)；以及

(d)比较每个临时子集的拟合度函数的值，并且选择表明最近似的拟合度函数值所对应的临时子集。

9.如权利要求8所述的方法，其中重复步骤(a)至(d)，从而形成大小增加或减小的临时子集的序列。

10.如权利要求8所述的方法，其中重复所述步骤(a)至(d)，直至满足预定条件。

11.如权利要求9所述的方法，其中所述拟合度函数使用所述核函数。

12.如权利要求1或2所述的方法，其中所述支撑向量机分类函数的形式为其中w_z0，j是最优权向量，k(x_j， x_i)是样本向量x_j和x_i的核函数，b₀是最优的偏移量，L是所述子集的大小。

13.如权利要求1或2所述的方法，包括从至少一个货币传感器和多个流通品得出多个测量结果，并且从所述测量结果形成所述训练数据向量集。

14.如权利要求1或2所述的方法，其中所述训练数据向量集的各个元素包括对应于被检测的流通品的多个特征的多个测量结果。

15.如权利要求1所述的方法，其中所述货币传感器是单据传感器。

16.如权利要求15所述的方法，其中所述单据传感器是钞票传感器。

17.如权利要求1所述的方法，其中所述货币传感器是硬币传感器。

18.如权利要求1或2所述的方法，其中所述核函数是高斯、多项式、S形、双曲正切或样条核。

19.如权利要求10所述的方法，其中所述满足预定条件是拟合度函数满足预定条件。

20.如权利要求19所述的方法，其中所述拟合度函数满足预定条件是所述拟合度函数的值小于或等于预定值或者大于或等于预定值；和/或所述子集为预定大小的；和/或直至K_s，s在数字上不再可逆，其中是在对应于核函数的映射下子集S的象的点积的L×L方阵。

21.一种验证器，包括：用于感测流通品以产生表示所述流通品的特征的测量值的装置；用于存储分类函数的装置，其中所述分类函数是由对应于多个流通品的特征的训练数据向量推导的；用于推导包含多个支撑向量的支撑向量机分类函数的装置，其中所述支撑向量机分类函数包括核函数，所述核函数与从对应于输入数据空间的第一空间到第二空间的映射对应并且确定训练数据向量集的子集，所述子集在所述第二空间中的象代表所述训练数据在所述第二空间中的象，其中所述支撑向量机分类函数以所述子集来表达；以及用于利用所述测量值和所述分类函数来验证流通品的装置。

22.如权利要求21所述的验证器，其中所述分类函数是包含常量的支撑向量机的形式，所述常量至少表示：

核函数，

权，以及

支撑向量集，或者表示对应于所述核函数的映射的象下面的数据的支撑向量子集。

23.如权利要求21或22所述的验证器，其中所述分类函数的形式为或其中x是样本向量，上标T表示转置，SVS是支撑向量集，α_0，i是拉格朗日乘子，d_i是样本向量x_i的类别，以及其中w_z0，j是最优权向量，k(x_j，x_i)是样本向量x_j和x_i的核函数，b₀是最优的偏移量，L是所述子集的大小。