CN111709320B - 一种基于密度峰值聚类特征选择的三维手写字符识别方法 - Google Patents

一种基于密度峰值聚类特征选择的三维手写字符识别方法 Download PDF

Info

Publication number
CN111709320B
CN111709320B CN202010467270.9A CN202010467270A CN111709320B CN 111709320 B CN111709320 B CN 111709320B CN 202010467270 A CN202010467270 A CN 202010467270A CN 111709320 B CN111709320 B CN 111709320B
Authority
CN
China
Prior art keywords
feature
formula
dimensional
density
point set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010467270.9A
Other languages
English (en)
Other versions
CN111709320A (zh
Inventor
张钰
王葵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN202010467270.9A priority Critical patent/CN111709320B/zh
Publication of CN111709320A publication Critical patent/CN111709320A/zh
Application granted granted Critical
Publication of CN111709320B publication Critical patent/CN111709320B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于密度峰值聚类特征选择的三维手写字符识别方法。现有的三维手写字符识别方法没有充分考虑冗余特征对字符识别率的影响。本发明如下:一、采集运动指尖的三维坐标并生成离散点集。二、顺序连接离散点生成三维轨迹。三、预处理。四、提取书写方向,曲率,坐标差值三大类特征。五、利用对称不确定性的倒数1/SU衡量特征间的相似性。六、利用密度峰值聚类算法的定义计算局部密度ρ。七、根据密度峰值聚类算法计算与高密度特征的距离。八、计算局部密度。九、将γ按降序排列,选取聚类中心。十、基于十折交叉验证方法和决策树算法模型,得到最终的识别率。本发明可以在特征减少,计算量降低的情况下,识别率还能提高。

Description

一种基于密度峰值聚类特征选择的三维手写字符识别方法
技术领域
本发明属于三维手写字符识别领域,具体涉及一种基于密度峰值聚类特征选择的三维手写字符识别方法。
背景技术
手写字符识别技术是借助PC机对一组手写字符进行分类,然后输出分类结果的技术,它是模式识别中的一个重要部分,也是光学识别领域的一个不可或缺的分支。但是由于手写字符的随意性,导致手写字符识别很难,有时人工识别也达不到100%的精度,但是很多应用方面都要求较高的识别率。
传统的二维手写字符是依靠纸笔,或者用手指在触摸屏上书写等方式完成的,这些方式需要物理平面的支撑,且手指会受到束缚。但随着深度传感器的发展,使得在三维空间中进行书写成为可能。但由于在三维空间中书写更加自由,导致三维手写字符识别更加困难,所以特征的选取尤其重要。目前已有不少特征描述方法用于三维手写字符识别算法,但这些算法大多没有考虑到提取的特征间存在冗余,而冗余特征的存在不仅会加大计算量,还会影响到识别率。因此,提出一种关于三维手写字符特征选择的方法具有重要意义。
发明内容
本发明主要是针对现有三维手写字符识别方法存在的不足,提出一种基于密度峰值聚类特征选择的三维手写字符识别方法。该方法主要解决三维手写字符识别中存在冗余特征的问题,适用于不同书写习惯的人群,并且该方法可以在减少特征的前提下,提高三维手写字符的识别率。
本发明的具体步骤如下:
步骤一、建立数据集,数据集包括m个手写字符的三维离散点集;
步骤二、将m个三维离散点集各自依序连接,得到m个手写字符的三维轨迹。
步骤三、对m个三维离散点集分别进行预处理。
步骤四、对预处理后的三维离散点集提取特征,特征分成三大类,分别是书写方向,曲率,坐标差,共计16个特征,具体如下:
4.1、三维离散点集中任意点的书写方向对应三个特征,分别为其相邻两点的连线与x轴、y轴、z轴夹角的余弦值。
4.2、三维离散点集中任意点的书写方向对应十个特征,分别为该点与相邻两点所成圆的圆心坐标、半径、圆心到相邻两点连线中点的向量坐标、圆心到改点与下一点连线中点的向量坐标。
4.3、三维离散点集中任意点的曲率特征对应三个特征,分别为其相邻两点的x轴、y轴、z轴的坐标差值。
步骤五、计算任意两个特征间的对称不确定性;第i个特征Xi与第j个特征Xj之间的对称不确定性SU(Xi,Xj)的表达式如式(4)所示。i=1,2,…,16;j=1,2,…,16;
Figure BDA0002513065040000021
式(4)中,H(Xi)、H(Xj)分别是特征Xi、Xj的信息熵,其表达式如式(5)所示。IG(Xi,Xj)表示特征Xi与特征Xj的信息增益,其表达式如式(6)所示。
H(Xi)=-∑p(xik)log2(p(xik))                  式(5)
式(5)中,p(xik)表示特征Xi第k个取值xik对应的概率;
IG(Xi,Xj)=H(Xi)-H(Xi|Xj)                  式(6)
式(6)中,H(Xi|Xj)是条件熵,其表达式如式(7)所示。
H(Xi|Xj)=-∑p(xjl)∑p(xik|xjl)log2(p(xik|xjl))              式(7)
式(7)中,p(xik|xjl)表示特征Xj取第l个值xjl时,特征Xi取第k个值xik的概率。
步骤六、计算第i个特征的局部密度;第i个特征的局部密度ρi的表达式如式(8)所示。i=1,2,…,16。
Figure BDA0002513065040000022
式(8)中,1/SUij是特征Xi和特征Xj的称为距离,即对称不确定性的倒数,dc是截断距离;χ(x)是逻辑判断函数,其表达式如式(9)所示。
Figure BDA0002513065040000031
步骤七、分别计算各个特征对应的高密度特征距离
对16个特征按照局部密度的大小以升序重新排序;除局部密度最大的特征外,任意一个特征Xi的高密度特征距离(δi)1≤i≤15表示特征Xi与局部密度高于特征Xi的各个特征中局部密度最小的特征Xj之间的距离,其表达式如式(10)所示。i=1,2,…,15。
Figure BDA0002513065040000032
局部密度最大的特征Xi的高密度特征距离(δi)i=16表示该特征Xi与其他各特征的距离的最大值,其表达式如式(11)所示。
Figure BDA0002513065040000033
步骤八、计算各特征的加权后的局部密度ρi与加权后的高密度特征距离δi的乘积,作为该特征的中心指标γi,具体表达式如式(12)所示;
Figure BDA0002513065040000034
式(12)中,ω为局部密度对应的权重。
步骤九、将各个特征按照中心指标γi的大小进行降序排列;选择前a个特征为聚类中心;a为识别特征数。
步骤十、使用者进行三维手写字符采集,得到三维点集;对所得的三维点集进行特征提取,提取出与步骤九所得a个聚类中心相对应的特征值;根据该a个特征值,通过决策树模型识别出被测三维手写字符。
作为优选,步骤一的具体过程如下:
使用者利用手指指尖在Leap Motion体感控制器上方进行字符的绘制,LeapMotion体感控制器以超过每秒200帧的速度追踪手指的移动,采集手指指尖运动的三维坐标并得到手写字符的三维离散点集;三维离散点集中包含n个点的三维坐标,n个点的坐标表示为(xi,yi,zi),i=1,2,...,n。
作为优选,步骤三中预处理的步骤分成四步,分别是线性回归,倾斜校正,轨迹归一化,重采样,具体如下:
3.1、对步骤二中得到的三维离散点集进行线性回归,得到回归线;回归线的方向为(vx,vy,vz)。
3.2、对三维离散点集进行旋转。旋转后的三维离散点集内第i个点的向量
Figure BDA0002513065040000041
的表达式如式(1)所示。
Figure BDA0002513065040000042
式(1)中,
Figure BDA0002513065040000043
是旋转前的三维离散点集内第i个点的向量,
Figure BDA0002513065040000044
是单位向量,θ为回归线的旋转角度,θ的表达式如式(2)所示:
Figure BDA0002513065040000045
式(2)中,
Figure BDA0002513065040000046
为回归线旋转前方向;
Figure BDA0002513065040000047
为回归线旋转后方向。
3.3、将旋转后的三维离散点集进行归一化。
3.4、对归一化后的三维离散点集进行重采样。
作为优选,步骤八中,局部密度对应的权重ω利用粒子群算法确定。
作为优选,步骤九中,识别特征数a的用粒子群算法确定。
本发明的有益效果:
1、本发明通过改进密度峰值聚类算法,提出了一种新的特征选择方法,并将其应用于三维手写字符识别领域。
2、本发明通过加权重的方式,使得改进后的聚类算法适合更多的数据集,提高了本发明的适应性。
3、本发明通过粒子群算法,使得改进后的聚类算法可以自动确定聚类中心,提高三维手写字符的识别速度和精度。
具体实施方式
以下对本发明作进一步说明。
一种基于密度峰值聚类特征选择的三维手写字符识别方法,具体步骤如下:
步骤一、建立数据集,数据集包括m个手写字符的三维离散点集;
使用者利用手指指尖在Leap Motion体感控制器上方进行字符的绘制,LeapMotion体感控制器以超过每秒200帧的速度追踪手指的移动,因此可以采集到手指指尖运动的三维坐标并得到手写字符的三维离散点集;三维离散点集中包含n个点的三维坐标,n个点的坐标表示为(xi,yi,zi),i=1,2,...,n。
步骤二、生成三维轨迹
由步骤一可知,每个字符都存在一个包含n个点的三维离散点集,按照步骤一中得到点的顺序来连接三维离散点集,得到字符的三维轨迹。
步骤三、对m个三维离散点集分别进行预处理
预处理的步骤主要分成四步,分别是线性回归,倾斜校正,轨迹归一化,重采样,具体如下:
3.1、对步骤二中得到的三维离散点集进行线性回归,得到回归线;回归线的方程为
Figure BDA0002513065040000051
其中,(x0,y0,z0)是回归线上的一个点,(vx,vy,vz)是回归线的方向;t为中间变量。
3.2、对三维离散点集进行旋转,由于不同的人书写习惯不同,所以写的字符的角度也会有所不同,所以需要对字符进行旋转,也就是倾斜校正。基本思想是对步骤二中的三维离散点集在步骤3.1中得到的回归线的帮助下进行旋转,使三维离散点集沿着z轴在xz平面上对齐。由步骤3.1得到回归线旋转前的方向向量(vx,vy,vz);而回归线旋转后的方向向量是沿着z轴的,因此可以得到旋转角度θ,具体的旋转公式如下
Figure BDA0002513065040000052
其中,
Figure BDA0002513065040000053
是旋转后的三维离散点集内第i个点的向量,
Figure BDA0002513065040000054
是旋转前的三维离散点集内第i个点的向量,
Figure BDA0002513065040000055
是单位向量,方向为(0,0,1),θ为回归线的旋转角度,θ的表达式如式(2)所示:
Figure BDA0002513065040000061
式(2)中,
Figure BDA0002513065040000062
为回归线旋转前方向;
Figure BDA0002513065040000063
为回归线旋转后方向。
3.3、每个人在对字符书写的时候,往往得到的字符大小都有所不同,为了消除字符大小对最终识别率的影响,需要将经步骤3.2旋转后的离散点集分别沿着x轴、y轴、z轴进行归一化。
3.4、Leap Motion体感控制器是按一定速度来采点的,但是每个人在对每个字符进行书写的时候所花时间都有所不同,这就导致每个字符的三维点集中包含的点数不同,为了使每个字符包含的点数保持一致,需要对归一化后的三维离散点集进行重采样。
步骤四、对m个三维离散点集内除起点、终点外的所有离散点分别进行提取特征。对预处理后的三维离散点集提取特征,特征分成三大类,分别是书写方向,曲率,坐标差,共计16个特征,具体如下:
4.1、三维离散点集中任意点的书写方向对应三个特征,分别为其相邻两点的连线与x轴、y轴、z轴夹角的余弦值。比如点B(x,y,z)的书写方向是由其前后两点A(x1,y1,z1)和C(x2,y2,z2)决定的。在三维空间中用一条直线将AC两点连接起来,然后分别计算该直线与三个坐标轴,即x轴,y轴,z轴夹角的余弦值,这三个余弦值即为三个书写方向特征值,即每一点的书写方向特征存在三个值。
4.2、与步骤4.1中书写方向的特征类似,三维离散点集中任意点的曲率特征也是与其相邻两点相关。三维离散点集中任意点的书写方向对应十个特征,分别为该点与相邻两点所成圆的圆心坐标(三个值)、半径、圆心到相邻两点连线中点的向量坐标(三个值)、圆心到改点与下一点连线中点的向量坐标(三个值)。比如点B的曲率特征是以A、B、C三个点组成的圆得到的,该三维空间中圆的圆心O坐标(xo,yo,zo)为三个特征值,该圆的半径r为一个特征值,点O到点M的向量
Figure BDA0002513065040000064
的三个坐标值,为三个特征值;点M为线AB的中点;点O到点N的向量
Figure BDA0002513065040000065
的三个坐标值,为三个特征值;点N为线BC的中点,即三维离散点集内的每一点均对应十个曲率特征值。
4.3、与书写方向和曲率特征类似,坐标差值也是与相邻两点相关;三维离散点集中任意点的曲率特征对应三个特征,分别为其相邻两点的x轴、y轴、z轴的坐标差值(下一点的坐标减去上一点的坐标)。比如B点坐标差特征是分别计算点A与点C在x轴,y轴,z轴上的坐标的差值Δx、Δy、Δz,即三维离散点集内的每一点均三个坐标差特征,其表达式如式(3)所示。
Δx=x2-x1
Δy=y2-y1
Δz=z2-z1                       式(3)
步骤五、计算任意两个特征间的对称不确定性
密度峰值聚类算法聚类中心的确定主要是基于两个假设:(1)聚类中心的局部密度大于围绕它的邻居的局部密度;(2)与其他高密度点距离较远。从这两个假设可以看出,聚类中心的确定主要依靠两个概念,一个是局部密度,一个是距离。这里用对称不确定性的倒数1/SU来衡量两特征间的相似性,即距离,1/SU越大,表示两特征相似性越小,距离越大,1/SU越小,表示两特征相似性越大,距离越小。使用对称不确定性可以避免原算法中计算欧式距离时数据需要保持在统一测量尺度的缺点。第i个特征Xi与第j个特征Xj之间的对称不确定性SU(Xi,Xj)的表达式如式(4)所示。i=1,2,…,16;j=1,2,…,16;
Figure BDA0002513065040000071
式(4)中,H(Xi)、H(Xj)分别是特征Xi、Xj的信息熵,其表达式如式(5)所示。IG(Xi,Xj)表示特征Xi与特征Xj的信息增益,其表达式如式(6)所示。
H(Xi)=-∑p(xik)log2(p(xik))                  式(5)
式(5)中,p(xik)表示特征Xi第k个取值xik对应的概率;
IG(Xi,Xj)=H(Xi)-H(Xi|Xj)                  式(6)
式(6)中,H(Xi|Xj)是条件熵,其表达式如式(7)所示。
H(Xi|Xj)=-∑p(xjl)∑p(xik|xjl)log2(p(xik|xjl))             式(7)
式(7)中,p(xik|xjl)表示特征Xj取第l个值xjl时,特征Xi取第k个值xik的概率。
步骤六、计算局部密度
一个特征的局部密度是找到与该特征之间的距离小于截断距离的特征的个数,将此个数称为该特征的局部密度ρi;局部密度ρi的表达式如式(8)所示。
Figure BDA0002513065040000081
式(8)中,1/SUij是特征Xi和特征Xj的对称不确定性的倒数,即为两特征间的距离,下面将对称不确定性的倒数称为距离,dc是截断距离,这里是将距离按升序排列并编号,找出所有距离中的2%处所对应的序号,将dc设置为该序号对应的距离值;χ(x)是逻辑判断函数,其表达式如式(9)所示。x为函数变量。
Figure BDA0002513065040000082
步骤七、分别计算各个特征对应的高密度特征距离
对16个特征按照局部密度的大小以升序重新排序;聚类中心的确定除了局部密度以外还需要计算与高密度特征的距离;除局部密度最大的特征外,任意一个特征Xi的高密度特征距离(δi)1≤i≤15表示特征Xi与局部密度高于特征Xi的各个特征中局部密度最小的特征Xj之间的距离,其表达式如式(10)所示。i=1,2,…,15。
Figure BDA0002513065040000083
局部密度最大的特征Xi的高密度特征距离(δi)i=16表示该特征Xi与其他各特征的距离的最大值,其表达式如式(11)所示。
Figure BDA0002513065040000084
步骤八、计算各特征的加权后的局部密度ρi与加权后的高密度特征距离δi的乘积,作为该特征的中心指标γi
根据密度峰值聚类算法的假设可知,聚类中心应当是局部密度ρ和高密度特征距离δ都比较大的特征,因此用ρ和δ的乘积值γ来衡量特征是否应该成为聚类中心,即更大的γ对应的特征更可能是聚类中心,但是由于不同的数据集中数据的分布不同,存在ρ较小,δ较大,或者ρ较大,δ较小的数据为聚类中心,所以在二者的乘积上方加上权重,具体计算方式如式(12)所示;
γi=ρi ω·(δi)(1-ω)                      式(12)
式(12)中,ω为局部密度对应的权重,其值利用粒子群算法确定的。
步骤九、进行特征选择
根据步骤八可知,聚类中心应该是中心指标γi较大的特征,因此将各个特征按照中心指标γi的大小进行降序排列;选择前a个特征为聚类中心;此a个聚类中心即为特征选择的结果。a的具体取值利用粒子群算法确定;ω和a的取值均以最终的识别率为适应度函数,进行迭代确定。
步骤十、使用者用Leap Motion体感控制器进行被测三维手写字符的数据采集,得到三维点集;对所得的三维点集进行特征提取,提取出与步骤九所得a个聚类中心相对应的特征值;根据该a个特征值,通过决策树模型识别出被测三维手写字符。

Claims (5)

1.一种基于密度峰值聚类特征选择的三维手写字符识别方法,其特征在于:步骤一、建立数据集,数据集包括m个手写字符的三维离散点集;
步骤二、将m个三维离散点集各自依序连接,得到m个手写字符的三维轨迹;
步骤三、对m个三维离散点集分别进行预处理;
步骤四、对预处理后的三维离散点集提取特征,特征分成三大类,分别是书写方向,曲率,坐标差,共计16个特征,具体如下:
4.1、三维离散点集中任意点的书写方向对应三个特征,分别为其相邻两点的连线与x轴、y轴、z轴夹角的余弦值;
4.2、三维离散点集中任意点的书写方向对应十个特征,分别为该点与相邻两点所成圆的圆心坐标、半径、圆心到相邻两点连线中点的向量坐标、圆心到该点与下一点连线中点的向量坐标;
4.3、三维离散点集中任意点的曲率特征对应三个特征,分别为其相邻两点的x轴、y轴、z轴的坐标差值;
步骤五、计算任意两个特征间的对称不确定性;第i个特征Xi与第j个特征Xj之间的对称不确定性SU(Xi,Xj)的表达式如式(4)所示;i=1,2,…,16;j=1,2,…,16;
式(4)中,H(Xi)、H(Xj)分别是特征Xi、Xj的信息熵,其表达式如式(5)所示;IG(Xi,Xj)表示特征Xi与特征Xj的信息增益,其表达式如式(6)所示;
H(Xi)=-∑p(xik)log2(p(xik))           式(5)
式(5)中,p(xik)表示特征Xi第k个取值xik对应的概率;
IG(Xi,Xj)=H(Xi)-H(Xi|Xj)           式(6)
式(6)中,H(Xi|Xj)是条件熵,其表达式如式(7)所示;
H(Xi|Xj)=-∑p(xjl)∑p(xik|xjl)log2(p(xik|xjl))         式(7)
式(7)中,p(xik|xjl)表示特征Xj取第l个值xjl时,特征Xi取第k个值xik的概率;
步骤六、计算第i个特征的局部密度;第i个特征的局部密度ρi的表达式如式(8)所示;i=1,2,…,16;
式(8)中,1/SUij是特征Xi和特征Xj的称为距离,即对称不确定性的倒数,dc是截断距离;χ(x)是逻辑判断函数,其表达式如式(9)所示;
步骤七、分别计算各个特征对应的高密度特征距离
对16个特征按照局部密度的大小以升序重新排序;除局部密度最大的特征外,任意一个特征Xi的高密度特征距离(δi)1≤i≤15表示特征Xi与局部密度高于特征Xi的各个特征中局部密度最小的特征Xj之间的距离,其表达式如式(10)所示;i=1,2,…,15;
局部密度最大的特征Xi的高密度特征距离(δi)i=16表示该特征Xi与其他各特征的距离的最大值,其表达式如式(11)所示;
步骤八、计算各特征的加权后的局部密度ρi与加权后的高密度特征距离δi的乘积,作为该特征的中心指标γi,具体表达式如式(12)所示;
γi=ρi ω·(δi)(1-ω)              式(12)
式(12)中,ω为局部密度对应的权重;
步骤九、将各个特征按照中心指标γi的大小进行降序排列;选择前a个特征为聚类中心;a为识别特征数;
步骤十、使用者进行三维手写字符采集,得到三维点集;对所得的三维点集进行特征提取,提取出与步骤九所得a个聚类中心相对应的特征值;根据该a个特征值,通过决策树模型识别出被测三维手写字符。
2.根据权利要求1所述的一种基于密度峰值聚类特征选择的三维手写字符识别方法,其特征在于:步骤一的具体过程如下:
使用者利用手指指尖在LeapMotion体感控制器上方进行字符的绘制,LeapMotion体感控制器以超过每秒200帧的速度追踪手指的移动,采集手指指尖运动的三维坐标并得到手写字符的三维离散点集;三维离散点集中包含n个点的三维坐标,n个点的坐标表示为(xi,yi,zi),i=1,2,...,n。
3.根据权利要求1所述的一种基于密度峰值聚类特征选择的三维手写字符识别方法,其特征在于:步骤三中预处理的步骤分成四步,分别是线性回归,倾斜校正,轨迹归一化,重采样,具体如下:
3.1、对步骤二中得到的三维离散点集进行线性回归,得到回归线;回归线的方向为(vx,vy,vz);
3.2、对三维离散点集进行旋转;旋转后的三维离散点集内第i个点的向量的表达式如式(1)所示;
式(1)中,是旋转前的三维离散点集内第i个点的向量,是单位向量,θ为回归线的旋转角度,θ的表达式如式(2)所示:
式(2)中,为回归线旋转前方向;为回归线旋转后方向;
3.3、将旋转后的三维离散点集进行归一化;
3.4、对归一化后的三维离散点集进行重采样。
4.根据权利要求1所述的一种基于密度峰值聚类特征选择的三维手写字符识别方法,其特征在于:步骤八中,局部密度对应的权重ω利用粒子群算法确定。
5.根据权利要求1所述的一种基于密度峰值聚类特征选择的三维手写字符识别方法,其特征在于:步骤九中,识别特征数a的用粒子群算法确定。
CN202010467270.9A 2020-05-28 2020-05-28 一种基于密度峰值聚类特征选择的三维手写字符识别方法 Active CN111709320B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010467270.9A CN111709320B (zh) 2020-05-28 2020-05-28 一种基于密度峰值聚类特征选择的三维手写字符识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010467270.9A CN111709320B (zh) 2020-05-28 2020-05-28 一种基于密度峰值聚类特征选择的三维手写字符识别方法

Publications (2)

Publication Number Publication Date
CN111709320A CN111709320A (zh) 2020-09-25
CN111709320B true CN111709320B (zh) 2023-04-18

Family

ID=72537371

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010467270.9A Active CN111709320B (zh) 2020-05-28 2020-05-28 一种基于密度峰值聚类特征选择的三维手写字符识别方法

Country Status (1)

Country Link
CN (1) CN111709320B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5577135A (en) * 1994-03-01 1996-11-19 Apple Computer, Inc. Handwriting signal processing front-end for handwriting recognizers
CN106354252A (zh) * 2016-08-18 2017-01-25 电子科技大学 一种基于stdw的连续字符手势轨迹识别方法
JP2017194935A (ja) * 2016-04-22 2017-10-26 パナソニックIpマネジメント株式会社 三次元再構成方法
CN109191365A (zh) * 2018-06-27 2019-01-11 杭州电子科技大学 一种基于有向长方体的三维空间手写字符维数约简方法
CN109597485A (zh) * 2018-12-04 2019-04-09 山东大学 一种基于双指角域特征的手势交互系统及其工作方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5577135A (en) * 1994-03-01 1996-11-19 Apple Computer, Inc. Handwriting signal processing front-end for handwriting recognizers
JP2017194935A (ja) * 2016-04-22 2017-10-26 パナソニックIpマネジメント株式会社 三次元再構成方法
CN106354252A (zh) * 2016-08-18 2017-01-25 电子科技大学 一种基于stdw的连续字符手势轨迹识别方法
CN109191365A (zh) * 2018-06-27 2019-01-11 杭州电子科技大学 一种基于有向长方体的三维空间手写字符维数约简方法
CN109597485A (zh) * 2018-12-04 2019-04-09 山东大学 一种基于双指角域特征的手势交互系统及其工作方法

Also Published As

Publication number Publication date
CN111709320A (zh) 2020-09-25

Similar Documents

Publication Publication Date Title
CN108564129B (zh) 一种基于生成对抗网络的轨迹数据分类方法
CN111931710B (zh) 一种联机手写文字识别方法、装置、电子设备及存储介质
Awal et al. First experiments on a new online handwritten flowchart database
CN111553399A (zh) 特征模型训练方法、装置、设备及存储介质
CN110232308B (zh) 基于手部速度与轨迹分布的跟随机器人手势轨迹识别方法
JPH05189617A (ja) 手書き文字認識に於けるアークのセグメント化の方法と装置
CN1607540A (zh) 检测以墨水输入的手绘对象的系统和方法
CN113033398B (zh) 一种手势识别方法、装置、计算机设备及存储介质
CN106203377A (zh) 一种煤粉尘图像识别方法
CN103455794A (zh) 一种基于帧融合技术的动态手势识别方法
CN104615642A (zh) 基于局部邻域约束的空间验证的错误匹配检测方法
Liu et al. Stroke sequence-dependent deep convolutional neural network for online handwritten Chinese character recognition
JPH10143668A (ja) 手書き文字列の照合方法および装置
WO2018161893A1 (zh) 用户身份识别方法及装置
Li et al. Hierarchical shape primitive features for online text-independent writer identification
Popli et al. Classification and recognition of online hand-written alphabets using machine learning methods
Tan et al. Online signature verification based on dynamic features from gene expression programming
CN113342208B (zh) 基于多点触控设备的铁路选线方法、终端及存储介质
CN107220634A (zh) 基于改进d‑p算法与多模板匹配的手势识别方法
CN111709320B (zh) 一种基于密度峰值聚类特征选择的三维手写字符识别方法
CN113496260A (zh) 基于改进YOLOv3算法的粮库人员不规范作业检测法
Arbain et al. Offline handwritten digit recognition using triangle geometry properties
Tang et al. Online chemical symbol recognition for handwritten chemical expression recognition
Chen et al. A handwritten character recognition algorithm based on artificial immune
CN112733758B (zh) 黎曼几何不变性下基于曲线的三维人脸识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant