CN109191365B - 一种基于有向长方体的三维空间手写字符维数约简方法 - Google Patents

一种基于有向长方体的三维空间手写字符维数约简方法 Download PDF

Info

Publication number
CN109191365B
CN109191365B CN201810676489.2A CN201810676489A CN109191365B CN 109191365 B CN109191365 B CN 109191365B CN 201810676489 A CN201810676489 A CN 201810676489A CN 109191365 B CN109191365 B CN 109191365B
Authority
CN
China
Prior art keywords
point
coordinate system
dimensional
axis
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810676489.2A
Other languages
English (en)
Other versions
CN109191365A (zh
Inventor
张钰
陆敬微
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN201810676489.2A priority Critical patent/CN109191365B/zh
Publication of CN109191365A publication Critical patent/CN109191365A/zh
Application granted granted Critical
Publication of CN109191365B publication Critical patent/CN109191365B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/06Topological mapping of higher dimensional structures onto lower dimensional surfaces
    • G06T3/067Reshaping or unfolding 3D tree structures onto 2D planes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Processing Or Creating Images (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种三维空间手写字符维数约简方法。现有三维字符降维方法计算量大或可视性差。本发明如下:一、定义初始三维坐标系。二、获取运动指尖的空间坐标并生成离散点集。三、用OBB包围盒算法针对步骤二所得离散点集建立有向长方体。四、确定自适应投影面。五、建立投影二维坐标系。六、将离散点集投影到自适应投影面上。七、旋转校正。八、依次连接输出点集内的n个输出点,得到输出轨迹。之后将所得输出轨迹以图片的形式输出。本发明能够精确地对三维手写字符进行降维,保证降维后能够得到固定方向的2D图像,从而实现更好的可视化效果,极大程度地提高了三维空间手写字符的识别率。

Description

一种基于有向长方体的三维空间手写字符维数约简方法
技术领域
本发明属于降维技术领域,具体涉及一种基于有向长方体的三维空间手写字符维数约简方法。
背景技术
在高维情况下会出现数据样本稀疏、距离计算困难的问题,这个问题被称为“维数灾难”。缓解维数灾难的一个重要途径是降维,亦称“维数约简”,即通过某种数学变换将高维属性空间转变成一个低维“空间”,这样不仅属性维度降低减少了计算开销,还增大了样本密度。为了解决这个问题,目前已经提出了许多降维方法。到目前为止,传统的降维方法仍存在着一些缺点和不足。多维缩放法(MDS)是要求原始空间中样本之间的距离在低维空间中得以保持,但实际上在降维之前就进行了大量的距离、内积计算,这是很消耗资源和时间的,所以对于维度灾难来说,MDS的缓解作用并不大。主成分分析法 (PCA)的缺点是降维后得到的2D字符方向的存在随机的反转以及随机的旋转角度,不能够获得较优的视觉效果,而2D字符的随机方向也将影响识别率。局部线性嵌入法(LLE)的缺点是维数约简之后的数据较好地保留原始数据的局部几何结构关系,但是却不能很好地保留原始数据全局结构的相关形状信息,导致可视化效果不佳。因此,提出一中可视化佳且识别率高的字符降维方法具有重要意义。
发明内容
本发明所要解决的技术问题是提供一种基于有向长方体的三维空间手写字符维数约简方法,以解决传统降维方法中2D字符随机反转及存在旋转角度的问题,实现更好的可视化效果。
本发明的具体步骤如下:
步骤一、根据Leap Motion体感控制器建立初始三维坐标系。
步骤二、使用者在Leap motion体感控制器上方用手指绘制字符。Leap motion体感控制器检测手指指尖在空间中运动的三维坐标,得到离散点集。离散点集包括n个离散点。n个离散点在初始三维坐标系内的坐标分别为(xi,yi,zi),i=1,2,…,n。
步骤三、用OBB包围盒算法针对步骤二所得离散点集建立有向长方体。
步骤四、选取步骤三所得有向长方体上面积最大的两个面的法向量作为自适应投影面的法向量。选取步骤二所得离散点集的几何中心点作为自适应投影面经过的点,从而确定自适应投影面。
离散点集的几何中心点的坐标为
Figure BDA0001709524190000021
若自适应投影面平行于初始三维坐标系内X轴、Z轴所成平面,则重新执行步骤二。否则,进入步骤五。
步骤五、定义自适应投影面与步骤3所得有向长方体上四条棱的交点分为点M、点N、点P、点Q。将点M、点N、点P分别投影在初始三维坐标系内X轴、Y轴所成平面上,得到点M1、点N1、点P1。点M1、点N1、点P1在初始三维坐标系内的坐标分别为M1(a1,b1,0),N1(a2,b2,0),P1(a3,b3,0)。
计算方向特征值d如下:
Figure BDA0001709524190000022
建立二维直角坐标系。二维直角坐标系的坐标原点为点M。若d<0,则二维直角坐标系的Y轴与线MQ重合,Y轴正方向为点M向点Q的方向,X 轴与线MN重合,X轴正方向为点M向点N的方向。若d≥0,则二维直角坐标系的Y轴与线MN重合,Y轴正方向为点M向点N的方向,X轴与线MQ 重合,X轴正方向为点M向点Q的方向。
步骤六、将步骤二所得离散点集投影到自适应投影面上,得到降维点集。降维点集包括n个降维点。n个降维点在初始三维坐标系内的坐标分别为 (xri,yri,zri),i=1,2,...,n。点M、点N、点P在初始三维坐标系内的坐标分别为 M(e1,f1,g1),N(e2,f2,g2),Q(e3,f3,g3
点M指向点Q的向量为
Figure BDA0001709524190000023
点M指向点N的向量为
Figure BDA0001709524190000024
向量
Figure BDA0001709524190000025
的单位向量为
Figure BDA0001709524190000026
向量
Figure BDA0001709524190000027
的单位向量为
Figure BDA0001709524190000031
点M指向降维点集内第i个降维点的向量
Figure BDA0001709524190000032
降维点集内n个降维点在二维直角坐标系内的坐标分为(pi,qi),i=1,2,...,n;若d<0,则
Figure BDA0001709524190000033
若d≥0,则
Figure BDA0001709524190000034
步骤七、将降维轨迹以降维点集的几何中心点为旋转中心,沿二维直角坐标系x轴正半轴向y轴正半轴的方向旋转θ。得到输出点集K。输出点集K 包括n个输出点。n个输出点在二维直角坐标系内的坐标分为(p′i,q′i),i=1,2,...,n。
其中,降维点集的几何中心点在二维直角坐标系内的坐标为
Figure BDA0001709524190000035
若x1<x3,y1<y3,则θ=0°。若x1>x3,y1<y3,则θ=90°。若x1>x3,y1>y3,则θ=180°。若x1<x3,y1>y3,则θ=270°;
Figure BDA0001709524190000036
Figure BDA0001709524190000037
步骤八、依次连接输出点集内的n个输出点,得到输出轨迹。
进一步地,步骤一中,以Leap Motion体感控制器的设备中心作为初始三维坐标系的坐标原点。初始三维坐标系的X轴与Leap Motion体感控制器的长边平行,且正方向朝向坐标原点靠近Leap Motion体感控制器信号灯的方向。初始三维坐标系的Z轴与LeapMotion体感控制器的短边平行,且正方向朝向使用位置。使用位置为使用者在进行字符绘制时所在的位置。初始三维坐标系的Y轴竖直设置,且正方向朝向正上方。
进一步地,步骤八得到输出轨迹后,将经所得输出轨迹以图片的形式输出。
本发明具有的有益效果是:
本发明能够精确地对三维手写字符进行降维,保证降维后能够得到固定方向的2D图像。此外,本发明解决了传统的降维方法中存在的2D字符随机反转和存在旋转角度的问题,从而实现更好的可视化效果,极大程度提高了三维空间手写字符的识别率。
具体实施方式
以下对本发明作进一步说明。
一种基于有向长方体的三维空间手写字符维数约简方法的具体步骤如下:
步骤一、定义初始三维坐标系
根据水平放置的Leap Motion体感控制器建立初始三维坐标系。以Leap Motion体感控制器的设备中心作为初始三维坐标系的坐标原点。初始三维坐标系的X轴与LeapMotion体感控制器的长边平行,且正方向朝向坐标原点靠近Leap Motion体感控制器信号灯的方向。初始三维坐标系的Z轴与Leap Motion体感控制器的短边平行,且正方向朝向使用位置。使用位置为使用者在进行字符绘制时所在的位置。初始三维坐标系的Y轴竖直设置,且正方向朝向正上方。
步骤二、获取运动指尖的空间坐标并生成三维轨迹离散点集
使用者在Leap motion体感控制器上方用手指绘制字符。Leap motion体感控制器检测手指指尖在空间中运动的三维坐标,得到离散点集H。(离散点集是Leap motion体感控制器检测到的手指指尖在三维空间中运动经过的点的集合)离散点集H包括n个离散点。n个离散点在初始三维坐标系内的坐标分别为(xi,yi,zi),i=1,2,…,n。
步骤三、用OBB包围盒算法针对步骤二所得离散点集建立有向长方体。
步骤四、确定自适应投影面
选取步骤三所得有向长方体上面积最大的两个面的法向量作为自适应投影面的法向量。选取步骤二所得离散点集的几何中心点作为自适应投影面经过的点,从而确定自适应投影面。由于OBB包络算法可以根据字符的书写角度进行紧密包络,即有向长方体代表了空间字符的方向,而有向长方体上最大面积的平面代表了最多的字符信息,故自适应投影面上能够显示出最完整的字符投影。
离散点集的几何中心点的坐标为
Figure BDA0001709524190000041
若自适应投影面平行于初始三维坐标系内X轴、Z轴所成平面,则输入的离散点集无法生成确定方向的投影,使用者重新绘制字符,重新执行步骤二。否则,进入步骤五。
步骤五、建立二维直角坐标系
定义自适应投影面与步骤3所得有向长方体上四条棱的交点分为点M、点N、点P、点Q。点M与点N分别为有向长方体内同一侧面的两条棱上的点。点N与点P分别为有向长方体内同一侧面的两条棱上的点。将点M、点 N、点P分别投影在初始三维坐标系内X轴、Y轴所成平面上,得到点M1、点N1、点P1。点M1、点N1、点P1在初始三维坐标系内的坐标分别为 M1(a1,b1,0),N1(a2,b2,0),P1(a3,b3,0)。
计算方向特征值d如下:
Figure BDA0001709524190000051
建立二维直角坐标系。二维直角坐标系的坐标原点为点M。若d<0,则二维直角坐标系的Y轴与线MQ重合,Y轴正方向为点M向点Q的方向,X 轴与线MN重合,X轴正方向为点M向点N的方向。若d≥0,则二维直角坐标系的Y轴与线MN重合,Y轴正方向为点M向点N的方向,X轴与线MQ 重合,X轴正方向为点M向点Q的方向。
步骤六、将离散点集投影到自适应投影面上
将步骤二所得离散点集投影到自适应投影面上,得到降维点集R。降维点集R包括n个降维点。n个降维点在初始三维坐标系内的坐标分别为(xri,yri,zri), i=1,2,…,n。点M、点N、点P在初始三维坐标系内的坐标分别为 M(e1,f1,g1),N(e2,f2,g2),Q(e3,e3,e3)。
点M指向点Q的向量为
Figure BDA0001709524190000052
点M指向点N的向量为
Figure BDA0001709524190000053
向量
Figure BDA0001709524190000054
的单位向量为
Figure BDA0001709524190000055
向量
Figure BDA0001709524190000056
的单位向量为
Figure BDA0001709524190000057
点M指向降维点集R内第i个降维点ri的向量
Figure BDA0001709524190000058
降维点集R内n个降维点在二维直角坐标系内的坐标分为(pi,qi),i=1,2,…,n;若 d<0,则
Figure BDA0001709524190000061
若d≥0,则
Figure BDA0001709524190000062
此时,降维点集在二维直角坐标系内,且不会出现上下反转和左右反转的情况,但是降维点集的底部到顶部的方向与二维直角坐标系Y轴正方向可能存在夹角,又因为OBB包络算法是紧密包围且代表字符方向的,降维点集底部往顶部的方向一定与矩形MNPQ的一对边平行,另一对边垂直,即降维点集需要旋转0°、90°或180°来使得降维点集的顶部朝向二维直角坐标系的Y 轴正方向。(降维点集的顶部即为所书写字符的顶部。)
步骤七、旋转校正
将降维轨迹以降维点集的几何中心点为旋转中心,沿二维直角坐标系x 轴正半轴向y轴正半轴的方向旋转θ。得到输出点集K。输出点集K包括n 个输出点。n个输出点在二维直角坐标系内的坐标分为(p′i,q′i),i=1,2,…,n。
其中,降维点集的几何中心点在二维直角坐标系内的坐标为
Figure BDA0001709524190000063
若x1<x3,y1<y3,则θ=0°。若x1>x3,y1<y3,则θ=90°。若x1>x3,y1>y3,则θ=180°。若x1<x3,y1>y3,则θ=270°;
Figure BDA0001709524190000064
Figure BDA0001709524190000065
步骤八、依次连接输出点集内的n个输出点,得到输出轨迹。之后将所得输出轨迹以图片的形式输出。

Claims (3)

1.一种三维空间手写字符维数约简方法,其特征在于:
步骤一、根据Leap Motion体感控制器建立初始三维坐标系;
步骤二、使用者在Leap motion体感控制器上方用手指绘制字符;Leap motion体感控制器检测手指指尖在空间中运动的三维坐标,得到离散点集;离散点集包括n个离散点;n个离散点在初始三维坐标系内的坐标分别为(xi,yi,zi),i=1,2,...,n;
步骤三、用OBB包围盒算法针对步骤二所得离散点集建立有向长方体;
步骤四、选取步骤三所得有向长方体上面积最大的两个面的法向量作为自适应投影面的法向量;选取步骤二所得离散点集的几何中心点作为自适应投影面经过的点,确定自适应投影面;
离散点集的几何中心点的坐标为
Figure FDA0001709524180000011
若自适应投影面平行于初始三维坐标系内X轴、Z轴所成平面,则重新执行步骤二;否则,进入步骤五;
步骤五、定义自适应投影面与步骤3所得有向长方体上四条棱的交点分为点M、点N、点P、点Q;将点M、点N、点P分别投影在初始三维坐标系内X轴、Y轴所成平面上,得到点M1、点N1、点P1;点M1、点N1、点P1在初始三维坐标系内的坐标分别为M1(a1,b1,0),N1(a2,b2,0),P1(a3,b3,0);
计算方向特征值d如下:
Figure FDA0001709524180000012
建立二维直角坐标系;二维直角坐标系的坐标原点为点M;若d<0,则二维直角坐标系的Y轴与线MQ重合,Y轴正方向为点M向点Q的方向,X轴与线MN重合,X轴正方向为点M向点N的方向;若d≥0,则二维直角坐标系的Y轴与线MN重合,Y轴正方向为点M向点N的方向,X轴与线MQ重合,X轴正方向为点M向点Q的方向;
步骤六、将步骤二所得离散点集投影到自适应投影面上,得到降维点集;降维点集包括n个降维点;n个降维点在初始三维坐标系内的坐标分别为(xri,yri,zri),i=1,2,...,n;点M、点N、点P在初始三维坐标系内的坐标分别为M(e1,f1,g1),N(e2,f2,g2),Q(e3,f3,g3);
点M指向点Q的向量为
Figure FDA0001709524180000021
点M指向点N的向量为
Figure FDA0001709524180000022
向量
Figure FDA0001709524180000023
的单位向量为
Figure FDA0001709524180000024
向量
Figure FDA0001709524180000025
的单位向量为
Figure FDA0001709524180000026
点M指向降维点集内第i个降维点的向量
Figure FDA0001709524180000027
降维点集内n个降维点在二维直角坐标系内的坐标分为(pi,qi),i=1,2,...,n;若d<0,则
Figure FDA0001709524180000028
若d≥0,则
Figure FDA0001709524180000029
步骤七、将降维轨迹以降维点集的几何中心点为旋转中心,沿二维直角坐标系x轴正半轴向y轴正半轴的方向旋转θ;得到输出点集K;输出点集K包括n个输出点;n个输出点在二维直角坐标系内的坐标分为(p′i,q′i),i=1,2,...,n;
其中,降维点集的几何中心点在二维直角坐标系内的坐标为
Figure FDA00017095241800000210
若x1<x3,y1<y3,则θ=0°;若x1>x3,y1<y3,则θ=90°;若x1>x3,y1>y3,则θ=180°;若x1<x3,y1>y3,则θ=270°;
Figure FDA00017095241800000211
Figure FDA00017095241800000212
步骤八、依次连接输出点集内的n个输出点,得到输出轨迹。
2.根据权利要求1所述的一种三维空间手写字符维数约简方法,其特征在于:以LeapMotion体感控制器的设备中心作为初始三维坐标系的坐标原点;初始三维坐标系的X轴与Leap Motion体感控制器的长边平行,且正方向朝向坐标原点靠近Leap Motion体感控制器信号灯的方向;初始三维坐标系的Z轴与Leap Motion体感控制器的短边平行,且正方向朝向使用位置;使用位置为使用者在进行字符绘制时所在的位置;初始三维坐标系的Y轴竖直设置,且正方向朝向正上方。
3.根据权利要求1所述的一种三维空间手写字符维数约简方法,其特征在于:步骤八得到输出轨迹后,将经所得输出轨迹以图片的形式输出。
CN201810676489.2A 2018-06-27 2018-06-27 一种基于有向长方体的三维空间手写字符维数约简方法 Active CN109191365B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810676489.2A CN109191365B (zh) 2018-06-27 2018-06-27 一种基于有向长方体的三维空间手写字符维数约简方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810676489.2A CN109191365B (zh) 2018-06-27 2018-06-27 一种基于有向长方体的三维空间手写字符维数约简方法

Publications (2)

Publication Number Publication Date
CN109191365A CN109191365A (zh) 2019-01-11
CN109191365B true CN109191365B (zh) 2022-11-25

Family

ID=64948595

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810676489.2A Active CN109191365B (zh) 2018-06-27 2018-06-27 一种基于有向长方体的三维空间手写字符维数约简方法

Country Status (1)

Country Link
CN (1) CN109191365B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111709320B (zh) * 2020-05-28 2023-04-18 杭州电子科技大学 一种基于密度峰值聚类特征选择的三维手写字符识别方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102902848A (zh) * 2012-09-18 2013-01-30 大连理工大学 针对边界元分析的三维可视化仿真方法
CN107609593A (zh) * 2017-09-15 2018-01-19 杭州电子科技大学 一种基于最长轨迹投影的三维空间手写字符降维方法
WO2018045670A1 (zh) * 2016-09-09 2018-03-15 华南理工大学 基于自然手势的虚拟数字雕塑方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102902848A (zh) * 2012-09-18 2013-01-30 大连理工大学 针对边界元分析的三维可视化仿真方法
WO2018045670A1 (zh) * 2016-09-09 2018-03-15 华南理工大学 基于自然手势的虚拟数字雕塑方法
CN107609593A (zh) * 2017-09-15 2018-01-19 杭州电子科技大学 一种基于最长轨迹投影的三维空间手写字符降维方法

Also Published As

Publication number Publication date
CN109191365A (zh) 2019-01-11

Similar Documents

Publication Publication Date Title
JP7337104B2 (ja) 拡張現実によるモデル動画多平面インタラクション方法、装置、デバイス及び記憶媒体
CN100470452C (zh) 一种实现三维增强现实的方法及系统
US9020266B2 (en) Methods and devices for processing handwriting input
US20190272670A1 (en) Real-time hand modeling and tracking using convolution models
CN110349152A (zh) 人脸图像质量检测方法及装置
CN107146287B (zh) 二维投影图像至三维模型的映射方法
US20230186590A1 (en) Method for omnidirectional dense regression for machine perception tasks via distortion-free cnn and spherical self-attention
WO2019000692A1 (zh) 立体图形绘制方法、装置、设备及存储介质
WO2017070923A1 (zh) 一种人脸识别方法和装置
WO2024109772A1 (zh) 一种基于结构光系统的人脸姿态估计方法及装置
CN109862343A (zh) 虚拟现实装置、影像处理方法以及非暂态电脑可读取记录媒体
Wang et al. Joint head pose and facial landmark regression from depth images
US7187378B2 (en) Determining the convex hull of convex polygons with congruent corresponding angles
CN101593357A (zh) 一种基于三维平面控件的交互式体切割方法
CN109191365B (zh) 一种基于有向长方体的三维空间手写字符维数约简方法
CN115082935A (zh) 用于对文档图像进行矫正的方法、设备及存储介质
CN103970432B (zh) 一种模拟真实翻页效果的方法与装置
Brynte et al. Rigidity preserving image transformations and equivariance in perspective
CN112700391A (zh) 一种图像处理方法、电子设备及计算机可读存储介质
CN111145081B (zh) 基于空间体积特征的三维模型视图投影方法及系统
CN104537628B (zh) 一种冗余可控的动漫图像适配方法
Heo et al. Generic 3D face pose estimation using facial shapes
Ye et al. An improved algorithm for triangle to triangle intersection test
Zellmann et al. A Practical Guide to Implementing Off-Axis Stereo Projection Using Existing Ray Tracing Libraries
CN116740298B (zh) 一种基于三维引擎的场景实时地图的构建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant