CN109191365B - 一种基于有向长方体的三维空间手写字符维数约简方法 - Google Patents
一种基于有向长方体的三维空间手写字符维数约简方法 Download PDFInfo
- Publication number
- CN109191365B CN109191365B CN201810676489.2A CN201810676489A CN109191365B CN 109191365 B CN109191365 B CN 109191365B CN 201810676489 A CN201810676489 A CN 201810676489A CN 109191365 B CN109191365 B CN 109191365B
- Authority
- CN
- China
- Prior art keywords
- point
- coordinate system
- dimensional
- axis
- initial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 230000003044 adaptive effect Effects 0.000 claims abstract description 7
- 239000013598 vector Substances 0.000 claims description 27
- 230000003238 somatosensory effect Effects 0.000 claims description 22
- 238000012800 visualization Methods 0.000 abstract description 5
- 230000000694 effects Effects 0.000 abstract description 4
- 238000004364 calculation method Methods 0.000 abstract description 3
- 238000000513 principal component analysis Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/06—Topological mapping of higher dimensional structures onto lower dimensional surfaces
- G06T3/067—Reshaping or unfolding 3D tree structures onto 2D planes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Processing Or Creating Images (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种三维空间手写字符维数约简方法。现有三维字符降维方法计算量大或可视性差。本发明如下:一、定义初始三维坐标系。二、获取运动指尖的空间坐标并生成离散点集。三、用OBB包围盒算法针对步骤二所得离散点集建立有向长方体。四、确定自适应投影面。五、建立投影二维坐标系。六、将离散点集投影到自适应投影面上。七、旋转校正。八、依次连接输出点集内的n个输出点,得到输出轨迹。之后将所得输出轨迹以图片的形式输出。本发明能够精确地对三维手写字符进行降维,保证降维后能够得到固定方向的2D图像,从而实现更好的可视化效果,极大程度地提高了三维空间手写字符的识别率。
Description
技术领域
本发明属于降维技术领域,具体涉及一种基于有向长方体的三维空间手写字符维数约简方法。
背景技术
在高维情况下会出现数据样本稀疏、距离计算困难的问题,这个问题被称为“维数灾难”。缓解维数灾难的一个重要途径是降维,亦称“维数约简”,即通过某种数学变换将高维属性空间转变成一个低维“空间”,这样不仅属性维度降低减少了计算开销,还增大了样本密度。为了解决这个问题,目前已经提出了许多降维方法。到目前为止,传统的降维方法仍存在着一些缺点和不足。多维缩放法(MDS)是要求原始空间中样本之间的距离在低维空间中得以保持,但实际上在降维之前就进行了大量的距离、内积计算,这是很消耗资源和时间的,所以对于维度灾难来说,MDS的缓解作用并不大。主成分分析法 (PCA)的缺点是降维后得到的2D字符方向的存在随机的反转以及随机的旋转角度,不能够获得较优的视觉效果,而2D字符的随机方向也将影响识别率。局部线性嵌入法(LLE)的缺点是维数约简之后的数据较好地保留原始数据的局部几何结构关系,但是却不能很好地保留原始数据全局结构的相关形状信息,导致可视化效果不佳。因此,提出一中可视化佳且识别率高的字符降维方法具有重要意义。
发明内容
本发明所要解决的技术问题是提供一种基于有向长方体的三维空间手写字符维数约简方法,以解决传统降维方法中2D字符随机反转及存在旋转角度的问题,实现更好的可视化效果。
本发明的具体步骤如下:
步骤一、根据Leap Motion体感控制器建立初始三维坐标系。
步骤二、使用者在Leap motion体感控制器上方用手指绘制字符。Leap motion体感控制器检测手指指尖在空间中运动的三维坐标,得到离散点集。离散点集包括n个离散点。n个离散点在初始三维坐标系内的坐标分别为(xi,yi,zi),i=1,2,…,n。
步骤三、用OBB包围盒算法针对步骤二所得离散点集建立有向长方体。
步骤四、选取步骤三所得有向长方体上面积最大的两个面的法向量作为自适应投影面的法向量。选取步骤二所得离散点集的几何中心点作为自适应投影面经过的点,从而确定自适应投影面。
若自适应投影面平行于初始三维坐标系内X轴、Z轴所成平面,则重新执行步骤二。否则,进入步骤五。
步骤五、定义自适应投影面与步骤3所得有向长方体上四条棱的交点分为点M、点N、点P、点Q。将点M、点N、点P分别投影在初始三维坐标系内X轴、Y轴所成平面上,得到点M1、点N1、点P1。点M1、点N1、点P1在初始三维坐标系内的坐标分别为M1(a1,b1,0),N1(a2,b2,0),P1(a3,b3,0)。
计算方向特征值d如下:
建立二维直角坐标系。二维直角坐标系的坐标原点为点M。若d<0,则二维直角坐标系的Y轴与线MQ重合,Y轴正方向为点M向点Q的方向,X 轴与线MN重合,X轴正方向为点M向点N的方向。若d≥0,则二维直角坐标系的Y轴与线MN重合,Y轴正方向为点M向点N的方向,X轴与线MQ 重合,X轴正方向为点M向点Q的方向。
步骤六、将步骤二所得离散点集投影到自适应投影面上,得到降维点集。降维点集包括n个降维点。n个降维点在初始三维坐标系内的坐标分别为 (xri,yri,zri),i=1,2,...,n。点M、点N、点P在初始三维坐标系内的坐标分别为 M(e1,f1,g1),N(e2,f2,g2),Q(e3,f3,g3。
步骤七、将降维轨迹以降维点集的几何中心点为旋转中心,沿二维直角坐标系x轴正半轴向y轴正半轴的方向旋转θ。得到输出点集K。输出点集K 包括n个输出点。n个输出点在二维直角坐标系内的坐标分为(p′i,q′i),i=1,2,...,n。
其中,降维点集的几何中心点在二维直角坐标系内的坐标为若x1<x3,y1<y3,则θ=0°。若x1>x3,y1<y3,则θ=90°。若x1>x3,y1>y3,则θ=180°。若x1<x3,y1>y3,则θ=270°;
步骤八、依次连接输出点集内的n个输出点,得到输出轨迹。
进一步地,步骤一中,以Leap Motion体感控制器的设备中心作为初始三维坐标系的坐标原点。初始三维坐标系的X轴与Leap Motion体感控制器的长边平行,且正方向朝向坐标原点靠近Leap Motion体感控制器信号灯的方向。初始三维坐标系的Z轴与LeapMotion体感控制器的短边平行,且正方向朝向使用位置。使用位置为使用者在进行字符绘制时所在的位置。初始三维坐标系的Y轴竖直设置,且正方向朝向正上方。
进一步地,步骤八得到输出轨迹后,将经所得输出轨迹以图片的形式输出。
本发明具有的有益效果是:
本发明能够精确地对三维手写字符进行降维,保证降维后能够得到固定方向的2D图像。此外,本发明解决了传统的降维方法中存在的2D字符随机反转和存在旋转角度的问题,从而实现更好的可视化效果,极大程度提高了三维空间手写字符的识别率。
具体实施方式
以下对本发明作进一步说明。
一种基于有向长方体的三维空间手写字符维数约简方法的具体步骤如下:
步骤一、定义初始三维坐标系
根据水平放置的Leap Motion体感控制器建立初始三维坐标系。以Leap Motion体感控制器的设备中心作为初始三维坐标系的坐标原点。初始三维坐标系的X轴与LeapMotion体感控制器的长边平行,且正方向朝向坐标原点靠近Leap Motion体感控制器信号灯的方向。初始三维坐标系的Z轴与Leap Motion体感控制器的短边平行,且正方向朝向使用位置。使用位置为使用者在进行字符绘制时所在的位置。初始三维坐标系的Y轴竖直设置,且正方向朝向正上方。
步骤二、获取运动指尖的空间坐标并生成三维轨迹离散点集
使用者在Leap motion体感控制器上方用手指绘制字符。Leap motion体感控制器检测手指指尖在空间中运动的三维坐标,得到离散点集H。(离散点集是Leap motion体感控制器检测到的手指指尖在三维空间中运动经过的点的集合)离散点集H包括n个离散点。n个离散点在初始三维坐标系内的坐标分别为(xi,yi,zi),i=1,2,…,n。
步骤三、用OBB包围盒算法针对步骤二所得离散点集建立有向长方体。
步骤四、确定自适应投影面
选取步骤三所得有向长方体上面积最大的两个面的法向量作为自适应投影面的法向量。选取步骤二所得离散点集的几何中心点作为自适应投影面经过的点,从而确定自适应投影面。由于OBB包络算法可以根据字符的书写角度进行紧密包络,即有向长方体代表了空间字符的方向,而有向长方体上最大面积的平面代表了最多的字符信息,故自适应投影面上能够显示出最完整的字符投影。
若自适应投影面平行于初始三维坐标系内X轴、Z轴所成平面,则输入的离散点集无法生成确定方向的投影,使用者重新绘制字符,重新执行步骤二。否则,进入步骤五。
步骤五、建立二维直角坐标系
定义自适应投影面与步骤3所得有向长方体上四条棱的交点分为点M、点N、点P、点Q。点M与点N分别为有向长方体内同一侧面的两条棱上的点。点N与点P分别为有向长方体内同一侧面的两条棱上的点。将点M、点 N、点P分别投影在初始三维坐标系内X轴、Y轴所成平面上,得到点M1、点N1、点P1。点M1、点N1、点P1在初始三维坐标系内的坐标分别为 M1(a1,b1,0),N1(a2,b2,0),P1(a3,b3,0)。
计算方向特征值d如下:
建立二维直角坐标系。二维直角坐标系的坐标原点为点M。若d<0,则二维直角坐标系的Y轴与线MQ重合,Y轴正方向为点M向点Q的方向,X 轴与线MN重合,X轴正方向为点M向点N的方向。若d≥0,则二维直角坐标系的Y轴与线MN重合,Y轴正方向为点M向点N的方向,X轴与线MQ 重合,X轴正方向为点M向点Q的方向。
步骤六、将离散点集投影到自适应投影面上
将步骤二所得离散点集投影到自适应投影面上,得到降维点集R。降维点集R包括n个降维点。n个降维点在初始三维坐标系内的坐标分别为(xri,yri,zri), i=1,2,…,n。点M、点N、点P在初始三维坐标系内的坐标分别为 M(e1,f1,g1),N(e2,f2,g2),Q(e3,e3,e3)。
此时,降维点集在二维直角坐标系内,且不会出现上下反转和左右反转的情况,但是降维点集的底部到顶部的方向与二维直角坐标系Y轴正方向可能存在夹角,又因为OBB包络算法是紧密包围且代表字符方向的,降维点集底部往顶部的方向一定与矩形MNPQ的一对边平行,另一对边垂直,即降维点集需要旋转0°、90°或180°来使得降维点集的顶部朝向二维直角坐标系的Y 轴正方向。(降维点集的顶部即为所书写字符的顶部。)
步骤七、旋转校正
将降维轨迹以降维点集的几何中心点为旋转中心,沿二维直角坐标系x 轴正半轴向y轴正半轴的方向旋转θ。得到输出点集K。输出点集K包括n 个输出点。n个输出点在二维直角坐标系内的坐标分为(p′i,q′i),i=1,2,…,n。
其中,降维点集的几何中心点在二维直角坐标系内的坐标为若x1<x3,y1<y3,则θ=0°。若x1>x3,y1<y3,则θ=90°。若x1>x3,y1>y3,则θ=180°。若x1<x3,y1>y3,则θ=270°;
步骤八、依次连接输出点集内的n个输出点,得到输出轨迹。之后将所得输出轨迹以图片的形式输出。
Claims (3)
1.一种三维空间手写字符维数约简方法,其特征在于:
步骤一、根据Leap Motion体感控制器建立初始三维坐标系;
步骤二、使用者在Leap motion体感控制器上方用手指绘制字符;Leap motion体感控制器检测手指指尖在空间中运动的三维坐标,得到离散点集;离散点集包括n个离散点;n个离散点在初始三维坐标系内的坐标分别为(xi,yi,zi),i=1,2,...,n;
步骤三、用OBB包围盒算法针对步骤二所得离散点集建立有向长方体;
步骤四、选取步骤三所得有向长方体上面积最大的两个面的法向量作为自适应投影面的法向量;选取步骤二所得离散点集的几何中心点作为自适应投影面经过的点,确定自适应投影面;
若自适应投影面平行于初始三维坐标系内X轴、Z轴所成平面,则重新执行步骤二;否则,进入步骤五;
步骤五、定义自适应投影面与步骤3所得有向长方体上四条棱的交点分为点M、点N、点P、点Q;将点M、点N、点P分别投影在初始三维坐标系内X轴、Y轴所成平面上,得到点M1、点N1、点P1;点M1、点N1、点P1在初始三维坐标系内的坐标分别为M1(a1,b1,0),N1(a2,b2,0),P1(a3,b3,0);
计算方向特征值d如下:
建立二维直角坐标系;二维直角坐标系的坐标原点为点M;若d<0,则二维直角坐标系的Y轴与线MQ重合,Y轴正方向为点M向点Q的方向,X轴与线MN重合,X轴正方向为点M向点N的方向;若d≥0,则二维直角坐标系的Y轴与线MN重合,Y轴正方向为点M向点N的方向,X轴与线MQ重合,X轴正方向为点M向点Q的方向;
步骤六、将步骤二所得离散点集投影到自适应投影面上,得到降维点集;降维点集包括n个降维点;n个降维点在初始三维坐标系内的坐标分别为(xri,yri,zri),i=1,2,...,n;点M、点N、点P在初始三维坐标系内的坐标分别为M(e1,f1,g1),N(e2,f2,g2),Q(e3,f3,g3);
步骤七、将降维轨迹以降维点集的几何中心点为旋转中心,沿二维直角坐标系x轴正半轴向y轴正半轴的方向旋转θ;得到输出点集K;输出点集K包括n个输出点;n个输出点在二维直角坐标系内的坐标分为(p′i,q′i),i=1,2,...,n;
其中,降维点集的几何中心点在二维直角坐标系内的坐标为若x1<x3,y1<y3,则θ=0°;若x1>x3,y1<y3,则θ=90°;若x1>x3,y1>y3,则θ=180°;若x1<x3,y1>y3,则θ=270°;
步骤八、依次连接输出点集内的n个输出点,得到输出轨迹。
2.根据权利要求1所述的一种三维空间手写字符维数约简方法,其特征在于:以LeapMotion体感控制器的设备中心作为初始三维坐标系的坐标原点;初始三维坐标系的X轴与Leap Motion体感控制器的长边平行,且正方向朝向坐标原点靠近Leap Motion体感控制器信号灯的方向;初始三维坐标系的Z轴与Leap Motion体感控制器的短边平行,且正方向朝向使用位置;使用位置为使用者在进行字符绘制时所在的位置;初始三维坐标系的Y轴竖直设置,且正方向朝向正上方。
3.根据权利要求1所述的一种三维空间手写字符维数约简方法,其特征在于:步骤八得到输出轨迹后,将经所得输出轨迹以图片的形式输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810676489.2A CN109191365B (zh) | 2018-06-27 | 2018-06-27 | 一种基于有向长方体的三维空间手写字符维数约简方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810676489.2A CN109191365B (zh) | 2018-06-27 | 2018-06-27 | 一种基于有向长方体的三维空间手写字符维数约简方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109191365A CN109191365A (zh) | 2019-01-11 |
CN109191365B true CN109191365B (zh) | 2022-11-25 |
Family
ID=64948595
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810676489.2A Active CN109191365B (zh) | 2018-06-27 | 2018-06-27 | 一种基于有向长方体的三维空间手写字符维数约简方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109191365B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111709320B (zh) * | 2020-05-28 | 2023-04-18 | 杭州电子科技大学 | 一种基于密度峰值聚类特征选择的三维手写字符识别方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102902848A (zh) * | 2012-09-18 | 2013-01-30 | 大连理工大学 | 针对边界元分析的三维可视化仿真方法 |
CN107609593A (zh) * | 2017-09-15 | 2018-01-19 | 杭州电子科技大学 | 一种基于最长轨迹投影的三维空间手写字符降维方法 |
WO2018045670A1 (zh) * | 2016-09-09 | 2018-03-15 | 华南理工大学 | 基于自然手势的虚拟数字雕塑方法 |
-
2018
- 2018-06-27 CN CN201810676489.2A patent/CN109191365B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102902848A (zh) * | 2012-09-18 | 2013-01-30 | 大连理工大学 | 针对边界元分析的三维可视化仿真方法 |
WO2018045670A1 (zh) * | 2016-09-09 | 2018-03-15 | 华南理工大学 | 基于自然手势的虚拟数字雕塑方法 |
CN107609593A (zh) * | 2017-09-15 | 2018-01-19 | 杭州电子科技大学 | 一种基于最长轨迹投影的三维空间手写字符降维方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109191365A (zh) | 2019-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7337104B2 (ja) | 拡張現実によるモデル動画多平面インタラクション方法、装置、デバイス及び記憶媒体 | |
CN100470452C (zh) | 一种实现三维增强现实的方法及系统 | |
US9020266B2 (en) | Methods and devices for processing handwriting input | |
US20190272670A1 (en) | Real-time hand modeling and tracking using convolution models | |
CN110349152A (zh) | 人脸图像质量检测方法及装置 | |
CN107146287B (zh) | 二维投影图像至三维模型的映射方法 | |
US20230186590A1 (en) | Method for omnidirectional dense regression for machine perception tasks via distortion-free cnn and spherical self-attention | |
WO2019000692A1 (zh) | 立体图形绘制方法、装置、设备及存储介质 | |
WO2017070923A1 (zh) | 一种人脸识别方法和装置 | |
WO2024109772A1 (zh) | 一种基于结构光系统的人脸姿态估计方法及装置 | |
CN109862343A (zh) | 虚拟现实装置、影像处理方法以及非暂态电脑可读取记录媒体 | |
Wang et al. | Joint head pose and facial landmark regression from depth images | |
US7187378B2 (en) | Determining the convex hull of convex polygons with congruent corresponding angles | |
CN101593357A (zh) | 一种基于三维平面控件的交互式体切割方法 | |
CN109191365B (zh) | 一种基于有向长方体的三维空间手写字符维数约简方法 | |
CN115082935A (zh) | 用于对文档图像进行矫正的方法、设备及存储介质 | |
CN103970432B (zh) | 一种模拟真实翻页效果的方法与装置 | |
Brynte et al. | Rigidity preserving image transformations and equivariance in perspective | |
CN112700391A (zh) | 一种图像处理方法、电子设备及计算机可读存储介质 | |
CN111145081B (zh) | 基于空间体积特征的三维模型视图投影方法及系统 | |
CN104537628B (zh) | 一种冗余可控的动漫图像适配方法 | |
Heo et al. | Generic 3D face pose estimation using facial shapes | |
Ye et al. | An improved algorithm for triangle to triangle intersection test | |
Zellmann et al. | A Practical Guide to Implementing Off-Axis Stereo Projection Using Existing Ray Tracing Libraries | |
CN116740298B (zh) | 一种基于三维引擎的场景实时地图的构建方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |