CN104885095A - 手写文档处理设备和方法 - Google Patents

手写文档处理设备和方法 Download PDF

Info

Publication number
CN104885095A
CN104885095A CN201380043857.5A CN201380043857A CN104885095A CN 104885095 A CN104885095 A CN 104885095A CN 201380043857 A CN201380043857 A CN 201380043857A CN 104885095 A CN104885095 A CN 104885095A
Authority
CN
China
Prior art keywords
graticule
graticules
area
stroke data
stroke
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201380043857.5A
Other languages
English (en)
Other versions
CN104885095B (zh
Inventor
井本和范
中洲俊信
柴田智行
登内洋次郎
高桥梓帆美
山内康晋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dynabook Inc
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Publication of CN104885095A publication Critical patent/CN104885095A/zh
Application granted granted Critical
Publication of CN104885095B publication Critical patent/CN104885095B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/147Determination of region of interest
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/177Editing, e.g. inserting or deleting of tables; using ruled lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • G06V30/347Sampling; Contour coding; Stroke extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)
  • User Interface Of Digital Computer (AREA)
  • Character Input (AREA)

Abstract

根据一个实施例,手写文档处理设备包括输入器、分类器、分割器和判断器。输入器输入笔划数据。分类器把笔划数据分类为多条格子线的数据和除格子线以外的笔划数据。分割器将包括多条格子线的区域划分为每个都对应于以四条格子线为界的单元格的第一区域和每个都包括最多三条格子线的第二区域。判断器判断在第二区域中的格子线是第一格子线还是第二格子线,其中,格子线不连接至第一格子线的一个端点,还是虚拟的外接格子线连接至第二格子线的一个端点。

Description

手写文档处理设备和方法
相关申请的交叉引用
此申请基于2012年8月17日提交的2012-180958号日本专利申请并要求其优先权的利益,其全部内容通过引用被合并到本文中。
技术领域
在这里描述的实施例一般地涉及一种手写文档处理设备和方法。
背景技术
已知在包括笔输入界面的应用程序中的用于提取表格格子线、表单的格子线等等,并且出于整齐的副本的目的而将它们成形的技术。
附图说明
图1是根据实施例的手写文档处理设备的方框图;
图2显示笔划数据的显示实例;
图3是显示笔划数据的柱状图的曲线;
图4是显示笔划的高宽比的视图;
图5是用于解释分类器的处理结果的视图;
图6A和6B是用于解释区域划分的视图;
图7是显示区域划分结果的视图;
图8是通过判断器的处理的流程图;
图9是用于解释基于单元格区域的统计量的计算的视图;
图10是显示判断器的处理结果的视图;
图11是显示判断器的处理结果的视图;
图12是显示基于除格子线以外的笔划的判断处理的视图;
图13是显示基于线段的比率的小扩展格子线的判断处理的视图;
图14是显示单元格区域的分组的视图;
图15是显示外接格子线的估算的视图;
图16是显示外接格子线的位置校正的视图;
图17是显示手写格子线的线转换的视图;
图18是用于解释外接格子线的显示模式的视图;
图19A、19B和19C是显示笔划数据的数据结构实例的视图;
图20是显示硬件配置实例的方框图;以及
图21是显示网络配置实例的视图。
具体实施方式
总的来说,根据一个实施例,手写文档处理设备包括输入器、分类器、分割器和判断器。输入器输入笔划数据。分类器把笔划数据分类为多条格子线的数据和除格子线以外的笔划数据。分割器将包括多条格子线的区域划分为每个都对应于以四条格子线为界的单元格的第一区域和每个都包括最多三条格子线的第二区域。判断器判断在第二区域中的格子线是格子线不连接至其一个端点的第一格子线,还是虚拟的外接格子线连接至其一个端点的第二格子线。
以下将参考附图描述实施例。
根据此实施例的手写文档处理设备被用于,例如,包括笔输入界面的笔记本应用程序。这个应用程序允许用户在自由的布局中在不使用任何图形绘制工具的情况下手动地手写表格。在这种情况下,格子线的长度经常可以是不均匀的,或者格子线可以经常变成非竖直的、弯曲的线。此外,当他或她手写输入表格时,用户可以经常忽略外框的格子线(以下称为外接格子线)。此实施例涉及为应付这些情形而需要的用户界面的改进,并且能够适当地处理手写格子线以使表格成形。
图1是根据本实施例的手写文档处理设备的方框图。手写文档处理设备2处理,例如,使用笔输入界面的手写输入。设备2的主要部分3包括用于输入笔划数据1的输入器4、把笔划数据1分类为格子线和其它数据的分类器5、将包括格子线的区域划分为第一和第二区域的分割器6以及将判断处理应用至第二区域中的格子线的判断器7。
设备2包括估算,例如,外接格子线的估算器8以及基于估算器8的估算结果显示成形的表格的显示器9。可以修改此实施例以使得估算器8被包括在主要部分3中。做为选择,也可以修改此实施例以使得设备2不包括估算器8和显示器9,并且判断器7的结果被用作最后的输出数据。
输入器4输入笔划数据1,该笔划数据1经由,例如,笔输入界面被提供。图2显示笔划数据1的显示实例10。笔划数据1具有对于每个笔划分类的坐标时间序列的数据,并且例如,被表示为如下:
笔划1:(x(1,1),y(1,1)),(x(1,2),y(1,2)),...,(x(1,N(1)),y(1,N(1)))
笔划2:(x(2,1),y(2,1)),(x(2,2),y(2,2)),...,(x(2,N(2)),y(2,N(2)))
...
在此N(i)是在采样笔划i的时候的点的数目。随后将描述笔划数据1(手写数据)的更详细的结构的实例。
分类器5将笔划数据1分类为多个格子线数据和除格子线以外的笔划数据。表格的格子线的特征在于(1)笔划长度相对较大,和(2)由笔划的开始和结束点决定的高宽比是极端地大/小。这样,笔划数据1能够基于这些标准被分类为格子线和其它数据。
图3显示笔划长度的分布图。在图3中的分布图L中,具有超过阈Th的笔划长度的笔划,是格子线(或格子线候选者)。这对应于以上条件(1)。图4显示由笔划的开始和结束点决定的高宽比。参考图4,因为具有起点S1和终点E1的笔划在水平方向上比在垂直方向上极端地长,所以它被分类为格子线。同样,因为具有起点S2和终点E2的笔划在垂直方向上比在水平方向上极端地长,所以它也被分类为格子线。图4所示的实例对应于以上条件(2)。
图5是用于解释分类器5的处理结果的视图。参考图5,引用符号RL表示在笔划数据1中的多个格子线数据;并且HW表示除在笔划数据1中的格子线以外的笔划数据。注意笔划数据HW对应于输入至手写表格的单元格的手写字符串(在这个实例中,是“好影響”,“悪影響”,“内部環境”,...,“グローバル化”)。
分割器6将包括由分类器5分类的多条格子线的区域划分为对应于以四条格子线为界的单元格的的第一区域,和包括最多三条格子线的第二区域。在这种情况下,注意力仅仅集中在笔划数据1中分类为格子线的数据上。如图6A所示,检测出笔划的交点(IP1至IP9)和端点(EP1至EP9)。接下来,从端点(EP1至EP9)中选择位于矩形的各个边的最末端的位置的多个端点以获得包括由分类器5分类的多条格子线(也就是说,所有的格子线)的区域。这个包含的区域不需要总是一个矩形,而是可以是多个矩形的组合,如图6B所示。接下来,基于交点(IP1至IP9),该包含的区域被分成多个区域R(图6B)。这些多个区域R包括第一区域RA1至RA4和第二区域RB1至RB9,如图7所示。
例如,第一区域RA1对应于以图6A所示的四个交点IP1、IP2、IP3和IP4为界的单元格(包括手写字符串“技術力高い”)。同样地,第一区域RA2对应于以四个交点IP2、IP3、IP5和IP6为界的单元格(包括手写字符串“機動力弱い”)。这些第一区域RA1至RA4以下将称为“单元格区域”。
相反,例如,第二区域RB1包括端点EP1(和EP4),如图6A所示。还有,第二区域RB1不是以四个交点为界,并且仅仅包括交点IP1。所以,第二区域RB1对应于这样的区域,在该区域中,对应于这个区域的单元格的某些格子线遗漏,并且该区域最多包括三条格子线(在这个实例中是两条格子线)。这些第二区域RB1至RB9以下将称为“小扩展区域”。同样地,第二区域RB2包括端点EP1(和EP2),如图6A所示。同样,第二区域RB2仅仅包括两个交点IP1和IP2,并且不是以四个交点为界。同样地,第二区域RB9包括端点EP9,如图6A所示。同样,第二区域RB9仅仅包括两个交点IP6和IP9,并且不是以四个交点为界。
分割器6可以简单地执行区域划分,所以“每个都包括至少一个端点的一组区域被确定为小扩展区域,并且一组其它的区域被确定为单元格区域”,或者“每个都包括至少一个端点的区域被确定为扩展区域,并且其它的区域被确定为单元格区域”。做为选择,分割器6可以执行区域划分,以使得“每个都包括四个交点的一组区域被确定为单元格区域,并且一组其它的区域被确定为小扩展区域”,或者“每个都包括四个交点的区域被确定为单元格区域,并且其它的区域被确定为小扩展区域”。
判断器7对于小扩展区域(RB1至RB9)的每个都判断所考虑的小扩展区域的格子线是没有格子线连接至其一个端点的第一格子线(以下称为“小扩展格子线”),还是虚拟的外接格子线连接至其一个端点的第二格子线。小扩展格子线是从格子线的交点伸出的“小扩展”,并且原则上当使表格成形时应该除去。
(实施例A)
在实施例A中,判断器7将降到基于由限定单元格的格子线的笔划长度计算的统计量的第一参考值之下的格子线判断为小扩展格子线。
图8是通过实施例A的判断器7的处理的流程图。
(步骤S1)
判断器7基于图9所示的单元格区域(RA1至RA4)的多条格子线的笔划计算格子线的统计量。简单地,垂直笔划长度的平均值和水平笔划长度的平均值分别被用作统计量。
(步骤S2)
判断器7判断是否仍然剩余将要处理的小扩展区域。如果所有的小扩展区域被处理了,则该处理结束。
(步骤S3)
判断器7基于步骤S1中的统计量判断限定小扩展区域的格子线是否满足标准。注意通过将垂直笔划长度的平均值乘以预定系数(例如,0.5)获得的值被用作垂直笔划的第一参考值,并且通过将水平笔划长度的平均值乘以预定系数获得的值被用作水平笔划的第一参考值。
(步骤S4)
如果限定小扩展区域的格子线是垂直笔划,并且如果那条格子线的垂直笔划长度等于或大于垂直笔划长度的第一参考值,则判断器7判断该格子线是连接到虚拟的外接格子线的那条。另一方面,如果限定小扩展区域的格子线是水平笔划,并且如果那条格子线的水平笔划长度等于或大于水平笔划长度的第一参考值,则判断器7也判断该格子线是连接到虚拟的外接格子线的那条。这些格子线对应于满足在步骤S3的判断处理中的基准的那些。
(步骤S5)
如果限定小扩展区域的格子线是垂直笔划,并且如果那条格子线的垂直笔划长度降到该垂直笔划长度的第一参考值之下,则判断器7判断该格子线是小扩展格子线。另一方面,如果限定小扩展区域的格子线是水平笔划,并且如果那条格子线的水平笔划长度降到该水平笔划长度的第一参考值之下,则判断器7也判断该格子线是小扩展格子线。这些格子线对应于不满足在步骤S3的判断处理中的基准的那些。
图10和11是显示判断器7的处理结果的视图。作为小扩展区域(RB1至RB9)的处理的结果,小扩展区域RB6、RB7、RB8和RB9包括小扩展格子线,如由“X”标记指示的。图11显示虚拟的外接格子线连接到的小扩展格子线RBL1至RBL3和第二格子线RAL1至RAL6。根据随后将要描述的估算处理,能够估算将要连接到这些第二格子线RAL1至RAL6的外接格子线以便补偿表格。
(实施例B)
实施例B不同于实施例A之处在于执行独立于格子线长度的判断。在实施例B中,如果除在小扩展区域中的格子线以外的笔划的数目等于或大于第二参考值,则判断器7判断在那个小扩展区域中的格子线是虚拟的外接格子线连接到的第二格子线。除在小扩展区域中的格子线以外的笔划是指限定手写字符等等的笔划组HW1(手写的“好影響”)至HW4(手写的“外部環境”),如图12所示。假定第二参考值(笔划的数目)是,例如,4。在这个实例中,笔划组HW1至HW4中的每个都显然地包括四个笔划以上。
根据实施例B,小扩展区域RB2,RB3,RB4,和RB5中的格子线被确定为第二格子线。在剩余的小扩展区域中的格子线被确定为小扩展格子线。所以,能够获得与在图11中相同的结果。小扩展区域RB2,RB3,RB4,和RB5能够被认为是单元格区域,其某些格子线遗漏。
注意因为实施例B基于除格子线以外的笔划的数目而不是格子线的长度执行判断,所以它能够适当地判断如下这样的格子线,该格子线的长度短并且虚拟的外接格子线将要连接到该格子线。
在这种情况下,除格子线以外的笔划的数目已经被主要地描述为第二基准。做为选择,可以使用除包括在小扩展区域中的格子线以外的笔划的总长度。例如,如图12所示,笔划组HW1至HW4中的每个笔画组的笔划长度的总和显然比格子线更长。对于每个区域计算除包括在小扩展区域中的格子线以外的笔划长度的总和,并且将该总长度与第二基准相比较,从而适当地判断虚拟的外接格子线将要连接到的格子线。
(实施例C)
实施例C处理其中不存在单元格区域的情况。在这种情况下,因为不存在限定单元格的格子线,所以不能计算在实施例A中的统计量。同样,当没有手写输入除格子线以外的笔划时,因为不能检测出对应于单元格的区域,所以不能应用实施例B。
在实施例C中,基于取决于小扩展区域中的两条格子线的交点的两条线段的长度比率,判断器7判断更短的线段是小扩展格子线。例如,如图13所示,基于包括交点IP和端点EP1的线段m的长度与包括交点IP和端点EP2的线段n的长度之间的比率,判断器7能够判断线段n是小扩展格子线。相反地,当m和n之间的比率大略地是1:1时,判断器7判断m和n是第二格子线,并且外接格子线连接到端点EP1和EP2。
(实施例D)
实施例D能够与实施例B结合地实行。当应用实施例B时,使用第二参考值(除格子线以外的笔划的数目的参考值)判断第二格子线(连接到外接格子线的格子线)。更具体地说,如图14所示,包括除格子线以外的笔划组HW1的区域3,包括除格子线以外的笔划组HW2的区域4,以及包括除格子线以外的笔划组HW3的区域5被确定为包括第二格子线的区域,那就是说,其某些格子线遗漏的单元格区域。
在这种情况下,据估计,用户以共同的意图在属于同一列的区域和属于同一行的区域上作出手写,并且如果某些区域是单元格区域,则属于单个的列或行的其它的区域能够被认为是空白的单元格区域。所以,更可取的是将判断结果作为单元格区域应用到其它的区域。
在实施例D中,连接到相同的格子线的区域被组合,并且跨越该组传播该判断结果。更具体地说,判断器7组共享格子线的多个小扩展区域,并且将第二格子线的判断结果应用到该组。例如,在图14中,判断器7将指示小扩展区域3中的格子线是第二格子线的判断结果应用到共享同一行中的格子线的其它的小扩展区域1和2,并且判断在其它的小扩展区域中的格子线是第二格子线。
注意前面提到的实施例A到D可以单独地实行或者多个实施例可以适当地结合。
接下来,估算器8和显示器9将描述如下。
(实施例E)
在实施例E中,估算器8包括估算连接到由判断器7判断的第二格子线的外接格子线的第一估算器。第一估算器分别地对于第二格子线的端点组G1和G2估算外接格子线L1和L2,如图15所示。外接格子线L1和L2对应于未手写输入并且被忽略的虚拟的外接格子线。例如,穿越端点组G1的Y坐标的平均值位置的水平线被用作在水平(行)方向上的外接格子线L1,并且穿越端点组G2的X坐标的平均值位置的垂直线被用作在垂直(列)方向上的外接格子线L2。如图15所示,估算的外接格子线L1和L2是与手写的内容一起由显示器9显示。
(实施例E')
实施例E'涉及实施例E的变形。当估算外接格子线时,如图16所示,更可取的是修正外接格子线AL的水平位置以便不遍布除格子线以外的笔划组HW1和HW2,那就是说,在这个实例中的手写字符串。
简单地,将组HW1和HW2的Y坐标与外接格子线AL的相比较,并且外接格子线AL的Y坐标被修正为相同的值或者落入预定阈值范围的值。
(实施例F)
在实施例F中,估算器8包括估算由用户手写的格子线的竖直转换的格子线的第二估算器。例如,如图17所示,与手写格子线L1至L6相联系地估算穿越各条格子线的质心的直线RL1至RL6。显示器9显示直线RL1至RL6而不是手写格子线L1至L6。
(实施例G)
在实施例G中,显示器9以不同的显示模式显示由估算器8估算的外接格子线(虚拟的线条)和由用户手写输入的格子线。更具体地说,切换诸如显示颜色、厚度和线条类型的笔划属性。例如,在图18中,由估算器8估算和补充外接格子线FL1和FL2,并且其它的格子线是由用户手写输入的那些。使用不同的显示模式以便互相区别这些线条。
注意更可取的是在可区别地显示估算的外接格子线的显示模式和没有任何这样的区别的之间切换。
注意前面提到的实施例E至G可以单独地实行,但是多个实施例可以适当地结合。
笔划数据1(手写数据)的更详细的数据结构的实例将参考图19A、19B和19C描述如下。
“笔划”是手写输入的笔图像,并且表示从当笔等等接触到输入表面时直到释放它为止的轨迹。正常地,因为轨迹上的点是以预定计时(例如,以恒定的周期)采样的,所以笔划可以表示为采样点的序列。
在图19B所示的实例中,用于一个笔划的笔划结构是由笔的移动平面上的一组坐标值(点结构)表示的。更具体地说,笔划结构包括指示形成那个笔划的点的数目的“点的总数”,“开始时间”,“外接图形”,以及和点的总数一样多的“点结构”的序列。注意开始时间指示笔接触到输入表面并且开始写入那个笔划的时间。外接图形指示用于那个笔划的轨迹的那个(更可取地,具有包括文档平面上的那个笔划的最小面积的矩形)。
点的结构取决于输入装置。在图19C的实例中,一个点的结构具有四个值,那就是说,在其采样那个点的坐标值x和y、写压强以及自初始点(例如,以上“开始时间”)起的时间差。
注意坐标是在文档平面的坐标系上的那些,并且可以由向着右下角增大以让左上角作为原点的正值表示。
当输入装置不能获取写压强时或者当它能够获取写压强但是后续的处理不使用该写压强时,可以忽略图19C中的写压强,或者可以在该写压强中描述指示无效的数据。
注意在图19B和19C所示的实例中,可以在笔划结构中的单独的点结构的区域中描述诸如坐标值x和y的实际数据,或者可以独立地管理笔划结构的数据和点结构的数据,并且可以在笔划结构中的每个单独的点结构的区域中描述与对应的点结构的链接信息。
此实施例的手写文档处理设备可以设定为独立的设备或作为能够经由网络互相通信并且设备的功能分布至其的多个结点。
此实施例的手写文档处理设备能够由不同的装置实施,诸如台式或膝上型的通用计算机、便推式通用计算机、另一个便推式信息装置、具有触摸面板的信息装置、智能电话、另一个信息处理设备等等。
图20显示实施此实施例的手写文档处理设备的硬件配置实例。参考图20,参考标号201表示CPU;202,预定输入装置;203,预定输出装置;204,RAM;205,ROM;206,外部存储器接口;以及207,通信接口。例如,当使用触摸面板时,使用例如液晶面板、笔、安装在该液晶面板上的笔划检测装置等等(参见图20中的208)。
还有,例如,图1所示的某些组件可以安装在客户端上,并且图1中剩余的组件可以安装在服务器上。
例如,图21显示通过在诸如内部网和/或因特网的网络300上配置服务器303,并且允许客户端301和302经由网络300与服务器303通信的此实施例的手写文档处理设备的实施实例。
注意在图21所示的实例中,客户端301经由无线通信连接到网络300,并且客户端302经由有线通信连接到网络300。
客户端301和302正常地是用户设备。服务器303可以是,例如,安装在如公司内部LAN的LAN上的,或者可以由因特网服务供应商等等管理。服务器303可以是用户设备,并且某个用户可以向另一个用户提供功能。
作为将图1所示的组件分布至客户端和服务器的方法,可以使用不同的方法。
能够基于作为软件的程序执行在前面提到的实施例中描述的处理序列所示的指令。通用计算机系统可以预先存储这个程序,并且加载这个程序,从而获得与前面提到的实施例的手写文档处理设备的那些相同的效果。在以上实施例中描述的指令被记录在磁盘(软磁盘、硬磁盘等等)、光盘(CD-ROM、CD-R、CD-RW、DVD-ROM、DVD±R、DVD±RW等等)、半导体存储器或者类似它们的记录介质中作为能够由计算机执行的程序。能够由计算机或嵌入系统读取的记录介质的存储格式没有特别限制。计算机从记录介质加载程序,并且基于这个程序控制CPU执行在该程序中描述的指令,从而实施与前面提到的实施例的手写文档处理设备的那些相同的操作。当然,计算机可以经由网络获取或加载该程序。
在计算机上运行的,诸如数据库管理软件或网络的OS(操作系统)或MW(中间件)可以基于从记录介质安装在计算机或嵌入系统中的程序的指令执行实施此实施例要求的处理的某些。
此外,此实施例的记录介质不局限于独立于计算机的介质,而是它包括存储或临时地存储经由LAN或因特网下载的程序的记录介质。
记录介质的数目不局限于一个,并且此实施例的记录介质包括其中从多个介质中执行此实施例的处理的情况。也就是说,介质的配置没有特别限制。
注意要求此实施例中的计算机或嵌入系统基于存储在记录介质中的程序执行此实施例中的各个处理,并且可以是诸如个人计算机或微型计算机的单个的设备或者其中经由网络连接多个设备的系统。
此实施例的计算机不局限于个人计算机而是它包括信息处理设备中包括的算术运算处理装置,微型计算机,等等,并且集合地意指能够借助于程序实施此实施例的功能的装置或设备。
虽然已经描述了某些实施例,但是这些实施例仅仅已经经由例子被给出,而不意欲限制该发明的范围。实际上,在这里描述的新颖的实施例可以用多种其它的形式被体现;此外,可以在没有脱离本发明的精神的情况下作出在这里描述的实施例的形式上的不同的省略,替换和变化。伴随的权利要求书和它们的同等物是用来覆盖这样的形式或修改,其将落入该发明的范围和精神。

Claims (13)

1.一种手写文档处理设备,其特征在于,包含:
输入器,所述输入器输入笔划数据;
分类器,所述分类器将所述笔划数据分类为多条格子线的数据和除格子线以外的笔划数据;
分割器,所述分割器将包括所述多条格子线的区域划分为每个都对应于以四条格子线为界的单元格的第一区域和每个都包括最多三条格子线的第二区域;以及
判断器,所述判断器判断在所述第二区域中的格子线是第一格子线还是第二格子线,其中,格子线不连接至所述第一格子线的一个端点,虚拟的外接格子线连接至所述第二格子线的一个端点。
2.如权利要求1所述的设备,其特征在于,进一步地包含估算所述虚拟的外接格子线的第一估算器。
3.如权利要求1所述的设备,其特征在于,进一步地包含估算所述多条格子线的竖直转换的格子线的第二估算器。
4.如权利要求2所述的设备,其特征在于,进一步地包含以不同于所述笔划数据的所述多条格子线的显示模式的显示模式显示所述外接格子线的显示器。
5.如权利要求1所述的设备,其特征在于,所述判断器基于由限定所述单元格的格子线的笔划长度计算的统计量,将降到第一参考值之下的格子线判断为所述第一格子线。
6.如权利要求1所述的设备,其特征在于,当笔划的数目和除了在所述第二区域中的所述格子线之外的笔划的总长度中的一个不小于第二参考值时,所述判断器判断在所述第二区域中的所述格子线是所述第二格子线。
7.如权利要求1所述的设备,其特征在于,基于在所述第二区域中的两条格子线的交点决定的两条线段的长度比率,所述判断器判断更短的线段是所述第一格子线。
8.如权利要求6所述的设备,其特征在于,所述判断器使用所述第二参考值将所述第二格子线的判断结果应用至共享格子线的另一个第二区域,并且判断在所述另一个第二区域中的格子线是所述第二格子线。
9.一种手写文档处理方法,其特征在于,包含:
输入笔划数据;
将所述笔划数据分类为多条格子线的数据和除格子线以外的笔划数据;
将包括所述多条格子线的区域划分为每个都对应于以四条格子线为界的单元格的第一区域和每个都包括最多三条格子线的第二区域;以及
判断在所述第二区域中的格子线是第一格子线还是第二格子线,其中,格子线不连接至所述第一格子线的一个端点,虚拟的外接格子线连接至所述第二格子线的一个端点。
10.一种记录介质,其存储用于控制计算机起下列作用的程序:
输入器,所述输入器输入笔划数据;
分类器,所述分类器将所述笔划数据分类为多条格子线的数据和除格子线以外的笔划数据;
分割器,所述分割器将包括所述多条格子线的区域划分为每个都对应于以四条格子线为界的单元格的第一区域和每个都包括最多三条格子线的第二区域;以及
判断器,所述判断器判断在所述第二区域中的格子线是第一格子线还是第二格子线,其中,格子线不连接至所述第一格子线的一个端点,虚拟的外接格子线连接至所述第二格子线的一个端点。
11.一种手写文档处理设备,其特征在于,包含:
处理器,用于输入笔划数据,将所述笔划数据分类为多条格子线的数据和除格子线以外的笔划数据,将包括所述多条格子线的区域划分为每个都对应于以四条格子线为界的单元格的第一区域和每个都包括最多三条格子线的第二区域,以及判断在所述第二区域中的格子线是第一格子线还是第二格子线,其中,格子线不连接至所述第一格子线的一个端点,虚拟的外接格子线连接至所述第二格子线的一个端点;以及
连接到所述处理器的存储器。
12.一种手写文档处理设备,其特征在于,包含:
输入器,所述输入器输入笔划数据;
分类器,所述分类器将所述笔划数据分类为多条格子线的数据和除格子线以外的笔划数据;
分割器,所述分割器将包括所述多条格子线的区域划分为每个都对应于以四条格子线为界的单元格的第一区域和每个都包括最多三条格子线的第二区域;以及
控制器,所述控制器控制显示器除去包括在所述第二区域中的小扩展以使得不显示所述小扩展。
13.一种手写文档处理设备,其特征在于,包含:
输入器,所述输入器输入笔划数据;
分类器,所述分类器将所述笔划数据分类为多条格子线的数据和除格子线以外的笔划数据;
分割器,所述分割器将包括所述多条格子线的区域划分为每个都对应于以四条格子线为界的单元格的第一区域和每个都包括最多三条格子线的第二区域;以及
显示器,所述显示器显示用于所述第二区域的虚拟的外接格子线。
CN201380043857.5A 2012-08-17 2013-08-16 手写文档处理设备和方法 Active CN104885095B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2012-180958 2012-08-17
JP2012180958A JP5783972B2 (ja) 2012-08-17 2012-08-17 手書き文書処理装置、方法およびプログラム
PCT/JP2013/072486 WO2014027703A2 (en) 2012-08-17 2013-08-16 Handwritten document processing apparatus and method

Publications (2)

Publication Number Publication Date
CN104885095A true CN104885095A (zh) 2015-09-02
CN104885095B CN104885095B (zh) 2018-09-25

Family

ID=49326817

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380043857.5A Active CN104885095B (zh) 2012-08-17 2013-08-16 手写文档处理设备和方法

Country Status (4)

Country Link
US (1) US9317493B2 (zh)
JP (1) JP5783972B2 (zh)
CN (1) CN104885095B (zh)
WO (1) WO2014027703A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110008923A (zh) * 2019-04-11 2019-07-12 网易有道信息技术(北京)有限公司 图像处理方法和训练方法、以及装置、介质、计算设备

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9286527B2 (en) 2014-02-20 2016-03-15 Google Inc. Segmentation of an input by cut point classification
US9927971B2 (en) 2014-12-05 2018-03-27 Kabushiki Kaisha Toshiba Electronic apparatus, method and storage medium for generating chart object
US10679049B2 (en) * 2017-09-29 2020-06-09 Konica Minolta Laboratory U.S.A., Inc. Identifying hand drawn tables

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1363230A1 (en) * 2002-05-14 2003-11-19 Microsoft Corporation Classification analysis of freeform digital ink input
CN101064007A (zh) * 2006-04-29 2007-10-31 北大方正集团有限公司 一种表格图像几何畸变的数字校正方法
CN101366020A (zh) * 2005-12-21 2009-02-11 微软公司 墨水笔记中的表格检测
CN101866335A (zh) * 2010-06-14 2010-10-20 深圳市万兴软件有限公司 一种文档转换中的表格处理方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0528258A (ja) * 1991-07-19 1993-02-05 Fuji Xerox Co Ltd 文字/図形分離装置付きフオーム入力装置
JPH0850650A (ja) 1994-08-03 1996-02-20 Nippon Digital Kenkyusho:Kk 図形清書化装置
JPH1166225A (ja) * 1997-08-25 1999-03-09 Ricoh Co Ltd 表情報抽出装置及び方法並びに記録媒体
US7412094B2 (en) * 2004-09-21 2008-08-12 Microsoft Corporation System and method for editing a hand-drawn table in ink input
US8719701B2 (en) * 2009-01-02 2014-05-06 Apple Inc. Identification of guides and gutters of a document

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1363230A1 (en) * 2002-05-14 2003-11-19 Microsoft Corporation Classification analysis of freeform digital ink input
CN101366020A (zh) * 2005-12-21 2009-02-11 微软公司 墨水笔记中的表格检测
CN101064007A (zh) * 2006-04-29 2007-10-31 北大方正集团有限公司 一种表格图像几何畸变的数字校正方法
CN101866335A (zh) * 2010-06-14 2010-10-20 深圳市万兴软件有限公司 一种文档转换中的表格处理方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110008923A (zh) * 2019-04-11 2019-07-12 网易有道信息技术(北京)有限公司 图像处理方法和训练方法、以及装置、介质、计算设备

Also Published As

Publication number Publication date
JP5783972B2 (ja) 2015-09-24
US20150154172A1 (en) 2015-06-04
WO2014027703A3 (en) 2014-04-10
WO2014027703A2 (en) 2014-02-20
JP2014038518A (ja) 2014-02-27
US9317493B2 (en) 2016-04-19
CN104885095B (zh) 2018-09-25

Similar Documents

Publication Publication Date Title
JP6069489B2 (ja) 物体認識装置および物体認識方法並びにプログラム
CN110909791B (zh) 一种相似图像识别方法及计算设备
US8751550B2 (en) Freeform mathematical computations
JP5717691B2 (ja) 手書き文字検索装置、方法及びプログラム
US9213897B2 (en) Image processing device and method
CN104885095A (zh) 手写文档处理设备和方法
US11822595B2 (en) Incremental agglomerative clustering of digital images
US11043027B2 (en) Three-dimensional graphics image processing
US20170212661A1 (en) 3D Model Generation from 2D Images
CN111492407B (zh) 用于绘图美化的系统和方法
CN108960012B (zh) 特征点检测方法、装置及电子设备
JP2020191057A (ja) レイアウト解析方法、読書補助装置、回路及び媒体
WO2016065551A1 (en) Whiteboard and document image detection method and system
CN115589786A (zh) 手绘图形识别方法、装置和系统,以及计算机可读存储介质
US11055887B2 (en) Modifying digital content with digital effects using facial skin mask
JP7511191B2 (ja) データ作成システム、学習システム、推定システム、処理装置、データ作成方法、及びプログラム
CN113516739B (zh) 一种动画处理方法、装置、存储介质及电子设备
CN109461198B (zh) 网格模型的处理方法及装置
CN112348069B (zh) 数据增强方法、装置、计算机可读存储介质及终端设备
CN111639573B (zh) 基于orb算法的手势识别方法、存储介质及电子设备
US20120299837A1 (en) Identifying contacts and contact attributes in touch sensor data using spatial and temporal features
CN110879957B (zh) 用于进行手分割的系统和方法
JP6072148B2 (ja) 手書き文書処理装置、方法およびプログラム
CN108182656B (zh) 一种图像处理方法及终端
US9569104B2 (en) Electronic device and scoring system and scoring method using same

Legal Events

Date Code Title Description
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190110

Address after: No. 6, 15, 5 Dingmu, Toyota, Tokyo, Japan

Patentee after: Toshiba terminal Solutions Ltd

Address before: Tokyo, Japan port area Zhi Pu Ding Ding 1, No. 1

Patentee before: Toshiba Corp