CN115398489A - 墨水数据的改正方法、信息处理装置及程序 - Google Patents

墨水数据的改正方法、信息处理装置及程序 Download PDF

Info

Publication number
CN115398489A
CN115398489A CN202180027543.0A CN202180027543A CN115398489A CN 115398489 A CN115398489 A CN 115398489A CN 202180027543 A CN202180027543 A CN 202180027543A CN 115398489 A CN115398489 A CN 115398489A
Authority
CN
China
Prior art keywords
ink data
data
character string
character
correcting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180027543.0A
Other languages
English (en)
Inventor
拉切扎尔·沙绍夫·多多夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wacom Co Ltd
Original Assignee
Wacom Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wacom Co Ltd filed Critical Wacom Co Ltd
Publication of CN115398489A publication Critical patent/CN115398489A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/171Editing, e.g. inserting or deleting by use of digital ink
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • G06F3/04883Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures for inputting data by handwriting, e.g. gesture or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/1801Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
    • G06V30/18076Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by analysing connectivity, e.g. edge linking, connected component analysis or slices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • G06V30/347Sampling; Contour coding; Stroke extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification
    • G06V30/387Matching; Classification using human interaction, e.g. selection of the best displayed recognition candidate

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

本发明的课题是能够自动地改正包含手写字符串的拼写错误的墨水数据。技术手段是,本发明的墨水数据的改正方法包括:步骤S2~S8,通过进行由墨水数据表示的手写字符串中包含的拼写错误的检测来决定墨水数据的改正方法;及步骤S10~S12,通过根据所决定的改正方法操作墨水数据来改正墨水数据。

Description

墨水数据的改正方法、信息处理装置及程序
技术领域
本发明涉及墨水数据的改正方法、信息处理装置及程序,尤其涉及表示字符串的墨水数据的改正方法以及实现这样的改正方法的信息处理装置及程序。
背景技术
随着支持利用手写笔的输入的信息处理装置(智能手机、平板终端、笔记本PC等)的增加,数字手写越来越受欢迎。如果使用数字手写,则能够实现以书写顺序的再现、将手写速度用作特征量的对照等在以往存在的纸上的手写中无法实现的情况。
在进行利用手写笔的输入的情况下,信息处理装置构成为生成包含1个以上的笔划数据的墨水数据。笔划数据是包含一系列的坐标的数据,该一系列的坐标表示在手写笔的笔尖与接触面接触后直到从接触面脱离为止的期间内的手写笔的指示位置的轨迹。例如,在用户通过手写笔输入字符串的情况下,信息处理装置按每个笔划生成笔划数据,并将其作为一系列的墨水数据保存在存储部内。这样生成的墨水数据最终成为表示用户输入的字符串的数据。在专利文献1中公开了这样的墨水数据的一例。
现有技术文献
专利文献
专利文献1:日本特开2019-036366号公报
发明内容
发明所要解决的课题
不过,在用户手写输入字符串时,有可能发生缺字、衍字、错字等拼写错误。这种拼写错误当然也反映在由墨水数据表示的字符串中,因此希望在由墨水数据表示的手写字符串中包含拼写错误的情况下,在信息处理装置侧自动地检测拼写错误,并改正墨水数据。
因此,本发明的目的之一在于提供能够自动地改正包含拼写错误的墨水数据的墨水数据的改正方法、信息处理装置及程序。
用于解决课题的技术方案
本发明的墨水数据的改正方法是与手写字符串对应的墨水数据的改正方法,包括如下步骤:决定步骤,通过进行由墨水数据表示的手写字符串中包含的拼写错误的检测,来决定所述墨水数据的改正方法;及改正步骤,通过根据所述改正方法操作所述墨水数据来改正所述墨水数据。
本发明的信息处理装置包括:改正方法决定部,通过进行由墨水数据表示的手写字符串中包含的拼写错误的检测来决定所述墨水数据的改正方法;及改正操作部,通过根据所述改正方法操作所述墨水数据来改正所述墨水数据。
本发明的程序用于使信息处理装置作为如下各部发挥功能:改正方法决定部,通过进行由墨水数据表示的手写字符串中包含的拼写错误的检测来决定所述墨水数据的改正方法;及改正操作部,通过根据所述改正方法操作所述墨水数据来改正所述墨水数据。
发明效果
根据本发明,能够自动地改正与包含拼写错误的手写字符串对应的墨水数据。
附图说明
图1是表示本发明的实施方式的平板终端1的结构及使用状态的一例的图。
图2是表示平板终端1的内部结构的图。
图3是表示主处理器10的功能块及存储在存储部11中的数据的图。
图4是表示拼写错误检测部20b执行的处理的一例的图。
图5是说明用于改正缺字的墨水数据的操作的图。
图6是说明用于改正衍字的墨水数据的操作的图。
图7是说明用于改正错字的墨水数据的操作的图。
图8是表示由主处理器10执行的墨水数据改正处理的整体流程的流程图。
图9是表示图8所示的字符追加处理的详细内容的流程图。
图10是表示图8所示的字符删除处理的详细内容的流程图。
图11是表示图8所示的字符替换处理的详细内容的流程图。
图12是表示本发明的实施方式的变形例的主处理器10的功能块及存储在存储部11中的数据的图。
具体实施方式
以下,参照附图对本发明的实施方式详细地进行说明。
图1是表示本发明的实施方式的平板终端1的结构及使用状态的一例的图。平板终端1是应对利用手写笔P进行的输入的信息处理装置,构成为具有兼作显示面和接触面的面板面2。利用手写笔P进行的输入的方式没有限定,例如,可以适当地利用主动静电方式(AES)或电磁感应方式(EMR)等。以下,以利用主动静电方式为前提继续进行说明。
图2是表示平板终端1的内部结构的图。如该图所示,平板终端1构成为具有主处理器10、存储部11、显示器12、接触传感器13及传感器控制器14。
主处理器10是平板终端1的中央处理装置,通过执行存储在存储部11中的程序,起到执行平板终端1的操作系统、描绘软件等各种应用程序等的作用。在描绘软件中包括如下功能:在存储部11内生成用于保存墨水数据的文件的功能;根据在后述的从落笔到抬笔之间从传感器控制器14逐次供给的坐标及数据生成笔划数据,逐次进行绘制并显示在显示器12上,并且将生成的笔划数据作为一系列的墨水数据相互关联地写入存储部内的功能;及从存储部11取出已生成的墨水数据,进行绘制并显示在显示器12上的功能。
存储部11构成为包括例如由DRAM(Dynamic Random Access Memory:动态随机存取存储器)构成的主存储装置、例如由闪存或硬盘构成的辅助存储装置。在存储部11中,除了预先保存由主处理器10执行的程序之外,还存储由主处理器10利用或生成的各种数据。在该数据中,除了上述的墨水数据之外,还包含平板终端1的识别信息、用于登录上述的操作系统或各种应用程序的登录信息等。
显示器12是视觉上输出主处理器10的处理的结果的装置,例如由液晶显示器或有机EL显示器构成。
接触传感器13是具有配置在图1所示的面板面2整体上的多个传感器电极的装置。多个传感器电极包括分别沿Y方向延伸的多个X电极、和分别沿X方向延伸的多个Y电极。也可以将配置在显示器12内的共同电极用作多个X电极,将这样构成的情况下的平板终端1称为“内嵌式”。
传感器控制器14是利用接触传感器13来进行面板面2内的手写笔P及手指的位置的检测及手写笔P发送的数据的接收的集成电路。从手写笔P接收的数据包括表示施加到手写笔P的笔尖的压力的笔压值、预先分配给各个手写笔P的笔ID等。其中,关于笔压值,传感器控制器14构成为基于从手写笔P接收到的笔压值来检测手写笔P与面板面2的接触(落笔)及手写笔P从面板面2脱离(抬笔)。传感器控制器14将表示检测到的位置的坐标、接收到的数据及落笔或抬笔的信息逐次供给到主处理器10。
在主处理器10中执行的描绘软件构成为,基于从传感器控制器14供给的各种数据生成笔划数据,并与预先生成的一系列的墨水数据相关联地保存在存储部11中。特别地,关于由手写笔P进行的输入,描绘软件构成为,通过将从落笔到抬笔之间从传感器控制器14供给的一系列的坐标及笔压值以时间序列配置来生成笔划数据,并与表示输入了该笔划数据的用户的用户信息相对应地,与一系列的墨水数据相关联地进行保存。用户信息的具体的内容可以是从传感器控制器14供给的笔ID,也可以是平板终端1的识别信息,也可以是操作系统或描绘应用程序的登录信息。
描绘软件还构成为,从存储部11取出已生成的墨水数据并进行绘制,显示在显示器12上。在该绘制中,为了对一系列的坐标之间的坐标进行补充,例如使用catmull-rom曲线等规定的插值曲线。另外,为了控制线宽或透明度而利用笔压值。
返回图1。该图所示的“patent aplication”的字符串是由墨水数据表示的手写字符串的一例。本实施方式的平板终端1的特征在于自动地检测这样的手写字符串中包含的拼写错误,并基于该结果自动地改正墨水数据这方面。以下,对这方面详细地进行说明。
图3是表示主处理器10的功能块及存储于存储部11中的数据的图。该图仅示出了与上述特征相关的部分。
如图3所示,主处理器10构成为在功能上具有改正方法决定部20及改正操作部21。其中,改正方法决定部20包括字符识别处理部20a及拼写错误检测部20b。此外,改正方法决定部20及改正操作部21优选作为功能之一安装在上述的描绘软件中。另外,在存储部11中保存有墨水数据库30、标准图案数据库31及单词辞典数据库32。
墨水数据库30是蓄积由主处理器10生成的墨水数据的数据库。在墨水数据库30中,不仅可以蓄积由平板终端1的主处理器10示出的墨水数据,还可以蓄积由其他信息处理装置的主处理器生成的墨水数据。
改正方法决定部20是通过进行由保存在墨水数据库30中的墨水数据表示的字符串中包含的拼写错误的检测来决定该墨水数据的改正方法的功能部。作为拼写错误检测的对象的墨水数据例如由用户指定。作为具体的处理,改正方法决定部20首先使用字符识别处理部20a执行字符识别处理,由此取得表示由作为处理对象的墨水数据表示的字符串的文本数据。接下来,改正方法决定部20使用拼写错误检测部20b进行所取得的文本数据中包含的拼写错误的检测。然后,最后基于检测到的拼写错误的内容决定墨水数据的改正方法。以下,详细地进行说明。
字符识别处理部20a是通过使用标准图案数据库31进行与所谓的OCR(OpticalCharacter Recognition:光学字符识别)同样的处理来执行字符识别处理的功能部。具体而言,当输入墨水数据时,字符识别处理部20a首先分析其布局,进行行及字符(包括空格)的切出。接下来,字符识别处理部20a从切出的各字符中进行特征值的提取。
标准图案数据库31中预先保存上述特征值的每个字符的标准图案。从切出的各字符提取了特征值的字符识别处理部20a通过将提取出的特征值与标准图案数据库31内的标准图案进行对照,对每个切出的字符选择1个字符。字符识别处理部20a将这样选择的一系列的字符作为表示由作为处理对象的墨水数据表示的字符串的文本数据输出。
在此,从字符识别处理部20a输出的文本数据优选与作为处理对象的墨水数据相对应地保存在墨水数据库30内。由此,在改正操作部21从墨水数据库30取得后述的追加笔划数据组时,能够基于与各墨水数据相对应地保存的文本数据来决定要取得的追加笔划数据组。
接着,拼写错误检测部20b是使用预先保存有由1个以上的字符的组合构成的单词的数据的单词辞典数据库32来检测从字符识别处理部20a输出的文本数据中包含的拼写错误的功能部。具体而言,拼写错误检测部20b首先将从字符识别处理部20a输出的文本数据按每个单词进行分割。如果是英语那样的进行分写的语言,则该分割只要基于字符间的空格进行即可。另一方面,在日语那样的不进行分写的语言的情况下,通过进行基于保存在单词辞典数据库32内的单词的知识处理来提取单词,并基于其结果进行分割即可。
拼写错误检测部20b接着对于通过分割得到的1个以上的单词分别判定单词辞典数据库32内是否存在一致或类似的单词。在此,2个单词类似是指例如单词间的莱文斯坦距离或雅罗-温克勒距离为规定值以下。在关于某单词而存在一致的单词的情况下,拼写错误检测部20b得出该单词不包含拼写错误的结论。另外,在关于某单词而不存在一致的单词及类似的单词的任一种的情况下,则拼写错误检测部20b得出该单词中不包含拼写错误的结论。该结论是由于认为是固有名词等辞典中未登载的单词的可能性较高。另一方面,在关于某单词而不存在一致的单词但存在类似的单词的情况下,拼写错误检测部20b得出该单词中包含拼写错误的结论。
图4是表示拼写错误检测部20b执行的上述处理的一例的图。图4的(a)表示墨水数据,图4的(b)表示基于图4的(a)的墨水数据从字符识别处理部20a输出的文本数据。在图4的(b)中,还示出作为上述的文本数据的分割的结果而得到的单词的定界符100。图4的(c)表示拼写错误检测部20b针对由定界符100分割的图4的(b)的文本数据的各部分从单词辞典数据库32内发现的单词。
如图4的(c)所示,对于文本数据中“patent”的部分,从单词辞典数据库32中发现了完全一致的单词“patent”。因此拼写错误检测部20b得出单词“patent”中不包含拼写错误的结论。另一方面,对于文本数据中“aplication”的部分,从单词辞典数据库32中未发现完全一致的单词,发现了类似的单词“application”。因此拼写错误检测部20b得出单词“aplication”中包含拼写错误的结论。
返回图3。由拼写错误检测部20b检测到的拼写错误中可能存在缺字、衍字、错字这3种。缺字是缺少必要的字符的拼写错误,衍字是混入不必要的字符的拼写错误,错字是将必要的字符替换为其他的字符的拼写错误。改正方法决定部20根据这些拼写错误的检测结果来决定墨水数据的改正方法。这样决定的改正方法在缺字的情况下是字符的追加,在衍字的情况下是字符的删除,在错字的情况下是字符的替换。
接下来,改正操作部21是通过基于由改正方法决定部20决定的改正方法操作墨水数据来改正墨水数据的功能部。以下,参照图5~图7,对改正操作部21进行的处理详细地进行说明。
图5是说明用于改正缺字的墨水数据的操作的图。图5的(a)中示出作为处理对象的墨水数据的一例。该例的墨水数据是图4中也示出的“patent aplication”,与用正确的拼写书写的“patent application”相比,缺少1个“p”。
由接受了图5的(a)的墨水数据的输入的改正方法决定部20决定的改正方法例如在“aplication”内的“p”与“l”之间追加“p”。改正操作部21首先从图3所示的墨水数据库30选择由与输入了作为处理对象的墨水数据的用户相同的用户输入的1个以上的墨水数据。此外,这里选择的墨水数据可以包括作为当前处理的对象的墨水数据。然后,改正操作部21从所选择的1个以上的墨水数据中取得表示作为追加对象的字符即“p”的1个以上的笔划数据。以下,将这样取得的1个以上的笔划数据称为“追加笔划数据组”。图5的(c)所示的字符101表示这样取得的追加笔划数据组。
接下来,改正操作部21根据构成作为处理对象的墨水数据的各字符的尺寸及作为追加对象的字符的内容来决定作为追加对象的字符101的宽度X。然后,在由作为处理对象的墨水数据表示的多个字符中,选择在与作为追加对象的字符101的插入部分相同的行内位于右侧的字符,根据所决定的宽度X,使所选择的1个以上的字符向右侧移动。具体而言,对与作为移动对象的字符对应的笔划数据中包含的一系列的坐标的每一个,进行将移动距离量的数值相加的处理,以使所选择的1个以上的字符向右侧移动与宽度X对应的距离。此外,基于该操作的各笔划数据的具体的移动距离例如如图5的(b)所示,只要设为宽度X加上规定的调整值α的距离即可。但是,调整值α可以是正的值,也可以是负的值,也可以是零。
接着,改正操作部21调整构成追加笔划数据组的一系列的坐标的值,以使追加了追加笔划数据组的墨水数据的绘制结果自然。具体而言,调整构成追加笔划数据组的一系列的坐标的值,使得作为对追加笔划数据组进行绘制的结果而显示的字符“p”在由改正方法决定部20决定的位置以先前决定的宽度X显示。另外,改正操作部21也可以调整构成墨水数据的文件内的追加笔划数据组的插入位置,以使自动再现墨水数据的情况下的再现顺序自然。执行了调整的改正操作部21通过将调整后的追加笔划数据组追加到墨水数据中,结束墨水数据的操作。
在此,在图5的例字那样的英语的情况下,使位于插入追加笔划数据组的部分的右侧的一系列的笔划数据向右侧移动,但根据语言及其书写方法,可以采用与其不同的方法。例如,在如阿拉伯语那样从左向右书写的语言中,使位于插入追加笔划数据组的部分的左侧的一系列的笔划数据向左侧移动。另外,在纵向书写的日语中,使位于插入追加笔划数据组的部分的下侧的一系列的笔划数据向下侧移动。
图6是说明用于改正衍字的墨水数据的操作的图。在图6的(a)中表示该例的作为处理对象的墨水数据。该墨水数据是“patent appllication”,与以正确拼写书写的“patent application”相比,追加了不需要的1个“l”。在图6的(a)中,字符102相当于该“l”。
由接受了图6的(a)的墨水数据的输入的改正方法决定部20决定的改正方法删除1个“appllication”内的“l”。改正操作部21首先取得作为处理对象的墨水数据中的作为删除对象的字符“l”的宽度Y。然后,如图6的(b)所示,从构成墨水数据的多个笔划数据中删除与作为删除对象的字符“l”对应的1个以上的笔划数据。
之后,改正方法决定部20在由作为处理对象的墨水数据表示的多个字符中,选择在与删除的字符“l”相同的行内位于一侧(在图6的例子中为右侧)的字符,基于宽度Y使所选择的1个以上的字符向左侧移动。具体而言,进行从与作为移动对象的字符对应的笔划数据中包含的一系列的坐标分别减去移动距离的量的数值的处理,以使所选择的1个以上的字符向左侧移动与宽度Y对应的距离。此外,基于该操作的各字符的具体的移动距离例如如图6的(b)所示,只要设为宽度Y加上规定的调整值β的距离即可。但是,调整值β可以是正的值,也可以是负的值,也可以是零。改正操作部21通过到此为止的处理来完成墨水数据的操作。
在此,在图6的例子那样的英语的情况下,使位于删除的字符的右侧的笔划数据向左侧移动,但根据语言及其书写方法,可以采用与其不同的方法。例如,在如阿拉伯语那样从左向右书写的语言中,使位于删除的字符的左侧的笔划数据向右侧移动。另外,在纵向书写的日语中,使位于删除的字符的下侧的笔划数据向上侧移动。
图7是说明用于改正错字的墨水数据的操作的图。在图7的(a)中表示该例的作为处理对象的墨水数据。该墨水数据是“patent applecation”,与以正确拼写书写的“patentapplication”相比,将“appl”后的“i”替换成了“e”。在图7的(a)中,字符103相当于该“e”。
由接受了图7的(a)的墨水数据的输入的改正方法决定部20决定的改正方法将“applecation”内的“e”替换为“i”。首先,接受了该决定的改正操作部21首先如图7的(a)~图7的(c)所示,将“e”作为删除对象,执行与参照图6说明的操作同样的墨水数据的操作。接着,改正操作部21如图7的(c)~图7的(e)所示,执行与参照图5说明的操作同样的墨水数据的操作,以在“l”与“c”之间追加“i”。
作为执行这些操作的结果,如图7的(e)所示,实现“applecation”内的“e”向“i”的替换。这样,用于改正错字的墨水数据的操作由用于改正衍字的墨水数据的操作和用于改正缺字的墨水数据的操作的组合构成。
接下来,对于以上说明的主处理器10的处理,通过参照主处理器10的处理流程,从其他观点再次详细地进行说明。
图8是表示由主处理器10执行的墨水数据改正处理的整体流程的流程图。如该图所示,首先,主处理器10首先从墨水数据库30中取得墨水数据(步骤S1),执行字符识别处理(步骤S2)。该字符识别处理的详细内容如上所述。
接着,主处理器10按每个单词对通过字符识别处理得到的文本数据进行分割(步骤S3)。该分割处理的详细内容如上所述。之后,主处理器10对于通过步骤S3的分割得到的文本数据内的各单词,执行步骤S5~S13的处理(步骤S4)。
具体而言,主处理器10首先判定在图3所示的单词辞典数据库32内是否存在一致的单词(步骤S5)。其结果,如果存在,则主处理器10得出没有拼写错误的结论并将处理转移到下一个单词。另一方面,如果不存在,则主处理器10进一步判定在单词辞典数据库32内是否存在类似的单词(步骤S6)。这里所说的类似的意思如上所述。在步骤S6中判定为不存在的情况下,主处理器10得出没有拼写错误的结论而将处理转移到下一个单词。另一方面,判定为存在的情况下的主处理器10通过将处理对象的单词与单词辞典数据库32内的类似单词进行比较,由此来检测处理对象的单词中包含的拼写错误的内容(步骤S7)。如上所述,这样检测到的拼写错误中可能包含缺字、衍字、错字这3种。
接下来,主处理器10根据在步骤S7中检测到的拼写错误的内容来决定墨水数据的改正方法(步骤S8)。在此,在步骤S7中检测到的拼写错误的内容不限于仅1个。在1个单词中包含多个拼写错误的情况下,主处理器10选择其中的1个,决定用于改正所选择的拼写错误的改正方法。
接着,主处理器10判定在步骤S8中决定的改正方法是字符的追加、字符的删除、字符的替换中的哪一个(步骤S9)。其结果,如果是字符的追加,则执行字符追加处理(步骤S10),如果是字符的删除,则执行字符删除处理(步骤S11),如果是字符的替换,则执行字符替换处理(步骤S12)。对于各自的详细内容,将在后面参照图9~图11详细地进行说明。
完成了步骤S10~S12中的任一个的主处理器10判定是否完成了处理对象的单词中包含的所有的拼写错误的改正(步骤S13),在判定为未完了的情况下,返回步骤S8对剩余的拼写错误进行改正。另一方面,判定为完成的主处理器10将处理转移到下一个单词。在对通过步骤S3的分割得到的文本数据内的各单词全部结束了处理的情况下,主处理器10结束墨水数据改正处理。
图9是表示图8所示的字符追加处理(步骤S10)的详细内容的流程图。执行该处理的主处理器10首先从墨水数据库30内选择由与作为处理对象的墨水数据(在图8的步骤S1中取得的墨水数据)相同的用户生成的1个以上的墨水数据,从所选择的1个以上的墨水数据中取得上述的追加笔划数据组(步骤S20)。
接下来,主处理器10根据构成作为处理对象的墨水数据的各字符的尺寸及作为追加对象的字符的内容来决定作为追加对象的字符的宽度X(步骤S21)。接着,主处理器10在由作为处理对象的墨水数据表示的多个字符中,选择在与作为追加对象的字符的插入部分相同的行内位于右侧的字符(步骤S22),对墨水数据进行操作,以使所选择的1个以上的字符向右侧移动与宽度X对应的距离(具体而言,图5所示的距离X+α)(步骤S23)。该操作的详细内容如上所述。
接下来,主处理器10调整构成追加笔划数据组的一系列的坐标的值,以使追加了追加笔划数据组的墨水数据的绘制结果自然(步骤S24)。该调整处理的详细内容如上所述。之后,主处理器10将调整后的追加笔划数据组追加到墨水数据中(步骤S25),结束字符追加处理。
图10是表示图8所示的字符删除处理(步骤S11)的详细内容的流程图。执行该处理的主处理器10首先导出作为处理对象的墨水数据中的作为删除对象的字符的宽度Y(步骤S30)。之后,主处理器10从作为处理对象的墨水数据中删除与作为删除对象的字符对应的1个以上的笔划数据(步骤S31)。
接下来,主处理器10在由作为处理对象的墨水数据表示的多个字符中,选择在与删除的字符相同的行内位于右侧的字符(步骤S32)。然后,对作为处理对象的墨水数据进行操作,以使所选择的1个以上的字符向左侧移动与宽度Y对应的距离(具体而言,图6所示的距离Y+β)(步骤S33)。该操作的详细内容如上所述。主处理器10通过完成步骤S33来结束字符删除处理。
图11是表示图8所示的字符替换处理(步骤S12)的详细内容的流程图。如该图所示,该处理是字符删除处理与字符追加处理的组合。具体而言,主处理器10首先将错误的字符作为删除对象,执行图10所示的字符删除处理(步骤S40)。由此,从作为处理对象的墨水数据删除错误的字符,填充由删除产生的空格。接下来,主处理器10执行图9所示的字符追加处理,以在删除了错误的字符的位置追加正确的字符(步骤S41)。由此,在作为处理对象的墨水数据的删除了错字的位置插入正确的字符。主处理器10在完成步骤S41后,结束字符替换处理。
如上所述,根据本实施方式的墨水数据的改正方法、信息处理装置及程序,能够自动地检测由墨水数据表示的字符串中包含的拼写错误,并基于其结果,对墨水数据进行改正。因此,能够自动地改正包含拼写错误的墨水数据。
另外,在进行追加字符的改正的情况下,由于从由与输入了作为处理对象的墨水数据的用户相同的用户过去输入的墨水数据中取得追加笔划数据组,因此能够防止笔迹与其他部分不同的字符混入墨水数据。
而且,在为了使追加了追加笔划数据组的墨水数据的绘制结果自然而调整构成追加笔划数据组的一系列的坐标的值后,在墨水数据中追加追加笔划数据组,因此在改正后也能得到自然的绘制结果。
以上,对本发明的优选实施方式进行了说明,但本发明并不限定于这样的实施方式,本发明在不脱离其主旨的范围内当然能够以各种方式实施。
例如,在图3中,说明了从墨水数据库30中选择由与输入了作为处理对象的墨水数据的用户相同的用户输入的1个以上的墨水数据的情况,但从墨水数据库30选择的墨水数据不一定是由相同的用户输入的墨水数据。
另外,说明了在图3所示的改正方法决定部20中,通过使用字符识别处理部20a执行字符识别处理来取得表示由作为处理对象的墨水数据表示的字符串的文本数据的情况,但不一定需要取得文本数据。即,在改正方法决定部20中,也可以通过使用字符识别处理部20a执行字符识别处理,对由作为处理对象的墨水数据表示的手写字符串的尺寸、倾斜等进行校正,由此进行手写字符串的标准化,并且在存储部11中代替文本数据而预先登记标准化的手写字符串,由此,以手写字符串自身为对象,在改正方法决定部20使用拼写错误检测部20b来进行所取得的手写字符串中包含的拼写错误的检测。
图12是表示如上述那样构成的上述实施方式的变形例的主处理器10的功能块及存储在存储部11中的数据的图。如该图所示,本变形例的主处理器10具有字符识别处理部20c来代替字符识别处理部20a,具有拼写错误检测部20d来代替拼写错误检测部20b。另外,存储部11具有手写字符串数据库33来代替单词辞典数据库32。
手写字符串数据库33是存储标准化的手写字符串的数据库。手写字符串数据库33构成为针对尽可能多的单词存储手写字符串的实例。
字符识别处理部20c通过对作为拼写错误检测的对象的墨水数据执行字符识别处理来进行字符串的标准化。具体而言,字符识别处理部20c首先通过进行与字符识别处理部20a同样的处理来切出行及字符,并针对每一个切出的字符选择1个字符。然后,对切出的字符进行整形,以使所选择的字符的形状接近期待的形状(即,手写字符串数据库33中存储的字符的形状)。如上所述,该整形包括倾斜的校正等。另外,调整整形后的各字符的尺寸,以使切出的各字符的尺寸例如彼此相等。
拼写错误检测部20d通过将从字符识别处理部20c输出的整形后的手写字符串与手写字符串数据库33中登记的手写字符串进行比较来检测拼写错误。具体而言,拼写错误检测部20d首先将从字符识别处理部20c输出的手写字符串按照每个单词进行分割。该处理可以是与拼写错误检测部20b进行的文本数据的分割同样的处理。然后,对于通过分割得到的1个以上的单词,分别判定在手写字符串数据库33内是否存在一致或类似的手写字符串。在对于某单词存在一致的手写字符串的情况下,拼写错误检测部20d得出该单词中不包含拼写错误的结论。另外,在对于某单词均不存在一致的手写字符串及类似的手写字符串的情况下,拼写错误检测部20d也得出该单词中不包含拼写错误的结论。另一方面,在对于某单词不存在一致的手写字符串但存在类似的手写字符串的情况下,拼写错误检测部20d得出该单词中包含拼写错误的结论。接受了该结论的改正方法决定部20及改正操作部21的处理如在上述实施方式中说明的处理那样。
这样,根据本变形例,即使不取得文本数据,也能够与上述实施方式同样地自动地改正包含拼写错误的墨水数据。
另外,在手写字符串中,例如如英语的书写体那样,存在前后的字符连接的情况。因此,改正操作部21也可以在将追加笔划数据组追加到墨水数据时,决定追加后应该连接的2个笔划数据,以所决定的2个笔划数据变成连接的方式,使该2个笔划数据的一方或双方的形状(包括位置及/或粗细)改变。同样地,也可以在删除1个以上的笔划数据并使在与删除的字符相同的行内位于一侧的字符向另一侧移动时,决定进行移动操作后应该连接的2个笔划数据,以使所决定的2个笔划数据变成连接的方式,使该2个笔划数据的一方或双方的形状(包括位置及/或粗细)改变。由此,能够实现使前后的字符连接的连续的笔划。
另外,图3所示的墨水数据库30、标准图案数据库31及单词辞典数据库32、图12所示的手写字符串数据库33中的至少一个数据库也可以是经由网络与主处理器10连接的结构。
而且,例如,也可以使用云计算技术经由网络来执行图3所示的主处理器10进行的处理的一部分或全部。
标号说明
1 平板终端
2 面板面
10 主处理器
11 存储部
12 显示器
13 接触传感器
14 传感器控制器
20 改正方法决定部
20a、20c 字符识别处理部
20b、20d 拼写错误检测部
21 改正操作部
30 墨水数据库
31 标准图案数据库
32 单词辞典数据库
33 手写字符串数据库
101 作为追加对象的字符
102 作为删除对象的字符
103 替换对象的字符
P 手写笔
X、Y 宽度
α、β 调整值

Claims (17)

1.一种与手写字符串对应的墨水数据的改正方法,包括如下步骤:
决定步骤,通过进行由墨水数据表示的手写字符串中包含的拼写错误的检测,来决定所述墨水数据的改正方法;及
改正步骤,通过根据所述改正方法操作所述墨水数据来改正所述墨水数据。
2.根据权利要求1所述的与手写字符串对应的墨水数据的改正方法,其中,
所述决定步骤通过执行字符识别处理来取得表示所述手写字符串的文本数据,并通过进行该文本数据中包含的拼写错误的检测来进行所述手写字符串中包含的拼写错误的检测。
3.根据权利要求1所述的与手写字符串对应的墨水数据的改正方法,其中,
所述决定步骤通过执行字符识别处理来进行所述手写字符串的标准化,并通过与预先登记的手写字符串进行比较来进行所述手写字符串中包含的拼写错误的检测。
4.根据权利要求1至3中任一项所述的与手写字符串对应的墨水数据的改正方法,其中,
所述改正方法是字符的追加,
由所述改正步骤进行的所述墨水数据的操作包括向构成所述墨水数据的多个笔划数据追加1个以上的笔划数据的操作,该1个以上的笔划数据表示作为追加对象的字符。
5.根据权利要求4所述的与手写字符串对应的墨水数据的改正方法,其中,
所述改正步骤从由输入了所述墨水数据的用户输入的1个以上的墨水数据中取得1个以上的笔划数据,该1个以上的笔划数据表示所述作为追加对象的字符。
6.根据权利要求5所述的与手写字符串对应的墨水数据的改正方法,其中,
由所述改正步骤进行的所述墨水数据的操作包括如下操作:用于决定所述作为追加对象的字符的宽度,并根据所决定的所述宽度使构成所述手写字符串的多个字符中位于插入所述作为追加对象的字符的部分的一侧的字符向该一侧移动的操作。
7.根据权利要求4至6中任一项所述的与手写字符串对应的墨水数据的改正方法,其中,
由所述改正步骤进行的所述墨水数据的操作包括如下操作:决定追加1个以上的笔划数据后应该连接的2个笔划数据,以使所决定的2个笔划数据变成连接的方式使该2个笔划数据的一方或双方的形状改变的操作。
8.根据权利要求1至3中任一项所述的与手写字符串对应的墨水数据的改正方法,其中,
所述改正方法是字符的删除,
由所述改正步骤进行的所述墨水数据的操作包括如下操作:从构成所述墨水数据的多个笔划数据中删除与作为删除对象的字符对应的1个以上的笔划数据的操作。
9.根据权利要求8所述的与手写字符串对应的墨水数据的改正方法,其中,
由所述改正步骤进行的所述墨水数据的操作包括如下操作:用于根据所述作为删除对象的字符的宽度,使构成所述手写字符串的多个字符中位于删除了的所述作为删除对象的字符的一侧的字符向另一侧移动的操作。
10.根据权利要求9所述的与手写字符串对应的墨水数据的改正方法,其中,
由所述改正步骤进行的所述墨水数据的操作包括如下操作:决定进行用于所述移动的操作后应该连接的2个笔划数据,并以使决定的2个笔划数据变成连接的方式使该2个笔划数据的一方或双方的形状改变的操作。
11.根据权利要求1至3中任一项所述的与手写字符串对应的墨水数据的改正方法,其中,
所述改正方法是字符的替换,
由所述改正步骤进行的所述墨水数据的操作包括如下操作:
从构成所述墨水数据的多个笔划数据中删除与错误的字符对应的1个以上的笔划数据的操作;及
向构成所述墨水数据的多个笔划数据追加表示正确的字符的1个以上的笔划数据的操作。
12.根据权利要求11所述的与手写字符串对应的墨水数据的改正方法,其中,
所述改正步骤从由输入了所述墨水数据的用户输入的1个以上的墨水数据中取得表示所述正确的字符的1个以上的笔划数据。
13.根据权利要求12所述的与手写字符串对应的墨水数据的改正方法,其中,
由所述改正步骤进行的所述墨水数据的操作包括如下操作:
用于根据所述错误的字符的宽度,使构成所述手写字符串的多个字符中位于删除了的所述错误的字符的一侧的字符向另一侧移动的操作;及
用于决定所述正确的字符的宽度,并根据所决定的所述宽度使构成所述手写字符串的多个字符中位于插入所述正确的字符的部分的一侧的字符向该一侧移动的操作。
14.一种信息处理装置,包括:
改正方法决定部,通过进行由墨水数据表示的手写字符串中包含的拼写错误的检测来决定所述墨水数据的改正方法;及
改正操作部,通过根据所述改正方法操作所述墨水数据来改正所述墨水数据。
15.根据权利要求14所述的信息处理装置,其中,
所述改正方法决定部通过执行字符识别处理来取得表示所述手写字符串的文本数据,并通过进行所述文本数据中包含的拼写错误的检测来进行所述墨水数据中包含的拼写错误的检测。
16.一种程序,用于使信息处理装置作为如下各部发挥功能:
改正方法决定部,通过进行由墨水数据表示的手写字符串中包含的拼写错误的检测来决定所述墨水数据的改正方法;及
改正操作部,通过根据所述改正方法操作所述墨水数据来改正所述墨水数据。
17.根据权利要求16所述的程序,其中,
所述改正方法决定部通过执行字符识别处理来取得表示所述手写字符串的文本数据,并通过进行该文本数据中包含的拼写错误的检测来进行所述墨水数据中包含的拼写错误的检测。
CN202180027543.0A 2020-04-27 2021-02-18 墨水数据的改正方法、信息处理装置及程序 Pending CN115398489A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2020078718 2020-04-27
JP2020-078718 2020-04-27
PCT/JP2021/006084 WO2021220589A1 (ja) 2020-04-27 2021-02-18 インクデータの修正方法、情報処理装置、及びプログラム

Publications (1)

Publication Number Publication Date
CN115398489A true CN115398489A (zh) 2022-11-25

Family

ID=78331937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180027543.0A Pending CN115398489A (zh) 2020-04-27 2021-02-18 墨水数据的改正方法、信息处理装置及程序

Country Status (5)

Country Link
US (1) US20220415070A1 (zh)
EP (1) EP4105823A4 (zh)
JP (1) JPWO2021220589A1 (zh)
CN (1) CN115398489A (zh)
WO (1) WO2021220589A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022030150A (ja) * 2020-08-06 2022-02-18 株式会社リコー 情報処理装置、情報処理方法、情報処理プログラム、情報処理システム

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5412771A (en) * 1992-02-07 1995-05-02 Signature Software, Inc. Generation of interdependent font characters based on ligature and glyph categorizations
JPH0877297A (ja) * 1994-09-06 1996-03-22 Matsushita Electric Ind Co Ltd 携帯端末装置
US7227993B2 (en) * 2003-01-27 2007-06-05 Microsoft Corporation Learning-based system and process for synthesizing cursive handwriting
JP2005190199A (ja) * 2003-12-25 2005-07-14 Seiko Epson Corp 手書き文字入力表示装置及び手書き文字入力表示方法ならびにそのプログラム
US7561740B2 (en) * 2004-12-10 2009-07-14 Fuji Xerox Co., Ltd. Systems and methods for automatic graphical sequence completion
US7567711B2 (en) * 2005-08-01 2009-07-28 Microsoft Corporation Cleaning up of handwriting intra-stroke and inter-stroke overtracing
CN101930545A (zh) * 2009-06-24 2010-12-29 夏普株式会社 手写识别方法和设备
US9880990B2 (en) * 2013-03-14 2018-01-30 Microsoft Technology Licensing, Llc Leveraging previous instances of handwriting for handwriting beautification and other applications
US10387721B2 (en) * 2013-07-17 2019-08-20 Lenovo (Singapore) Pte. Ltd. Information handling device handwriting clean-up
JP6043019B2 (ja) 2013-11-19 2016-12-14 株式会社ワコム インクデータの生成、インクデータのレンダリング、インクデータの操作、及び、インクデータの伝達のための方法及びシステム
US10387034B2 (en) * 2015-09-03 2019-08-20 Microsoft Technology Licensing, Llc Modifying captured stroke information into an actionable form
JP2018049502A (ja) * 2016-09-23 2018-03-29 株式会社Nttドコモ 情報処理装置
US10783323B1 (en) * 2019-03-14 2020-09-22 Michael Garnet Hawkes Analysis system

Also Published As

Publication number Publication date
JPWO2021220589A1 (zh) 2021-11-04
WO2021220589A1 (ja) 2021-11-04
EP4105823A4 (en) 2023-08-09
EP4105823A1 (en) 2022-12-21
US20220415070A1 (en) 2022-12-29

Similar Documents

Publication Publication Date Title
US7349576B2 (en) Method, device and computer program for recognition of a handwritten character
US5454046A (en) Universal symbolic handwriting recognition system
CN105229574A (zh) 减少基于触摸的键盘的错误率
JPH11328312A (ja) 手書き漢字認識方法および装置
JPH05324903A (ja) パターン認識装置
KR20140089915A (ko) 필기 문자 조정 방법 및 장치
CN114730241B (zh) 触摸式用户界面输入中的手势笔画识别
US20220415070A1 (en) Ink data modification method, information processing device, and program thereof
US20050276480A1 (en) Handwritten input for Asian languages
WO2016119146A1 (en) Method and device for inputting handwriting character
US10049107B2 (en) Non-transitory computer readable medium and information processing apparatus and method
CN115004262B (zh) 处理手写中列表的方法和计算装置
US10127478B2 (en) Electronic apparatus and method
US20180032244A1 (en) Input control device, input control method, character correction device, and character correction method
JP2010026718A (ja) 文字入力装置および方法
JP2761679B2 (ja) オンライン手書き文字認識装置
US6636636B1 (en) Character recognizing apparatus, method, and storage medium
JP3985926B2 (ja) 文字認識方法、文字認識装置、文書画像処理システム及び記録媒体
JP2001022891A (ja) 認識装置および認識用記憶媒体
JP3167799B2 (ja) オンライン手書き文字認識装置
JP3153704B2 (ja) 文字認識装置
JP2002163608A (ja) 手書き文字認識装置
KR102677200B1 (ko) 터치-기반 사용자 인터페이스 입력에서의 제스처 스트로크 인식
JPH07302306A (ja) 文字入力装置
JP4261831B2 (ja) 文字認識処理方法、文字認識処理装置、文字認識プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination