CN1250205A - 文献图象处理装置及其方法和录有所用程序的记录介质 - Google Patents

文献图象处理装置及其方法和录有所用程序的记录介质 Download PDF

Info

Publication number
CN1250205A
CN1250205A CN99120579A CN99120579A CN1250205A CN 1250205 A CN1250205 A CN 1250205A CN 99120579 A CN99120579 A CN 99120579A CN 99120579 A CN99120579 A CN 99120579A CN 1250205 A CN1250205 A CN 1250205A
Authority
CN
China
Prior art keywords
lines
document image
zone
row
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN99120579A
Other languages
English (en)
Other versions
CN1173283C (zh
Inventor
金本优子
広泽昌司
山之上雅文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of CN1250205A publication Critical patent/CN1250205A/zh
Application granted granted Critical
Publication of CN1173283C publication Critical patent/CN1173283C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/171Editing, e.g. inserting or deleting by use of digital ink
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)
  • Processing Or Creating Images (AREA)
  • User Interface Of Digital Computer (AREA)
  • Document Processing Apparatus (AREA)

Abstract

为了以良好的风格和高度的可操作性在文献影象中沿着要求的字符串画出手工输入的线条部分,用扫描器读入文献的影象数据(36D)显示在显示部分(2)上。当用户操作图形输入板(3A)以便用手工沿着显示的文献中要求的字符串画出线条部分(L)(S2)时,行提取部分(4)根据手工画出的线条部分的输入数据(36A)所代表的位置信息和文献影像数据,从文献影像的区域中提取沿着它画出手工输入线条部分的行区域。手工输入的线条部分被修正为沿着提取的行区域画出的直线。

Description

文献图象处理装置及其方法和 录有所用程序的记录介质
本发明一般地涉及修正为显示而手工输入到包括字符的文献图象中的线条部分的文献图象处理装置及文献图象处理方法,以及可用计算机读出的录有为此目的的文献图象处理程序的记录介质。更详细地说,本发明涉及根据已经用于手工输入线条部分的方法修正在要求的位置上的手工输入的线条部分的文献图象处理装置和文献图象处理方法,以及可用计算机读出的录有为此目的的文献图象处理程序的记录介质。
公开让公众审查的日本专利No.61-273070公开了一种具有给读出的文献图象要求部分加下划线的编辑功能的文献图象处理装置。该文献图象处理装置具有用来显示读出的文献图象的显示部分。当用户想在所显示的文献图象中的要求的字符串加上下划线时,他/她利用鼠标装置等指定要求的字符串,并输入准备好的“加下划线”编辑命令。结果,要求的字符串便加上了下划线。但是这种类型的图象处理装置可操作性差,因为用户必须在字符串的基础上指定准备加下划线的字符串区域的同时输入编辑命令。
公开让公众审查的日本专利No.8-30250公开了一种文献图象处理装置,它给变成了像点图象的字符串的图象加下划线。当通过文献处理装置给其大小和种类变化的整行字符串加下划线时,涉及包围字符串中的字符的矩形区域和包围所有字符串的矩形区域的信息用来在要求的位置上离开包围整个字符串的矩形区域任意距离处放置一条下划线。该文献处理装置用来给整行字符串加上下划线。因此,无法对于包括多行字符串的图象中的特定字符或指定的特定字符串加下划线,故不适宜于一般用途。
公开让公众审查的日本专利No.5-181857公开了一种信息处理装置,它允许用户容易地输入和显示诸如给字符串加下划线等修改信息。但是,在这种信息处理装置中,只能编辑正文数据,而无法输入图象的修改信息。另外,必须专门为字符的修改信息提供输入区域,这是不利的。
用手沿着显示的文献图象中的字符串画线条的操作与在打印在纸张上的字符串下面画线的操作类似,它具有高性能的人机接口。但是,在传统的手工输入的方法中手工输入的线条部分原样显示,并因而错误地把画在字符串上的线条部分显示成穿过字符串,结果有时变得难以阅读。手工输入的或许是直线的线条显示出来却是并非准确直线的难看的线条。当手工输入不同类型的线条时,需要诸如比例尺等辅助工具,这在可操作性方面也是不利的。
本发明的一个目的是提供一种用于处理文献图象用的装置和方法,它允许用户以高的可操作性沿着文献图象中任意的字符串手工画出一条光滑的线条,并提供一种可用计算机读出的录有为此目的的文献图象处理程序的记录介质。
为了达到本发明的上述目的,按照本发明一个方面的文献图象处理装置具有如下结构。文献图象处理装置包括:显示部分,用来显示文献图象;线条输入部分,用来输入用手工沿着显示在显示部分上的文献图象中任意字符串画出的线条;和处理部分,用来处理输入的线条部分。该处理部分具有:方向判定部分,用来判定手工画出的线条的方向;行提取部分和线条修正部分。行提取部分根据方向判定部分所判定的方向以及文献图象中一个或多个字符图象提取包括文献图象区域中任意字符串的行的区域。线条修正部分把手画线条部分修正成沿着行提取部分所提取的行的区域画出的标准的线条部分,以便显示在显示部分上。
因此,只要用线条输入部分把线条部分手工画到文献图象中感兴趣的任意字符串的图象上,就可以利用线条修正部分沿着该任意字符串的图象画出一条标准的线条部分。结果,只要按照意愿用手工把线条部分画到任意字符串上,用户就可以沿着任意字符串放上一条良好的线条部分,换句话说,用户可以获得精细的文献图象。
上述文献图象处理装置的处理部分还可以包括处理区域指定部分,用来指定用于处理文献图象区域中手工画出的线条部分的处理区域。
通过这样设置的处理区域指定部分,用户就可以免去诸如预先在文献图象中指定处理区域等操作,这改进了可操作性。由于只对指定的处理区域,而不是对文献图象的整个区域进行处理,故可对处理部分进行精确而高速的操作。
上述图象处理装置中的行提取部分可以具有候选区域提取部分和行区域判定部分。候选区域提取部分根据方向判定部分所判定的方向和文献图象区域中的至少一个字符图象区域的方向为一行提取至少一个候选区域。行区域判定部分在所提取的至少一个候选区域内判定包括任意字符串的行区域。
因此,若候选区域提取部分提取了多个区域,则行区域判定部分判定多个候选区域中沿着哪一个区域已经放置了手工画出的线条部分。结果,用户免去了诸如指定包括已经放置了手工画出的线条部分的任意字符串的行区域的操作,从而改善可操作性。
在上述文献图象处理装置中,标准线条部分可以是直线。因此,若沿着任意字符串手工画出难看的线条部分,手工画出的线条部分可以修正成直线部分以供显示。
在上述文献图象处理装置中,线条修正部分具有线条类型识别部分,用来识别手工画出的线条部分的类型,并根据识别出的线条类型将手工画出的线条部分修正为标准的线条部分。
因此,手工画出的线条部分可以根据线条部分的类型(诸如虚线和波纹线)修正为标准的线条部分,各种类型的线条部分都可以精细地沿着任意字符串放置。
上述文献图象处理装置中的线条修正部分具有调整部分。调整部分根据行提取部分所提取的行区域中的至少一个字符区域把标准线条部分的长度调整为最优长度。
结果,利用所提取的行区域中的至少一个字符区域,换句话说,根据任意字符串的区域,可以把标准线条部分调整到具有最优长度,使得能够以较佳的风格提供文献图象。
在文献图象处理装置的线条修正部分中,若沿着行提取部分所提取的行区域已经画出一条或多条标准线条部分,则应用标准线条位置修正部分。标准线条位置修正部分修正对应于手工画出的线条部分的标准线条部分的位置,以便与在相应的行区域内已经画出那些至少一条的线条部分的情况下连续地画出标准线条部分。
因此,若在包括任意字符串的同一行区域内已经画出标准线条部分,则为了显示而把与新输入的手工画出的线条部分对应的标准线条部分修正成与已经画出的标准线条部分连接,故可以以更好的风格提供文献图象。
在上述文献图象处理装置的线条修正部分中,若至少一个手工画出的线条部分输入到行提取部分所提取的行区域中,则应用手工画出的线条部分修正部分。手工画出的线条部分修正部分调整与那些至少一条的手工画出的线条部分对应的标准线条部分的位置,并把它们修正成单独一条连续的标准线条部分。
结果,若多条手工画出的线条部分输入到同一行区域,则与这些手工画出的线条部分对应的多条标准线条部分被修正成单独一条标准线条以供显示,故可以以更好的风格提供文献图象。
在上述文献图象处理装置中,线条修正部分具有假名标音行识别部分,用以识别与假名标音行(例如,(用假名)标出汉字读音)对应的由行提取部分提取的行区域。若一个行区域被假名标音行识别部分识别出是与假名标音行对应的,则手工画出的线条部分被修正为沿着假名标音行放置的标准线条部分。
结果,若任意字符串相当于假名标音行,则标准线条部分可以在适当位置画出,从而可以更加精美地提供文献图象。
按照本发明另一个方面的文献图象处理方法包括以下步骤:显示文献图象;输入沿着所显示的文献图象中的任意字符串的图象的手工画出的线条部分;以及处理所输入的手工画出的线条部分。处理步骤具有以下步骤:判定手工画出的线条部分的方向;根据所判定的方向和文献图象中至少一个字符的图象提取文献图象区域中包括任意字符串的行区域;以及把手工画出的线条部分修正为沿着所提取的行区域而画出的标准线条部分,以供显示。
因此,只要在文献图象中的任意字符串的图象上画出线条部分,手工画出的线条部分就可以被修正为沿着任意字符串的图象画出的标准线条部分,线条部分可以容易地沿着任意字符串放置,故可以以更加精美的方式提供文献图象。
按照本发明的再一方面,可以提供一种可用计算机读出的录有文献图象程序的记录介质,以便允许计算机执行上述文献图象处理方法。
结合附图对本发明进行详细描述之后本发明的上述和其它目的、特征、方面和优点将变得更加清楚。
图1A至1C是举例说明按照本发明的文献图象处理装置的配置的方框图;
图2是用以举例说明按照本发明的文献图象处理装置的处理过程的概略的流程图;
图3是图1A中行提取部分4的配置的方框图;
图4A和4B是表示图3中的处理区域指定部分6的图解说明;
图5是用来举例说明由图3中方向判定部分7对自由曲线进行方向判定的过程的流程图;
图6是用来描述方向判定部分7的图解说明;
图7A到7F是用来描述图3中字符区域检测部分8的图解说明;
图8A至8C是用来描述图3中行区域提取部分9的图解说明图;
图9是用来举例说明图3中行判定部分10的过程流程图;
图10A至10D是用来描述涉及本发明第一实施例的具体过程的图解说明;
图11是用来举例说明利用图1A中的曲线修正部分5把自由曲线修正为直线的过程的流程图;
图12A和12B是用来描述按照图11中所示的过程流程图的过程的图解说明;
图13A至13C是用来描述利用字符区域修正修正数据的过程的图解说明;
图14是用来描述当自由曲线输入到包括带假名标音的字符的文献图象中时图1A中利用曲线修正部分5进行的过程的图解说明;
图15是用来举例说明图1A中波形线识别部分51所进行的过程的流程图;
图16是用来举例说明图1A中虚线识别部分52所进行的过程的流程图;
图17A至17C是用来描述图1A中调整部分53所进行的过程的图解说明;
图18是举例说明图1A中修正数据有/无判定部分55所进行的过程的流程图;
图19a至19E是举例说明图1A中位置修正部分55所进行的过程的流程图;
图20是举例说明图1A中多自由曲线有/无判定部分56的流程图;
图21A至21E是描述图1A中多线条部分位置修正部分57所进行的过程的例子的图解说明;
图22是描述本发明第三实施例用的数据储存部分31D中内容的例子的图解说明。
下面将参考附图描述本发明的各个实施例。
第一实施例
图1A和1B中示出了按照本发明每一个实施例的文献图象处理装置的功能和硬件配置。在图1A中,该文献图象处理装置包括:图象输入部分1,用来输入包括字符的文献中的图象数据;显示部分2;线条输入部分3;行提取部分4和曲线修正部分5。曲线修正部分5包括波形线条识别部分51;虚线识别部分52和调整部分53,后者将结合第一实施例加以描述;假名标音行识别部分50;修正数据有/无判定部分54和位置修正部分55,它将结合第二实施例加以描述;以及多条自由曲线有/无判定部分56和多条线条部分位置修正部分57,它将结合第三实施例加以描述。
图1B中,文献图象处理装置包括用来以集中方式监视和控制本装置的CPU(中央处理单元)30,而连接到CPU 30的有:扫描器1A,它是图象输入部分1的一个例子;显示部分2;图形输入板3A,它是线条输入部分3的一个例子;储存部分31,它包括储存各种程序的程序储存部分31P和储存各种数据的数据储存部分31D;通信接口I/F(接口)32,用来连接包括Internet(互联网)的通信网络33;和外部记录介质驱动器34,用来访问存储着各种程序和各种数据的外部记录介质。
图1C表示按本发明第一实施例的数据储存部分31D中的储存内容的一个例子,其细节容后再描述。
在图1A中的文献图象处理装置的操作中,由图象输入部分1输入的文献图象数据变成位图字体,以便在显示部分2显示,并作为图象数据36D存入数据储存部分31D。在用户看着所显示的文献图象的同时,他/她操作线条输入部分3,在文献图象中要求的部位沿着字符串输入一条手工画出的手画线条部分(下文称作自由曲线)。自由曲线包括倾斜或不倾斜的直线和弯曲的线条。输入的自由曲线数据依次作为输入数据36A存入数据储存部分31D。然后,行提取部分4利用图象数据36D和输入数据36A提取所判定的行区域数据36B,以便应用于曲线修正部分5。所判定的行区域数据36B是一种代表设置有自由曲线的由图象数据36D指示的文献中的行区域的信息。曲线修正部分5利用所加的已判定的行区域数据36B和输入数据36A来象将要描述的那样修正输入数据36A,而其结果作为修正后的数据36C存入数据储存部分31D。修正自由曲线后,在显示部分2所显示的文献图象中要求的部位沿着字符串显示修正后的自由曲线。
这里示出扫描器1A、诸如OCR(光学字符阅读器)、复印机和电子照相机等的图象读入器,作为图象输入部分1,但本发明并不限于此。更具体地说,记录介质读出器,从通过以前的读出而录有文献图象的CD-ROM(只读小光盘)、硬盘、软盘和磁光盘或半导体储存装置。文献图象数据的输入是通过通信网络33进行的,而不是利用图象输入部分1。
显示部分2包括未示出的显示控制部分和输出部分。输出部分可以是例如,诸如CRT(阴极射线管)或LCD(液晶显示器)等图象显示装置。在操作中,显示部分2根据从图象输入部分1送来的图象数据36D显示文献图象,并根据从线条输入部分3输入的输入数据36A把自由曲线显示在文献图象上。自由曲线修正之后,删除基于输入数据36A显示的自由曲线,并在显示部分2的文献图象上显示基于来自线修正部分5的修正后的输入数据36A的线条部分,换句话说,显示基于修正后的数据36C的线条部分。
在这里,线条输入部分3并不限于图形输入板3A,它可以是诸如鼠标器、指针(cursor)和控制杆等指向装置。由线条输入部分3输入的自由曲线用的输入数据36A加在显示部分2、行提取部分4和曲线修正部分5上。
行提取部分4和曲线修正部分5包括CPU 30和储存部分31。
现将参考图2描述按照本发明的文献图象处理装置的整个处理过程的流程。在步骤S1(图2中标为S1)中,从图象输入部分1输入图象数据36D。在以下的描述中,以位图的形式出现的图象数据36D的区域的水平方向称作X方向,而垂直方向称作Y方向,并以左上角为原点。在步骤S2,用户看着显示部分2所显示的图象数据36D的同时,他/她从线条输入部分3手工输入自由曲线。输入数据36A,例如,定义为一组按照时序的n个坐标值,诸如(x(i),y(i))(i=1到n)。这里,以自由曲线的输入分量尺寸的升序的形式设置输入数据36A。在步骤S3,为图象数据36D的区域指定一个准备接受后述的各种处理的区域,而此后的过程在这个区域进行。最好处理这样指定的图象数据36D的部分区域,而不是它的整个区域,因为处理速度会提高。
在步骤S4,为了判断在图象数据36D表示的文献中随后的过程是对垂直方向书写的字符行(X方向)进行,还是对按水平方向书写的字符列(Y方向)进行,判断自由曲线是否以水平方向(行的方向,X方向)输入。若判定自由曲线是以水平方向输入的,则执行步骤S6及其后的过程,但若判断结果相反,则执行步骤S5中的过程,对于步骤S6及其后的过程,行和列对调。
在步骤S6,在处理区域中,删除字符上的区域信息。在步骤S7中,根据删除的字符区域信息和输入数据36A所代表的自由曲线的方向,提取相应行上的区域信息。在步骤S8,根据所提取的行区域信息,判断输入数据36A的自由曲线沿哪一行放置。在步骤S9,象将要描述的那样修正输入数据36A,以便使自由曲线沿着判定行画出,以此获得修正后的数据36C。在步骤S10,根据从修正导出的修正后的数据36C在显示部分2图象数据36D显示的文献上显示线条部分。这里,图1A中的图象输入部分1具有步骤S1的功能,显示部分2具有步骤S10的功能,线条输入部分3具有步骤S2的功能,行提取部分4具有步骤S3至S8的功能,而曲线修正部分5具有步骤S9的功能。
现将描述图1A中的行提取部分4。图3表示行提取部分4的配置。在图3中,行提取部分4包括处理区域指定部分6、方向判定部分7、字符区域检测部分8、行区域提取部分9和行判定部分10。
处理区域指定部分6用来防止离开由输入数据36A指示的自由曲线的区域受将要描述的字符区域检测过程或行提取过程影响。更具体地说,在根据由输入数据36A表示的自由曲线的位置规定的范围内,指定准备接受字符区域检测过程或行区域提取过程的区域。现将结合图4A详细地描述这一点。
图4A表示与从图象输入部分1获得的对应图象数据36D的文献如何显示在显示部分2。图4A表示图象数据36D在X方向上的宽度WD,图象数据36D在Y方向上的高度HT。图4B表示如何为所显示的图象数据36D而输入自由曲线(输入数据36A)用的数据,和如何指定处理区域PE(点线所围成的区域)。自由曲线的输入数据36A(x(i),y(i))(i=1到n)的起点坐标数据(x(1),y(1))和终点坐标数据(x(n),y(n))用来以矩形区域数据(x(1)-W,y(1)-H),(x(n)+W1,y(n)+H1)的形式指定处理区域PE。但应注意,(x(1)-W,y(1)-H)代表矩形区域左上角的坐标值,而(x(n)+W1,y(n)+H1)代表该矩形区域右下角的坐标值。这里,变量W,H,W1和H1每一个都是任意常数,并且若设置成具有文献的图象数据36D中线条或字符空间的常数倍的值,则可以指定与输入图象数据36D对应的处理区域PE。注意,按照本实施例,处理区域PE是根据用于自由曲线的输入数据36D所代表的位置信息自动地设置的,但本发明不限于此。更具体地说,处理区域PE可以用图形输入板3等像要求那样指定。
方向判定部分7判断自由曲线是在X方向还是在Y方向输入的。现将结合图5流程图描述该方向判定过程。在步骤S21,比较自由曲线输入数据36A(x(i),y(i))(i=1到n)的起点坐标(x(1),y(1))和终点坐标(x(n),y(n))之间在X方向上的差值的绝对值|x(1)-x(n)|和在Y方向上的差值的绝对值|y(1)-y(n)|,若前者较大,则在步骤S22判定自由曲线是在X方向画出的。若后者较大,则在步骤S23判定自由曲线是在Y方向画出的。
图6表示图5中所示的过程的具体例子。自由曲线L一个端点的坐标(23,34)和另一个端点的坐标(31,35)之间X方向之差的绝对值是8(=|23-31|),Y方向上差值的绝对值是1(=|34-35|),因此前者较大。因此判定自由曲线L的输入数据36A是在X方向输入到文献的图象数据36D的。
字符区域检测部分8根据处理区域PE中的图象数据36D中自由曲线输入数据36A的方向检测字符区域。作为字符区域检测方法的一个例子,利用X方向和Y方向中每一个上的投影。在投影方法中,图象数据36D的字符部分上和空部分上的灰度等级数据是例如在指定方向上投影。更具体地说,求出图象数据36D在Y方向(或X方向)上的投影,并将处理区域PE分成至少一个作为候选的行区域(或至少一个作为候选的列区域)和其它区域。用类似的方法在X方向(或Y方向)上求出至少一个作为候选的行区域(或列区域)的投影,使得处理区域PE分成至少一个作为字符候选的区域和其它区域。对每一个候选区域,以类似方法求出Y方向(或X方向)上的投影,以便至少检测出一个字符区域。现将结合图7A至7F描述这一点。若例如自由曲线L是在X方向输入的(见图7A),则在自由曲线L输入之前(见图7B),求出图象数据36D处理区域PE在Y方向上的投影YSD(在图7C中用虚线箭头表示)。处理区域PE被分成作为多个候选的多个行区域LE和其它区域(图中用阴影线表示,见图7C)。然后,求出作为候选的每一个行区域LE在X方向上的投影(图中用虚线箭头表示)(见图7D),然后把处理区域PE分成至少一个作为候选的字符区域CE和其它区域。在图7D中,字符“”和“”是一个字符,但这些字符的字符区域每一个都被分成多个字符区域CE。因此,为了正确地为每一个这样的字符检测字符区域CE,若在X方向上这些字符区域之间的距离不大于某个阈值V(见图7E),则这些字符区域合并成一个字符区域CE。但应指出,阈值V是任意常数,而若该值被设置成数据36D文献中字符距离的常数倍,则可以进行与图象数据36对应的处理。另外,当求出每一个字符区域CE在Y方向上的投影YSD时,最后检测出每一个字符的字符区域CE1(见图7F)。
行区域提取部分9根据处理区域PE中图象数据36D的自由曲线L的输入数据36A的方向提取行区域。作为提取行区域方法的一个例子,可以利用每一个字符区域CE1在X方向和Y方向上的投影XSD和YSD。按照这个方法,求出在与输入数据36A的方向垂直的方向上每一个字符区域CE1的信息的投影。即可提取行区域(或列区域)。更具体地说,现在让我们假定,以前已经检测出图8A中所示的多个字符区域CE1的信息。由于已知自由曲线L的走向是X方向,所以,当求出在Y方向上的投影YSD时(见图8B),就可以提取行区域LE1(见图8C)。不利用多个字符区域CE1这样的信息,即可提取行区域LE1。例如,若在图7D中X方向上的投影XSD中,将两端的信息切除,则提取至少一个行区域LE1。
提取出来的每一个行区域LE1都由矩形区域数据((s(j),t(j)),(u(j),v(j))),(j=1至m)定义。但应注意,变量m代表提取出来的行区域LE1的总数,变量(s(j),t(j))代表矩形区域左上角的坐标,而变量(u(i),v(i))代表矩形区域右下角的坐标。这样提取出来的至少一个行区域LE1的信息临时储存(未示出)在CPU 30中内部储存器(未示出)中。
行判定部分10判断自由曲线L放置在图象数据36D的文献中的哪一行上。为了判定所述行,利用至少一个行区域LE1的数据((s(j),t(j)),(u(j),v(j))),(j=1至m)和自由曲线L的输入数据36A(x(i),y(i))(i=1至n)。更具体地说,若自由曲线L已经在X方向上输入,则把自由曲线L的输入数据36A的y坐标的平均值MY(=(y(1)+y(2)+...+y(n))/n)与行区域LE1在Y方向上信息的平均值MY(j)(=(t(j)+v(j))/2)(j=1至m)比较,并判定自由曲线L是沿着哪一行画的。现将参见图10中的流程图,针对自由曲线L在X方向输入的情况描述行判定部分10的处理过程。在步骤S31,从未示出的CPU 30中的内部储存器和从数据储存部分31D读出行区域LE1的数据((s(j),t(j)),(u(j),v(j))),(j=1至m)和自由曲线L的输入数据36A(x(i),y(i))(i=1至n)。在步骤S32判定,行区域提取部分9是否提取了至少一个行区域LE1。若未提取出行区域LE1,则假定在自由曲线L附近不存在字符,因此全部步骤完成,而且曲线修正部分5不进行对自由曲线L的输入数据36A的修正。
同时,若行区域提取部分9已经提取行区域LE1,则在步骤S33,求出自由曲线L的输入数据36A的y坐标的平均值MY,并对行区域LE1的数据设置Y方向上的平均值MY(j)的最大值,并因此将变量max设置为0。在步骤S34,将变量j设置为1,并指定第一行区域LE1的数据。在步骤S35,求出平均值MY(j)。在步骤S36,为了判定感兴趣的行区域LE1是否处于Y轴的负方向,若MY>MY(j)成立,则判定为是。若该关系成立,则控制进到步骤S37,否则在步骤S39指定下一个行区域LE1的数据。
在步骤S37,在至少满足步骤S36的条件的行区域LE1中间,位于Y轴正方向的行区域LE1会是比较接近自由曲线L,因此判定MY(j)>max是否成立。若该关系成立,则控制进到步骤S38,否则在步骤S39,指定下一个行区域LE1的信息。在步骤S38,将变量max设置为MY(j),变量LNE设置为”j”,并在步骤S39指定下一个行区域LE1的信息。注意,变量LNE是一个规定自由曲线L沿着它画出的行区域LE1的变量。
在步骤S40判断在步骤S31读出的全部行区域LE1的数据是否均已处理完毕。若处理尚未完毕,则控制返回步骤S35,否则一系列处理步骤均已完成,由变量LNE代表的行区域LE1被判定为自由曲线沿之画出的行。此后该行被称为“判定行”。
把该判定行以称为矩形区域数据((s,t),(u,v))的行区域数据36B的形式存入数据储存部分31D。但应指出,变量(s,t)是该矩形区域左上角的坐标,而变量(u,v)是该矩形区域右下角的坐标。若自由曲线L沿着Y方向输入,则在图9所示的处理过程中,变量MY和MY(j)分别用变量MX和MX(j)代替。
这里,现将参照图10A至10D描述当已经在X方向上输入自由曲线L时的具体处理。图10A表示已经用手工方法输入到显示部分2的文献图象上的自由曲线L。图10B表示由处理区域指定部分6指定的处理区域PE中字符区域检测部分8检测字符区域的结果。图10C表示行区域提取部分9根据被检测出来的每一个字符区域的信息和方向判定部分7所判定的自由曲线L的输入数据36A所代表的方向提取至少一个行区域LE1的结果。图10D表示由行判定部分10作出的在至少一个行区域LE1中间检测到的自由曲线L是沿着哪一个行区域画出的判定结果。这些处理结果可以不必逐一显示在屏幕上,但是这里象所显示的那样把它们显示出来,使得用户容易地判断该处理过程已适当地完成了。
现将描述图1中曲线修正部分5。曲线修正部分5判定对于行提取部分4获得的判定行如何修正自由曲线L以及将其画在何处。把关于判定行的区域数据的位置信息((s,t),(u,v))和自由曲线L的输入数据36A(x(i),y(i))(i=1至n)用于自由曲线L的修正过程。自由曲线L一般被修正为直线。这里,将描述自由曲线L在X方向输入,并修正输入数据36A,以便将在Y方向上离开判定行区域数据36B的距离为变量数值a的位置上画出基于自由曲线L的直线的情况。但应指出,变量a是任意常数,而若该变量被设置为图象数据36D的文献中行或字符空间的常数倍,则可以指定与图象数据36D对应的直线的位置。
现将参照图11描述自由曲线L在X方向输入时该曲线的修正过程。在步骤S41,从数据储存部分31D读出判定行区域数据36B((s,t),(u,v))和自由曲线L的输入数据36A(x(i),y(i))(i=1至n)。在步骤S42,变量i设置为1,以此指定输入数据36A中的第一坐标的数据。在步骤S43,x坐标轴的数据不变,在判定行区域右下角y坐标值v上加上变量值a。结果,输入数据36A转变成修正后的数据36C(xc(i),yc(i))。在步骤S44,指定输入数据36A的下一个坐标的数据。在步骤S45判断输入数据36A的全部坐标是否均已处理完毕。若处理尚未完成,则控制返回步骤S43,否则该曲线的修正过程已经完成,获得修正后的数据36C(xc(i),yc(i))(i=1至n),并将其存入数据储存部分31D。请注意,修正后的数据36C可以是连接坐标(xc(1),yc(1))和坐标(xc(n),yc(n))的直线。当上述自由曲线L在X方向上输入时,具体的修正过程示于图12A和12B。
当在Y方向上手工输入自由曲线L时,只需将图11流程图中步骤S43中呈现的公式变成xc(i)=x(i)+a,yc(i)=y(i)。这样,修正了自由曲线L的输入数据36A,以便在X方向上在离开判定行区域的距离为变量a的值的位置上画出一条直线。
对于修正后的数据36C所代表的线段的端点的坐标,关于每一个字符区域CE1的信息都用来修正由调整部分53修正后的数据36D所代表的线段的长度,使得可以清晰地确定修正后的数据36C所代表的线段。例如,如图13A所示,在字符“木”和“川”的字符区域CE1中,自由曲线是从这些字符区域CE1的中间画的。在这样的情况下,判断是否已经画出具有不小于针对判定行中每一个字符区域CE1规定的在自由曲线L的方向上的阈值T的长度的自由曲线L,并且修正后的数据36C由调整部分53修正。但应指出,阈值T是任意常数,而若将该阈值设置为图象数据36D的文献中字符距离的常数倍,则对修正后的数据36C可以作出与图象数据36C相应的修正。对于每一个字符区域CE1,若已经画出具有不小于自由曲线L方向上的阈值T的长度的自由曲线L,则判定自由曲线L已经沿着字符区域CE1的字符画出,并且这样修正修正后的数据36C,使得直线是在X方向上沿着字符区域CE1的整个范围画出(见图13B)的。修正后的数据36C是这样修正的,使得直线的端点位于某一个字符区域CE1与相邻的字符区域CE1之间(见图13C)。这样,利用关于与自由曲线L对应的判定行中字符区域CE1的信息,就可以修正自由曲线L的由修正后的数据36C代表的直线的长度。
曲线修正部分5具有假名标音行识别部分50。假名标音行识别部分50把行判定部分4所判定的行区域LE1(或列区域)的宽度与另一个行区域LE1(或列区域)的宽度比较,而若该宽度不大于规定的阈值U,则该行被识别为包括沿着汉字设置的假名的假名标音行,但应注意,阈值U是任意常数,若把该阈值设置为图象数据36D的文献中的字符距离或行距离的常数倍,则可进行与图象数据36D对应的假名标音行的识别过程。
图14表示当线条部分是沿着包括带有假名标音的字符的字符串的假名标音行设置的时进行的曲线修正过程。在这里,以下(1)至(3)中任何一个步骤都被选择来修正自由曲线L。
(1)线条部分沿着假名标音行画出(图14中箭头①)。
(2)再次进行行判定过程,而同时忽略假名标音行,以便判定新的判定行(图14中的箭头②)。更具体地说,这样重新判定的行是包括带有假名标音的字符的行。于是,沿着新判定行设置线段。
(3)类似于以上②的步骤,再一次进行行判定过程,以便判定新的判定行,沿着该判定行设置线段(见图14中的箭头③)。更具体地说,在新判定行中,对于附有假名标音的字符沿着假名标音设置线段,而对于无假名标音的字符,沿着重新判定的判定行设置线段。
在上述过程中,实线自由曲线L被修正为沿着判定行设置的直线,现将描述实线以外其它类型的自由曲线L的过程。
曲线修正部分5具有波形线识别部分51,用来识别在X方向上输入的自由曲线是否波形线,下面将参照图15描述曲线修正部分5所进行的过程。在图15的步骤S51中,从数据储存部分31D读出自由曲线L的输入数据36A(x(i),y(i))(i=1至n)。在步骤S52,利用最小二乘法处理读出的输入数据36A,将其转变为一条趋近手工输入的自由曲线L的直线数据。该转变所得的直线数据定义为F(x)=ax+b。在步骤S53,把变量CNT设置为0。变量CNT代表自由曲线L与趋近自由曲线L的直线的交点数目。然后,把变量i设置为2,以此指定自由曲线L的输入数据36A中的第二个坐标。在步骤S54判断连接自由曲线L的输入数据36A的第i个坐标和第i-1个坐标的直线是否与趋近于自由曲线L的直线相交。此时,若判定相交,则控制进到步骤S55,否则在步骤56令变量i加一,以此指定输入数据36A中的下一个坐标。
在步骤S55,令变量CNT加一,对自由曲线L和趋近于它的直线的交点数进行计数,并且控制进到步骤S56。在步骤S57判断输入数据36A全部坐标的数据是否均已处理完毕,若处理尚未完成,则控制返回步骤S54。
在步骤S58判断变量CNT是否大于一个预定的阈值N,而若该值大于该阈值,则在步骤S60判定自由曲线L是一条波形线,否则在步骤S59判定该自由曲线L不是波形线,于是处理结束。但应指出,阈值N是任意常数,若该阈值N过大,则很可能无法把自由曲线L识别为波形线,而若该阈值N过小,则在大多数情况下会把该曲线识别为波形线。若自由曲线L是在Y方向上输入的,则图15流程图中步骤S52的公式用F(x)=ay+b代替,而且步骤S54中的判断公式用((x(i)-F(y(i)))×x(i-1)-F(y(i-1)))<0代替,并进行相同的处理过程。
若自由曲线L被波形线识别部分51识别为波形线,则按照从以下步骤中选中的一个修正自由曲线L:(1)把自由曲线L修正为标准的波形线,(2)把自由曲线L修正为具有预定范围的振幅和不规则周期的波形线,以及(3)把自由曲线L修正为具有基于该自由曲线L的振幅的规定范围的振幅和不规则周期的波形线。这里,步骤(1)中的标准波形线是指,例如,正弦波,具有恒定波长和振幅的波形线。(2)中修正方法的一个例子如下。当在X方向上手工输入自由曲线L时,自由曲线L的输入数据36A利用x(i)=x(i)和y(i)=y(i)+T(i)×R(式中T(i)是y(i)的常数倍,而变量R是随机函数)修正。过程(3)中的修正方法的一个例子如下。当在X方向上输入自由曲线L时,输入数据36A在Y方向上的最大值和最小值分别为变量MAX和MIN,而x(i)=x(i)和y(i)=y(i)+T(i)×R(i)成立(式中变量T(i)是变量y(i)的一个常数变量,而变量R(i)是基于自由曲线L振幅的随机函数)。因为R(i)定义为R(i)=(F(x(i))-MEAN)/(MAX-MIN)(式中MEAN=(MAX-MIN)/2),因此自由曲线L被修正为波形线。
现将描述当自由曲线L是不同于实线,例如是虚线类型时的处理。曲线修正部分5具有虚线识别部分52,以识别在X方向上手工输入的自由曲线L是否虚线。
现将结合图16的流程图描述虚线识别部分52的处理过程。
在图16中的步骤S61中,从数据储存部分31D读出自由曲线L输入数据36A(x(i),y(i))(i=1至n)。在步骤S62判断自由曲线L输入的方向上的长度(x(n)-x(1))是否小于预定值Q,而若该长度较小,则控制进到下一个步骤S63。否则,判定自由曲线L不是虚线,于是识别虚线的过程结束。但应注意,阈值Q是任意常数,若该阈值设置为图象数据36D的文献中的字符距离的常数倍,则可进行识别与图象数据36D对应的虚线识别过程。
在步骤S63,输入自由曲线L之后,判断下一个自由曲线L是否已经在预定的时间周期内输入,而如果有了这样的输入,则在步骤S65判定该曲线是虚线,否则在步骤S64判定该曲线不是虚线,于是虚线识别过程结束。若文献图象处理装置具有虚线识别部分52,则自由曲线L的输入数据36A包括代表数据输入时间的时间数据,因此在步骤S63判断步骤根据该时间数据进行。注意,若自由曲线L在Y方向上输入,则在图16步骤S62中的表达式用(y(n)-y(1))<Q代替,并进行相同的处理过程。
若虚线识别部分52把自由曲线L识别为虚线,则假定虚线由p个线条部分组成。在这种情况下,p个线条部分的输入数据36A中的每一个均定义为(x(k)(i),y(k)(i))(k=1至p)(i=1至n(p))(式中变量n(k)是用来代表构成虚线的每一个线条部分的坐标总个数)。然后,选择以下步骤中的任何一个,并执行:(1)把自由曲线L修正为标准虚线。(2)把自由曲线L修正为这样的虚线,即虚线的每一个线条部分的长度或线条部分之间的距离在预定范围内是不规则的,以及(3)利用每一个线条部分的长度或线条部分之间的距离把自由曲线L做成具有不规则性的虚线。在过程(1)中的规则虚线是这样一条虚线,即构成虚线的每一个线条部分的长度和线条部分之间的距离例如是常数,而且各线条部分安排在单一直线上。修正步骤(2)的例子如下。当自由曲线L在X方向上输入时,自由曲线L的输入数据36A利用以下表达式修正。更具体地说,若x(k)(i)=x(k)(i)(式中,x(k)(i)-x(k)(1)≤P),则x(k)(i)=x(k)(1)+P(式中x(k)(i)-x(k)(1)>P),和y(k)(i)=v(k)+a(式中变量v(k)是Y方向上线条部分k的判定行的最大坐标)用来输入数据36A。但应注意,上述变量P是任意常数,而若设置为图象数据36D的文献中字符之间的距离的常数倍,则可识别一条与图象数据36D对应的虚线。
当线条部分之间的距离太大时,增加安排修正后的输入数据36A的步骤,并可加上新的线条部分。
在上述步骤(3),行提取部分4和曲线修正部分5的过程用于虚线的每一个线条部分。更具体地说,在自由曲线L输入的方向上,修正后的数据36C的每一个坐标的对应值等于原输入数据36A的对应值,并利用输入数据36A产生不规则的虚线。例如,若自由曲线L在X方向上输入,则自由曲线L的输入数据36A转换成定义为x(k)(i)=x(k)(i)和y(k)(i)=v(k)+a的修正后的数据36C。
在曲线修正部分5中,若在修正后的数据36C周围没有字符区域存在,则由调整部分53删除一部分修正后的数据36C,调整由修正后的数据36C代表的直线的长度。图17A至17C表示当自由曲线L一端出现在没有字符区域的处理区域PE(未示出)的一部分时的过程。若自由曲线L画在没有字符区域的部分(见图17A和17B),则根据判定行一端字符区域CE1的位置(见图17C)删除修正后的数据36C中判断方向上的不必要的数据。
第二实施例
现将描述本发明的第二实施例。在上述第一实施例中,一旦已经手工输入自由曲线L,就立即进行图2步骤S3及其后的过程,换句话说,采用顺序的处理过程。用众所周知的技术检测自由曲线L的输入的结束。更具体地说,自由曲线L输入之后,利用现在示出的计时器测量规定时间周期的过去,而若在规定时间周期过去之后下一条自由曲线L的数据尚未获得,则相应地检测到自由曲线L输入结束。
在第二实施例中,按照第一实施例的方法获得的修正后的数据36C和图象数据36D已经储存在数据储存部分31D中,并显示在显示部分2上,对同一图象数据36D输入了新的自由曲线L。
这个实施例的配置与第一实施例类似,但第二实施例的功能如下。更具体地说,如图1所示,曲线修正部分5包括按照第二实施例的修正数据有/无判定部分54和位置修正部分55。当自由曲线L输入到由判定行区域数据36B((s,t),(u,v))代表的判定行时,修正数据有/无判定部分54判断修正后的自由曲线是否已经沿着判定行画出。若修正数据有/无判定部分54判定已经修正的自由曲线已经沿着判定行画出,则位置修正部分55修正刚输入的自由曲线L或已经沿着判定行画出的修正后的自由曲线的位置,使这些曲线连续。
现将结合图18的流程图描述修正数据有/无判定部分54判断是否至少有一段与该自由曲线L沿之输入的判定行对应的修正后的数据36C已经存入数据储存部分31D的过程。注意,自由曲线L已经在X方向上沿着判定行输入了。让我们假定,至少一段修正后的数据36C已经登记入数据储存部分31D。
在图18步骤S71中,从数据储存部分31D读出手工输入的自由曲线L的输入数据36A(x(i),y(i))(i=1至n)和至少一段修正后的数据36C(x(k)(j),y(k)(j))(k=1至r)(j=1至n(k))(式中变量n(k)是构成第k个修正数据36C的坐标总数)。在步骤S72,变量k设置为1,以此在读出的至少一段修正后的数据36C中间指定第一个修正后的数据36C。在步骤S73,求出自由曲线L的输入数据36A的y坐标的平均值MY(=y(1)+y(2)+...+y(n)/n)和所指定修正后的数据36C的y坐标的平均值Y(k)(=(y(k)(1)+y(k)(2)+...+y(k)(n(k))/n(k))。在这里,得到y坐标的平均值,因为指定的修正后的数据36C可能是波形线或虚线的数据。
若在步骤S74判定|MY-Y(k)|的值小于规定值R,则在步骤S77判定自由曲线L是沿着与修正后的数据36C所代表的线条部分的同一行画出的,这样便完成该过程。同时,若|MY-Y(k)|的值不小于规定值R,则在步骤S75令变量k加一,以此指定下一个修正后的数据36C。但应指出,阈值R是任意常数,而若阈值R设置为图象数据36D所代表的文献中字符间距或行间距离的常数倍,则可进行与图象数据36D对应的过程。
在步骤S76中,为了检测修正后的数据36C,以满足步骤S74的条件,判断是否在步骤S71读出的全部修正后的数据36C均已处理完毕,换句话说,判断k>r是否成立。若未检测出满足步骤S74的条件的修正后的数据36C,则在步骤S78判定没有一条线条部分是沿着自由曲线L的同一行画出的,这样便完成该过程。注意,若自由曲线L是在Y方向上输入的,则在图18中的步骤S73和S74用变量MX代替变量MY,同时用变量X(k)代替变量Y(k),并用类似方法进行该过程。
现将结合图19A至19E描述当沿着一个线条部分已经沿着它画出的同一行设置自由曲线L时根据数据储存部分31D中的修正后数据36C进行的显示处理。当用户利用线条输入部分3将自由曲线L手工输入到以前显示在显示部分2(见图19A)的图象数据36D的文献上时,指定处理区域PE,检测至少一个字符区域CE1(见图19B),并提取行区域LE1(见图19C)。自由曲线L经受曲线修正处理,以便在离开由提取行区域LE1代表的判定行一定距离的位置画出一条直线L1(见图19D)。此时,修正数据有/无判定部分54判断修正后的数据36C的线条部分是否已经沿着判定行画出,以此,自由曲线L的修正后数据36C用位置修正部分55修正,使得线条部分L1和L2形成一条单一的直线L3(见图19E)。更具体地说,在位置修正部分55中,对位于判定行(与图19D中“专门示出”的线条部分L1对应的修正后的数据36C)附近的线条部分的修正后的数据36C进行修正,以便与位于离开判定行(图19D中线条部分L2的修正后数据36C)的线条部分的修正后数据36C连续。结果,线条部分L1的位置被修正得沿着判定行,并将画出直线L3(见图19E)。
若自由曲线L和已经沿着判定行画出的线条部分是波形线,则自由曲线L的修正后数据36C只需经受上述的指定新位置的处理过程。否则,处理该数据使之与已经在代表自由曲线L的端点的数据中登记的修正后数据36C连续,并移动相位,使微分值相等,或者增加/减少关于加上/删去线条部分上的信息、以便该数据可以与已经画出的线条部分的修正后的数据36C连续的安排。
第三实施例
在第一和第二实施例中,自由曲线L是逐一地手工输入和处理的。在第三实施例中,一次处理多条输入的自由曲线L。在第三实施例中,若用户选择批处理作为自由曲线L的输入方式,而且手工输入多条任意自由曲线L,则操作线条输入部分3中的批处理按钮等(未示出)并进行下列处理。
按照第三实施例的文献图象处理装置的配置与第一实施例的相同,但有下列新功能。更具体地说,当从线条输入部分3输入q条自由曲线L时,每一条自由曲线L的输入数据36A定义为(x(k)(i),y(k)(i))(k=1~q)(i=1~n(k))(式中变量n(k)是组成第k条自由曲线的坐标总数)。按照升序设置关于输入数据36A的相应的自由曲线L的分重。
行提取部分4处理q条自由曲线L,因此获得判定行区域数据36B((s(k),t(k)),(u(k),v(k))(k=1至q),并存入数据储存部分31D。但应注意,变量(s(k),t(k))代表判定行区域(矩形区域)左上角的坐标,而变量(u(k),v(k))代表判定行区域(矩形区域)右下角的坐标。利用唯一地规定图22中所示的数据储存部分31D中数据的标号值L(k)=k(k=1至q)分配与在行判定部分10中获得的判定行对应的判定行区域数据36B。
按照第三实施例,曲线修正部分5有多自由曲线有/无判定部分56和多线条位置修正部分57。多自由曲线有/无判定部分56判断是否沿着同一判定行设置多条自由曲线L,换句话说,对于同一判定行区域数据36B((s(k),t(k)),(u(k),v(k))(k=1至q)。若多自由曲线有/无判定部分56判定多条自由曲线L沿着同一判定行画出,则多线条位置修正部分57修正与沿着同一行画出的多条自由曲线L对应的多段修正后的数据36C,以便具有连续性。
这里,现将结合图20的流程图描述在多自由曲线有/无判定部分56中,在X方向上手工输入了多条自由曲线L时的过程。
在步骤S81,从数据储存部分31D读出关于多条自由曲线L的多段输入数据36A(x(k)(i),y(k)(i))和标号值L(k)(k=1至q)(i=1至n(k))。在步骤S82,把变量k设置为1,并在多段读出的输入数据36A中间指定第一输入数据36A。在步骤S83,把变量j设置为k+1,并指定下一个输入数据36A。在步骤S84,求出第k个输入数据36A的y坐标的平均值Y(k)(=(y(k)(1)+y(k)(2)+...+y(k)(n(k))/n(k))和第j个输入数据36A的y坐标的平均值Y(j)(=(y(j)(1)+y(j)(2)+...+y(j)(n(j))/n(j))。
若在步骤S85判定数值|Y(k)-Y(j)|小于预定阈值R,则在步骤S86中比较标号值(k)和标号值L(j),并根据比较结果,分别在步骤S87和S88处理较大的标号值,并且后者变为较小的标号值。但应注意,阈值R是任意常数,而若把阈值R设置为图象数据36D的文献中的字符间或行间距离的常数倍,则可进行与图象数据36D对应的处理过程。
在步骤S89,变量j加一,以此指定下一个输入数据36A。在步骤S90判断j>q是否成立,并重复步骤S84至S88的过程,直至j>q成立为止。在步骤S91,变量k加一,以此指定下一个输入数据36A。然后,重复步骤S83至S91的过程,直至在步骤S92判定k>q。这样,当q个自由曲线L的所有组合都经过处理时,与同一判定行对应的所有自由曲线L中的每一个的判定行区域数据36B都将具有同一标号值L(k)。
注意,若自由曲线L是在Y的方向上输入的,则在图20的步骤S84和S85中,变量y用变量x代替,而变量Y用变量X代替,于是可以进行同一处理过程。
上述处理的结果,若具有同一标号值L(k)的多个判定行区域数据36B登记在图22的数据储存部分31D中,换句话说,若判定多条自由曲线L都是沿着同一判定行画出的,如图21A和21E所示,则多条自由曲线L的修正后数据36C被多线条位置修正部分57为显示而进行修正如下。更具体地说,当从线条输入部分3手工输入两条自由曲线L(1)和L(2)时(见图21A),指定处理区域PE(1)和PE(2),对每一个处理区域检测出至少一个字符区域CE1(见图21B),以便把行区域LE(1)和LE(2)提取为判定行(见图21C)。对自由曲线L(1)和L(2)的修正数据36C进行修正,以便沿着离开由曲线修正部分5求出的每一个判定行一定距离a的位置画出直线L1和L2(见图21D)。此时,由于判定自由曲线L(1)和L(2)是沿着同一判定行画出的,所以,多线条位置修正部分57就修正两个修正后的数据36C,以便使这两条自由曲线具有连续性。更具体地说,直线L1和L2中比较接近判定行的一个的修正后数据36C(在图21D中沿着字符串“”画出的直线L2的修正后数据36C)被修正,以便与离判定行较远的修正后数据36C(在图21D中沿着字符串“”画出的直线L1的修正后数据36C)连续(见图21E)。
若沿着同一判定行输入的多条自由曲线L是波形线,则为了使多条自由曲线L构成单一的连续线条部分,必须进行以下过程。更具体地说,除了指定与每一条自由曲线L对应的修正后数据36C的位置,使之具有连续性的过程之外,还进行以下过程。例如,可以对各个修正后数据36C进行修正以移动相位,使得每一个修正后的数据36C在线条部分的端部具有连续性,而且微分值相等。可以增加/减少安排修正后数据36C的过程,以便加上/删除线条部分,使得多段修正后数据36C具有连续性。
注意,在上述实施例中,在显示部分2显示的文献图象中的手工输入的线条部分的数据作为与图象数据36D对应的单独数据储存,如图31D所示。
包括在上述实施例方面的流程图中所示的过程的各种处理过程是由读出并执行以前储存在程序储存部分31P中的文献图象处理程序的CPU 30实现的。这些程序储存在可由CPU 30读出的记录介质上,诸如程序储存部分31P中。作为记录介质,可以使用外部记录介质35。在这种情况下,外部储存介质35设置在外部记录介质驱动器34中,从外部记录介质35读出的程序装入包括内部程序储存部分31P的预定区域内,然后可以由CPU 30读出,以便执行。用于装入的程序预先储存在装置主体的储存区域(未示出)中。
程序储存介质可以是独立于装置主体的记录介质。更具体地说,该介质可以是磁带,诸如磁带和盒式录音带;磁盘,诸如软盘和硬盘;诸如CD-ROM,MO(磁光盘),MD等盘和诸如DVD等光盘,IC卡等卡(包括储存卡)和光卡或包括半导体储存器,诸如掩模型ROM(只读储存器),EPROM(可擦除可编程只读储存器),EEPROM(电可擦除可编程只读储存器)和快速ROM。
如图1B所示的文献图象处理装置可以连接到包括Internet的通讯网络33上,因此,它可以是载有图象处理程序的介质,以便通过通讯网络下载文献图象处理程序。
尽管已经对本发明详细地进行了描述和举例说明,但是,显然,这只是作为图解说明和例子,并不是作为限制。本发明的精神和范围只由后附的权利要求书限制。

Claims (15)

1.一种文献图像处理装置,它包括:
显示部分(2),用来显示文献图像;
线条输入部分(3),用来输入用手工沿着显示在显示部分上的文献图像中任意字符串画出的线条(L);和
处理部分(4,5),用来处理所述线条输入部分(3)输入的线条部分(L),
所述处理部分包括:
方向判定装置(7),用来判定所述手工画出的线条的方向;
行提取装置(8,9,10),根据所述方向判定装置所判定的方向以及所述文献图像中一个或多个字符的图像,提取包括所述文献图像区域中所述任意字符串的行区域,和
线条修正装置(5),把所述手画线条部分修正成沿着所述行提取部分所提取的行区域画出的正常的线条部分,以此显示在所述显示部分上。
2.权利要求1的文献图象处理装置,其特征在于:
所述处理部分还包括处理区域指定装置(6),用来指定用于处理所述文献图像区域中所述手工画出的线条部分的处理区域(PE)。
3.权利要求1的文献图象处理装置,其特征在于:
所述行提取装置包括:
候选区域提取装置(8,9),用来根据所述方向判定装置所判定的方向和所述文献图像区域中的至少一个字符图像区域提取作为所述行的区域的候选的至少一个候选区域,
行区域判定装置(10),用来在由所述候选区域提取装置所提取的至少一个所述候选区域内判定包括所述任意字符串的所述行的区域。
4.权利要求1的文献图象处理装置,其特征在于:所述正常线条部分可以是直线。
5.权利要求1的文献图象处理装置,其特征在于:
所述线条修正装置包括:
线条类型识别装置(51,52),用来识别所述手工画出的线条部分的类型,并根据所述线条类型识别装置识别出的所述线条类型将所述手工画出的线条部分修正为所述正常线条部分。
6.权利要求5的文献图象处理装置,其特征在于:
所述正常线条部分的线条类型与所述线条类型识别装置识别的所述手工画出的所述的线条类型一致。
7.权利要求1的文献图象处理装置,其特征在于:
所述线条修正部分具有调整装置(53),后者根据所述行提取装置所提取的所述行的区域中的至少一个字符的区域把所述正常线条部分的长度调整为最优长度。
8.权利要求1的文献图象处理装置,其特征在于:
所述线条修正装置具有正常线条位置修正装置(55),当已经沿着所述行提取装置提取的所述行的区域画出至少一个条所述正常线条部分时,用来修正与所述手工输入的线条部分对应的所述正常线条部分或至少一条已经沿着所述行的区域画出的正常线条部分,以便连续地画出与所述手工输入的线条部分对应的所述正常线条部分和至少一条已经沿着所进行的区域画出的正常线条部分。
9.权利要求8的文献图象处理装置,其特征在于:
所述线条修正装置还包括正常线条有/无判定装置(54),用来判断是否沿着所述行提取装置提取的所述行的区域已经画出至少一条所述正常线条部分。
10.权利要求1的文献图象处理装置,其特征在于:
所述线条修正装置具有手工输入线条部分修正装置(57),用来调整与至少一个所述手工输入的线条部分对应的至少一个所述正常线条部分的位置,以此当至少一个所述手工输入的线条部分输入到所述行提取装置所提取的所述行的区域时,把至少一个所述正常线条部分修正为单一的连续的正常线条部分。
11.权利要求10的文献图象处理装置,其特征在于:
所述线条修正装置还具有正常线条有/无判定装置(56),用来判断是否在所述行提取装置提取的所述行的区域上已经输入至少一条所述手工输入的线条部分。
12.权利要求1的文献图象处理装置,其特征在于:
所述线条修正装置具有假名标音行识别装置(50),用以识别行提取部分所提取的所述行的区域是否与包括沿汉字一侧给出假名的假名标音行对应,并当所述行的区域被所述假名标音行识别装置识别为与所述假名标音行对应时,把所述手工输入的线条部分修正为沿着所述假名标音行的区域画出的所述正常线条部分。
13.权利要求1的文献图象处理装置,其特征在于:
所述文献是在所述文献图像中水平和垂直两个方向(X,Y)中的一个方向上描述的,
所述方向判定装置判定所述手工输入的线条部分是沿着所述两个方向中的哪一个方向。
14.一种文献图像处理方法,它包括下列步骤:
显示文献图像(S1);
沿着所述显示步骤所显示的文献图像中的任意字符串的图像输入手工画出的线条部分(L)(S2),以及
处理所述输入步骤所输入的所述手工画出的线条部分(S4至S10);
所述处理步骤包括,
判定所述手工画出的线条部分的方向(S4);
根据所述判定步骤所判定的方向和所述文献图像中至少一个字符的图像提取所述文献图像区域中包括所述任意字符串的行区域,以及
把所述手工画出的线条部分修正为沿着所述提取步骤所提取的所述行的区域而设置的正常线条部分,以此显示正常线条部分(S9,S10)。
15.一种可用计算机读出的录有文献图像程序的记录介质,所述程序利用计算机执行文献图像处理方法,后者包括以下步骤:
显示文献图像(S1);
沿着所述显示步骤所显示的文献图像中的任意字符串的图像输入手工画出的线条部分(L)(S2),以及
处理所述输入步骤所输入的手工画出的线条部分(S4至S10);
所述处理步骤包括,
判定所述手工画出的线条部分的方向(S4);
根据所述判定步骤所判定的方向和所述文献图像中至少一个字符的图像提取所述文献图像区域中包括所述任意字符串的行区域,以及
把所述手工画出的线条部分修正为沿着所述提取步骤所提取的所述行的区域而设置的正常线条部分,以此显示正常线条部分(S9,S10)。
CNB991205790A 1998-10-01 1999-09-30 文献图象处理装置和方法 Expired - Fee Related CN1173283C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP279226/1998 1998-10-01
JP27922698A JP3795238B2 (ja) 1998-10-01 1998-10-01 文書画像処理装置及び文書画像処理方法

Publications (2)

Publication Number Publication Date
CN1250205A true CN1250205A (zh) 2000-04-12
CN1173283C CN1173283C (zh) 2004-10-27

Family

ID=17608198

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB991205790A Expired - Fee Related CN1173283C (zh) 1998-10-01 1999-09-30 文献图象处理装置和方法

Country Status (4)

Country Link
US (1) US6810147B2 (zh)
EP (1) EP0990994A3 (zh)
JP (1) JP3795238B2 (zh)
CN (1) CN1173283C (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001090879A1 (en) * 2000-05-26 2001-11-29 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for displaying information
KR20030018519A (ko) * 2001-08-30 2003-03-06 서치캐스트 주식회사 이미지검색 기반 편리한 한자 입력교정 방법
KR100398832B1 (ko) 2001-10-31 2003-09-19 헤라우스오리엔탈하이텍 주식회사 본딩 와이어용 스풀 케이스 및 이 케이스를 사용한 스풀취급 방법
JP3870176B2 (ja) * 2003-07-29 2007-01-17 キヤノン株式会社 情報処理方法及び装置
JP4081056B2 (ja) * 2004-08-30 2008-04-23 株式会社東芝 情報処理装置、情報処理方法及びプログラム
JP4900640B2 (ja) * 2005-03-30 2012-03-21 京セラ株式会社 携帯端末装置およびその文書表示制御方法
JP5208540B2 (ja) * 2008-02-27 2013-06-12 株式会社Pfu 画像ファイル振分方法、画像ファイル振分装置、および、プログラム
JP2009303164A (ja) * 2008-06-17 2009-12-24 Canon Inc 画像読取装置及び画像読取装置の制御方法
JP2010039572A (ja) * 2008-07-31 2010-02-18 Sky Co Ltd 文字装飾システム及び文字装飾プログラム
US9196047B2 (en) * 2010-11-08 2015-11-24 Manipal Institute Of Technology Automated tuberculosis screening
JP5810858B2 (ja) * 2011-11-16 2015-11-11 沖電気工業株式会社 情報処理装置、情報処理方法およびコンピュータプログラム
CN105426818B (zh) * 2015-10-30 2019-07-02 小米科技有限责任公司 区域提取方法及装置
JP6805552B2 (ja) * 2016-05-26 2020-12-23 コニカミノルタ株式会社 情報処理装置及びプログラム
JP6717141B2 (ja) * 2016-09-20 2020-07-01 コニカミノルタ株式会社 文書閲覧装置及びプログラム
CN109753971B (zh) * 2017-11-06 2023-04-28 阿里巴巴集团控股有限公司 扭曲文字行的矫正方法及装置、字符识别方法及装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61273070A (ja) 1985-05-27 1986-12-03 Canon Inc 画像処理装置
JP3135290B2 (ja) * 1991-07-30 2001-02-13 キヤノン株式会社 画像処理方法及び装置
DE69130469T2 (de) * 1990-08-03 1999-05-06 Canon K.K., Tokio/Tokyo Gerät und Verfahren zur Bildverarbeitung
JP3489119B2 (ja) * 1991-08-09 2004-01-19 富士ゼロックス株式会社 文書処理装置
US5384863A (en) * 1991-11-19 1995-01-24 Xerox Corporation Methods and apparatus for automatic modification of semantically significant portions of a document without document image decoding
JPH05181857A (ja) * 1992-01-08 1993-07-23 Canon Inc 情報処理装置
US5583543A (en) * 1992-11-05 1996-12-10 Sharp Kabushiki Kaisha Pen input processing apparatus
JPH06242885A (ja) * 1993-02-16 1994-09-02 Hitachi Ltd 文書編集方法
JPH06324798A (ja) * 1993-05-17 1994-11-25 Sharp Corp 手書き編集機能を持つ文書処理装置
US5614926A (en) * 1993-05-17 1997-03-25 Sharp Kabushiki Kaisha Word processor with a handwriting text processing function
JP3287075B2 (ja) * 1993-09-08 2002-05-27 ソニー株式会社 形状入力方法および装置
JPH07182303A (ja) * 1993-12-24 1995-07-21 Sharp Corp 情報処理装置
JPH07287768A (ja) * 1994-04-19 1995-10-31 Toshiba Corp 文書作成装置及び図形処理方法
US5812697A (en) * 1994-06-10 1998-09-22 Nippon Steel Corporation Method and apparatus for recognizing hand-written characters using a weighting dictionary
JPH0830250A (ja) * 1994-07-20 1996-02-02 Fujitsu Ltd 文章処理装置
JP4144911B2 (ja) * 1996-08-30 2008-09-03 富士通株式会社 編集処理方法及び文書編集装置
JP2974061B2 (ja) * 1996-11-13 1999-11-08 日本電気株式会社 パタン抽出装置

Also Published As

Publication number Publication date
US20030174907A1 (en) 2003-09-18
JP3795238B2 (ja) 2006-07-12
EP0990994A3 (en) 2006-03-22
US6810147B2 (en) 2004-10-26
CN1173283C (zh) 2004-10-27
JP2000112599A (ja) 2000-04-21
EP0990994A2 (en) 2000-04-05

Similar Documents

Publication Publication Date Title
CN1173283C (zh) 文献图象处理装置和方法
US6466694B2 (en) Document image processing device and method thereof
CN102117269B (zh) 对文档进行数字化的装置及方法
CN102147911B (zh) 图像处理装置
CN110472208A (zh) Pdf文档中表格解析的方法、系统、存储介质及电子设备
CN1492377A (zh) 表格处理系统及方法
CN1234565A (zh) 手写文字识别方法及系统
CN1102778C (zh) 能简单修饰文件数据的文件处理装置
CN1383094A (zh) 帐票识别方法
JP3814320B2 (ja) 画像処理方法及び装置
JP2009251872A (ja) 情報処理装置及び情報処理プログラム
CN100341028C (zh) 模式分段装置及其方法和模式识别装置及其方法
CN1254764C (zh) 表单处理装置和表单处理方法
US7016535B2 (en) Pattern identification apparatus, pattern identification method, and pattern identification program
JPH11219409A (ja) 文書読取装置
JP4810853B2 (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JPH07220023A (ja) 表認識方法及びその装置
US5748779A (en) Method and apparatus for inputting handwritten alphanumeric characters and for displaying the input characters
JP2020047138A (ja) 情報処理装置
CN1097815C (zh) 字符成形设备
JP5062076B2 (ja) 情報処理装置及び情報処理プログラム
JP2001291055A (ja) 帳票認識装置およびそのプログラム記録媒体
JP2003308478A (ja) 帳票認識装置、記憶媒体、及びプログラム
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JP2022092498A (ja) 画像処理装置、画像処理方法及びプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20041027

Termination date: 20140930

EXPY Termination of patent right or utility model