CN1383516A

CN1383516A - 采用一对一比较的汉字校对系统

Info

Publication number: CN1383516A
Application number: CN01801889A
Authority: CN
Inventors: 全政桓
Original assignee: PALMAN SYSTEM Ltd
Current assignee: PALMAN SYSTEM Ltd
Priority date: 2000-07-05
Filing date: 2001-04-11
Publication date: 2002-12-04
Also published as: WO2002003240A1; KR100351584B1; KR20010015963A; JP2004502258A

Abstract

本发明涉及一种采用一对一比较的校对系统。按照本发明可以完成快速和简单的汉字文献校对,不用检查整个中文文献,只需要执行以下步骤:扫描准备输入的原始中文文献并且产生原始文献的原始图像;通过将原始图像自动分割成汉字图像而产生分割的位图;采用光学字符识别(OCR)或一对一输入的方法根据原始文献输入对应着各个位图图像的汉字;在用户选择了一对一比较菜单时产生具有相同代码的输入汉字的索引文件,显示按相同的汉字输入的位图图像,并且点击和标记与相应的输入字符不同的位图图像;以及在仅仅收集带标记的位图图像之后校正错误输入的字符和与其相对应的字符文本。

Description

采用一对一比较的汉字校对系统

技术领域

本发明涉及一种采用一对一比较的校对系统，具体涉及一种采用一对一比较的汉字校对系统，借助于这一系统，即使是不懂汉字的人也能快速和简单地校对中文文献，不需要检查中文文献全文。在采用一对一比较的这种汉字校对系统中，利用扫描仪扫描中文的原始拷贝并且转换成图像；由用户按照原始拷贝输入汉字，并且选择一个一对一比较菜单；在屏幕上显示原始拷贝中与用户输入的相同的汉字相对应汉字的位图图像；对包括不同于位图图像的汉字的文本做标记，然后，用户可以仅仅再次输入带标记的文本。

技术背景

一般来说，由于汉字是一种象形文字，输入汉字是很困难的。另外，如果用户不知道准确的字根和比划数，用户就不可能输入汉字。即使用户知道汉字的字根和比划数，也会频繁地出现因排字错误或人为错误造成的汉字输入错误。因此，一种实用的校对程序有必要执行用来校正汉字输入错误的步骤，这一点是公认的。

然而，如上所述，常规的汉字输入方法从输入汉字的处理能力上来看过于复杂并且还有缺陷，因为用户仅仅是看着汉字的形状来输入汉字，往往会输入与用户想要输入的汉字不同的汉字。

因此，用户就有必要校对输入汉字所获得的文献。然而，除非校对者能认识所有的汉字，否则就无法校对中文文献。在外国，由于很少有人能阅读所有中文文献，他们需要从头到尾逐个检查汉字来校对中文文献，这样造成的问题是校对文献需要很长的时间，并且不能完整地执行校对，即使是多次重复执行校对也几乎不能缩短校对所需的时间。

进而，在混合使用水平和垂直书写的条件下，要在比较两个句子的同时校对文献是很困难的，并且校对是很麻烦的，因为文献需要分开打印。

发明概述

因此，为了解决上述问题，本发明的目的是提供一种采用一对一比较的汉字校对系统，借助于这一系统，即使是不懂汉字的人也能快速和简单地校对中文文献，不需要检查中文文献全文；在这种系统中利用扫描仪扫描中文的原始拷贝并且转换成图像，将图像分割成各个汉字图像而产生分割的位图，由用户按照原始拷贝输入汉字，并且选择一个一对一比较菜单，在屏幕上显示原始拷贝中与用户输入的相同的汉字相对应汉字的位图图像，对包括不同于位图图像的汉字的文本做标记，然后，用户可以仅仅再次输入带标记的文本。

按照本发明，用来实现上述目的的采用一对一比较的汉字校对系统包括以下步骤：产生并存储从扫描仪扫描的原始拷贝转换而来的原始图像；通过一个分割执行程序将原始图像分割成对应着原始图像中的汉字的各个图像，然后通过一个位图产生程序产生分割的位图；由用户输入汉字并且选择一个一对一比较菜单，根据这些位图，通过一个索引文件产生程序产生在输入的字符当中具有相同代码的中文文献的索引文件，然后检查分割的位图图像；在完成检查之后，同时在屏幕的左边显示输入的字符文本并在其右边显示对应着输入字符文本的分割的位图图像，以便通过一个比较程序在输入字符文本和分割的位图图像之间进行观察比较；确认在右边的原始位图图像当中是否包括任何与左边的字符文本不同的位图图像，并且点击和标记不同的位图图像；收集标记的位图图像和与其相对应的字符文本，并且显示标记的位图图像和字符文本，使用户能够再次输入正确的汉字文本；并且执行整体的校对，使再次输入的正确文本在原先输入的原始文本中能够得到自动反映和校正。

附图简介

图1为表示按照本发明一个实施例的总体构造的示意图。

图2为表示本发明的一个操作过程的流程图。

图3到6为表示用于本发明的操作流程的屏幕显示的示意图。

实施本发明的最佳方式

以下要具体参照附图来解释本发明的一个最佳实施例。

图1示意性表示了本发明实施例的构造。

按照这一构造，用户用扫描仪2输入汉字原始拷贝，由能够识别扫描的微处理器1将扫描的文献转换成一个图像，然后产生要存储在存储器3中的一个原始图像。

微处理器1通过一个分割执行程序4和一个位图产生程序5自动分割原始图像，从而产生分割的位图。

用户利用光学字符识别(OCR)输入各个汉字，或者是根据原始拷贝一对一地输入，然后存储在存储器3中。

如果用户选择了一对一比较菜单，识别到这一选择的微处理器1就通过一个索引文件产生程序6根据原始图像的分割的位图为具有相同代码的汉字产生各自的索引文件，然后指令屏幕8显示同一个文本的输入文本和位图图像，从而通过一个比较程序7来确定它们彼此间是否有任何不同。

仅仅收集显示文本当中带标记的汉字，并且再次显示在屏幕8上。根据原始图像，在该文本中再次输入正确的汉字，从而校正与原始图像不同的输入文本。这样就能快速执行校对。

按照本发明，如此构成的采用一对一比较的校对系统是借助一种汉字输入法输入汉字来执行校对，例如有OCR，一对一输入等等方法，并且将输入的文本与原始图像相比较。

首先，用户用扫描仪2输入需要输入的汉字原始拷贝(步骤11)。然后由能够识别扫描的微处理器1将扫描的文献转换成一个图像，产生一个原始图像(步骤12)，并且将原始图像存储在存储器3中(步骤13)。

接着，微处理器1通过分割执行程序4将原始图像中的各个汉字分割成各自的图像(步骤14)，并且通过位图产生程序产生分割的位图(步骤15)。

然后，用户利用诸如OCR或一对一输入等汉字输入法完整地输入原始拷贝中的汉字(步骤16)。然后，如果用户选择了一对一比较菜单(步骤17)，识别到这一选择的微处理器1就通过索引文件产生程序6根据位图为输入的汉字当中具有相同代码的汉字产生各自的索引文件，并且检查分割的位图图像(步骤18)。

在完成检查之后，如图3所示，微处理器1指令屏幕8在其左边显示输入的文本并在其右边显示对应着输入的相同汉字那些汉字的位图图像，以便用户能够在它们之间进行观察比较(步骤19)。

因此，在检查显示在屏幕8左边的输入文本和右边的位图图像的同时，用户要确认在屏幕右边的位图图像是否与输入的汉字不同(步骤20)。点击不同于输入汉字的位图图像，如图4所示给位图图像做标记(步骤21)。

如果包括按上述方法输入的相同汉字的输入文本有许多(步骤22)，就收集由用户输入的包括相同汉字的那些文本的位图图像，并且显示在单个屏幕上(步骤23)。如图5所示，由用户确认输入的汉字是否与其位图图像相同，并且仅仅通过点击给不同于输入字符的位图图像做标记(步骤24)。

然后，如果用户在完成比较之后想要校正这些文本(步骤25)，就可以仅仅收集带标记的位图图像和与其相对应的输入文本(步骤26)并且如图6所示再次显示在单个屏幕上(步骤27)，这样，用户就能再次输入正确的汉字(步骤28)。

再次输入的汉字被自动反映在先前输入的原始文本上并且完成校正。这样就能完成整个文本从头到尾的校对(步骤29)。

工业实用性

按照本发明的采用一对一比较的校对系统能够快速和简单地校对中文文献，不用检查整个中文文献，只需要执行以下步骤：扫描准备输入的原始中文文献并且产生原始文献的原始图像；通过将原始图像自动分割成汉字图像而产生分割的位图；采用光学字符识别(OCR)或一对一输入的方法根据原始文献输入对应着各个位图图像的汉字；在用户选择了一对一比较菜单时产生具有相同代码的输入汉字的索引文件，显示按相同的汉字输入的位图图像，并且点击和标记与相应的输入字符不同的位图图像；以及在仅仅收集带标记的位图图像之后校正错误输入的字符和与其相对应的字符文本。

Claims

1.一种采用一对一比较的汉字校对系统，包括以下步骤：

产生并存储从扫描仪扫描的原始拷贝转换而来的原始图像；

通过一个分割执行程序将原始图像分割成对应着原始图像中的汉字的各个图像，然后通过一个位图产生程序产生分割的位图；

由用户输入汉字并且选择一个一对一比较菜单，根据上述位图，通过一个索引文件产生程序产生在上述输入字符当中具有相同代码的汉字的索引文件，然后检查分割的位图图像；

在完成检查之后，同时在屏幕的左边显示输入的字符文本并在其右边显示对应着输入字符文本的分割的位图图像，以便通过一个比较程序在上述输入字符文本和上述分割的位图图像之间进行观察比较；

确认在上述右边的原始位图图像当中是否包括任何与上述左边的字符文本不同的位图图像，并且点击和标记不同的位图图像；

收集带标记的位图图像和与其相对应的字符文本，并且显示上述带标记的位图图像和字符文本，使上述用户能够再次输入正确的汉字文本；并且

执行整体的校对，使再次输入的正确文本在上述原先输入的原始文本中能够得到自动反映和校正。

2.按照权利要求1的采用一对一比较的汉字校对系统，其特征是，如果上述输入文本有许多，就在单个屏幕上显示上述位图图像和按照相同的字符输入的上述字符文本，由上述用户为不同于上述输入字符文本的上述位图图像做标记，并且，如果上述用户想要对文本进行校正，上述用户就可以通过收集并显示上述带标记的位图图像和与其相对应的上述输入文本而再次输入正确的汉字。