CN101923541B

CN101923541B - 翻译装置、翻译方法

Info

Publication number: CN101923541B
Application number: CN2010102937538A
Authority: CN
Inventors: 小山俊哉; 斋藤照花; 馆野昌一; 田中圭; 长尾隆; 榊原正义; 彭新宇; 中村浩太郎; 伊藤笃; 田川昌俊; 田宗道弘; 增市博; 佐藤直子; 田代洁
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2005-03-22
Filing date: 2005-08-18
Publication date: 2012-05-30
Anticipated expiration: 2025-08-18
Also published as: CN101923541A; US20060217954A1; US7865353B2

Abstract

一种翻译装置，包括：字符识别单元，用于识别输入图像文本区中的文本数据；翻译器，用于翻译所述文本区的文本数据；以及布局结构处理器，用于生成包含文本区翻译后文本数据和输入图像中的图形的数据，其中在由所述布局结构处理器生成的数据的图像布局中保持输入图像的布局，布局结构处理器通过改变图形区的大小来生成数据，字符识别单元还对输入图像中的图形区的图像进行字符识别处理，以输出表示图形区字符类型、位置和大小的图形区文本数据；翻译器还对图形区文本数据进行翻译处理，以输出图形区翻译后文本数据，图形区翻译后文本数据表示要容纳入该图形区的字符的类型、位置和大小；所述布局结构处理器包括翻译后数据传送控制器和切换单元。

Description

翻译装置、翻译方法

本申请根据中华人民共和国专利法实施细则第42条提出，是2005年8月18日提交的发明名称为“翻译装置、翻译方法及存储介质”的申请号为200510092818.1的发明专利申请的分案申请。

技术领域

本发明涉及一种用于在将文档中包含的文本从一种语言翻译成另一种语言后生成翻译数据的技术。

背景技术

已经提出了各种类型的翻译设备，其接收有图或无图的文档的图像数据、翻译该图像数据的文本区中包含的文本、并且生成包含翻译后文本的经翻译的文档或生成包含翻译后文本和原始图形的文档。

已知提出了一种技术，即采用布局分析使输入数据的文本区和图形区分开，并且识别文本区中的字符以进行翻译。然后将获得的翻译后的文本量与现存的文本区的大小进行比较，从而可以根据比较结果再形成文本区。然而，作为对文本区再形成的结果，如果不能再将图形区分配在同一页上，则将图形区分配在下一页中。因此，由于文本区和图形区分配的改变，读者可能难于阅读翻译后的文档。

此外，由于常用的翻译设备在同一页的不同区域或不同页中输出原始文档和翻译后的文档，因而用户通常很难找到原始文本和翻译后文本之间的对应。已知提出了一种技术，即在原始文本的行间布置翻译后的文本，从而减少了用户寻找原始文本和翻译后文本之间的对应所引起的的麻烦。

然而，翻译后文本中所包含的字符的数量和类型会与原始文本中的不同；结果，一行翻译后文本中包含的字符串的长度与一行原始文本所占据的长度不相等。

发明内容

鉴于上述情况提出了本发明，本发明提供了一种系统，用于保留文本区和图形区的原始布局地生成包含翻译后文本部分和原始图形部分的翻译数据。此外，本发明提供了一种系统，用于使得能够生成翻译数据，通过使用该系统，用户很容易将原始文档与翻译后文档相联系，提高了可阅览性。

一方面，本发明提供了一种翻译装置，所述翻译装置包括：字符识别单元，用于识别输入图像文本区中的文本数据；翻译器，用于翻译所述文本区中的文本数据；以及布局结构处理器，用于通过改变翻译后文本数据的字符大小来生成包含文本区翻译后文本数据和输入图像中的图形的数据，从而在由所述布局结构处理器生成的数据的图像布局中保持输入图像的布局，其中所述布局结构处理器通过改变图形区的大小来生成所述数据，其中所述字符识别单元还对输入图像中的图形区的图像进行字符识别处理，以输出表示图形区字符类型、位置和大小的图形区文本数据；其中所述翻译器还对图形区文本数据进行翻译处理，以输出图形区翻译后文本数据，所述图形区翻译后文本数据表示要容纳入该图形区的字符的类型、位置和大小；并且其中所述布局结构处理器包括：翻译后数据传送控制器，用于在预定的传输数据量限度内将文本区翻译后文本数据在翻译后文本与图形数据的不同页的文本区之间进行传送；和切换单元，用于在以下情况下对页的设置进行控制，代替对标识图形的图形标识信息进行传送：在该页的图形区翻译后的文本数据中包含所述图形标识信息；在所述翻译后数据传送控制器对该翻译后文本数据进行传送之前，在已经包含有所述图形区翻译后文本数据中所包含的图形标识信息的页的同一页的文本区翻译后文本数据中，包含这样的图形标识信息，该图形标识信息与所述图形区翻译后文本数据中所包含的图形标识信息相同；并且如果所述翻译后数据传送控制器对翻译后文本数据进行传送，则该图形标识信息将被传送到另一页的文本区中。

另一方面，本发明提供了一种翻译装置，所述翻译装置包括：字符识别单元，用于识别输入图像文本区中的文本数据；翻译器，用于翻译所述文本区中的文本数据；以及布局结构处理器，用于通过改变翻译后文本数据的字符大小来生成包含文本区翻译后文本数据和输入图像中的图形的数据，从而在由所述布局结构处理器生成的数据的图像布局中保持输入图像的布局，其中所述布局结构处理器通过改变图形区的大小来生成所述数据，其中所述字符识别单元还对输入图像中的图形区的图像进行字符识别处理，以输出表示图形区中的字符的类型、位置和大小的图形区文本数据；其中所述翻译器还对图形区文本数据进行翻译处理，以输出图形区翻译后文本数据，所述图形区翻译后文本数据表示要容纳入图形区的字符的类型、位置和大小；并且所述布局结构处理器包括：翻译后数据传送控制器，用于在预定的传送数据量限度内将文本区翻译后文本数据在翻译后文本与图形数据的不同页的文本区之间进行传送；和切换单元，用于在生成具有将多个页设置在相同页面上的N-up结构的翻译后文本与图形数据时，在以下情况下对页的设置进行控制，代替对标识图形的图形标识信息进行传送：在页面中的图形区翻译后文本数据中包含所述图形标识信息；在翻译后数据传送控制器对翻译后文本数据进行传送之前，在已经包含有所述图形区翻译后文本数据中包含的图形标识信息的页面的同一页面的文本区翻译后文本数据中，包含这样的图形标识信息，该图形标识信息与所述图形区翻译后文本数据中所包含的图形标识信息相同；并且如果所述翻译后数据传送控制器对翻译后文本数据进行传送，则该图形标识信息将被传送到另一页面的文本区中。

根据本发明的实施例，可以生成其文本部分经翻译的翻译后文本与图形数据，同时保持输入数据的文本区和图形区的布局。

另一方面，本发明提供了一种翻译方法，所述方法包括以下步骤：字符识别步骤，识别输入图像文本区中的文本数据；翻译步骤，翻译所述文本区中的文本数据；以及布局结构处理步骤，通过改变翻译后文本数据的字符大小来生成包含文本区翻译后文本数据和输入图像中的图形的数据，从而在生成的数据的图像布局中保持输入图像的布局，其中通过改变所述图形区的大小来生成所述数据，其中在所述字符识别步骤中还对输入图像中的图形区的图像进行字符识别处理，以输出表示图形区字符类型、位置和大小的图形区文本数据；其中在所述翻译步骤中还对图形区文本数据进行翻译处理，以输出图形区翻译后文本数据，所述图形区翻译后文本数据表示要容纳入该图形区的字符的类型、位置和大小；并且其中所述布局结构处理步骤包括：翻译后数据传送控制步骤，用于在预定的传输数据量限度内将文本区翻译后文本数据在翻译后文本与图形数据的不同页的文本区之间进行传送；和切换步骤，用于在以下情况下对页的设置进行控制，代替对标识图形的图形标识信息进行传送：在该页的图形区翻译后的文本数据中包含所述图形标识信息；在所述翻译后数据传送控制步骤对该翻译后文本数据进行传送之前，在已经包含有所述图形区翻译后文本数据中所包含的图形标识信息的页的同一页的文本区翻译后文本数据中，包含这样的图形标识信息，该图形标识信息与所述图形区翻译后文本数据中所包含的图形标识信息相同；并且如果所述翻译后数据传送控制步骤对翻译后文本数据进行传送，则该图形标识信息将被传送到另一页的文本区中。

另一方面，本发明提供了一种翻译方法，所述方法包括以下步骤：字符识别步骤，识别输入图像文本区中的文本数据；翻译步骤，翻译所述文本区中的文本数据；以及布局结构处理步骤，通过改变翻译后文本数据的字符大小来生成包含文本区翻译后文本数据和输入图像中的图形的数据，从而在生成的数据的图像布局中保持输入图像的布局，其中通过改变所述图形区的大小来生成所述数据，其中在所述字符识别步骤中还对输入图像中的图形区的图像进行字符识别处理，以输出表示图形区中的字符的类型、位置和大小的图形区文本数据；其中在所述翻译步骤中还对图形区文本数据进行翻译处理，以输出图形区翻译后文本数据，所述图形区翻译后文本数据表示要容纳入图形区的字符的类型、位置和大小；并且所述布局结构处理步骤包括：翻译后数据传送控制步骤，用于在预定的传送数据量限度内将文本区翻译后文本数据在翻译后文本与图形数据的不同页的文本区之间进行传送；和切换步骤，用于在生成具有将多个页设置在相同页面上的N-up结构的翻译后文本与图形数据时，在以下情况下对页的设置进行控制，代替对标识图形的图形标识信息进行传送：在页面中的图形区翻译后文本数据中包含所述图形标识信息；在翻译后数据传送控制步骤对翻译后文本数据进行传送之前，在已经包含有所述图形区翻译后文本数据中包含的图形标识信息的页面的同一页面的文本区翻译后文本数据中，包含这样的图形标识信息，该图形标识信息与所述图形区翻译后文本数据中所包含的图形标识信息相同；并且如果所述翻译后数据传送控制步骤对翻译后文本数据进行传送，则该图形标识信息将被传送到另一页面的文本区中。

根据本发明的实施例，由于翻译后文本的字符串与原始文本的字符串长度相同，且两者平行放置，所以用户可以很容易地进行原始文本和翻译后文本之间的对应。结果，大大提高了可阅览性。

附图说明

下面将根据附图对本发明的实施例进行详细说明，在附图中：

图1是示出了根据本发明第一实施例的翻译装置的结构的框图；

图2是示出了根据第一实施例的有图文档翻译程序的过程的流程图；

图3的图示出了根据第一实施例的有图文档翻译程序的过程的一部分；

图4A至4D的图与传统技术相比较地描述了第一实施例的效果；

图5是示出了根据本发明第二实施例的有图文档翻译程序的过程的流程图；

图6的图描述了根据另一实施例的处理；

图7的图描述了根据另一实施例的处理；

图8是示出了根据本发明第三实施例的图像生成装置的框图；

图9是示出了根据第三实施例的图像生成装置中翻译处理单元的结构的框图；

图10是示出了由翻译处理单元进行的处理的流程图；

图11A和11B的图示出了说明在翻译处理单元中进行的处理的图像；以及

图12A和12B的图示出了说明校正字符串长度的处理(即在翻译处理单元中进行的处理)的字符串。

具体实施方式

下面，将参照附图说明本发明的实施例。

第一实施例

图1是示出了根据本发明第一实施例的翻译装置的基本结构的框图。该翻译装置的结构与结合了扫描功能、复印功能、打印功能和传真功能的多功能机相类似。该翻译装置具有带ADF(自动送纸器)的图像读取装置1、打印装置2、通信接口3、显示单元4、操作单元5、易失性存储器6、非易失性存储器7以及控制上述各单元的CPU 8。在CPU 8的控制下，在该翻译装置中实现了多种功能：通过打印装置2对由图像读取装置1读取的图像进行打印来实现复印功能、将图像通过通信接口3和网络传输到相应的传真机来实现传真功能等。

在非易失性存储器7中存储有本实施例的专用程序以及用于使得CPU 8进行控制以实现此类多功能装置设有的多种功能的控制程序，所述特有程序为将从装置外扫描到的图像中包含的文本翻译成另一种语言的有图文档翻译程序，并且该专用程序生成用于输出的带有图形的翻译数据，所述翻译数据包含取代了表示原始文本的图像的翻译后文本数据。在图2的流程图中示出了有图文档翻译程序进行的典型过程。为了避免重复说明，将在本实施例后面部分提供对本实施例的操作的说明时再说明该过程的细节。

根据本实施例的翻译技术具有这样一种结构使得可以以下述方式实现有图文档翻译程序：

a.在图像读取装置1中，读取包含以一种语言撰写的文本和图形的文档的图像，并将该图像存储在易失性存储器6中，以便使用有图文档翻译程序对该图像进行处理并使用打印装置2将通过该处理获得的翻译后文本与图形数据作为图像输出。另选地，采用通信接口3通过传真或电子邮件，将通过该处理获得的翻译后文本与图形数据传输到需要该翻译后数据的用户；以及

b.通过通信接口3接收包含以一种语言撰写的文本和图形的文档的图像，并将该图像存储在易失性存储器6中，以便使用有图文档翻译程序对该图像进行处理并使用打印装置2将通过该处理获得的翻译后文本与图形数据作为图像输出。另选地，采用通信接口3通过传真或电子邮件，将通过该处理获得的翻译后文本与图形数据传输到需要该翻译后数据的用户。

在非易失性存储器7中存储有使得能够传输图像(其为有图文档翻译程序的输入信息)和翻译后文本与图形数据(其为有图文档翻译程序的输出信息)的控制程序。通过经由操作单元5或通信接口3提供的命令，提供详细指令，使控制程序进行信息传输。

下面，将给出对本实施例操作的说明。一旦通过图像读取装置1和通信接口3输入了具有一页或多页的待处理图像，则随后将其存储在易失性存储器6中，CPU 8执行有图文档翻译程序，其流程示于图2中。在布局分析处理101(其为有图文档翻译程序的第一处理)中，CPU 8分析存储在易失性存储器6中的输入图像的布局。然后CPU 8获得如图3中所示的文本区201、图形区202和余白区203，并将具有与所获区域相同区域的翻译后文本与图形数据存储在易失性存储器6的工作区。在这一阶段，文本区201和图形区202为空。

随后CPU 8顺序进行字符识别处理102、翻译处理103和文本量计算处理104。在字符识别处理102中，对包含在输入图像200的文本区201中的图像进行字符识别，从而生成文本区文本数据。该文本区文本数据包含有关经识别的字符的类型的信息和诸如字符大小、行距、页边距等的设置信息。在字符识别处理102中，还对图形区202中包含的图像进行处理以生成图形区文本数据。该图形区文本数据包含有关图形区202中包含的字符的类型、位置和大小的信息。

在翻译处理103中，将文本区文本数据和图形区文本数据翻译成另一种语言，以生成文本区翻译后的文本数据204和图形区翻译后的文本数据205，分别将其分配到已存储在工作区中的翻译后文本与图形数据的文本区201和图形区202。该文本区翻译后的文本数据204包含有关形成翻译后文本的字符的类型的信息以及从原始文本区文本数据继承来的设置信息；并且图形区翻译后的文本数据205包含表示形成翻译后文本的字符的类型的信息和表示从原始图形区文本数据继承来的字符的位置和大小的信息。通过操作单元5或通信接口3提供的命令分别指定包含在输入图像200中的文本的语言和翻译后文本的语言，并且根据该命令在翻译处理103中进行翻译。

在图2中，由短划线进行的分组形成了布局结构处理器500，用于生成翻译后文本与图形数据，该数据在其文本区包含文本区翻译后的文本数据204并在其图形区包含图形区翻译后的文本数据205以及输入图像200的图形区202中的数据。在文本量计算处理104中，计算由文本区翻译后的文本数据204表示的翻译后文本的数据量并将其存储在非易失性存储器7中。在区域大小计算处理105中计算文本区201和图形区202的大小(即面积)并将其存储在易失性存储器6中。可以在布局分析处理101之后和文本量/区域大小比较处理106之前的任何时刻进行区域大小计算处理105。

在文本量/区域大小比较处理106中，将由文本量计算处理104获得的翻译后文本的字符量与由区域大小计算处理105获得的文本区201的大小进行比较，并且将比较结果存储在易失性存储器6中。具体而言，在文本量/区域大小比较处理106中，计算对由文本区翻译后的文本数据204表示的翻译后文本成像获得的图像所占据的面积与要容纳该图像的文本区201的大小之间的比值，并将该计算出的比值存储在易失性存储器6中。

CPU 8基于进行文本量/区域大小比较处理106所获得的结果，进行文本大小缩放处理107或图形缩放处理108。文本大小缩放处理107作为设置控制装置对在翻译后文本与图形数据中的文本区翻译后的文本数据204的设置进行控制，从而继承了输入图像200的布局作为翻译后文本与图形数据的文本区201和图形区202的布局。具体而言，在文本大小缩放处理107中，根据目前翻译后文本占据的面积和文本区的大小之间的比值(该比值已经在文本量/区域大小比较处理106中获得)计算翻译后文本的各字符的大小，使得当对文本区翻译后的文本数据204成像时，该图像可以容纳在文本区201中。

当判定如果缩小(或放大)图形区202的大小则无需改变字符大小就可以将翻译后文本的图像容纳到文本区201中时，则进行图形缩放处理108，以在最大允许限度内放大(或缩小)文本区201的大小。根据在文本量/区域大小比较处理106中获得的比值作出该判定。在图形缩放处理108中，获得在不改变设置(诸如形成文本区翻译后的文本数据204的字符大小)的情况下容纳通过对数据204进行成像获得的图像所需的文本区201的大小。此外，在根据所获得的大小改变文本区201的大小的情况下，还获得图形区202的大小，使得在输入图像200的同一页中的文本区201和图形区202仍可以容纳在翻译后文本与图形数据中的同一页中。然后，获得对图形的缩放因子，该缩放因子为改变前后的大小的比值。

在重构处理109中，使用进行文本大小缩放处理107和图形缩放处理108获得的结果，重构翻译后文本与图形数据，将该数据存储在易失性存储器6的工作区中。

在进行了文本大小缩放处理107而未进行图形缩放处理108的情况下，在重构处理109中，首先将输入图像200不包括文本图像的图形区202的图像存储在工作区中翻译后文本与图形数据的图形区202中。接着，将从输入图像200的图形区202中获得的图形区翻译后的文本数据205存储在翻译后文本与图形数据的图形区202中。当将存储在图形区202中的数据重现为图像时，图形区202中的翻译后文本将与输入图像200的原始文本具有相同的大小并占据相同的位置。随后，将从输入图像200的文本区201中获得的文本区翻译后的文本数据204存储在翻译后文本与图形数据的文本区201中。指定包含在文本区翻译后的文本数据204中的字符大小的信息示出了应用文本大小缩放处理107之后的大小。结果，当对文本区翻译后的文本数据204进行成像时，该图像准确适合于文本区201。

另一方面，在重构处理109中，在不进行文本大小缩放处理107而进行图形缩放处理108的情况下，根据执行图形缩放处理108而获得的结果来改变翻译后文本与图形数据的文本区201和图形区202。根据图形缩放处理108获得的缩放因子，对除去字符图像后的输入图像200的图形区202的图像进行放大或缩小，以存储在翻译后文本与图形数据的图形区202中。

此外，对表示图形区翻译后的文本数据205中所包含的字符大小的信息进行修改以示出通过乘以图形缩放处理108获得的缩放因子而获得的值。再根据该缩放因子，修改显示图形区翻译后的文本数据205中的字符位置的信息。进行该修改使得当对图形区翻译后的文本数据205成像时，在图形区202中，翻译后文本的字符的图像占据与输入图像的原始字符相同的位置。接着，将文本区翻译后的文本数据204存储在翻译后文本与图形数据的文本区201中。不对指定包含在文本区翻译后的文本数据204中的字符大小的信息进行文本大小缩放处理107，而是通过图形缩放处理108改变文本区201。结果，当对文本区翻译后的文本数据204进行成像时，翻译后文本的图像准确适合于文本区201。

因此，在以翻译后文本取代了包含在原始输入图像中的文本后，将翻译后文本与图形数据存储在易失性存储器6的工作区中。然后通过打印装置2将翻译后文本与图形数据打印到记录纸上，或通过通信接口3将其传输到需要该翻译结果的外部用户处。

图4A至4B的图与传统技术相比较地说明了本发明的效果。在该示例中，如图4A所示，将外文的有图文档的输入图像存储在易失性存储器6中，并将输入图像的文本部分翻译成日语。

当采用传统技术时，在输入图像的文本区中的字符串的翻译后文本不再能够容纳在原始文本区中的情况下，如图4B所示，翻译后文本被置于被放大了的文本区中，结果图形区被移到了原始页的下一页。结果，在采用传统技术输出的翻译后文本与图形中，文本区和图形区的布局看上去与输入图像的外文有图原始文档差异很大。因此导致翻译后文本很难阅读。

相反，在本实施例中，获得了如图4C或图4D所示的翻译后文本与图形。图4C示出了通过进行文本大小缩放处理107而未进行图形缩放处理108获得的翻译后文本与图形；而图4D示出了通过未进行文本大小缩放处理107而进行了图形缩放处理108获得的翻译后文本与图形。如这些图中所示，根据本实施例获得的翻译后文本与图形的文本区和图形区布局与输入图像的布局相同(图4C)或与输入图像的布局差异不是很大(图4D)。因此，当与采用传统技术的翻译后文本与图形相比时，根据本实施例获得的翻译后文本与图形很容易被用户所理解。

第二实施例

第一实施例对于要处理有多个页的输入图像的情况也有效。在要处理有多页的输入图像的情况下，根据第一实施例，在尽可能保持各页的文本区、图形区、和余白的同时，生成翻译后文本与图形数据，并且将从输入图像的各页的文本区获得的文本区翻译后的文本数据存储在翻译后文本与图形数据的与输入图像相同的页的文本区中。然而，当严格应用该规则时，可能会引起在翻译后文本和图形数据的各页的文本区中的翻译后文本密度在各页间不一致。在本实施例中，可以将文本区翻译后的文本数据在最大允许限度内在各页之间传送以降低翻译后文本密度的不一致。换句话说，例如，在翻译后文本的文本量相对于特定页的文本区的大小很大，但是在下页中翻译后文本的文本量相对于其文本区大小很小的情况下，可以将在最后部分中的字符串(其不太可能适合于前一页)传送到后一页。相反，在翻译后文本的文本量相对于特定页的文本区的大小很小，但在下页中翻译后文本的文本量相对于其文本区的大小很大的情况下，可以将后一页中的前端部分中的字符串发送到前一页。

因此降低了翻译后文本在不同页之间密度的不一致；然而，这会带来另一个问题。即，传送到另一页中的字符串包含该经传送的字符串以前位于的页中包含的图形的标号的情况下，用户必须很麻烦地翻到前一页以确认包含该标号的文本中引用的图形。本实施例还防止了给用户带来的这种不便。

图5是示出了根据本实施例进行的有图文档翻译程序的过程的流程图。在该图中，对应于图2中所示处理的那些处理采用相同的标号。在根据本实施例的有图文档翻译程序中，还提供了同一图形标号搜索处理110，并且，根据执行同一图形标号搜索处理110获得的结果，判定是否进行由短划线归在一起的文本量计算处理104、文本量/区域大小比较处理106、文本大小缩放处理107以及图形缩放处理108(下文中为了方便称为组处理111)。换句话说，同一图形标号搜索处理110包括：翻译后文本数据传送控制手段，用于将文本区翻译后的文本数据在最大允许限度内在翻译后文本与图形数据的不同页的文本区之间传送；和传送控制/设置控制切换手段，用于在以下情况下，使设置控制手段控制所讨论页的设置，来取代由翻译后文本数据传送控制手段传送翻译后文本数据：a)标识图形的图形标识信息包含在图形区翻译后的文本数据中；b)在翻译后文本数据传送控制手段对翻译后文本数据进行传送之前，与该图形区翻译后的文本数据中包含的图形标识信息同一页中的文本区翻译后的文本数据中包含与该图形区翻译后的文本数据中包含的图形标识信息相同的图形标识信息；并且c)如果翻译后文本数据被翻译后文本数据传送控制手段传送，则图形标识信息将传送到不同页中。下面，将对此进行详细说明。

当可能进行将翻译后文本的字符串在不同页之间传送时，执行同一图形标号搜索处理110。具体而言，在特定字符串可能从其溢出到另一页的各页中进行同一图形标号搜索处理110，并判定是否允许这种流出。

在从特定页的文本区流出的字符串不包含诸如标号和标题的任何图形标识信息、或即使包含这种图形标识信息，但其并不对应于相同页的图形区中的图形标识信息的情况下，允许字符串这样流到另一页中。相反，在从特定页的文本区中流出的字符串包含图形标识信息并且其对应于相同页的图形区中的图形标识信息的情况下，不允许字符串流到另一页。

在同一图形标号搜索处理110中，对在不同页之间传送时，翻译后文本的字符串从其传送或传送到此的各页进行上述判定，以判定是否允许对这些字符的传送。仅对被允许的页进行这些字符的传送，并且确定待分配到各页的文本区的翻译后文本。结果，一些页的文本区可能由于不允许字符串流出到另一页，而被填满溢出，或由于不允许字符串从另一页中流入，一些页的文本区中可能包含空白。在同一图形标号搜索处理110中，判定应该对一些这种页进行组处理111并且不需要对其他页进行组处理111。

仅当上述同一图形标号搜索处理110判定需要执行组处理111时才执行组处理111。在第一实施例中描述了组处理111和重构处理的细节，因此将略去重复的说明。

根据本实施例，仅当在使标号与该标号所引用的图形位于相同页中为优选的情况下，由于翻译，文本区中的该图形标号可能被传送到另一页时，才进行文本大小缩放处理107和图形缩放处理108，以防止将标号传送到标号引用的图形并不位于其中的另一页中。因此，由于当参照图形阅读正文时，用户不必参照不同页，并且由于除必要时不改变字符和/或图形的大小，所以，用户将很容易阅读根据本发明获得的翻译后文本与图形。

其他实施例

前面已经说明了第一实施例和第二实施例，但是本发明还可以有下面的实施例。

1)在第一和第二实施例中，可以改变行距使得不用进行文本大小缩放处理107而使翻译后文本适合于文本区。

2)在第一和第二实施例中，可以通过放大或缩小余白的大小来调整文本区的大小使得可以将翻译后文本容纳于其中。

3)可以进行图形缩放处理108和文本大小缩放处理107两者来重构布局。在这种情况下可以设想一些模式。在第一种模式中，可以提供字符大小缩放因子的上限和下限，并且在所提供的限度内进行文本大小缩放处理107。在即使根据限度内的缩放因子缩小或放大字符大小，仍不能将文本区中的翻译后文本的图像容纳入与原始页相同的页中的情况下，进而进行图形缩放处理108以通过缩小或放大图形区来保留容纳文本区翻译后的文本数据的图像所需的面积。在第二种模式中，提供图形区缩放因子的上限和下限，并且在所提供的限度内进行图形缩放处理108。在即使根据限度内的缩放因子缩小或放大图形区后，仍不能将文本区中翻译后的文本数据的图像容纳在与原始页相同的页中的情况下，进行文本大小缩放处理107使得文本区翻译后的文本数据的图像能够容纳入文本区中。

4)在一些情况下，用户可以指定所谓的“N-Up”打印，其中“N-Up”将N个页的图像作为一组合图像输出在一页上。在这种情况下，同一图形标号搜索处理110可以进行以下判定。下文将给出对”2-Up”打印的示例的描述。

如图6中所示，假设这样一种情况：将生成翻译后文本与图形数据400-1，其为将输出在同一页面上的输入图像200-1和200-2的2-Up模式数据。在图6所示的示例中，输入图像200-1在其文本区201包含对应于包含在其图形区202中的图形标识信息的图形标识信息。在翻译后文本与图形数据400-1中，在一些情况下，由于翻译改变了字符数，对对应于输入图像200-1的页的文本区201中包含的图形标识信息“图1”的翻译可能不能容纳在相同文本区201中。在这种情况下，由于由图形标识信息“图1”标识的图形存在于相同页面中，在同一图形标号搜索处理110中允许将对“图1”的翻译从对应于输入图像200-1的页的文本区传送到对应于输入图像200-2的页的文本区201。进而在同一图形标号搜索处理110中判定是否需要对最初容纳翻译“图1”的页进行组处理111。

如图7所示，假设这样一种情况：将生成翻译后文本数据400-1(其使对应于输入图像200-1和200-2的数据以2-Up模式输出在同一页面中)和翻译后文本数据400-2(其使得对应于输入图像200-3和200-4的数据以2-Up模式输出在同一页面中)。在图7所示的示例中，对于输入图像200-1和200-2，对应于输入图像200-1的图形区202中存在的图形标识信息的图形标识信息存在于输入图像200-2的文本区201中。在翻译后文本与图形数据400-1中，在某些情况下，由于通过翻译处理改变了字符数，因而如果字符大小相同，则对对应于输入图像200-2的页的文本区201中容纳的图形标识信息“图1”的翻译不能容纳在文本区201中。如果允许将对图形标识信息“图1”的翻译传送到下一页(即对应于输入图像200-3的页)，则由图形标识信息“图1”标识的图形将不能与该图形标识信息存在于相同的页中。为了避免这种结果，在同一图形标号搜索处理110中，不允许传送字符串，并且判定应该对对应于输入图像200-2的数据进行组处理111。根据本实施例可以获得与上述第二实施例相同的效果。

5)在上述各实施例中，将翻译后文本数据作为文本数据存储在翻译后文本与图形数据的文本区和图形区中，使得生成翻译后文本与图形数据，该数据同时具有文本数据和图像数据。另选地，可以对翻译后文本数据进行成像以将经成像的翻译后文本映射到文本区和图形区，从而生成翻译后文本与图形数据，该数据包含全部图像数据。

6)在上述各实施例中，在多功能机中安装有图文档翻译程序。然而，本发明的实施例并不限于这种模式，而可以将上述实施例的有图文档翻译程序存储在诸如CD-ROM的计算机可读取记录介质中以发给普通用户。另选地，可以通过网络将有图文档翻译程序发给普通用户。

第三实施例

下面将参照附图给出对本发明第三实施例的描述。

图8为示出了根据本发明实施例的图像形成装置100的框图。如图所示，图像形成装置100具有翻译处理单元1、操作单元2、网络I/F单元3、存储器存储单元4、打印单元5和图像读取单元6。

打印单元5具有感光器、曝光单元、传送单元和定影单元(fixingunit)。打印单元5根据翻译处理单元1提供的图像数据生成色粉图像以并将该色粉图像定影在一页纸(其为记录介质)上。操作单元2具有由液晶显示器(未示出)形成的显示单元和各种按钮，从而可以接收来自用户的指令。用户使用操作单元2选择要使用的纸、输入各种打印设置等。

图像读取单元6扫描源文档的数据，并且作为图像数据输出。存储器存储单元4存储由图像读取单元6扫描的图像数据以及其他数据。通过网络I/F单元3使得能够进行翻译处理单元1、操作单元2、存储器存储单元4、打印单元5以及图像读取单元6之间的数据通信。

如图9所示，翻译处理单元1包括CPU(中央处理单元)11、RAM(随机访问存储器)12以及ROM(只读存储器)13。翻译处理单元1控制图像形成装置100的各单元，并执行各图像处理以及输入图像数据的翻译处理所需的计算。图像数据暂时存储在RAM 12中以待处理。在ROM 13中存储有图像数据处理和翻译处理所需的各种图像处理程序PRG和翻译程序PRG。

接下来将根据图10所示的流程图，给出由具有上述结构的图像形成装置100进行的操作的示例。在该示例中，由图像形成装置100读取源文档的图像，并且将包含在该图像中的日语翻译成英语。

将源文档置于图像读取单元6的扫描板(未示出)上，然后使图像读取单元6开始读取该文档。结果，图像读取单元6读取存在于扫描区的图像(步骤S01)。

图11A示出了由图像读取单元6读取的图像的一个示例。如图所示，扫描图像G为包括包含日语的原始文本J(包括由图中圆圈所示的部分)和图形Z的图像。

用户参照示出了诸如图11A中所示的图像的操作单元2的显示屏，操作诸如鼠标或键盘的输入仪器来移动指针或光标，以指定扫描图像G用于翻译的区域(步骤S02)。在该示例中，图像G的全部区域(图11A所示的图像G的全部)被指定为翻译区域。

当用户指定全部区域为翻译区域时，翻译处理单元1识别在图像G中指定的全部区域中的图像数据的文本。将识别出的文本从全部图像数据中提取出(步骤S03)。

然后翻译处理单元1对包含在所提取出的文本的区域中的图像数据进行OCR(光学字符阅读器)处理，将该区域中的文本的图像数据转变为文本数据，并且读取经转变的文本数据作为原始文本J的文本数据(步骤S04)。

随后翻译处理单元1的CPU11获得存储在ROM13中的语言信息并将语言信息与原始文本J的文本数据进行比较以识别出原始文本J的语言(步骤S05)。在该示例中，在将该文本与ROM13中的语言信息比较后，CPU11识别原始文本J的语言为日语。

此外，翻译处理单元1的CPU11从存储在ROM13中的翻译处理程序PGM中运行并执行日译英的翻译程序，从而生成英语的翻译后文本E的文本数据(步骤S06)。

在根据原始文本J生成翻译后文本E后，翻译处理单元1比较翻译后数据E和原始文本J的字符串的长度(步骤S07)。

在本实施例中，确定原始文本J的语义部分(例如分句或整句)的图像的横向长度为字符串的长度；并且通过将翻译后文本E的各字符在横向上的点数和横向上各字符间的间距的点数求和获得的长度确定为字符串的长度。将所确定的翻译后文本E的的字符串的长度与原始文本J的相比较。另选地，可以将原始文本J的字符串长度确定为语义部分横向上字符的点数之和。

翻译处理单元1根据原始文本J和翻译后文本E的字符串长度之间的比较结果，从诸如改变字体和/或点、均等间距等的校正处理中确定适当的处理，作为要应用到翻译后文本E的校正处理。翻译处理单元1然后进行经确定的校正处理以将翻译后文本E的字符串长度变为与原始文本J的长度相等(步骤S08)。

应当注意的是，当翻译后文本E的字符串长度落在预定点数范围(在视觉上，用户可认为是相同)内时，翻译处理单元1将翻译后文本E和原始文本J的字符串长度确定为彼此相等。

图12A示出了日语原始文本J的字符串和翻译后文本E的字符串。如图所示，翻译后文本E的字符串长于原始文本J的字符串。在这种情况下，翻译处理单元1根据原始文本J和翻译后文本E之间的字符串长度的比较结果，改变字体以及减小字符大小的点数作为校正处理。翻译处理单元1改变字体和字符大小点数，以减小字符串长度，从而如图12B所示，将翻译后文本E的字符串长度改变为与原始文本J的字符串长度相同的预定点数范围内。

接着，翻译处理单元1将进行了校正处理的翻译后文本E的文本数据加入到整个图像G的图像数据，从而字符串长度经过校正的翻译后文本E平行于并位于原始文本J的下面(步骤S09)。

当用户通过操作单元2输入了打印指令时，将在翻译处理单元1中处理过的图像数据输出到打印单元5，并且在打印单元5中，将表示图像数据的图像打印到纸上(步骤S10)。

结果，如图11B所示，在限定范围的整个部分中，字符串长度合适的英语的翻译后文本E(在图中以×标记示出)位于现存的日语原始文本J的下面。

因此，根据本实施例，通过改变翻译后文本E的字符的点数和字体，可以将翻译后文本E平行于原始文本J放置，且其字符串的长度与原始文本J的相同。结果，可以根据以这种方式放置的表示翻译后文本E和原始文本J的打印件，很容易地识别原始文本J和翻译后文本E之间的对应；因此，大大提高了打印件的可阅览性。

此外，由于在翻译前提取出图像数据中的文本数据，因而可以确保仅对包含图形的图像的字符或文本进行翻译。

在上述实施例中，给出了对翻译后文本的字符串长于原始文本的情况的说明。在翻译后文本的字符串短于原始文本的情况下，翻译处理单元1进行与上述相同的处理，使翻译后文本与原始文本相关地等间距排列，使得翻译后文本的长度与原始文本的相等，并且翻译后文本和原始文本彼此平行放置。

此外，在上述实施例中，由于通过改变翻译后文本中字符的点数或字体来校正字符串的长度，因而另选地可以将翻译后文本的字符改为注音型字符(ruby-type character)以校正翻译后文本的字符串长度。

在上述实施例中，给出了使字符串长度适合于原始文本的过程的示例的说明。显然，可以改变原始文本的字符串长度或原始文本和翻译后文本的字符串长度使其具有彼此相等的长度。在改变原始文本的字符串长度的情况下，可以在将原始文本转变为字符后，改变字符的字体或点数，或者可以将转变后的字符与翻译后文本相关地等间距排列。另选地，可以放大或缩小原始文本的图像数据的大小来进行调整。

只要字符横向上和字符之间间距中的点数是预定的，则不仅可以通过对点数求和，而且可以通过使用字符数来确定字符串的长度。另选地，可以根据打印输出的长度(毫米)来确定字符串的长度。

显然，原始文本和翻译后文本的语言并不限于上述实施例中所描述的那些，可以是德语、法语、俄语、西班牙语、汉语、韩国语和其他语种。

在上述实施例中，给出了假设本发明应用于图像形成装置100中的说明，但本发明不限于此。例如还可以提供一种仅具有上述图像形成装置100中翻译处理单元1的功能的翻译装置或图像处理装置。在这种情况下，翻译装置或图像处理装置可以是具有上述翻译处理单元1的功能的ASIC(特定用途集成电路)。此外，还可以通过将用于进行上述翻译处理的翻译处理程序PRG记录在诸如磁盘、软盘、CD(光盘)、DVD(多功能数码光盘)和RAM等的记录介质上来提供本发明。

如上所述，本发明提供了一种翻译装置，包括：字符识别单元，用于识别输入图像文本区的文本数据；翻译器，用于翻译所述文本区的文本数据；以及布局结构处理器，用于生成包含文本区翻译后文本数据和输入图像中图形的数据，其中在由所述布局结构处理器生成的数据的图像布局中保持输入图像的布局。

根据本发明实施例，所述布局结构处理器可以根据翻译后文本数据量和文本区大小，改变翻译后文本数据的设置。

根据另一实施例，所述布局结构处理器可以通过改变翻译后文本数据的字符的大小来生成翻译后文本数据。

根据另一实施例，所述布局结构处理器可以通过改变翻译后文本数据的行距来生成翻译后文本数据。

根据另一实施例，所述布局结构处理器可以通过改变翻译后文本数据周围的余白来生成翻译后文本数据。

根据另一实施例，所述布局结构处理器可以通过改变图形区的大小来生成数据。

根据本发明的又一实施例，所述翻译装置还可以包括图形再形成单元，用于在以下情况下再形成图形区：通过在预定区域内再形成文本区，可以将翻译后文本数据以与该文本数据相同的字符大小容纳在再形成的文本区中。

根据另一实施例，所述翻译装置还包括图形再形成单元，用于在以预定方式改变翻译后文本数据的设置，还不能将翻译后文本数据容纳在文本区中的情况下再形成文本区和图形区。

根据另一实施例，所述字符识别单元还可以对输入图像图形区的图像执行字符识别处理，以输出表示图形区字符的类型、位置和大小的图形区文本数据；所述翻译处理器还可以对图形区文本数据执行翻译处理，以输出要容纳到图形区的表示字符的类型、位置和大小的图形区翻译后文本数据；并且所述布局结构处理器还包括：翻译后数据传送控制器，用于将文本区翻译后文本数据在预定方式内在翻译后文本与图形数据的不同页的文本区之间进行传送；以及切换单元，用于在以下情况下对页的设置进行控制，代替对标识图形的图形标识信息进行传送：所述图形标识信息包含在该页的图形区翻译后文本数据中；在翻译后数据传送控制器对翻译后文本数据进行传送之前，包含该被包含图形标识信息的同一页的文本区翻译后文本数据中包含与该被包含图形标识信息相同的图形标识信息；并且如果所述翻译后数据传送控制器对翻译后文本数据进行传送，则该图形标识信息将被传送到另一页的文本区中。

根据另一实施例，字符识别单元还可以对输入图像的图形区图像执行字符识别处理，以输出表示图形区中字符的类型、位置和大小的图形区文本数据；所述翻译处理器还可以对图形区文本数据执行翻译处理，以输出表示要容纳到所述图形区的字符的类型、位置和大小的图形区翻译后文本数据；并且其中所述布局结构处理器可以包括：翻译后数据传送控制器，用于以预定方式将文本区翻译后文本数据在翻译后文本与图形数据的不同页的文本区之间进行传送；以及切换单元，用于在生成具有将多个页布置在同一页面的N-up结构的翻译后文本与图形数据时，在以下情况下对页的设置进行控制，代替对标识图形的图形标识信息进行传送：所述图形标识信息包含在布置在页面中的图形区翻译后文本数据中；在翻译后数据传送控制器对翻译后文本数据进行传送之前，包含该被包含图形标识信息的同一页面的文本区翻译后文本数据中包含与该被包含图形标识信息相同的图形标识信息；并且如果所述翻译后数据传送控制器对翻译后文本数据进行传送，则该图形标识信息将被传送到另一页面的文本区中。

如上所述，本发明提供了一种翻译装置，该翻译装置包括翻译处理器，用于翻译原始文本并进行校正使得原始文本字符串的长度和翻译后文本字符串的长度彼此基本相同，其中原始文本和翻译后文本平行放置。

根据本发明的实施例，所述翻译处理器可以改变原始文本和翻译后文本中至少之一的字符长度。

根据另一实施例，所述翻译处理器可以通过对字符间的空间和字符的点数求和来确定字符串的长度。

根据另一实施例，所述翻译处理器可以改变字符的点大小。

根据另一实施例，所述翻译处理器可以改变字符字体。

根据另一实施例，所述翻译处理器可以将字符改为注音型字符。

一方面，本发明提供了一种翻译方法，包括以下步骤：识别输入图像的文本区的文本数据；翻译文本区的文本数据；并且生成包含文本区翻译后文本数据和输入图像中的图形的数据，其中在生成步骤中生成的数据的图像布局中保持输入图像的布局。

另一方面，本发明还提供了翻译方法，包括以下步骤：翻译原始文本，并进行校正以使得原始文本的字符串的长度和翻译后文本的字符串长度彼此基本相同，其中原始文本和翻译后文本平行放置。

又一方面，本发明还提供了一种计算机可读取存储介质，所述存储介质存储这样的程序，其指令可由计算机执行，以实现翻译功能，所述功能包括：字符识别功能，用于识别输入图像文本区中的文本数据；翻译处理功能，用于翻译文本区的文本数据；以及布局结构处理功能，用于生成包含文本区翻译后文本数据和输入图像中的图形的数据，其中在由所述布局结构处理功能生成的数据的图像布局中保持输入图像的布局。

此外，本发明还提供了一种计算机可读取存储介质，所述存储介质存储这样的程序，其指令可由计算机执行，以实现翻译功能，所述功能包括：翻译处理功能，用于翻译原始文本，并进行校正以使得原始文本的字符串的长度和翻译后文本的字符串长度彼此基本相同，其中原始文本和翻译后文本平行放置。

为了解释和说明的目的，给出了对于本发明实施例的上述说明。这不是详尽的，也并不希望将本发明限于所公开的具体形式。显然，对于本领域技术人员来说，进行多种修改和变型是显而易见的。选择并说明了上述实施例是为了最好地说明本发明的原理和其实际应用，从而使得本领域其他技术人员能够理解本发明的各种实施例，并且在用于所设想的特定用途时进行各种适当的修改。本发明的范围由后面的权利要求书及其等同物来限定。

在此通过引用并入2005年3月22日提交的日本专利申请No.2005-82047和2005年3月25日提交的日本专利申请No.2005-90179的全部内容，包括说明书、权利要求书、附图和摘要。

Claims

1.一种翻译装置，所述翻译装置包括：

字符识别单元，用于识别输入图像文本区中的文本数据；

翻译器，用于翻译所述输入图像文本区中的文本数据；以及

布局结构处理器，用于通过改变翻译后文本数据的字符大小来生成包含文本区翻译后文本数据和输入图像中的图形的数据，从而在由所述布局结构处理器生成的数据的图像布局中保持输入图像的布局，

其中所述布局结构处理器通过改变图形区的大小来生成所述包含文本区翻译后文本数据和输入图像中的图形的数据，

其中所述字符识别单元还对输入图像中的图形区的图像进行字符识别处理，以输出表示图形区字符类型、位置和大小的图形区文本数据；

其中所述翻译器还对图形区文本数据进行翻译处理，以输出图形区翻译后文本数据，所述图形区翻译后文本数据表示要容纳入该图形区的字符的类型、位置和大小；并且

其中所述布局结构处理器包括：

翻译后数据传送控制器，用于在预定的传输数据量限度内将文本区翻译后文本数据在翻译后文本与图形数据的不同页的文本区之间进行传送；和

切换单元，用于在以下情况下对页的设置进行控制，代替对标识图形的图形标识信息进行传送：在该页的图形区翻译后的文本数据中包含所述图形标识信息；在所述翻译后数据传送控制器对该翻译后文本数据进行传送之前，在已经包含有所述图形区翻译后文本数据中所包含的图形标识信息的页的同一页的文本区翻译后文本数据中，包含这样的图形标识信息，该图形标识信息与所述图形区翻译后文本数据中所包含的图形标识信息相同；并且如果所述翻译后数据传送控制器对翻译后文本数据进行传送，则该图形标识信息将被传送到另一页的文本区中。

2.根据权利要求1所述的翻译装置，其中所述布局结构处理器根据翻译后文本数据量和文本区的大小来改变翻译后文本数据的设置。

3.根据权利要求1所述的翻译装置，其中所述布局结构处理器通过改变翻译后文本数据的行距来生成翻译后文本数据。

4.根据权利要求1所述的翻译装置，其中所述布局结构处理器通过改变翻译后文本数据周围的余白来生成翻译后文本数据。

5.一种翻译装置，所述翻译装置包括：

字符识别单元，用于识别输入图像文本区中的文本数据；

翻译器，用于翻译所述输入图像文本区中的文本数据；以及

其中所述字符识别单元还对输入图像中的图形区的图像进行字符识别处理，以输出表示图形区中的字符的类型、位置和大小的图形区文本数据；

其中所述翻译器还对图形区文本数据进行翻译处理，以输出图形区翻译后文本数据，所述图形区翻译后文本数据表示要容纳入图形区的字符的类型、位置和大小；并且

所述布局结构处理器包括：

翻译后数据传送控制器，用于在预定的传送数据量限度内将文本区翻译后文本数据在翻译后文本与图形数据的不同页的文本区之间进行传送；和

切换单元，用于在生成具有将多个页设置在相同页面上的N-up结构的翻译后文本与图形数据时，在以下情况下对页的设置进行控制，代替对标识图形的图形标识信息进行传送：在页面中的图形区翻译后文本数据中包含所述图形标识信息；在翻译后数据传送控制器对翻译后文本数据进行传送之前，在已经包含有所述图形区翻译后文本数据中包含的图形标识信息的页面的同一页面的文本区翻译后文本数据中，包含这样的图形标识信息，该图形标识信息与所述图形区翻译后文本数据中所包含的图形标识信息相同；并且如果所述翻译后数据传送控制器对翻译后文本数据进行传送，则该图形标识信息将被传送到另一页面的文本区中。

6.一种翻译方法，所述方法包括以下步骤：

字符识别步骤，识别输入图像文本区中的文本数据；

翻译步骤，翻译所述输入图像文本区中的文本数据；以及

布局结构处理步骤，通过改变翻译后文本数据的字符大小来生成包含文本区翻译后文本数据和输入图像中的图形的数据，从而在生成的数据的图像布局中保持输入图像的布局，

其中通过改变图形区的大小来生成所述包含文本区翻译后文本数据和输入图像中的图形的数据，

其中在所述字符识别步骤中还对输入图像中的图形区的图像进行字符识别处理，以输出表示图形区字符类型、位置和大小的图形区文本数据；

其中在所述翻译步骤中还对图形区文本数据进行翻译处理，以输出图形区翻译后文本数据，所述图形区翻译后文本数据表示要容纳入该图形区的字符的类型、位置和大小；并且

其中所述布局结构处理步骤包括：

翻译后数据传送控制步骤，用于在预定的传输数据量限度内将文本区翻译后文本数据在翻译后文本与图形数据的不同页的文本区之间进行传送；和

切换步骤，用于在以下情况下对页的设置进行控制，代替对标识图形的图形标识信息进行传送：在该页的图形区翻译后的文本数据中包含所述图形标识信息；在所述翻译后数据传送控制步骤对该翻译后文本数据进行传送之前，在已经包含有所述图形区翻译后文本数据中所包含的图形标识信息的页的同一页的文本区翻译后文本数据中，包含这样的图形标识信息，该图形标识信息与所述图形区翻译后文本数据中所包含的图形标识信息相同；并且如果所述翻译后数据传送控制步骤对翻译后文本数据进行传送，则该图形标识信息将被传送到另一页的文本区中。

7.根据权利要求6所述的翻译方法，其中所述布局结构处理步骤根据翻译后文本数据量和文本区的大小来改变翻译后文本数据的设置。

8.根据权利要求6所述的翻译方法，其中所述布局结构处理步骤通过改变翻译后文本数据的行距来生成翻译后文本数据。

9.根据权利要求6所述的翻译方法，其中所述布局结构处理步骤改变翻译后文本数据周围的余白来生成翻译后文本数据。

10.一种翻译方法，所述方法包括以下步骤：

字符识别步骤，识别输入图像文本区中的文本数据；

翻译步骤，翻译所述输入图像文本区中的文本数据；以及

其中在所述字符识别步骤中还对输入图像中的图形区的图像进行字符识别处理，以输出表示图形区中的字符的类型、位置和大小的图形区文本数据；

其中在所述翻译步骤中还对图形区文本数据进行翻译处理，以输出图形区翻译后文本数据，所述图形区翻译后文本数据表示要容纳入图形区的字符的类型、位置和大小；并且

所述布局结构处理步骤包括：

翻译后数据传送控制步骤，用于在预定的传送数据量限度内将文本区翻译后文本数据在翻译后文本与图形数据的不同页的文本区之间进行传送；和

切换步骤，用于在生成具有将多个页设置在相同页面上的N-up结构的翻译后文本与图形数据时，在以下情况下对页的设置进行控制，代替对标识图形的图形标识信息进行传送：在页面中的图形区翻译后文本数据中包含所述图形标识信息；在翻译后数据传送控制步骤对翻译后文本数据进行传送之前，在已经包含有所述图形区翻译后文本数据中包含的图形标识信息的页面的同一页面的文本区翻译后文本数据中，包含这样的图形标识信息，该图形标识信息与所述图形区翻译后文本数据中所包含的图形标识信息相同；并且如果所述翻译后数据传送控制步骤对翻译后文本数据进行传送，则该图形标识信息将被传送到另一页面的文本区中。