JP2007034430A - Translation device, translation method, and program - Google Patents

Translation device, translation method, and program Download PDF

Info

Publication number
JP2007034430A
JP2007034430A JP2005213346A JP2005213346A JP2007034430A JP 2007034430 A JP2007034430 A JP 2007034430A JP 2005213346 A JP2005213346 A JP 2005213346A JP 2005213346 A JP2005213346 A JP 2005213346A JP 2007034430 A JP2007034430 A JP 2007034430A
Authority
JP
Japan
Prior art keywords
abbreviation
sentence
image
translation
phrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005213346A
Other languages
Japanese (ja)
Other versions
JP4852918B2 (en
Inventor
Naoko Sato
直子 佐藤
Masatoshi Tagawa
昌俊 田川
Michihiro Tamune
道弘 田宗
Atsushi Ito
篤 伊藤
Hiroshi Masuichi
博 増市
Kiyoshi Tashiro
潔 田代
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2005213346A priority Critical patent/JP4852918B2/en
Publication of JP2007034430A publication Critical patent/JP2007034430A/en
Application granted granted Critical
Publication of JP4852918B2 publication Critical patent/JP4852918B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Facsimiles In General (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a technology which can make the layout of a translated sentence identical to that of an original sentence when a document generated with a certain language is translated with a different language. <P>SOLUTION: A translation device 1 determines, for each unit area which constitutes an original sentence, whether a translated sentence corresponding to an original sentence arranged in a unit area can be arranged with the same layout as the original sentence in the unit area. When the result of the determination is that the translated sentence cannot be arranged with the same layout as the original sentence in the unit area, the translation device extracts words and phrases, which satisfy preliminarily determined conditions, from the translated sentence as the abbreviation-object words and phrases, and then determines abbreviation words obtained by abbreviating part of a character string constituting the abbreviation-object words and phrases. Then, the translation device generates a translated sentence in which the abbreviation-object words and phrases are converted to abbreviation words, generates the image of the translated sentence with the same layout as the original sentence, and generates images representing the definitions of the abbreviation words. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、文書を異なる言語の文書に翻訳する技術に関する。   The present invention relates to a technique for translating a document into a document of a different language.

ある言語で記述された文章を他言語の文章に翻訳すると文章の文字数が増える場合がある。例えば、日本語の漢字仮名混じり文を英文に翻訳すると、一般に文字数が増える。図4は、日本語で記載された原文の例である。図5は、この原文を英語に翻訳した翻訳文の例である。この例で示されるように、翻訳文の文字数が原文の文字数より増えると、翻訳文の画像を原文と同一のレイアウトで生成することができなくなる場合がある。ここで、レイアウトとは、ページ内における文章や図表の配置、文字サイズ 文字間隔 行間隔等を意味する。   If a sentence written in one language is translated into a sentence in another language, the number of characters in the sentence may increase. For example, translating Japanese kanji-kana mixed sentences into English generally increases the number of characters. FIG. 4 is an example of the original text written in Japanese. FIG. 5 is an example of a translation sentence obtained by translating the original sentence into English. As shown in this example, if the number of characters in the translated sentence is larger than the number of characters in the original sentence, the translated sentence image may not be generated with the same layout as the original sentence. Here, the layout means the arrangement of sentences and diagrams on the page, character size, character spacing, line spacing, and so on.

例えば、仮に原文と同一の文字サイズ、文字間隔および行間隔にて翻訳文の画像を生成すると、文章の外観上の長さが長くなる。文章の外観上の長さが長くなると、章、節、項の区切りの位置、図表類の位置などの変更が生じ得るため、文書の外観の印象が変化してしまう。また、ページ数が増加することもあり得る。しかし、原文と翻訳文の外観の印象は近似していることが望ましい。また、ページ数の増加も避けることが望ましい。
一方、翻訳文の文字サイズを小さくすると文章の外観上の長さを短縮することができる。しかし、文字サイズを小さくすると文章が読みにくくなってしまう。文字間隔を小さくする、行間隔を小さくする、などの手段を用いたとしても文章が読みにくくなってしまう。
上述のとおり、文書を他言語に翻訳する際に、翻訳文のレイアウトを原文と常に同一にすることは従来の技術では不可能である。
For example, if an image of a translated sentence is generated with the same character size, character spacing, and line spacing as the original sentence, the length of the sentence on the external appearance becomes longer. When the length of the appearance of a sentence becomes long, the impression of the appearance of the document changes because the positions of chapters, sections, paragraph breaks, charts and the like may change. In addition, the number of pages may increase. However, it is desirable that the impressions of the appearance of the original text and the translated text are similar. It is also desirable to avoid an increase in the number of pages.
On the other hand, if the character size of the translated sentence is reduced, the length of the appearance of the sentence can be shortened. However, if the character size is reduced, the text becomes difficult to read. Even if means such as reducing the character spacing or the line spacing are used, the text becomes difficult to read.
As described above, when translating a document into another language, it is impossible with the conventional technique to always make the translated sentence layout the same as the original sentence.

ところで、語句を構成する文字列の一部を削除することによって省略語を作成し、この省略語を用いて文章を作成する技術が知られている。例えば、特許文献1に開示されている技術においては、予め定められた条件に該当する単語列を抽出し、抽出された単語列に含まれる文字の一部を一定の規則に従って削除することによって省略語を作成する。例えば、名詞等、特定の品詞が所定数以上連続し、これと同一の単語列が所定数以上文中に存在するならば、この単語列に含まれる単語の先頭文字を用いて省略語を作成する。そして、この単語列を省略語で置き換えた文章を生成する。これによって、頻出する長い語句が自動的に省略語に変換されるから、ユーザの負担を増すことなく、読みやすい文章を作成することができるようになる。
特開平11−328166号公報
By the way, a technique for creating an abbreviation by deleting a part of a character string constituting a phrase and creating a sentence using the abbreviation is known. For example, in the technique disclosed in Patent Document 1, a word string corresponding to a predetermined condition is extracted, and a part of characters included in the extracted word string is deleted according to a certain rule. Create a word. For example, if a predetermined number or more of a specific part of speech such as a noun is continuous and there are a predetermined number or more of the same word string in the sentence, an abbreviation is created using the first character of the word included in the word string . Then, a sentence in which this word string is replaced with an abbreviation is generated. As a result, frequently occurring long phrases are automatically converted into abbreviations, so that an easy-to-read sentence can be created without increasing the burden on the user.
JP 11-328166 A

上記の特許文献1で開示されている技術を用いれば、文章の文字数を減らすことができる。しかし、この技術では、予め定められた条件に該当する単語列の文字数を削減するにすぎないから、文章の外観上の長さを制御することができない。従って、この技術では、翻訳文のレイアウトを原文と常に同一にすることができるとは限らない。
本発明は、上述した背景の下になされたものであり、ある言語で作成された文書を異なる言語の文書に翻訳する際に、翻訳文のレイアウトを原文と同一にすることのできる技術の提供を目的とする。
If the technique disclosed in Patent Document 1 is used, the number of characters in the sentence can be reduced. However, this technique only reduces the number of characters in a word string that meets a predetermined condition, and thus cannot control the length of the appearance of a sentence. Therefore, with this technique, the layout of the translated sentence cannot always be the same as the original sentence.
The present invention has been made under the above-described background, and provides a technique capable of making the layout of the translated sentence the same as that of the original sentence when translating a document created in a language into a document in a different language. With the goal.

上述の課題を解決するために、本発明は、異種言語間で同じ意味の単語を対応付けて記憶した辞書と、原文の記載された原稿の画像を入力する入力手段と、前記入力手段で入力された画像で表される原稿のレイアウトを解析し、該原稿を構成する単位領域を認識する画像解析手段と、前記入力手段で入力された画像に含まれている原文の文字列を認識する文字認識手段と、前記文字認識手段で認識された文字列に対応する翻訳語を前記辞書から抽出して翻訳文を生成する翻訳手段と、前記画像解析手段で認識された単位領域毎に、当該単位領域に配置されている原文に対応する翻訳文を該原文と同一のレイアウトにて当該単位領域に配置することができるか否かを判定する判定手段と、前記判定手段による判定の結果、前記翻訳文を前記原文と同一のレイアウトにて当該単位領域に配置することができない場合に、予め定められた第1の条件を満たす語句を省略対象語句として該翻訳文から抽出する抽出手段と、前記抽出手段で抽出された省略対象語句を構成する文字列の一部を省略した省略語を決定する省略語決定手段と、前記抽出手段で抽出された省略対象語句を前記省略語決定手段で決定された省略語に変換した翻訳文を生成する変換手段と、前記変換手段で生成された翻訳文の画像を前記原文と同一のレイアウトにて生成するとともに、前記省略語決定手段で決定された省略語の定義を表す画像を生成する画像生成手段と、前記画像生成手段で生成された画像を出力する出力手段とを有することを特徴とする翻訳装置を提供する。   In order to solve the above-described problems, the present invention relates to a dictionary that stores words having the same meaning in different languages in association with each other, an input unit that inputs an image of a document in which the original text is described, and an input unit that uses the input unit. An image analyzing unit that analyzes a layout of a document represented by the displayed image and recognizes a unit area constituting the document, and a character that recognizes a character string of the original text included in the image input by the input unit Recognizing means; translation means for extracting a translation word corresponding to the character string recognized by the character recognizing means from the dictionary; generating a translated sentence; and for each unit area recognized by the image analyzing means, Determining means for determining whether or not a translated sentence corresponding to the original sentence arranged in the area can be arranged in the unit area in the same layout as the original sentence; and as a result of the determination by the determining means, the translation The sentence When it is impossible to arrange in the unit area in the same layout, an extraction unit that extracts a phrase that satisfies a predetermined first condition from the translated sentence as an abbreviation target phrase, and extracted by the extraction unit An abbreviation determination means for determining an abbreviation in which a part of a character string constituting the abbreviation target phrase is omitted, and an abbreviation target phrase extracted by the extraction means is converted into an abbreviation determined by the abbreviation determination means A conversion means for generating a translation sentence, and an image representing the definition of the abbreviation determined by the abbreviation determination means while generating an image of the translation sentence generated by the conversion means in the same layout as the original sentence There is provided a translation apparatus comprising: an image generating means for generating; and an output means for outputting an image generated by the image generating means.

また、上述の課題を解決するために、本発明は、原文の記載された原稿の画像を入力する入力ステップと、前記入力ステップで入力された画像で表される原稿のレイアウトを解析し、該原稿を構成する単位領域を認識する画像解析ステップと、前記入力ステップで入力された画像に含まれている原文の文字列を認識する文字認識ステップと、前記文字認識ステップで認識された文字列に対応する翻訳語を異種言語間で同じ意味の単語を対応付けて記憶した辞書から抽出して翻訳文を生成する翻訳ステップと、前記画像解析ステップで認識された単位領域毎に、当該単位領域に配置されている原文に対応する翻訳文を該原文と同一のレイアウトにて当該単位領域に配置することができるか否かを判定する判定ステップと、前記判定ステップによる判定の結果、前記翻訳文を前記原文と同一のレイアウトにて当該単位領域に配置することができない場合に、予め定められた第1の条件を満たす語句を省略対象語句として該翻訳文から抽出する抽出ステップと、前記抽出ステップで抽出された省略対象語句を構成する文字列の一部を省略した省略語を決定する省略語決定ステップと、前記抽出ステップで抽出された省略対象語句を前記省略語決定ステップで決定された省略語に変換した翻訳文を生成する変換ステップと、前記変換ステップで生成された翻訳文の画像を前記原文と同一のレイアウトにて生成するとともに、前記省略語決定ステップで決定された省略語の定義を表す画像を生成する画像生成ステップと、前記画像生成ステップで生成された画像を出力する出力ステップとを有することを特徴とする翻訳方法を提供する。   In order to solve the above-described problem, the present invention analyzes an input step of inputting an image of a document in which the original text is described, and a layout of the document represented by the image input in the input step, An image analysis step for recognizing a unit area constituting the document, a character recognition step for recognizing a character string of the original text included in the image input in the input step, and a character string recognized in the character recognition step For each unit region recognized in the image analysis step, a translation step that extracts a corresponding translated word from a dictionary that stores words having the same meaning in different languages in association with each other and generates a translated sentence. A determination step for determining whether or not a translated sentence corresponding to the arranged original sentence can be arranged in the unit area in the same layout as the original sentence; and As a result of the determination, when the translated sentence cannot be arranged in the unit area in the same layout as the original sentence, a phrase satisfying a first predetermined condition is extracted from the translated sentence as an abbreviation target phrase. An abbreviation determination step for determining an abbreviation obtained by omitting a part of the character string constituting the abbreviation target word / phrase extracted in the extraction step; an abbreviation target word / phrase extracted in the extraction step; A conversion step for generating the translated sentence converted into the abbreviation determined in the determination step, and an image of the translation sentence generated in the conversion step is generated in the same layout as the original sentence, and in the abbreviation determination step An image generation step for generating an image representing the definition of the abbreviation determined; and an output step for outputting the image generated in the image generation step. To provide a translation method comprising Rukoto.

また、上述の課題を解決するために、本発明は、コンピュータ装置を、異種言語間で同じ意味の単語を対応付けて記憶した辞書と、原文の記載された原稿の画像を入力する入力手段と、前記入力手段で入力された画像で表される原稿のレイアウトを解析し、該原稿を構成する単位領域を認識する画像解析手段と、前記入力手段で入力された画像に含まれている原文の文字列を認識する文字認識手段と、前記文字認識手段で認識された文字列に対応する翻訳語を前記辞書から抽出して翻訳文を生成する翻訳手段と、前記画像解析手段で認識された単位領域毎に、当該単位領域に配置されている原文に対応する翻訳文を該原文と同一のレイアウトにて当該単位領域に配置することができるか否かを判定する判定手段と、前記判定手段による判定の結果、前記翻訳文を前記原文と同一のレイアウトにて当該単位領域に配置することができない場合に、予め定められた第1の条件を満たす語句を省略対象語句として該翻訳文から抽出する抽出手段と、前記抽出手段で抽出された省略対象語句を構成する文字列の一部を省略した省略語を決定する省略語決定手段と、前記抽出手段で抽出された省略対象語句を前記省略語決定手段で決定された省略語に変換した翻訳文を生成する変換手段と、前記変換手段で生成された翻訳文の画像を前記原文と同一のレイアウトにて生成するとともに、前記省略語決定手段で決定された省略語の定義を表す画像を生成する画像生成手段と、前記画像生成手段で生成された画像を出力する出力手段として機能させるためのプログラムを提供する。   In order to solve the above-described problem, the present invention provides a computer apparatus in which a dictionary storing words having the same meaning in different languages in association with each other, and an input unit for inputting an image of a document in which the original text is described. Analyzing the layout of the document represented by the image input by the input means, recognizing the unit area constituting the document, and the original text included in the image input by the input means Character recognition means for recognizing a character string, translation means for extracting a translation word corresponding to the character string recognized by the character recognition means from the dictionary and generating a translation sentence, and a unit recognized by the image analysis means A determination unit that determines whether a translated sentence corresponding to an original sentence arranged in the unit area can be arranged in the unit area for each area in the same layout as the original sentence; and Judgment As a result, when the translated sentence cannot be arranged in the unit area in the same layout as the original sentence, an extraction means for extracting from the translated sentence a word that satisfies a predetermined first condition as an abbreviation target phrase An abbreviation determination means for determining an abbreviation obtained by omitting a part of a character string constituting the abbreviation target phrase extracted by the extraction means, and an abbreviation determination means for the abbreviation target phrase extracted by the extraction means A conversion unit that generates a translated sentence converted into the abbreviation determined in step (b), an image of the translation sentence generated by the conversion unit is generated in the same layout as the original sentence, and the abbreviation determination unit determines An image generation means for generating an image representing the definition of the abbreviation and a program for functioning as an output means for outputting the image generated by the image generation means.

上記の翻訳装置または翻訳方法もしくはプログラムによれば、原文を構成する単位領域毎に、当該単位領域に配置されている原文に対応する翻訳文を原文と同一のレイアウトにて当該単位領域に配置することができるか否かが判定される。判定の結果、翻訳文を原文と同一のレイアウトにて当該単位領域に配置することができない場合に、予め定められた第1の条件を満たす語句が省略対象語句として翻訳文から抽出される。次に、省略対象語句を構成する文字列の一部を省略した省略語が決定される。次に、省略対象語句を省略語に変換した翻訳文が生成され、翻訳文の画像が原文と同一のレイアウトにて生成され、省略語の定義を表す画像が生成される。   According to the above translation apparatus, translation method, or program, for each unit area constituting the original sentence, the translated sentence corresponding to the original sentence arranged in the unit area is arranged in the unit area in the same layout as the original sentence. It is determined whether or not As a result of the determination, if the translated sentence cannot be arranged in the unit area in the same layout as the original sentence, a phrase satisfying a first predetermined condition is extracted from the translated sentence as an abbreviation target phrase. Next, an abbreviation in which a part of the character string constituting the abbreviation target phrase is omitted is determined. Next, a translation sentence in which the abbreviation target phrase is converted into an abbreviation is generated, an image of the translation sentence is generated with the same layout as the original sentence, and an image representing the definition of the abbreviation is generated.

本発明によれば、ある言語で作成された文書を異なる言語の文書に翻訳する際に、翻訳文のレイアウトを原文と同一にすることができる。   According to the present invention, when a document created in a language is translated into a document in a different language, the layout of the translated sentence can be made the same as the original sentence.

以下、図面を参照して、本発明の実施形態について説明する。
<第1実施形態>
<構成>
翻訳装置1は、入力された原文を翻訳して目的言語の翻訳文を得る翻訳機能と、原稿を読み取って複製物を作成する複写機能とを有している。
まず、翻訳装置1のハードウェア構成について説明する。図1は、本発明の実施形態における翻訳装置1のハードウェア構成を示す図である。
翻訳装置1は、CPU(Central Processing Unit)44、ROM(Read Only Memory)45、RAM(Random Access Memory)46等(いずれも図示省略)からなる制御部4を有し、ROM45に格納されているOS(Operating System)プログラムをCPU44が実行することによって翻訳装置1各部の制御を行う。
Embodiments of the present invention will be described below with reference to the drawings.
<First Embodiment>
<Configuration>
The translation apparatus 1 has a translation function for translating an input original sentence to obtain a target language translation sentence, and a copying function for reading a manuscript and creating a duplicate.
First, the hardware configuration of the translation apparatus 1 will be described. FIG. 1 is a diagram illustrating a hardware configuration of a translation apparatus 1 according to an embodiment of the present invention.
The translation apparatus 1 includes a control unit 4 including a CPU (Central Processing Unit) 44, a ROM (Read Only Memory) 45, a RAM (Random Access Memory) 46, and the like (all not shown), and is stored in the ROM 45. Each part of the translation apparatus 1 is controlled by the CPU 44 executing an OS (Operating System) program.

記憶部5は、ハードディスク装置等の不揮発性メモリである。記憶部5には、原稿の読取、翻訳、出力等の手順を記述したプログラムが記憶されている。
指示入力部41は、テンキー、スタートボタン等からなるキーボード40、タッチパネル機能を有する液晶パネルからなる表示部39を備えており、翻訳装置1に対する指示をユーザが入力することができる。また、翻訳装置1に異常等が発生した場合に、表示部39に翻訳装置1の状態に関する情報を表示することができる。
給紙トレイ9には画像を形成するためのシート10が収容される。ユーザが指示入力部41により画像形成の指示を入力すると、給紙ローラ33が回転駆動され、給紙トレイ9からシート10を1枚ずつ送り出す。給紙トレイ9から送り出されたシート10はローラ対34、35、37によって搬送路36に沿って搬送される。
The storage unit 5 is a nonvolatile memory such as a hard disk device. The storage unit 5 stores a program describing procedures such as reading, translating, and outputting a document.
The instruction input unit 41 includes a keyboard 40 including a numeric keypad and a start button, and a display unit 39 including a liquid crystal panel having a touch panel function. The user can input an instruction to the translation apparatus 1. In addition, when an abnormality or the like occurs in the translation apparatus 1, information regarding the state of the translation apparatus 1 can be displayed on the display unit 39.
A sheet 10 for forming an image is accommodated in the sheet feed tray 9. When the user inputs an image formation instruction using the instruction input unit 41, the paper feed roller 33 is driven to rotate, and the sheets 10 are sent out from the paper feed tray 9 one by one. The sheet 10 sent out from the paper feed tray 9 is conveyed along a conveyance path 36 by roller pairs 34, 35, and 37.

画像入力部12は、原稿を光学的に読み取って画像データを生成するスキャナ装置である。プラテンガラス2上に載置された原稿に対して光源13により光が照射され、この反射光が光学系3によって処理される。反射光は、ミラー14、15、16を介して受光部17で受光される。そして、画像処理部18が反射光を電気信号に変換し、イエロー、マゼンタ、シアン、ブラックの各色からなる画像データを生成する。   The image input unit 12 is a scanner device that optically reads a document and generates image data. The original placed on the platen glass 2 is irradiated with light from the light source 13, and the reflected light is processed by the optical system 3. The reflected light is received by the light receiving unit 17 via the mirrors 14, 15 and 16. Then, the image processing unit 18 converts the reflected light into an electrical signal, and generates image data composed of each color of yellow, magenta, cyan, and black.

画像形成部6は、画像形成エンジン7Y、7M、7C、7K、転写ベルト8等からなる。
画像形成エンジン7Y、7M、7C、7Kは、それぞれイエロー(Y)、マゼンタ(M)、シアン(C)、ブラック(K)の各色のトナー像を形成する。各画像形成エンジンの構成は共通であるから、ここでは画像形成エンジン7Yについてのみ説明する。
画像形成エンジン7Yは、静電潜像が形成される像担持体としての感光体ドラム20Yの周囲に、帯電装置21Y、露光装置19Y、現像装置22Y、クリーナ24Y等を設けて構成されている。
The image forming unit 6 includes image forming engines 7Y, 7M, 7C, and 7K, a transfer belt 8, and the like.
The image forming engines 7Y, 7M, 7C, and 7K form toner images of yellow (Y), magenta (M), cyan (C), and black (K), respectively. Since the configuration of each image forming engine is common, only the image forming engine 7Y will be described here.
The image forming engine 7Y includes a charging device 21Y, an exposure device 19Y, a developing device 22Y, a cleaner 24Y, and the like around a photosensitive drum 20Y as an image carrier on which an electrostatic latent image is formed.

帯電装置21Yは、矢印Aの方向に回転駆動される感光体ドラム20Yの表面を所定の電位に帯電させる。
露光装置19Yは、所定の電位に帯電した感光体ドラム20Yに対して、画像データに基づいた露光用ビームLBを照射するROS(Raster Output Scanner)である。露光装置19Yは、図示しない半導体レーザーから画像データに基づいてレーザー光を出射し、このレーザー光を偏向走査することにより感光体ドラム20Yの表面に静電潜像を形成する。感光体ドラム20Yの表面では、レーザー光が照射された部分の電位が、感光体ドラム20Yの有する光導電性により所定のレベルまで減少する。このように、感光体ドラム20Yの表面電位が変化することにより、感光体ドラム20Yの表面には画像データにもとづいた静電潜像が形成される。
The charging device 21Y charges the surface of the photosensitive drum 20Y that is rotationally driven in the direction of arrow A to a predetermined potential.
The exposure device 19Y is a ROS (Raster Output Scanner) that irradiates a photosensitive drum 20Y charged to a predetermined potential with an exposure beam LB based on image data. The exposure device 19Y emits a laser beam based on image data from a semiconductor laser (not shown), and forms an electrostatic latent image on the surface of the photoreceptor drum 20Y by deflecting and scanning the laser beam. On the surface of the photoreceptor drum 20Y, the potential of the portion irradiated with the laser light is reduced to a predetermined level due to the photoconductivity of the photoreceptor drum 20Y. As described above, when the surface potential of the photosensitive drum 20Y changes, an electrostatic latent image based on the image data is formed on the surface of the photosensitive drum 20Y.

現像装置22Yは、感光体ドラム20Y表面に形成された静電潜像を顕像化する装置である。トナータンク23Yからはトナー(帯電色材)が供給され、感光体ドラム20Yの帯電極性と同極性に帯電したトナーによって静電潜像を反転現像することによってトナー像を得る。
転写ベルト8は、ローラ26、27、28、29に張架されており、矢印Bの方向に循環駆動される。感光体ドラム20Yはその下方に位置する転写ベルト8と圧接しており、上記のようにして形成されたトナー像が転写ベルト8に転写される。
クリーナ24Yは、感光体ドラム20Yに残存したトナーを除去する装置である。
The developing device 22Y is a device that visualizes the electrostatic latent image formed on the surface of the photosensitive drum 20Y. Toner (charged color material) is supplied from the toner tank 23Y, and a toner image is obtained by reversal development of the electrostatic latent image with toner charged to the same polarity as that of the photosensitive drum 20Y.
The transfer belt 8 is stretched around rollers 26, 27, 28, and 29, and is circulated and driven in the direction of arrow B. The photosensitive drum 20Y is in pressure contact with the transfer belt 8 positioned below the photosensitive drum 20Y, and the toner image formed as described above is transferred to the transfer belt 8.
The cleaner 24Y is a device that removes the toner remaining on the photosensitive drum 20Y.

以上が画像形成エンジン7Yの構成である。画像形成エンジン7M、7C、7Kにおいても各色に対応したトナー像が形成され、転写ベルト8に重ねて転写される。なお、これ以降、画像形成エンジン7Y、7M、7C、7Kを区別する必要のない場合には、単に画像形成エンジン7と称する。他の構成要素についても同様に、Y、M、C、Kの別を区別する必要のない場合には、Y、M、C、Kの表記を省略するものとする。   The above is the configuration of the image forming engine 7Y. In the image forming engines 7M, 7C, and 7K, toner images corresponding to the respective colors are formed and transferred onto the transfer belt 8 in an overlapping manner. Hereinafter, when it is not necessary to distinguish the image forming engines 7Y, 7M, 7C, and 7K, they are simply referred to as the image forming engine 7. Similarly, for other components, the Y, M, C, and K notations are omitted when it is not necessary to distinguish between Y, M, C, and K.

給紙トレイ9から搬送路36上に送り出されたシート10は、転写ベルト8と転写ローラ30とが形成するニップ部に進入し、転写ベルト8に圧接される。この圧接力および静電吸引力によってトナー像がシート10の表面に転写される。
トナー像が転写されたシート10は、ローラ対31によって定着装置11に導かれる。定着装置11においては、シート10に対して加圧および加熱が施され、トナー像がシート10に定着される。このようにして画像形成が行われたシート10は、排紙トレイ32に排出される。
The sheet 10 sent out from the paper feed tray 9 onto the conveyance path 36 enters a nip portion formed by the transfer belt 8 and the transfer roller 30 and is pressed against the transfer belt 8. The toner image is transferred to the surface of the sheet 10 by this pressure contact force and electrostatic attraction force.
The sheet 10 on which the toner image is transferred is guided to the fixing device 11 by the roller pair 31. In the fixing device 11, the sheet 10 is pressed and heated to fix the toner image on the sheet 10. The sheet 10 on which the image is formed in this manner is discharged to the paper discharge tray 32.

次に、翻訳装置1の機能構成について説明する。図2は、翻訳装置1の機能構成を表す図である。CPU44が記憶部5に記憶されているプログラムを実行することによってこれらの機能が実現される。
辞書201は、異種言語間で同じ意味の単語を対応付けて記憶したものであり、記憶部5に格納されている。辞書201は、日本語、英語、中国語など種々の言語に対応したものが記憶されている。また、辞書201には、単語の品詞の種別を表す情報が各単語と対応付けられて記憶されている。
Next, the functional configuration of the translation apparatus 1 will be described. FIG. 2 is a diagram illustrating a functional configuration of the translation apparatus 1. These functions are realized by the CPU 44 executing the program stored in the storage unit 5.
The dictionary 201 stores words having the same meaning in different languages in association with each other, and is stored in the storage unit 5. The dictionary 201 stores various languages such as Japanese, English, and Chinese. Further, the dictionary 201 stores information indicating the type of part of speech of the word in association with each word.

省略語辞書202は、語句を構成する文字列の一部を省略した省略語を当該語句と対応付けて記憶したものであり、記憶部5に格納されている。省略語辞書202も、日本語、英語、中国語など種々の言語に対応したものが記憶されている。
図6は、省略語辞書202の例を示す図である。同図においては、英語の省略語辞書の例が示されている。例えば、原語「next-generation」の省略語として「N-G」が対応付けられて記憶されている。省略語辞書202には、予め任意に定められた省略語を記憶させておいてもよいし、あるいは、後述する省略語生成手段107によって生成された省略語を記憶させてもよい。
The abbreviation dictionary 202 stores abbreviations in which a part of a character string constituting a phrase is omitted in association with the phrase, and is stored in the storage unit 5. The abbreviation dictionary 202 also stores data corresponding to various languages such as Japanese, English, and Chinese.
FIG. 6 is a diagram illustrating an example of the abbreviation dictionary 202. In the figure, an example of an English abbreviation dictionary is shown. For example, “NG” is stored in association with the abbreviation of the original word “next-generation”. The abbreviation dictionary 202 may store abbreviations arbitrarily determined in advance, or may store abbreviations generated by the abbreviation generator 107 described later.

入力手段101は、原文の記載された原稿の画像を入力する。具体的には、入力手段101は、画像入力部12を用いて原稿の画像を入力し、原稿の画像を表す原稿画像データを生成する。
画像解析手段102は、入力手段101で入力された画像で表される原稿のレイアウトを解析し、この原稿を構成する単位領域を認識する。ここで、レイアウトとは、ページ内における文章や図表の配置、文字サイズ 文字間隔 行間隔等を意味する。レイアウト解析によって、原稿を構成する文章領域、図表領域、絵柄領域などが区別して認識される。さらに、文章領域における章、節、項などの区切り、表中のセルの区切りなどが認識される。そして、これらの区切りによって区切られた各領域が単位領域として認識される。例えば図4の例では、「1.はじめに」に後続する行から「2.XMLの特徴」の直前の行までが1つの単位量域として認識される。
The input unit 101 inputs an image of a document in which the original text is described. Specifically, the input unit 101 inputs an image of a document using the image input unit 12 and generates document image data representing the image of the document.
The image analysis unit 102 analyzes the layout of the document represented by the image input by the input unit 101 and recognizes unit areas constituting the document. Here, the layout means the arrangement of sentences and diagrams on the page, character size, character spacing, line spacing, and so on. Through the layout analysis, a text area, a chart area, a picture area, and the like constituting the original are distinguished and recognized. Furthermore, chapters, sections, paragraphs, etc. in the text area, and cell divisions in the table are recognized. Each area delimited by these delimiters is recognized as a unit area. For example, in the example of FIG. 4, the line from “1. Introduction” to the line immediately before “2.XML features” is recognized as one unit quantity region.

文字認識手段103は、入力手段101で入力された画像に含まれている原文の文字列を認識する。記憶部5には公知のOCR(Optical Character Recognition)プログラムが記憶されており、CPU44がこのOCRプログラムを実行することによって文字認識が行われる。   The character recognition unit 103 recognizes a character string of the original text included in the image input by the input unit 101. The storage unit 5 stores a known OCR (Optical Character Recognition) program, and character recognition is performed by the CPU 44 executing the OCR program.

翻訳手段104は、入力手段101で入力された画像に含まれる原文を翻訳先言語で記述された文に翻訳して翻訳文を生成する。翻訳文の生成には公知の方法を用いる。例えば、形態素解析手法を用いて原文を形態素に分割し、構文解析手法、意味解析手法を用いて原文の構文を解析して構文木を作成し、翻訳先言語における構文木に変換する。そして、各形態素に対応する訳語を辞書201から抽出して構文木にあてはめ、翻訳文を生成する。   The translation unit 104 translates the original sentence included in the image input by the input unit 101 into a sentence described in the translation destination language to generate a translation sentence. A known method is used to generate a translation. For example, the original text is divided into morphemes using a morphological analysis technique, the syntax of the original text is analyzed using a syntax analysis technique and a semantic analysis technique, and a syntax tree is created, which is converted into a syntax tree in the target language. Then, the translation corresponding to each morpheme is extracted from the dictionary 201 and applied to the syntax tree to generate a translated sentence.

判定手段105は、画像解析手段102で認識された単位領域毎に、当該単位領域に配置されている原文に対応する翻訳文を原文と同一のレイアウトにて当該単位領域に配置することができるか否かを判定する。例えば、図4の例における「1.はじめに」に後続する単位領域においては、図5の例に示されるように翻訳文の行数(18行)が原文の行数(14行)を上回っている。従って、この例では、翻訳文を原文と同一のレイアウトにて当該単位領域に配置することができないと判定される。   For each unit region recognized by the image analysis unit 102, the determination unit 105 can arrange the translated sentence corresponding to the original sentence arranged in the unit area in the unit area in the same layout as the original sentence. Determine whether or not. For example, in the unit area following “1. Introduction” in the example of FIG. 4, the number of translated text lines (18 lines) exceeds the number of original text lines (14 lines) as shown in the example of FIG. Yes. Therefore, in this example, it is determined that the translated sentence cannot be arranged in the unit area in the same layout as the original sentence.

抽出手段106は、判定手段105による判定の結果、翻訳文を原文と同一のレイアウトにて当該単位領域に配置することができない場合に、予め定められた第1の条件を満たす語句を省略対象語句として翻訳文から抽出する。ここで、予め定められた第1の条件とは、例えば、予め定められた上限値を上回る文字数の名詞または名詞句が翻訳文中に出現する出現回数が予め定められた上限値を上回る場合である。図6に省略語辞書202の例を示す。例えば、原語「next-generation」は文字数が15である。文字数の上限値を例えば10に設定した場合、「next-generation」が省略対象語句として抽出される。なお、出現回数の上限値は任意の値であり、1でもよい。
抽出手段106における省略対象語句の抽出の条件は上記の他にも任意の条件を用いることが可能である。例えば、単語よりも熟語を優先して省略対象語句として抽出するようにしてもよい。あるいは、翻訳文において用いられる省略語の種類が最も少なくなるように省略対象語句を抽出するようにしてもよい。
If the result of determination by the determining unit 105 is that the translated sentence cannot be arranged in the unit area in the same layout as the original sentence, the extracting unit 106 selects a phrase that satisfies the first condition that is determined in advance. As extracted from the translation. Here, the predetermined first condition is, for example, a case where the number of appearances of a noun or a noun phrase having more characters than the predetermined upper limit exceeds the predetermined upper limit. . FIG. 6 shows an example of the abbreviation dictionary 202. For example, the original word “next-generation” has 15 characters. When the upper limit of the number of characters is set to 10, for example, “next-generation” is extracted as an abbreviation target phrase. The upper limit value of the number of appearances is an arbitrary value and may be 1.
In addition to the above, any condition can be used as the condition for extracting the omitted words / phrases in the extracting means 106. For example, idioms may be extracted as abbreviation target phrases with priority over words. Alternatively, the abbreviation target phrases may be extracted so that the number of abbreviations used in the translated sentence is minimized.

省略語生成手段107は、語句を構成する文字列の一部を予め定められた規則に従って省略した省略語を生成する。省略語の生成方法は任意の方法を用いることが可能である。以下に、省略語の生成方法の例を列挙する。
<方法1>省略対象語句が単語の場合には、省略対象語句の先頭から所定数の文字を用いて省略語を生成する。例えば、省略対象語句が「specification」である場合には、先頭から4文字を用いることにより「spec」なる省略語が生成される。
<方法2>省略対象語句が単語の場合には、省略対象語句の先頭文字と、先頭文字に後続する子音とを出現順に並べることによって省略語を生成する。例えば、省略対象語句が「source」である場合には、「src」なる省略語が生成される。
<方法3>方法2において、先頭文字に後続する子音のうち最初に出現する子音のみを用いる。例えば、省略対象語句が「green」である場合には、「gr」なる省略語が生成される。
The abbreviation generation means 107 generates abbreviations in which a part of a character string constituting a phrase is omitted according to a predetermined rule. An arbitrary method can be used as the method for generating the abbreviation. Examples of abbreviation generation methods are listed below.
<Method 1> When the abbreviation target phrase is a word, an abbreviation is generated using a predetermined number of characters from the beginning of the abbreviation target phrase. For example, when the abbreviation target phrase is “specification”, the abbreviation “spec” is generated by using the first four characters.
<Method 2> When the abbreviation target phrase is a word, the abbreviation is generated by arranging the first character of the abbreviation target phrase and the consonant following the first character in the order of appearance. For example, when the abbreviation target phrase is “source”, an abbreviation “src” is generated.
<Method 3> In Method 2, only the consonant that appears first among the consonants following the first character is used. For example, when the abbreviation target phrase is “green”, an abbreviation “gr” is generated.

<方法4>省略対象語句が熟語(2つ以上の単語からなる語句)の場合には、省略対象語句を構成する各単語の先頭文字を出現順に並べることによって省略語を生成する。例えば、省略対象語句が「markup language」である場合には、「ML」なる省略語が生成される。
<方法5>省略対象語句が熟語の場合には、省略対象語句を構成する単語のうち最後に出現する単語を除く各単語の先頭文字と、最後に出現する単語を構成するすべての文字とを出現順に並べることによって省略語を生成する。例えば、省略対象語句が「target value」である場合には、「tvalue」なる省略語が生成される。
<Method 4> When an abbreviation target phrase is a idiom (a phrase composed of two or more words), an abbreviation is generated by arranging the first characters of the words constituting the abbreviation target phrase in the order of appearance. For example, when the abbreviation target phrase is “markup language”, an abbreviation “ML” is generated.
<Method 5> When the abbreviation target phrase is a idiom, the first character of each word excluding the word that appears last among the words that constitute the abbreviation target phrase, and all the characters that constitute the word that appears last Abbreviations are generated by arranging them in order of appearance. For example, when the abbreviation target phrase is “target value”, an abbreviation “tvalue” is generated.

省略語決定手段108は、抽出手段106で抽出された省略対象語句を構成する文字列の一部を省略した省略語を決定する。省略語の決定は、省略語辞書202および省略語生成手段107を用いて行う。まず、抽出手段106で抽出された省略対象語句に対応する省略語を省略語辞書202から抽出する。省略対象語句に対応する省略語が省略語辞書202に記憶されていない場合には、省略語生成手段107により省略対象語句の省略語を生成する。
省略語の決定においては、最初の試行で原文と同一のレイアウトに収まる翻訳文が生成されるとは限らない。そのため、省略語決定手段108によって省略語を一旦決定した後、この省略語を用いた翻訳文が原文と同一のレイアウトに収まるか否かを判定手段105を用いて判定する。判定の結果、同一のレイアウトに収まらない場合には、文字数の上限値または出現回数の上限値を引き下げる(第2の条件)ことによってさらに省略語を生成し、この省略語を用いた翻訳文が原文と同一のレイアウトに収まるか否かを判定手段105を用いて判定する。省略語決定手段108は、省略語を用いた翻訳文が原文と同一のレイアウトに収まるようになるまで、この一連の処理を繰り返す。
The abbreviation determination means 108 determines an abbreviation obtained by omitting a part of the character string constituting the abbreviation target phrase extracted by the extraction means 106. The abbreviation is determined using the abbreviation dictionary 202 and the abbreviation generator 107. First, abbreviations corresponding to the abbreviation target phrases extracted by the extraction unit 106 are extracted from the abbreviation dictionary 202. If the abbreviation corresponding to the abbreviation target phrase is not stored in the abbreviation dictionary 202, the abbreviation generation means 107 generates an abbreviation for the abbreviation target phrase.
In determining abbreviations, a translated sentence that fits in the same layout as the original sentence is not always generated in the first trial. For this reason, after the abbreviation determination means 108 once determines an abbreviation, it is determined using the determination means 105 whether or not a translation using this abbreviation fits in the same layout as the original sentence. As a result of the determination, if they do not fit in the same layout, an abbreviation is further generated by lowering the upper limit of the number of characters or the upper limit of the number of appearances (second condition), and a translation using this abbreviation is It is determined using the determination means 105 whether or not it fits in the same layout as the original text. The abbreviation determination means 108 repeats this series of processing until the translated sentence using the abbreviation comes into the same layout as the original sentence.

変換手段109は、抽出手段106で抽出された省略対象語句を省略語決定手段108で決定された省略語に変換した翻訳文を生成する。
画像生成手段110は、変換手段109で生成された翻訳文の画像を原文と同一のレイアウトにて生成するとともに、省略語決定手段108で決定された省略語の定義を表す画像を生成する。省略語の定義を表す画像は、例えば翻訳文の余白部分に配置する。画像生成手段110は、翻訳文と省略語の定義とを表すテキスト、文書のレイアウトからなる文書データをページ記述言語を用いて生成する。
出力手段111は、画像生成手段110で生成されたデータに基づいて画像を出力する。具体的には、画像生成手段110で生成された文書データをラスタデータに変換し、画像形成部6に供給する。すると、翻訳文を表す画像がシート表面に形成されて排紙トレイ32に排出される。
The conversion unit 109 generates a translated sentence obtained by converting the abbreviation target phrase extracted by the extraction unit 106 into the abbreviation determined by the abbreviation determination unit 108.
The image generation unit 110 generates an image of the translated sentence generated by the conversion unit 109 with the same layout as the original sentence, and generates an image representing the definition of the abbreviation determined by the abbreviation determination unit 108. An image representing the definition of the abbreviation is placed, for example, in the margin of the translated sentence. The image generation unit 110 generates document data including a text representing a translated sentence and an abbreviation definition and a document layout using a page description language.
The output unit 111 outputs an image based on the data generated by the image generation unit 110. Specifically, the document data generated by the image generation unit 110 is converted into raster data and supplied to the image forming unit 6. Then, an image representing the translated text is formed on the sheet surface and discharged to the paper discharge tray 32.

<動作>
次に、翻訳装置1の動作について説明する。ここで、翻訳装置1には電源が投入されており、CPU44がプログラムを実行中であるものとする。図3は、翻訳装置1の動作のフローを示す図である。また、以下に示す処理は、CPU44が記憶部5に記憶されているプログラムを実行することによって行われるものであるから、以下の説明においては、動作の主体をCPU44とする。
最初にステップA01では、CPU44は、入力手段101を用いて、原文の記載された紙文書(原稿)の読み取りを行う。原文(日本語)の記載された原稿の例を図4に示す。ユーザは、原文の記載された面がプラテンガラス2に接するように原稿を載置し、指示入力部41のスタートボタンを押下する。すると、画像入力部12が画像の読み取りを開始する。ステップA02では、CPU44は、読み取った原稿の画像を表す画像データを生成し、記憶部5に記憶させる。
<Operation>
Next, the operation of the translation apparatus 1 will be described. Here, it is assumed that the translation apparatus 1 is powered on and the CPU 44 is executing a program. FIG. 3 is a diagram illustrating an operation flow of the translation apparatus 1. In addition, since the processing shown below is performed by the CPU 44 executing a program stored in the storage unit 5, in the following description, the main subject of the operation is the CPU 44.
First, in step A01, the CPU 44 uses the input unit 101 to read a paper document (original) in which the original text is described. FIG. 4 shows an example of a manuscript in which the original text (Japanese) is written. The user places the document so that the surface on which the original text is written is in contact with the platen glass 2, and presses the start button of the instruction input unit 41. Then, the image input unit 12 starts reading an image. In step A <b> 02, the CPU 44 generates image data representing the read original image and stores it in the storage unit 5.

次に、ステップA03では、CPU44は、画像解析手段102を用いて、入力された画像で表される原稿のレイアウトを解析し、この原稿を構成する単位領域を認識する。図4の例では、「1.はじめに」に後続する行から「2.XMLの特徴」の直前の行までが1つの単位量域として認識される。
ステップA04では、CPU44は、文字認識手段103を用いて、入力された画像に含まれている原文の文字列を認識する。
Next, in step A03, the CPU 44 uses the image analysis unit 102 to analyze the layout of the document represented by the input image, and recognizes unit areas constituting the document. In the example of FIG. 4, a line from “1. Introduction” to a line immediately before “2. XML features” is recognized as one unit quantity region.
In step A04, the CPU 44 uses the character recognition means 103 to recognize the original character string contained in the input image.

ステップA05では、CPU44は、翻訳手段104を用いて、入力された画像に含まれる原文を翻訳先言語で記述された文に翻訳して翻訳文を生成する。図4に示されている原文(日本語)を英語に翻訳した例を図5に示す。図4において「1.はじめに」に後続する単位領域に配置されている原文の行数が14行であるのに対して、図5においては、当該原文の翻訳文の行数が18行に増加している。
ステップA06では、CPU44は、判定手段105を用いて、単位領域毎に、当該単位領域に配置されている原文に対応する翻訳文を原文と同一のレイアウトにて当該単位領域に配置することができるか否かを判定する。例えば、図4における「1.はじめに」に後続する単位領域においては、図5に示されるように翻訳文の行数が原文の行数を上回っている。従って、この例では、翻訳文を原文と同一のレイアウトにて当該単位領域に配置することができない(ステップA06:NO)と判定され、ステップA07に進む。
In step A05, the CPU 44 uses the translation unit 104 to translate the original sentence included in the input image into a sentence described in the translation destination language to generate a translated sentence. FIG. 5 shows an example in which the original text (Japanese) shown in FIG. 4 is translated into English. In FIG. 4, the number of lines of the original text arranged in the unit area following “1. Introduction” is 14 lines, whereas in FIG. 5, the number of translated text lines of the original text is increased to 18 lines. is doing.
In step A06, using the determination unit 105, the CPU 44 can arrange, for each unit area, a translated sentence corresponding to the original sentence arranged in the unit area in the unit area in the same layout as the original sentence. It is determined whether or not. For example, in the unit area following “1. Introduction” in FIG. 4, the number of lines in the translated sentence exceeds the number of lines in the original sentence as shown in FIG. Therefore, in this example, it is determined that the translated sentence cannot be arranged in the unit area in the same layout as the original sentence (step A06: NO), and the process proceeds to step A07.

ステップA07では、CPU44は、判定手段105による判定の結果、翻訳文を原文と同一のレイアウトにて当該単位領域に配置することができない場合に、抽出手段106を用いて、予め定められた第1の条件を満たす語句を省略対象語句として翻訳文から抽出する。図5の例において、文字数の上限値を13、出現回数の上限値を1とすると、「next-generation」、「markup language」、「specification」、「electronic commerce」の合計4つの語句が省略対象語句として抽出される。   In step A07, if the result of determination by the determination means 105 is that the translated sentence cannot be placed in the unit area in the same layout as the original sentence, the CPU 44 uses the extraction means 106 to determine a first predetermined value. A phrase satisfying the above condition is extracted from the translated sentence as an abbreviation target phrase. In the example of FIG. 5, if the upper limit of the number of characters is 13 and the upper limit of the number of appearances is 1, a total of four words “next-generation”, “markup language”, “specification”, and “electronic commerce” can be omitted. Extracted as a phrase.

ステップA08では、CPU44は、省略語決定手段108を用いて、抽出手段106で抽出された省略対象語句を構成する文字列の一部を省略した省略語を決定する。この例においては、図6に示されるように、上記の4つの語句の省略語が省略語辞書202に記憶されているので、各省略対象語句に対応する省略語を省略語辞書202から抽出する。また、この例においては、ステップA09では、上記の4つの語句の省略語が省略語辞書202に記憶されているので、省略語辞書202への省略語の記憶(ステップA09)は行わない。   In step A08, the CPU 44 uses the abbreviation determination means 108 to determine an abbreviation in which a part of the character string constituting the abbreviation target phrase extracted by the extraction means 106 is omitted. In this example, as shown in FIG. 6, since the abbreviations of the above four terms are stored in the abbreviation dictionary 202, the abbreviations corresponding to each abbreviation target phrase are extracted from the abbreviation dictionary 202. . In this example, in step A09, the abbreviations of the above four words are stored in the abbreviation dictionary 202, so the abbreviations are not stored in the abbreviation dictionary 202 (step A09).

ステップA10では、CPU44は、変換手段109を用いて、省略対象語句を省略語決定手段108で決定された省略語に変換する。そして、ステップA06に戻り、判定手段105を用いて、単位領域毎に、当該単位領域に配置されている原文に対応する翻訳文を原文と同一のレイアウトにて当該単位領域に配置することができるか否かを判定する。図7は省略語を用いた翻訳文の例を示す図である。同図に示すように、省略語の使用によって翻訳文の行数が14行となっている。従って、この例においては、当該単位領域に配置されている原文に対応する翻訳文を原文と同一のレイアウトにて当該単位領域に配置することができると判定される(ステップA06:YES)。この判定の結果、CPU44はステップA11に進み、画像生成手段110を用いて、省略対象語句を省略語に変換した翻訳文を表す画像を原文と同一のレイアウトにて生成する。さらに、省略語の定義を表す画像を翻訳文の画像の余白部分に配置する。そして、生成された画像を表す文書データを生成し、出力手段111に供給する。CPU44は、出力手段44を用いて、文書データをラスタデータに変換し、画像形成部6に供給する。すると、翻訳文を表す画像がシート表面に形成されて排紙トレイ32に排出される。
以上が、翻訳装置1の動作のフローである。
In step A10, the CPU 44 uses the conversion means 109 to convert the abbreviation target phrase into the abbreviation determined by the abbreviation determination means 108. Then, returning to step A06, the translation means corresponding to the original text arranged in the unit area can be arranged in the unit area in the same layout as the original text for each unit area using the determination unit 105. It is determined whether or not. FIG. 7 is a diagram showing an example of a translated sentence using abbreviations. As shown in the figure, the number of translated sentences is 14 by using abbreviations. Therefore, in this example, it is determined that the translated sentence corresponding to the original sentence arranged in the unit area can be arranged in the unit area with the same layout as the original sentence (step A06: YES). As a result of this determination, the CPU 44 proceeds to step A11 and uses the image generation means 110 to generate an image representing the translated sentence obtained by converting the abbreviation target phrase into an abbreviation with the same layout as the original sentence. Furthermore, an image representing the definition of the abbreviation is placed in the margin of the translated sentence image. Then, document data representing the generated image is generated and supplied to the output unit 111. The CPU 44 converts the document data into raster data using the output unit 44 and supplies the raster data to the image forming unit 6. Then, an image representing the translated text is formed on the sheet surface and discharged to the paper discharge tray 32.
The above is the operation flow of the translation apparatus 1.

次に、表中に記載された省略対象語句を省略語に変換する例について説明する。図8は、日本語で記述された表の例を示す図である。この表を英語で記述された表に翻訳する場合、「色」の欄に配置された語句は英語に翻訳すると文字数が増加するため原文と同一のレイアウト、すなわち該当するセルの枠内に収まらなくなる。そこで、この例では、「色」の欄に配置されている語句を省略対象語句とし、これらを省略語に変換する。図9は、省略語を用いて作成した表の例を示す図である。この例では、省略対象語句の先頭から2文字を用いて省略語を作成している。「色」は「co」に、「黒」は「bl」に、「黄」は「ye」に、「緑」は「gr」に、それぞれ変換される。そして、各省略語の定義を表す文字列が余白部分(この例では表の上側)に出力される。このようにして、翻訳文を原文と同一のレイアウトにて作成することができるようになる。   Next, an example of converting an abbreviation target phrase described in the table into an abbreviation will be described. FIG. 8 shows an example of a table written in Japanese. When this table is translated into a table written in English, the words placed in the “color” column will not fit within the same layout of the original text, that is, the corresponding cell frame, because the number of characters increases when translated into English. . Therefore, in this example, the words / phrases arranged in the “color” column are set as abbreviation target words / phrases and these are converted into abbreviations. FIG. 9 is a diagram illustrating an example of a table created using abbreviations. In this example, an abbreviation is created using two characters from the beginning of the abbreviation target phrase. “Color” is converted to “co”, “black” to “bl”, “yellow” to “ye”, and “green” to “gr”. Then, a character string representing the definition of each abbreviation is output in the margin (in this example, the upper side of the table). In this way, the translated sentence can be created with the same layout as the original sentence.

以上説明したように、本発明に係る翻訳装置は、原文を構成する単位領域毎に、当該単位領域に配置されている原文に対応する翻訳文を原文と同一のレイアウトにて当該単位領域に配置することができるか否かを判定する。判定の結果、翻訳文を原文と同一のレイアウトにて当該単位領域に配置することができない場合に、予め定められた第1の条件を満たす語句を省略対象語句として翻訳文から抽出する。次に、省略対象語句を構成する文字列の一部を省略した省略語を決定する。次に、省略対象語句を省略語に変換した翻訳文を生成し、翻訳文の画像を原文と同一のレイアウトにて生成し、省略語の定義を表す画像を生成する。よって、本発明によれば、ある言語で作成された文書を異なる言語の文書に翻訳する際に、翻訳文のレイアウトを原文と同一にすることができる。   As described above, the translation apparatus according to the present invention arranges, for each unit area constituting the original sentence, the translated sentence corresponding to the original sentence arranged in the unit area in the unit area in the same layout as the original sentence. It is determined whether or not it can be performed. As a result of the determination, if the translated sentence cannot be arranged in the unit area in the same layout as the original sentence, a phrase satisfying a first predetermined condition is extracted from the translated sentence as an abbreviation target phrase. Next, an abbreviation in which a part of the character string constituting the abbreviation target phrase is omitted is determined. Next, a translation sentence in which the abbreviation target phrase is converted into an abbreviation is generated, an image of the translation sentence is generated with the same layout as the original sentence, and an image representing the definition of the abbreviation is generated. Therefore, according to the present invention, when a document created in one language is translated into a document in a different language, the layout of the translated sentence can be made the same as the original sentence.

<変形例>
以上説明した形態に限らず、本発明は種々の形態で実施可能である。例えば、上述の実施形態を以下のように変形した形態でも実施可能である。
<Modification>
The present invention is not limited to the form described above, and can be implemented in various forms. For example, the embodiment described above can be modified as follows.

上述の実施形態においては、省略語の決定の際に、省略対象語句に対応する省略語を省略語辞書202から抽出し、省略対象語句に対応する省略語が省略語辞書202に記憶されていない場合には、省略語生成手段107により省略対象語句の省略語を生成するようになっているが、省略語生成手段107のみを用いる構成としてもよい。   In the embodiment described above, the abbreviation corresponding to the abbreviation target phrase is extracted from the abbreviation dictionary 202 when the abbreviation is determined, and the abbreviation corresponding to the abbreviation target phrase is not stored in the abbreviation dictionary 202. In this case, an abbreviation of the abbreviation target phrase is generated by the abbreviation generator 107, but only the abbreviation generator 107 may be used.

画像入力部12は、翻訳装置1にネットワークを介して接続された別体のスキャナ装置であってもよい。また、画像形成部6は、翻訳装置1にネットワークを介して接続された別体のプリンタ装置であってもよい。   The image input unit 12 may be a separate scanner device connected to the translation device 1 via a network. The image forming unit 6 may be a separate printer device connected to the translation device 1 via a network.

翻訳装置1のハードウェア構成を示す図である。2 is a diagram illustrating a hardware configuration of a translation apparatus 1. FIG. 翻訳装置1の機能構成を表す図である。2 is a diagram illustrating a functional configuration of a translation apparatus 1. FIG. 翻訳装置1の動作のフローを示す図である。It is a figure which shows the flow of operation | movement of the translation apparatus. 日本語で記載された原文の例である。This is an example of the original text written in Japanese. 原文を英語に翻訳した翻訳文の例である。It is an example of the translation sentence which translated the original sentence into English. 省略語辞書202の例を示す図である。It is a figure which shows the example of the abbreviation dictionary. 省略語を用いた翻訳文の例を示す図である。It is a figure which shows the example of the translation using an abbreviation. 日本語で記述された表の例を示す図である。It is a figure which shows the example of the table | surface described in Japanese. 省略語を用いて作成した表の例を示す図である。It is a figure which shows the example of the table | surface created using the abbreviation.

符号の説明Explanation of symbols

1…翻訳装置、4…制御部、5…記憶部、41…指示入力部、9…給紙トレイ、10…シート、12…画像入力部、6…画像形成部、7Y、7M、7C、7K…画像形成エンジン、8…転写ベルト、201…辞書、202…省略語辞書、44…CPU、45…ROM、46…RAM、101…入力手段、102…画像解析手段、103…文字認識手段、104…翻訳手段、105…判定手段、106…抽出手段、107…省略語生成手段、108…省略語決定手段、109…変換手段、110…画像生成手段、111…出力手段。   DESCRIPTION OF SYMBOLS 1 ... Translation apparatus, 4 ... Control part, 5 ... Memory | storage part, 41 ... Instruction input part, 9 ... Paper feed tray, 10 ... Sheet, 12 ... Image input part, 6 ... Image formation part, 7Y, 7M, 7C, 7K DESCRIPTION OF SYMBOLS ... Image formation engine, 8 ... Transfer belt, 201 ... Dictionary, 202 ... Abbreviation dictionary, 44 ... CPU, 45 ... ROM, 46 ... RAM, 101 ... Input means, 102 ... Image analysis means, 103 ... Character recognition means, 104 ... translation means, 105 ... determination means, 106 ... extraction means, 107 ... abbreviation generation means, 108 ... abbreviation determination means, 109 ... conversion means, 110 ... image generation means, 111 ... output means.

Claims (18)

異種言語間で同じ意味の単語を対応付けて記憶した辞書と、
原文の記載された原稿の画像を入力する入力手段と、
前記入力手段で入力された画像で表される原稿のレイアウトを解析し、該原稿を構成する単位領域を認識する画像解析手段と、
前記入力手段で入力された画像に含まれている原文の文字列を認識する文字認識手段と、
前記文字認識手段で認識された文字列に対応する翻訳語を前記辞書から抽出して翻訳文を生成する翻訳手段と、
前記画像解析手段で認識された単位領域毎に、当該単位領域に配置されている原文に対応する翻訳文を該原文と同一のレイアウトにて当該単位領域に配置することができるか否かを判定する判定手段と、
前記判定手段による判定の結果、前記翻訳文を前記原文と同一のレイアウトにて当該単位領域に配置することができない場合に、予め定められた第1の条件を満たす語句を省略対象語句として該翻訳文から抽出する抽出手段と、
前記抽出手段で抽出された省略対象語句を構成する文字列の一部を省略した省略語を決定する省略語決定手段と、
前記抽出手段で抽出された省略対象語句を前記省略語決定手段で決定された省略語に変換した翻訳文を生成する変換手段と、
前記変換手段で生成された翻訳文の画像を前記原文と同一のレイアウトにて生成するとともに、前記省略語決定手段で決定された省略語の定義を表す画像を生成する画像生成手段と、
前記画像生成手段で生成された画像を出力する出力手段と
を有することを特徴とする翻訳装置。
A dictionary in which words of the same meaning are stored in association with each other in different languages,
An input means for inputting an image of a document in which the original document is described;
Image analysis means for analyzing a layout of a document represented by an image input by the input means and recognizing a unit area constituting the document;
Character recognition means for recognizing the original text string contained in the image input by the input means;
Translation means for extracting a translation word corresponding to the character string recognized by the character recognition means from the dictionary and generating a translation sentence;
For each unit area recognized by the image analysis means, it is determined whether or not the translated sentence corresponding to the original sentence arranged in the unit area can be arranged in the unit area in the same layout as the original sentence. Determination means to perform,
As a result of the determination by the determination means, if the translated sentence cannot be arranged in the unit area in the same layout as the original sentence, the phrase that satisfies a first condition that is determined in advance is used as the abbreviation target phrase Extraction means for extracting from the sentence;
Abbreviation determination means for determining an abbreviation obtained by omitting a part of the character string constituting the abbreviation target phrase extracted by the extraction means;
Conversion means for generating a translated sentence obtained by converting the abbreviation target phrase extracted by the extraction means into the abbreviation determined by the abbreviation determination means;
An image generation unit that generates an image of the translation sentence generated by the conversion unit in the same layout as the original sentence, and generates an image representing the definition of the abbreviation determined by the abbreviation determination unit;
A translation apparatus comprising: output means for outputting the image generated by the image generation means.
前記変換手段で生成された翻訳文に対し、前記判定手段を用いた判定を行い、該判定の結果、該翻訳文を前記原文と同一のレイアウトにて当該単位領域に配置することができない場合に、予め定められた第2の条件を満たす語句を省略対象語句として該翻訳文から抽出し、該省略対象語句を前記省略語決定手段に供給する省略語再決定手段を有することを特徴とする請求項1に記載の翻訳装置。   When the translated text generated by the converting means is determined using the determining means, and as a result of the determination, the translated text cannot be arranged in the unit area in the same layout as the original text And abbreviation re-determination means for extracting a phrase satisfying a predetermined second condition from the translation as an abbreviation target phrase and supplying the abbreviation target phrase to the abbreviation determination means. Item 2. The translation device according to Item 1. 語句を構成する文字列の一部を省略した省略語を該語句と対応付けて記憶した省略語辞書を有し、
前記省略語決定手段は、前記抽出手段で抽出された省略対象語句に対応する省略語を前記省略語辞書から抽出する
ことを特徴とする請求項1または2に記載の翻訳装置。、
An abbreviation dictionary storing abbreviations in which a part of a character string constituting a phrase is omitted in association with the phrase;
The translation device according to claim 1, wherein the abbreviation determination unit extracts an abbreviation corresponding to the abbreviation target phrase extracted by the extraction unit from the abbreviation dictionary. ,
語句を構成する文字列の一部を予め定められた規則に従って省略した省略語を生成する省略語生成手段を有し、
前記省略語決定手段は、前記抽出手段で抽出された省略対象語句に対応する省略語が前記省略語辞書に記憶されていない場合には、前記省略語生成手段により該省略対象語句の省略語を生成する
ことを特徴とする請求項3に記載の翻訳装置。
Abbreviation generation means for generating abbreviations in which a part of a character string constituting a phrase is omitted according to a predetermined rule;
When the abbreviation corresponding to the abbreviation target phrase extracted by the extraction means is not stored in the abbreviation dictionary, the abbreviation determination means determines the abbreviation of the abbreviation target phrase by the abbreviation generation means. The translation device according to claim 3, wherein the translation device is generated.
語句を構成する文字列の一部を予め定められた規則に従って省略した省略語を生成する省略語生成手段を有し、
前記省略語決定手段は、前記抽出手段で抽出された省略対象語句に対応する省略語を前記省略語生成手段により生成する
ことを特徴とする請求項1または2に記載の翻訳装置。
Abbreviation generation means for generating abbreviations in which a part of a character string constituting a phrase is omitted according to a predetermined rule;
The translation device according to claim 1, wherein the abbreviation determination means generates an abbreviation corresponding to the abbreviation target phrase extracted by the extraction means by the abbreviation generation means.
前記省略語生成手段で生成された省略語を前記省略対象語句と対応付けて前記省略語辞書に記憶させる省略語記憶手段を有することを特徴とする請求項4に記載の翻訳装置。   5. The translation apparatus according to claim 4, further comprising abbreviation storage means for storing the abbreviation generated by the abbreviation generation means in the abbreviation dictionary in association with the abbreviation target phrase. 前記省略語生成手段で生成された省略語が、他の省略対象語句と対応付けられて既に前記省略語辞書に記憶されている場合には、該省略語と異なる省略語を生成する省略語再生成手段を有することを特徴とする請求項4または6に記載の翻訳装置。   When the abbreviation generated by the abbreviation generator is associated with another abbreviation target phrase and is already stored in the abbreviation dictionary, abbreviation reproduction for generating an abbreviation different from the abbreviation The translation apparatus according to claim 4, further comprising a generating unit. 前記抽出手段は、予め定められた上限値を上回る文字数の名詞または名詞句を省略対象語句として抽出することを特徴とする請求項1乃至7のいずれかに記載の翻訳装置。   The translation apparatus according to claim 1, wherein the extracting unit extracts a noun or a noun phrase having a number of characters exceeding a predetermined upper limit value as an abbreviation target phrase. 前記抽出手段は、前記名詞または名詞句が前記翻訳文中に出現する出現回数が予め定められた上限値を上回る場合に、該名詞または名詞句を省略対象語句として抽出することを特徴とする請求項1乃至7のいずれかに記載の翻訳装置。   The extraction means extracts the noun or noun phrase as an abbreviation target phrase when the number of appearances of the noun or noun phrase exceeds a predetermined upper limit. The translation apparatus according to any one of 1 to 7. 前記抽出手段は、単語よりも熟語を優先して省略対象語句として抽出することを特徴とする請求項1乃至7のいずれかに記載の翻訳装置。   The translation device according to claim 1, wherein the extraction unit extracts the idiom as a subject to be omitted in preference to the word. 前記抽出手段は、前記翻訳文において用いられる省略語の種類が最も少なくなるように省略対象語句を抽出することを特徴とする請求項1乃至7のいずれかに記載の翻訳装置。   The translation device according to claim 1, wherein the extraction unit extracts an abbreviation target phrase so that the number of abbreviations used in the translated sentence is minimized. 前記省略語生成手段は、前記省略対象語句が単語の場合には、該省略対象語句の先頭から所定数の文字を用いて省略語を生成することを特徴とする請求項4乃至7のいずれかに記載の翻訳装置。   The abbreviation generation means generates an abbreviation using a predetermined number of characters from the head of the abbreviation target phrase when the abbreviation target phrase is a word. The translation device described in 1. 前記省略語生成手段は、前記省略対象語句が単語の場合には、該省略対象語句の先頭文字と、該先頭文字に後続する子音と、を出現順に並べることによって省略語を生成することを特徴とする請求項4乃至7のいずれかに記載の翻訳装置。   The abbreviation generation means generates an abbreviation by arranging a leading character of the abbreviation target phrase and a consonant following the leading character in the order of appearance when the abbreviation target phrase is a word. The translation device according to claim 4. 前記省略語生成手段は、前記子音のうち最初に出現する子音のみを用いることを特徴とする請求項13に記載の翻訳装置。   The translation apparatus according to claim 13, wherein the abbreviation generation unit uses only a consonant that appears first among the consonants. 前記省略語生成手段は、前記省略対象語句が熟語の場合には、該省略対象語句を構成する各単語の先頭文字を出現順に並べることによって省略語を生成することを特徴とする請求項4乃至7のいずれかに記載の翻訳装置。   The abbreviation generation means generates an abbreviation by arranging the first characters of each word constituting the abbreviation target phrase in the order of appearance when the abbreviation target phrase is a idiom. 8. The translation device according to any one of items 7. 前記省略語生成手段は、前記省略対象語句が熟語の場合には、該省略対象語句を構成する単語のうち最後に出現する単語を除く各単語の先頭文字と、最後に出現する単語を構成するすべての文字と、を出現順に並べることによって省略語を生成することを特徴とする請求項4乃至7のいずれかに記載の翻訳装置。   When the abbreviation target phrase is a idiom, the abbreviation generation means configures the first character of each word excluding the word that appears last among the words constituting the abbreviation phrase and the word that appears last The translation device according to claim 4, wherein abbreviations are generated by arranging all characters in the order of appearance. 原文の記載された原稿の画像を入力する入力ステップと、
前記入力ステップで入力された画像で表される原稿のレイアウトを解析し、該原稿を構成する単位領域を認識する画像解析ステップと、
前記入力ステップで入力された画像に含まれている原文の文字列を認識する文字認識ステップと、
前記文字認識ステップで認識された文字列に対応する翻訳語を異種言語間で同じ意味の単語を対応付けて記憶した辞書から抽出して翻訳文を生成する翻訳ステップと、
前記画像解析ステップで認識された単位領域毎に、当該単位領域に配置されている原文に対応する翻訳文を該原文と同一のレイアウトにて当該単位領域に配置することができるか否かを判定する判定ステップと、
前記判定ステップによる判定の結果、前記翻訳文を前記原文と同一のレイアウトにて当該単位領域に配置することができない場合に、予め定められた第1の条件を満たす語句を省略対象語句として該翻訳文から抽出する抽出ステップと、
前記抽出ステップで抽出された省略対象語句を構成する文字列の一部を省略した省略語を決定する省略語決定ステップと、
前記抽出ステップで抽出された省略対象語句を前記省略語決定ステップで決定された省略語に変換した翻訳文を生成する変換ステップと、
前記変換ステップで生成された翻訳文の画像を前記原文と同一のレイアウトにて生成するとともに、前記省略語決定ステップで決定された省略語の定義を表す画像を生成する画像生成ステップと、
前記画像生成ステップで生成された画像を出力する出力ステップと
を有することを特徴とする翻訳方法。
An input step for inputting an image of the original document with the original text;
An image analysis step of analyzing a layout of the document represented by the image input in the input step and recognizing a unit area constituting the document;
A character recognition step for recognizing the original text string included in the image input in the input step;
A translation step of generating a translated sentence by extracting a translation word corresponding to the character string recognized in the character recognition step from a dictionary in which words having the same meaning are associated and stored between different languages;
For each unit area recognized in the image analysis step, it is determined whether a translated sentence corresponding to the original sentence arranged in the unit area can be arranged in the unit area in the same layout as the original sentence A determination step to:
As a result of the determination in the determination step, when the translated sentence cannot be arranged in the unit area with the same layout as the original sentence, the phrase that satisfies the first condition defined in advance is used as the abbreviation target phrase An extraction step to extract from the sentence;
An abbreviation determination step for determining an abbreviation obtained by omitting a part of the character string constituting the abbreviation target phrase extracted in the extraction step;
A conversion step for generating a translation sentence obtained by converting the abbreviation target phrase extracted in the extraction step into the abbreviation determined in the abbreviation determination step;
An image generation step for generating an image of the translated sentence generated in the conversion step in the same layout as the original sentence, and generating an image representing the definition of the abbreviation determined in the abbreviation determination step;
An output step of outputting the image generated in the image generation step.
コンピュータ装置を、
異種言語間で同じ意味の単語を対応付けて記憶した辞書と、
原文の記載された原稿の画像を入力する入力手段と、
前記入力手段で入力された画像で表される原稿のレイアウトを解析し、該原稿を構成する単位領域を認識する画像解析手段と、
前記入力手段で入力された画像に含まれている原文の文字列を認識する文字認識手段と、
前記文字認識手段で認識された文字列に対応する翻訳語を前記辞書から抽出して翻訳文を生成する翻訳手段と、
前記画像解析手段で認識された単位領域毎に、当該単位領域に配置されている原文に対応する翻訳文を該原文と同一のレイアウトにて当該単位領域に配置することができるか否かを判定する判定手段と、
前記判定手段による判定の結果、前記翻訳文を前記原文と同一のレイアウトにて当該単位領域に配置することができない場合に、予め定められた第1の条件を満たす語句を省略対象語句として該翻訳文から抽出する抽出手段と、
前記抽出手段で抽出された省略対象語句を構成する文字列の一部を省略した省略語を決定する省略語決定手段と、
前記抽出手段で抽出された省略対象語句を前記省略語決定手段で決定された省略語に変換した翻訳文を生成する変換手段と、
前記変換手段で生成された翻訳文の画像を前記原文と同一のレイアウトにて生成するとともに、前記省略語決定手段で決定された省略語の定義を表す画像を生成する画像生成手段と、
前記画像生成手段で生成された画像を出力する出力手段
として機能させるためのプログラム。
Computer equipment,
A dictionary in which words of the same meaning are stored in association with each other in different languages,
An input means for inputting an image of a document in which the original document is described;
Image analysis means for analyzing a layout of a document represented by an image input by the input means and recognizing a unit area constituting the document;
Character recognition means for recognizing the original text string contained in the image input by the input means;
Translation means for extracting a translation word corresponding to the character string recognized by the character recognition means from the dictionary and generating a translation sentence;
For each unit area recognized by the image analysis means, it is determined whether or not the translated sentence corresponding to the original sentence arranged in the unit area can be arranged in the unit area in the same layout as the original sentence. Determination means to perform,
As a result of the determination by the determination means, if the translated sentence cannot be arranged in the unit area in the same layout as the original sentence, the phrase that satisfies a first condition that is determined in advance is used as the abbreviation target phrase Extraction means for extracting from the sentence;
Abbreviation determination means for determining an abbreviation obtained by omitting a part of the character string constituting the abbreviation target phrase extracted by the extraction means;
Conversion means for generating a translated sentence obtained by converting the abbreviation target phrase extracted by the extraction means into the abbreviation determined by the abbreviation determination means;
An image generation unit that generates an image of the translation sentence generated by the conversion unit in the same layout as the original sentence, and generates an image representing the definition of the abbreviation determined by the abbreviation determination unit;
A program for causing an image generated by the image generating means to function as an output means.
JP2005213346A 2005-07-22 2005-07-22 Translation apparatus, translation method, and program Active JP4852918B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005213346A JP4852918B2 (en) 2005-07-22 2005-07-22 Translation apparatus, translation method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005213346A JP4852918B2 (en) 2005-07-22 2005-07-22 Translation apparatus, translation method, and program

Publications (2)

Publication Number Publication Date
JP2007034430A true JP2007034430A (en) 2007-02-08
JP4852918B2 JP4852918B2 (en) 2012-01-11

Family

ID=37793659

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005213346A Active JP4852918B2 (en) 2005-07-22 2005-07-22 Translation apparatus, translation method, and program

Country Status (1)

Country Link
JP (1) JP4852918B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100912502B1 (en) 2007-07-27 2009-08-17 한국전자통신연구원 Machine translation method for PDF file
US9588967B2 (en) 2015-04-22 2017-03-07 Kabushiki Kaisha Toshiba Interpretation apparatus and method
US10423700B2 (en) 2016-03-16 2019-09-24 Kabushiki Kaisha Toshiba Display assist apparatus, method, and program

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6364366A (en) * 1986-09-05 1988-03-22 Hitachi Ltd Semiconductor integrated circuit
JPH05324427A (en) * 1992-05-27 1993-12-07 Hitachi Ltd Document information compressor
JPH07192000A (en) * 1993-12-27 1995-07-28 Toshiba Corp Machine translation method equipped with summary function
JPH11328166A (en) * 1998-05-15 1999-11-30 Brother Ind Ltd Character input device and computer-readable recording medium where character input processing program is recorded

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6364366A (en) * 1986-09-05 1988-03-22 Hitachi Ltd Semiconductor integrated circuit
JPH05324427A (en) * 1992-05-27 1993-12-07 Hitachi Ltd Document information compressor
JPH07192000A (en) * 1993-12-27 1995-07-28 Toshiba Corp Machine translation method equipped with summary function
JPH11328166A (en) * 1998-05-15 1999-11-30 Brother Ind Ltd Character input device and computer-readable recording medium where character input processing program is recorded

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100912502B1 (en) 2007-07-27 2009-08-17 한국전자통신연구원 Machine translation method for PDF file
US8108202B2 (en) 2007-07-27 2012-01-31 Electronics And Telecommunications Research Institute Machine translation method for PDF file
US9588967B2 (en) 2015-04-22 2017-03-07 Kabushiki Kaisha Toshiba Interpretation apparatus and method
US10423700B2 (en) 2016-03-16 2019-09-24 Kabushiki Kaisha Toshiba Display assist apparatus, method, and program

Also Published As

Publication number Publication date
JP4852918B2 (en) 2012-01-11

Similar Documents

Publication Publication Date Title
JP4428266B2 (en) Translation apparatus and program
JP4325577B2 (en) Translation apparatus and program
EP0247395B1 (en) Machine translation system
JPH05314175A (en) Parallel translation image forming device
Karim Technical challenges and design issues in bangla language processing
US10810383B2 (en) Image processing apparatus for comparing documents in different languages
US9529792B2 (en) Glossary management device, glossary management system, and recording medium for glossary generation
JP4852918B2 (en) Translation apparatus, translation method, and program
JP2019109628A5 (en)
JP2006276918A (en) Translating device, translating method and program
JP4419891B2 (en) Translation apparatus, translation method, and program
JP2007518164A (en) Automatic translation apparatus, automatic translation method using the automatic translation apparatus, and recording medium on which the automatic translation apparatus is recorded
US20190188266A1 (en) Image processing apparatus
JPH0765012A (en) Bilingual image generating device
JP2019109629A5 (en)
JP4992216B2 (en) Translation apparatus and program
JP2007086867A (en) Translation device, translation method and program
US11706352B2 (en) Color expression conversion apparatus for understanding color perception in document using textual, expression and non-transitory computer readable medium storing program
JPH05324704A (en) Bilingual image forming device
JP2020178168A (en) Image forming apparatus
Deacon Adpositions in Distributed Morphology: The nature of the square root of Roots and categorial heads
JPH05324709A (en) Bilingual image forming device
JP3353873B2 (en) Machine translation equipment
JP2011170624A (en) Image display device, image forming apparatus, image display method, computer program, and recording medium
Kupść Aspect assignment in a knowledge-based english-polish machine translation system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080423

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110927

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111010

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141104

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4852918

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350