JP2007086867A - Translation device, translation method and program - Google Patents
Translation device, translation method and program Download PDFInfo
- Publication number
- JP2007086867A JP2007086867A JP2005271847A JP2005271847A JP2007086867A JP 2007086867 A JP2007086867 A JP 2007086867A JP 2005271847 A JP2005271847 A JP 2005271847A JP 2005271847 A JP2005271847 A JP 2005271847A JP 2007086867 A JP2007086867 A JP 2007086867A
- Authority
- JP
- Japan
- Prior art keywords
- translation
- sentence
- output
- input
- translated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
Description
本発明は、文章を異なる言語の文章に翻訳する技術に関する。 The present invention relates to a technique for translating sentences into sentences in different languages.
ある自然言語で記述された文章(原文)を他の自然言語の文章(翻訳文)に翻訳する機械翻訳の技術が知られている。機械翻訳には種々の方式が存在する。例えば、最も翻訳精度の高い方式として、公知の形態素解析、構文解析、意味解析を組み合わせたいわゆる解析ベースの翻訳方式が知られている。また、最も単純な翻訳方式としては、原文を形態素に分割し、各形態素に対応する訳語を順次出力する方式がある。
各翻訳方式にはそれぞれ長所、短所がある。例えば、一般に高精度の翻訳方式においては原文を入力してから翻訳結果を得るまでにかかる時間が長いという傾向がある。反対に、各形態素の訳語を出力だけの方式の場合、翻訳に要する時間は比較的短時間で済むが、翻訳結果が文章として構成されていないので、そのままでは意味を把握しにくいという問題がある。
A machine translation technique for translating a sentence (original text) described in a certain natural language into another natural language sentence (translated sentence) is known. There are various methods for machine translation. For example, as a method with the highest translation accuracy, a so-called analysis-based translation method combining known morphological analysis, syntax analysis, and semantic analysis is known. Further, as the simplest translation method, there is a method of dividing an original sentence into morphemes and sequentially outputting translated words corresponding to the morphemes.
Each translation method has advantages and disadvantages. For example, in general, in a high-accuracy translation system, it takes a long time to obtain a translation result after inputting an original sentence. On the other hand, in the case of the method that only outputs the translation of each morpheme, the time required for translation is relatively short, but the translation result is not structured as a sentence, so there is a problem that it is difficult to grasp the meaning as it is. .
そこで、翻訳に要する処理時間と翻訳精度とをある程度のレベルで両立させることを目的とした技術が提案されている。例えば、特許文献1に開示されている翻訳装置は、特定のキーワードが登録されたテーブルが記憶されており、このキーワードを含む文のみを翻訳する速読モードと全文を翻訳する全訳モードのいずれかが選択可能となっている。ユーザが速読モードを選択することによって、特定のキーワードを含む文のみが翻訳されるから、文書の概要を迅速に把握することができる。
しかし、上記の従来技術には以下のような問題がある。すなわち、第一に、ユーザは翻訳方式を選択して翻訳装置に指示を与える手間がかかる。第二に、ユーザが簡易な方式で翻訳を行い、その翻訳結果に不満を持った場合、より高度な方式により翻訳をやり直すという手間がかかる。
本発明は、上述した背景の下になされたものであり、短時間でできるだけ精度の高い翻訳結果を得ることのできる技術の提供を目的とする。
However, the above prior art has the following problems. That is, first, it takes time for the user to select a translation method and give an instruction to the translation apparatus. Secondly, when a user translates with a simple method and is dissatisfied with the translation result, it takes time to redo the translation with a more advanced method.
The present invention has been made under the above-described background, and an object of the present invention is to provide a technique capable of obtaining a translation result with the highest possible accuracy in a short time.
上述の課題を解決するために、本発明は、原文を表すデータを入力する入力手段と、互いに異なる複数の翻訳方式を翻訳精度の低いものから順次使用して、前記入力手段で入力されたデータで表される原文を翻訳し、翻訳文を生成する翻訳手段と、前記複数の翻訳方式の各々による翻訳が完了し次第、翻訳の完了した翻訳方式による翻訳文を記憶する記憶手段と、翻訳文の出力を指示する指示手段と、前記指示手段により翻訳文の出力が指示された時点で前記記憶手段に記憶されている翻訳文の中から最後に記憶された翻訳文を抽出し、該翻訳文を表すデータを出力する出力手段とを有することを特徴とする翻訳装置を提供する。 In order to solve the above-described problems, the present invention provides an input unit that inputs data representing original text and a plurality of different translation methods, which are sequentially used in descending order of translation accuracy, and is input by the input unit. A translation means for translating the original sentence represented by the above, a translation means for generating a translation sentence, a storage means for storing the translation sentence according to the translation system that has been translated as soon as translation by each of the plurality of translation methods is completed, and a translation sentence An instruction means for instructing the output of a translation sentence, and a translation sentence stored last in the translation sentence stored in the storage means when the output of the translation sentence is instructed by the instruction means, and the translation sentence And an output means for outputting data representing the translation device.
また、上述の課題を解決するために、本発明は、原文を表すデータを入力する入力ステップと、互いに異なる複数の翻訳方式を翻訳精度の低いものから順次使用して、前記入力ステップで入力されたデータで表される原文を翻訳し、翻訳文を生成する翻訳ステップと、前記複数の翻訳方式の各々による翻訳が完了し次第、翻訳の完了した翻訳方式による翻訳文を記憶する記憶ステップと、翻訳文の出力が指示された時点で、記憶されている翻訳文の中から最後に記憶された翻訳文を抽出し、該翻訳文を表すデータを出力する出力ステップとを有することを特徴とする翻訳方法を提供する。 In order to solve the above-described problem, the present invention uses an input step for inputting data representing the original text and a plurality of different translation methods in order from the one with the lowest translation accuracy, and is input in the input step. A translation step for translating the original sentence represented by the data, and generating a translation sentence; and a storage step for storing the translation sentence by the translation system that has been translated as soon as the translation by each of the plurality of translation systems is completed; An output step of extracting the last stored translation sentence from the stored translation sentences and outputting data representing the translation sentence when the output of the translation sentence is instructed Provide translation methods.
また、上述の課題を解決するために、本発明は、コンピュータ装置を、原文を表すデータを入力する入力手段と、互いに異なる複数の翻訳方式を翻訳精度の低いものから順次使用して、前記入力手段で入力されたデータで表される原文を翻訳し、翻訳文を生成する翻訳手段と、前記複数の翻訳方式の各々による翻訳が完了し次第、翻訳の完了した翻訳方式による翻訳文を記憶する記憶手段と、翻訳文の出力を指示する指示手段と、前記指示手段により翻訳文の出力が指示された時点で前記記憶手段に記憶されている翻訳文の中から最後に記憶された翻訳文を抽出し、該翻訳文を表すデータを出力する出力手段として機能させるためのプログラムを提供する。 Further, in order to solve the above-described problem, the present invention provides a computer apparatus that uses the input means for inputting data representing the original text and a plurality of different translation methods in order from the one with the lowest translation accuracy, and performs the input. The translation means for translating the original sentence represented by the data input by the means to generate a translation sentence, and storing the translation sentence according to the translation system that has been translated as soon as the translation by each of the plurality of translation methods is completed A storage means, an instruction means for instructing output of a translated sentence, and a translation sentence stored last in a translation sentence stored in the storage means at the time when the output of the translation sentence is instructed by the instruction means. A program for extracting and functioning as output means for outputting data representing the translated sentence is provided.
上記の翻訳装置または翻訳方法もしくはプログラムによれば、互いに異なる複数の翻訳方式を翻訳精度の低いものから順次使用して原文が翻訳され、複数の翻訳方式の各々による翻訳が完了し次第、翻訳の完了した翻訳方式による翻訳文が記憶される。そして、翻訳文の出力が指示された時点で、記憶されている翻訳文の中から最後に記憶された翻訳文が抽出され、この翻訳文を表すデータが出力される。 According to the above translation apparatus, translation method, or program, the original text is translated using a plurality of different translation methods in descending order of translation accuracy, and as soon as translation by each of the plurality of translation methods is completed, A translated sentence according to the completed translation method is stored. Then, when the output of the translated sentence is instructed, the last stored translated sentence is extracted from the stored translated sentences, and data representing the translated sentence is output.
本発明によれば、短時間でできるだけ精度の高い翻訳結果を得ることができる。 According to the present invention, a translation result that is as accurate as possible can be obtained in a short time.
以下、図面を参照して、本発明の実施形態について説明する。
<構成>
翻訳装置1は、入力された原文を翻訳して目的言語の翻訳文を得る翻訳機能と、原稿を読み取って複製物を作成する複写機能とを有している。
まず、翻訳装置1のハードウェア構成について説明する。図1は、本発明の実施形態における翻訳装置1のハードウェア構成を示す図である。
翻訳装置1は、CPU(Central Processing Unit)44、ROM(Read Only Memory)45、RAM(Random Access Memory)46等(いずれも図示省略)からなる制御部4を有し、ROM45に格納されているOS(Operating System)プログラムをCPU44が実行することによって翻訳装置1各部の制御を行う。
Embodiments of the present invention will be described below with reference to the drawings.
<Configuration>
The translation apparatus 1 has a translation function for translating an input original sentence to obtain a target language translation sentence, and a copying function for reading a manuscript and creating a duplicate.
First, the hardware configuration of the translation apparatus 1 will be described. FIG. 1 is a diagram illustrating a hardware configuration of a translation apparatus 1 according to an embodiment of the present invention.
The translation apparatus 1 includes a control unit 4 including a CPU (Central Processing Unit) 44, a ROM (Read Only Memory) 45, a RAM (Random Access Memory) 46, and the like (all not shown), and is stored in the
記憶部5は、ハードディスク装置等の不揮発性メモリである。記憶部5には、原稿の読取、翻訳、出力等の手順を記述したプログラムが記憶されている。
指示入力部41は、テンキー、スタートボタン等からなるキーボード40、タッチパネル機能を有する液晶パネルからなる表示部39を備えており、翻訳装置1に対する指示をユーザが入力することができる。ユーザが入力する指示とは、例えば、原稿の読み取り及び翻訳処理を開始することの指示、翻訳結果を出力することの指示などである。また、表示部39には、翻訳装置1の状態に関する情報を表示することができ、翻訳の処理中であることを示す情報、翻訳処理が完了したことを示す情報などが表示される。
給紙トレイ9には画像を形成するためのシート10が収容される。ユーザが指示入力部41により画像形成の指示を入力すると、給紙ローラ33が回転駆動され、給紙トレイ9からシート10を1枚ずつ送り出す。給紙トレイ9から送り出されたシート10はローラ対34、35、37によって搬送路36に沿って搬送される。
The storage unit 5 is a nonvolatile memory such as a hard disk device. The storage unit 5 stores a program describing procedures such as reading, translating, and outputting a document.
The
A
画像入力部12は、原稿を光学的に読み取って画像データを生成するスキャナ装置である。プラテンガラス2上に載置された原稿に対して光源13により光が照射され、この反射光が光学系3によって処理される。反射光は、ミラー14、15、16を介して受光部17で受光される。そして、画像処理部18が反射光を電気信号に変換し、イエロー、マゼンタ、シアン、ブラックの各色からなる画像データを生成する。
The
画像形成部6は、画像形成エンジン7Y、7M、7C、7K、転写ベルト8等からなる。
画像形成エンジン7Y、7M、7C、7Kは、それぞれイエロー(Y)、マゼンタ(M)、シアン(C)、ブラック(K)の各色のトナー像を形成する。各画像形成エンジンの構成は共通であるから、ここでは画像形成エンジン7Yについてのみ説明する。
画像形成エンジン7Yは、静電潜像が形成される像担持体としての感光体ドラム20Yの周囲に、帯電装置21Y、露光装置19Y、現像装置22Y、クリーナ24Y等を設けて構成されている。
The image forming unit 6 includes
The
The
帯電装置21Yは、矢印Aの方向に回転駆動される感光体ドラム20Yの表面を所定の電位に帯電させる。
露光装置19Yは、所定の電位に帯電した感光体ドラム20Yに対して、画像データに基づいた露光用ビームLBを照射するROS(Raster Output Scanner)である。露光装置19Yは、図示しない半導体レーザーから画像データに基づいてレーザー光を出射し、このレーザー光を偏向走査することにより感光体ドラム20Yの表面に静電潜像を形成する。感光体ドラム20Yの表面では、レーザー光が照射された部分の電位が、感光体ドラム20Yの有する光導電性により所定のレベルまで減少する。このように、感光体ドラム20Yの表面電位が変化することにより、感光体ドラム20Yの表面には画像データにもとづいた静電潜像が形成される。
The charging device 21Y charges the surface of the
The
現像装置22Yは、感光体ドラム20Y表面に形成された静電潜像を顕像化する装置である。トナータンク23Yからはトナー(帯電色材)が供給され、感光体ドラム20Yの帯電極性と同極性に帯電したトナーによって静電潜像を反転現像することによってトナー像を得る。
転写ベルト8は、ローラ26、27、28、29に張架されており、矢印Bの方向に循環駆動される。感光体ドラム20Yはその下方に位置する転写ベルト8と圧接しており、上記のようにして形成されたトナー像が転写ベルト8に転写される。
クリーナ24Yは、感光体ドラム20Yに残存したトナーを除去する装置である。
The developing
The
The cleaner 24Y is a device that removes the toner remaining on the
以上が画像形成エンジン7Yの構成である。画像形成エンジン7M、7C、7Kにおいても各色に対応したトナー像が形成され、転写ベルト8に重ねて転写される。なお、これ以降、画像形成エンジン7Y、7M、7C、7Kを区別する必要のない場合には、単に画像形成エンジン7と称する。他の構成要素についても同様に、Y、M、C、Kの別を区別する必要のない場合には、Y、M、C、Kの表記を省略するものとする。
The above is the configuration of the
給紙トレイ9から搬送路36上に送り出されたシート10は、転写ベルト8と転写ローラ30とが形成するニップ部に進入し、転写ベルト8に圧接される。この圧接力および静電吸引力によってトナー像がシート10の表面に転写される。
トナー像が転写されたシート10は、ローラ対31によって定着装置11に導かれる。定着装置11においては、シート10に対して加圧および加熱が施され、トナー像がシート10に定着される。このようにして画像形成が行われたシート10は、排紙トレイ32に排出される。
The
The
次に、翻訳装置1の機能構成について説明する。図2は、翻訳装置1の機能構成を表す図である。CPU44が記憶部5に記憶されているプログラムを実行することによってこれらの機能が実現される。
辞書201は、異種言語間で同義の語句を対応付けて記憶したものであり、記憶部5に格納されている。辞書201は、日本語、英語、中国語など種々の言語に対応したものが記憶されている。また、辞書201には、単語の品詞の種別を表す情報が各単語と対応付けられて記憶されている。
Next, the functional configuration of the translation apparatus 1 will be described. FIG. 2 is a diagram illustrating a functional configuration of the translation apparatus 1. These functions are realized by the
The
入力手段101は、原文を表すデータを入力する。具体的には、入力手段101は、画像入力部12を用いて原文の記載された原稿を読み取り、原稿の画像を表す原稿画像データを生成する。
文字認識手段102は、入力手段101にて入力されたデータに含まれている文字列を認識する。記憶部5には公知のOCR(Optical Character Recognition)プログラムが記憶されており、CPU44がこのOCRプログラムを実行することによって文字認識が行われる。
形態素解析手段103は、文字認識手段102により認識された文字列を形態素(単語等)に分割する。形態素解析手段103は、当該文字列に該当する単語を辞書201から抽出する。
The input means 101 inputs data representing the original text. Specifically, the
The
The
翻訳手段104は、文字認識手段103で認識された文字列を翻訳して翻訳文を生成する。翻訳文の生成においては複数の翻訳方式が使用可能となっており、いずれも公知の方法である。本実施形態においては、以下に示す3種類の翻訳方式が使用可能となっているが、これはあくまでも一例であり、ここに示す以外の翻訳方式を用いることも可能である。
The
<A方式>
A方式は、原文を形態素に分割し、各形態素に対応する訳語を順次出力する方式である。
<B方式>
B方式は、前述の特許文献1で開示されている速読モードである。すなわち、特定のキーワードが登録されたテーブルが記憶部5に記憶されており、このキーワードを含む文のみを解析ベースの翻訳方式(後述するC方式)によって翻訳し、出力する。
<A method>
The A method is a method of dividing an original sentence into morphemes and sequentially outputting translated words corresponding to the morphemes.
<B method>
The B method is a fast reading mode disclosed in the above-mentioned Patent Document 1. That is, a table in which a specific keyword is registered is stored in the storage unit 5, and only a sentence including this keyword is translated and output by an analysis-based translation method (C method described later).
<C方式>
C方式は、形態素解析、構文解析、意味解析を組み合わせたいわゆる解析ベースの翻訳方式である。この方式では、まず、形態素解析手法を用いて原文を形態素に分割し、構文解析手法、意味解析手法を用いて原文の構文を解析して構文木を作成し、翻訳先言語における構文木に変換する。そして、各形態素に対応する訳語を辞書201から抽出して構文木にあてはめ、翻訳文を生成する。
<C method>
The C method is a so-called analysis-based translation method that combines morphological analysis, syntax analysis, and semantic analysis. In this method, first, the original text is divided into morphemes using a morphological analysis technique, the syntax of the original text is analyzed using a syntax analysis technique and a semantic analysis technique, and a syntax tree is created and converted to a syntax tree in the target language. To do. Then, the translation corresponding to each morpheme is extracted from the
ここで、各方式を比較すると、それぞれ以下のような特徴がある。
A方式は、翻訳結果が文章として構成されていないので翻訳の精度は最も低いが、最も処理時間が短い。C方式は、翻訳の精度は最も高いが、翻訳処理に要する時間が最も長い。B方式は、翻訳の精度と処理時間の両方において、A方式とC方式の中間的な方式である。
Here, when each method is compared, it has the following characteristics.
The A method has the lowest translation accuracy because the translation result is not configured as a sentence, but the processing time is the shortest. The C method has the highest translation accuracy, but takes the longest time for translation processing. The B method is an intermediate method between the A method and the C method in both translation accuracy and processing time.
さらに、本発明における翻訳手段104は、以下の特徴を有している。
翻訳手段104は、上記の3つの翻訳方式を下記の順序にて順次使用して翻訳を行う。翻訳方式の使用順序は任意であるが、本実施形態においては下記の2種類のいずれかの順序決定方式にて使用順序が定められている。
<順序決定方式1>
互いに異なる複数の翻訳方式を翻訳精度の低いものから順次使用する。順序決定方式1によれば、上記の3方式の使用順序は、A方式、B方式、C方式の順となる。
<順序決定方式2>
互いに異なる複数の翻訳方式を翻訳処理に要する時間の短いものから順次使用する。順序決定方式2によれば、上記の3方式の使用順序は、A方式、B方式、C方式の順となる。
Furthermore, the translation means 104 in the present invention has the following features.
The
<Order determination method 1>
A plurality of different translation methods are used sequentially from the one with the lowest translation accuracy. According to the order determination method 1, the above three methods are used in the order of the A method, the B method, and the C method.
<Order determination method 2>
A plurality of different translation methods are used sequentially from the one with the shortest time required for translation processing. According to the order determination method 2, the usage order of the above three methods is the order of the A method, the B method, and the C method.
このように、上記の3方式の場合、一般には、順序決定方式1、順序決定方式2のいずれによっても3方式の使用順序は同一となる。しかし、使用順序に例外が生じる場合がある。例えば、原文言語と翻訳先言語とが非常に近似した文法構造を有している場合、原文の形態素に対応する訳語を順次出力するだけの単純な逐語訳でも十分な精度を持つことがあり得る。その場合、B方式よりもA方式の方が翻訳文全体の翻訳精度が高くなることがあり得る。すると、順序決定方式1による使用順序は、B方式、A方式、C方式の順となる。
また、原文言語と翻訳先言語とが非常に近似した文法構造を有している場合、解析ベース(B方式、C方式)の翻訳処理に要する時間が他の言語の組み合わせに比べて比較的短くなることがあり得る。その場合、A方式よりもB方式の方が処理時間が短くなることがあり得る。すると、順序決定方式2による使用順序は、B方式、A方式、C方式の順となる。
As described above, in the case of the above-described three methods, in general, the order of use of the three methods is the same in both the order determination method 1 and the order determination method 2. However, there may be exceptions in the order of use. For example, if the source language and the target language have a very similar grammatical structure, a simple word-by-word translation that only sequentially outputs translations corresponding to the morphemes of the source text may have sufficient accuracy. . In that case, the translation accuracy of the entire translated sentence may be higher in the A method than in the B method. Then, the order of use by the order determination method 1 is the order of the B method, the A method, and the C method.
In addition, when the source language and the target language have a very similar grammatical structure, the time required for the analysis-based (B method, C method) translation processing is relatively short compared to other language combinations. Can be. In that case, the processing time may be shorter in the B method than in the A method. Then, the order of use by the order determination method 2 is the order of the B method, the A method, and the C method.
上記のように、原文言語と翻訳先言語の組み合わせによって、翻訳方式の使用順序は異なる場合がある。本発明の翻訳装置1においては、原文の言語と翻訳先言語との組み合わせに応じて、複数の翻訳方式の使用順序が予め決定されており、その言語の組み合わせと翻訳方式の使用順序とが対応付けられて記憶部5に記憶されている。順序決定手段108は、原文言語と翻訳先言語の組み合わせに応じた使用順序を記憶部5から読み出して、その使用順序を表す情報を翻訳手段104に供給する。翻訳手段104は、順序決定手段108から供給された情報で表される使用順序に従って翻訳を行う
As described above, the order in which the translation methods are used may differ depending on the combination of the source language and the target language. In the translation apparatus 1 of the present invention, the order of use of a plurality of translation methods is determined in advance according to the combination of the source language and the translation target language, and the combination of the languages corresponds to the order of use of the translation methods. Attached and stored in the storage unit 5. The
記憶手段105は、複数の翻訳方式の各々による翻訳が完了し次第、翻訳の完了した翻訳文を表すデータを記憶部5に記憶させる。翻訳文の記憶の際、当該翻訳文のデータを原文を表すデータと対応付けて記憶させる。ここで原文を表すデータは、原文自体であってもよいし、原文を識別することのできる識別データであってもよい。
指示手段106は、翻訳文の出力を指示する。具体的には、ユーザが指示入力部41に備えられているキーボード40、または表示部39のタッチパネル機能を用いて翻訳文の出力を指示すると、当該指示を表す情報がCPU44に供給される。
The
The instruction means 106 instructs the output of the translated sentence. Specifically, when the user instructs the output of the translation using the
出力手段107は、指示手段106により翻訳文の出力が指示された時点で記憶部5に記憶されている翻訳文の中から最後に記憶された翻訳文を抽出し、この翻訳文を表すデータを出力する。ここで例えば、順序決定手段108で決定された使用順序がA方式、B方式、C方式の順であるとする。この場合、指示手段106により翻訳文の出力が指示された時点でA方式による翻訳のみが完了し、その翻訳文が記憶部5に記憶されているならば、出力手段107はこの翻訳文を出力する。一方、翻訳文の出力が指示された時点でA方式、b方式による翻訳が完了し、それらの翻訳文が記憶部5に記憶されているならば、出力手段107はB方式による翻訳文を出力する。同様に、翻訳文の出力が指示された時点でA方式、b方式、C方式による翻訳が完了し、それらの翻訳文が記憶部5に記憶されているならば、出力手段107はC方式による翻訳文を出力する。
そして、出力されたデータは、画像形成部6に供給され、画像形成部6は翻訳文の画像をシート表面に形成して、このシートを排紙トレイ32に排出する。
The output means 107 extracts the translation sentence stored lastly from the translation sentences stored in the storage unit 5 at the time when the instruction means 106 instructs the output of the translation sentence, and outputs the data representing the translation sentence. Output. Here, for example, it is assumed that the usage order determined by the
The output data is supplied to the image forming unit 6, and the image forming unit 6 forms an image of the translated sentence on the sheet surface and discharges the sheet to the
<動作>
次に、翻訳装置1の動作について説明する。ここで、翻訳装置1には電源が投入されており、CPU44がプログラムを実行中であるものとする。図3は、翻訳装置1の動作のフローを示す図である。なお、以下に示す動作はCPU44がプログラムを実行することによって実現されるから、動作の主体をCPU44とする。
<Operation>
Next, the operation of the translation apparatus 1 will be described. Here, it is assumed that the translation apparatus 1 is powered on and the
最初にステップA01では、CPU44は、原文の入力、文字認識処理、形態素解析を行う。具体的には、まず、CPU44は、入力手段101を用いて、原文の記載された原稿の読み取りを行う。ユーザは、原稿の読み取り面がプラテンガラス2に接するように原稿を載置し、指示入力部41のスタートボタンを押下する。すると、翻訳装置1の画像入力部12が原稿の読み取りを開始する。画像入力部12は、読み取った原稿の画像データを生成し、記憶部5に記憶する。画像データが記憶されると、CPU44は、文字認識手段102を用いて画像データに含まれる文字列を認識する。そして、CPU44は、形態素解析手段103を用いて、文字列を形態素に分割する。文字列が形態素に分割されると、CPU44は、順序決定手段108を用いて、原文言語と翻訳先言語との組み合わせに応じて翻訳方式の使用順序を決定する。この例においては、翻訳方式の使用順序はA方式、B方式、C方式の順であるものとする。
First, in step A01, the
次にステップA02では、CPU44は、A方式を使用して原文の翻訳を行う。ステップA03では、CPU44は、翻訳文の出力指示が入力されたか否かを判定する。出力指示が入力された場合(ステップA03:YES)にはステップA04に進み、A方式による翻訳処理が完了したか否かを判定する。翻訳処理が完了している場合(ステップA04:YES)にはステップA17に進む。ステップA17では、CPU44は翻訳文を表すデータを記憶部5に記憶させ、ステップA18に進み、出力手段107によって翻訳文を出力する。翻訳処理が完了していない場合(ステップA04:NO)にはステップA02に戻る。
Next, in step A02, the
一方、翻訳文の出力指示が入力されていない場合(ステップA03:NO)にはステップA05に進み、A方式による翻訳処理が完了したか否かを判定する。翻訳処理が完了している場合(ステップA05:YES)にはステップA06に進む。ステップA06では、CPU44は、翻訳文を表すデータを記憶部5に記憶させる。翻訳処理が完了していない場合(ステップA05:NO)にはステップA02に戻る。
CPU44は、ステップA03の判定を一定時間間隔(例えば、1秒間隔)で行うことによって、翻訳文の出力指示が入力されたか否かを常時監視する。
On the other hand, if a translation output instruction has not been input (step A03: NO), the process proceeds to step A05, where it is determined whether or not the translation processing by the A method has been completed. If the translation process has been completed (step A05: YES), the process proceeds to step A06. In step A06, the
The
ステップA06の処理が完了したならば、CPU44は、ステップA07に進み、B方式による翻訳処理を開始する。なお、ステップA07からステップA11までの動作は、翻訳方式がB方式であることを除いてはステップA02からステップA06までの動作と同様であるのでその説明を割愛する。また、ステップA12からステップA16までの動作は、翻訳方式がC方式であることを除いてはステップA02からステップA06までの動作と同様であるのでその説明を割愛する。
以上が翻訳装置1の動作である。
以上説明したように、本発明の翻訳装置1によれば、短時間でできるだけ精度の高い翻訳結果を得ることができる。
If the processing of step A06 is completed, the
The above is the operation of the translation apparatus 1.
As described above, according to the translation apparatus 1 of the present invention, it is possible to obtain a translation result that is as accurate as possible in a short time.
<変形例>
以上説明した形態に限らず、本発明は種々の形態で実施可能である。例えば、上述の実施形態を以下のように変形した形態でも実施可能である。
画像入力部12は、翻訳装置1にネットワークを介して接続された別体のスキャナ装置であってもよい。また、画像入力部12は、被写体を撮像して、被写体の画像を表す画像データを生成するデジタルスチールカメラであってもよい。この場合、画像データをデジタルスチールカメラに組み込まれた半導体メモリ等の記録媒体に記録させ、この記録媒体から画像データを読み出し、読み出された画像データを翻訳装置1に入力する。
画像形成部6は、翻訳装置1にネットワークを介して接続された別体のプリンタ装置であってもよい。
<Modification>
The present invention is not limited to the form described above, and can be implemented in various forms. For example, the embodiment described above can be modified as follows.
The
The image forming unit 6 may be a separate printer device connected to the translation device 1 via a network.
指示手段106は、ネットワークを介して翻訳装置1に接続されているコンピュータ装置等から翻訳文の出力の指示を受け付けるようにしてもよい。
出力手段107は、ネットワークを介して翻訳装置1に接続されている画像形成装置等へ翻訳文を表すデータを出力するようにしてもよい。
出力手段107により出力されるデータは、翻訳文を表すテキストデータ、翻訳文の画像を表す画像データであってもよい。
また、翻訳装置1を以下に示すように構成することも好ましい。すなわち、翻訳装置1に公知のレイアウト解析機能を備えておき、原文の原稿のレイアウトを解析する。レイアウト解析によって、原文の原稿に含まれる文章領域、絵柄領域、図表領域等が判別され、さらに文章領域における文字の字体、文字サイズ、文字修飾(太字、斜体、色、網がけなど)、文字間隔、行間隔などに関する情報が得られる。そして、翻訳手段104によって生成された翻訳文を原文と同一または近似したレイアウトにて配置し、この翻訳文を表すデータをページ記述言語、ビットマップデータ形式等により生成し、出力手段107により出力する。また、原文の原稿に絵柄や図表が含まれている場合には、翻訳文とともにこれらの絵柄や図表を原文の原稿と同一または近似したレイアウトにて配置した画像を表すデータを生成する。なお、翻訳文、絵柄、図表等をそれぞれ別個のデータファイルとして生成し、出力するようにしてもよい。
The
The
The data output by the output means 107 may be text data representing a translated sentence or image data representing an image of a translated sentence.
Moreover, it is also preferable to comprise the translation apparatus 1 as shown below. That is, the translation apparatus 1 has a known layout analysis function, and analyzes the layout of the original document. The layout analysis identifies the text area, design area, chart area, etc. included in the original text, and character font, character size, character modification (bold, italic, color, halftone, etc.) and character spacing in the text area. Information about line spacing, etc. is obtained. Then, the translated sentence generated by the
原文の入力後、所定の時間までに翻訳文の出力指示が入力されない場合、その時点で記憶部5に記憶されている翻訳文のデータを消去するようにしてもよい。また、記憶部5の記憶容量が不足する場合、入力時刻の最も古い原文に対応する翻訳文のデータを記憶部5から消去するようにしてもよい。また、記憶部5の記憶容量が不足する場合、最も生成時刻の古い翻訳文のデータを記憶部5から消去するようにしてもよい。また、記憶部5の記憶容量が不足する場合、最も翻訳精度の低い翻訳文のデータを記憶部5から消去するようにしてもよい。このようにすれば、記憶部5の記憶領域を無駄に占有するを防止することができる。 If the translated text output instruction is not input by a predetermined time after the input of the original text, the translated text data stored in the storage unit 5 at that time may be deleted. If the storage capacity of the storage unit 5 is insufficient, the translated text data corresponding to the original text with the oldest input time may be deleted from the storage unit 5. Further, when the storage capacity of the storage unit 5 is insufficient, the translated sentence data with the oldest generation time may be deleted from the storage unit 5. Further, when the storage capacity of the storage unit 5 is insufficient, the translated sentence data having the lowest translation accuracy may be deleted from the storage unit 5. In this way, it is possible to prevent the storage area of the storage unit 5 from being occupied unnecessarily.
翻訳文の出力指示が入力された時点で、まだ翻訳処理の完了していない翻訳方式による翻訳処理を中止するようにしてもよい。このようにすれば、制御部4の有する計算資源の無駄な使用を防止することができる。
また、翻訳文の出力指示が入力された時点で、まだ翻訳処理の完了していない翻訳方式による翻訳処理を続行するようにしてもよい。このようにすれば、出力された翻訳文の翻訳精度が不足しているとユーザが判断した場合に、さらに高度な翻訳精度の翻訳文を迅速に得ることができる。
At the time when the output instruction of the translated sentence is input, the translation processing by the translation method that has not been completed yet may be stopped. In this way, useless use of computing resources of the control unit 4 can be prevented.
Further, when a translation output instruction is input, the translation process using a translation method that has not been completed may be continued. In this way, when the user determines that the translation accuracy of the output translation is insufficient, a translation with a higher translation accuracy can be obtained quickly.
また、ある翻訳方式による翻訳処理が完了し次第、その翻訳文を出力するようにしてもよい。また、ある翻訳方式による翻訳処理が完了し次第、翻訳が完了したことを表すメッセージを表示部39に表示し、翻訳の完了をユーザに対して報知するようにしてもよい。
Alternatively, the translated sentence may be output as soon as the translation process by a certain translation method is completed. Further, as soon as translation processing by a certain translation method is completed, a message indicating that translation is completed may be displayed on the
1…翻訳装置、4…制御部、5…記憶部、51…辞書、41…指示入力部、9…給紙トレイ、10…シート、12…画像入力部、6…画像形成部、7Y、7M、7C、7K…画像形成エンジン、8…転写ベルト、201…辞書、101…入力手段、102…文字認識手段、103…形態素解析手段、104…翻訳手段、105…記憶手段、106…指示手段、107…出力手段、108…順序決定手段。 DESCRIPTION OF SYMBOLS 1 ... Translation apparatus, 4 ... Control part, 5 ... Memory | storage part, 51 ... Dictionary, 41 ... Instruction input part, 9 ... Paper feed tray, 10 ... Sheet, 12 ... Image input part, 6 ... Image formation part, 7Y, 7M , 7C, 7K ... image forming engine, 8 ... transfer belt, 201 ... dictionary, 101 ... input means, 102 ... character recognition means, 103 ... morphological analysis means, 104 ... translation means, 105 ... storage means, 106 ... instruction means, 107: output means, 108: order determining means.
Claims (7)
互いに異なる複数の翻訳方式を翻訳精度の低いものから順次使用して、前記入力手段で入力されたデータで表される原文を翻訳し、翻訳文を生成する翻訳手段と、
前記複数の翻訳方式の各々による翻訳が完了し次第、翻訳の完了した翻訳方式による翻訳文を記憶する記憶手段と、
翻訳文の出力を指示する指示手段と、
前記指示手段により翻訳文の出力が指示された時点で前記記憶手段に記憶されている翻訳文の中から最後に記憶された翻訳文を抽出し、該翻訳文を表すデータを出力する出力手段と
を有することを特徴とする翻訳装置。 An input means for inputting data representing the original text;
Translating means for translating the original text represented by the data input by the input means by using a plurality of different translation methods from the one with the lowest translation accuracy, and generating a translated text;
As soon as the translation by each of the plurality of translation schemes is completed, storage means for storing a translation sentence by the translated translation scheme;
An instruction means for instructing output of the translation,
An output means for extracting a translation sentence stored last from the translation sentences stored in the storage means at the time when the output of the translation sentence is instructed by the instruction means, and outputting data representing the translation sentence; A translation apparatus comprising:
互いに異なる複数の翻訳方式を翻訳処理に要する時間の短いものから順次使用して、前記入力手段で入力されたデータで表される原文を翻訳し、翻訳文を生成する翻訳手段と、
前記複数の翻訳方式の各々による翻訳が完了し次第、翻訳の完了した翻訳方式による翻訳文を記憶する記憶手段と、
翻訳文の出力を指示する指示手段と、
前記指示手段により翻訳文の出力が指示された時点で前記記憶手段に記憶されている翻訳文の中から最後に記憶された翻訳文を抽出し、該翻訳文を表すデータを出力する出力手段と
を有することを特徴とする翻訳装置。 An input means for inputting data representing the original text;
Translating means for translating the original text represented by the data input by the input means by using a plurality of different translation methods from the shortest time required for translation processing, and generating a translated text;
As soon as the translation by each of the plurality of translation schemes is completed, storage means for storing a translation sentence by the translated translation scheme;
An instruction means for instructing output of the translation,
An output means for extracting a translation sentence stored last from the translation sentences stored in the storage means at the time when the output of the translation sentence is instructed by the instruction means, and outputting data representing the translation sentence; A translation apparatus comprising:
前記翻訳手段は、前記順序決定手段で決定された使用順序に従って翻訳を行う
ことを特徴とする請求項1または2に記載の翻訳装置。 Order determining means for determining the order of use of the plurality of translation methods according to the combination of the source language and the target language,
The translation apparatus according to claim 1, wherein the translation unit performs translation according to a use order determined by the order determination unit.
前記読取手段で生成された画像データに含まれる文字列を認識する文字認識手段と
を有し、
前記入力手段は前記文字認識手段にて認識された文字列を入力する
ことを特徴とする請求項1乃至3のいずれかに記載の翻訳装置。 Reading means for reading a document in which the original is described and generating image data representing an image of the document;
Character recognition means for recognizing a character string included in the image data generated by the reading means,
The translation apparatus according to claim 1, wherein the input unit inputs a character string recognized by the character recognition unit.
前記読取手段で生成された画像データに含まれる文字列を認識する文字認識手段と
を有し、
前記入力手段は前記文字認識手段にて認識された文字列を入力する
ことを特徴とする請求項1乃至3のいずれかに記載の翻訳装置。 A reading unit that captures an image of a subject displaying the original text and generates image data representing the image of the subject;
Character recognition means for recognizing a character string included in the image data generated by the reading means,
The translation apparatus according to claim 1, wherein the input unit inputs a character string recognized by the character recognition unit.
互いに異なる複数の翻訳方式を翻訳精度の低いものから順次使用して、前記入力ステップで入力されたデータで表される原文を翻訳し、翻訳文を生成する翻訳ステップと、
前記複数の翻訳方式の各々による翻訳が完了し次第、翻訳の完了した翻訳方式による翻訳文を記憶する記憶ステップと、
翻訳文の出力が指示された時点で、記憶されている翻訳文の中から最後に記憶された翻訳文を抽出し、該翻訳文を表すデータを出力する出力ステップと
を有することを特徴とする翻訳方法。 An input step for inputting data representing the original text;
A translation step of translating the original text represented by the data input in the input step by using a plurality of different translation methods from the one with the lowest translation accuracy, and generating a translated text,
As soon as translation by each of the plurality of translation systems is completed, a storage step of storing a translation sentence by the translated translation system,
An output step of extracting the last stored translation sentence from the stored translation sentences and outputting data representing the translation sentence when the output of the translation sentence is instructed Translation method.
原文を表すデータを入力する入力手段と、
互いに異なる複数の翻訳方式を翻訳精度の低いものから順次使用して、前記入力手段で入力されたデータで表される原文を翻訳し、翻訳文を生成する翻訳手段と、
前記複数の翻訳方式の各々による翻訳が完了し次第、翻訳の完了した翻訳方式による翻訳文を記憶する記憶手段と、
翻訳文の出力を指示する指示手段と、
前記指示手段により翻訳文の出力が指示された時点で前記記憶手段に記憶されている翻訳文の中から最後に記憶された翻訳文を抽出し、該翻訳文を表すデータを出力する出力手段
として機能させるためのプログラム。 Computer equipment,
An input means for inputting data representing the original text;
Translating means for translating the original text represented by the data input by the input means by using a plurality of different translation methods from the one with the lowest translation accuracy, and generating a translated text;
As soon as the translation by each of the plurality of translation schemes is completed, storage means for storing a translation sentence by the translated translation scheme;
An instruction means for instructing output of the translation,
As an output means for extracting the translation sentence stored last from the translation sentences stored in the storage means at the time when the output of the translation sentence is instructed by the instruction means, and outputting data representing the translation sentence A program to make it work.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005271847A JP2007086867A (en) | 2005-09-20 | 2005-09-20 | Translation device, translation method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005271847A JP2007086867A (en) | 2005-09-20 | 2005-09-20 | Translation device, translation method and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007086867A true JP2007086867A (en) | 2007-04-05 |
Family
ID=37973820
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005271847A Pending JP2007086867A (en) | 2005-09-20 | 2005-09-20 | Translation device, translation method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007086867A (en) |
-
2005
- 2005-09-20 JP JP2005271847A patent/JP2007086867A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4428266B2 (en) | Translation apparatus and program | |
JP4325577B2 (en) | Translation apparatus and program | |
JP4789516B2 (en) | Document conversion apparatus, document conversion method, and storage medium | |
US9529792B2 (en) | Glossary management device, glossary management system, and recording medium for glossary generation | |
JP2018124810A (en) | Image processing device and image processing method | |
US20190188267A1 (en) | Image processing apparatus | |
US10863043B2 (en) | Image forming apparatus for forming image on recording sheet | |
JP4852918B2 (en) | Translation apparatus, translation method, and program | |
JP4419891B2 (en) | Translation apparatus, translation method, and program | |
JP2006276918A (en) | Translating device, translating method and program | |
US20190188266A1 (en) | Image processing apparatus | |
US8224091B2 (en) | Image processing apparatus, method of controlling the same, and program for extracting information usable for a search | |
US20160255239A1 (en) | Image Processing Apparatus and Image Processing Method | |
US9876916B1 (en) | Image forming apparatus that image-forms result of proofreading process with respect to sentence | |
JPH0765012A (en) | Bilingual image generating device | |
JP2007086867A (en) | Translation device, translation method and program | |
JP2018077794A (en) | Image processing device and image forming apparatus | |
JP4001133B2 (en) | Automatic translation device and automatic translation system | |
JP2008213263A (en) | Image formation device, image processing method, image processing program and recording medium with memorized image processing program | |
EP4336816A1 (en) | Image forming apparatus, image forming program, and image forming method | |
JP2002288169A (en) | Image forming device | |
JP3269842B2 (en) | Bilingual image forming device | |
US10839272B2 (en) | Image forming apparatus that prints image forming data including sentences in plurality of languages, on recording medium | |
JPH05324704A (en) | Bilingual image forming device | |
JPH05324709A (en) | Bilingual image forming device |