JP6312243B2 - Translation apparatus, translation method, and translation program - Google Patents
Translation apparatus, translation method, and translation program Download PDFInfo
- Publication number
- JP6312243B2 JP6312243B2 JP2014068166A JP2014068166A JP6312243B2 JP 6312243 B2 JP6312243 B2 JP 6312243B2 JP 2014068166 A JP2014068166 A JP 2014068166A JP 2014068166 A JP2014068166 A JP 2014068166A JP 6312243 B2 JP6312243 B2 JP 6312243B2
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- data
- translation
- reading
- kana
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
この発明は、例えば、地図上に記載される文字情報であるいわゆる地図注記などのように、大量に存在する名詞句の羅列データの翻訳を行うための装置、方法、プログラムに関する。 The present invention relates to an apparatus, a method, and a program for translating enumeration data of a large number of noun phrases such as so-called map notes that are character information described on a map.
従来から機械翻訳装置に関する種々の発明がなされている。例えば、後に記す特許文献1には、固有名詞を翻訳する場合であっても、固有名詞辞書を適切に整備しておくことにより正確に翻訳することができることが記載されている。また、同文献には、固有名詞辞書に登録された各固有名詞に対する捕捉語を記憶保持する捕捉語辞書をも用いることにより、固有名詞がどのようなものかについても翻訳結果に含めるようにすることが記載されている。これにより、翻訳結果をより理解し易いものとすることができるという点で効果がある。
Conventionally, various inventions relating to machine translation devices have been made. For example,
従来の機械翻訳装置の場合、翻訳のために種々の辞書が必要になっている。上述した特許文献1に記載の発明でも固有名詞などの翻訳辞書に加えて捕捉語辞書も必要なっている。翻訳のために辞書を検索する処理にはある程度時間がかかるために、大量の固有名詞などの名詞句の羅列の翻訳を行う場合には時間が掛かる。例えば、大量の名詞句の羅列の翻訳行う場合の例として、地図注記の翻訳を行う場合について考える。
In the case of a conventional machine translation device, various dictionaries are required for translation. The invention described in
地図には、例えば、市街図、道路図、広域図、地方図、全国図といった種々のものがあり、さらに同じ種類の地図でも縮尺の異なる複数の地図が存在する。このように、種類や縮尺の異なる全ての地図を対象にした場合、地図注記は数千万件も存在する。そして、数字、アルファベット、アイコンのみにより構成される地図注記などの翻訳が必要ないものは除外し、重複する地図注記は1つに集約したとしても、翻訳対象となる地図注記は数百万件も存在する。 There are various maps such as city maps, road maps, regional maps, regional maps, and national maps, and there are a plurality of maps of different scales even with the same type of map. Thus, when all types of maps of different types and scales are targeted, there are tens of millions of map notes. And even if map annotations consisting only of numbers, alphabets, and icons are excluded, those that do not need to be translated are excluded, and even if multiple overlapping map notes are consolidated into one, millions of map notes are subject to translation. Exists.
この数百万件の地図注記を、従来の辞書を参照する方式で多言語に機械翻訳する場合には、数週間を要しているのが現状である。また、地図注記は、地図上の地物が無くなったり、新たにできたりした場合には、必ず変わるため、所定のタイミングで現地調査をして更新し、翻訳し直す必要がある。 It takes several weeks to machine-translate these millions of map notes into multiple languages using a conventional dictionary reference method. In addition, map notes always change when features on the map are lost or newly created, so it is necessary to conduct a field survey at a predetermined timing to update and re-translate.
このように、地図注記は、翻訳を繰り返す必要があるため、できるだけ高速に翻訳したいとする要求が従来からある。このことは地図注記だけでなく、住所リスト、電話帳リスト、顧客リストなどに記載された、例えば、地名、名称、名前、住所といった多数の名詞句の羅列を翻訳する場合にも同様に生じている課題である。 As described above, since map annotation needs to be repeatedly translated, there is a conventional request to translate as fast as possible. This also occurs when translating a large number of noun phrases such as place names, names, names, addresses, etc., not only in map notes but also in address lists, phone book lists, customer lists, etc. It is a problem.
以上のことに鑑み、この発明は、大量に存在する名詞句の羅列データを、従来の機械翻訳装置に比べて飛躍的に速く、且つ、正確に翻訳できるようにすることを目的とする。 In view of the above, an object of the present invention is to make it possible to translate a large amount of noun phrase enumeration data much faster and more accurately than conventional machine translation devices.
上記課題を解決するため、請求項1に記載の発明の翻訳装置は、
翻訳対象言語に応じて、検索する名詞句の種類の異なる複数の翻訳辞書の中から使用する辞書を選択して抽出し、その使用順序を定めて並べ替え、名詞句の読み仮名の長いもの順に辞書内容を並べた翻訳用辞書を作成する辞書作成手段と、
翻訳対象の1以上の名詞句と当該1以上の名詞句のそれぞれの読み仮名とを有する読み仮名付与済みデータを、他の読み仮名付与済みデータと区別可能な態様で1つの変数に格納する格納手段と、
前記辞書作成手段により作成された前記翻訳用辞書の辞書データを1件ずつ読み込み、前記変数に格納されている前記読み仮名付与済みデータの翻訳対象の名詞句を、前記翻訳用辞書の前記辞書データを用いて目的とする言語に全文置換する全文置換手段と
を備えることを特徴とする。
In order to solve the above problem, a translation device according to
Select and extract the dictionary to be used from multiple translation dictionaries with different types of noun phrases to be searched according to the language to be translated. A dictionary creation means for creating a dictionary for translation of the dictionary contents;
Storage that stores reading-kana-added data having one or more noun phrases to be translated and the reading-kana of each of the one or more noun phrases in a variable that is distinguishable from other reading-kana-giving data. Means,
The dictionary data of the dictionary for translation created by the dictionary creating means is read one by one, and the noun phrase to be translated of the data with the kana added stored in the variable is converted to the dictionary data of the dictionary for translation. And a full-text replacement means for replacing the full-text into the target language.
この請求項1に記載の発明の翻訳装置によれば、辞書作成手段は、翻訳対象言語に応じて翻訳用辞書を作成する。格納手段は、読み仮名付与済みデータを、他の読み仮名付与済みデータと区別可能な態様で1つの変数に格納する。全文置換手段は、辞書作成手段により作成された前記翻訳用辞書の辞書データを1件ずつ読み込み、格納手段によって所定の変数に格納されている読み仮名付与済みデータの名詞句を、読み込んだ辞書の辞書データを用いて目的とする言語に全文置換する。 According to the translation device of the first aspect of the present invention, the dictionary creating means creates the translation dictionary according to the language to be translated. The storage means stores the reading-kana-added data in one variable in a manner distinguishable from other reading-kana-giving data. The full-text replacement means reads the dictionary data of the dictionary for translation created by the dictionary creation means one by one, and the noun phrase of the reading-kana-given data stored in a predetermined variable by the storage means Full-text replacement with the target language using dictionary data.
これにより、翻訳対象の読み仮名付与済みデータを所定の変数に格納して、格納された多数の読み仮名付与済みデータの名詞句を一括して処理対象とすることができる。そして、翻訳用辞書の辞書データを1件ずつ読み込んで、読み仮名が一致する辞書データを用いて、翻訳対象の読み仮名付与済みデータの名詞句を目的とする言語に置換するといった従来に無い手法で名詞句の翻訳ができる。この場合、読み仮名の1つ1つに基づいて翻訳辞書を参照する場合に比べて、大幅に翻訳に掛かる処理時間を短縮できる。 As a result, it is possible to store the translation-ready kana-given data in a predetermined variable and collectively process the stored many noun phrases of the read-kana-given data. Then, the dictionary data of the dictionary for translation is read one by one, and the noun phrase of the read-named kana-given data to be translated is replaced with the target language by using the dictionary data having the same reading-kana. Can translate noun phrases. In this case, the processing time required for translation can be greatly shortened as compared with the case where the translation dictionary is referred to based on each reading kana.
この発明によれば、大量に存在する名詞句の羅列データを、従来の機械翻訳装置に比べて飛躍的に速く、且つ、正確に翻訳できる。 According to the present invention, enumerated data of a large number of noun phrases can be translated significantly faster and more accurately than conventional machine translation devices.
以下、図を参照しながら、この発明の装置、方法、プログラムの一実施の形態について説明する。この発明は、地図注記、電話帳リスト、顧客リストなどに記載された地名、名称、名前、住所といった、大量に存在する名詞句の羅列データについて翻訳を行う場合に適用可能なものである。「名詞句」との文言は、物体、物質、人物、場所など具体的な対象を示す語句を意味する。この明細書において、翻訳対象となる「名詞句の羅列」の具体例として、地図注記、電話帳リスト、顧客リストなどに記載された、例えば、地名、名称、名前、住所といったものを想定している。 Hereinafter, embodiments of the apparatus, method, and program of the present invention will be described with reference to the drawings. The present invention can be applied to translation of enumerated data of a large number of noun phrases such as place names, names, names, and addresses described in map notes, telephone directory lists, customer lists, and the like. The term “noun phrase” means a phrase indicating a specific object such as an object, a substance, a person, or a place. In this specification, as a specific example of “a list of noun phrases” to be translated, for example, a place name, a name, a name, an address described in a map note, a phone book list, a customer list, etc. Yes.
以下においては、地図注記の翻訳を行う場合を例にして具体的に説明する。地図注記は、上述もしたように大量に存在し、頻繁に更新されるため、その更新の都度、翻訳し直さなければならないものである。また、近年おいては、外国から日本を訪れる観光客やビジネスマンも増えてきており、最新の地図の地図注記を所定の外国語に翻訳して表した外国語対応の最新の地図を迅速に提供することが望まれている。しかも、外国語は、中国語(簡体)、中国語(繁体)、英語、韓国語などというように、複数の言語に対応することが求められる。 In the following, a specific description will be given by taking as an example the case of translating a map note. Map annotations exist in large quantities as described above, and are frequently updated. Therefore, map annotations must be re-translated each time they are updated. In recent years, the number of tourists and business people visiting Japan from abroad has increased, and the latest maps for foreign languages, which are translated from the map annotations of the latest maps into the specified foreign languages, can be quickly displayed. It is hoped to provide. Moreover, foreign languages are required to correspond to a plurality of languages such as Chinese (simplified), Chinese (traditional), English, and Korean.
このような背景の下、以下に説明する実施の形態の装置、方法、プログラムは、大量に存在する地図注記を、従来の機械翻訳装置に比べて、飛躍的に速く、しかも適切に、且つ、複数の言語に翻訳することを実現している。 Under such a background, the apparatus, method, and program according to the embodiments described below are capable of converting a large amount of map annotations significantly faster and more appropriately than a conventional machine translation apparatus, and It has been translated into multiple languages.
[ビッグデータ翻訳装置の構成例]
まず、この実施の形態のビッグデータ翻訳装置(以下、単に翻訳装置と記載する。)の構成例と動作の概要について説明する。図1は、この実施の形態の翻訳装置の構成例と動作の概要を説明するためのブロック図である。なお、図1において、翻訳対象データF111などの記載における文字「F」は、ファイル(file)の略称として用いている。
[Configuration example of big data translation device]
First, a configuration example and an outline of operation of a big data translation apparatus (hereinafter simply referred to as a translation apparatus) of this embodiment will be described. FIG. 1 is a block diagram for explaining a configuration example and an outline of operation of the translation apparatus according to this embodiment. In FIG. 1, the letter “F” in the description of the translation target data F111 or the like is used as an abbreviation for a file.
図1に示す翻訳装置において、制御部101は、当該翻訳装置の各部を制御する機能を実現し、記憶装置102は情報記憶保持機能を実現し、操作部103は、ユーザーインターフェース機能を実現する。
In the translation apparatus shown in FIG. 1, the
読み仮名辞書群104は、固有名詞読み仮名辞書、一般名詞読み仮名辞書、接頭語読み仮名辞書、接尾語読み仮名辞書、カタカナ語読み仮名辞書などの複数の読み仮名辞書を備え、日本語の地図注記データに対する読み仮名を提供する。なお、図示していないが、接頭語読み仮名辞書には、固有名詞接頭語読み仮名辞書、一般名詞接頭語読み仮名辞書、カタカナ語接頭語読み仮名辞書がある。同様に、接尾語読み仮名辞書には、固有名詞接尾語読み仮名辞書、一般名詞接尾語読み仮名辞書、カタカナ語接尾語読み仮名辞書がある。
The reading
また、固有名詞読み仮名辞書、一般名詞読み仮名辞書、カタカナ語読み仮名辞書のそれぞれは、部分一致により読み仮名の置換が可能なものである。また、各接頭語読み仮名辞書は、接頭語の読み仮名を提供するものであるので、前方一致により読み仮名の置換が可能なものである。また、各接尾語読み仮名辞書は、接尾語の読み仮名を提供するものであるので、後方一致により読み仮名の置換が可能なものである。 Each of the proper noun reading kana dictionary, the general noun reading kana dictionary, and the katakana reading kana dictionary can replace the reading kana by partial matching. Each prefix reading kana dictionary provides the reading kana of the prefix, so that the reading kana can be replaced by front matching. Each suffix reading kana dictionary provides a reading kana for the suffix, so that the reading kana can be replaced by backward matching.
言語別翻訳辞書群105は、この実施の形態では、日本語の地図注記データの読み仮名を、目的とする外国語に翻訳するための言語別の翻訳辞書を備える。この実施の形態では、中国語(簡体)、中国語(繁体)、英語、韓国語の4言語に対応するため、4言語の翻訳辞書を備える。更に、各言語の翻訳辞書は、大きく分けると、一般名詞に関する辞書やカタカナ語に関する辞書を備える。一般名詞に関する辞書は、一般名詞接尾語辞書、一般名詞接頭語辞書、一般名詞辞書からなる。カタカナ語に関する辞書は、カタカナ語固有名詞接尾語辞書、カタカナ語固有名詞接頭語辞書、カタカナ語固有一般名詞辞書、カタカナ語一般名詞接尾語辞書、カタカナ語一般名詞接頭語辞書、カタカナ語一般名詞辞書からなる。
In this embodiment, the language-specific
また、一般名詞辞書、カタカナ語固有名詞辞書、カタカナ語一般名詞辞書のそれぞれは、部分一致により読み仮名などに対応する翻訳データ(翻訳語句)の置換が可能なものである。また、各接頭語辞書は、接頭語に対応する翻訳データを提供するものであるので、前方一致により接頭語の翻訳データの置換が可能なものである。また、各接尾語辞書は、接尾語の翻訳データを提供するものであるので、後方一致により接尾語の翻訳データの置換が可能なものである。 Each of the general noun dictionary, the katakana proper noun dictionary, and the katakana general noun dictionary can replace translation data (translation words) corresponding to reading kana and the like by partial matching. Each prefix dictionary provides translation data corresponding to the prefix, so that prefix translation data can be replaced by prefix matching. Also, each suffix dictionary provides suffix translation data, so that suffix translation data can be replaced by backward matching.
翻訳対象データファイル111は、翻訳対象となる多数の地図注記データを保持する。図2は、翻訳対象データファイル111の格納データの例を説明するための図である。図2に示すように、翻訳対象データファイル111には、「エリアコード、属性番号、地図注記データ」からなる翻訳対象データが多数保持されている。この翻訳対象データファイル111には、例えば、図示しない外部インターフェイスなどを通じて外部機器から提供された翻訳対象データなどが格納される。 The translation object data file 111 holds a large number of map note data to be translated. FIG. 2 is a diagram for explaining an example of data stored in the translation object data file 111. As shown in FIG. 2, the translation target data file 111 holds a large number of translation target data composed of “area code, attribute number, map annotation data”. The translation target data file 111 stores, for example, translation target data provided from an external device through an external interface (not shown).
読み仮名付与部112は、翻訳対象データファイル111に格納されている多数の地図注記データのそれぞれについて、これに含まれている漢字部分を、読み仮名辞書群104の読み仮名辞書を用いて読み仮名に変換する。読み仮名付与部112は、変換した読み仮名を含む、読み仮名付与済みデータを形成して、読み仮名付与済みデータファイル113に記録する。読み仮名付与済みデータファイル113は、ハードディスクなどの大容量記録媒体に作成され、読み仮名付与部112によって形成された読み仮名付与済みデータを蓄積する。
The reading
図3は、読み仮名付与済みデータファイル113の格納データの例を説明するための図である。図3に示すように、読み仮名付与済みデータファイル113に格納された読み仮名付与済みデータは、「エリアコード、属性番号、地図注記データ、読み仮名」からなるものである。なお、読み仮名は、読み仮名を取得した辞書が異なれば、それらは分離して示されている。すなわち、図3において、「悪石島」は、「悪石」部分の読み仮名は、例えば固有名詞辞書から取得され、「島」部分の読み仮名は、一般名詞接尾語辞書から取得されたために、「あくせき じま」というように、「あくせき」と「じま」がそれぞれ異なる辞書から取得されたことが分かる態様で読み仮名付与済みデータに格納されている。
FIG. 3 is a diagram for explaining an example of data stored in the read-named
この実施の形態において、使用辞書作成部114は、翻訳対象言語(何語に翻訳するのか)に応じて、翻訳に使用する翻訳用使用辞書を翻訳用使用辞書ファイル115に作成する。具体的に使用辞書作成部114は、翻訳対象言語に応じて言語別翻訳辞書群105の翻訳辞書の中から使用する辞書を選択して抽出する。そして、その使用順序を定めて抽出した辞書を並べ変えて結合し、更に各辞書の内容(辞書データ)を地図注記の読み仮名の長いもの順に並べた翻訳用使用辞書を翻訳用使用辞書ファイル115に作成する。
In this embodiment, the use
なお、各辞書データには、使用辞書作成部114により、その辞書データが属する辞書に応じて、部分一致、前方一致、後方一致のいずれにより検索語の置換が可能なものかを示す情報も付加される。例えば、一般名詞辞書、カタカナ語固有一般名詞辞書、カタカナ語一般名詞辞書の辞書データには部分一致により使用されるものである情報が付加される。また、一般名詞接頭語辞書、カタカナ語固有名詞接頭語辞書、カタカナ語一般名詞接頭語辞書には前方一致により使用されるものである情報が付加される。また、一般名詞接尾語辞書、カタカナ語固有名詞接尾語辞書、カタカナ語一般名詞接尾語辞書の辞書データには後方一致により使用されるものである情報が付加される。
In addition, information indicating whether the search word can be replaced by partial match, forward match, or backward match is added to each dictionary data according to the dictionary to which the dictionary data belongs by the use
全文置換処理部116は、大容量メモリ116Mを備え、大きく以下の2つの処理を行う。第1の処理は、読み仮名付与済みデータファイル113の読み仮名付与済みデータを読み込んで、読み仮名付与済みデータごとにセパレータを付しながら、全読み仮名付与済みデータを1つの変数に格納する処理を行う。第2の処理は、使用辞書作成部114が作成した翻訳用使用辞書ファイル115の辞書データを1件ずつ読み込み、上記の変数に格納した読み仮名付与済みデータの読み仮名を辞書データの翻訳データで置換する処理を行う。
The full-text
これにより、全文置換処理部116は、読み仮名付与済みデータの地図注記データに対する翻訳データを含む翻訳済みデータを形成し、これを翻訳済みデータファイル117に記録する。翻訳済みデータファイル117は、ハードディスクなどの大容量記録媒体に作成され、全文置換処理部116によって形成された翻訳済みデータを蓄積する。
As a result, the full-text
このように、この実施の形態の翻訳装置は、全文置換処理部116の機能により、読み仮名付与済みデータファイル113の全読み仮名付与済みデータを所定の変数に格納することにより、全読み仮名付与済みデータをメモリ116Mに格納して、一括して処理の対象にする。そして、整えた翻訳用使用辞書ファイル115の辞書データを1件ずつ読み込んで、メモリ116M上の全ての読み仮名付与済みデータを対象にして、翻訳用使用辞書ファイル115の翻訳データを付与する処理を行う。換言すれば、メモリ116M上の全ての読み仮名付与済みデータの各読み仮名を、翻訳用使用辞書ファイル115の翻訳データにより全文置換するようにしている。これにより、数多く存在する地図注記の超高速な翻訳を可能にしている。
As described above, the translation apparatus according to this embodiment stores the full-reading kana-given data in the reading-kana-given data file 113 in a predetermined variable by the function of the full-text
以下、この実施の形態の翻訳装置の主要部である、使用辞書作成部114において行われる処理と、全文置換処理部116において行われる処理の詳細について説明する。
Hereinafter, the details of the processing performed in the use
[使用辞書作成部114の処理]
図4は、使用辞書作成部114の処理について説明するためのブロック図である。上述もし、また、図4にも示すように、言語別翻訳辞書群105には、言語別に、例えば、一般名詞接尾語辞書、一般名詞接頭語辞書、一般名詞辞書、カタカナ語固有名詞接尾語辞書、カタカナ語固有名詞接頭語辞書、カタカナ語固有一般名詞辞書、カタカナ語一般名詞接尾語辞書、カタカナ語一般名詞接頭語辞書、カタカナ語一般名詞辞書が用意されている。
[Process of Use Dictionary Creation Unit 114]
FIG. 4 is a block diagram for explaining the processing of the use
このため、使用辞書作成部114は、翻訳対象言語に応じて、言語別翻訳辞書群105の翻訳辞書の中から使用する辞書を選択して抽出する。そして、その使用順序を定めて辞書を並べ変えて結合し、更に各辞書の内容(辞書データ)を、地図注記の読み仮名の長いもの順に並べた翻訳用使用辞書を翻訳用使用辞書ファイル115に作成する。なお、地図注記の読み仮名の長いもの順に並べるのは、最長一致法により、読み仮名付与済みデータの名詞句を置換するためである。また、各辞書データには、上述もしたように、その辞書データが属する辞書に応じて、部分一致、前方一致、後方一致のいずれにより検索語の置換が可能なものかを示す情報も付加される。
Therefore, the use
また、辞書の選択や並び順は、翻訳対象言語ごとの優先度や必要性に応じて行う。辞書の選択や並び順の一例について説明する。韓国語は表音文字であり、カタカナで表現された日本語は、その音(おん)に対応する韓国語(ハングル文字)に置き換えることができる。このため、翻訳対象言語が韓国語の場合、使用辞書作成部114は、カタカナ語の辞書は使用せず、韓国語への翻訳用の一般名詞接尾語辞書、一般名詞接頭語辞書、一般名詞辞書を使用辞書として選択する。
Further, the selection and arrangement order of dictionaries are performed according to the priority and necessity of each language to be translated. An example of dictionary selection and arrangement order will be described. Korean is a phonetic character, and Japanese expressed in katakana can be replaced with a Korean (Hangul character) corresponding to the sound. For this reason, when the language to be translated is Korean, the use
そして、使用辞書作成部114は、選択した辞書の並び順として、例えば、接尾語、接頭語を翻訳した上で、残りの一般名詞を翻訳するために、(1)一般名詞接尾語辞書→(2)一般名詞接頭語辞書→(3)一般名詞辞書の順に並べて結合する。各辞書内は、上述もしたように、地図注記に対応する読み仮名の長いもの順に並べる。このようにして、地図注記を韓国語に翻訳するための翻訳用使用辞書を翻訳用使用辞書ファイル115に形成する。
Then, the use
また、漢字で表された日本語の一般名詞は、中国語でも同じ漢字で表される場合も多い。このため、翻訳対象言語が中国語である場合には、上述した9つの全ての辞書を用いるが、カタカナ語の翻訳を優先させるため、カタカナ語に関する辞書を先に使用し、次に一般名詞に関する辞書を使用するように使用辞書を並べ変えて結合する。各辞書内は、上述もしたように、地図注記に対応する読み仮名の長いもの順に並べる。このようにして、地図注記を中国語に翻訳するための翻訳用使用辞書を翻訳用使用辞書ファイル115に形成する。
In addition, Japanese common nouns expressed in Chinese characters are often expressed in the same Chinese characters in Chinese. For this reason, when the language to be translated is Chinese, all the nine dictionaries described above are used. However, in order to prioritize the translation of Katakana, the dictionary related to Katakana is used first, and then the general noun is used. Rearrange the used dictionaries to use dictionaries and combine them. As described above, each dictionary is arranged in the order of long reading kana corresponding to the map notes. In this manner, a translation use dictionary for translating map notes into Chinese is formed in the translation
また、翻訳対象言語が英語の場合には、日本語とは全く異なる言語であるため、上述した9つの全ての辞書を用い、その使用順も最初に一般名詞に関する辞書、次にカタカナ語に関する辞書というように並べて結合することができる。この場合においても、各辞書内は、上述もしたように、地図注記に対応する読み仮名の長いもの順に並べておく。このようにして、地図注記を英語に翻訳するための翻訳用使用辞書を翻訳用使用辞書ファイル115に形成する。
In addition, when the translation target language is English, it is a completely different language from Japanese, so all nine of the above-mentioned dictionaries are used, and the order of use is first a dictionary for general nouns and then a dictionary for katakana. Can be combined side by side. Even in this case, the respective dictionaries are arranged in the order of the long reading kana corresponding to the map notes as described above. In this manner, a translation use dictionary for translating map notes into English is formed in the translation
なお、ここで説明した翻訳対象言語ごとの優先度や必要性に応じた辞書の選択や並び順は一例であり、この他にも種々の態様とすることができる。また、上述した9つの辞書以外にも使用する辞書が存在する場合には、その辞書についても考慮することは言うまでもない。また、翻訳対象言語ごとに特別に設けられた辞書が存在する場合もあり、その場合には、その翻訳対象言語が選択された場合には、当該辞書も使用される辞書として選択されることになる。 Note that the selection and arrangement order of dictionaries according to the priority and necessity for each translation target language described here are merely examples, and various other modes can be used. Needless to say, if there are dictionaries to be used other than the nine dictionaries described above, these dictionaries are also considered. In addition, there may be a dictionary specially provided for each translation target language. In that case, when the translation target language is selected, the dictionary is also selected as a dictionary to be used. Become.
[全文置換処理部116の処理]
[第1の処理(変数への格納処理)]
図5、図6、図7のそれぞれは、全文置換処理部116で行われる第1の処理である読み仮名付与済みデータファイル113の全ての読み仮名付与済みデータを1つの変数に格納する処理について説明するための図である。
[Process of Full Text Replacement Processing Unit 116]
[First processing (storage processing to variable)]
Each of FIGS. 5, 6, and 7 relates to a process of storing all reading-kana-given data in the reading-kana-given data file 113 as a first process performed by the full-text
この内、図5は、全文置換処理部116で行われる当該第1の処理について説明するための図である。図5に示すように、全文置換処理部116で行われる第1の処理は、読み仮名付与済みデータファイル113の読み仮名付与済みデータを読み込んで、読み仮名付与済みデータごとにセパレータを付しながら、全読み仮名付与済みデータを1つの変数に格納する。これにより、読み仮名付与済みデータファイル113の全ての読み仮名付与済みデータが、全文置換処理部116のメモリ116M上に展開される。
Among these, FIG. 5 is a figure for demonstrating the said 1st process performed in the full text
図6は、全文置換処理部116において実行される読み仮名付与済みデータの変数への格納プログラムの一例を示す図である。図6に示すプログラムにより、図3を用いて説明したように、「エリアコード、属性番号、地図注記、読み仮名」からなる読み仮名付与済みデータのそれぞれは、他の読み仮名付与済みデータと分離可能な態様で変数$head[$i]に格納される。更に、読み仮名付与済みデータのそれぞれの読み仮名だけが変数$jpに格納される。これら変数に格納された読み仮名付与済みデータと、当該読み仮名付与済みデータの読み仮名とは、同じ順番で各変数に格納されるので、そのそれぞれの対応関係は維持される。
FIG. 6 is a diagram illustrating an example of a program for storing the reading-kana-given data that is executed in the full-text
図7は、図3に示した読み仮名付与済みデータファイル113の各読み仮名付与済みデータの読み仮名が、変数$jpに格納された状態を示す図である。図6に示したプログラムを実行することにより、各読み仮名付与済みデータの読み仮名だけが、他の読み仮名と分離可能な態様で変数$jpに格納される。これにより、各読み仮名付与済みデータの各読み仮名がメモリ116M上に格納され、一括して処理の対象にできる。
FIG. 7 is a diagram showing a state where the reading pseudonym of each reading pseudonym-assigned data of the reading pseudonym assigned data file 113 shown in FIG. 3 is stored in the variable $ jp. By executing the program shown in FIG. 6, only the reading kana of each reading kana-given data is stored in the variable $ jp in a manner separable from other reading kana. As a result, each reading-kana of each reading-kana-given data is stored on the
[第2の処理(全文置換処理)]
図8、図9、図10、図11のそれぞれは、全文置換処理部116で行われる第2の処理である翻訳用使用辞書ファイル115の辞書データを用いて、上述したように変数$Jpに格納された読み仮名を目的とする言語に置換する処理について説明するための図である。
[Second processing (full-text replacement processing)]
8, 9, 10, and 11, as described above, the variable $ Jp is set in the variable $ Jp using the dictionary data of the translation
この内、図8は、全文置換処理部116で行われる当該第2の処理について説明するための図である。図8に示すように、全文置換処理部116で行われる第2の処理は、翻訳用使用辞書ファイル115の辞書データを1件ずつ読み込み、変数$jpに格納されている読み仮名付与済みデータの読み仮名を当該辞書データの翻訳データに置換する処理を行う。そして、変数$head[$i]に格納された読み仮名付与済みデータと、これに対する変数$jpの置換された翻訳データとを対応付けて翻訳済みデータを形成し、これを翻訳済みデータファイル117に記録する。これにより、翻訳対象の地図注記を、目的とする翻訳対象言語に翻訳できる。
Among these, FIG. 8 is a figure for demonstrating the said 2nd process performed in the full-text
図9は、全文置換処理部116において実行される変数$Jpに格納された読み仮名を目的とする言語に全文置換するプログラムの一例を示す図である。図9に示すプログラムは、後方一致により用いられる辞書の辞書データを用いては、後方一致により置換処理を行う。また、当該プログラムは、前方一致により用いられる辞書の辞書データを用いては、前方一致により置換処理を行う。同様に、当該プログラムは、部分一致により用いられる辞書の辞書データを用いては、部分一致により置換処理を行う。
FIG. 9 is a diagram showing an example of a program that replaces the full text with the target language of the reading pseudonym stored in the variable $ Jp, which is executed by the full text
そして、図9に示すプログラムは、置換処理終了後においては、変数$head[$i]に格納された読み仮名付与済みデータと、これに対する変数$jpの置換された翻訳データとを対応付けて翻訳済みデータを形成し、これを出力する。実際には、形成された翻訳済みデータは翻訳済みデータファイル117に記録される。このようにして、翻訳対象の地図注記が目的とする翻訳対象言語に翻訳される。
Then, after the replacement process is completed, the program shown in FIG. 9 associates the read-named data stored in the variable $ head [$ i] with the translation data in which the variable $ jp is replaced. Form translated data and output it. Actually, the formed translated data is recorded in the translated
ここで、図7に示したように、変数$jpに格納された翻訳対象の地図注記に対応する読み仮名を、英語に翻訳する場合を例にして、全文置換処理部116で行われる第2の処理である全文置換処理について具体的に説明する。
Here, as shown in FIG. 7, the second sentence performed by the full-text
図10は、変数$jpに格納された翻訳対象の地図注記に対応する読み仮名を、英語に翻訳する場合に、翻訳用使用辞書ファイル115に用意される翻訳用使用辞書データの例を説明するための図である。ここでは、説明を簡単にするため、図10に示すように、辞書A〜Eの5つの辞書が使用する辞書として選択されて抽出され、辞書A〜Eの順番で並べられたものとする。そして、辞書A〜Eのそれぞれには、辞書データが1つだけ存在しているものとする。
FIG. 10 illustrates an example of the translation use dictionary data prepared in the translation
図11は、図10に示した辞書により、変数$jpの格納データを全文置換処理した場合の状態を示す図である。図11(A)は、図7に示した内容と同じであり、変数$jpに、3つの地図注記データの読み仮名「あくせき じま」、「ひずえ じま」、「ヲウボウ かはん」が格納されている場合を示している。 FIG. 11 is a diagram showing a state when the full text replacement processing is performed on the stored data of the variable $ jp using the dictionary shown in FIG. FIG. 11 (A) is the same as that shown in FIG. 7, and in the variable $ jp, three readings of map annotation data “Akase Jima”, “Hizue Jima”, “Owaku Kahan” "Is stored.
そして、全文置換処理部116は、この例の場合、まず、翻訳用使用辞書ファイル115から、辞書Aの辞書データを読み込み、部分一致により、変数$jpの格納データの全文置換を行う。すなわち、全文置換処理部116は、辞書Aの辞書データに応じて、「ヲウボウ」を「Wobou」に置換せよという命令を出す。ここで、「ヲウボウ」は、名詞句の任意の位置にある「ヲウボウ」を置換の対象にすることを意味する。この場合、図11(B)に示すように、3番目の名詞句の読み仮名の「ヲウボウ」が、辞書Aの辞書データの翻訳データ「Wobou」に置換される。
In this example, the full text
なお、この例において、全文置換処理部116が出す命令において、部分一致、前方一致、後方一致の区別は、置換対象の読み仮名に付される「,(カンマ)」の位置により判別できる。すなわち、前方一致により置換を指示する場合には、「,ヲウボウ」となり、後方一致で置換を指示する場合には、「ヲウボウ,」となる。また、部分一致で置換を指示する場合には、「ヲウボウ」となり、「,(カンマ)」は付されないものとなる。
In this example, in the command issued by the full-text
次に、全文置換処理部116は、翻訳用使用辞書ファイル115から、辞書Bの辞書データを読み込み、前方一致により、変数$jpの格納データの全文置換を行う。すなわち、全文置換処理部116は、辞書Bの辞書データに基づいて、「,あくせき」を「Akuseki」に置換せよという命令を出す。ここで、「,あくせき」は、名詞句の前方にある「あくせき」を置換の対象にすることを意味する。この場合、図11(C)に示すように、1番目の名詞句の読み仮名の前側(前方)に位置する「あくせき」が、辞書Bの辞書データの翻訳データ「Akuseki」に置換される。
Next, the full-text
次に、全文置換処理部116は、翻訳用使用辞書ファイル115から、辞書Cの辞書データを読み込み、後方一致により、変数$jpの格納データの全文置換を行う。すなわち、全文置換処理部116は、辞書Cの辞書データに基づいて、「かはん,」を「River side」に置換せよという命令を出す。ここで、「かはん,」は、名詞句の後方にある「かはん」を置換の対象にすることを意味する。この場合、図11(D)に示すように、3番目の名詞句の読み仮名の後側(後方)に位置する「かはん」が、辞書Cの辞書データの翻訳データ「Rever Side」に置換される。
Next, the full text
次に、全文置換処理部116は、翻訳用使用辞書ファイル115から、辞書Dの辞書データを読み込み、前方一致により、変数$jpの格納データの全文置換を行う。すなわち、全文置換処理部116は、辞書Dの辞書データに基づいて、「,ひずえ」を「Hizue」に置換せよという命令を出す。ここで、「,ひずえ」は、名詞句の前方にある「ひずえ」を置換の対象にすることを意味する。この場合、図11(E)に示すように、2番目の名詞句の読み仮名の前側(前方)に位置する「ひずえ」が、辞書Dの辞書データの翻訳データ「Hizue」に置換される。
Next, the full text
最後に、全文置換処理部116は、翻訳用使用辞書ファイル115から、辞書Eの辞書データを読み込み、後方一致により、変数$jpの格納データの全文置換を行う。すなわち、全文置換処理部116は、辞書Eの辞書データに基づいて、「じま,」を「Island」に置換せよという命令を出す。ここで、「じま,」は、名詞句の後方にある「じま」を置換の対象にすることを意味する。この場合、図11(F)に示すように、1番目と2番目の2つの名詞句の読み仮名の後側(後方)に位置する「じま」が、辞書Eの辞書データの翻訳データ「Island」に置換される。このようにして、翻訳用使用辞書ファイル115に作成された翻訳用使用辞書の辞書データにより、変数$jp内の読み仮名を翻訳データに置き換える全文置換が行われる。
Finally, the full text
そして、全文置換処理部116は、上述もしたように、変数$head[$i]に格納された読み仮名付与済みデータと、これに対する変数$jpの置換された翻訳データとを対応付けて翻訳済みデータを形成し、これを翻訳済みデータファイル117に記録する。図12は、翻訳済みデータファイル117の格納データの例を説明するための図である。図12に示すように、翻訳済みデータファイル117の格納データである翻訳済みデータは、「エリアコード、属性番号、地図注記、読み仮名、翻訳データ」からなる。このようにして、翻訳対象データファイル111の各翻訳対象データに対して、対応する翻訳データを付加した翻訳済みデータが、翻訳済みデータファイル117に得られる。
Then, as described above, the full-text
なお、図11に示した例においては、名詞句を構成する語句が2つしかないために、部分一致の例と前方一致の例が同じになっている。しかし、本来の部分一致置換は、例えば「○○映画村」という翻訳対象データが存在し、「置換方式=部分一致,翻訳対象=映画,翻訳データ=movie」という辞書データで翻訳することが指示されたとする。この場合には、「映画」を「movie」に置換せよという命令が出される。この命令により、「○○映画村」が、「○○movie村」というように、「映画」が「movie」に置き換えられるのが本来の部分一致による置換である。 In the example shown in FIG. 11, since there are only two words constituting the noun phrase, the partial match example and the forward match example are the same. However, the original partial match replacement has, for example, translation target data “XX movie village”, and it is instructed to translate with dictionary data “substitution method = partial match, translation target = movie, translation data = movie”. Suppose that In this case, an instruction to replace “movie” with “movie” is issued. By this command, “movie movie village” is replaced with “movie movie village”, and “movie” is replaced with “movie” in the original partial match replacement.
[実施の形態の翻訳装置での翻訳処理のまとめ]
次に、この実施の形態の翻訳装置で行われる地図注記の翻訳処理について、図13、図14のフローチャートを参照しながらまとめる。この実施の形態の翻訳装置で行われる処理は、大きく分けると翻訳対象データである地図注記データへの読み仮名の付与処理と、読み仮名が付与された地図注記データの翻訳処理とに分けることができる。読み仮名が付与された地図注記データは、地図注記データを種々の言語に翻訳する場合に共通して利用することができるため、地図注記データに変更が生じない限り、1回だけ行えばよい。これに対して、地図注記の翻訳処理は、翻訳対象言語がことなれば別途実行する必要のある処理である。
[Summary of Translation Processing in Translation Device of Embodiment]
Next, the map annotation translation processing performed by the translation apparatus of this embodiment will be summarized with reference to the flowcharts of FIGS. The processing performed in the translation apparatus of this embodiment can be broadly divided into reading kana assignment processing for map annotation data that is data to be translated and translation processing for map annotation data to which reading kana is given. it can. Since the map note data to which the reading pseudonym is assigned can be used in common when the map note data is translated into various languages, it may be performed only once unless the map note data is changed. On the other hand, the map annotation translation process is a process that needs to be executed separately if the language to be translated is different.
[読み仮名の付与処理]
図13は、この実施の形態の翻訳装置で行われる翻訳対象データに対して読み仮名を付与する処理を説明するためのフローチャートである。この図13のフローチャートに示す処理は、当該翻訳装置の制御部101において実行され、制御部101が読み仮名付与部112を制御することによって行われる。
[Yomikana assignment process]
FIG. 13 is a flowchart for explaining a process of assigning a reading pseudonym to translation target data performed by the translation apparatus of this embodiment. The processing shown in the flowchart of FIG. 13 is executed by the
当該翻訳装置の制御部101は、操作部103を通じて当該翻訳装置の使用者からの読み仮名の付与処理の実行指示を受け付けると、図13に示す翻訳処理を実行する。この場合、制御部101は、読み仮名付与部112を制御し、翻訳対象データファイル111に蓄積されている各翻訳対象データの地図注記に対して、読み仮名辞書群104の各辞書を用いて、読み仮名を付与する処理を行う(ステップS101)。
When the
このステップS101の処理において読み仮名付与部112は、図2に示した翻訳対象データファイル111の各翻訳対象データに対して、その地図注記に対する読み仮名を付与して、図3に示した読み仮名付与済みデータを作成する。ここで作成された読み仮名付与済みデータは、読み仮名付与済みデータファイル113に蓄積される。
In the process of step S101, the reading
このようにして、翻訳対象データファイル111の全ての翻訳対象データに対応する読み仮名付与済みデータが、読み仮名付与済みデータファイル113に格納されると、この図13に示す処理は終了する。 In this way, when the reading pseudonymized data corresponding to all the translation target data in the translation target data file 111 is stored in the reading pseudonymized data file 113, the processing shown in FIG.
[地図注記の翻訳処理]
図14は、この実施の形態の翻訳装置で行われる地図注記の翻訳処理を説明するためのフローチャートである。この図14のフローチャートに示す処理は、当該翻訳装置の制御部101において実行され、制御部101が使用辞書作成部114と、全文置換処理部116とを制御することによって行われる。
[Translation processing of map notes]
FIG. 14 is a flowchart for explaining a map annotation translation process performed by the translation apparatus of this embodiment. The processing shown in the flowchart of FIG. 14 is executed by the
当該翻訳装置の制御部101は、操作部103を通じて当該翻訳装置の使用者からの翻訳処理の実行指示を受け付けると、図13に示す翻訳処理を実行する。まず、制御部101は、操作部103を通じて使用者からの翻訳対象言語の選択入力を受け付ける(ステップS201)。
When receiving a translation processing execution instruction from the user of the translation device through the
次に、制御部101は、使用辞書作成部114を制御し、選択された翻訳対象言語に応じた翻訳用使用辞書を、翻訳用使用辞書ファイル115に作成する処理を行う(ステップS202)。このステップS202の処理は、上述もしたように、使用辞書作成部114が、翻訳対象言語に応じて、翻訳に使用する辞書を言語別翻訳辞書群105から選択して抽出する。そして、使用辞書作成部114が、抽出した辞書をその使用順序を定めて並べ替える共に、地図注記の読み仮名の長いもの順に辞書データを並べた翻訳用使用辞書を翻訳用使用辞書ファイル115に作成する。
Next, the
次に、制御部101は、全文置換処理部116を制御して、読み仮名付与済みデータファイル113に格納されている読み仮名付与済みデータを、所定の変数に格納する処理を行う(ステップS203)。このステップS203の処理は、図5〜図7を用いて説明したように、変数$head[$i]に読み仮名付与済みデータを、変数$jpに読み仮名付与済みデータの読み仮名を格納する処理である。
Next, the
この後、制御部101は、全文置換処理部116を制御して、翻訳用使用辞書ファイル115の辞書データを1件ずつ読み込み、変数$jpに格納した読み仮名を辞書データの翻訳データで全文置換する処理を行う(ステップS204)。このステップS204の処理は、図8〜図11を用いて説明した処理であり、変数$jpに格納された地図注記の読み仮名は、翻訳用使用辞書ファイル115に格納されている各翻訳用使用辞書データの翻訳データで全文置換される。
Thereafter, the
そして、制御部101は、更に全文置換処理部116を制御し、全文置換処理部116が、翻訳済みデータを作成し、これを翻訳済みデータファイル117に記録する処理を行う(ステップS205)。このステップS205において作成される翻訳済みデータは、変数$head[$i]に格納された読み仮名付与済みデータと、これに対する変数$jpの置換された翻訳データとを対応付けて形成されるものである。このステップS205の処理の後、この図14に示す翻訳処理は終了する。これにより、翻訳済みデータファイル117には、図12に示した態様の翻訳済みデータが蓄積される。
The
なお、上述もしたように、図12に示した例の翻訳済みデータは、地図注記を英語に翻訳したものである。従って、図14に示した翻訳処理において、ステップS201で目的とする言語を翻訳対象言語として選択することにより、地図注記を目的とする言語に翻訳した翻訳済みデータが作成できる。 As described above, the translated data in the example shown in FIG. 12 is a map note translated into English. Therefore, in the translation process shown in FIG. 14, by selecting the target language as the translation target language in step S201, translated data translated into the target language for the map annotation can be created.
[中国語への翻訳の場合の特例処理]
上述した実施の形態では、中国語(簡体)、中国語(繁体)、英語、韓国語の4言語に翻訳することを想定した。当該4言語のどの言語に翻訳する場合にも、この発明を適用することが可能である。しかし、中国語(簡体)、中国語(繁体)に翻訳する場合であって、日本語の地図注記の漢字部分については、これに付与された読み仮名を用いずに、単漢字変換により翻訳が可能である。
[Special handling for translation into Chinese]
In the embodiment described above, it is assumed that translation is performed into four languages of Chinese (simplified), Chinese (traditional), English, and Korean. The present invention can be applied to any of the four languages. However, when translating into Chinese (simplified) and Chinese (traditional), the kanji part of the map note in Japanese can be translated by single kanji conversion without using the reading kana given to it. Is possible.
すなわち、日本語の漢字は、中国語(簡体)、中国語(繁体)と共通に用いることができるものも多く、通常、日本語の漢字に対して、対応する中国語の簡体文字、中国語の繁体文字が決まる。このため、日本語の地図注記の漢字部分は、読み仮名を用いずに、単漢字変換により翻訳する。簡単には、日本語の漢字をそのまま用いるようにしてもよいし、日本語の漢字から中国語の簡体文字、中国語の繁体文字を特定して、これを翻訳結果として用いるようにしてもよい。なお、日本語のかたかなやひらがなについては、上述したこの発明によって翻訳できる。 That is, there are many Japanese kanji characters that can be used in common with Chinese (simplified) and Chinese (traditional). Usually, the corresponding Chinese simplified characters, Chinese Traditional characters are determined. For this reason, the kanji portion of the Japanese map note is translated by single kanji conversion without using the reading kana. For simplicity, Japanese Kanji characters may be used as they are, or Simplified Chinese characters and Traditional Chinese characters may be identified from Japanese Kanji characters and used as translation results. . Note that Japanese Katakana and Hiragana can be translated by the above-described invention.
[実施の形態の効果]
上述した実施の形態の翻訳装置によれば、大量に存在する地図注記を、従来の機械翻訳装置に比べて飛躍的に速く、且つ、正確に翻訳できる。
[Effect of the embodiment]
According to the translation apparatus of the embodiment described above, a large amount of map notes can be translated significantly faster and more accurately than conventional machine translation apparatuses.
また、地図注記について読み仮名を付与し、この付与した読み仮名を翻訳する構成としているので、実際の読み方に即した翻訳ができる。不自然な翻訳となることが無い。 Moreover, since the reading kana is given to the map note, and the given reading kana is translated, the translation according to the actual reading can be performed. There is no unnatural translation.
そして、数百万件の地図注記を翻訳する場合、従来は翻訳に数週間かかっていたが、これを数時間に短縮することができた。 And when translating millions of map notes, it used to take weeks to translate, but it could be reduced to hours.
[エリアコードと属性番号の利用]
なお、上述した実施の形態においては、図3を用いて説明したように、読み仮名付与済みデータファイル113の各格納データには、エリアコードと属性番号とが付されている。このため、翻訳用変数はエリア別、属性別で用意する。そして、翻訳対象データに読み仮名を付与した読み仮名付与済みデータを、各変数に振り分けて格納し、これを結合することにより、エリア別、属性別に、読み仮名付与済みデータを格納した1つの変数が形成できる。この場合、エリアコードと属性番号とが、各読み仮名付与済みデータのヘッダ情報となる。
[Use of area code and attribute number]
In the above-described embodiment, as described with reference to FIG. 3, each storage data of the reading pseudonymized data file 113 is assigned an area code and an attribute number. For this reason, translation variables are prepared for each area and attribute. Then, the reading-kana-assigned data with the reading-kana added to the data to be translated is distributed to each variable and stored, and by combining them, one variable storing the reading-kana-added data by area and attribute Can be formed. In this case, the area code and the attribute number serve as header information of each reading-kana given data.
また、上述した実施の形態では、言語別翻訳辞書群の各翻訳辞書には、エリアコードや属性番号が無い場合を例にして説明したが、これに限るものではない。実際には、辞書データもエリア別、属性別に編成される。すなわち、言語別翻訳辞書群の各翻訳辞書が有する辞書データのそれぞれにも、翻訳対象データの場合と同様にして、エリアコードと属性番号とが付与されている。同じ文字からなる地図注記でも、エリアが異なれば読み方が違う場合も有れば、同じ文字からなる地図注記でも、属性が異なれば読み方が違う場合もあるためである。前者の例としては、「新宿」との記載は、「しんじゅく」と読む地名もあれば、「あらじゅく」と読む地名もある。また、後者の例としては、「浅草」と記載されていても、地名では「あさくさ」と読ませ、寺院の名称としては「せんそう」と読ませるといった例がある。 In the above-described embodiment, the case where each translation dictionary in the language-specific translation dictionary group has no area code or attribute number has been described as an example. However, the present invention is not limited to this. In practice, dictionary data is also organized by area and attribute. That is, the area code and the attribute number are assigned to each dictionary data included in each translation dictionary in the language-specific translation dictionary group as in the case of the translation target data. This is because even a map note made up of the same characters may be read differently if the area is different, and a map note made up of the same characters may be read differently if the attributes are different. As an example of the former, the description of “Shinjuku” includes a place name that reads “Shinjuku” and a place name that reads “Arajuku”. As an example of the latter, there is an example in which “Asakusa” is read as the place name, and “Senso” is read as the temple name, even though “Asakusa” is described.
そこで、使用辞書作成部114は、翻訳用使用辞書を作成するに当り、各翻訳辞書の各辞書データが備えるエリアコードと属性番号をも含めて辞書データを構成する。そして、各辞書の辞書データは、エリアコード順であって、属性番号順で、且つ読み仮名の文字数の長いもの順に並べる。そして、エリアコードと、属性番号と、読み仮名とが一致した場合にのみ、読み仮名付与済みデータの読み仮名を、翻訳用使用辞書ファイル115の辞書データの翻訳データで置換する。このようにすることによって、エリアや属性が異なることによって読み仮名が違う同じ表記の地図注記に対しても、その適切な読み仮名に応じた適切な翻訳結果を確実に付与できる。
Therefore, the use
また、エリアコードと、読み仮名とが一致した場合にのみ、読み仮名付与済みデータの読み仮名を、翻訳用使用辞書ファイル115の辞書データの翻訳データで置換することもできる。同様に、属性番号と、読み仮名とが一致した場合にのみ、読み仮名付与済みデータの読み仮名を、翻訳用使用辞書ファイル115の辞書データの翻訳データで置換することもできる。前者の場合には、例えば、翻訳対象が住所などのように、属性番号を有しないデータを翻訳する場合に適用できる。後者の場合には、単一のエリアの地図注記を翻訳する場合など、翻訳対象のデータが属するエリアが単一のエリアに限られている場合に適用できる。
In addition, only when the area code and the reading kana match, the reading kana of the data to which the reading kana has been added can be replaced with the translation data of the dictionary data in the translation
[変形例など]
なお、上述した実施の形態では、地図注記データを翻訳する場合を例にして説明したが、これに限るものではない。例えば、電話帳リスト、顧客リスト、住所リストといった多数の名前、住所などの名詞句の羅列が含まれるものの当該多数の名詞句の羅列を翻訳する場合に、この発明を適用できる。
[Modifications, etc.]
In the above-described embodiment, the case where the map annotation data is translated has been described as an example. However, the present invention is not limited to this. For example, the present invention can be applied to a case where a large number of noun phrases such as a phone book list, a customer list, and an address list are included, but a large number of noun phrases are translated.
また、上述した実施の形態では、地図注記データを翻訳する場合の翻訳対象言語には、例えば、中国語(簡体)、中国語(繁体)、英語、韓国語の4言語に対応可能なものとして説明したが、これに限るものではない。目的とする言語の翻訳辞書を用意するだけで、地図注記などの名詞句の羅列を種々の言語に翻訳できる。 In the above-described embodiment, the language to be translated when the map annotation data is translated is, for example, capable of supporting four languages: Chinese (simplified), Chinese (traditional), English, and Korean. Although explained, it is not limited to this. A list of noun phrases such as map notes can be translated into various languages simply by preparing a translation dictionary for the target language.
また、読み仮名が付与されて形成された読み仮名付与済みデータは、各言語に翻訳する場合に共通に利用できるので、図13に示した翻訳対象データに対して読み仮名を付与する処理は、地図注記に変更が無い限り、1回だけ行えばよい。 Moreover, since the reading-kana-added data formed by adding the reading-kana can be used in common when translated into each language, the process of giving the reading-kana to the translation target data shown in FIG. As long as there are no changes to the map notes, this only needs to be done once.
また、上述した実施の形態では、使用辞書作成部114が、言語別翻訳辞書群105から翻訳対象言語に応じて、必要となる辞書を選択して抽出し、それらの並び順を整えた翻訳用使用辞書を翻訳用使用辞書ファイル115に作成するものとして説明した。しかし、これに限るものではない。必要となる辞書を、必要となる順番で、シーケンシャルに読み出すようにしてももちろんよい。この場合、使用辞書作成部114は、全文置換処理部116に対して、使用する辞書とその使用順を指示するものとなる。
In the above-described embodiment, the use
また、図2などに示した地図注記データは、その一例として簡単なものを示したが、実際には、漢字、カタカナ、ひらがな、英数字記号が混在する場合がある。このため、漢字やカタカナの一般名詞については、上述した方式で翻訳を行う。また、漢字の固有名詞については、その読み仮名をローマ字変換する。また、カタカナを韓国語に翻訳する場合には、音(おん)に応じて韓国に置き換える。英数字記号は、何もせずにそのまま用いる。というように、ハイブリッドな翻訳が行われる。 In addition, the map annotation data shown in FIG. 2 and the like is shown as a simple example, but in reality, kanji, katakana, hiragana, and alphanumeric symbols may be mixed. For this reason, kanji and katakana common nouns are translated in the manner described above. In addition, for kanji proper nouns, their kana are converted to Roman characters. If katakana is translated into Korean, it is replaced with Korean according to the sound. Use alphanumeric characters as they are without doing anything. Thus, a hybrid translation is performed.
[その他]
上述した実施の形態の説明からも分かるように、請求項に記載した翻訳装置の翻訳辞書は、実施の形態の翻訳装置の言語別翻訳辞書群の各翻訳辞書に対応し、また、請求項に記載した翻訳装置の辞書作成手段は、実施の形態の翻訳装置の使用辞書作成部114に対応している。また、請求項に記載した翻訳装置の読み仮名辞書は、実施の形態の翻訳装置の読み仮名辞書群104の各読み仮名辞書に対応し、請求項に記載した翻訳装置の読み仮名付与手段は、実施の形態の翻訳装置の読み仮名付与部112に対応している。
[Others]
As can be seen from the description of the above-described embodiment, the translation dictionary of the translation device described in the claims corresponds to each translation dictionary of the language-specific translation dictionary group of the translation device of the embodiment. The dictionary creation means of the translation device described corresponds to the use
また、請求項に記載した翻訳装置の格納手段、全文置換手段のそれぞれは、実施の形態の翻訳装置の全文置換処理部116に対応している。
Each of the storage unit and the full text replacement unit of the translation device described in the claims corresponds to the full text
また、図14を用いて説明した翻訳処理は、この発明の翻訳方法の一実施の形態が適用されたものであり、図14を用いて説明した翻訳処理を実行するプログラムは、この発明の翻訳プログラムの一実施の形態が適用されたものである。また、図1に示した読み仮名付与部112、使用辞書作成部114、全文置換処理部116の各機能は、制御部101で実行されるプログラムにより、制御部101の機能として実現することもできる。
The translation process described with reference to FIG. 14 is the one to which an embodiment of the translation method of the present invention is applied. The program for executing the translation process described with reference to FIG. An embodiment of the program is applied. 1 may be realized as a function of the
101…制御部、102…記憶装置、103…操作部、104…読み仮名辞書群、105…言語別翻訳辞書群、111…使用辞書作成部、112…翻訳用使用辞書ファイル、113…翻訳対象データファイル、114…読み仮名付与部、115…読み仮名付与済みデータファイル、116…全文置換処理部、116M…メモリ、117…翻訳済みデータファイル
DESCRIPTION OF
Claims (7)
翻訳対象の1以上の名詞句と当該1以上の名詞句のそれぞれの読み仮名とを有する読み仮名付与済みデータを、他の読み仮名付与済みデータと区別可能な態様で1つの変数に格納する格納手段と、
前記辞書作成手段により作成された前記翻訳用辞書の辞書データを1件ずつ読み込み、前記変数に格納されている前記読み仮名付与済みデータの翻訳対象の名詞句を、前記翻訳用辞書の前記辞書データを用いて目的とする言語に全文置換する全文置換手段と
を備えることを特徴とする翻訳装置。 Select and extract the dictionary to be used from multiple translation dictionaries with different types of noun phrases to be searched according to the language to be translated. A dictionary creation means for creating a dictionary for translation of the dictionary contents;
Storage that stores reading-kana-added data having one or more noun phrases to be translated and the reading-kana of each of the one or more noun phrases in a variable that is distinguishable from other reading-kana-giving data. Means,
The dictionary data of the dictionary for translation created by the dictionary creating means is read one by one, and the noun phrase to be translated of the data with the kana added stored in the variable is converted to the dictionary data of the dictionary for translation. A translation device comprising: full-text replacement means for replacing the full-text with a target language using
前記複数の翻訳辞書は、検索語の一致方式が前方一致、後方一致、部分一致で異なる複数の辞書を含むことを特徴とする翻訳装置。 The translation device according to claim 1,
The translation apparatus, wherein the plurality of translation dictionaries include a plurality of dictionaries having different search word matching methods for front matching, backward matching, and partial matching.
前記変数に格納された前記読み仮名付与済みデータには、当該読み仮名付与済みデータに含まれる前記名詞句の属性を示す属性情報が付加されており、
前記翻訳辞書の辞書データには、当該辞書データに含まれる前記名詞句の属性を示す属性情報が対応付けられており、
前記全文置換手段は、前記変数に格納されている前記読み仮名付与済みデータの名詞句を、当該読み仮名付与済みデータと同じ属性情報を有する前記翻訳辞書の辞書データを用いて目的とする言語に置換することを特徴とする翻訳装置。 A translation device according to claim 1 or 2, wherein
Attribute information indicating the attribute of the noun phrase included in the reading-kana-given data is added to the reading-kana-giving data stored in the variable,
The dictionary data of the translation dictionary is associated with attribute information indicating the attribute of the noun phrase included in the dictionary data,
The full-text replacing means converts the noun phrase of the reading-kana-given data stored in the variable into a target language using dictionary data of the translation dictionary having the same attribute information as the reading-kana-given data. A translation device characterized by replacing.
前記変数に格納された前記読み仮名付与済みデータには、当該読み仮名付与済みデータに含まれる前記名詞句に関する場所が属する地域を示すエリア情報が付加されており、
前記翻訳辞書の辞書データには、当該辞書データに含まれる前記名詞句に関する場所が属する地域を示すエリア情報が付加されており、
前記全文置換手段は、前記変数に格納されている前記読み仮名付与済みデータの名詞句を、当該読み仮名付与済みデータと同じエリア情報を有する前記翻訳辞書の辞書データを用いて目的とする言語に置換することを特徴とする翻訳装置。 A translation device according to claim 1 or 2, wherein
Area information indicating a region to which a location relating to the noun phrase included in the reading pseudonymized data belongs is added to the reading pseudonymized data stored in the variable,
Area information indicating a region to which a place relating to the noun phrase included in the dictionary data belongs is added to the dictionary data of the translation dictionary,
The full-text replacement means converts the noun phrase of the reading-kana-given data stored in the variable into a target language using dictionary data of the translation dictionary having the same area information as the reading-kana-given data. A translation device characterized by replacing.
前記変数に格納された前記読み仮名付与済みデータには、当該読み仮名付与済みデータに含まれる前記名詞句の属性を示す属性情報と、当該読み仮名付与済みデータに含まれる前記名詞句に関する場所が属する地域を示すエリア情報とが付加されており、
前記翻訳辞書の辞書データには、当該辞書データに含まれる前記名詞句の属性を示す属性情報と、当該辞書データに含まれる前記名詞句に関する場所が属する地域を示すエリア情報が付加されており、
前記全文置換手段は、前記変数に格納されている前記読み仮名付与済みデータの名詞句を、当該読み仮名付与済みデータと同じ属性情報とエリア情報とを有する前記翻訳辞書の辞書データを用いて目的とする言語に置換することを特徴とする翻訳装置。 A translation device according to claim 1 or 2, wherein
The phonetic affixed data stored in the variable includes attribute information indicating attributes of the noun phrase included in the phonetic affixed data, and a place related to the noun phrase included in the phonetic affixed data. Area information indicating the region to which it belongs,
In the dictionary data of the translation dictionary, attribute information indicating the attribute of the noun phrase included in the dictionary data, and area information indicating a region to which a place related to the noun phrase included in the dictionary data belongs, are added.
The full-text replacement means uses the dictionary data of the translation dictionary having the same attribute information and area information as the reading-kana-given data for the noun phrase of the reading-kana-giving data stored in the variable. A translation device characterized in that it is replaced with a language.
格納手段が、翻訳対象の1以上の名詞句と当該1以上の名詞句のそれぞれの読み仮名とを有する読み仮名付与済みデータを、他の読み仮名付与済みデータと区別可能な態様で1つの変数に格納する格納工程と、
全文置換手段が、前記辞書作成手段により作成された前記翻訳用辞書の辞書データを1件ずつ読み込み、前記変数に格納されている前記読み仮名付与済みデータの翻訳対象の名詞句を、前記翻訳用辞書の前記辞書データを用いて目的とする言語に全文置換する全文置換工程と
を有することを特徴とする翻訳方法。 The dictionary creation means selects and extracts dictionaries to be used from multiple translation dictionaries with different types of noun phrases to be searched according to the language to be translated, determines the order of use, rearranges them, and reads noun phrases A dictionary creation step for creating a dictionary for translation in which the dictionary contents are arranged in the order of long kana;
One variable in a manner in which the storage means can distinguish the reading-kana-added data having one or more noun phrases to be translated and the respective reading-kana of the one or more noun phrases from other reading-kana-giving data. Storing process to store in,
Full-text replacement means reads the dictionary data of the dictionary for translation created by the dictionary creation means one by one, and translates the noun phrase to be translated of the reading-kana given data stored in the variable And a full-text replacing step of replacing the full-text with a target language using the dictionary data of the dictionary.
翻訳対象言語に応じて、検索する名詞句の種類の異なる複数の翻訳辞書の中から使用する辞書を選択して抽出し、その使用順序を定めて並べ替え、名詞句の読み仮名の長いもの順に辞書内容を並べた翻訳用辞書を作成する辞書作成手段と、
翻訳対象の1以上の名詞句と当該1以上の名詞句のそれぞれの読み仮名とを有する読み仮名付与済みデータを、他の読み仮名付与済みデータと区別可能な態様で1つの変数に格納する格納手段と、
前記辞書作成手段により作成された前記翻訳用辞書の辞書データを1件ずつ読み込み、前記変数に格納されている前記読み仮名付与済みデータの翻訳対象の名詞句を、前記翻訳用辞書の前記辞書データを用いて目的とする言語に全文置換する全文置換手段と
として機能させることを特徴とする翻訳プログラム。 The computer installed in the translation device
Select and extract the dictionary to be used from multiple translation dictionaries with different types of noun phrases to be searched according to the language to be translated. A dictionary creation means for creating a dictionary for translation of the dictionary contents;
Storage that stores reading-kana-added data having one or more noun phrases to be translated and the reading-kana of each of the one or more noun phrases in a variable that is distinguishable from other reading-kana-giving data. Means,
The dictionary data of the dictionary for translation created by the dictionary creating means is read one by one, and the noun phrase to be translated of the data with the kana added stored in the variable is converted to the dictionary data of the dictionary for translation. A translation program that functions as full-text replacement means for replacing the full-text with a target language using.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014068166A JP6312243B2 (en) | 2014-03-28 | 2014-03-28 | Translation apparatus, translation method, and translation program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014068166A JP6312243B2 (en) | 2014-03-28 | 2014-03-28 | Translation apparatus, translation method, and translation program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015191446A JP2015191446A (en) | 2015-11-02 |
JP6312243B2 true JP6312243B2 (en) | 2018-04-18 |
Family
ID=54425883
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014068166A Expired - Fee Related JP6312243B2 (en) | 2014-03-28 | 2014-03-28 | Translation apparatus, translation method, and translation program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6312243B2 (en) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0981572A (en) * | 1995-09-12 | 1997-03-28 | Toshiba Corp | Translation device and dictionary priority setting method |
CN1934565A (en) * | 2004-03-18 | 2007-03-21 | 日本电气株式会社 | Machine translation system, machine translation method, and program |
JP5529092B2 (en) * | 2011-09-14 | 2014-06-25 | 株式会社ゼンリンデータコム | Note data translation apparatus, note data translation method, and note data translation program |
JP6210398B2 (en) * | 2012-04-25 | 2017-10-11 | 株式会社サン・フレア | Translation support device, translation support system, and program thereof |
JP6076285B2 (en) * | 2014-03-25 | 2017-02-08 | 株式会社ゼンリンデータコム | Translation apparatus, translation method, and translation program |
-
2014
- 2014-03-28 JP JP2014068166A patent/JP6312243B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2015191446A (en) | 2015-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5011751B2 (en) | Translation information output processing program, processing method, and processing apparatus | |
US7979268B2 (en) | String matching method and system and computer-readable recording medium storing the string matching method | |
CN103026318B (en) | Input method editor | |
JP2007004633A (en) | Language model generation device and language processing device using language model generated by the same | |
JP2005107597A (en) | Device and method for searching for similar sentence and program | |
CN106873971B (en) | Multi-language display method and system for flash application | |
JP6312243B2 (en) | Translation apparatus, translation method, and translation program | |
JP4845523B2 (en) | Character processing apparatus, method, program, and recording medium | |
JP7027757B2 (en) | Information processing equipment and information processing programs | |
JP6076285B2 (en) | Translation apparatus, translation method, and translation program | |
JP2012098891A (en) | Information processing system and information processing method | |
JP5521772B2 (en) | Character input device, character input method and program | |
JP6805206B2 (en) | Search word suggestion device, expression information creation method, and expression information creation program | |
JP2010146061A (en) | Example display, example display method, and example display program | |
JP6221275B2 (en) | Character input program and character input device | |
JP4587908B2 (en) | Metadata generation device, metadata constraint definition processing device, and control method thereof | |
JP2008210229A (en) | Device, method and program for retrieving intellectual property information | |
JP2015176541A (en) | Translation device, translation method and translation program | |
JP6048601B2 (en) | Information display device, program, and word information display method | |
JP2019008477A (en) | Discrimination program, discrimination device and discrimination method | |
JP2015185116A (en) | Translation device, translation method and translation program | |
JP2018147205A (en) | Information processing device and information processing program | |
JP6166443B1 (en) | Information search support device and program | |
JP2015185115A (en) | Translation device, translation method and translation program | |
JP5742454B2 (en) | Input support program, input support apparatus, and input support method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170323 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180312 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180314 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180316 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6312243 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |