JP2015184998A - 翻訳装置、翻訳方法及び翻訳プログラム - Google Patents

翻訳装置、翻訳方法及び翻訳プログラム Download PDF

Info

Publication number
JP2015184998A
JP2015184998A JP2014062001A JP2014062001A JP2015184998A JP 2015184998 A JP2015184998 A JP 2015184998A JP 2014062001 A JP2014062001 A JP 2014062001A JP 2014062001 A JP2014062001 A JP 2014062001A JP 2015184998 A JP2015184998 A JP 2015184998A
Authority
JP
Japan
Prior art keywords
translation
reading
program
dictionary
kana
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014062001A
Other languages
English (en)
Other versions
JP6076285B2 (ja
Inventor
光昭 小関
Mitsuaki Koseki
光昭 小関
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zenrin Datacom Co Ltd
Original Assignee
Zenrin Datacom Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zenrin Datacom Co Ltd filed Critical Zenrin Datacom Co Ltd
Priority to JP2014062001A priority Critical patent/JP6076285B2/ja
Publication of JP2015184998A publication Critical patent/JP2015184998A/ja
Application granted granted Critical
Publication of JP6076285B2 publication Critical patent/JP6076285B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】大量に存在する名詞句の羅列を、従来の機械翻訳装置に比べて飛躍的に速く、且つ、正確に翻訳できるようにする。
【解決手段】読み仮名辞書111の各辞書は、読み仮名付与プログラム作成部112によって、その内容がプログラムロジックに変換され、文字列に対してその読み仮名を付与する読み仮名付与プログラムとなる。言語別翻訳辞書群の各辞書は、言語別翻訳プログラム作成部122よって、その内容がプログラムロジックに変換され、読み仮名を所定の言語に翻訳する翻訳プログラムとなる。読み仮名付与プログラム実行部132により、読み仮名付与プログラムを実行し、言語別翻訳プログラム実行部134により、言語別翻訳プログラムが実行され、大量の名詞句の羅列の翻訳を行う。
【選択図】図1

Description

この発明は、例えば、地図上に記載される文字情報であるいわゆる地図注記などのように、大量に存在する名詞句の羅列データの翻訳を行うための装置、方法、プログラムに関する。
従来から機械翻訳装置に関する種々の発明がなされている。例えば、後に記す特許文献1には、固有名詞を翻訳する場合であっても、固有名詞辞書を適切に整備しておくことにより正確に翻訳することができることが記載されている。また、同文献には、固有名詞辞書に登録された各固有名詞に対する捕捉語を記憶保持する捕捉語辞書をも用いることにより、固有名詞がどのようなものかについても翻訳結果に含めるようにすることが記載されている。これにより、翻訳結果をより理解し易いものとすることができるという点で効果がある。
特開2004−220416号公報
従来の機械翻訳装置の場合、翻訳のために種々の辞書が必要になっている。上述した特許文献1に記載の発明でも固有名詞などの翻訳辞書に加えて捕捉語辞書も必要なっている。翻訳のために辞書を検索する処理にはある程度時間がかかるために、大量の固有名詞などの名詞句の羅列の翻訳を行う場合には時間が掛かる。例えば、大量の名詞句の羅列の翻訳行う場合の例として、地図注記の翻訳を行う場合について考える。
地図には、例えば、市街図、道路図、広域図、地方図、全国図といった種々のものがあり、さらに同じ種類の地図でも縮尺の異なる複数の地図が存在する。このように、種類や縮尺の異なる全ての地図を対象にした場合、地図注記は数千万件も存在する。そして、数字、アルファベット、アイコンのみにより構成される地図注記などの翻訳が必要ないものは除外し、重複する地図注記は1つに集約したとしても、翻訳対象となる地図注記は数百万件も存在する。
この数百万件の地図注記を、従来の辞書を参照する方式で多言語に機械翻訳する場合には、数週間を要しているのが現状である。また、地図注記は、地図上の地物が無くなったり、新たにできたりした場合には、必ず変わるため、所定のタイミングで現地調査をして更新し、翻訳し直す必要がある。
このように、地図注記は、翻訳を繰り返す必要があるため、できるだけ高速に翻訳したいとする要求が従来からある。このことは地図注記だけでなく、住所リスト、電話帳リスト、顧客リストなどに記載された、例えば、地名、名称、名前、住所といった多数の名詞句の羅列を翻訳する場合にも同様に生じている課題である。
以上のことに鑑み、この発明は、大量に存在する名詞句の羅列データを、従来の機械翻訳装置に比べて飛躍的に速く、且つ、正確に翻訳できるようにすることを目的とする。
上記課題を解決するため、請求項1に記載の発明の翻訳装置は、
文字列とその読み仮名とを対応付けた読み仮名辞書と、
前記読み読み仮名辞書の内容をプログラムロジックに変換し、入力された文字列に読み仮名を付与する読み仮名付与プログラムを作成する第1のプログラム作成手段と、
読み仮名とその読み仮名に対応する所定の言語の文字列とを対応付けた翻訳辞書と、
前記翻訳辞書の内容をプログラムロジックに変換し、入力された読み仮名を所定の言語に翻訳する翻訳プログラムを作成する第2のプログラム作成手段と、
前記第1のプログラム作成手段で作成された前記読み仮名付与プログラムを実行し、翻訳対象の文字列に読み仮名を付与する読み仮名付与手段と、
前記第2のプログラム作成手段で作成された翻訳プログラムを実行し、前記読み仮名付与手段で付与された読み仮名を目的とする言語に翻訳する翻訳手段と
を備えることを特徴とする。
この請求項1に記載の発明の翻訳装置によれば、読み仮名辞書は、第1のプログラム作成手段によって、その内容がプログラムロジックに変換され、入力さえた文字列に対してその読み仮名を付与する読み仮名付与プログラムとなる。同様に、翻訳辞書は、第2のプログラム作成手段によって、その内容がプログラムロジックに変換され、読み仮名を所定の言語に翻訳する翻訳プログラムとなる。
当該翻訳装置では、読み仮名変換手段が、第1のプログラム作成手段で作成された前記読み仮名付与プログラムを実行し、翻訳対象の文字列に読み仮名を付与する。当該読み仮名付与プログラムは、読み仮名辞書の内容がそのままプログラムロジックとされたものなので、外部の読み仮名辞書を参照する必要は全く無い。
当該翻訳装置では、翻訳手段が、第2のプログラム作成手段で作成された翻訳プログラムを実行し、読み仮名付与手段で付与された読み仮名を目的とする言語に翻訳する。当該翻訳プログラムは、翻訳辞書の内容がそのままプログラムロジックとされたものなので、外部の翻訳辞書を参照する必要は全く無い。
このように、当該翻訳装置では、翻訳対象の文字列に読み仮名を付与する場合にも、また、付与された読み仮名を目的とする言語に翻訳する場合にも、外部の辞書を全く参照しないため、極めて高速に翻訳を行える。従って、翻訳対象の文字列が多数存在していても、超高速に翻訳が行える。
この発明によれば、例えば、地図注記などの大量に存在する名詞句の羅列を、従来の機械翻訳装置に比べて飛躍的に速く、且つ、正確に翻訳できる。
実施の形態の翻訳装置の構成例と動作の概要を説明するためのブロック図である。 読み仮名辞書群111の内の固有名詞読み仮名辞書の一例を示す図である。 図2に示した固有名詞読み仮名辞書をプログラムロジックに変換して形成した読み仮名付与プログラムの例を示す図である。 入力データ「23,138,小碓通」を翻訳処理する場合の例を説明するための図である。 従来の翻訳装置における翻訳処理の概要を説明するための図である。 実施の形態の翻訳装置で行われる翻訳処理のための事前準備処理を説明するためのフローチャートである。 実施の形態の翻訳装置で行われる翻訳処理を説明するためのフローチャートである。
以下、図を参照しながら、この発明の装置、方法、プログラムの一実施の形態について説明する。この発明は、地図注記、電話帳リスト、顧客リストなどに記載された地名、名称、名前、住所といった、大量に存在する名詞句の羅列データについて翻訳を行う場合に適用可能なものである。「名詞句」との文言は、物体、物質、人物、場所など具体的な対象を示す語句を意味する。この明細書において、翻訳対象となる「名詞句の羅列」の具体例として、地図注記、電話帳リスト、顧客リストなどに記載された、例えば、地名、名称、名前、住所といったものを想定している。
以下においては、地図注記の翻訳を行う場合を例にして具体的に説明する。地図注記は、上述もしたように大量に存在し、頻繁に更新されるため、その更新の都度、翻訳し直さなければならないものであること。また、近年おいては、外国から日本を訪れる観光客やビジネスマンも増えてきており、最新の地図の地図注記を所定の外国語に翻訳して表した外国語対応の最新の地図を迅速に提供することが望まれていること。しかも、外国語は、中国語(簡体)、中国語(繁体)、英語、韓国語などというように、複数の言語に対応することが求められることなどの事情がある。
このような背景の下、以下に説明する実施の形態の装置、方法、プログラムは、大量に存在する地図注記を、従来の機械翻訳装置に比べて、飛躍的に速く、しかも適切に、且つ、複数の言語に翻訳することを実現している。
[ビッグデータ翻訳装置の構成例]
まず、この実施の形態のビッグデータ翻訳装置(以下、単に翻訳装置と記載する。)の構成例と動作の概要について説明する。図1は、この実施の形態の翻訳装置の構成例と動作の概要を説明するためのブロック図である。図1に示す翻訳装置において、制御部101は、当該翻訳装置の各部を制御する機能を、記憶装置102は情報記憶保持機能を実現し、操作部103は、ユーザーインターフェース機能を実現する。
読み仮名辞書群111は、固有名詞読み仮名辞書、一般名詞読み仮名辞書、接頭語読み仮名辞書、接尾語読み仮名辞書、カタカナ語読み仮名辞書などの複数の読み仮名辞書を備え、日本語の地図注記データに対する読み仮名を提供する。なお、図示していないが、接頭語読み仮名辞書は、固有名詞接頭語読み仮名辞書、一般名詞接頭語読み仮名辞書、カタカナ語接頭語読み仮名辞書がある。同様に、接尾語読み仮名辞書は、固有名詞接尾語読み仮名辞書、一般名詞接尾語読み仮名辞書、カタカナ語接尾語読み仮名辞書がある。
また、固有名詞読み仮名辞書、一般名詞読み仮名辞書、カタカナ語読み仮名辞書のそれぞれは、部分一致により漢字の読み仮名の検索が可能なものである。また、各接頭語読み仮名辞書は、接頭語の読み仮名を提供するものであるので、前方一致により漢字の読み仮名の検索が可能なものである。また、各接尾語読み仮名辞書は、接尾語の読み仮名を提供するものであるので、後方一致により漢字の読み仮名の検索が可能なものである。
読み仮名付与プログラム作成部(第1のプログラム作成手段)112は、読み仮名辞書群111の各読み仮名辞書の内容をプログラムロジックに変換し、地図注記データに対して読み仮名を付与する読み仮名付与プログラムを作成する。読み仮名付与プログラム作成部112により作成された読み仮名付与プログラムは、読み仮名付与プログラム格納部113に格納される。読み仮名付与プログラム格納部113は、例えば、記憶装置102の所定の格納領域に形成される。
図2は、読み仮名辞書群111の内の固有名詞読み仮名辞書の一例を示す図である。図3は、図2に示した固有名詞読み仮名辞書の一例から読み仮名付与プログラム作成部112により作成され、読み仮名付与プログラム格納部113に格納される読み仮名付与プログラムの一例を示す図である。
図2に示すように、読み仮名辞書は、エリアコード、属性番号、固有名詞及びその読み仮名からなる。エリアコードは、所定のエリアを一意に特定する情報である。エリアコードで特定される所定のエリアとしては、例えば都道府県がある。もちろん、都道府県よりも細分化したエリアとすることも可能である。属性番号は、地図注記として用いられる固有名詞がどのような属性のものかを示すものであり、例えば、地名、教育機関、公共機関、山岳、河川など100以上の属性(レイヤ)に分類されている。
また、図2において、固有名詞は、地図注記として用いられる固有名詞であり、読み仮名は、対応する固有名詞の読み仮名である。図2に示した固有名詞読み仮名辞書の一例は、愛知県(エリアコード=23)の、地名(属性番号=138)の一部を示すものである。なお、ここでは、固有名詞読み仮名辞書の例を示したが、その他の一般名詞読み仮名辞書、接頭語読み仮名辞書、接尾語読み仮名辞書、カタカナ語読み仮名辞書も基本的に図2に示した固有名詞読み仮名辞書と同様の構成を有する。
図2に示した固有名詞読み仮名辞書を、読み仮名付与プログラム作成部112によりプログラムロジックに変換すると、図3に示す読み仮名付与プログラムが得られる。図3に示した読み仮名付与プログラムは、プログラミング言語としてPerl(パール)によって記述されたものである。図3に示す読み仮名付与プログラムは、エリアコードと属性番号が一致し、且つ、地図注記(この例では固有名詞である地名)が一致したら、地図注記と読み仮名を出力するものである。
読み仮名付与プログラム作成部112は、具体例を示せば、図2に示した固有名詞読み仮名辞書から、図3に示した読み仮名付与プログラムを作成するものである。この実施の形態においては、最長一致法により地図注記の読み仮名を特定する。このため、読み仮名付与プログラム作成部112は、読み仮名辞書の内容を、名詞句(図2、図3に示した例では固有名詞)を長いもの順に並び変えたプログラムを作成している。図3に示した読み仮名付与プログラムを見れば分かるように、読み仮名辞書の内容がそのままプログラムロジックとなっているので、外部の辞書を参照する必要の全く無いプログラムとなっている。
実際には、読み仮名辞書群111は、上述したように複数の読み仮名辞書を備えているため、読み仮名付与プログラム作成部112により作成される読み仮名付与プログラムは、各読み仮名辞書に対応したプログラムロジック部を有する。より具体的には、読み仮名付与プログラムは、初期処理部、ユーザー辞書提供部、固有名詞接尾語辞書(後方一致)ロジック部、固有名詞接頭語辞書(前方一致)ロジック部、固有名詞辞書(部分一致)ロジック部、一般名詞接尾語辞書(後方一致)ロジック部、一般名詞接頭語辞書(前方一致)ロジック部、一般有名詞辞書(部分一致)ロジック部、カタカナ語一般名詞接尾語辞書(後方一致)ロジック部、カタカナ語一般名詞接頭語辞書(前方一致)ロジック部、カタカナ語一般有名詞辞書(部分一致)ロジック部、例外処理部、終了処理部の各部からなる。
読み仮名付与プログラム作成部112は、上記の各ロジック部の作成(生成)時には、(1)処理対象の読み仮名辞書から同じエリアコードと属性番号の辞書データ(エリアコード、属性番号、名詞句、読み仮名)を抽出する。そして、(2)読み仮名付与プログラム作成部112は、抽出した辞書データを名詞句の文字数の多いもの順に並べ変える。最長一致により読み仮名の抽出を可能にするためである。当該(1)、(2)の処理を処理対象の辞書から同じエリアコードと属性番号の辞書データが無くなるまで繰り返し、無くなれば、次のエリアコードと属性番号を有する辞書データの処理に移る。
このようにして、処理対処の全ての辞書データについて処理が完了すると、当該処理対処の読み仮名辞書に対応するロジック部が作成(生成)できる。そして、読み仮名辞書群111の各読み仮名辞書について、プログラムロジックを作成することにより、前方一致、後方一致、部分一致で用いられる各読み仮名辞書を最長一致法で読み仮名を抽出する読み仮名付与プログラムロジックに変換できる。
言語別翻訳辞書群121は、この実施の形態では、日本語の地図注記データの読み仮名を、目的とする外国語に翻訳するための言語別の翻訳辞書を備える。この実施の形態では、中国語(簡体)、中国語(繁体)、英語、韓国語の4言語に対応するため、4言語の翻訳辞書を備える。更に、各言語の翻訳辞書は、大きく分けると、一般名詞に関する辞書やカタカナ語に関する辞書を備える。一般名詞に関する辞書は、一般名詞接尾語辞書、一般名詞接頭語辞書、一般名詞辞書からなる。カタカナ語に関する辞書は、カタカナ語固有名詞接尾語辞書、カタカナ語固有名詞接頭語辞書、カタカナ語固有一般名詞辞書、カタカナ語一般名詞接尾語辞書、カタカナ語一般名詞接頭語辞書、カタカナ語一般名詞辞書からなる。
また、一般名詞辞書、カタカナ語固有名詞辞書、カタカナ語一般名詞辞書のそれぞれは、部分一致により読み仮名などに対応する翻訳データ(翻訳語句)の検索が可能なものである。また、各接頭語辞書は、接頭語に対応する翻訳データを提供するものであるので、前方一致により接頭語の翻訳データの検索が可能なものである。また、各接尾語辞書は、接尾語の翻訳データを提供するものであるので、後方一致により接尾語の翻訳データの検索が可能なものである。
言語別翻訳辞書群121が有する翻訳辞書もまた、図2に示した読み仮名辞書の場合と同様に、エリアコード、属性番号を備える。翻訳辞書の場合、図2における「固有名詞」が「読み仮名」などとなり、図2における「読み仮名」が「所定の言語の文字列(翻訳データ)」となるものである。
言語別翻訳プログラム作成部(第2のプログラム作成手段)122は、言語別翻訳辞書群121の各翻訳辞書の内容をプログラムロジックに変換し、地図注記データの読み仮名などを、所定の言語に変換する言語別翻訳プログラムを作成する。言語別翻訳プログラム作成部122により作成された言語別翻訳プログラムは、言語別翻訳プログラム格納部123に格納される。言語別翻訳プログラム格納部123、例えば、記憶装置102の所定の格納領域に形成される。
言語別翻訳プログラム作成部122により作成される言語別翻訳プログラムのプログラムロジック自体は、図3に示した読み仮名変換プログラムと同様のものである。すなわち、言語別翻訳プログラム作成部122により作成される言語別翻訳プログラムは、エリアコードと属性番号が一致し、且つ、読み仮名など(この例では地図注記の読み仮名など)が一致したら、当該読み仮名などと対応する所定の言語の文字列(翻訳データ)を出力するものである。
実際には、言語別翻訳辞書群121は、上述したように複数の翻訳辞書を備えているため、言語別翻訳プログラム作成部122により作成される言語別翻訳プログラムは、各翻訳辞書に対応したプログラムロジック部を有する。より具体的には、言語別翻訳プログラムは、初期処理部、ユーザー辞書提供部、一般名詞接尾語辞書(後方一致)ロジック部、一般名詞接頭語辞書(前方一致)ロジック部、一般名詞辞書(部分一致)ロジック部、カタカナ語固有名詞接尾語辞書(後方一致)ロジック部、カタカナ語固有名詞接頭語辞書(前方一致)ロジック部、カタカナ語固有有名詞辞書(部分一致)ロジック部、カタカナ語一般名詞接尾語辞書(後方一致)ロジック部、カタカナ語一般名詞接頭語辞書(前方一致)ロジック部、カタカナ語一般有名詞辞書(部分一致)ロジック部、例外処理部、終了処理部などの各部からなる。
言語別翻訳プログラム作成部122は、上記の各ロジック部の作成(生成)時には、(A)処理対象の翻訳辞書から同じエリアコードと属性番号の辞書データ(エリアコード、属性番号、名詞句、翻訳データ)を抽出する。そして、(B)言語別翻訳プログラム作成部122は、抽出した辞書データを名詞句の文字数の多いもの順に並べ変える。最長一致により翻訳データの抽出を可能にするためである。当該(A)、(B)の処理を処理対象の辞書から同じエリアコードと属性番号の辞書データが無くなるまで繰り返し、無くなれば、次のエリアコードと属性番号を有する辞書データの処理に移る。
このようにして、処理対処の全ての辞書データについて処理が完了すると、当該処理対処の翻訳辞書に対応するロジック部が作成(生成)できる。そして、言語別翻訳辞書群121の各翻訳辞書について、プログラムロジックを作成することにより、前方一致、後方一致、部分一致で用いられる各翻訳辞書を最長一致法で読み仮名を抽出する言語別翻訳プログラムロジックに変換できる。
翻訳対象データファイル(図1では、翻訳対象データFと記載。)131は、翻訳対象となる多数の地図注記データを保持する。具体的に、翻訳対象データファイル131には、「エリアコード、属性番号、地図注記データ」からなる翻訳対象データが多数保持されている。この翻訳対象データファイル131には、例えば、図示しない外部インターフェイスなどを通じて外部機器から提供された翻訳対象データなどが格納される。
読み仮名付与プログラム実行部132は、読み仮名付与プログラム作成部112により作成され、読み仮名付与プログラム格納部113に格納されている読み仮名付与プログラムを読み出して実行する。これにより、翻訳対象データファイル131に格納されている翻訳対象データの地図注記データに対して、実行された読み仮名付与プログラムにより読み仮名が付与される。
このようにして、翻訳対象データに対して読み仮名が付与されて形成された読み仮名データは、読み仮名データファイル(図1では、読み仮名データFと記載。)133に記録される。当該読み仮名データは、「エリアコード、属性番号、地図注記データ、対応する読み仮名」からなるものである。読み仮名データファイル133は、ハードディスクなどの大容量記録媒体に作成される。
言語別翻訳プログラム実行部134は、言語別翻訳プログラム作成部122により作成され、言語別翻訳プログラム格納部123に格納されている言語別翻訳プログラムを読み出して実行する。これにより、読み仮名データファイル133に格納されている各読み仮名データの読み仮名が、実行された言語別翻訳プログラムにより所定の言語に翻訳され、読み仮名データに対して、翻訳データが付加された言語別翻訳データが形成される。
言語別翻訳プログラム実行部134により実行された言語別翻訳プログラムにより作成された言語別翻訳データは、言語別翻訳データファイル135に記録される。当該言語別翻訳データは、「エリアコード、属性情報、地図注記データ、対応する読み仮名、所定の言語の文字列(翻訳データ)」からなるものである。言語別翻訳データファイル135は、ハードディスクなどの大容量記録媒体に作成される。
このように、この実施の形態の翻訳装置は、読み仮名辞書をプログラムロジックに変換して、読み仮名付与プログラムを作成し、この読み仮名付与プログラムを用いて、翻訳対象の地図注記データに対して読み仮名を付与する。また、この実施の形態の翻訳装置は、言語別の翻訳辞書をプログラムロジックに変換して、言語別翻訳プログラムを作成し、この言語別翻訳プログラムを用いて、地図注記データに対して付与された読み仮名を目的とする言語に翻訳する。
このように、使用される種々の辞書は、プログラムロジックに変換され、プログラムとして機能するので、種々の辞書を参照することが無く、プログラムを通じて、地図注記に対して読み仮名を付与し、この読み仮名が所定の言語に翻訳される構成になっている。これにより、外部の辞書を参照しないので、大量の地図注記を高速に目的とする言語に翻訳できる。
[翻訳装置の動作の具体例]
次に、図1を用いて説明したこの実施の形態の翻訳装置における翻訳処理の具体例について説明する。この実施の形態の翻訳装置は、大量の地図注記を超高速に翻訳できるものであるが、その処理内容を簡単に説明するため、1件分の入力データがどのように処理されるのかを具体的に説明する。
図4は、図1に示した翻訳装置において、エリアコードが「23(愛知県)」で、属性番号が「138(地名)」で、地図注記が「小碓通」である入力データを処理する場合の例を説明するための図である。図4に示すように、「23(エリアコード),138(属性番号),小碓通(地図注記)」である入力データが翻訳対象データファイル131に用意されている(ステップS1)。
そして、読み仮名辞書がプログラムロジックに変換されて形成された読み仮名付与プログラムを、読み仮名付与プログラム実行部132が実行する(ステップS2)。当該読み仮名付与プログラムは、翻訳対象データファイル131の当該入力データを読み出して、当該入力データ中の地図注記データに対応する読み仮名を付与した読み仮名データを形成し、これを読み仮名データファイル133に記録する(ステップS3)。
ステップS3で読み仮名データファイル133に記録される読み仮名データは、図4のステップS3に示したように、入力データに対して、更に読み仮名「こうす どおり」が付与されたものである。この読み仮名データは、どの言語に翻訳する場合にも共通に用いられる。すなわち、読み仮名データファイル133の読み仮名データは、各言語の翻訳プログラムによって共通に用いられる。
次に、言語別翻訳辞書がプログラムロジックに変換されて形成された言語別翻訳プログラムを、言語別翻訳プログラム実行部134が実行する(ステップS4)。当該言語別翻訳プログラムは、読み仮名データファイル133の当該読み仮名データを読み出して、当該読み仮名データ中の読み仮名に対応する所定の言語の文字列(翻訳データ)を付与した言語別翻訳データを形成し、これを言語別翻訳データファイル135に記録する(ステップS5)。
ステップS5で言語別翻訳データファイル135に記録される翻訳データは、図4のステップS5に示したように、読み仮名データに対して、更に各言語の翻訳データが付与されたものである。この実施の形態においては、中国語(簡体)、中国語(繁体)、英語、韓国語の4言語に翻訳されるため、各言語の翻訳プログラムにより、図4のステップS5に示したように、4言語のそれぞれの言語別の翻訳データが形成される。
これに対して、図5は、従来の翻訳装置における翻訳処理の概要を説明するための図である。図5に示すように、従来の翻訳装置では、図4に示した例と同様の入力データを翻訳する場合、言語別翻訳プログラムが、まず、翻訳対象の文字列(この例の場合には地図注記)を形態素解析などの手法を用いて意味のある文字列単位に分解する。そして、この分解した各文字列(あるいは文字)を、翻訳辞書を用いて翻訳する。
この従来の翻訳装置の場合には、形態素解析の段階や翻訳処理の段階で種々の辞書(データベース)を参照する必要がある。このように種々に辞書にアクセスする分の時間は、翻訳処理に掛かる時間の多くの部分を占めており、翻訳処理は時間の掛かるものとなっていた。
しかし、図4と図5とを比較しても分かるように、この出願の翻訳装置の場合には、外部の辞書(データベース)を全く参照しないため、翻訳処理の高速化が実現できる。また、地図注記に読み仮名を付与することで、正しい読み仮名に応じた翻訳が可能となる。また、地図注記データに対して読み仮名が付与されて形成された読み仮名データは、各言語の翻訳プログラムで共通に使用される。このため、各言語の翻訳プログラムにおいて、地図注記に読み仮名を付与する処理は行わなくてもよい。
[実施の形態の翻訳装置で行われる処理のまとめ]
この実施の形態の翻訳装置で行われる処理は、読み仮名付与プログラムと言語別翻訳プログラムを作成する事前準備処理と、作成された読み仮名付与プログラムと言語別翻訳プログラムを用いて地図注記を翻訳する翻訳処理とに大きく分けることができる。事前準備処理は、基になる読み仮名辞書や言語別翻訳辞書が変更されない限り、繰り返し行う必要は無い。また、この実施の形態の翻訳装置において行われる翻訳処理は、まず、地図注記データに対して読み仮名を付与して読み仮名データを形成する処理と、形成された読み仮名データの読み仮名を翻訳する処理とに分けられる。以下においては、この実施の形態の翻訳装置で行われる、事前準備処理と翻訳処理のそれぞれについて、具体的に説明する。
[事前準備処理]
図6は、この実施の形態の翻訳装置で行われる事前準備処理を説明するためのフローチャートである。事前準備処理は、図6に示すように、まず、読み仮名付与プログラム作成部112が、読み仮名辞書群111の各読み仮名辞書のぞれぞれの内容をプログラムロジックに変換して、読み仮名付与プログラムを作成する(ステップS21)。ステップS21の処理では、前方一致、後方一致、部分一致で使用される読み仮名辞書のそれぞれが、最長一致法で読み仮名を置換するプログラムロジックに変換される。
次に、言語別翻訳プログラム作成部122が、言語別翻訳辞書群121の各翻訳辞書の内容をプログラムロジックに変換して、言語別翻訳プログラムを作成する(ステップS22)。ステップS22の処理でも、前方一致、後方一致、部分一致で使用される翻訳辞書のそれぞれが、最長一致法で対象翻訳言語に置換するプログラムロジックに変換される。
これら2つの処理を通じて、読み仮名付与プログラム格納部113には読み仮名付与プログラムが格納され、言語別翻訳プログラム格納部123には、各言語別の翻訳プログラムが格納され、地図注記の翻訳処理の準備が整えられる。なお、言語別翻訳プログラム格納部123には、言語別の複数の翻訳プログラムが格納されることになる。
このように、図6に示した処理を通じて、翻訳処理前の事前準備ができる。そして、上述もしたように、図6に示す事前準備は、読み仮名辞書群111の読み仮名辞書に変更が生じたり、言語別翻訳辞書群121の翻訳辞書に変更が生じたりした場合に実行すればよい。もちろん、読み仮名辞書群111の読み仮名辞書だけに変更が生じた場合には、図6に示したステップS21の処理だけを行えばよい。また、言語別翻訳辞書群121の翻訳辞書だけに変更が生じた場合には、図6に示したステップS22の処理だけを行えばよい。
[翻訳処理]
図7は、この実施の形態の翻訳装置で行われる翻訳処理を説明するフローチャートである。当該翻訳処理は、図7に示すように、読み仮名付与処理(図7(A))と、言語別翻訳処理(図7(B))からなる。読み仮名付与処理(図7(A))は、読み仮名付与プログラム実行部132において実行される読み仮名付与プログラムによる処理である。言語別翻訳処理(図7(B))は、言語別翻訳プログラム実行部134において実行される言語別翻訳プログラムによる処理である。
当該翻訳処理では、まず、読み仮名付与プログラム実行部132が読み仮名付与プログラムを実行し、翻訳対象データファイル131をインプットファイルとし、読み仮名データファイル133をアウトプットファイルとして、図7(A)に示す読み仮名付与処理を行う。当該読み仮名付与処理において、読み仮名付与プログラム実行部132は、翻訳対象データファイル131から翻訳対象データを順次に読み出す(ステップS31)。読み仮名付与プログラム実行部132は、翻訳対象データが読み出せたか否か(全ての翻訳対象データの読み出しが終了したか否か)を判別する(ステップS32)。
ステップS32の判別処理において、翻訳対象データが読み出せたと判別したとする。この場合、読み仮名付与プログラム実行部132は、その読み出した翻訳対象データの地図注記データに対して読み仮名を付与して読み仮名データを形成し、これを読み仮名データファイル133に書き込む処理を行う(ステップS33)。この後、ステップS31からの処理を繰り返す。
ステップS32の判別処理において、全ての翻訳対処データの読み出しが終了したと判別したときには、図7(A)に示す読み仮名付与処理を終了する。
当該読み仮名付与プログラムによる読み仮名付与処理が終了すると、言語別翻訳プログラム実行部134が言語別翻訳プログラムを実行し、読み仮名データファイル133をインプットファイルとし、言語別翻訳データファイル135をアウトプットファイルとして、図7(B)に示す言語別翻訳処理を行う。当該言語別翻訳処理において、言語別翻訳プログラム実行部134は、読み仮名データファイル133から読み仮名データを順次に読み出す(ステップS41)。言語別翻訳プログラム実行部134は、読み仮名データが読み出せたか否か(全ての読み仮名データの読み出しが終了したか否か)を判別する(ステップS42)。
ステップS42の判別処理において、読み仮名データが読み出せたと判別したとする。この場合、言語別翻訳プログラム実行部134は、その読み出した読み仮名データの読み仮名に対する所定の言語の文字列(翻訳データ)を付与して言語別翻訳データを形成し、これを言語別翻訳データファイル135に書き込む処理を行う(ステップS43)。この後、ステップS41からの処理を繰り返す。
ステップS42の判別処理において、読み仮名データが読み出せなかった(全ての読み仮名データの読み出しが終了した)と判別したときには、図7(B)に示す言語別翻訳与処理を終了する。なお、この図7(B)に示す処理は、言語別の翻訳プログラムによって言語別に行われる処理である。
このように、読み仮名付与処理(図7(A))と言語別翻訳処理(図7(B))の処理を通じて翻訳処理が行われる。そして、読み仮名付与処理と言語別翻訳処理のいずれにおいても、インプットファイルとアウトプットファイルが存在するだけで、参照データベースは一切存在しない。すなわち、読み仮名辞書や翻訳辞書は、プログラムロジックに変換されて、それぞれ、読み仮名付与プログラム、言語別翻訳プログラムとされている。このため、地図注記に対する読み仮名の付与は、読み仮名付与プログラムの中だけで完結するように処理され、付与された読み仮名の所定の言語への翻訳は、言語別翻訳プログラムの中だけで完結するように処理される
このようにして、この実施の形態の翻訳装置では、大量の地図注記を極めて高速に翻訳することを実現している。
[実施の形態の効果]
上述した実施の形態の翻訳装置によれば、大量に存在する地図注記を、従来の機械翻訳装置に比べて飛躍的に速く、且つ、正確に翻訳できる。
また、地図注記について読み仮名を付与し、この付与した読み仮名を翻訳する構成としているので、実際の読み方に即した翻訳ができる。不自然な翻訳となることが無い。
また、読み仮名が付与されて形成された読み仮名データは、各言語の翻訳プログラムで共通に使用できる。つまり、地図注記を複数の言語に翻訳する場合であっても、各言語の翻訳プログラムなどで重複して読み仮名データを形成する処理を行わなくても済む。
そして、数百万件の地図注記を翻訳する場合、従来は翻訳に数週間かかっていたが、これを数時間に短縮することができた。各言語の翻訳プログラムによる処理は、それぞれ数十分の処理時間を実現している。
[変形例など]
なお、上述した実施の形態では、地図注記データを中国語(簡体)、中国語(繁体)、英語、韓国語の4言語に翻訳するものとして説明したが、これに限るものではない。この他の種々の言語に翻訳することももちろんできる。翻訳対象の言語の組み合わせは種々の組み合わせとすることができる。もちろん、単一の言語に翻訳する場合にも対応できる。
また、上述した実施の形態では、地図注記データを翻訳する場合を例にして説明したが、これに限るものではない。例えば、電話帳リスト、顧客リスト、住所リストといった多数の名前、住所などの名詞句の羅列が含まれるものの当該多数の名詞句の羅列を翻訳する場合に、この発明を適用できる。
また、上述した実施の形態では、読み仮名に対して翻訳を行うものとして説明した。しかし、これに限るものではない。例えば、ひらがな、カタカナ、漢字、アルファベット、数字、記号からなる翻訳対象そのものと作成した読み仮名とを比較しながら、より適切に翻訳を行うようにすることができる。
[その他]
上述した実施の形態の説明からも分かるように、請求項に記載した翻訳装置の読み仮名辞書は、実施の形態の翻訳装置の読み仮名辞書群の各読み仮名辞書に対応し、また、請求項に記載した翻訳装置の翻訳辞書は、実施の形態の翻訳装置の言語別翻訳辞書群の各翻訳辞書に対応している。また、請求項に記載した翻訳装置の第1のプログラム作成手段は、実施の形態の翻訳装置の読み仮名付与プログラム作成部112に対応し、請求項に記載した翻訳装置の第2のプログラム作成手段は、この実施の形態の翻訳装置の言語別翻訳プログラム作成部122に対応している。
また、請求項に記載した翻訳装置の読み仮名付与手段は、この実施の形態の翻訳装置の読み仮名付与プログラム実行部132に対応し、また、請求項に記載した翻訳装置の翻訳手段は、この実施の形態の翻訳装置の言語別翻訳プログラム実行部134に対応している。
また、図5、図6を用いて説明した翻訳処理は、この発明の翻訳方法の一実施の形態が適用されたものであり、図5、図6を用いて説明した翻訳処理を実行するプログラムは、この発明の翻訳プログラムの一実施の形態が適用されたものである。また、図1に示した読み仮名付与プログラム作成部112、言語別翻訳プログラム作成部122、読み仮名付与プログラム実行部132、言語別翻訳プログラム実行部134の各機能は、制御部101で実行されるプログラムにより、制御部101の機能として実現することもできる。
101…制御部、102…記憶装置、103…操作部、111…読み仮名辞書群、112…読み仮名付与プログラム作成部、113…読み仮名付与プログラム格納部、121…言語別翻訳辞書群、122…言語別翻訳プログラム作成部、123…言語別翻訳プログラム格納部、131…翻訳対象データファイル、132…読み仮名付与プログラム実行部、133…読み仮名データファイル、134…言語別翻訳プログラム実行部、135…言語別翻訳データファイル

Claims (7)

  1. 文字列とその読み仮名とを対応付けた読み仮名辞書と、
    前記読み読み仮名辞書の内容をプログラムロジックに変換し、入力された文字列に読み仮名を付与する読み仮名付与プログラムを作成する第1のプログラム作成手段と、
    読み仮名とその読み仮名に対応する所定の言語の文字列とを対応付けた翻訳辞書と、
    前記翻訳辞書の内容をプログラムロジックに変換し、入力された読み仮名を所定の言語に翻訳する翻訳プログラムを作成する第2のプログラム作成手段と、
    前記第1のプログラム作成手段で作成された前記読み仮名付与プログラムを実行し、翻訳対象の文字列に読み仮名を付与する読み仮名付与手段と、
    前記第2のプログラム作成手段で作成された翻訳プログラムを実行し、前記読み仮名付与手段で付与された読み仮名を目的とする言語に翻訳する翻訳手段と
    を備えることを特徴とする翻訳装置。
  2. 請求項1に記載の翻訳装置であって、
    前記第2のプログラム作成手段は、所定の翻訳条件に合致するプログラムロジックに変換できるものであることを特徴とする翻訳装置。
  3. 請求項1または請求項2のいずれかに記載の翻訳装置であって、
    前記読み仮名辞書と前記翻訳辞書とは、検索語の一致方式が、前方一致、後方一致、部分一致で異なる複数の辞書からなることを特徴とする翻訳装置。
  4. 請求項3に記載の翻訳装置であって、
    前記第1のプログラム作成手段は、前方一致、後方一致、部分一致で使用される前記読み仮名辞書のそれぞれを、最長一致法で読み仮名を置換するプログラムロジックに変換するものであり、
    前記第2のプログラム作成手段は、前方一致、後方一致、部分一致で使用される前記翻訳辞書のそれぞれを、最長一致法で対象翻訳言語に置換するプログラムロジックに変換するものであることを特徴とする翻訳装置。
  5. 請求項1、請求項2、請求項3または請求項4のいずれかに記載の翻訳装置であって、
    前記翻訳対象の文字列は、場所に関するものであり、前記読み仮名変換辞書には、各文字列に対応して、その文字列が属する地域を示すエリア情報と、その文字列の属性を示す属性情報とが付加されており、
    前記第1のプログラム作成手段は、前記エリア情報と前記属性情報とを含めて、前記読み読み仮名変換辞書の内容をプログラムロジックに変換することを特徴とする翻訳装置。
  6. 第1のプログラム作成手段が、文字列とその読み仮名とを対応付けた読み仮名辞書の内容をプログラムロジックに変換し、入力された文字列に読み仮名を付与する読み仮名付与プログラムを作成する第1のプログラム作成工程と、
    第2のプログラム作成手段が、読み仮名とその読み仮名に対応する所定の言語の文字列とを対応付けた翻訳辞書の内容をプログラムロジックに変換し、入力された読み仮名を所定の言語に翻訳する翻訳プログラムを作成する第2のプログラム作成工程と、
    前記第1のプログラム作成工程において作成した前記読み仮名付与プログラムを、読み仮名付与手段が実行し、翻訳対象の文字列に読み仮名を付与する読み仮名付与工程と、
    前記第2のプログラム作成工程において作成した翻訳プログラムを、翻訳手段が実行し、前記読み仮名付与工程で付与した読み仮名を目的とする言語に翻訳する翻訳工程と
    を有することを特徴とする翻訳方法。
  7. 文字列とその読み仮名とを対応付けた読み仮名辞書と、読み仮名とその読み仮名に対応する所定の言語の文字列とを対応付けた翻訳辞書とを備えた情報処理装置に搭載されたコンピュータを、
    前記読み読み仮名辞書の内容をプログラムロジックに変換し、入力された文字列に読み仮名を付与する読み仮名付与プログラムを作成する第1のプログラム作成手段と、
    前記翻訳辞書の内容をプログラムロジックに変換し、入力された読み仮名を所定の言語に翻訳する翻訳プログラムを作成する第2のプログラム作成手段と、
    前記第1のプログラム作成手段で作成された前記読み仮名付与プログラムを実行し、翻訳対象の文字列に読み仮名を付与する読み仮名付与手段と、
    前記第2のプログラム作成手段で作成された翻訳プログラムを実行し、前記読み仮名付与手段で付与された読み仮名を目的とする言語に翻訳する翻訳手段と
    して機能させることを特徴とする翻訳プログラム。
JP2014062001A 2014-03-25 2014-03-25 翻訳装置、翻訳方法及び翻訳プログラム Expired - Fee Related JP6076285B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014062001A JP6076285B2 (ja) 2014-03-25 2014-03-25 翻訳装置、翻訳方法及び翻訳プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014062001A JP6076285B2 (ja) 2014-03-25 2014-03-25 翻訳装置、翻訳方法及び翻訳プログラム

Publications (2)

Publication Number Publication Date
JP2015184998A true JP2015184998A (ja) 2015-10-22
JP6076285B2 JP6076285B2 (ja) 2017-02-08

Family

ID=54351429

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014062001A Expired - Fee Related JP6076285B2 (ja) 2014-03-25 2014-03-25 翻訳装置、翻訳方法及び翻訳プログラム

Country Status (1)

Country Link
JP (1) JP6076285B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015191446A (ja) * 2014-03-28 2015-11-02 株式会社ゼンリンデータコム 翻訳装置、翻訳方法及び翻訳プログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6170663A (ja) * 1984-09-14 1986-04-11 Toshiba Corp 住所翻訳装置
JP2009075748A (ja) * 2007-09-19 2009-04-09 Toshiba Corp 機械翻訳装置及びプログラム
JP2013061830A (ja) * 2011-09-14 2013-04-04 Zenrin Datacom Co Ltd 注記データ翻訳装置、注記データ翻訳方法および注記データ翻訳プログラム
JP2013257672A (ja) * 2012-06-12 2013-12-26 Shinei Planners:Kk 漢字引き仮名変換機能付き日本語入力システム
JP2015176541A (ja) * 2014-03-18 2015-10-05 株式会社ゼンリンデータコム 翻訳装置、翻訳方法及び翻訳プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6170663A (ja) * 1984-09-14 1986-04-11 Toshiba Corp 住所翻訳装置
JP2009075748A (ja) * 2007-09-19 2009-04-09 Toshiba Corp 機械翻訳装置及びプログラム
JP2013061830A (ja) * 2011-09-14 2013-04-04 Zenrin Datacom Co Ltd 注記データ翻訳装置、注記データ翻訳方法および注記データ翻訳プログラム
JP2013257672A (ja) * 2012-06-12 2013-12-26 Shinei Planners:Kk 漢字引き仮名変換機能付き日本語入力システム
JP2015176541A (ja) * 2014-03-18 2015-10-05 株式会社ゼンリンデータコム 翻訳装置、翻訳方法及び翻訳プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015191446A (ja) * 2014-03-28 2015-11-02 株式会社ゼンリンデータコム 翻訳装置、翻訳方法及び翻訳プログラム

Also Published As

Publication number Publication date
JP6076285B2 (ja) 2017-02-08

Similar Documents

Publication Publication Date Title
JP5997217B2 (ja) 言語変換において複数の読み方の曖昧性を除去する方法
US9262403B2 (en) Dynamic generation of auto-suggest dictionary for natural language translation
US7979268B2 (en) String matching method and system and computer-readable recording medium storing the string matching method
CA2630949A1 (en) Method for transliterating and suggesting arabic replacement for a given user input
CN105573990A (zh) 外语句子制作支援装置以及方法
JP2021099771A (ja) 翻訳方法、装置、電子機器、可読記憶媒体、及びコンピュータープログラム
JP6076285B2 (ja) 翻訳装置、翻訳方法及び翻訳プログラム
JP2018067264A (ja) データ検索プログラム、データ検索装置およびデータ検索方法
JP2015095182A (ja) 文字列処理装置、方法、及びプログラム
TW561360B (en) Method and system for case conversion
JP2007133682A (ja) 全文検索システム、及び、その全文検索方法
JP6805206B2 (ja) 検索ワードサジェスト装置、表現情報の作成方法、および、表現情報の作成プログラム
JP2022002034A (ja) 抽出方法、抽出プログラム、及び、抽出装置
Batjargal et al. Providing universal access to Japanese humanities digital libraries: an approach to federated searching system using automatic metadata mapping
JP2015176541A (ja) 翻訳装置、翻訳方法及び翻訳プログラム
JP2008210229A (ja) 知的財産情報検索装置、知的財産情報検索方法及び知的財産情報検索プログラム
JP6312243B2 (ja) 翻訳装置、翻訳方法及び翻訳プログラム
JP4415768B2 (ja) 住所テーブル生成支援方法及び装置及びプログラム
JP6203083B2 (ja) 未知語抽出装置及び未知語抽出方法
JP7200474B2 (ja) 変換補助装置、変換補助システム、変換補助方法及びコンピュータプログラム
Kimura A modification of the FRAD model for personal names in non-Roman languages
CN106896935A (zh) 输入法
JP2015185115A (ja) 翻訳装置、翻訳方法及び翻訳プログラム
Alam et al. Improving accessibility of archived raster dictionaries of complex script languages
JP6162074B2 (ja) 検索キー作成方法及びその装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160328

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161228

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170110

R150 Certificate of patent or registration of utility model

Ref document number: 6076285

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees