JP2015184998A

JP2015184998A - 翻訳装置、翻訳方法及び翻訳プログラム

Info

Publication number: JP2015184998A
Application number: JP2014062001A
Authority: JP
Inventors: 光昭小関; Mitsuaki Koseki
Original assignee: Zenrin Datacom Co Ltd
Current assignee: Zenrin Datacom Co Ltd
Priority date: 2014-03-25
Filing date: 2014-03-25
Publication date: 2015-10-22
Anticipated expiration: 2034-03-25
Also published as: JP6076285B2

Abstract

【課題】大量に存在する名詞句の羅列を、従来の機械翻訳装置に比べて飛躍的に速く、且つ、正確に翻訳できるようにする。
【解決手段】読み仮名辞書１１１の各辞書は、読み仮名付与プログラム作成部１１２によって、その内容がプログラムロジックに変換され、文字列に対してその読み仮名を付与する読み仮名付与プログラムとなる。言語別翻訳辞書群の各辞書は、言語別翻訳プログラム作成部１２２よって、その内容がプログラムロジックに変換され、読み仮名を所定の言語に翻訳する翻訳プログラムとなる。読み仮名付与プログラム実行部１３２により、読み仮名付与プログラムを実行し、言語別翻訳プログラム実行部１３４により、言語別翻訳プログラムが実行され、大量の名詞句の羅列の翻訳を行う。
【選択図】図１

Description

この発明は、例えば、地図上に記載される文字情報であるいわゆる地図注記などのように、大量に存在する名詞句の羅列データの翻訳を行うための装置、方法、プログラムに関する。

従来から機械翻訳装置に関する種々の発明がなされている。例えば、後に記す特許文献１には、固有名詞を翻訳する場合であっても、固有名詞辞書を適切に整備しておくことにより正確に翻訳することができることが記載されている。また、同文献には、固有名詞辞書に登録された各固有名詞に対する捕捉語を記憶保持する捕捉語辞書をも用いることにより、固有名詞がどのようなものかについても翻訳結果に含めるようにすることが記載されている。これにより、翻訳結果をより理解し易いものとすることができるという点で効果がある。

特開２００４−２２０４１６号公報

従来の機械翻訳装置の場合、翻訳のために種々の辞書が必要になっている。上述した特許文献１に記載の発明でも固有名詞などの翻訳辞書に加えて捕捉語辞書も必要なっている。翻訳のために辞書を検索する処理にはある程度時間がかかるために、大量の固有名詞などの名詞句の羅列の翻訳を行う場合には時間が掛かる。例えば、大量の名詞句の羅列の翻訳行う場合の例として、地図注記の翻訳を行う場合について考える。

地図には、例えば、市街図、道路図、広域図、地方図、全国図といった種々のものがあり、さらに同じ種類の地図でも縮尺の異なる複数の地図が存在する。このように、種類や縮尺の異なる全ての地図を対象にした場合、地図注記は数千万件も存在する。そして、数字、アルファベット、アイコンのみにより構成される地図注記などの翻訳が必要ないものは除外し、重複する地図注記は１つに集約したとしても、翻訳対象となる地図注記は数百万件も存在する。

この数百万件の地図注記を、従来の辞書を参照する方式で多言語に機械翻訳する場合には、数週間を要しているのが現状である。また、地図注記は、地図上の地物が無くなったり、新たにできたりした場合には、必ず変わるため、所定のタイミングで現地調査をして更新し、翻訳し直す必要がある。

このように、地図注記は、翻訳を繰り返す必要があるため、できるだけ高速に翻訳したいとする要求が従来からある。このことは地図注記だけでなく、住所リスト、電話帳リスト、顧客リストなどに記載された、例えば、地名、名称、名前、住所といった多数の名詞句の羅列を翻訳する場合にも同様に生じている課題である。

以上のことに鑑み、この発明は、大量に存在する名詞句の羅列データを、従来の機械翻訳装置に比べて飛躍的に速く、且つ、正確に翻訳できるようにすることを目的とする。

上記課題を解決するため、請求項１に記載の発明の翻訳装置は、
文字列とその読み仮名とを対応付けた読み仮名辞書と、
前記読み読み仮名辞書の内容をプログラムロジックに変換し、入力された文字列に読み仮名を付与する読み仮名付与プログラムを作成する第１のプログラム作成手段と、
読み仮名とその読み仮名に対応する所定の言語の文字列とを対応付けた翻訳辞書と、
前記翻訳辞書の内容をプログラムロジックに変換し、入力された読み仮名を所定の言語に翻訳する翻訳プログラムを作成する第２のプログラム作成手段と、
前記第１のプログラム作成手段で作成された前記読み仮名付与プログラムを実行し、翻訳対象の文字列に読み仮名を付与する読み仮名付与手段と、
前記第２のプログラム作成手段で作成された翻訳プログラムを実行し、前記読み仮名付与手段で付与された読み仮名を目的とする言語に翻訳する翻訳手段と
を備えることを特徴とする。

この請求項１に記載の発明の翻訳装置によれば、読み仮名辞書は、第１のプログラム作成手段によって、その内容がプログラムロジックに変換され、入力さえた文字列に対してその読み仮名を付与する読み仮名付与プログラムとなる。同様に、翻訳辞書は、第２のプログラム作成手段によって、その内容がプログラムロジックに変換され、読み仮名を所定の言語に翻訳する翻訳プログラムとなる。

当該翻訳装置では、読み仮名変換手段が、第１のプログラム作成手段で作成された前記読み仮名付与プログラムを実行し、翻訳対象の文字列に読み仮名を付与する。当該読み仮名付与プログラムは、読み仮名辞書の内容がそのままプログラムロジックとされたものなので、外部の読み仮名辞書を参照する必要は全く無い。

当該翻訳装置では、翻訳手段が、第２のプログラム作成手段で作成された翻訳プログラムを実行し、読み仮名付与手段で付与された読み仮名を目的とする言語に翻訳する。当該翻訳プログラムは、翻訳辞書の内容がそのままプログラムロジックとされたものなので、外部の翻訳辞書を参照する必要は全く無い。

このように、当該翻訳装置では、翻訳対象の文字列に読み仮名を付与する場合にも、また、付与された読み仮名を目的とする言語に翻訳する場合にも、外部の辞書を全く参照しないため、極めて高速に翻訳を行える。従って、翻訳対象の文字列が多数存在していても、超高速に翻訳が行える。

この発明によれば、例えば、地図注記などの大量に存在する名詞句の羅列を、従来の機械翻訳装置に比べて飛躍的に速く、且つ、正確に翻訳できる。

実施の形態の翻訳装置の構成例と動作の概要を説明するためのブロック図である。読み仮名辞書群１１１の内の固有名詞読み仮名辞書の一例を示す図である。図２に示した固有名詞読み仮名辞書をプログラムロジックに変換して形成した読み仮名付与プログラムの例を示す図である。入力データ「２３，１３８，小碓通」を翻訳処理する場合の例を説明するための図である。従来の翻訳装置における翻訳処理の概要を説明するための図である。実施の形態の翻訳装置で行われる翻訳処理のための事前準備処理を説明するためのフローチャートである。実施の形態の翻訳装置で行われる翻訳処理を説明するためのフローチャートである。

以下、図を参照しながら、この発明の装置、方法、プログラムの一実施の形態について説明する。この発明は、地図注記、電話帳リスト、顧客リストなどに記載された地名、名称、名前、住所といった、大量に存在する名詞句の羅列データについて翻訳を行う場合に適用可能なものである。「名詞句」との文言は、物体、物質、人物、場所など具体的な対象を示す語句を意味する。この明細書において、翻訳対象となる「名詞句の羅列」の具体例として、地図注記、電話帳リスト、顧客リストなどに記載された、例えば、地名、名称、名前、住所といったものを想定している。

以下においては、地図注記の翻訳を行う場合を例にして具体的に説明する。地図注記は、上述もしたように大量に存在し、頻繁に更新されるため、その更新の都度、翻訳し直さなければならないものであること。また、近年おいては、外国から日本を訪れる観光客やビジネスマンも増えてきており、最新の地図の地図注記を所定の外国語に翻訳して表した外国語対応の最新の地図を迅速に提供することが望まれていること。しかも、外国語は、中国語（簡体）、中国語（繁体）、英語、韓国語などというように、複数の言語に対応することが求められることなどの事情がある。

このような背景の下、以下に説明する実施の形態の装置、方法、プログラムは、大量に存在する地図注記を、従来の機械翻訳装置に比べて、飛躍的に速く、しかも適切に、且つ、複数の言語に翻訳することを実現している。

［ビッグデータ翻訳装置の構成例］
まず、この実施の形態のビッグデータ翻訳装置（以下、単に翻訳装置と記載する。）の構成例と動作の概要について説明する。図１は、この実施の形態の翻訳装置の構成例と動作の概要を説明するためのブロック図である。図１に示す翻訳装置において、制御部１０１は、当該翻訳装置の各部を制御する機能を、記憶装置１０２は情報記憶保持機能を実現し、操作部１０３は、ユーザーインターフェース機能を実現する。

読み仮名辞書群１１１は、固有名詞読み仮名辞書、一般名詞読み仮名辞書、接頭語読み仮名辞書、接尾語読み仮名辞書、カタカナ語読み仮名辞書などの複数の読み仮名辞書を備え、日本語の地図注記データに対する読み仮名を提供する。なお、図示していないが、接頭語読み仮名辞書は、固有名詞接頭語読み仮名辞書、一般名詞接頭語読み仮名辞書、カタカナ語接頭語読み仮名辞書がある。同様に、接尾語読み仮名辞書は、固有名詞接尾語読み仮名辞書、一般名詞接尾語読み仮名辞書、カタカナ語接尾語読み仮名辞書がある。

また、固有名詞読み仮名辞書、一般名詞読み仮名辞書、カタカナ語読み仮名辞書のそれぞれは、部分一致により漢字の読み仮名の検索が可能なものである。また、各接頭語読み仮名辞書は、接頭語の読み仮名を提供するものであるので、前方一致により漢字の読み仮名の検索が可能なものである。また、各接尾語読み仮名辞書は、接尾語の読み仮名を提供するものであるので、後方一致により漢字の読み仮名の検索が可能なものである。

読み仮名付与プログラム作成部（第１のプログラム作成手段）１１２は、読み仮名辞書群１１１の各読み仮名辞書の内容をプログラムロジックに変換し、地図注記データに対して読み仮名を付与する読み仮名付与プログラムを作成する。読み仮名付与プログラム作成部１１２により作成された読み仮名付与プログラムは、読み仮名付与プログラム格納部１１３に格納される。読み仮名付与プログラム格納部１１３は、例えば、記憶装置１０２の所定の格納領域に形成される。

図２は、読み仮名辞書群１１１の内の固有名詞読み仮名辞書の一例を示す図である。図３は、図２に示した固有名詞読み仮名辞書の一例から読み仮名付与プログラム作成部１１２により作成され、読み仮名付与プログラム格納部１１３に格納される読み仮名付与プログラムの一例を示す図である。

図２に示すように、読み仮名辞書は、エリアコード、属性番号、固有名詞及びその読み仮名からなる。エリアコードは、所定のエリアを一意に特定する情報である。エリアコードで特定される所定のエリアとしては、例えば都道府県がある。もちろん、都道府県よりも細分化したエリアとすることも可能である。属性番号は、地図注記として用いられる固有名詞がどのような属性のものかを示すものであり、例えば、地名、教育機関、公共機関、山岳、河川など１００以上の属性（レイヤ）に分類されている。

また、図２において、固有名詞は、地図注記として用いられる固有名詞であり、読み仮名は、対応する固有名詞の読み仮名である。図２に示した固有名詞読み仮名辞書の一例は、愛知県（エリアコード＝２３）の、地名（属性番号＝１３８）の一部を示すものである。なお、ここでは、固有名詞読み仮名辞書の例を示したが、その他の一般名詞読み仮名辞書、接頭語読み仮名辞書、接尾語読み仮名辞書、カタカナ語読み仮名辞書も基本的に図２に示した固有名詞読み仮名辞書と同様の構成を有する。

図２に示した固有名詞読み仮名辞書を、読み仮名付与プログラム作成部１１２によりプログラムロジックに変換すると、図３に示す読み仮名付与プログラムが得られる。図３に示した読み仮名付与プログラムは、プログラミング言語としてＰｅｒｌ（パール）によって記述されたものである。図３に示す読み仮名付与プログラムは、エリアコードと属性番号が一致し、且つ、地図注記（この例では固有名詞である地名）が一致したら、地図注記と読み仮名を出力するものである。

読み仮名付与プログラム作成部１１２は、具体例を示せば、図２に示した固有名詞読み仮名辞書から、図３に示した読み仮名付与プログラムを作成するものである。この実施の形態においては、最長一致法により地図注記の読み仮名を特定する。このため、読み仮名付与プログラム作成部１１２は、読み仮名辞書の内容を、名詞句（図２、図３に示した例では固有名詞）を長いもの順に並び変えたプログラムを作成している。図３に示した読み仮名付与プログラムを見れば分かるように、読み仮名辞書の内容がそのままプログラムロジックとなっているので、外部の辞書を参照する必要の全く無いプログラムとなっている。

実際には、読み仮名辞書群１１１は、上述したように複数の読み仮名辞書を備えているため、読み仮名付与プログラム作成部１１２により作成される読み仮名付与プログラムは、各読み仮名辞書に対応したプログラムロジック部を有する。より具体的には、読み仮名付与プログラムは、初期処理部、ユーザー辞書提供部、固有名詞接尾語辞書（後方一致）ロジック部、固有名詞接頭語辞書（前方一致）ロジック部、固有名詞辞書（部分一致）ロジック部、一般名詞接尾語辞書（後方一致）ロジック部、一般名詞接頭語辞書（前方一致）ロジック部、一般有名詞辞書（部分一致）ロジック部、カタカナ語一般名詞接尾語辞書（後方一致）ロジック部、カタカナ語一般名詞接頭語辞書（前方一致）ロジック部、カタカナ語一般有名詞辞書（部分一致）ロジック部、例外処理部、終了処理部の各部からなる。

読み仮名付与プログラム作成部１１２は、上記の各ロジック部の作成（生成）時には、（１）処理対象の読み仮名辞書から同じエリアコードと属性番号の辞書データ（エリアコード、属性番号、名詞句、読み仮名）を抽出する。そして、（２）読み仮名付与プログラム作成部１１２は、抽出した辞書データを名詞句の文字数の多いもの順に並べ変える。最長一致により読み仮名の抽出を可能にするためである。当該（１）、（２）の処理を処理対象の辞書から同じエリアコードと属性番号の辞書データが無くなるまで繰り返し、無くなれば、次のエリアコードと属性番号を有する辞書データの処理に移る。

このようにして、処理対処の全ての辞書データについて処理が完了すると、当該処理対処の読み仮名辞書に対応するロジック部が作成（生成）できる。そして、読み仮名辞書群１１１の各読み仮名辞書について、プログラムロジックを作成することにより、前方一致、後方一致、部分一致で用いられる各読み仮名辞書を最長一致法で読み仮名を抽出する読み仮名付与プログラムロジックに変換できる。

言語別翻訳辞書群１２１は、この実施の形態では、日本語の地図注記データの読み仮名を、目的とする外国語に翻訳するための言語別の翻訳辞書を備える。この実施の形態では、中国語（簡体）、中国語（繁体）、英語、韓国語の４言語に対応するため、４言語の翻訳辞書を備える。更に、各言語の翻訳辞書は、大きく分けると、一般名詞に関する辞書やカタカナ語に関する辞書を備える。一般名詞に関する辞書は、一般名詞接尾語辞書、一般名詞接頭語辞書、一般名詞辞書からなる。カタカナ語に関する辞書は、カタカナ語固有名詞接尾語辞書、カタカナ語固有名詞接頭語辞書、カタカナ語固有一般名詞辞書、カタカナ語一般名詞接尾語辞書、カタカナ語一般名詞接頭語辞書、カタカナ語一般名詞辞書からなる。

また、一般名詞辞書、カタカナ語固有名詞辞書、カタカナ語一般名詞辞書のそれぞれは、部分一致により読み仮名などに対応する翻訳データ（翻訳語句）の検索が可能なものである。また、各接頭語辞書は、接頭語に対応する翻訳データを提供するものであるので、前方一致により接頭語の翻訳データの検索が可能なものである。また、各接尾語辞書は、接尾語の翻訳データを提供するものであるので、後方一致により接尾語の翻訳データの検索が可能なものである。

言語別翻訳辞書群１２１が有する翻訳辞書もまた、図２に示した読み仮名辞書の場合と同様に、エリアコード、属性番号を備える。翻訳辞書の場合、図２における「固有名詞」が「読み仮名」などとなり、図２における「読み仮名」が「所定の言語の文字列（翻訳データ）」となるものである。

言語別翻訳プログラム作成部（第２のプログラム作成手段）１２２は、言語別翻訳辞書群１２１の各翻訳辞書の内容をプログラムロジックに変換し、地図注記データの読み仮名などを、所定の言語に変換する言語別翻訳プログラムを作成する。言語別翻訳プログラム作成部１２２により作成された言語別翻訳プログラムは、言語別翻訳プログラム格納部１２３に格納される。言語別翻訳プログラム格納部１２３、例えば、記憶装置１０２の所定の格納領域に形成される。

言語別翻訳プログラム作成部１２２により作成される言語別翻訳プログラムのプログラムロジック自体は、図３に示した読み仮名変換プログラムと同様のものである。すなわち、言語別翻訳プログラム作成部１２２により作成される言語別翻訳プログラムは、エリアコードと属性番号が一致し、且つ、読み仮名など（この例では地図注記の読み仮名など）が一致したら、当該読み仮名などと対応する所定の言語の文字列（翻訳データ）を出力するものである。

実際には、言語別翻訳辞書群１２１は、上述したように複数の翻訳辞書を備えているため、言語別翻訳プログラム作成部１２２により作成される言語別翻訳プログラムは、各翻訳辞書に対応したプログラムロジック部を有する。より具体的には、言語別翻訳プログラムは、初期処理部、ユーザー辞書提供部、一般名詞接尾語辞書（後方一致）ロジック部、一般名詞接頭語辞書（前方一致）ロジック部、一般名詞辞書（部分一致）ロジック部、カタカナ語固有名詞接尾語辞書（後方一致）ロジック部、カタカナ語固有名詞接頭語辞書（前方一致）ロジック部、カタカナ語固有有名詞辞書（部分一致）ロジック部、カタカナ語一般名詞接尾語辞書（後方一致）ロジック部、カタカナ語一般名詞接頭語辞書（前方一致）ロジック部、カタカナ語一般有名詞辞書（部分一致）ロジック部、例外処理部、終了処理部などの各部からなる。

言語別翻訳プログラム作成部１２２は、上記の各ロジック部の作成（生成）時には、（Ａ）処理対象の翻訳辞書から同じエリアコードと属性番号の辞書データ（エリアコード、属性番号、名詞句、翻訳データ）を抽出する。そして、（Ｂ）言語別翻訳プログラム作成部１２２は、抽出した辞書データを名詞句の文字数の多いもの順に並べ変える。最長一致により翻訳データの抽出を可能にするためである。当該（Ａ）、（Ｂ）の処理を処理対象の辞書から同じエリアコードと属性番号の辞書データが無くなるまで繰り返し、無くなれば、次のエリアコードと属性番号を有する辞書データの処理に移る。

このようにして、処理対処の全ての辞書データについて処理が完了すると、当該処理対処の翻訳辞書に対応するロジック部が作成（生成）できる。そして、言語別翻訳辞書群１２１の各翻訳辞書について、プログラムロジックを作成することにより、前方一致、後方一致、部分一致で用いられる各翻訳辞書を最長一致法で読み仮名を抽出する言語別翻訳プログラムロジックに変換できる。

翻訳対象データファイル（図１では、翻訳対象データＦと記載。）１３１は、翻訳対象となる多数の地図注記データを保持する。具体的に、翻訳対象データファイル１３１には、「エリアコード、属性番号、地図注記データ」からなる翻訳対象データが多数保持されている。この翻訳対象データファイル１３１には、例えば、図示しない外部インターフェイスなどを通じて外部機器から提供された翻訳対象データなどが格納される。

読み仮名付与プログラム実行部１３２は、読み仮名付与プログラム作成部１１２により作成され、読み仮名付与プログラム格納部１１３に格納されている読み仮名付与プログラムを読み出して実行する。これにより、翻訳対象データファイル１３１に格納されている翻訳対象データの地図注記データに対して、実行された読み仮名付与プログラムにより読み仮名が付与される。

このようにして、翻訳対象データに対して読み仮名が付与されて形成された読み仮名データは、読み仮名データファイル（図１では、読み仮名データＦと記載。）１３３に記録される。当該読み仮名データは、「エリアコード、属性番号、地図注記データ、対応する読み仮名」からなるものである。読み仮名データファイル１３３は、ハードディスクなどの大容量記録媒体に作成される。

言語別翻訳プログラム実行部１３４は、言語別翻訳プログラム作成部１２２により作成され、言語別翻訳プログラム格納部１２３に格納されている言語別翻訳プログラムを読み出して実行する。これにより、読み仮名データファイル１３３に格納されている各読み仮名データの読み仮名が、実行された言語別翻訳プログラムにより所定の言語に翻訳され、読み仮名データに対して、翻訳データが付加された言語別翻訳データが形成される。

言語別翻訳プログラム実行部１３４により実行された言語別翻訳プログラムにより作成された言語別翻訳データは、言語別翻訳データファイル１３５に記録される。当該言語別翻訳データは、「エリアコード、属性情報、地図注記データ、対応する読み仮名、所定の言語の文字列（翻訳データ）」からなるものである。言語別翻訳データファイル１３５は、ハードディスクなどの大容量記録媒体に作成される。

このように、この実施の形態の翻訳装置は、読み仮名辞書をプログラムロジックに変換して、読み仮名付与プログラムを作成し、この読み仮名付与プログラムを用いて、翻訳対象の地図注記データに対して読み仮名を付与する。また、この実施の形態の翻訳装置は、言語別の翻訳辞書をプログラムロジックに変換して、言語別翻訳プログラムを作成し、この言語別翻訳プログラムを用いて、地図注記データに対して付与された読み仮名を目的とする言語に翻訳する。

このように、使用される種々の辞書は、プログラムロジックに変換され、プログラムとして機能するので、種々の辞書を参照することが無く、プログラムを通じて、地図注記に対して読み仮名を付与し、この読み仮名が所定の言語に翻訳される構成になっている。これにより、外部の辞書を参照しないので、大量の地図注記を高速に目的とする言語に翻訳できる。

［翻訳装置の動作の具体例］
次に、図１を用いて説明したこの実施の形態の翻訳装置における翻訳処理の具体例について説明する。この実施の形態の翻訳装置は、大量の地図注記を超高速に翻訳できるものであるが、その処理内容を簡単に説明するため、１件分の入力データがどのように処理されるのかを具体的に説明する。

図４は、図１に示した翻訳装置において、エリアコードが「２３（愛知県）」で、属性番号が「１３８（地名）」で、地図注記が「小碓通」である入力データを処理する場合の例を説明するための図である。図４に示すように、「２３（エリアコード），１３８（属性番号），小碓通（地図注記）」である入力データが翻訳対象データファイル１３１に用意されている（ステップＳ１）。

そして、読み仮名辞書がプログラムロジックに変換されて形成された読み仮名付与プログラムを、読み仮名付与プログラム実行部１３２が実行する（ステップＳ２）。当該読み仮名付与プログラムは、翻訳対象データファイル１３１の当該入力データを読み出して、当該入力データ中の地図注記データに対応する読み仮名を付与した読み仮名データを形成し、これを読み仮名データファイル１３３に記録する（ステップＳ３）。

ステップＳ３で読み仮名データファイル１３３に記録される読み仮名データは、図４のステップＳ３に示したように、入力データに対して、更に読み仮名「こうすどおり」が付与されたものである。この読み仮名データは、どの言語に翻訳する場合にも共通に用いられる。すなわち、読み仮名データファイル１３３の読み仮名データは、各言語の翻訳プログラムによって共通に用いられる。

次に、言語別翻訳辞書がプログラムロジックに変換されて形成された言語別翻訳プログラムを、言語別翻訳プログラム実行部１３４が実行する（ステップＳ４）。当該言語別翻訳プログラムは、読み仮名データファイル１３３の当該読み仮名データを読み出して、当該読み仮名データ中の読み仮名に対応する所定の言語の文字列（翻訳データ）を付与した言語別翻訳データを形成し、これを言語別翻訳データファイル１３５に記録する（ステップＳ５）。

ステップＳ５で言語別翻訳データファイル１３５に記録される翻訳データは、図４のステップＳ５に示したように、読み仮名データに対して、更に各言語の翻訳データが付与されたものである。この実施の形態においては、中国語（簡体）、中国語（繁体）、英語、韓国語の４言語に翻訳されるため、各言語の翻訳プログラムにより、図４のステップＳ５に示したように、４言語のそれぞれの言語別の翻訳データが形成される。

これに対して、図５は、従来の翻訳装置における翻訳処理の概要を説明するための図である。図５に示すように、従来の翻訳装置では、図４に示した例と同様の入力データを翻訳する場合、言語別翻訳プログラムが、まず、翻訳対象の文字列（この例の場合には地図注記）を形態素解析などの手法を用いて意味のある文字列単位に分解する。そして、この分解した各文字列（あるいは文字）を、翻訳辞書を用いて翻訳する。

この従来の翻訳装置の場合には、形態素解析の段階や翻訳処理の段階で種々の辞書（データベース）を参照する必要がある。このように種々に辞書にアクセスする分の時間は、翻訳処理に掛かる時間の多くの部分を占めており、翻訳処理は時間の掛かるものとなっていた。

しかし、図４と図５とを比較しても分かるように、この出願の翻訳装置の場合には、外部の辞書（データベース）を全く参照しないため、翻訳処理の高速化が実現できる。また、地図注記に読み仮名を付与することで、正しい読み仮名に応じた翻訳が可能となる。また、地図注記データに対して読み仮名が付与されて形成された読み仮名データは、各言語の翻訳プログラムで共通に使用される。このため、各言語の翻訳プログラムにおいて、地図注記に読み仮名を付与する処理は行わなくてもよい。

［実施の形態の翻訳装置で行われる処理のまとめ］
この実施の形態の翻訳装置で行われる処理は、読み仮名付与プログラムと言語別翻訳プログラムを作成する事前準備処理と、作成された読み仮名付与プログラムと言語別翻訳プログラムを用いて地図注記を翻訳する翻訳処理とに大きく分けることができる。事前準備処理は、基になる読み仮名辞書や言語別翻訳辞書が変更されない限り、繰り返し行う必要は無い。また、この実施の形態の翻訳装置において行われる翻訳処理は、まず、地図注記データに対して読み仮名を付与して読み仮名データを形成する処理と、形成された読み仮名データの読み仮名を翻訳する処理とに分けられる。以下においては、この実施の形態の翻訳装置で行われる、事前準備処理と翻訳処理のそれぞれについて、具体的に説明する。

［事前準備処理］
図６は、この実施の形態の翻訳装置で行われる事前準備処理を説明するためのフローチャートである。事前準備処理は、図６に示すように、まず、読み仮名付与プログラム作成部１１２が、読み仮名辞書群１１１の各読み仮名辞書のぞれぞれの内容をプログラムロジックに変換して、読み仮名付与プログラムを作成する（ステップＳ２１）。ステップＳ２１の処理では、前方一致、後方一致、部分一致で使用される読み仮名辞書のそれぞれが、最長一致法で読み仮名を置換するプログラムロジックに変換される。

次に、言語別翻訳プログラム作成部１２２が、言語別翻訳辞書群１２１の各翻訳辞書の内容をプログラムロジックに変換して、言語別翻訳プログラムを作成する（ステップＳ２２）。ステップＳ２２の処理でも、前方一致、後方一致、部分一致で使用される翻訳辞書のそれぞれが、最長一致法で対象翻訳言語に置換するプログラムロジックに変換される。

これら２つの処理を通じて、読み仮名付与プログラム格納部１１３には読み仮名付与プログラムが格納され、言語別翻訳プログラム格納部１２３には、各言語別の翻訳プログラムが格納され、地図注記の翻訳処理の準備が整えられる。なお、言語別翻訳プログラム格納部１２３には、言語別の複数の翻訳プログラムが格納されることになる。

このように、図６に示した処理を通じて、翻訳処理前の事前準備ができる。そして、上述もしたように、図６に示す事前準備は、読み仮名辞書群１１１の読み仮名辞書に変更が生じたり、言語別翻訳辞書群１２１の翻訳辞書に変更が生じたりした場合に実行すればよい。もちろん、読み仮名辞書群１１１の読み仮名辞書だけに変更が生じた場合には、図６に示したステップＳ２１の処理だけを行えばよい。また、言語別翻訳辞書群１２１の翻訳辞書だけに変更が生じた場合には、図６に示したステップＳ２２の処理だけを行えばよい。

［翻訳処理］
図７は、この実施の形態の翻訳装置で行われる翻訳処理を説明するフローチャートである。当該翻訳処理は、図７に示すように、読み仮名付与処理（図７（Ａ））と、言語別翻訳処理（図７（Ｂ））からなる。読み仮名付与処理（図７（Ａ））は、読み仮名付与プログラム実行部１３２において実行される読み仮名付与プログラムによる処理である。言語別翻訳処理（図７（Ｂ））は、言語別翻訳プログラム実行部１３４において実行される言語別翻訳プログラムによる処理である。

当該翻訳処理では、まず、読み仮名付与プログラム実行部１３２が読み仮名付与プログラムを実行し、翻訳対象データファイル１３１をインプットファイルとし、読み仮名データファイル１３３をアウトプットファイルとして、図７（Ａ）に示す読み仮名付与処理を行う。当該読み仮名付与処理において、読み仮名付与プログラム実行部１３２は、翻訳対象データファイル１３１から翻訳対象データを順次に読み出す（ステップＳ３１）。読み仮名付与プログラム実行部１３２は、翻訳対象データが読み出せたか否か（全ての翻訳対象データの読み出しが終了したか否か）を判別する（ステップＳ３２）。

ステップＳ３２の判別処理において、翻訳対象データが読み出せたと判別したとする。この場合、読み仮名付与プログラム実行部１３２は、その読み出した翻訳対象データの地図注記データに対して読み仮名を付与して読み仮名データを形成し、これを読み仮名データファイル１３３に書き込む処理を行う（ステップＳ３３）。この後、ステップＳ３１からの処理を繰り返す。

ステップＳ３２の判別処理において、全ての翻訳対処データの読み出しが終了したと判別したときには、図７（Ａ）に示す読み仮名付与処理を終了する。

当該読み仮名付与プログラムによる読み仮名付与処理が終了すると、言語別翻訳プログラム実行部１３４が言語別翻訳プログラムを実行し、読み仮名データファイル１３３をインプットファイルとし、言語別翻訳データファイル１３５をアウトプットファイルとして、図７（Ｂ）に示す言語別翻訳処理を行う。当該言語別翻訳処理において、言語別翻訳プログラム実行部１３４は、読み仮名データファイル１３３から読み仮名データを順次に読み出す（ステップＳ４１）。言語別翻訳プログラム実行部１３４は、読み仮名データが読み出せたか否か（全ての読み仮名データの読み出しが終了したか否か）を判別する（ステップＳ４２）。

ステップＳ４２の判別処理において、読み仮名データが読み出せたと判別したとする。この場合、言語別翻訳プログラム実行部１３４は、その読み出した読み仮名データの読み仮名に対する所定の言語の文字列（翻訳データ）を付与して言語別翻訳データを形成し、これを言語別翻訳データファイル１３５に書き込む処理を行う（ステップＳ４３）。この後、ステップＳ４１からの処理を繰り返す。

ステップＳ４２の判別処理において、読み仮名データが読み出せなかった（全ての読み仮名データの読み出しが終了した）と判別したときには、図７（Ｂ）に示す言語別翻訳与処理を終了する。なお、この図７（Ｂ）に示す処理は、言語別の翻訳プログラムによって言語別に行われる処理である。

このように、読み仮名付与処理（図７（Ａ））と言語別翻訳処理（図７（Ｂ））の処理を通じて翻訳処理が行われる。そして、読み仮名付与処理と言語別翻訳処理のいずれにおいても、インプットファイルとアウトプットファイルが存在するだけで、参照データベースは一切存在しない。すなわち、読み仮名辞書や翻訳辞書は、プログラムロジックに変換されて、それぞれ、読み仮名付与プログラム、言語別翻訳プログラムとされている。このため、地図注記に対する読み仮名の付与は、読み仮名付与プログラムの中だけで完結するように処理され、付与された読み仮名の所定の言語への翻訳は、言語別翻訳プログラムの中だけで完結するように処理される
このようにして、この実施の形態の翻訳装置では、大量の地図注記を極めて高速に翻訳することを実現している。

［実施の形態の効果］
上述した実施の形態の翻訳装置によれば、大量に存在する地図注記を、従来の機械翻訳装置に比べて飛躍的に速く、且つ、正確に翻訳できる。

また、地図注記について読み仮名を付与し、この付与した読み仮名を翻訳する構成としているので、実際の読み方に即した翻訳ができる。不自然な翻訳となることが無い。

また、読み仮名が付与されて形成された読み仮名データは、各言語の翻訳プログラムで共通に使用できる。つまり、地図注記を複数の言語に翻訳する場合であっても、各言語の翻訳プログラムなどで重複して読み仮名データを形成する処理を行わなくても済む。

そして、数百万件の地図注記を翻訳する場合、従来は翻訳に数週間かかっていたが、これを数時間に短縮することができた。各言語の翻訳プログラムによる処理は、それぞれ数十分の処理時間を実現している。

［変形例など］
なお、上述した実施の形態では、地図注記データを中国語（簡体）、中国語（繁体）、英語、韓国語の４言語に翻訳するものとして説明したが、これに限るものではない。この他の種々の言語に翻訳することももちろんできる。翻訳対象の言語の組み合わせは種々の組み合わせとすることができる。もちろん、単一の言語に翻訳する場合にも対応できる。

また、上述した実施の形態では、地図注記データを翻訳する場合を例にして説明したが、これに限るものではない。例えば、電話帳リスト、顧客リスト、住所リストといった多数の名前、住所などの名詞句の羅列が含まれるものの当該多数の名詞句の羅列を翻訳する場合に、この発明を適用できる。

また、上述した実施の形態では、読み仮名に対して翻訳を行うものとして説明した。しかし、これに限るものではない。例えば、ひらがな、カタカナ、漢字、アルファベット、数字、記号からなる翻訳対象そのものと作成した読み仮名とを比較しながら、より適切に翻訳を行うようにすることができる。

［その他］
上述した実施の形態の説明からも分かるように、請求項に記載した翻訳装置の読み仮名辞書は、実施の形態の翻訳装置の読み仮名辞書群の各読み仮名辞書に対応し、また、請求項に記載した翻訳装置の翻訳辞書は、実施の形態の翻訳装置の言語別翻訳辞書群の各翻訳辞書に対応している。また、請求項に記載した翻訳装置の第１のプログラム作成手段は、実施の形態の翻訳装置の読み仮名付与プログラム作成部１１２に対応し、請求項に記載した翻訳装置の第２のプログラム作成手段は、この実施の形態の翻訳装置の言語別翻訳プログラム作成部１２２に対応している。

また、請求項に記載した翻訳装置の読み仮名付与手段は、この実施の形態の翻訳装置の読み仮名付与プログラム実行部１３２に対応し、また、請求項に記載した翻訳装置の翻訳手段は、この実施の形態の翻訳装置の言語別翻訳プログラム実行部１３４に対応している。

また、図５、図６を用いて説明した翻訳処理は、この発明の翻訳方法の一実施の形態が適用されたものであり、図５、図６を用いて説明した翻訳処理を実行するプログラムは、この発明の翻訳プログラムの一実施の形態が適用されたものである。また、図１に示した読み仮名付与プログラム作成部１１２、言語別翻訳プログラム作成部１２２、読み仮名付与プログラム実行部１３２、言語別翻訳プログラム実行部１３４の各機能は、制御部１０１で実行されるプログラムにより、制御部１０１の機能として実現することもできる。

１０１…制御部、１０２…記憶装置、１０３…操作部、１１１…読み仮名辞書群、１１２…読み仮名付与プログラム作成部、１１３…読み仮名付与プログラム格納部、１２１…言語別翻訳辞書群、１２２…言語別翻訳プログラム作成部、１２３…言語別翻訳プログラム格納部、１３１…翻訳対象データファイル、１３２…読み仮名付与プログラム実行部、１３３…読み仮名データファイル、１３４…言語別翻訳プログラム実行部、１３５…言語別翻訳データファイル

Claims

文字列とその読み仮名とを対応付けた読み仮名辞書と、
前記読み読み仮名辞書の内容をプログラムロジックに変換し、入力された文字列に読み仮名を付与する読み仮名付与プログラムを作成する第１のプログラム作成手段と、
読み仮名とその読み仮名に対応する所定の言語の文字列とを対応付けた翻訳辞書と、
前記翻訳辞書の内容をプログラムロジックに変換し、入力された読み仮名を所定の言語に翻訳する翻訳プログラムを作成する第２のプログラム作成手段と、
前記第１のプログラム作成手段で作成された前記読み仮名付与プログラムを実行し、翻訳対象の文字列に読み仮名を付与する読み仮名付与手段と、
前記第２のプログラム作成手段で作成された翻訳プログラムを実行し、前記読み仮名付与手段で付与された読み仮名を目的とする言語に翻訳する翻訳手段と
を備えることを特徴とする翻訳装置。
請求項１に記載の翻訳装置であって、
前記第２のプログラム作成手段は、所定の翻訳条件に合致するプログラムロジックに変換できるものであることを特徴とする翻訳装置。
請求項１または請求項２のいずれかに記載の翻訳装置であって、
前記読み仮名辞書と前記翻訳辞書とは、検索語の一致方式が、前方一致、後方一致、部分一致で異なる複数の辞書からなることを特徴とする翻訳装置。
請求項３に記載の翻訳装置であって、
前記第１のプログラム作成手段は、前方一致、後方一致、部分一致で使用される前記読み仮名辞書のそれぞれを、最長一致法で読み仮名を置換するプログラムロジックに変換するものであり、
前記第２のプログラム作成手段は、前方一致、後方一致、部分一致で使用される前記翻訳辞書のそれぞれを、最長一致法で対象翻訳言語に置換するプログラムロジックに変換するものであることを特徴とする翻訳装置。
請求項１、請求項２、請求項３または請求項４のいずれかに記載の翻訳装置であって、
前記翻訳対象の文字列は、場所に関するものであり、前記読み仮名変換辞書には、各文字列に対応して、その文字列が属する地域を示すエリア情報と、その文字列の属性を示す属性情報とが付加されており、
前記第１のプログラム作成手段は、前記エリア情報と前記属性情報とを含めて、前記読み読み仮名変換辞書の内容をプログラムロジックに変換することを特徴とする翻訳装置。
第１のプログラム作成手段が、文字列とその読み仮名とを対応付けた読み仮名辞書の内容をプログラムロジックに変換し、入力された文字列に読み仮名を付与する読み仮名付与プログラムを作成する第１のプログラム作成工程と、
第２のプログラム作成手段が、読み仮名とその読み仮名に対応する所定の言語の文字列とを対応付けた翻訳辞書の内容をプログラムロジックに変換し、入力された読み仮名を所定の言語に翻訳する翻訳プログラムを作成する第２のプログラム作成工程と、
前記第１のプログラム作成工程において作成した前記読み仮名付与プログラムを、読み仮名付与手段が実行し、翻訳対象の文字列に読み仮名を付与する読み仮名付与工程と、
前記第２のプログラム作成工程において作成した翻訳プログラムを、翻訳手段が実行し、前記読み仮名付与工程で付与した読み仮名を目的とする言語に翻訳する翻訳工程と
を有することを特徴とする翻訳方法。
文字列とその読み仮名とを対応付けた読み仮名辞書と、読み仮名とその読み仮名に対応する所定の言語の文字列とを対応付けた翻訳辞書とを備えた情報処理装置に搭載されたコンピュータを、
前記読み読み仮名辞書の内容をプログラムロジックに変換し、入力された文字列に読み仮名を付与する読み仮名付与プログラムを作成する第１のプログラム作成手段と、
前記翻訳辞書の内容をプログラムロジックに変換し、入力された読み仮名を所定の言語に翻訳する翻訳プログラムを作成する第２のプログラム作成手段と、
前記第１のプログラム作成手段で作成された前記読み仮名付与プログラムを実行し、翻訳対象の文字列に読み仮名を付与する読み仮名付与手段と、
前記第２のプログラム作成手段で作成された翻訳プログラムを実行し、前記読み仮名付与手段で付与された読み仮名を目的とする言語に翻訳する翻訳手段と
して機能させることを特徴とする翻訳プログラム。