JP2014238808A - 翻訳システム及び翻訳プログラム、並びに翻訳方法 - Google Patents

翻訳システム及び翻訳プログラム、並びに翻訳方法 Download PDF

Info

Publication number
JP2014238808A
JP2014238808A JP2013242312A JP2013242312A JP2014238808A JP 2014238808 A JP2014238808 A JP 2014238808A JP 2013242312 A JP2013242312 A JP 2013242312A JP 2013242312 A JP2013242312 A JP 2013242312A JP 2014238808 A JP2014238808 A JP 2014238808A
Authority
JP
Japan
Prior art keywords
translation
character string
morpheme
key
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013242312A
Other languages
English (en)
Other versions
JP5586772B1 (ja
Inventor
ニコロフ イリアン
Nikolov Ilian
ニコロフ イリアン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BAIT AL HIKMA KK
BAIT AL-HIKMA KK
Original Assignee
BAIT AL HIKMA KK
BAIT AL-HIKMA KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BAIT AL HIKMA KK, BAIT AL-HIKMA KK filed Critical BAIT AL HIKMA KK
Priority to JP2013242312A priority Critical patent/JP5586772B1/ja
Application granted granted Critical
Publication of JP5586772B1 publication Critical patent/JP5586772B1/ja
Publication of JP2014238808A publication Critical patent/JP2014238808A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】 使用メモリ容量及び処理負荷を低減するのに好適な翻訳システムを提供する。【解決手段】 形態素翻訳処理は、翻訳対象文字列から形態素を副文字列として取得し、キー形態素及び最適訳語を対応づけて記憶する翻訳情報テーブル400から副文字列と完全一致するキー形態素を検索し、キー形態素を索出した場合は、索出したキー形態素に対応する最適訳語を翻訳情報テーブル400から取得し、キー形態素を索出しない場合は、副文字列を含むキー形態素を翻訳情報テーブル400から検索し、複数のキー形態素を索出した場合は、索出した複数のキー形態素のうち出現頻度が最も高いキー形態素に対応する最適訳語を翻訳情報テーブル400から取得し、取得した最適訳語を副文字列の訳語として出力する。【選択図】 図6

Description

本発明は、第1言語からなる翻訳対象文字列を形態素ごとに第2言語に翻訳するシステム及びプログラム並びに方法に係り、特に、使用メモリ容量及び処理負荷を低減するのに好適な翻訳システム及び翻訳プログラム、並びに翻訳方法に関する。
従来、テキスト翻訳のアプリケーションとして、例えば、非特許文献1、2記載の技術が知られている。
"Google Translate for Android"、[online]、平成25年5月8日、Google Inc.、[平成25年6月7日検索]、インターネット<URL:https://play.google.com/store/apps/details?id=com.google.android.apps.translate&hl=ja> "ABBYY TextGrabber + Translator"、[online]、平成25年6月3日、ABBYY Software House、[平成25年6月7日検索]、インターネット<URL:https://play.google.com/store/apps/details?id=com.abbyy.mobile.textgrabber.full&hl=ja>
しかしながら、非特許文献1、2記載の技術は、多数の言語に対応するために言語ごとにライブラリ(辞書)を利用する必要があるので、モバイル機器において大量のメモリ領域を使用するという問題があった。また、高い翻訳精度を実現するために複雑なアルゴリズムを採用しているので、モバイル機器への処理負荷が大きいという問題もあった。近年、モバイル機器の性能が向上してきたとはいえ、まだまだメモリ容量や処理性能が十分であるとはいえないので、特にモバイル機器において上記問題は顕著である。
そこで、本発明は、このような従来の技術の有する未解決の課題に着目してなされたものであって、使用メモリ容量及び処理負荷を低減するのに好適な翻訳システム及び翻訳プログラム、並びに翻訳方法を提供することを目的としている。
〔発明1〕 上記目的を達成するために、発明1の翻訳システムは、第1言語からなる翻訳対象文字列を形態素ごとに第2言語に翻訳する翻訳システムであって、前記翻訳対象文字列から形態素を取得する形態素取得手段と、前記第1言語からなる異なる複数のキー形態素について、当該キー形態素、当該キー形態素を前記第2言語に翻訳した場合に得られる訳語、及び、所定の文書における当該キー形態素又は当該訳語の出現頻度を対応づけて記憶する翻訳情報記憶手段から、前記形態素取得手段で取得した形態素と完全一致する前記キー形態素を検索する第1キー形態素検索手段と、前記第1キー形態素検索手段で前記キー形態素を索出した場合は、索出したキー形態素に対応する前記訳語を前記翻訳情報記憶手段から取得する第1訳語取得手段と、前記第1キー形態素検索手段で前記キー形態素を索出しない場合は、前記形態素取得手段で取得した形態素を含む前記キー形態素を前記翻訳情報記憶手段から検索する第2キー形態素検索手段と、前記第2キー形態素検索手段で複数の前記キー形態素を索出した場合は、索出した複数の前記キー形態素のうち前記出現頻度が最も高い前記キー形態素に対応する前記訳語を前記翻訳情報記憶手段から取得する第2訳語取得手段と、前記第1訳語取得手段又は前記第2訳語取得手段で取得した訳語を、前記形態素取得手段で取得した形態素の訳語として出力する訳語出力手段とを備える。
このような構成であれば、形態素取得手段により、翻訳対象文字列から形態素が取得され、第1キー形態素検索手段により、取得された形態素と完全一致するキー形態素が翻訳情報記憶手段から検索される。ここで、キー形態素が索出された場合は、第1訳語取得手段により、索出された形態素に対応する訳語が翻訳情報記憶手段から取得される。そして、訳語出力手段により、取得された訳語が、取得された形態素の訳語として出力される。
これに対し、キー形態素が索出されない場合は、第2キー形態素検索手段により、取得された形態素を含むキー形態素が翻訳情報記憶手段から検索される。ここで、複数のキー形態素が索出された場合は、第2訳語取得手段により、索出された複数のキー形態素のうち出現頻度が最も高いキー形態素に対応する訳語が翻訳情報記憶手段から取得される。そして、訳語出力手段により、取得された訳語が、取得された形態素の訳語として出力される。
ここで、訳語出力手段は、例えば、表示、印刷、音声出力、記憶装置や記憶媒体等への書き出し、外部の端末等への送信、バイブレーション等の振動、発熱その他の方法により訳語を出力することができる。したがって、出力には、少なくとも表示、印刷、音声出力、書き出し(ファイルの生成を含む。)、送信、振動及び発熱が含まれる。以下、出力の概念については同じである。
また、キー形態素、訳語及び出現頻度を対応づけて記憶することとしては、(1)例えば、キー形態素、訳語及び出現頻度を同一のレコードに登録するなど、直接対応づけて記憶すること、(2)例えば、キー形態素及び中間情報を対応づけて登録するテーブルと、訳語、出現頻度及び中間情報を対応づけて登録するテーブルを設けるなど、中間に1又は複数の情報を介して記憶することが含まれる。すなわち、キー形態素から訳語又は出現頻度を辿ることができる態様であれば、あらゆるデータ構造を採用することができる。以下、情報を対応づけて記憶する概念については同じである。
また、翻訳情報記憶手段は、キー形態素、訳語及び出現頻度をあらゆる手段で且つあらゆる時期に記憶するものであり、キー形態素、訳語及び出現頻度を予め記憶してあるものであってもよいし、キー形態素、訳語及び出現頻度を予め記憶することなく、本システムの動作時に外部からの入力等によってキー形態素、訳語及び出現頻度を記憶するようになっていてもよい。
また、本システムは、単一の装置、端末その他の機器として実現するようにしてもよいし、複数の装置、端末その他の機器を通信可能に接続したネットワークシステムとして実現するようにしてもよい。後者の場合、各構成要素は、それぞれ通信可能に接続されていれば、複数の機器等のうちいずれに属していてもよい。以下、発明2の翻訳システムにおいて同じである。
〔発明2〕 さらに、発明2の翻訳システムは、第1言語からなる翻訳対象文字列を形態素ごとに第2言語に翻訳する翻訳システムであって、前記翻訳対象文字列から形態素を取得する形態素取得手段と、前記第1言語からなる異なる複数のキー形態素について、当該キー形態素、当該キー形態素を前記第2言語に翻訳した場合に得られる複数の訳語のうち訳語の候補として最も推奨すべき最適訳語、前記複数の訳語のうち前記最適訳語以外の次候補訳語、及び、所定の文書における当該キー形態素又は当該最適訳語の出現頻度を対応づけて記憶する翻訳情報記憶手段から、前記形態素取得手段で取得した形態素と完全一致する前記キー形態素を検索する第1キー形態素検索手段と、前記第1キー形態素検索手段で前記キー形態素を索出した場合は、索出したキー形態素に対応する前記最適訳語を前記翻訳情報記憶手段から取得する第1訳語取得手段と、前記第1キー形態素検索手段で前記キー形態素を索出しない場合は、前記形態素取得手段で取得した形態素を含む前記キー形態素を前記翻訳情報記憶手段から検索する第2キー形態素検索手段と、前記第2キー形態素検索手段で複数の前記キー形態素を索出した場合は、索出した複数の前記キー形態素のうち前記出現頻度が最も高い前記キー形態素に対応する前記最適訳語を前記翻訳情報記憶手段から取得する第2訳語取得手段と、前記第1訳語取得手段又は前記第2訳語取得手段で取得した最適訳語を、前記形態素取得手段で取得した形態素の訳語として出力する訳語出力手段と、前記第1訳語取得手段又は前記第2訳語取得手段で取得した最適訳語のうち指定された最適訳語について、当該最適訳語に対応する前記次候補訳語を出力する次候補訳語出力手段と、前記次候補訳語出力手段で出力された次候補訳語のなかからいずれかを選択する次候補訳語選択手段と、前記指定された最適訳語を、前記次候補訳語選択手段で選択された次候補訳語に変更する訳語変更手段とを備える。
このような構成であれば、形態素取得手段により、翻訳対象文字列から形態素が取得され、第1キー形態素検索手段により、取得された形態素と完全一致するキー形態素が翻訳情報記憶手段から検索される。ここで、キー形態素が索出された場合は、第1訳語取得手段により、索出された形態素に対応する最適訳語が翻訳情報記憶手段から取得される。そして、訳語出力手段により、取得された最適訳語が、取得された形態素の訳語として出力される。
これに対し、キー形態素が索出されない場合は、第2キー形態素検索手段により、取得された形態素を含むキー形態素が翻訳情報記憶手段から検索される。ここで、複数のキー形態素が索出された場合は、第2訳語取得手段により、索出された複数のキー形態素のうち出現頻度が最も高いキー形態素に対応する最適訳語が翻訳情報記憶手段から取得される。そして、訳語出力手段により、取得された最適訳語が、取得された形態素の訳語として出力される。
また、取得された最適訳語のなかからいずれかが指定されると、次候補訳語出力手段により、指定された最適訳語に対応する次候補訳語が出力される。そして、次候補訳語選択手段により、出力された次候補訳語のなかからいずれかが選択されると、訳語変更手段により、指定された最適訳語が、選択された次候補訳語に変更される。
ここで、翻訳情報記憶手段は、キー形態素、最適訳語、次候補訳語及び出現頻度をあらゆる手段で且つあらゆる時期に記憶するものであり、キー形態素、最適訳語、次候補訳語及び出現頻度を予め記憶してあるものであってもよいし、キー形態素、最適訳語、次候補訳語及び出現頻度を予め記憶することなく、本システムの動作時に外部からの入力等によってキー形態素、最適訳語、次候補訳語及び出現頻度を記憶するようになっていてもよい。
〔発明3〕 さらに、発明3の翻訳システムは、発明2の翻訳システムにおいて、前記翻訳情報記憶手段は、異なる複数の前記キー形態素について、当該キー形態素、当該キー形態素の品詞、前記最適訳語、前記次候補訳語及び前記出現頻度を対応づけて記憶し、前記第1キー形態素検索手段で索出したキー形態素に対応する前記品詞に基づいて当該キー形態素のすべての品詞活用を生成する品詞活用生成手段と、前記品詞活用生成手段で生成した品詞活用に基づいて、前記翻訳対象文字列における、前記形態素取得手段で取得した形態素以後の文字列と一致する品詞活用を前記翻訳対象文字列から検索する品詞活用検索手段と、前記品詞活用検索手段で索出した品詞活用を出力する品詞活用出力手段とを備える。
このような構成であれば、品詞活用生成手段により、索出されたキー形態素に対応する品詞に基づいてそのキー形態素のすべての品詞活用が生成され、品詞活用検索手段により、生成された品詞活用のなかから、翻訳対象文字列における、取得された形態素以後の文字列と一致する品詞活用が翻訳対象文字列から検索される。そして、品詞活用出力手段により、索出された品詞活用が出力される。
ここで、翻訳情報記憶手段は、キー形態素の品詞をあらゆる手段で且つあらゆる時期に記憶するものであり、キー形態素の品詞を予め記憶してあるものであってもよいし、キー形態素の品詞を予め記憶することなく、本システムの動作時に外部からの入力等によってキー形態素の品詞を記憶するようになっていてもよい。
〔発明4〕 一方、上記目的を達成するために、発明4の翻訳プログラムは、第1言語からなる翻訳対象文字列を形態素ごとに第2言語に翻訳する処理を実行させるための翻訳プログラムであって、前記翻訳対象文字列から形態素を取得する形態素取得ステップと、前記第1言語からなる異なる複数のキー形態素について、当該キー形態素、当該キー形態素を前記第2言語に翻訳した場合に得られる訳語、及び、所定の文書における当該キー形態素又は当該訳語の出現頻度を対応づけて記憶する翻訳情報記憶手段から、前記形態素取得ステップで取得した形態素と完全一致する前記キー形態素を検索する第1キー形態素検索ステップと、前記第1キー形態素検索ステップで前記キー形態素を索出した場合は、索出したキー形態素に対応する前記訳語を前記翻訳情報記憶手段から取得する第1訳語取得ステップと、前記第1キー形態素検索ステップで前記キー形態素を索出しない場合は、前記形態素取得ステップで取得した形態素を含む前記キー形態素を前記翻訳情報記憶手段から検索する第2キー形態素検索ステップと、前記第2キー形態素検索ステップで複数の前記キー形態素を索出した場合は、索出した複数の前記キー形態素のうち前記出現頻度が最も高い前記キー形態素に対応する前記訳語を前記翻訳情報記憶手段から取得する第2訳語取得ステップと、前記第1訳語取得ステップ又は前記第2訳語取得ステップで取得した訳語を、前記形態素取得ステップで取得した形態素の訳語として出力する訳語出力ステップとを含む処理をコンピュータに実行させるためのプログラムである。
このような構成であれば、コンピュータによってプログラムが読み取られ、読み取られたプログラムに従ってコンピュータが処理を実行すると、発明1の翻訳システムと同等の作用が得られる。
〔発明5〕 一方、上記目的を達成するために、発明5の翻訳方法は、第1言語からなる翻訳対象文字列を形態素ごとに第2言語に翻訳する翻訳方法であって、形態素取得手段が、前記翻訳対象文字列から形態素を取得する形態素取得ステップと、第1キー形態素検索手段が、前記第1言語からなる異なる複数のキー形態素について、当該キー形態素、当該キー形態素を前記第2言語に翻訳した場合に得られる訳語、及び、所定の文書における当該キー形態素又は当該訳語の出現頻度を対応づけて記憶する翻訳情報記憶手段から、前記形態素取得ステップで取得した形態素と完全一致する前記キー形態素を検索する第1キー形態素検索ステップと、第1訳語取得手段が、前記第1キー形態素検索ステップで前記キー形態素を索出した場合は、索出したキー形態素に対応する前記訳語を前記翻訳情報記憶手段から取得する第1訳語取得ステップと、第2キー形態素検索手段が、前記第1キー形態素検索ステップで前記キー形態素を索出しない場合は、前記形態素取得ステップで取得した形態素を含む前記キー形態素を前記翻訳情報記憶手段から検索する第2キー形態素検索ステップと、第2訳語取得手段が、前記第2キー形態素検索ステップで複数の前記キー形態素を索出した場合は、索出した複数の前記キー形態素のうち前記出現頻度が最も高い前記キー形態素に対応する前記訳語を前記翻訳情報記憶手段から取得する第2訳語取得ステップと、訳語出力手段が、前記第1訳語取得ステップ又は前記第2訳語取得ステップで取得した訳語を、前記形態素取得ステップで取得した形態素の訳語として出力する訳語出力ステップとを含む。
以上説明したように、発明1の翻訳システム、発明4の翻訳プログラム、又は発明5の翻訳方法によれば、キー形態素、訳語及び出現頻度を対応づけて記憶する翻訳情報記憶手段があれば足りるので、多数のライブラリを利用する必要がなく、従来に比して、使用メモリ容量を低減することができる。また、翻訳対象文字列を形態素ごとに第2言語に翻訳するという簡易なアルゴリズムであるので、従来に比して、処理負荷を低減することができる。さらに、第1キー形態素検索手段及び第1訳語取得手段による訳語変換に加え、キー形態素又は訳語の出現頻度を考慮した第2キー形態素検索手段及び第2訳語取得手段による訳語変換を行うので、簡易なアルゴリズムを採用しつつも一定の翻訳精度を確保することができる。
さらに、発明2の翻訳システムによれば、キー形態素、最適訳語、次候補訳語及び出現頻度を対応づけて記憶する翻訳情報記憶手段があれば足りるので、多数のライブラリを利用する必要がなく、従来に比して、使用メモリ容量を低減することができる。また、翻訳対象文字列を形態素ごとに第2言語に翻訳するという簡易なアルゴリズムであるので、従来に比して、処理負荷を低減することができる。さらに、第1キー形態素検索手段及び第1訳語取得手段による訳語変換に加え、キー形態素又は最適訳語の出現頻度を考慮した第2キー形態素検索手段及び第2訳語取得手段による訳語変換を行うので、簡易なアルゴリズムを採用しつつも一定の翻訳精度を確保することができる。さらに、最適訳語を次候補訳語に変更することができるので、ユーザビリティを向上することができる。
さらに、発明3の翻訳システムによれば、翻訳対象文字列における形態素の品詞活用が得られるので、翻訳精度を向上することができる。
モバイル機器100の外観構成を示す図である。 モバイル機器100の機能ブロック図である。 翻訳情報テーブル400のデータ構造を示す図である。 漢字修正情報テーブル420のデータ構造を示す図である。 撮影翻訳処理を示すフローチャートである。 形態素翻訳処理を示すフローチャートである。 類似キー形態素検索処理を示すフローチャートである。 翻訳対象文字列を翻訳する動作を示すシーケンスチャートである。 翻訳対象文字列を翻訳する動作を示すシーケンスチャートである。 最適訳語を次候補訳語に変更する画面である。
以下、本発明の実施の形態を説明する。図1乃至図10は、本実施の形態を示す図である。
本実施の形態は、日本語からなる翻訳対象文字列を形態素ごとに英語に翻訳する場合を示す。例えば、「外国人は日本の料理が大好きです。」という翻訳対象文字列は、「foreigner」「(object)」「Japan」「"'s"」「cooking」「(subject)」「favourite (is)」と翻訳される。このように形態素ごとに翻訳するという簡易なアルゴリズムを採用することにより処理負荷を低減する。
まず、本実施の形態に係るモバイル機器100の構成を説明する。
図1は、モバイル機器100の外観構成を示す図である。同図(a)は、モバイル機器100の正面図であり、同図(b)は、モバイル機器100の側面図である。
図2は、モバイル機器100の機能ブロック図である。
モバイル機器100は、図1に示すように、正面及び背面を含むキャビネット10を有して構成されている。キャビネット10の正面には、タッチパネル21が設けられている。タッチパネル21は、画像を表示する表示部28と、表示部28に重ねられる検出部29とを有して構成されている。
表示部28は、液晶パネルと、液晶パネルを照明するパネルバックライトとを有して構成されている。液晶パネルは、画像を表示するための表示面28aを有し、表示面28aが外部に現れる。表示面28aの上に検出部29が設けられている。なお、液晶パネルに代えて、有機EL(Electro Luminescence)パネルその他の表示素子を用いることもできる。
検出部29は、タッチセンサ等からなり、透明なシート状に形成される。検出部29を透して表示面28aを見ることができる。検出部29は、マトリクス状に設けられた第1透明電極、第2透明電極及びカバーを有して構成されている。検出部29は、第1透明電極と第2透明電極との間の静電容量の変化を検出することにより、ユーザが触れた表示面28a上の位置(以下、「入力位置」という。)を検出し、その入力位置に応じた位置信号を制御部27に出力する。なお、検出部29は、静電容量式に限らず、超音波式、感圧式、抵抗膜式又は光検知式等を用いることもできる。
なお、ユーザが表示面28aに触れるとは、ユーザが指又はペン等の接触部材(以下、単に「指」という。)により表示面28aをタッチ、スライド、タップ、フリック等の操作をすることである。また、表示面28aに触れるとは、実際には、検出部29を覆うカバーの表面における表示面28aの画像が映る領域を触れることである。「スライド」とは、ユーザが表示面28aに指を接触したまま動かす操作をいう。「タップ」とは、ユーザが指で表示面28aを軽く叩くように、表示面28a上のある箇所に指をタッチさせ、そして短時間のうちにリリースする操作である。「フリック」とは、ユーザが指により表示面28aを素早く弾くような操作であり、表示面28aに指を接触したまま、短時間に所定距離以上指を動かし、リリースする操作をいう。「ピンチアウト」とは、ユーザが2本の指で表示面28aをタッチし、表示面28aに指を接触したまま指を広げる操作をいう。「ピンチイン」とは、ユーザが2本の指で表示面28aをタッチし、表示面28aに指を接触したまま指を狭める操作をいう。
キャビネット10の正面には、マイク11及びスピーカ12が設けられている。ユーザは、スピーカ12からの音声を耳で捉え、マイク11に対して音声を発することにより通話を行うことができる。
キャビネット10の背面には、撮影部24のレンズ窓(不図示)が設けられている。レンズ窓から被写体の画像が撮影部24に取り込まれる。
モバイル機器100は、図2に示すように、タッチパネル21、通信部22、位置情報取得部23、撮影部24、記憶部25、出力部26及び制御部27を有して構成されている。
表示部28は、制御部27の制御に従って、ユーザの操作に利用されるGUI(Graphical User Interface)等を表示する。検出部29は、入力位置を示す座標情報を制御部27に出力する。テキストを入力する場合は、例えば、テキストボックス等をタップすると、キーボード画像(GUI)が表示部28に表示され、キーボード画像に配列された文字をタップ等することによりその文字を入力することができる。その他、撮影部24で撮影された撮影画像に基づいて文字認識処理を行ったり、マイク11で入力した音声に基づいて音声認識処理を行ったりすることによりテキストを入力することもできる。
通信部22は、携帯電話機において使用される無線通信の規格に従ってデータ通信を行い、インターネット等のネットワークを介して、サーバ等に対して情報の送信を要求する。そして、通信部22は、サーバ等から送信されてくる情報を受信し、制御部27に出力する。
位置情報取得部23は、GPS(Global Positioning System)や無線LAN(Local Area Network)等を利用して、モバイル機器100の現在位置を特定する位置情報を取得する。例えば、位置情報取得部23は、少なくとも別々の箇所に設置された3つの基地局から発信される無線LANの電波を利用し、それらの基地局の位置情報に基づいた3辺測量の手法により、モバイル機器100の現在位置を特定する。
撮影部24は、CCD(Charge Coupled Device)センサやCMOS(Complementary Metal Oxide Semiconductor)センサ等の撮像素子を有して構成され、ユーザのシャッター操作に従って写真を撮影する。そして、撮影部24が写真を撮影すると、制御部27は、撮影された撮影画像を記憶部25に記憶する。
記憶部25は、不揮発性の半導体メモリ(例えば、EEPROM(Electronically Erasable and Programmable Read Only Memory))を有して構成されている。記憶部25は、制御部27が実行するためのプログラム(アプリケーションソフト)、撮影部24で撮影された撮影画像を記憶する。
制御部27は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等をバス接続して構成されている。
次に、記憶部25のデータ構造を説明する。
図3は、翻訳情報テーブル400のデータ構造を示す図である。
記憶部25は、図3に示すように、翻訳対象文字列を英語に翻訳するための翻訳情報テーブル400を記憶している。このように1つの翻訳情報テーブル400だけを利用して翻訳を行うことによりRAMの使用メモリ容量を低減する。
翻訳情報テーブル400には、IDごとに1つのレコードが登録されている。各レコードは、一意に割り当てられたIDを登録するフィールド402と、キーとなるキー形態素を登録するフィールド404と、キー形態素の読みを登録するフィールド406と、キー形態素の品詞を登録するフィールド408と、キー形態素を英語に翻訳した場合に得られる複数の訳語のうち訳語の候補として最も推奨すべき最適訳語を登録するフィールド412と、キー形態素を英語に翻訳した場合に得られる複数の訳語のうち最適訳語以外の次候補訳語を登録するフィールド410と、所定の日本語文書におけるキー形態素の出現頻度を登録するフィールド414とを含んで構成されている。ここで、フィールド408の品詞は、例えば、「n」が名詞、「v」が動詞活用形、「inf」が動詞不定詞、「adj」が形容詞、「aux」が助動詞、「adv」が副詞、「conj」が接続詞、「prep」が前置詞を表している。
図3の例では、第7段目のレコードには、キー形態素として「持ち直」が、読みとして「モチナオス」が、品詞として「v5s,vt」が、最適訳語として「to recover」が、次候補訳語として「to recover/to rally/to improve/to pick up/(P)/」が、出現頻度として「161」がそれぞれ登録されている。これは、キー形態素「持ち直」について、読みが「モチナオス」、品詞が動詞活用形、最適訳語が「to recover」、次候補訳語が「to rally」「to improve」「to pick up」、出現頻度が161回であることを示している。
図4は、漢字修正情報テーブル420のデータ構造を示す図である。
記憶部25は、さらに、図4に示すように、翻訳対象文字列中の誤認識された文字列を適切な漢字に修正するための漢字修正情報テーブル420を記憶している。
漢字修正情報テーブル420の各レコードは、修正対象文字列を登録するフィールド424と、翻訳対象文字列に含まれる修正対象文字列を修正すべき漢字を登録するフィールド422とを含んで構成されている。
図4の例では、第1段目のフィールドには、修正対象文字列として「ネ」「貞」が、修正漢字として「禎」がそれぞれ登録されている。これは、連続する2つの文字列「ネ」「貞」が翻訳対象文字列に含まれている場合は、これを「禎」という漢字に修正すべきことを示している。
次に、モバイル機器100で実行される処理を説明する。
モバイル機器100において、CPUは、ROM又は記憶部25に記憶されているプログラムを起動させ、そのプログラムに従って、図5のフローチャートに示す撮影翻訳処理を実行する。
図5は、撮影翻訳処理を示すフローチャートである。
撮影翻訳処理は、モバイル機器100で実行されると、図5に示すように、まず、ステップS100に移行する。
ステップS100では、撮影部24で撮影された撮影画像を記憶部25から読み出し、ステップS102に移行して、読み出した撮影画像に含まれる文字を認識する文字認識処理を実行する。この文字認識処理は、例えば、OCR(Optical Character Recognition)処理等で採用される公知の文字認識技術を採用することができる。
次いで、ステップS104に移行して、ステップS102の文字認識処理で認識された翻訳対象文字列を形態素ごとに英語に翻訳する形態素翻訳処理を実行し、ステップS106に移行して、翻訳対象文字列の各形態素に対応させて形態素翻訳処理で取得した最適訳語を表示部28に表示し、ステップS108に移行する。
ステップS108では、表示された最適訳語のなかからいずれかが指定されたか否かを判定し、いずれかの最適訳語が指定されたと判定した場合(YES)は、ステップS110に移行して、指定された最適訳語に対応する次候補訳語を表示部28に表示し、ステップS112に移行する。
ステップS112では、表示された次候補訳語のなかからいずれかが選択されたか否かを判定し、いずれかの次候補訳語が選択されたと判定した場合(YES)は、ステップS114に移行して、指定された最適訳語を、選択された次候補訳語に変更し、一連の処理を終了する。
一方、ステップS112で、いずれの次候補訳語も選択されないと判定した場合(NO)は、ステップS108に移行する。
一方、ステップS108で、いずれの最適訳語も指定されないと判定した場合(NO)は、ステップS108で待機する。
次に、ステップS104の形態素翻訳処理を説明する。
図6は、形態素翻訳処理を示すフローチャートである。
形態素翻訳処理は、ステップS104で実行されると、図6に示すように、まず、ステップS200に移行する。
ステップS200では、ステップS102の文字認識処理から翻訳対象文字列を取得し、ステップS202に移行して、漢字修正情報テーブル420を参照し、翻訳対象文字列中の誤認識された文字列を適切な漢字に修正し、ステップS204に移行する。
ステップS204では、翻訳対象文字列において取得する形態素の先頭位置を格納するための変数indの値を「0」に設定し、ステップS206に移行して、変数indの値が翻訳対象文字列の長さよりも小さいか否かを判定し、翻訳対象文字列の長さよりも小さいと判定した場合(YES)は、ステップS208に移行する。
ステップS208では、最小となる変数nの値を算出する。具体的には、(1)翻訳情報テーブル400のなかで最も長いキー形態素の文字数、(2)翻訳対象文字列における変数indの値が示す位置から翻訳対象文字列の末尾までの文字数、(3)翻訳対象文字列における変数indの値が示す位置から次に出現する句読点の直前までの文字数をそれぞれ算出し、算出した文字数のうち最小の値を変数nに設定する。
次いで、ステップS210に移行して、翻訳対象文字列における変数indの値が示す位置から変数nの長さ分の文字列を副文字列として翻訳対象文字列から取得し、ステップS212に移行する。
ステップS212では、副文字列と完全一致するキー形態素を翻訳情報テーブル400から検索し、ステップS214に移行して、該当のキー形態素を索出したか否かを判定し、該当のキー形態素を索出したと判定した場合(YES)は、ステップS216に移行する。
ステップS216では、索出したキー形態素に対応する品詞を翻訳情報テーブル400から取得し、取得した品詞に基づいて、索出したキー形態素のすべての品詞活用を生成し、ステップS218に移行する。
ステップS218では、生成した品詞活用に基づいて、翻訳対象文字列における副文字列以後の文字列と一致する最も長い品詞活用を翻訳対象文字列から検索し、ステップS220に移行して、該当の品詞活用を索出したか否かを判定し、該当の品詞活用を索出したと判定した場合(YES)は、ステップS222に移行する。
ステップS222では、索出した品詞活用の文字列を配列に格納し、ステップS224に移行して、索出した品詞活用の長さに相当する値を変数indに加算し、ステップS226に移行する。
ステップS226では、ステップS212で索出したキー形態素に対応する最適訳語及び次候補訳語を翻訳情報テーブル400から取得し、ステップS228に移行して、索出したキー形態素並びに取得した品詞、最適訳語及び次候補訳語を配列に格納し、ステップS206に移行する。
一方、ステップS220で、該当の品詞活用を索出しないと判定した場合(NO)は、ステップS230に移行して、ステップS212で索出したキー形態素の長さに相当する値を変数indに加算し、ステップS226に移行する。
一方、ステップS214で、該当のキー形態素を索出しないと判定した場合(NO)は、ステップS232に移行して、変数nの値から「1」を減算し、ステップS234に移行して、副文字列の長さが「0」であるか否かを判定し、副文字列の長さが「0」でないと判定した場合(NO)は、ステップS210に移行する。
一方、ステップS234で、副文字列の長さが「0」であると判定した場合(YES)は、ステップS236に移行する。
ステップS236では、副文字列周辺の文字列と部分一致する類似のキー形態素を検索する類似キー形態素検索処理を実行し、ステップS238に移行して、該当のキー形態素を索出したか否かを判定し、該当のキー形態素を索出したと判定した場合(YES)は、ステップS240に移行する。
ステップS240では、複数のキー形態素を索出した場合は、索出した複数のキー形態素のうち出現頻度が最も高いキー形態素を翻訳情報テーブル400から取得し、翻訳対象文字列において対象の文字列を、取得したキー形態素に置き換える。また、キー形態素を1つだけ索出した場合は、翻訳対象文字列において対象の文字列を、索出したキー形態素に置き換える。ここで、対象の文字列とは、翻訳対象文字列において、出現頻度が最も高いキー形態素を検索する元となった副文字列をいう。
ステップS240の処理が終了すると、ステップS206に移行する。
一方、ステップS238で、該当のキー形態素を索出しないと判定した場合(NO)は、ステップS242に移行して、キー形態素及び類似のキー形態素がいずれも検索できなかったことを示す”?”を配列に格納し、ステップS244に移行して、変数indの値に「1」を加算し、ステップS206に移行する。
一方、ステップS206で、変数indの値が翻訳対象文字列の長さ以上であると判定した場合(NO)は、ステップS246に移行して、ステップS104の形態素翻訳処理を呼び出した元の処理(関数)に配列結果を返し、一連の処理を終了して元の処理に復帰させる。
次に、ステップS236の類似キー形態素検索処理を説明する。
図7は、類似キー形態素検索処理を示すフローチャートである。
類似キー形態素検索処理は、ステップS236で実行されると、図7に示すように、まず、ステップS300に移行する。
ステップS300では、ステップS208と同様に最小となる変数mの値を算出する。具体的には、(1)翻訳情報テーブル400のなかで最も長いキー形態素の文字数、(2)翻訳対象文字列における変数indの値が示す位置から翻訳対象文字列の末尾までの文字数、(3)翻訳対象文字列における変数indの値が示す位置から次に出現する句読点の直前までの文字数をそれぞれ算出し、算出した文字数のうち最小の値を変数mに設定する。
次いで、ステップS302に移行して、翻訳対象文字列における変数indの値が示す位置から変数mの長さ分の文字列を副文字列として翻訳対象文字列から取得し、ステップS304に移行する。
ステップS304では、副文字列を含むキー形態素を翻訳情報テーブル400から検索し、ステップS306に移行して、該当のキー形態素を索出したか否かを判定し、該当のキー形態素を索出したと判定した場合(YES)は、ステップS308に移行する。
ステップS308では、索出したキー形態素ごとにそのキー形態素の出現頻度を翻訳情報テーブル400から取得し、索出したすべてのキー形態素及び取得した出現頻度を配列に格納し、ステップS310に移行して、変数mの値から「1」を減算し、ステップS312に移行して、副文字列の長さが「0」であるか否かを判定し、副文字列の長さが「0」でないと判定した場合(NO)は、ステップS302に移行する。
一方、ステップS312で、副文字列の長さが「0」であると判定した場合(YES)は、ステップS314に移行し、ステップS236の類似キー形態素検索処理を呼び出した元の処理(関数)に配列結果を返し、一連の処理を終了して元の処理に復帰させる。
一方、ステップS306で、該当のキー形態素を索出しないと判定した場合(NO)は、ステップS310に移行する。
次に、本実施の形態の動作を説明する。
「外国人は日本の料理が好きです。」という翻訳対象文字列を形態素ごとに英語に翻訳する場合を例に説明する。
図8は、翻訳対象文字列を翻訳する動作を示すシーケンスチャートである。
図8では、プロセス1〜43が示されている。以下、プロセス1〜43を順次説明する。
<プロセス1>
ステップS200で、翻訳対象文字列「外国人は日本の料理が好きです。」が取得される。
<プロセス2>
変数indの値が「0」に設定される。変数nは、翻訳対象文字列における変数indの値が示す位置から次に出現する句読点の直前までの文字数が14文字と最小なので、変数nの値が「14」に設定される。そうすると、ステップS210で、副文字列「外国人は日本の料理が好きです」が取得される。しかし、この副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在しないので、変数nの値が減算される。
<プロセス3>
減算の結果、変数nの値が「13」となるので、ステップS210で、副文字列「外国人は日本の料理が好きで」が取得される。しかし、この副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在しないので、変数nの値が減算される。
<プロセス4>
プロセス2〜3と同様に、副文字列「外国人は日本の料理が好き」「外国人は日本の料理が好」「外国人は日本の料理が」「外国人は日本の料理」「外国人は日本の料」「外国人は日本の」「外国人は日本」「外国人は日」について順に検索が行われるが、これら副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在しないので、変数nの値が減算される。
<プロセス5>
プロセス4での減算の結果、変数nの値が「4」となるので、ステップS210で、副文字列「外国人は」が取得される。しかし、この副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在しないので、変数nの値が減算される。
<プロセス6>
減算の結果、変数nの値が「3」となるので、ステップS210で、副文字列「外国人」が取得される。この副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在するので、キー形態素「外国人」が索出される。
<プロセス7>
ステップS216で、キー形態素「外国人」に対応する品詞が翻訳情報テーブル400から取得される。
<プロセス8>
ステップS216で、取得された品詞に基づいてキー形態素「外国人」のすべての品詞活用「外国人ではありませんでした」「外国人ではありません」「外国人じゃなかった」「外国人じゃない」「外国人でした」が生成されるが、翻訳対象文字列における副文字列以後の文字列と一致する最も長い品詞活用が翻訳対象文字列に存在しない。
<プロセス9>
ステップS230で、キー形態素「外国人」の長さに相当する値「3」が変数indに加算される。
<プロセス10>
ステップS228、S230で、キー形態素「外国人」、品詞「noun」、最適訳語「foreigner」及び次候補訳語「1) foreigner, 2) foreign citizen, 3) alien」が配列に格納される。
<プロセス11>
加算の結果、変数indの値が「3」となる。変数nは、翻訳対象文字列における変数indの値が示す位置から次に出現する句読点の直前までの文字数が11文字と最小なので、変数nの値が「11」に設定される。そうすると、ステップS210で、副文字列「は日本の料理が好きです」が取得される。しかし、この副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在しないので、変数nの値が減算される。
<プロセス12>
減算の結果、変数nの値が「10」となるので、ステップS210で、副文字列「は日本の料理が好きで」が取得される。しかし、この副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在しないので、変数nの値が減算される。
<プロセス13>
プロセス11〜12と同様に、副文字列「は日本の料理が好き」「は日本の料理が好」「は日本の料理が」「は日本の料理」「は日本の料」「は日本の」「は日本」について順に検索が行われるが、これら副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在しないので、変数nの値が減算される。
<プロセス14>
プロセス13での減算の結果、変数nの値が「2」となるので、ステップS210で、副文字列「は日」が取得される。しかし、この副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在しないので、変数nの値が減算される。
<プロセス15>
減算の結果、変数nの値が「1」となるので、ステップS210で、副文字列「は」が取得される。この副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在するので、キー形態素「は」が索出される。
<プロセス16>
ステップS216で、キー形態素「は」に対応する品詞が翻訳情報テーブル400から取得される。
<プロセス17>
ステップS230で、キー形態素「は」の長さに相当する値「1」が変数indに加算される。また、ステップS228、S230で、キー形態素「は」、品詞「particle」、最適訳語「(object)」及び次候補訳語「-」が配列に格納される。
<プロセス18>
加算の結果、変数indの値が「4」となる。変数nは、翻訳対象文字列における変数indの値が示す位置から次に出現する句読点の直前までの文字数が10文字と最小なので、変数nの値が「10」に設定される。そうすると、ステップS210で、副文字列「日本の料理が好きです」が取得される。しかし、この副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在しないので、変数nの値が減算される。
<プロセス19>
減算の結果、変数nの値が「9」となるので、ステップS210で、副文字列「日本の料理が好きで」が取得される。しかし、この副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在しないので、変数nの値が減算される。
<プロセス20>
プロセス18〜19と同様に、副文字列「日本の料理が好き」「日本の料理が好」「日本の料理が」「日本の料理」「日本の料」について順に検索が行われるが、これら副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在しないので、変数nの値が減算される。
<プロセス21>
プロセス20の減算の結果、変数nの値が「3」となるので、ステップS210で、副文字列「日本の」が取得される。しかし、この副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在しないので、変数nの値が減算される。
<プロセス22>
減算の結果、変数nの値が「2」となるので、ステップS210で、副文字列「日本」が取得される。この副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在するので、キー形態素「日本」が索出される。
<プロセス23>
ステップS216で、キー形態素「日本」に対応する品詞が翻訳情報テーブル400から取得される。
<プロセス24>
ステップS216で、取得された品詞に基づいてキー形態素「日本」のすべての品詞活用「日本ではありませんでした」「日本ではありません」「日本じゃなかった」「日本じゃない」「日本でした」が生成されるが、翻訳対象文字列における副文字列以後の文字列と一致する最も長い品詞活用が翻訳対象文字列に存在しない。
<プロセス25>
ステップS230で、キー形態素「日本」の長さに相当する値「2」が変数indに加算される。
<プロセス26>
ステップS228、S230で、キー形態素「日本」、品詞「noun」、最適訳語「Japan」及び次候補訳語「Japan」が配列に格納される。
<プロセス27>
加算の結果、変数indの値が「6」となる。変数nは、翻訳対象文字列における変数indの値が示す位置から次に出現する句読点の直前までの文字数が8文字と最小なので、変数nの値が「8」に設定される。そうすると、ステップS210で、副文字列「の料理が好きです」が取得される。しかし、この副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在しないので、変数nの値が減算される。
<プロセス28>
プロセス27と同様に、副文字列「料理が好きで」「料理が好き」「の料理が好」「の料理が」「の料理」について順に検索が行われるが、これら副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在しないので、変数nの値が減算される。
<プロセス29>
プロセス28での減算の結果、変数nの値が「2」となるので、ステップS210で、副文字列「の料」が取得される。しかし、この副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在しないので、変数nの値が減算される。
<プロセス30>
減算の結果、変数nの値が「1」となるので、ステップS210で、副文字列「の」が取得される。この副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在するので、キー形態素「の」が索出される。
<プロセス31>
ステップS216で、キー形態素「の」に対応する品詞が翻訳情報テーブル400から取得される。
<プロセス32>
ステップS230で、キー形態素「の」の長さに相当する値「1」が変数indに加算される。また、ステップS228、S230で、キー形態素「の」、品詞「particle」、最適訳語「"'s"」及び次候補訳語「-」が配列に格納される。
<プロセス33>
加算の結果、変数indの値が「7」となる。変数nは、翻訳対象文字列における変数indの値が示す位置から次に出現する句読点の直前までの文字数が7文字と最小なので、変数nの値が「7」に設定される。そうすると、ステップS210で、副文字列「料理が好きです」が取得される。しかし、この副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在しないので、変数nの値が減算される。
<プロセス34>
プロセス33と同様に、副文字列「料理が好きで」「料理が好き」「料理が好」「料理が」について順に検索が行われるが、これら副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在しないので、変数nの値が減算される。
<プロセス35>
プロセス34の減算の結果、変数nの値が「2」となるので、ステップS210で、副文字列「料理」が取得される。この副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在するので、キー形態素「料理」が索出される。
<プロセス36>
ステップS216で、キー形態素「料理」に対応する品詞が翻訳情報テーブル400から取得される。そして、ステップS216で、取得された品詞に基づいてキー形態素「料理」のすべての品詞活用「料理ではありませんでした」「料理ではありません」「料理じゃなかった」「料理じゃない」「料理でした」が生成されるが、翻訳対象文字列における副文字列以後の文字列と一致する最も長い品詞活用が翻訳対象文字列に存在しない。
<プロセス37>
ステップS230で、キー形態素「料理」の長さに相当する値「2」が変数indに加算される。
<プロセス38>
ステップS228、S230で、キー形態素「料理」、品詞「noun and suru verb」、最適訳語「cooking」及び次候補訳語「1) cooking, 2) cuisine, 3) dealing with something, 4)handling, 5) administration, 6)management」が配列に格納される。
<プロセス39>
加算の結果、変数indの値が「9」となる。変数nは、翻訳対象文字列における変数indの値が示す位置から次に出現する句読点の直前までの文字数が5文字と最小なので、変数nの値が「5」に設定される。そうすると、ステップS210で、副文字列「が好きです」が取得される。しかし、この副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在しないので、変数nの値が減算される。
<プロセス40>
プロセス39と同様に、副文字列「が好きで」「が好き」「が好」について順に検索が行われるが、これら副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在しないので、変数nの値が減算される。
<プロセス41>
プロセス40での減算の結果、変数nの値が「1」となるので、ステップS210で、副文字列「が」が取得される。この副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在するので、キー形態素「が」が索出される。
<プロセス42>
ステップS216で、キー形態素「が」に対応する品詞が翻訳情報テーブル400から取得される。
<プロセス43>
ステップS230で、キー形態素「が」の長さに相当する値「1」が変数indに加算される。また、ステップS228、S230で、キー形態素「が」、品詞「particle」、最適訳語「(subject)」及び次候補訳語「-」が配列に格納される。
図9は、翻訳対象文字列を翻訳する動作を示すシーケンスチャートである。
図9では、プロセス44〜56が示されている。以下、プロセス44〜56を順次説明する。
<プロセス44>
加算の結果、変数indの値が「10」となる。変数nは、翻訳対象文字列における変数indの値が示す位置から次に出現する句読点の直前までの文字数が4文字と最小なので、変数nの値が「4」に設定される。そうすると、ステップS210で、副文字列「好きです」が取得される。しかし、この副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在しないので、変数nの値が減算される。
<プロセス45>
プロセス44と同様に、副文字列「好きで」「好き」「好」について順に検索が行われるが、これら副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在しないので、変数nの値が減算される。
<プロセス46>
副文字列の長さが「0」となったので、完全一致するキー形態素が検索できなかったことになる。
<プロセス47>
そこで、ステップS236で、類似キー形態素検索処理が実行される。
<プロセス48>
ステップS300〜S304で、変数mの値が「4」〜「1」の範囲で変化し、副文字列「好きです」「好きで」「好き」「好」のそれぞれについて、この副文字列を含むキー形態素が翻訳情報テーブル400から検索される。ここで、副文字列「好き」を含むキー形態素が翻訳情報テーブル400に存在するので、キー形態素「大好き」「物好き」「人好き」が索出される。
<プロセス49>
ステップS308で、キー形態素「大好き」及び出現頻度「1362」、キー形態素「物好き」及び出現頻度「197」、並びに、キー形態素「人好き」及び出現頻度「39」が配列に格納される。
<プロセス50>
キー形態素「大好き」「物好き」「人好き」のうち「大好き」の出現頻度「1362」が最も高いので、ステップS240で、翻訳対象文字列において対象の文字列「好き」がキー形態素「大好き」に置き換えられる。
<プロセス51>
変数nは、翻訳対象文字列における変数indの値が示す位置から次に出現する句読点の直前までの文字数が5文字と最小なので、変数nの値が「5」に設定される。そうすると、ステップS210で、副文字列「大好きです」が取得される。しかし、この副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在しないので、変数nの値が減算される。
同様に、副文字列「大好きで」について順に検索が行われるが、この副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在しないので、変数nの値が減算される。
そして、減算の結果、変数nの値が「3」となるので、ステップS210で、副文字列「大好き」が取得される。この副文字列と完全一致するキー形態素が翻訳情報テーブル400に存在するので、キー形態素「大好き」が索出される。
<プロセス52>
ステップS216で、キー形態素「大好き」に対応する品詞が翻訳情報テーブル400から取得される。
<プロセス53>
ステップS216で、取得された品詞に基づいてキー形態素「大好き」のすべての品詞活用「大好きではありませんでした」「大好きではありません」「大好きでした」「大好きです」「大好きじゃありませんでした」が生成され、翻訳対象文字列における副文字列以後の文字列と一致する最も長い品詞活用「大好きです」が検索される。
<プロセス54>
ステップS230で、キー形態素「大好きです」の長さに相当する値「5」が変数indに加算される。
<プロセス55>
ステップS228、S230で、キー形態素「大好き」「大好きです」、品詞「na-adjective」、最適訳語「favourite (is)」及び次候補訳語「1) loveable, 2) very likeable, 3) like very much/(P)/」が配列に格納される。
<プロセス56>
加算の結果、変数indの値が「15」となるので、ステップS246で、配列結果が返される。
図10は、最適訳語を次候補訳語に変更する画面である。
ステップS106で、図10に示すように、翻訳対象文字列の各形態素に対応させて最適訳語が表示される。ここで、ユーザは、例えば最適訳語「foreigner」をタップ等で指定すると、同図(a)に示すように、次候補訳語として「(1)foreigner」「(2)foreign citizen」「(3)alien」が表示される。次候補訳語は、例えばドロップダウンリスト440で表示される。次候補訳語のなかに他に最適な訳語がある場合、ユーザは、例えば次候補訳語「(3)alien」を選択すると、最適訳語「foreigner」が次候補訳語「alien」に変更される。
また、ユーザは、例えば最適訳語「cooking」をタップ等で指定すると、同図(b)に示すように、次候補訳語として「(1)cooking」「(2)cuisine」「(3)dealing with something」「(4)handling」「(5)administration」「(6)management」が表示される。次候補訳語は、例えばドロップダウンリスト442で表示される。次候補訳語のなかに他に最適な訳語がある場合、ユーザは、例えば次候補訳語「(2)cuisine」を選択すると、最適訳語「cooking」が次候補訳語「cuisine」に変更される。
このようにして、本実施の形態では、翻訳対象文字列から形態素を副文字列として取得し、第1言語からなる異なる複数のキー形態素について、そのキー形態素、そのキー形態素を第2言語に翻訳した場合に得られる複数の訳語のうち訳語の候補として最も推奨すべき最適訳語、複数の訳語のうち最適訳語以外の次候補訳語、及び、所定の日本語文書におけるそのキー形態素の出現頻度を対応づけて記憶する翻訳情報テーブル400から副文字列と完全一致するキー形態素を検索し、キー形態素を索出した場合は、索出したキー形態素に対応する最適訳語を翻訳情報テーブル400から取得し、キー形態素を索出しない場合は、副文字列を含むキー形態素を翻訳情報テーブル400から検索し、複数のキー形態素を索出した場合は、索出した複数のキー形態素のうち出現頻度が最も高いキー形態素に対応する最適訳語を翻訳情報テーブル400から取得し、取得した最適訳語を副文字列の訳語として出力する。
これにより、キー形態素、最適訳語、次候補訳語及び出現頻度を対応づけて記憶する翻訳情報テーブル400があれば足りるので、多数のライブラリを利用する必要がなく、従来に比して、使用メモリ容量を低減することができる。また、翻訳対象文字列を形態素ごとに第2言語に翻訳するという簡易なアルゴリズムであるので、従来に比して、処理負荷を低減することができる。さらに、キー形態素との完全一致検索による訳語変換に加え、出現頻度を考慮したキー形態素との部分一致検索による訳語変換を行うので、簡易なアルゴリズムを採用しつつも一定の翻訳精度を確保することができる。
さらに、本実施の形態では、取得した最適訳語のうち指定された最適訳語について、その最適訳語に対応する次候補訳語を表示し、表示された次候補訳語のなかからいずれかを選択し、指定された最適訳語を、選択された次候補訳語に変更する。
これにより、最適訳語を次候補訳語に変更することができるので、ユーザビリティを向上することができる。
さらに、本実施の形態では、索出したキー形態素に対応する品詞に基づいてそのキー形態素のすべての品詞活用を生成し、生成した品詞活用に基づいて、翻訳対象文字列における副文字列以後の文字列と一致する品詞活用を翻訳対象文字列から検索し、索出した品詞活用を出力する。
これにより、翻訳対象文字列における形態素の品詞活用が得られるので、翻訳精度を向上することができる。
本実施の形態において、翻訳情報テーブル400は、発明1乃至5の翻訳情報記憶手段に対応し、ステップS110は、発明2の次候補訳語出力手段に対応し、ステップS112は、発明2の次候補訳語選択手段に対応し、ステップS114は、発明2の訳語変更手段に対応している。また、ステップS210は、発明1乃至3若しくは5の形態素取得手段、又は形態素取得ステップに対応し、ステップS212は、発明1乃至3若しくは5の第1キー形態素検索手段、又は発明4若しくは5の第1キー形態素検索ステップに対応し、ステップS214は、発明1、2若しくは5の第1訳語取得手段、又は発明4若しくは5の第1訳語取得ステップに対応している。
また、本実施の形態において、ステップS304、S240、S212は、発明1、2若しくは5の第2キー形態素検索手段、又は発明4若しくは5の第2キー形態素検索ステップに対応し、ステップS214は、発明1、2若しくは5の第2訳語取得手段、又は発明4若しくは5の第2訳語取得ステップに対応している。また、ステップS216は、発明3の品詞活用生成手段に対応し、ステップS218は、発明3の品詞活用検索手段に対応し、ステップS228は、発明1、2若しくは5の訳語出力手段、又は発明4若しくは5の訳語出力ステップに対応している。
また、本実施の形態において、ステップS228は、発明3の品詞活用出力手段に対応し、日本語は、発明1、2、4又は5の第1言語に対応し、英語は、発明1、2、4又は5の第2言語に対応している。
なお、上記実施の形態においては、所定の日本語文書におけるキー形態素の出現頻度を翻訳情報テーブル400に登録したが、これに限らず、所定の英語文書における最適訳語の出現頻度を登録することもできる。
また、上記実施の形態及びその変形例においては、キー形態素の読みを出力しなかったが、これに限らず、ステップS226、S228において、ステップS212で索出したキー形態素に対応するキー形態素の読み、最適訳語及び次候補訳語を翻訳情報テーブル400から取得し、索出したキー形態素並びに取得したキー形態素の読み、品詞、最適訳語及び次候補訳語を配列に格納することもできる。
また、上記実施の形態及びその変形例においては、単一の機器であるモバイル機器100として実現したが、これに限らず、ネットワークシステムとして実現することもできる。インターネット等のネットワークには、翻訳サーバと、複数のユーザ端末とが接続されている。翻訳サーバは、上記実施の形態におけるモバイル機器100と同等の機能を有して構成されている。異なるのは、入力装置40による入力に代えてユーザ端末から情報を受信する点と、表示装置44による表示に代えてユーザ端末に情報を送信する点である。
また、上記実施の形態及びその変形例においては、日本語からなる翻訳対象文字列を形態素ごとに英語に翻訳する場合について本発明を適用したが、これに限らず、本発明の主旨を逸脱しない範囲で他の場合にも適用可能である。例えば、翻訳元の言語及び翻訳先の言語は、任意に設定することができる。
100…モバイル機器、 10…キャビネット、 11…マイク、 12…スピーカ、 21…タッチパネル、 22…通信部、 23…位置情報取得部、 24…撮影部、 25…記憶部、 26…出力部、 27…制御部、 28…表示部、 28a…表示面、 29…検出部、 400…翻訳情報テーブル、 420…漢字修正情報テーブル、 402〜414、422、424…フィールド、 440、442…ドロップダウンリスト

Claims (3)

  1. 第1言語からなる翻訳対象文字列を形態素ごとに第2言語に翻訳する翻訳システムであって、
    前記翻訳対象文字列から形態素を含む文字列を副文字列として取得する副文字列取得手段と、
    前記第1言語からなる異なる複数のキー形態素について、当該キー形態素、当該キー形態素の品詞、当該キー形態素を前記第2言語に翻訳した場合に得られる訳語、及び、所定の文書における当該キー形態素又は当該訳語の出現頻度を対応づけて記憶する翻訳情報記憶手段から、前記副文字列取得手段で取得した副文字列と完全一致する前記キー形態素を検索する第1キー形態素検索手段と、
    前記第1キー形態素検索手段で索出したキー形態素に対応する前記訳語を前記翻訳情報記憶手段から取得する第1訳語取得手段と、
    前記第1訳語取得手段で取得した訳語を、前記副文字列取得手段で取得した副文字列の訳語として出力する訳語出力手段と、
    前記第1キー形態素検索手段で索出したキー形態素に対応する前記品詞に基づいて当該キー形態素のすべての品詞活用を生成する品詞活用生成手段と、
    前記品詞活用生成手段で生成した品詞活用に基づいて、前記翻訳対象文字列における、前記副文字列取得手段で取得した副文字列以後の文字列と一致する品詞活用を前記翻訳対象文字列から検索する品詞活用検索手段と、
    前記品詞活用検索手段で索出した品詞活用を出力する品詞活用出力手段とを備えることを特徴とする翻訳システム。
  2. 第1言語からなる翻訳対象文字列を形態素ごとに第2言語に翻訳する処理を実行させるための翻訳プログラムであって、
    前記翻訳対象文字列から形態素を含む文字列を副文字列として取得する副文字列取得ステップと、
    前記第1言語からなる異なる複数のキー形態素について、当該キー形態素、当該キー形態素の品詞、当該キー形態素を前記第2言語に翻訳した場合に得られる訳語、及び、所定の文書における当該キー形態素又は当該訳語の出現頻度を対応づけて記憶する翻訳情報記憶手段から、前記副文字列取得ステップで取得した副文字列と完全一致する前記キー形態素を検索する第1キー形態素検索ステップと、
    前記第1キー形態素検索ステップで索出したキー形態素に対応する前記訳語を前記翻訳情報記憶手段から取得する第1訳語取得ステップと、
    前記第1訳語取得ステップで取得した訳語を、前記副文字列取得ステップで取得した副文字列の訳語として出力する訳語出力ステップと、
    前記第1キー形態素検索ステップで索出したキー形態素に対応する前記品詞に基づいて当該キー形態素のすべての品詞活用を生成する品詞活用生成ステップと、
    前記品詞活用生成ステップで生成した品詞活用に基づいて、前記翻訳対象文字列における、前記副文字列取得ステップで取得した副文字列以後の文字列と一致する品詞活用を前記翻訳対象文字列から検索する品詞活用検索ステップと、
    前記品詞活用検索ステップで索出した品詞活用を出力する品詞活用出力ステップとを含む処理をコンピュータに実行させるためのプログラムであることを特徴とする翻訳プログラム。
  3. 第1言語からなる翻訳対象文字列を形態素ごとに第2言語に翻訳する翻訳方法であって、
    副文字列取得手段が、前記翻訳対象文字列から形態素を含む文字列を副文字列として取得する副文字列取得ステップと、
    第1キー形態素検索手段が、前記第1言語からなる異なる複数のキー形態素について、当該キー形態素、当該キー形態素の品詞、当該キー形態素を前記第2言語に翻訳した場合に得られる訳語、及び、所定の文書における当該キー形態素又は当該訳語の出現頻度を対応づけて記憶する翻訳情報記憶手段から、前記副文字列取得ステップで取得した副文字列と完全一致する前記キー形態素を検索する第1キー形態素検索ステップと、
    第1訳語取得手段が、前記第1キー形態素検索ステップで索出したキー形態素に対応する前記訳語を前記翻訳情報記憶手段から取得する第1訳語取得ステップと、
    訳語出力手段が、前記第1訳語取得ステップで取得した訳語を、前記副文字列取得ステップで取得した副文字列の訳語として出力する訳語出力ステップと、
    品詞活用生成手段が、前記第1キー形態素検索ステップで索出したキー形態素に対応する前記品詞に基づいて当該キー形態素のすべての品詞活用を生成する品詞活用生成ステップと、
    品詞活用検索手段が、前記品詞活用生成ステップで生成した品詞活用に基づいて、前記翻訳対象文字列における、前記副文字列取得ステップで取得した副文字列以後の文字列と一致する品詞活用を前記翻訳対象文字列から検索する品詞活用検索ステップと、
    品詞活用出力手段が、前記品詞活用検索ステップで索出した品詞活用を出力する品詞活用出力ステップとを含むことを特徴とする翻訳方法。
JP2013242312A 2013-11-22 2013-11-22 翻訳システム及び翻訳プログラム、並びに翻訳方法 Active JP5586772B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013242312A JP5586772B1 (ja) 2013-11-22 2013-11-22 翻訳システム及び翻訳プログラム、並びに翻訳方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013242312A JP5586772B1 (ja) 2013-11-22 2013-11-22 翻訳システム及び翻訳プログラム、並びに翻訳方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2013121985A Division JP5497230B1 (ja) 2013-06-10 2013-06-10 翻訳システム及び翻訳プログラム、並びに翻訳方法

Publications (2)

Publication Number Publication Date
JP5586772B1 JP5586772B1 (ja) 2014-09-10
JP2014238808A true JP2014238808A (ja) 2014-12-18

Family

ID=51617881

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013242312A Active JP5586772B1 (ja) 2013-11-22 2013-11-22 翻訳システム及び翻訳プログラム、並びに翻訳方法

Country Status (1)

Country Link
JP (1) JP5586772B1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017151786A (ja) * 2016-02-25 2017-08-31 富士ゼロックス株式会社 翻訳プログラム及び情報処理装置
JP2020517008A (ja) * 2017-04-05 2020-06-11 ティーストリート プロプライアタリー リミテッド 言語翻訳支援システム
JP2021043954A (ja) * 2019-09-06 2021-03-18 国人 小林 発明文書分析システム及び発明文書分析処理プログラム

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62221027A (ja) * 1986-03-20 1987-09-29 Fujitsu Ltd 単語分割装置における単語候補検索方式
JPH06149872A (ja) * 1992-11-12 1994-05-31 Seiko Epson Corp 文章入力装置
JPH06243162A (ja) * 1992-04-15 1994-09-02 Ricoh Co Ltd 機械翻訳装置
JPH09160920A (ja) * 1995-12-12 1997-06-20 Brother Ind Ltd 機械翻訳装置
JPH09223146A (ja) * 1996-02-16 1997-08-26 Toshiba Corp 翻訳方法
JPH1125093A (ja) * 1997-07-07 1999-01-29 Brother Ind Ltd 機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH11282839A (ja) * 1998-03-31 1999-10-15 Brother Ind Ltd 機械翻訳システム及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2001125907A (ja) * 1999-10-26 2001-05-11 Nippon Telegr & Teleph Corp <Ntt> 辞書検索方法、装置、および辞書検索プログラムを記録した記録媒体
JP2005216108A (ja) * 2004-01-30 2005-08-11 Casio Comput Co Ltd 辞書情報表示制御装置、および辞書情報表示制御プログラム、辞書情報表示制御方法
JP2007122509A (ja) * 2005-10-28 2007-05-17 Rozetta Corp 語句配列の自然度判定装置、方法及びプログラム
JP2010067021A (ja) * 2008-09-11 2010-03-25 Toshiba Corp 機械翻訳装置及び機械翻訳プログラム

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62221027A (ja) * 1986-03-20 1987-09-29 Fujitsu Ltd 単語分割装置における単語候補検索方式
JPH06243162A (ja) * 1992-04-15 1994-09-02 Ricoh Co Ltd 機械翻訳装置
JPH06149872A (ja) * 1992-11-12 1994-05-31 Seiko Epson Corp 文章入力装置
JPH09160920A (ja) * 1995-12-12 1997-06-20 Brother Ind Ltd 機械翻訳装置
JPH09223146A (ja) * 1996-02-16 1997-08-26 Toshiba Corp 翻訳方法
JPH1125093A (ja) * 1997-07-07 1999-01-29 Brother Ind Ltd 機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH11282839A (ja) * 1998-03-31 1999-10-15 Brother Ind Ltd 機械翻訳システム及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2001125907A (ja) * 1999-10-26 2001-05-11 Nippon Telegr & Teleph Corp <Ntt> 辞書検索方法、装置、および辞書検索プログラムを記録した記録媒体
JP2005216108A (ja) * 2004-01-30 2005-08-11 Casio Comput Co Ltd 辞書情報表示制御装置、および辞書情報表示制御プログラム、辞書情報表示制御方法
JP2007122509A (ja) * 2005-10-28 2007-05-17 Rozetta Corp 語句配列の自然度判定装置、方法及びプログラム
JP2010067021A (ja) * 2008-09-11 2010-03-25 Toshiba Corp 機械翻訳装置及び機械翻訳プログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017151786A (ja) * 2016-02-25 2017-08-31 富士ゼロックス株式会社 翻訳プログラム及び情報処理装置
JP2020517008A (ja) * 2017-04-05 2020-06-11 ティーストリート プロプライアタリー リミテッド 言語翻訳支援システム
US11455476B2 (en) 2017-04-05 2022-09-27 TSTREET Pty Ltd Language translation aid
JP7212333B2 (ja) 2017-04-05 2023-01-25 ティーストリート プロプライアタリー リミテッド 言語翻訳支援システム
JP2021043954A (ja) * 2019-09-06 2021-03-18 国人 小林 発明文書分析システム及び発明文書分析処理プログラム
JP7165163B2 (ja) 2019-09-06 2022-11-02 国人 小林 発明文書分析システム及び発明文書分析処理プログラム

Also Published As

Publication number Publication date
JP5586772B1 (ja) 2014-09-10

Similar Documents

Publication Publication Date Title
US9519641B2 (en) Photography recognition translation
KR102567285B1 (ko) 모바일 비디오 서치 기법
US9715489B2 (en) Displaying a prediction candidate after a typing mistake
US9411801B2 (en) General dictionary for all languages
US8782556B2 (en) User-centric soft keyboard predictive technologies
US11573646B2 (en) Method and system for ranking candidates in input method
US9047268B2 (en) Character and word level language models for out-of-vocabulary text input
WO2018076450A1 (zh) 一种输入方法和装置、一种用于输入的装置
CN107305438B (zh) 候选项的排序方法和装置、用于候选项排序的装置
CN107918496B (zh) 一种输入纠错方法和装置、一种用于输入纠错的装置
US20100121870A1 (en) Methods and systems for processing complex language text, such as japanese text, on a mobile device
US20150293975A1 (en) Method and device for searching for contact object, and storage medium
CN110019675B (zh) 一种关键词提取的方法及装置
WO2019109664A1 (zh) 一种跨语言搜索方法和装置、一种用于跨语言搜索的装置
JP2014229091A (ja) 文字入力用のプログラム
JP5586772B1 (ja) 翻訳システム及び翻訳プログラム、並びに翻訳方法
WO2023078414A1 (zh) 相关文章搜索方法、装置、电子设备和存储介质
CN110795014B (zh) 一种数据处理方法、装置和用于数据处理的装置
CN110633017A (zh) 一种输入方法、装置和用于输入的装置
CN108536653B (zh) 一种输入方法、装置和用于输入的装置
JP5497230B1 (ja) 翻訳システム及び翻訳プログラム、並びに翻訳方法
JP7208968B2 (ja) 情報処理方法、装置および記憶媒体
CN112987941B (zh) 生成候选词的方法及装置
US20200279560A1 (en) Acoustic sensing-based text input method
CN111460836B (zh) 一种数据处理方法、装置和用于数据处理的装置

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140722

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140722

R150 Certificate of patent or registration of utility model

Ref document number: 5586772

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S802 Written request for registration of partial abandonment of right

Free format text: JAPANESE INTERMEDIATE CODE: R311802