JP6320732B2 - 翻訳装置、および翻訳装置の制御方法 - Google Patents

翻訳装置、および翻訳装置の制御方法 Download PDF

Info

Publication number
JP6320732B2
JP6320732B2 JP2013246528A JP2013246528A JP6320732B2 JP 6320732 B2 JP6320732 B2 JP 6320732B2 JP 2013246528 A JP2013246528 A JP 2013246528A JP 2013246528 A JP2013246528 A JP 2013246528A JP 6320732 B2 JP6320732 B2 JP 6320732B2
Authority
JP
Japan
Prior art keywords
translation
character string
unit
result
translation result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013246528A
Other languages
English (en)
Other versions
JP2015106183A (ja
Inventor
健文 大塚
健文 大塚
石川 博一
博一 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2013246528A priority Critical patent/JP6320732B2/ja
Priority to PCT/JP2014/072050 priority patent/WO2015079752A1/ja
Publication of JP2015106183A publication Critical patent/JP2015106183A/ja
Application granted granted Critical
Publication of JP6320732B2 publication Critical patent/JP6320732B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、画像データに含まれる文字列を翻訳する翻訳装置および翻訳装置の制御方法に関する。
カメラの動画撮影モードで撮影されている画像中に含まれている文字列を文字認識(OCR:optical character recognition)で認識して抽出し、抽出された文字列を翻訳した結果を、リアルタイムに画面に表示させる技術が知られている。
特許文献1には、撮影部で撮影された文書や看板などに含まれる文字列を抽出し、抽出した文字列を、翻訳後、元の文字列を置換して、あるいは元の文字列に重畳して表示部に表示するカメラが開示されている。
特開2011−134144号公報(2011年 7月 7日公開)
しかしながら、上述のような従来技術は画像中の文字列の抽出に失敗した場合、適切に翻訳できないという問題がある。例えば、画像中の文字認識を行うOCRが認識した文字列が適切ではない場合、抽出された文字列に誤りが含まれることになり、画像に含まれる文字列が適切に翻訳できない。
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、画像に含まれる文字列を適切に認識できなかった場合でも、適切な翻訳を表示することができる翻訳装置等を提供することにある。
上記の課題を解決するために、本発明の一態様に係る翻訳装置は、入力された画像データに含まれる文字列を翻訳し、翻訳結果を表示する翻訳装置であって、上記画像データから検出された文字列の翻訳の成否を判定する判定手段と、上記判定手段が、上記翻訳が成功したと判定した場合、上記文字列と翻訳結果とを対応付けて記憶部に記憶させる記憶制御手段と、上記判定手段が、上記翻訳が失敗したと判定した場合、上記文字列と類似した文字列を上記記憶部から抽出する抽出手段と、上記抽出手段が抽出した上記類似した文字列と対応する翻訳結果を、上記検出された文字列の翻訳結果として表示する表示制御手段とを備える。
本発明の一態様によれば、画像データに含まれる文字列の翻訳を失敗した場合であっても、該文字列と類似した文字列を過去に翻訳した履歴を利用して、翻訳結果として適切と考えられるものを表示することができる。よって、翻訳が失敗した場合であっても、ユーザに対しては適切な翻訳結果を提示することができるという効果を奏する。
本発明の実施形態1に係る翻訳装置の概略構成例を示すブロック図である。 図1に示す翻訳成功履歴のデータ構造の一例を示す図である。 上記翻訳装置の動作の概略を説明するための図である。 上記翻訳装置が行う処理の流れの一例を示すフローチャートである。 翻訳結果を保存する処理を説明するための図である。 図4に示す保存処理の詳細な処理の流れの一例を示すフローチャートである。
〔実施形態1〕
本発明の実施の形態について、図1〜図6に基づいて説明すれば、以下のとおりである。まず、携帯端末10を例に挙げて、本発明に係る翻訳装置1の概略構成例について、図1を用いて説明する。図1は、本発明の実施形態1に係る翻訳装置1の概略構成例を示すブロック図である。なお、携帯端末10は、操作入力部、通信部などを備えてもよいが、本発明の特徴点に直接関係しないので、これらの説明は省略する。
(携帯端末10の構成例)
本発明の一実施形態において、携帯端末10は翻訳装置1、カメラ3、および表示装置4を備えている。カメラ3は、デジタルカメラ、またはデジタルビデオカメラであり、撮像した静止画像、または動画像の画像データを翻訳装置1へと出力する。表示装置4は、翻訳装置1から取得した画像データおよび文字列データなどを画面に表示するための装置である。なお、カメラ3および表示装置4が翻訳装置1との間で画像データなどの情報を送受信可能な通信機能(図示せず)を備え、カメラ3と翻訳装置1、および翻訳装置1と表示装置4をそれぞれ異なる位置に存在する構成であってもよい。また、表示装置4は、その表示画面にタッチパネルを重畳して、表示画面の一部または全体が、該表示画面に対するユーザによるタッチ操作を受け付ける操作入力部として機能するように構成してもよい。
(翻訳装置1の構成例)
翻訳装置1は、記憶部2、画像取得部11、文字列検出部12、翻訳部13、成否判定部(判定手段)14、記憶制御部(記憶制御手段)15、翻訳履歴抽出部(抽出手段)16、および表示制御部(表示制御手段)17を備えている。
記憶部2は、画像21、辞書22、および翻訳成功履歴23を格納する記憶装置である。画像21は、画像取得部11が取得した画像データである。辞書22は、各種の電子的な辞書である。ここで、各種の辞書とは、各国の単語や文章を翻訳するために必要な情報を記憶する辞書および辞典であり、例えば、語学辞書、国語辞典、地名辞典、ことわざ辞典、俗語辞典、類語辞典などである。翻訳成功履歴23には、文字列と翻訳結果と翻訳履歴抽出部16により抽出された抽出回数との組が格納されている。この翻訳成功履歴23のデータ構造については、後述する。
画像取得部11は、カメラ3から出力された画像データを取得する。なお、画像取得部11が取得する画像データはカメラ3から出力される画像データに限定されない。例えば、画像取得部11は画像21に記憶された画像データを読み出してもよい。また、放送局から放送波によって配信される放送番組の画像データ、およびインターネットなどの通信ネットワークを介して取得または受信される動画ファイルなどの映像の画像データであってもよい。
文字列検出部12は、画像取得部11から出力される画像データに含まれる文字列を認識して検出する。文字列検出部12は、例えば、光学式文字読み取り装置(OCR:optical character recognition)である。文字列検出部12は、検出された文字列をテキスト形式のデータに変換してもよい。
翻訳部13は、文字列検出部12から出力された文字列(翻訳前文字列)について、辞書22に格納されている辞書を検索して、該文字列に対応する翻訳(翻訳後文字列)を決定し、成否判定部14へと出力する。なお、以下では、「翻訳処理」という文言を使用する場合があるが、これは翻訳を行う処理を指している。
成否判定部14は、画像データから検出された文字列の翻訳の成否を判定する。ここで、画像データから検出された文字列の翻訳が失敗した例としては、翻訳後文字列の中に翻訳前文字列が含まれている場合が挙げられる。例えば、文字列検出部12が、画像データに含まれる文字列「I have a pen」の「pen」を「pel」として誤認識した場合、翻訳部13は、検出された文字列「I have a pel」に対応する翻訳として、「私はpelを持っている」という翻訳後文字列を出力する。このように、誤認識された文字列の翻訳では、翻訳前文字列が翻訳後文字列中に残存しているか否かによって該翻訳の成否が判断され得る。ただし、数字など翻訳によって変化しない文字列は、この判定方法から除くことが望ましい。なお、翻訳の成否の判定には、既知の様々な翻訳アプリなどが備える判定方法が適用可能であり、翻訳する言語間の文字列の特質にあわせて適宜好適な判定方法を用いることができる。
記憶制御部15は、成否判定部14が、翻訳が成功したと判定した場合、上記文字列と翻訳結果とを対応付けて記憶部2に保存する。より具体的には、翻訳に成功している場合、記憶制御部15は、翻訳に成功した翻訳前文字列と、翻訳後文字列とを対応付けて、翻訳成功履歴23に保存する。さらに、記憶制御部15は、文字列と、該文字列の翻訳結果と、翻訳履歴抽出部16により該文字列が抽出された回数(抽出回数)とを対応付けて翻訳成功履歴23に記憶させる。なお、記憶制御部15が翻訳成功履歴23に、翻訳に成功した翻訳結果を保存する処理については、後述する。
翻訳履歴抽出部16は、上記判定手段が、上記翻訳が失敗したと判定した場合、上記文字列と類似した文字列を上記記憶部から抽出する。類似した文字列の抽出には、類似度を利用することができる。類似度とは、比較する2つの文字列を等しくするために必要な手順の最少回数(編集距離とも呼ばれる)を求めて、この最少回数がもっとも少ない文字列同士の類似度が最も高いと判定してもよい。なお、手順とは、各文字の置き換え、挿入、および削除などである。具体的には、レーベンシュタイン距離、またはジャロ・ウィンクラー距離などの、類似度を判定する公知の方法を適用することができる。
表示制御部17は、上記抽出手段が抽出した上記類似した文字列と対応する翻訳結果を、上記検出された文字列の翻訳として表示する。この際、画像取得部11から画像データを取得して、該画像の中に、翻訳した結果の文字列を重ね合わせて表示するように表示装置4を制御してもよい。
(翻訳成功履歴23のデータ構造)
次に、翻訳成功履歴23に保存(格納)されるデータの構造について、図2を用いて説明する。図2は、図1に示す翻訳成功履歴23のデータ構造の一例を示す図である。翻訳成功履歴23には、文字列と翻訳結果と翻訳履歴抽出部16により抽出された抽出回数との組が格納されている。また、図2に示す例では、各文字列と翻訳結果との対応付けに対して、個別の識別情報であるインデックスが割り当てられている。
翻訳部13が文字列の翻訳処理を行い、その翻訳結果を成否判定部14が失敗と判定した場合、翻訳履歴抽出部16は、翻訳部13が翻訳した該文字列に類似する文字列を、翻訳成功履歴23に保存されている全インデックスの翻訳前文字列の中から抽出する。
(翻訳装置1を用いた翻訳の例)
ここでは、携帯端末10の翻訳装置1が画像データに含まれる英語を日本語へと翻訳する例を挙げて説明する。図3は、翻訳装置1の動作の概略を説明する説明図である。なお、翻訳装置1は、辞書22に適切な辞書類を格納することで、英語から日本語への翻訳に限定されず、任意の言語間の翻訳を行うことができる。
文字列検出部12が画像データに含まれる文字列を検出した結果が「I play tenis」という文字列であった場合、「tenis」という文字列は辞書22に格納されている英和辞典などには存在しないので、翻訳部13はこの「tenis」を翻訳することができず、「私はtenisをする」という翻訳結果を成否判定部14へと出力する。翻訳できなかった文字列「tenis」がそのまま翻訳結果に含まれているので、成否判定部14は、この翻訳を失敗と判定する。
翻訳履歴抽出部16は、成否判定部14から翻訳を失敗したという情報、および、翻訳を失敗した文字列「I play tenis」を受け取る。そして、翻訳履歴抽出部16は、翻訳成功履歴23に保存されている、過去に翻訳に成功した文字列を検索し、その中から、「I play tenis」に類似する文字列「I play tennis」を抽出する。文字列「I play tenis」と文字列「I play tennis」は、「tenis」に1文字「n」を挿入するという1回の編集処理だけで互いに等しい文字列になるため、非常に類似している。そこで、翻訳履歴抽出部16は、翻訳成功履歴23に保存されている、文字列「I play tennis」を翻訳した「私はテニスをする」を表示制御部17へと出力する。そして、表示制御部17は、入力された文字列「私はテニスをする」を、画像データから文字列検出部12が検出した文字列の翻訳として表示するように、表示装置4を制御する。
上記のように、翻訳装置1は、画像データからの文字列に対応する翻訳結果を表示する場合に、翻訳成功履歴23に保存されている、過去に翻訳を成功した文字列と翻訳結果とに関する情報を利用して、画像データから検出された文字列に対する翻訳として表示する。これにより、画像データからの文字列の検出が正しく行われず、翻訳処理に失敗した場合であっても、該文字列と類似する文字列に対する過去の翻訳結果を利用して、適切と考えられる翻訳を表示することができる。よって、画像データに含まれる文字列の翻訳が失敗しても、適切な翻訳を提示することができる。
なお、翻訳装置1は、図3に示すように、単語に限らず文章翻訳に対しても、翻訳に失敗した文字列の翻訳として適切と考えられる翻訳を表示することができる。
また、翻訳の失敗を結果的に減らすことにより、翻訳の成功と失敗とが連続することにより表示画面がちらついてしまうことを防止することができる。例えば、画像データから文字列を認識して検出するOCR処理が安定しない場合、文字列の検出が正確に行われないことに起因する翻訳の失敗が生じる。例えば、「私はtenisをする」と「私はテニスをする」とが同じ表示位置に交互に表示されると、特に「tenis」と「テニス」とが表示される位置などにおいてちらつきが生じ、翻訳を視認することが困難になる。しかしながら、上記のように、翻訳に失敗した「私はtenisをする」の代わりとして、過去の翻訳結果を利用して「私はテニスをする」を表示させることによって、この表示のちらつきも防ぐことができる。
(翻訳装置1の処理の流れ)
ここでは、翻訳装置1が画像データに含まれる文字列の翻訳を表示装置4に表示する処理の流れについて、図4を用いて説明する。図4は、図1に示す翻訳装置1が行う処理の流れの一例を示すフローチャートである。
カメラ3によって撮像された画像データを画像取得部11が取得すると(S1)、文字列検出部12は、OCR処理などによって文字認識を行い、該画像データに含まれる文字列を、翻訳対象として検出する(S2)。なお、画像取得部11が動画像であれば、文字列検出部12はカメラ3から次々と出力される各フレーム画像について文字列の認識、検出を行う。
S2において検出された文字列は、次に、翻訳部13へと出力され、翻訳部13は、入力される文字列の翻訳を行う(S3)。成否判定部14は翻訳部13が行った翻訳処理において、文字列に翻訳できない文字列(図3に示す例では、「tenis」がこれに該当)があるか否かを判定し、各翻訳が成功したか否かを判定する(S4:判定ステップ)。
翻訳できない文字列がない場合(S4においてNO)、すなわち、翻訳に成功している場合、記憶制御部15は、この翻訳前文字列と、翻訳後文字列とを対応付けて、翻訳成功履歴23に保存する(S5:記憶制御ステップ)。また、翻訳後文字列は、成否判定部14によって表示制御部17へと出力され、表示装置4に表示される(S6)。なお、記憶制御部15が、翻訳に成功した翻訳前文字列と、翻訳後文字列とを対応付けて、翻訳成功履歴23に保存する処理については、後述する。
翻訳できない文字列がある場合(S4においてYES)、すなわち、翻訳に失敗している場合、翻訳履歴抽出部16は、翻訳成功履歴23に保存されている翻訳前文字列に、当該翻訳できない文字列を含む文字列に類似した翻訳前文字列があるか否かを検索する(S7)。
翻訳成功履歴23に保存されている翻訳前文字列に、翻訳部13が翻訳できない文字列に類似した翻訳前文字列が無い場合(S7においてNO)、ステップS3で実行された翻訳結果の文字列である翻訳後文字列を表示する(S6)。なお、この翻訳後文字列は、翻訳できない文字列を含んでいる。
翻訳成功履歴23に保存されている翻訳前文字列に、翻訳部13が翻訳できない文字列に類似した翻訳前文字列がある場合(S7においてYES)、翻訳履歴抽出部16は、該翻訳できない文字列を含む文字列と最も類似した翻訳前文字列と対応する翻訳後文字列を抽出し、表示制御部17へと出力する(S8:抽出ステップ)。表示制御部17は翻訳後文字列を翻訳結果として表示するよう、表示装置4を制御する(S8:表示制御ステップ)。翻訳履歴抽出部16は、翻訳後文字列を抽出した翻訳結果の抽出回数(図3参照)をインクリメントする。
(翻訳結果の保存処理)
次に、記憶制御部15が、翻訳前文字列と、翻訳後文字列とを対応付けて、翻訳に成功した結果を翻訳成功履歴23に保存する処理について図5および図6を用いて説明する。図5は、図6に示す翻訳結果の保存処理の前提となる翻訳成功履歴23を説明するための図である。なお、図5において、各翻訳結果に付与された数字1〜nは、図2に示すインデックスと同じものであり、翻訳成功履歴23に保存できる翻訳結果の数は有限数nである。すなわち、nは翻訳成功履歴23に保存できる翻訳結果の数の上限である。
前述のように、翻訳できない文字列が無い場合(図4のS4においてNO)記憶制御部15は、この翻訳に成功した翻訳前文字列と、翻訳後文字列とを対応付けて、翻訳成功履歴23に保存する(図4のS5)。保存処理(S5)において、翻訳結果の数が翻訳成功履歴23の上限nに達した場合、記憶制御部15は、抽出回数が少ないものから順に、翻訳結果を更新する。
図5に示すように、直近に(最後に)更新された翻訳結果が、インデックスkの翻訳結果として保存された状態において、その次に翻訳に成功した翻訳前文字列および翻訳後文字列を、翻訳結果として保存する処理について、図6を用いて説明する。図6は、図4に示す保存処理(S5)の詳細な処理の流れの一例を示すフローチャートである。
まず、記憶制御部15は、新たに翻訳に成功した翻訳前文字列が、その時点で既に翻訳成功履歴23に保存済みの文字列か否かを判定する(S51)。保存済みの文字列である場合(S51においてYES)、この新たに翻訳に成功した翻訳前文字列の保存は行わない。これにより、翻訳成功履歴23に同じ翻訳結果が重複して保存されることを避けることができる。よって、翻訳成功履歴23が保存できる有限の数の翻訳結果を有効に利用することができる。
一方、新たに翻訳に成功した翻訳前文字列が、保存済みの文字列ではない場合(S51においてNO)、記憶制御部15は、総記憶回数をインクリメントする(S52)。ここで、総記憶回数とは、記憶制御部15によって翻訳成功履歴23に翻訳結果が保存された回数である。すなわち、翻訳成功履歴23に保存されていない文字列の翻訳結果を保存する処理を記憶制御部15が行うたびに、各保存処理が計数開始から何回目の保存処理であるかを計数する。
次に、記憶制御部15は、図5に示すn個の翻訳結果、すなわち、翻訳結果1から翻訳結果nの全ての抽出回数を確認し(S53)、最も抽出回数の少ない翻訳結果の抽出回数pを決定する(S54)。
その後に、記憶制御部15は、翻訳結果のインデックスをk+1に設定する(S55)。すなわち、直前に保存された翻訳結果kの次のインデックスに対応する翻訳結果k+1を、最初の変更候補として設定する。
抽出回数がpに等しければ(S56においてYES)、その翻訳結果を、新しい翻訳結果に変更する(S57)。一方、抽出回数がpに等しくない(pよりも多い)場合(S56においてNO)、インデックスがnに等しいか否かを判定する(S58)。すなわち、翻訳成功履歴23に格納されている、文字列と翻訳結果と翻訳履歴抽出部16により抽出された抽出回数との組の数が上限値nに達している場合、記憶制御部15は、抽出回数が最も少ない組を翻訳成功履歴23から削除した後、新たに翻訳が成功した文字列と該文字列の翻訳結果とを対応付けて翻訳成功履歴23に記憶させる。
インデックスがnに等しい場合(S58においてYES)、すなわち、変更候補とする翻訳結果のインデックスが終端に達した場合、次の変更候補とする翻訳結果のインデックスを1に設定する(S59)。一方、インデックスがnに等しくない(nよりも小さい)場合(S58においてNO)、次の変更候補となる翻訳結果のインデックスとして、今の翻訳結果のインデックスに1を加えたインデックスに対応する翻訳結果を設定する(S60)。
このように、直前に保存された翻訳結果kの次のインデックスに対応する翻訳結果k+1を、最初の変更候補として設定し、その後は、変更候補とする翻訳結果のインデックスを次々に1ずつ後ろにずらして設定する。そして、設定したインデックスに対応する各翻訳結果の抽出回数が最少であるか否かを順に調べ、抽出回数が最少の翻訳結果を、新しい翻訳結果と変更する。これにより、更新されたばかりの翻訳結果kが、直後に行われる保存処理によってすぐに更新されることを避けることができる。
また、抽出回数が少ないものから順に翻訳結果を更新することで、文字列の翻訳処理を失敗した場合により有用な翻訳結果を優先的に翻訳成功履歴23に保持することができる。よって、翻訳が失敗した場合でも、適切に翻訳結果を表示できる場合を増やすことができる。
S57において、新しい翻訳結果に変更することによって、行った保存処理が計数開始から所定の回数Tに達した場合(S61においてYES)、各翻訳結果の抽出回数の値を半分にする(S62)。記憶制御部15が行った保存処理が計数開始から所定の回数Tに達したときの翻訳成功履歴23に保存されている各翻訳結果の抽出回数が、例えば、図2に示すような値であれば、インデックス1の抽出回数は2(5を半分にして、小数点以下を切り捨てた値)、インデックス2の抽出回数は12、インデックスnの抽出回数は3となる。そして、総記憶回数をリセットして、新たに保存処理を行う回数の計数を開始する(S63)。
なお、総記憶回数をリセットする処理(S63)は、必ずしも行わなくてもよい。例えば、S61において、総記憶回数が所定の回数Tの自然数倍に達したとき、すなわち、総記憶回数を所定の回数Tで割ったときの余りが0である場合に、S62において、各翻訳結果の抽出回数の値を半分にするようにしてもよい。
このように、記憶制御部15は、文字列と該文字列の翻訳結果とを対応付けて翻訳成功履歴23に記憶させた回数を計数し、該回数が所定値を超えたとき、当該文字列と対応付けられた抽出回数の値を減らす。
翻訳結果の抽出回数が多い場合でも、長い期間、翻訳成功履歴23に保存されている翻訳結果は、翻訳の失敗を減らすために役に立っていない可能性がある。そこで、長い期間、翻訳成功履歴23に保存されたままの翻訳結果が生じにくくなるように、翻訳装置1は、一定期間ごとに抽出回数の値を減らす構成であってもよい。一定期間とは、例えば、図6に示す例の場合、保存処理が行われる回数Tによって規定されているが、これに限定されず、翻訳装置1を利用して翻訳処理を行った回数、文字列の翻訳に成功した総回数、翻訳履歴抽出部16が翻訳結果を抽出する回数など、任意の計数可能な数値によって規定してもよい。
なお、図6のS51において、新たに翻訳に成功した翻訳前文字列が、その時点で既に翻訳成功履歴23に保存済みの文字列であるか否かにかかわらず、記憶制御部15が、翻訳処理を行った回数をインクリメントする構成であってもよい。この場合、記憶制御部15は、文字列の翻訳に成功した総回数を計数し、該総回数が所定値を超えたとき、当該文字列と対応付けられた抽出回数の値を減らす。すなわち、保存済みの文字列であった場合も、文字列の翻訳に成功した総回数としてインクリメントし、S61において、文字列の翻訳に成功した総回数が所定の回数Tの自然数倍に達したとき、S62において、各翻訳結果の抽出回数の値を半分にするようにしてもよい。これにより、保存済みの文字列ばかりを翻訳した場合にも、翻訳成功履歴23に格納された、抽出回数が多い翻訳結果の履歴を更新しないまま記憶部において格納し続けることを避けることができる。
なお、ここでは、抽出回数の数を減らすために半分にするという計算を例に挙げたが、これに限定されない。例えば、1より大きい任意の数で抽出回数を除算してもよいし、所定の数値を抽出回数から減算して得られる値の正の整数または0を導出してもよい。また、その他の様々な演算を1つ以上適用してもよい。
また、各翻訳結果の抽出回数のなかで、所定値を超えた値だけを減らすようにしてもよい。例えば、所定値を24と設定すれば、図2のインデックス2の翻訳結果の抽出回数が24であり、この所定値に達しているので、インデックス2の抽出回数の値は半分の12とされる。この場合には、インデックス1、インデックスnなどの抽出回数は、所定値24よりも低い値なので、減らすように演算されない。これにより、所定値として設定された値に従って抽出回数の値の上限が設定される。
このように記憶制御部15は、適宜、抽出回数の値を減らすように制御することが好ましい。これにより、抽出回数が多い翻訳結果を、更新しないまま記憶部に格納し続けることを避けることができる。よって、有用な翻訳結果を古いものと入れ替えて、記憶している翻訳結果を適切に更新することができる。
〔実施形態2〕
翻訳装置1の制御ブロック(特に、文字列検出部12、翻訳部13、成否判定部14、記憶制御部15、翻訳履歴抽出部16、および表示制御部17)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。
後者の場合、翻訳装置1は、各機能を実現するソフトウェアであるプログラムの命令を実行するCPU、上記プログラムおよび各種データがコンピュータ(またはCPU)で読み取り可能に記録されたROM(Read Only Memory)または記憶装置(これらを「記録媒体」と称する)、上記プログラムを展開するRAM(Random Access Memory)などを備えている。そして、コンピュータ(またはCPU)が上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
〔まとめ〕
本発明の態様1に係る翻訳装置1は、入力された画像データに含まれる文字列を翻訳し、翻訳結果を表示する翻訳装置であって、上記画像データから検出された文字列の翻訳の成否を判定する判定手段(成否判定部14)と、上記判定手段が、上記翻訳が成功したと判定した場合、上記文字列と翻訳結果とを対応付けて記憶部2に記憶させる記憶制御手段(記憶制御部15)と、上記判定手段が、上記翻訳が失敗したと判定した場合、上記文字列と類似した文字列を上記記憶部から抽出する抽出手段(翻訳履歴抽出部16)と、上記抽出手段が抽出した上記類似した文字列と対応する翻訳結果を、上記検出された文字列の翻訳として表示する表示制御手段(表示制御部17)とを備えている。
上記の構成によれば、翻訳に失敗した場合、翻訳に失敗した文字列と類似した文字列を、過去に翻訳に成功した文字列が格納されている記憶部から抽出し、該類似した文字列と対応する翻訳結果を、翻訳に失敗した文字列の翻訳として表示する。
これにより、文字列の翻訳処理を失敗した場合であっても、該文字列の翻訳結果として適切と考えられるものを表示することができる。よって、翻訳が失敗した場合であっても適切な翻訳結果を提示することができる。
また、翻訳が失敗した場合であっても適切な翻訳結果を提示することができるので、翻訳の成功と失敗とが連続することにより表示画面がちらついてしまうことを防止することができる。
本発明の態様2に係る翻訳装置は、上記態様1において、上記記憶制御手段は、さらに、上記文字列と、上記抽出手段により該文字列が抽出された抽出回数とを対応付けて上記記憶部に記憶させてもよい。
上記の構成によれば、上記文字列と、上記抽出手段により該文字列が抽出された回数とを対応付けて、記憶部に記憶させる。これにより、過去に翻訳に成功した文字列に対応する翻訳結果が、どの程度、翻訳に失敗した文字列に対応する翻訳として利用されたかを適宜評価することができる。
本発明の態様3に係る翻訳装置は、上記態様2において、上記記憶部が格納可能な、上記文字列と上記翻訳結果と上記抽出回数との組の数には上限値があり、上記記憶部に格納されている上記組の数が上記上限値に達している場合、上記記憶制御手段は、上記抽出回数が最も少ない組を上記記憶部から削除した後、新たに翻訳が成功した上記文字列と上記翻訳結果とを対応付けて上記記憶部に記憶させてもよい。
上記の構成によれば、上記文字列と上記翻訳結果と上記抽出回数との組の数が記憶部に格納可能な上限に達している場合、抽出回数が最も少ない組を記憶部から削除した後、新たに翻訳が成功した文字列と翻訳結果とを対応付けて記憶部に記憶させる。これにより、文字列の翻訳処理を失敗した場合に抽出される回数の少ない翻訳結果に代えて、より有用な翻訳結果を優先的に記憶部に保持させることができる。
本発明の態様4に係る翻訳装置は、上記態様2または3において、上記記憶制御手段は、上記文字列と上記翻訳結果とを対応付けて上記記憶部に記憶させた回数を計数し、該回数が所定値を超えたとき、当該文字列と対応付けられた上記抽出回数の値を減らすものであってもよい。
上記の構成によれば、文字列と上記翻訳結果とを対応付けて上記記憶部に記憶させた回数が所定値を超えたとき、文字列と対応付けられた抽出回数の値を減らす。これにより、抽出回数が多い翻訳結果の履歴を更新しないまま記憶部において格納し続けることを避けることができる。よって、有用な翻訳結果を古いものと入れ替えて、翻訳結果を適切に更新することができる。
本発明の態様5に係る翻訳装置は、入力された画像データに含まれる文字列を翻訳し、翻訳結果を表示する翻訳装置の制御方法であって、上記画像データから検出された文字列の翻訳の成否を判定する判定ステップと、上記判定ステップにおいて、上記翻訳が成功したと判定した場合、上記文字列と翻訳結果とを対応付けて記憶部に記憶させる記憶制御ステップと、上記判定ステップにおいて、上記翻訳が失敗したと判定した場合、上記文字列と類似した文字列を上記記憶部から抽出する抽出ステップと、上記抽出ステップにおいて抽出した上記類似した文字列と対応する翻訳結果を、上記検出された文字列の翻訳結果として表示する表示制御ステップとを含んでいる。
上記の方法によれば、上記態様1の翻訳装置と同様の効果を奏する。
本発明の各態様に係る翻訳装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記翻訳装置が備える各手段として動作させることにより上記翻訳装置をコンピュータにて実現させる翻訳装置の制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。
本発明は、画像データ中の文字列に対応する翻訳を表示する携帯端末、および通信回線を介して頒布される翻訳アプリケーションソフトウェアに利用することができる。
1 翻訳装置
2 記憶部
14 成否判定部(判定手段)
15 記憶制御部(記憶制御手段)
16 翻訳履歴抽出部(抽出手段)
17 表示制御部(表示制御手段)

Claims (5)

  1. 入力された画像データに含まれる文字列を翻訳し、翻訳結果を表示する翻訳装置であって、
    上記画像データから検出された文字列の翻訳の成否を判定する判定手段と、
    上記判定手段が、上記翻訳が成功したと判定した場合、上記文字列と翻訳結果とを対応付けて記憶部に記憶させる記憶制御手段と、
    上記判定手段が、上記翻訳が失敗したと判定した場合、上記文字列と類似した文字列を上記記憶部から抽出する抽出手段と、
    上記抽出手段が抽出した上記類似した文字列と対応する翻訳結果を、上記検出された文字列の翻訳結果として表示する表示制御手段とを備え、
    上記抽出手段は、上記翻訳が失敗したと判定された文字列と類似する文字列の抽出回数のみを増加させることを特徴とする翻訳装置。
  2. 上記記憶制御手段は、さらに、上記文字列と、上記抽出手段により該文字列が抽出された抽出回数とを対応付けて上記記憶部に記憶させることを特徴とする請求項1に記載の翻訳装置。
  3. 上記記憶部が格納可能な、上記文字列と上記翻訳結果と上記抽出回数との組の数には上限値があり、
    上記記憶部に格納されている上記組の数が上記上限値に達している場合、上記記憶制御手段は、上記抽出回数が最も少ない組を上記記憶部から削除した後、新たに翻訳が成功した上記文字列と上記翻訳結果とを対応付けて上記記憶部に記憶させることを特徴とする請求項2に記載の翻訳装置。
  4. 上記記憶制御手段は、上記文字列と上記翻訳結果とを対応付けて上記記憶部に記憶させた回数を計数し、該回数が所定値を超えたとき、当該文字列と対応付けられた上記抽出回数の値を減らすことを特徴とする請求項2または3に記載の翻訳装置。
  5. 入力された画像データに含まれる文字列を翻訳し、翻訳結果を表示する翻訳装置の制御方法であって、
    上記画像データから検出された文字列の翻訳の成否を判定する判定ステップと、
    上記判定ステップにおいて、上記翻訳が成功したと判定した場合、上記文字列と翻訳結果とを対応付けて記憶部に記憶させる記憶制御ステップと、
    上記判定ステップにおいて、上記翻訳が失敗したと判定した場合、上記文字列と類似した文字列を上記記憶部から抽出する抽出ステップと、
    上記抽出ステップにおいて抽出した上記類似した文字列と対応する翻訳結果を、上記検出された文字列の翻訳結果として表示する表示制御ステップとを含み、
    上記抽出ステップにおいて、翻訳が失敗したと判定された文字列と類似する文字列の抽出回数のみを増加させることを特徴とする翻訳装置の制御方法。
JP2013246528A 2013-11-28 2013-11-28 翻訳装置、および翻訳装置の制御方法 Active JP6320732B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013246528A JP6320732B2 (ja) 2013-11-28 2013-11-28 翻訳装置、および翻訳装置の制御方法
PCT/JP2014/072050 WO2015079752A1 (ja) 2013-11-28 2014-08-22 翻訳装置、および翻訳装置の制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013246528A JP6320732B2 (ja) 2013-11-28 2013-11-28 翻訳装置、および翻訳装置の制御方法

Publications (2)

Publication Number Publication Date
JP2015106183A JP2015106183A (ja) 2015-06-08
JP6320732B2 true JP6320732B2 (ja) 2018-05-09

Family

ID=53198709

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013246528A Active JP6320732B2 (ja) 2013-11-28 2013-11-28 翻訳装置、および翻訳装置の制御方法

Country Status (2)

Country Link
JP (1) JP6320732B2 (ja)
WO (1) WO2015079752A1 (ja)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0764991A (ja) * 1993-08-25 1995-03-10 Casio Comput Co Ltd 定型文書入力装置
JPH11272671A (ja) * 1998-03-20 1999-10-08 Toshiba Corp 機械翻訳装置及び機械翻訳方法
JP2003178067A (ja) * 2001-12-10 2003-06-27 Mitsubishi Electric Corp 携帯端末型画像処理システム、携帯端末およびサーバ
JP2004078485A (ja) * 2002-08-15 2004-03-11 Oki Electric Ind Co Ltd 翻訳支援システムおよび方法
JP5208795B2 (ja) * 2009-02-12 2013-06-12 株式会社東芝 通訳装置、方法、及びプログラム

Also Published As

Publication number Publication date
WO2015079752A1 (ja) 2015-06-04
JP2015106183A (ja) 2015-06-08

Similar Documents

Publication Publication Date Title
CN108287858B (zh) 自然语言的语义提取方法及装置
CN105976818B (zh) 指令识别的处理方法及装置
US8855424B2 (en) Word recognition method, word recognition program, and information processing device
US9489372B2 (en) Web-based spell checker
KR101633570B1 (ko) 문자 판독용의 프로그램 및 문자 판독 장치 및 문자 판독 방법
CN109271641B (zh) 一种文本相似度计算方法、装置及电子设备
CN113052169A (zh) 视频字幕识别方法、装置、介质及电子设备
CN111160013B (zh) 文本纠错方法及装置
CN111753532B (zh) 西文文本的纠错方法和装置、电子设备及存储介质
CN112329482A (zh) 机器翻译方法、装置、电子设备和可读存储介质
CN104182381A (zh) 文字输入用方法和系统
CN112784009A (zh) 一种主题词挖掘方法、装置、电子设备及存储介质
US9659224B1 (en) Merging optical character recognized text from frames of image data
CN113272873A (zh) 用于增强现实的方法和设备
CN114387602A (zh) 医疗ocr数据优化模型训练方法、优化方法及设备
JP6328409B2 (ja) 翻訳装置
JP6204894B2 (ja) バックスペースキーに基づいて入力ミスを自動的に修正する日本語入力方法、入力システム、コンピュータプログラム及び記録媒体
JP6320732B2 (ja) 翻訳装置、および翻訳装置の制御方法
JP6433045B2 (ja) キーワード抽出装置およびプログラム
KR101245631B1 (ko) 근사조합장치, 근사조합방법, 프로그램 및 기록매체
JP2019211959A (ja) 検索方法、検索プログラムおよび検索装置
CN115396690A (zh) 音频与文本组合方法、装置、电子设备及存储介质
CN111860526B (zh) 基于图像的判题方法、装置、电子设备和计算机存储介质
KR20180007183A (ko) 대표문자와 공백 입력을 통한 둘 이상의 단어로 구성된 문장입력방법 및 장치
JP5752073B2 (ja) データ修正装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160923

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171003

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180327

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180404

R150 Certificate of patent or registration of utility model

Ref document number: 6320732

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150