JP2006085461A - 情報処理装置、情報処理方法及び情報処理プログラム - Google Patents

情報処理装置、情報処理方法及び情報処理プログラム Download PDF

Info

Publication number
JP2006085461A
JP2006085461A JP2004269950A JP2004269950A JP2006085461A JP 2006085461 A JP2006085461 A JP 2006085461A JP 2004269950 A JP2004269950 A JP 2004269950A JP 2004269950 A JP2004269950 A JP 2004269950A JP 2006085461 A JP2006085461 A JP 2006085461A
Authority
JP
Japan
Prior art keywords
recognition
dictionary
language
translation
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004269950A
Other languages
English (en)
Other versions
JP5150035B2 (ja
Inventor
Masahiro Yamazaki
正裕 山崎
Hideki Kuwamoto
英樹 桑本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Hitachi Mobile Communications Co Ltd
Original Assignee
Casio Hitachi Mobile Communications Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Hitachi Mobile Communications Co Ltd filed Critical Casio Hitachi Mobile Communications Co Ltd
Priority to JP2004269950A priority Critical patent/JP5150035B2/ja
Publication of JP2006085461A publication Critical patent/JP2006085461A/ja
Application granted granted Critical
Publication of JP5150035B2 publication Critical patent/JP5150035B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】 複数言語対応とした場合であっても、適切な認識辞書を用いて読み取った文字列のイメージを正しい文字情報に変換し、また、適切な翻訳辞書を用いて認識した文字列を正しい言語に翻訳する。
【解決手段】 言語設定部110は、通信部106で取得された、携帯電話100の位置情報に従って、その場所に対応する言語を特定する。画像認識部105は、言語−認識辞書対応表109を参照し、該特定した言語に対応する認識辞書108を用いて、読み取った文字列のイメージを文字情報に変換する。また、CPU102は、上記認識辞書に対応付けられている翻訳辞書を用いて認識した文字列を翻訳して、表示部107に訳語を表示する。
【選択図】 図1

Description

本発明は、例えば、携帯電話、PHS(Personal Handy-phone System)、PDA(Personal Digital Assistant)、PC(Personal Computer)やデジタルカメラ等に係り、読み取った画像データから文字列のイメージを認識して文字列に変換したり、変換した文字列を所定の言語に翻訳する情報処理装置、情報処理方法及び情報処理プログラムに関する。
従来より、紙面上に印刷された文字列のイメージを読み取り、OCR(Optical Character Recognition)機能を利用して、そのイメージから文字列を認識して文字情報に変換し、翻訳辞書を参照して、その文字列に対応する翻訳を表示部に表示する電子辞書が提案されている(例えば特許文献1参照)。
特開平5−274346号公報
しかしながら、上述した従来技術では、一種類の翻訳辞書を搭載した場合の処理については記載されているが、複数の翻訳辞書を搭載した場合の処理については記載されていない。そのため、読み取った文字列のイメージを、OCR機能を用いて文字情報に変換する際に、複数の認識辞書の中から使用すべき認識辞書を選択する方法などについて何ら記載されていない。同様に、文字認識により読み取った単語の翻訳を取得する際に、複数の翻訳辞書の中から使用すべき翻訳辞書を選択する方法などについても何ら記載されていない。
すなわち、上述した従来技術では、複数言語対応の文字認識、または複数言語対応の翻訳を実現する上での課題や使い勝手については十分な検討がされていない。このため、複数言語対応とした場合、読み取った文字列のイメージに応じて適切な認識辞書を選択することができず、また、読み取った文字列のイメージを、正しい文字情報に変換することができないという問題があった。同様に、認識した文字列に応じて適切な翻訳辞書を選択することができず、また、認識した文字列を正しい言語に翻訳することができないという問題があった。
そこで本発明は、複数言語対応とした場合であっても、読み取った文字列の言語に応じて複数の認識辞書の中から適切な認識辞書を容易に選択することができるとともに、読み取った文字列のイメージを正しい文字情報に変換することができ、また、認識した文字列に応じて複数の翻訳辞書の中から適切な翻訳辞書を容易に選択することができるとともに、認識した文字列を正しい言語に翻訳することができる情報処理装置、情報処理方法及び情報処理プログラムを提供することを目的とする。
上記目的達成のため、請求項1記載の発明による情報処理装置は、画像情報を撮像する撮像手段と、前記撮像手段により撮像された画像情報に含まれる識別情報を認識する際に用いられ、複数の言語に対応した認識辞書と、前記画像情報に含まれる識別情報の言語を特定する言語特定手段と、前記言語特定手段により特定された言語に基づいて、画像情報に含まれる識別情報を認識する際に用いる認識辞書を決定する認識辞書決定手段と、前記認識辞書決定手段により決定された認識辞書を用いて、前記撮像手段により撮像された画像情報に含まれる識別情報を認識する認識手段とを具備することを特徴とする。
また、好ましい態様として、例えば請求項2記載のように、請求項1記載の情報処理装置において、位置情報を取得する位置情報取得手段を具備し、前記言語特定手段は、前記位置情報取得手段により取得された位置情報に基づいて使用する言語を特定するようにしてもよい。
また、好ましい態様として、例えば請求項3記載のように、請求項2記載の情報処理装置において、位置情報と該位置情報で示される場所で使用されている言語とを対応付けて記憶する位置−言語対応表を具備し、前記言語特定手段は、前記位置情報取得手段により取得された位置情報を用いて、前記位置−言語対応表を参照して使用する言語を特定するようにしてもよい。
また、好ましい態様として、例えば請求項4記載のように、請求項1記載の情報処理装置において、複数の言語とそれぞれの言語が前記言語特定手段により特定された場合に認識に用いるべき認識辞書とを対応付けて記憶する言語−認識辞書対応表を具備し、前記認識手段は、前記言語特定手段により特定された言語を用いて、前記言語−認識辞書対応表を参照して、認識に用いるべき認識辞書を特定し、該特定された認識辞書を用いて、前記撮像手段により撮像された画像情報に含まれる識別情報を認識するようにしてもよい。
また、上記目的達成のため、請求項5記載の発明による情報処理装置は、画像情報を撮像する撮像手段と、前記撮像手段により撮像された画像情報に含まれる識別情報を認識する際に用いられ、複数の言語に対応した認識辞書と、前記複数の言語に対応した認識辞書の使用順番を記載した認識辞書使用順番表と、前記認識辞書使用順番表の使用順番に従った認識辞書を用いて、前記撮像手段により撮像された画像情報に含まれる識別情報を認識する認識手段とを具備することを特徴とする。
また、好ましい態様として、例えば請求項6記載のように、請求項5記載の情報処理装置において、前記認識辞書の使用順番は、それぞれの認識辞書の使用回数順であってもよい。
また、好ましい態様として、例えば請求項7記載のように、請求項5記載の情報処理装置において、前記認識辞書の使用順番は、それぞれの認識辞書の最新使用時刻の若い順であってもよい。
また、上記目的達成のため、請求項8記載の発明による情報処理装置は、画像情報を撮像する撮像手段と、前記撮像手段により撮像された画像情報に含まれる識別情報を認識する際に用いられ、複数の言語に対応した認識辞書と、前記複数の言語に対応した認識辞書のうち、どの認識辞書を用いるかを指示する指示手段と、前記指示手段による指示に従った認識辞書を用いて、前記撮像手段により撮像された画像情報に含まれる識別情報を認識する認識手段とを具備することを特徴とする。
また、好ましい態様として、例えば請求項9記載のように、請求項1記載の情報処理装置において、前記識別情報に関連する関連情報が記載され、複数の言語に対応した翻訳辞書と、前記認識手段によって用いられた認識辞書に基づいて、前記複数の言語に対応した翻訳辞書の中から、使用する翻訳辞書を決定する翻訳辞書決定手段と、前記翻訳辞書決定手段により決定された翻訳辞書を用いて、前記認識手段により認識された識別情報に含まれる識別情報を翻訳する翻訳手段とを具備するようにしてもよい。
また、上記目的達成のため、請求項10記載の発明による情報処理装置は、画像情報を撮像する撮像手段と、前記撮像手段により撮像された画像情報に含まれる識別情報を認識する認識手段と、前記識別情報に関連する関連情報が記載され、複数の言語に対応した翻訳辞書と、翻訳言語を特定する翻訳言語特定手段と、前記翻訳言語特定手段によって特定された翻訳言語に基づいて、前記複数の言語に対応した翻訳辞書の中から、使用する翻訳辞書を決定する翻訳辞書決定手段と、前記翻訳辞書決定手段により決定された翻訳辞書を用いて、前記認識手段により認識された識別情報に含まれる識別情報を翻訳する翻訳手段とを具備することを特徴とする。
また、好ましい態様として、例えば請求項11記載のように、請求項10記載の情報処理装置において、位置情報を取得する位置情報取得手段を具備し、前記翻訳言語特定手段は、前記位置情報取得手段により取得された位置情報に基づいて使用する翻訳言語を特定するようにしてもよい。
また、好ましい態様として、例えば請求項12記載のように、請求項10記載の情報処理装置において、前記複数の言語に対応した翻訳辞書のうち、どの翻訳辞書を用いるかを指示する指示手段を具備し、前記翻訳手段は、前記指示手段による指示に従った翻訳辞書を用いて、前記認識手段により認識された識別情報に含まれる識別情報を翻訳するようにしてもよい。
また、好ましい態様として、例えば請求項13記載のように、請求項10ないし12のいずれかに記載の情報処理装置において、通信手段と、前記認識手段により認識された識別情報に関連した関連情報の参照を指示する関連情報参照指示部と、前記関連情報参照指示部により前記関連情報の参照が指示された場合、前記認識手段により認識された識別情報に基づいて、前記関連情報を前記通信手段を介して取得する関連情報取得手段とを具備するようにしてもよい。
また、上記目的達成のため、請求項14記載の発明による情報処理方法は、位置情報を取得し、取得された位置情報に基づいて認識に用いる言語を特定し、特定された言語に基づいて、複数の言語に対応した認識辞書の中から、撮像された画像情報に含まれる識別情報を認識する際に用いる認識辞書を決定し、決定された認識辞書を用いて、撮像された画像情報に含まれる識別情報を認識することを特徴とする。
また、上記目的達成のため、請求項15記載の発明による情報処理方法は、撮像された画像情報に含まれる識別情報を認識する際に用いられ、複数の言語に対応した認識辞書に対して、認識辞書の使用順番を設定しておき、複数の言語に対応した認識辞書の中から、使用順番に従った認識辞書を用いて、撮像された画像情報に含まれる識別情報を認識することを特徴とする。
また、上記目的達成のため、請求項16記載の発明による情報処理方法は、撮像された画像情報に含まれる識別情報を認識する際に用いられ、複数の言語に対応した認識辞書に対して、指示入力に従って用いるべき認識辞書を設定しておき、外部からの指示に従った認識辞書を用いて、撮像された画像情報に含まれる識別情報を認識することを特徴とする。
また、上記目的達成のため、請求項17記載の発明による情報処理方法は、位置情報を取得し、取得された位置情報に基づいて翻訳に用いる翻訳言語を特定し、特定された翻訳言語に基づいて、複数の言語に対応した翻訳辞書の中から、使用する翻訳辞書を決定し、決定された翻訳辞書を用いて、認識された識別情報に含まれる識別情報を翻訳することを特徴とする。
また、上記目的達成のため、請求項18記載の発明による情報処理プログラムは、画像情報を撮像するステップと、位置情報を取得するステップと、取得された位置情報に基づいて認識に用いる言語を特定するステップと、特定された言語に基づいて、複数の言語に対応した認識辞書の中から、撮像された画像情報に含まれる識別情報を認識する際に用いる認識辞書を決定するステップと、決定された認識辞書を用いて、撮像された画像情報に含まれる識別情報を認識するステップとをコンピュータに実行させることを特徴とする。
また、上記目的達成のため、請求項19記載の発明による情報処理プログラムは、画像情報を撮像するステップと、位置情報を取得するステップと、取得された位置情報に基づいて翻訳に用いる翻訳言語を特定するステップと、特定された翻訳言語に基づいて、複数の言語に対応した翻訳辞書の中から、使用する翻訳辞書を決定するステップと、決定された翻訳辞書を用いて、認識された識別情報に含まれる識別情報を翻訳するステップとをコンピュータに実行させることを特徴とする。
請求項1記載の発明によれば、言語特定手段により画像情報に含まれる識別情報の言語を特定し、認識辞書決定手段により、特定された言語に基づいて、画像情報に含まれる識別情報を認識する際に用いる認識辞書を決定し、認識手段により、決定された認識辞書を用いて、撮像された画像情報に含まれる識別情報を認識するようにしたので、複数言語対応とした場合であっても、読み取った文字列の言語に応じて複数の認識辞書の中から適切な認識辞書を容易に選択することができるとともに、読み取った文字列のイメージを正しい文字情報に変換することができるという利点が得られる。
また、請求項2記載の発明によれば、前記言語特定手段により、前記位置情報取得手段により取得された位置情報に基づいて、画像情報に含まれる識別情報を認識する際に用いる言語を特定するようにしたので、複数言語対応とした場合であっても、読み取った文字列の言語に応じて複数の認識辞書の中から適切な認識辞書を容易に選択することができるとともに、読み取った文字列のイメージを正しい文字情報に変換することができるという利点が得られる。
また、請求項3記載の発明によれば、前記言語特定手段により、前記位置情報取得手段により取得された位置情報を用いて、前記位置−言語対応表を参照して、画像情報に含まれる識別情報を認識する際に用いる言語を特定するようにしたので、複数言語対応とした場合であっても、読み取った文字列の言語に応じて複数の認識辞書の中から適切な認識辞書を容易に選択することができるとともに、読み取った文字列のイメージを正しい文字情報に変換することができるという利点が得られる。
また、請求項4記載の発明によれば、前記認識手段により、前記言語特定手段により特定された言語を用いて、言語−認識辞書対応表を参照して、認識に用いるべき認識辞書を特定し、該特定された認識辞書を用いて、前記撮像手段により撮像された画像情報に含まれる識別情報を認識するようにしたので、複数言語対応とした場合であっても、読み取った文字列の言語に応じて複数の認識辞書の中から適切な認識辞書を容易に選択することができるとともに、読み取った文字列のイメージを正しい文字情報に変換することができるという利点が得られる。
また、請求項5記載によれば、認識手段により、前記認識辞書使用順番表の使用順番に従った認識辞書を用いて、前記撮像手段により撮像された画像情報に含まれる識別情報を認識するようにしたので、複数言語対応とした場合であっても、複数の認識辞書の中から適切な認識辞書を容易に選択することができるとともに、読み取った文字列のイメージを正しい文字情報に変換することができるという利点が得られる。
また、請求項6記載の発明によれば、前記認識辞書の使用順番を、それぞれの認識辞書の使用回数順としたので、複数言語対応とした場合であっても、複数の認識辞書の中から適切な認識辞書を容易に選択することができるとともに、読み取った文字列のイメージを正しい文字情報に変換することができるという利点が得られる。
また、請求項7記載の発明によれば、前記認識辞書の使用順番を、それぞれの認識辞書の最新使用時刻の若い順としたので、複数言語対応とした場合であっても、複数の認識辞書の中から適切な認識辞書を容易に選択することができるとともに、読み取った文字列のイメージを正しい文字情報に変換することができるという利点が得られる。
また、請求項8記載の発明によれば、指示手段により、前記複数の言語に対応した認識辞書のうち、どの認識辞書を用いるかを指示されと、認識手段により、指示に従った認識辞書を用いて、前記撮像手段により撮像された画像情報に含まれる識別情報を認識するようにしたので、複数の認識辞書の中から適切な認識辞書を容易に選択することができるとともに、読み取った文字列のイメージを正しい文字情報に変換することができるという利点が得られる。
また、請求項9記載の発明によれば、翻訳辞書決定手段により、前記認識手段によって用いられた認識辞書に基づいて、前記複数の言語に対応した翻訳辞書の中から、使用する翻訳辞書を決定し、翻訳手段により、前記翻訳辞書決定手段により決定された翻訳辞書を用いて、前記認識手段により認識された識別情報に含まれる識別情報を翻訳するようにしたので、認識した文字列に応じて複数の翻訳辞書の中から適切な翻訳辞書を容易に選択することができるとともに、認識した文字列を正しい言語に翻訳することができるという利点が得られる。
また、請求項10記載によれば、認識手段により、前記撮像手段により撮像された画像情報に含まれる識別情報を認識し、翻訳言語特定手段により、翻訳に用いる翻訳言語を特定し、翻訳辞書決定手段により、特定された翻訳言語に基づいて、前記複数の言語に対応した翻訳辞書の中から、使用する翻訳辞書を決定し、翻訳手段により、決定された翻訳辞書を用いて、前記認識手段により認識された識別情報に含まれる識別情報を翻訳するようにしたので、認識した文字列に応じて複数の翻訳辞書の中から適切な翻訳辞書を容易に選択することができるとともに、認識した文字列を正しい言語に翻訳することができるという利点が得られる。
また、請求項11記載の発明によれば、前記翻訳言語特定手段により、前記位置情報取得手段により取得された位置情報に基づいて使用する翻訳言語を特定するようにしたので、認識した文字列に応じて複数の翻訳辞書の中から適切な翻訳辞書を容易に選択することができるとともに、認識した文字列を正しい言語に翻訳することができるという利点が得られる。
また、請求項12記載の発明によれば、前記翻訳手段により、前記指示手段による指示に従った翻訳辞書を用いて、前記認識手段により認識された識別情報に含まれる識別情報を翻訳するようにしたので、複数の翻訳辞書の中から適切な翻訳辞書を容易に選択することができるとともに、認識した文字列を正しい言語に翻訳することができるという利点が得られる。
また、請求項13記載の発明によれば、前記関連情報参照指示部により前記関連情報の参照が指示された場合、関連情報取得手段により、前記認識手段により認識された識別情報に基づいて、前記関連情報を前記通信手段を介して取得するようにしたので、認識した文字列に応じて複数の翻訳辞書の中から適切な翻訳辞書を容易に選択することができるとともに、認識した文字列を正しい言語に翻訳することができ、さらに、翻訳した文字列の詳細な情報を取得することができるという利点が得られる。
また、請求項14記載によれば、位置情報を取得し、取得された位置情報に基づいて認識に用いる言語を特定し、特定された言語に基づいて、複数の言語に対応した認識辞書の中から、撮像された画像情報に含まれる識別情報を認識する際に用いる認識辞書を決定し、決定された認識辞書を用いて、撮像された画像情報に含まれる識別情報を認識するようにしたので、複数言語対応とした場合であっても、読み取った文字列の言語に応じて複数の認識辞書の中から適切な認識辞書を容易に選択することができるとともに、読み取った文字列のイメージを正しい文字情報に変換することができるという利点が得られる。
また、請求項15記載の発明によれば、撮像された画像情報に含まれる識別情報を認識する際に用いられ、複数の言語に対応した認識辞書に対して、認識辞書の使用順番を設定しておき、複数の言語に対応した認識辞書の中から、使用順番に従った認識辞書を用いて、撮像された画像情報に含まれる識別情報を認識するようにしたので、複数言語対応とした場合であっても、複数の認識辞書の中から適切な認識辞書を容易に選択することができるとともに、読み取った文字列のイメージを正しい文字情報に変換することができるという利点が得られる。
また、請求項16記載の発明によれば、撮像された画像情報に含まれる識別情報を認識する際に用いられ、複数の言語に対応した認識辞書に対して、指示入力に従って用いるべき認識辞書を設定しておき、外部からの指示に従った認識辞書を用いて、撮像された画像情報に含まれる識別情報を認識するようにしたので、複数の認識辞書の中から適切な認識辞書を容易に選択することができるとともに、読み取った文字列のイメージを正しい文字情報に変換することができるという利点が得られる。
また、請求項17記載の発明によれば、位置情報を取得し、取得された位置情報に基づいて翻訳に用いる翻訳言語を特定し、特定された翻訳言語に基づいて、複数の言語に対応した翻訳辞書の中から、使用する翻訳辞書を決定し、決定された翻訳辞書を用いて、認識された識別情報に含まれる識別情報を翻訳するようにしたので、認識した文字列に応じて複数の翻訳辞書の中から適切な翻訳辞書を容易に選択することができるとともに、認識した文字列を正しい言語に翻訳することができるという利点が得られる。
また、請求項18記載によれば、画像情報を撮像するステップと、位置情報を取得するステップと、取得された位置情報に基づいて認識に用いる言語を特定するステップと、特定された言語に基づいて、複数の言語に対応した認識辞書の中から、撮像された画像情報に含まれる識別情報を認識する際に用いる認識辞書を決定するステップと、決定された認識辞書を用いて、撮像された画像情報に含まれる識別情報を認識するステップとをコンピュータに実行させるようにしたので、複数言語対応とした場合であっても、読み取った文字列の言語に応じて複数の認識辞書の中から適切な認識辞書を容易に選択することができるとともに、読み取った文字列のイメージを正しい文字情報に変換することができるという利点が得られる。
また、請求項19記載の発明によれば、画像情報を撮像するステップと、位置情報を取得するステップと、取得された位置情報に基づいて翻訳に用いる翻訳言語を特定するステップと、特定された翻訳言語に基づいて、複数の言語に対応した翻訳辞書の中から、翻訳に用いる翻訳辞書を決定するステップと、決定された翻訳辞書を用いて、認識された識別情報に含まれる識別情報を翻訳するステップとをコンピュータに実行させるようにしたので、認識した文字列に応じて複数の翻訳辞書の中から適切な翻訳辞書を容易に選択することができるとともに、認識した文字列を正しい言語に翻訳することができるという利点が得られる。
以下、本発明の実施の形態を、図面を参照して説明する。
A.第1実施形態
A−1.第1実施形態の構成
図1は、本第1実施形態に係る携帯電話の外観を示す模式図である。また、図2は、本発明の第1実施形態に係る携帯電話の構成を示すブロック図である。本第1実施形態においては、携帯電話に搭載された画像認識機能(OCR機能)を利用して、紙面などに記載された英単語を認識して読み取り、その認識結果を出力する場合について説明する。
図1に示すように、携帯電話100は、入力部101などが設けられた本体部と表示部107などが設けられた蓋部とからなる。該携帯電話100は、図2に示すように、入力部101、CPU102、撮像部103、記憶部104、画像認識部105、通信部106、表示部107からなる。
入力部101は、キーボード等の電話番号その他の情報を入力する入力部であり、携帯電話の電源をON/OFFするとき、被写体を撮像するときなど、ユーザが携帯電話に入力を与える際に使用するものである。
CPU102は、記憶部104に記憶されたプログラムに基づいて動作し、例えば、入力部101からの入力に応じて各部を制御するものである。撮像部103は、例えば、カメラなどで構成されたものであり、被写体である人の顔や、景色、文字などを撮像し、CPU102で扱える画像情報に変換し、変換された画像情報は必要に応じて表示部107等に出力する。ユーザは、表示部107に出力された画像情報をモニタしながら撮像したい画像を選んで、例えば、シャッターキーとして割り当てられた操作キー(以下、シャッターキー)等を押下することにより撮像の指示を行う。シャッターキーが押下されれば、撮像された画像情報は記憶部104に記憶される。
また、記憶部104は、例えば、ROM(Read Only Memory)やRAM(Random Access Memory)等で構成され、上記画像情報以外に、携帯電話100で扱うデータやソフトウェアなども記憶する。また、該記憶部104は、認識辞書108および言語−認識辞書対応表109を備えている。これら認識辞書108および言語−認識辞書対応表109については後述する。
画像認識部105は、画像情報に含まれる文字や記号等の識別情報を認識する。ここで、識別情報とは、文字、記号等で表された情報であり、例えば、ホームページのアドレス、メールアドレス、住所、電話番号、地図情報あるいは英語の単語等のように文字や記号等で表現されたものであり、事物を識別できる情報であれば上記例以外のものでも構わない。すなわち、画像認識部105は、OCR機能を備えており、OCR機能を実現する具体的な構成は、例えば、特許文献1に記されている。
ここで、認識とは、撮像部103により撮像された画像情報に含まれる識別情報を抽出し、その識別情報を所定の領域ごとに分割し、分割された領域を所定のパラメータ値に変換し、そのパラメータ値に基づいて分割された領域がどのような情報であるかを決定することをいう。
より具体的にいえば、例えば、画像情報内の「abc」という文字を「認識」する場合を考えると、まず、「abc」が画像情報内のどの位置の情報であるかを特定し(文字列抽出)、次に、「a」「b」「c」に分割し、「a」を所定のパラメータ値(例えば、その文字を縦、横、斜めからの見た線分の構成を、文字の白色部分を「0」、黒色部分を「1」としてパラメータ化された値)に変換する。そして、変換されたパラメータ値に最も類似したパラメータ値に対応付けされた文字(文字コード)を認識辞書108から選び出す。
認識辞書108とは、パラメータ値とそのパラメータ値に対応したアルファベット等の文字(文字コード)とが記述されている表であり、記憶部104に記憶されている。ところで、本発明の携帯電話100は、英語や韓国語、日本語といった複数の言語に対応するために、それぞれの言語に対応した認識辞書を備えている。そして、英語を認識する場合には、アルファベットに対応した認識辞書(英語認識辞書)を用いて認識し、また、韓国語を認識する場合にはハングル文字に対応した認識辞書(韓国語認識辞書)を用いて認識する。
なお、日本語やハングル文字などのように文字数が多い場合、1つの認識辞書に全ての文字について格納してしまうと、ファイルサイズが増大してしまう。そのため、複数の認識辞書に分割して格納してもよいし、例えば日本語の場合には、JISで定められた第1水準の文字だけを格納してもよい。
ところで、例えば、携帯電話100で、英語認識辞書を用いて認識するように設定していた場合、韓国語は認識できない。そのため、ユーザは、携帯電話100を、韓国語認識辞書を用いて認識するように設定し、もう一度認識し直す必要がある。
このように、認識する言語が変わるたびに認識辞書を変更し直す必要があるため、例えば、韓国と日本を頻繁に行き来するようなユーザは、韓国に行ったら韓国語認識辞書に設定し、日本に行ったら日本語認識辞書に設定する必要があり、非常に手間がかかる。そこで、本第1実施形態では、携帯電話100の位置情報を取得し、その位置情報から使用されている言語を特定し、当該言語に対応した認識辞書を用いて、撮像部103により撮像された画像情報に含まれる識別情報を認識するように自動的に設定するようにする。なお、携帯電話100の位置情報の取得方法については後述する。
そこで、本第1実施形態では、特定された言語に対して認識に用いるべき認識辞書を自動的に設定するために、前述した言語−認識辞書対応表109を記憶部104に備えている。言語−認識辞書対応表109は、図3に示すように、言語301と該言語に対する認識辞書のファイル名302との対応関係を示した表である。すなわち、言語が特定された場合、言語−認識辞書対応表109を参照することにより、認識に用いるべき認識辞書を一意に決定することができる。
また、認識する前に認識対象となる識別情報を特定する必要があるが、特定する手段として、例えば、表示部107の中心に表示された「+」マークを識別情報の上に持っていけば、「+」マークの位置から近傍のスペース情報からスペース情報までの部分を一区切りの単語として自動的に特定するようにしてもよい。
また、ユーザが入力部101を利用して認識対象部分をカーソル等で直接指定できるようにしても構わないし、複数の認識対象を同時に選択できるようにしても構わない。更に、動画の場合には、動画を静止画でコマ送りできるように設定しておき、そのコマ送り画面で認識対象となる識別情報を選択できるようにしても構わない。
更に、認識対象を決定するために、ひとまず対象を決定する「仮決定」と仮決定された対象が間違っていない場合に「本決定」を行うように構成すれば、仮決定の段階で認識対象の特定に誤りがある場合に、容易に対象文字等の変更を行うことができるため、使い勝手を向上させることができる。
次に、表示部107は、例えば、LCD(Liquid Crystal Display)や有機EL(Electroluminescence)等で構成され、撮像部103により撮像された画像や画像認識部105により認識された識別情報を表示する。その他、表示部107に、例えば、電源状態、電波強度、電池残量、サーバ接続状態もしくは未読メール等の動作状態、入力した電話番号、メール宛先、メール送信文書等や、動画および静止画、着信時の発呼者の電話番号、着信メール文書、接続されたインターネット画面等の受信データの表示、また、携帯電話の機能を利用するために必要な画面を表示する。
通信部106は、他の情報処理装置とデータのやり取りを行う。基地局、ロケーションサーバおよびGPS(Global Positioning System)衛星と情報のやり取りを行い、携帯電話の位置座標を緯度・経度で取得する場合にも利用する。また、携帯電話100がインターネットや他の情報処理装置などにアクセスするための通信処理等も行う。また、通信部106は、図1に示すように1つのみを使用する場合に限らず、例えば、CDMA、EV−DO、無線LAN等の複数の通信方式を利用可能にするために複数備えても良い。
言語設定部110は、通信部106によって取得された携帯電話の位置座標を用いて、その場所(国や地域)で使用されている言語を特定し、記憶部104に保存されたソフトウェアプログラム中に存在する言語を表す変数に保存する。言語設定部110は、位置座標と、その位置座標の場所で使用されている言語との対応関係が記載された「位置−言語対応表」を保持している。
図4(a)に示すように、位置−言語対応表200は、言語201、位置座標(東経)202、位置座標(北緯)203などから構成される。例えば、取得した位置座標が(東経255°20′10″、北緯41°39′10″)であった場合、当該位置座標は位置座標(東経)205と位置座標(北緯)206の範囲内であるから、この場所で使用されている言語は英語204ということになる。なお、この方法だと、細かい長方形の領域で地球上の全ての領域を表現する必要があり、データサイズが大きくなってしまう。そこで、領域を多角形で表現することにより、それぞれ多角形の頂点の位置座標だけあれば地球上全ての領域を表現できるため、データサイズを削減することができる。例えば、図4(b)に示すように、頂点A、B、E、Dで囲まれた領域では独語、頂点B、C、Dで囲まれた領域では仏語というようになる。
また、言語を特定する方法としては、上記以外にも、携帯電話基地局から送信されてくるLAI(Location Area Identity)信号に基づいて携帯電話の位置を取得し、該携帯電話の位置に基づいて、そこで使用されている言語を特定する方法があり、特開2002−247646号公報に開示されている。
また、CPU102は、モード判定フラグを利用して、撮像モードが通常の静止画又は動画を撮像する通常撮像モードであるか、画像認識部105を利用して識別情報を認識する認識モードであるかを判定する。ここで、モード判定フラグは、例えば、記憶部104に記憶されたソフトウェアのプログラム中に存在する変数で、認識モードの場合と通常撮像モードとでは異なる値になるようにし、CPU102は、この変数に基づいて認識モードと通常撮像モードとを、例えば、入力部101による操作により切り換える。
以下、本第1実施形態では、「認識モード」と「通常撮像モード」との2種類を有する場合を考えるが、これに限定されるものではなく、それ以外にモードがあっても構わない。
A−2.第1実施形態の動作
次に、本第1実施形態における携帯電話100の処理手順を図5に示すフローチャートを参照して説明する。
まず、携帯電話100がキー入力を待つ状態(ステップS501)において、カメラ機能を起動するキー入力をCPU102が検出すると(ステップS502)、記憶部104に保存されているカメラ機能に関する変数の初期化等といったカメラ起動処理を行う(ステップS503)。その後、CPU102は、撮像モードが、「認識モード」、「通常撮像モード」のいずれかであるかを判定する。そして、「認識モード」である場合には、ステップS503において、撮像部103を起動させた後にシャッターキー等が押下されると、撮像対象物の画像データを取得し、取得された画像データを記憶部104に一時的に保存する(ステップS504)。
次に、画像認識部105が上記画像データを読み取る(ステップS505)。その後、言語設定部110が、通信部106によって取得された携帯電話の位置座標を用いて、その場所(国や地域)で使用されている言語を特定し、記憶部104に保存された言語を表す変数に言語種別情報を設定する(ステップS506)。次に、CPU102が変数から言語種別情報を読み取り、言語−認識辞書対応表109を参照して認識辞書ファイル名を特定し、当該認識辞書ファイル名を画像認識部105に渡す(ステップS507)。
次に、画像データに含まれる単語の中から、認識対象とする単語を選択すべく、表示部107の中心に表示された「+」マークに最も近接している単語を認識対象単語とする(ステップS508)。そして、CPU102は、認識対象単語として特定された単語の周囲に枠表示を行い、現在認識対象として特定されている単語が何であるかをユーザに明示する(ステップS509)。その後、画像認識部105が文字認識処理を行う。
文字認識処理では、まず、文字行抽出処理によって、画像データのどこに文字行があるかを抽出する。そして、文字行の範囲が決定したら、その文字行の中で黒画素の集合と集合との間隔が所定値以上である場合には、それらの集合はスペースによって区切られた文字列とする。すなわち、単語であると認識される。このように抽出された文字列の範囲の座標は記憶部104に保存される。
次に、画像認識部105がステップS107で取得した認識辞書ファイル名の認識辞書を用いて、指定された認識対象部分(枠内)の文字認識処理を行い(ステップS510)、認識結果を表示部107に表示する(ステップS511)。
このように、言語設定部110が特定した言語に従って、認識辞書を選択するため、ユーザが改めて認識辞書を設定する必要がなくなり、読み取った文字列の言語に応じて複数の認識辞書の中から適切な認識辞書を容易に選択することができるとともに、読み取った文字列のイメージを正しい文字情報に変換することができ、使い勝手が向上する。
なお、上述した第1実施形態では、例えば、韓国で英単語を認識する場合、自動的に韓国語の認識辞書を用いて認識することになるが、韓国語認識辞書を用いて認識できなかったら、その後に英語認識辞書などの他の言語の認識辞書を用いて認識するようにしてもよい。このようにすれば、ユーザは認識辞書の設定を変更することなく、韓国でも韓国語以外の文字が認識できるため、さらに使い勝手を向上させることができる。
B.第2実施形態
次に、本発明の第2実施形態について説明する。本第2実施形態では、図6に示すように、画像認識部105が認識辞書108の各言語に対応する認識辞書を使用した回数303や、使用時刻304を、言語−認識辞書対応表109に記載し、例えば、CPU102は、回数303を参照し、使用回数が多い順番に認識辞書を用いるよう画像認識部105に命令することもできる。同様に、使用時刻304の新しい順番に認識辞書108の各言語に対応する認識辞書を使用するようにしてもよい。こうすることにより、ユーザに最適な認識辞書の選択が可能になり、使い勝手が向上する。
C.第3実施形態
次に、本発明の第3実施形態について説明する。上述した第2実施形態では、回数303や使用時刻304に従って、認識辞書108の各言語に対応する認識辞書の使用順番を設定するようにしたが、この場合、CPU102が言語−認識辞書対応表109の回数303や使用時刻304から決定した、認識辞書108の各言語に対応する認識辞書の使用順番によっては、認識する文字によって認識時間が長くなる可能性がある。例えば、認識辞書108の各言語に対応する認識辞書の使用順番が、1.英語、2.韓国語、3.アラビア語、4.日本語、となっていた場合に、日本語を認識するためには、英語認識辞書、韓国語認識辞書、アラビア語認識辞書を用いて認識が試みられた後に、日本語認識辞書を用いて認識が行われる。
このような余計な処理を省くために、入力部101のキーに、それぞれどの認識辞書を用いて認識するかを予め設定しておくこともできる。すなわち、入力部101のキー入力があった場合には、上記回数303や使用時刻304により設定された使用順番より、キー入力を優先して、使用すべき認識辞書を決定してもよい。例えば、入力部101のうち「1」キーには英語、「2」キーには韓国語、「3」キーには日本語などと設定しておく。具体的には、図6に示すように、言語−認識辞書対応表109にキー割当て305の欄を設け、当該欄にキーの種類を表す番号などの識別子を記載しておく。
ここで、図7は、キー割当て305欄を設けた言語−認識辞書対応表109を用いて、読み取った文字列のイメージを認識する場合の処理を説明するためのフローチャートである。
まず、図5に示すステップS501〜ステップS503までと同様の処理を行い、カメラを起動する。この状態で、ユーザによって「1」キーが押下されると、CPU102が「1」キーが押下されたことを検出し(ステップS601)、CPU102は、言語−認識辞書対応表109を参照し(ステップS602)、キー割当て305の欄から「1」キーを表す識別子を検索する(ステップS603)。「1」キーを表す識別子が見つかると、当該識別子に対応付けられた認識辞書ファイル名「OCR_eng.dat」を記憶部104に保存する(ステップS604)。そして、図5のステップS504〜ステップS505と同様の処理を行った後、CPU102は、ステップS605で記憶部104に保存しておいた認識辞書ファイル名を画像認識部105に渡す。その後、図5のステップS508〜ステップS511と同様の処理を行い、認識結果を表示する。
このように、キー割当てを行うことで、認識辞書108の各言語に対応する認識辞書のうち、画像認識部105に使用させる認識辞書をユーザが特定することができる。よって、異なる言語に対応した認識辞書を使用することがないため、認識時間が短縮され、使い勝手が向上する。
なお、上述した第3実施形態において、キー割当以外にも、音声認識技術を用いて利用者の発した言葉を検出し、言語を特定するようにしてもよい。
D.第4実施形態
D−1.第4実施形態の構成
次に、本発明の第4実施形態について説明する。ここで、図8は、本発明の第4実施形態による携帯電話の構成を示すブロック図である。なお、図2に対応する部分には同一の符号を付けて説明を省略する。これまでは、文字を認識してその認識結果を表示することについて述べてきたが、本第4実施形態では、図8に示すように、携帯電話100の記憶部104に、複数の言語のそれぞれに対応する翻訳辞書111を備えることで、認識して読み取った英単語などの外国語を日本語に翻訳して表示させる。
ここでいう、翻訳辞書111には、例えば、外国語(英語やフランス語など)の単語等といった識別情報、該識別情報の日本語訳が含まれる。また、該識別情報の様々な日本語訳や使い方・用例等について詳しく書かれたホームページのURL等が含まれていてもよい。さらに、識別情報の説明であることがわかれば、絵や音などのデータでもよい。
本第2実施形態では、画像認識部105が使用する認識辞書と、認識した単語を翻訳するために使用する翻訳辞書との対応関係を示した「認識辞書−翻訳辞書対応表」を記憶部104に保存しておく。
図9に、認識辞書−翻訳辞書対応表400の内容を示す。当該認識辞書−翻訳辞書対応表400には、認識辞書ファイル名302、翻訳辞書ファイル名306の欄が設けられており、例えば、認識辞書ファイル名「OCR_eng.dat」と翻訳辞書ファイル名「TRANS_eng_jap.dic」が対応関係にあることを示している。ここで、「OCR_eng.dat」は、英語の文字(アルファベット)に対応した認識辞書であり、「TRANS_eng_jap.dic」は、英単語とその日本語訳が記載された和辞書である。画像認識部105は、認識した後に当該対応表を参照し、翻訳に使用する翻訳辞書を決定することができ、ユーザの手間を省くことができる。
D−2.第4実施形態の動作
次に、本第4実施形態における携帯電話の処理手順を図10に示すフローチャートを参照して説明する。まず、図5のステップS501〜ステップS509までと同様の処理を行い、撮像した画像中に含まれる文字の中から認識対象を決定する。その後、画像認識部105が文字認識処理を行い(ステップS701)、認識が成功したかどうかを判定する(ステップS702)。
判定する方法としては、例えば、認識対象となった文字に対する上述した所定のパラメータ値と、認識辞書108に格納されたパラメータ値との値の差が、予め定められた範囲内であった場合にその文字に対しては認識成功とするなどの方法がある。そして、認識対象として選択された文字列のうち、全ての文字に対して認識成功となれば、ステップS702において認識成功とする。なお、全ての文字が認識成功にならなくても、文字列全体の例えば8割以上の文字が認識成功となればステップS702で認識成功としてもよい。
ステップS702で認識成功とならなかった場合には、まだ使用していない認識辞書が他にもあるかどうかをCPU102が検索し(ステップS711)、見つかった場合には、その認識辞書を用いて再度文字認識処理を行う(ステップS701)。一方、使用していない認識辞書がなかった場合には、「認識失敗しました。」などといった表示を表示部107に表示する(ステップS712)。
一方、ステップS702で認識成功となった場合には、CPU102が認識結果を記憶部104に保存する(ステップS703)。また、使用した認識辞書ファイル名をCPU102が記憶部104に保存する(ステップS704)。そして、CPU102は、認識辞書−翻訳辞書対応表400の認識辞書ファイル名302の欄を参照し、記憶部104に保存された認識辞書ファイル名と一致するファイル名を検索し、一致するファイル名が見つかった場合には、当該認識辞書ファイル名に対応付けられた翻訳辞書ファイル名を取得する(ステップS705)。
次に、画像認識部105によって認識された認識結果をCPU102が記憶部104から読み取り、CPU102は、ステップS705において取得した翻訳辞書ファイル名のファイルにアクセスする。そして、当該翻訳辞書に含まれる単語データの中から、認識結果と一致する単語を検索する(ステップS706)。
単語を検索する方法としては、まず文字列が完全に一致するものを探し出し、完全に一致するものがなかった場合には、一文字だけ異なるがその他の文字は一致している単語を探し出すという方法が好ましい。この方法を採用することで、画像認識部105が紙面上の文字を誤って認識した場合でも、その文字列に一番近い単語を探し出すことができ、何度も撮像して文字認識をやり直す手間が省くことができる。また、一文字だけ異なる単語もない場合には、二文字だけ異なる単語、三文字だけ異なる単語、というように異なる文字数をだんだん増やして検索してもよく、この場合、認識率が低くても該当する単語を探し出すことができる。
上記検索によって翻訳辞書内に一致する単語が見つかった場合には、CPU102は、その単語に対応する日本語訳を、翻訳辞書111の対応する言語の翻訳辞書から読み取って(ステップS708)、表示部107に日本語訳を表示する(ステップS709)。一方、翻訳辞書内に一致する単語が見つからなかった場合には、「該当する単語が見つかりません」などといった表示を表示部107に表示する(ステップS712)。
このようにして、本第4実施形態における携帯電話では、ユーザがいちいち翻訳辞書を設定し直すことなく、複数の言語に対する日本語訳を連続して表示することができる。
なお、認識辞書−翻訳辞書対応表400の翻訳辞書ファイル名331の欄は、言語−認識辞書対応表109に欄を追加して記載してもよい。こうすることで、CPU102が参照する表が少なくなり、記憶部104の容量の削減や、ソフトウェア構造の簡単化ができる。
また、認識辞書−翻訳辞書対応表400は、携帯電話100の記憶部104に新たに翻訳辞書が保存された際に、翻訳辞書ファイル名331、認識辞書ファイル名302のそれぞれの欄に値が入力されることが好ましい。値の入力は、ユーザによって入力部101から入力されるようにしてもよい。その際、表示部107には、ユーザへの入力を促すメッセージを表示することが好ましい。例えば、図11(a)のように、記憶部104に保存されている認識辞書のファイル名一覧802を表示しておく。ユーザは、ファイル名に対応する番号の数字キーを押下することで、認識辞書を選択できるようにする。ユーザによって、例えば「1」キーが押下されると、図11(b)のように、「TRANS_eng_jap.dic」と「OCR_eng.dat」とを対応付けたことをユーザに知らせるメッセージを表示する。
また、翻訳辞書のフォーマットを決めて、予め定められた場所(例えばファイルの先頭など)に対応する認識辞書を現す認識辞書識別子を格納しておく。そして、新たな翻訳辞書が記憶部104に保存された際に、翻訳辞書に格納された当該認識辞書識別子をCPU102が参照し、認識辞書−翻訳辞書対応表400に値の入力を行うようにしてもよい。
E.第5実施形態
次に、本発明の第5実施形態について説明する。上述した第4実施形態では、1つの認識辞書に対して1つの翻訳辞書が決定される場合を考えてきたが、本第5実施形態では、それぞれの認識言語に対して、複数の言語の各々に対応する複数の翻訳辞書を設け、認識した文字列を、複数の翻訳辞書のいずれか1つを用いて翻訳する場合について説明する。どの翻訳辞書を用いるか、すなわちどの言語に翻訳するかは、位置情報に基づいてその場所で用いられる言語を特定し、該言語に対応する翻訳辞書を用いて、認識した文字列を翻訳するようになっている。
例えば、英語を認識した場合には、英語から日本語に翻訳する英和辞書、英語から韓国語に翻訳する英韓辞書、英語からドイツ語に翻訳する英独辞書などがある。そのため、ユーザは、翻訳する際にどの翻訳辞書を用いて翻訳するかを選択する必要がある。また、予め使用する翻訳辞書を設定しておけば、認識する毎に選択する手間は省けるが、上述したように、例えば、韓国・日本間を頻繁に行き来するユーザがいて、頻繁に英韓辞書と英和辞書を使用する場合には、使用する翻訳辞書を頻繁に設定する必要があり、手間がかかってしまう。
そこで本第5実施形態では、携帯電話100の位置情報を取得し、該位置情報からその場所で使用されている言語を特定し、認識した文字列を特定した言語に翻訳する。そのために、図12に示すように、翻訳辞書ファイル名901、被翻訳言語902、翻訳言語903を対応付けた対応表900を記憶部104に保持する。そして、CPU102は、言語設定部110によって設定された言語に基づいて対応表900を参照し、使用する翻訳辞書を設定する。ここで、被翻訳言語902とは、翻訳される単語の言語を表す識別子であり、例えば、「英語」905である。また、翻訳言語903とは、翻訳する際に使用する言語を表す識別子であり、例えば、「日本語」906である。翻訳辞書ファイル名901は、被翻訳言語902から翻訳言語903へ翻訳するための翻訳辞書のファイル名であり、例えば、「TRANS_eng_jap.dic」904は、「英語」905の単語と、当該単語に対応する「日本語」906の意味とが記載された辞書である。
本第5実施形態では、画像認識部105がユーザ指定による言語に対応する認識辞書を用いて、読み込んだ文字列のイメージを認識した後、使用した認識辞書と言語−認識辞書対応表109とから、被翻訳言語を決定する。具体的には、被翻訳言語を表すプログラム上の変数Lang_inに認識対象の単語の言語を代入する。例えば、使用した認識辞書がOCR_eng.datであった場合、言語−認識辞書対応表109から言語は「英語」となり、変数Lang_inには英語が代入される。次に、言語設定部110が位置情報に従って設定した言語を、翻訳言語を表すプログラム上の変数Lang_outに代入する。そして、CPU102は、変数Lang_inと変数Lang_outを読み取り、それぞれが対応表900の被翻訳言語902、翻訳言語903と等しくなる翻訳辞書ファイル名を検索する。検索の結果見つかった場合には、その翻訳辞書ファイル名のファイルにアクセスし、単語の翻訳を検索する。こうすることで、ユーザはいちいち設定する手間が省けて、使い勝手が向上する。
なお、対応表900は、携帯電話100の記憶部104に新たに翻訳辞書が保存された際に、翻訳辞書ファイル名901、認識文字言語902、翻訳言語903のそれぞれの欄に値が入力されることが好ましい。値の入力は、ユーザによって入力部101から入力されるようにしてもよい。その際、表示部107にはユーザへの入力を促すメッセージを表示することが好ましい。また、翻訳辞書のフォーマットを決めて、翻訳辞書の予め定められた場所、例えばファイルの先頭などに被翻訳言語と翻訳言語を格納するようにしておき、当該場所をCPU102が参照して、対応表900に値の入力を行うようにしてもよい。
図13(a)は、本第5実施形態の携帯電話100で日本語が話されている場所において、英単語を認識し、その翻訳を表示した際の画面表示例である。枠1001によって囲まれた「thank」という英単語が、認識対象の単語であることを示しており、その翻訳結果が結果表示部1002に表示されている。日本語圏であるので、「ありがとう」1003と表示されている。また、図13(b)は、携帯電話100で中国語が話されている場所において、図13(a)と同様に翻訳結果を表示した際の画面表示例である。翻訳結果は、中国語で「謝謝」と表示されている。
また、地域によっては、複数の言語が使用されている。例えば、カナダでは英語とフランス語、インドでは英語とヒンズー語などが使用されている。その場合、どの言語で翻訳するかをユーザに選択させるようにすれば、さらに使い勝手が向上する。なお、この場合、図3に示す位置―言語対応表200において、位置情報に対して、その場所で使用されている少なくとも1つ以上の言語が設定されているものとする。すなわち、複数の言語が使用されている場所を示す位置情報には、複数の言語を設定しておく。
図14にその画面表示例を示す。図14(a)は、「now」という単語が認識対象単語になったことを示している。この状態でユーザが「選択」キーを押下すると、図14(b)に遷移する。図14(b)は、ユーザにどの言語で翻訳するかを選択させる画面である。この状態で、例えば「1」キーを押下すると、日本語に翻訳するように設定され、図14(c)に遷移する。図14(c)は、認識対象の単語「now」を日本語に翻訳した結果を示した画面である。翻訳結果表示部1104に認識対象単語「now」の訳が日本語で表示されている。
また、認識した単語の翻訳結果を表示したあと、辞書アプリケーションなどのサイトに接続し、認識単語の詳細な意味や様々な使用方法などを閲覧するようにしてもよい。具体的には、翻訳結果が表示部107に表示された状態において、ユーザによって入力部101に入力があったら、サイトに接続してサイトの内容を表示部107に表示する。この場合、接続するサイトのURLを決定する際に、携帯電話100の位置情報を使用してもよい。
具体的には、対応表900に、サイトURL(図示せず)の欄を追加して、それぞれの翻訳辞書ファイルに対応したURL(の一部)を記載しておく。例えば、翻訳辞書ファイルTRANS_eng_jpa.dicに対応するサイトのURL(の一部)は、「http://xxx.???.com/english-japanese/」とする。そして、当該サイトのURL(の一部)と画像認識部105が認識した単語とを用いて、接続するURLをCPU102が作成する。CPU102によって作成されたURLに通信部106が接続し、当該URLの内容を表示部107に表示する。例えば、「mobile」という単語を認識した場合は、接続するURLは「http://xxx.???.com/english-japanese/mobile.html」などのようになる。
なお、上述した実施形態では、認識辞書、翻訳辞書は、1ファイルにつき1つの言語として説明してきたが、複数の言語をまとめて1つのファイルにしてもよい。例えば、先頭から英語認識辞書、日本語認識辞書、韓国語認識辞書、といったようにまとめて1つのファイルとして格納する。そして、対応表には認識辞書の代わりに、ファイルのどの部分に認識辞書が格納されているかを表すデータを記載しておく。例えば、日本語認識辞書がファイルの先頭から1500バイト目から格納されている場合、対応表には、ファイル名と共に「1500」と記載しておく。これで、日本語認識辞書を使用したい場合は、ファイルの1500バイト目からアクセスすればよい。これにより、複数の認識辞書や翻訳辞書がまとめられたファイルにも対応でき、使い勝手が向上する。
なお、上述してきた種々の機能をソフトウェアで実現してもよく、ユーザは、例えば、CD―ROM等の記録媒体やサーバから当該ソフトウェアを受信して当該種々の機能を実現できる。これにより、必要な機能だけを搭載したり、また、好みに応じて色々な機能を追加もしくは削除、あるいは更新したりすることが容易となる。
更に、上述した実施例を組み合わせて新しく実施形態を構成することができることは言うまでもない。
また、本発明は、上記に示された実施例に限定されるものではなく、ここに開示された原理及び特性を用いた多様な実施例が存在する。
本発明による携帯電話100の外観を示す模式図である。 本発明の第1実施形態に係る携帯電話の構成を示すブロック図である。 本第1実施形態による言語−認識辞書対応表109の内容を示す概念図である。 本第1実施形態による位置−言語対応表の内容を示す概念図である。 本第1実施形態に係る携帯電話の処理を説明するためのフローチャートである。 本発明の第2、第3実施形態による言語−認識辞書対応表109の内容を示す概念図である。 本第3実施形態に係る携帯電話の処理を説明するためのフローチャートである。 本発明の第4実施形態に係る携帯電話の構成を示すブロック図である。 本第4実施形態による認識辞書−翻訳辞書対応表400の内容を示す概念図である。 本第4実施形態に係る携帯電話の処理を説明するためのフローチャートである。 本第4実施形態に係る携帯電話の画面表示例を示す模式図である。 本発明の第5実施形態に係る対応表900の内容を示す概念図である。 本第5実施形態に係る携帯電話の画面表示例を示す模式図である。 本第5実施形態に係る携帯電話の他の画面表示例を示す模式図である。
符号の説明
100 携帯電話
101 入力部(指示手段)
102 CPU(認識辞書決定手段、翻訳辞書決定手段、翻訳手段)
103 撮像部(撮像手段)
104 記憶部
105 画像認識部(認識手段)
106 通信部(位置情報取得手段)
107 表示部
108 認識辞書
109 言語−認識辞書対応表(認識辞書使用順番表)
110 言語設定部(言語特定手段)
111 翻訳辞書
200 位置−言語対応表
400 認識辞書−翻訳辞書対応表

Claims (19)

  1. 画像情報を撮像する撮像手段と、
    前記撮像手段により撮像された画像情報に含まれる識別情報を認識する際に用いられ、複数の言語に対応した認識辞書と、
    前記画像情報に含まれる識別情報の言語を特定する言語特定手段と、
    前記言語特定手段により特定された言語に基づいて、画像情報に含まれる識別情報を認識する際に用いる認識辞書を決定する認識辞書決定手段と、
    前記認識辞書決定手段により決定された認識辞書を用いて、前記撮像手段により撮像された画像情報に含まれる識別情報を認識する認識手段と
    を具備することを特徴とする情報処理装置。
  2. 位置情報を取得する位置情報取得手段を具備し、
    前記言語特定手段は、前記位置情報取得手段により取得された位置情報に基づいて使用する言語を特定することを特徴とする請求項1記載の情報処理装置。
  3. 位置情報と該位置情報で示される場所で使用されている言語とを対応付けて記憶する位置−言語対応表を具備し、
    前記言語特定手段は、前記位置情報取得手段により取得された位置情報を用いて、前記位置−言語対応表を参照して使用する言語を特定することを特徴とする請求項2記載の情報処理装置。
  4. 複数の言語とそれぞれの言語が前記言語特定手段により特定された場合に認識に用いるべき認識辞書とを対応付けて記憶する言語−認識辞書対応表を具備し、
    前記認識手段は、前記言語特定手段により特定された言語を用いて、前記言語−認識辞書対応表を参照して、認識に用いるべき認識辞書を特定し、該特定された認識辞書を用いて、前記撮像手段により撮像された画像情報に含まれる識別情報を認識することを特徴とする請求項1記載の情報処理装置。
  5. 画像情報を撮像する撮像手段と、
    前記撮像手段により撮像された画像情報に含まれる識別情報を認識する際に用いられ、複数の言語に対応した認識辞書と、
    前記複数の言語に対応した認識辞書の使用順番を記載した認識辞書使用順番表と、
    前記認識辞書使用順番表の使用順番に従った認識辞書を用いて、前記撮像手段により撮像された画像情報に含まれる識別情報を認識する認識手段と
    を具備することを特徴とする情報処理装置。
  6. 前記認識辞書の使用順番は、それぞれの認識辞書の使用回数順であることを特徴とする請求項5記載の情報処理装置。
  7. 前記認識辞書の使用順番は、それぞれの認識辞書の最新使用時刻の若い順であることを特徴とする請求項5記載の情報処理装置。
  8. 画像情報を撮像する撮像手段と、
    前記撮像手段により撮像された画像情報に含まれる識別情報を認識する際に用いられ、複数の言語に対応した認識辞書と、
    前記複数の言語に対応した認識辞書のうち、どの認識辞書を用いるかを指示する指示手段と、
    前記指示手段による指示に従った認識辞書を用いて、前記撮像手段により撮像された画像情報に含まれる識別情報を認識する認識手段と
    を具備することを特徴とする情報処理装置。
  9. 前記識別情報に関連する関連情報が記載され、複数の言語に対応した翻訳辞書と、
    前記認識手段によって用いられた認識辞書に基づいて、前記複数の言語に対応した翻訳辞書の中から、使用する翻訳辞書を決定する翻訳辞書決定手段と、
    前記翻訳辞書決定手段により決定された翻訳辞書を用いて、前記認識手段により認識された識別情報に含まれる識別情報を翻訳する翻訳手段と
    を具備することを特徴とする請求項1記載の情報処理装置。
  10. 画像情報を撮像する撮像手段と、
    前記撮像手段により撮像された画像情報に含まれる識別情報を認識する認識手段と、
    前記識別情報に関連する関連情報が記載され、複数の言語に対応した翻訳辞書と、
    翻訳言語を特定する翻訳言語特定手段と、
    前記翻訳言語特定手段によって特定された翻訳言語に基づいて、前記複数の言語に対応した翻訳辞書の中から、使用する翻訳辞書を決定する翻訳辞書決定手段と、
    前記翻訳辞書決定手段により決定された翻訳辞書を用いて、前記認識手段により認識された識別情報に含まれる識別情報を翻訳する翻訳手段と
    を具備することを特徴とする情報処理装置。
  11. 位置情報を取得する位置情報取得手段を具備し、
    前記翻訳言語特定手段は、前記位置情報取得手段により取得された位置情報に基づいて使用する翻訳言語を特定することを特徴とする請求項10記載の情報処理装置。
  12. 前記複数の言語に対応した翻訳辞書のうち、どの翻訳辞書を用いるかを指示する指示手段を具備し、
    前記翻訳手段は、前記指示手段による指示に従った翻訳辞書を用いて、前記認識手段により認識された識別情報に含まれる識別情報を翻訳することを特徴とする請求項10記載の情報処理装置。
  13. 通信手段と、
    前記認識手段により認識された識別情報に関連した関連情報の参照を指示する関連情報参照指示部と、
    前記関連情報参照指示部により前記関連情報の参照が指示された場合、前記認識手段により認識された識別情報に基づいて、前記関連情報を前記通信手段を介して取得する関連情報取得手段と
    を具備することを特徴とする請求項10ないし12のいずれかに記載の情報処理装置。
  14. 位置情報を取得し、取得された位置情報に基づいて認識に用いる言語を特定し、特定された言語に基づいて、複数の言語に対応した認識辞書の中から、撮像された画像情報に含まれる識別情報を認識する際に用いる認識辞書を決定し、決定された認識辞書を用いて、撮像された画像情報に含まれる識別情報を認識することを特徴とする情報処理方法。
  15. 撮像された画像情報に含まれる識別情報を認識する際に用いられ、複数の言語に対応した認識辞書に対して、認識辞書の使用順番を設定しておき、複数の言語に対応した認識辞書の中から、使用順番に従った認識辞書を用いて、撮像された画像情報に含まれる識別情報を認識することを特徴とする情報処理方法。
  16. 撮像された画像情報に含まれる識別情報を認識する際に用いられ、複数の言語に対応した認識辞書に対して、指示入力に従って用いるべき認識辞書を設定しておき、外部からの指示に従った認識辞書を用いて、撮像された画像情報に含まれる識別情報を認識することを特徴とする情報処理方法。
  17. 位置情報を取得し、取得された位置情報に基づいて翻訳に用いる翻訳言語を特定し、特定された翻訳言語に基づいて、複数の言語に対応した翻訳辞書の中から、使用する翻訳辞書を決定し、決定された翻訳辞書を用いて、認識された識別情報に含まれる識別情報を翻訳することを特徴とする情報処理方法。
  18. 画像情報を撮像するステップと、
    位置情報を取得するステップと、
    取得された位置情報に基づいて認識に用いる言語を特定するステップと、
    特定された言語に基づいて、複数の言語に対応した認識辞書の中から、撮像された画像情報に含まれる識別情報を認識する際に用いる認識辞書を決定するステップと、
    決定された認識辞書を用いて、撮像された画像情報に含まれる識別情報を認識するステップと
    をコンピュータに実行させることを特徴とする情報処理プログラム。
  19. 画像情報を撮像するステップと、
    位置情報を取得するステップと、
    取得された位置情報に基づいて翻訳に用いる翻訳言語を特定するステップと、
    特定された翻訳言語に基づいて、複数の言語に対応した翻訳辞書の中から、使用する翻訳辞書を決定するステップと、
    決定された翻訳辞書を用いて、認識された識別情報に含まれる識別情報を翻訳するステップと
    をコンピュータに実行させることを特徴とする情報処理プログラム。
JP2004269950A 2004-09-16 2004-09-16 携帯端末、情報処理方法及び情報処理プログラム Expired - Fee Related JP5150035B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004269950A JP5150035B2 (ja) 2004-09-16 2004-09-16 携帯端末、情報処理方法及び情報処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004269950A JP5150035B2 (ja) 2004-09-16 2004-09-16 携帯端末、情報処理方法及び情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2006085461A true JP2006085461A (ja) 2006-03-30
JP5150035B2 JP5150035B2 (ja) 2013-02-20

Family

ID=36163919

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004269950A Expired - Fee Related JP5150035B2 (ja) 2004-09-16 2004-09-16 携帯端末、情報処理方法及び情報処理プログラム

Country Status (1)

Country Link
JP (1) JP5150035B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010218041A (ja) * 2009-03-13 2010-09-30 Omron Corp 携帯式文字認識装置、文字認識プログラム及び文字認識方法
JP2011118531A (ja) * 2009-12-01 2011-06-16 Brother Industries Ltd ヘッドマウントディスプレイ
JP2011138473A (ja) * 2010-06-08 2011-07-14 Square Enix Co Ltd リアルタイムなカメラ辞書
JP2011141750A (ja) * 2010-01-07 2011-07-21 Nec Corp データ翻訳装置、データ翻訳システム、データ翻訳方法およびプログラム
JP4790080B1 (ja) * 2010-10-01 2011-10-12 株式会社スクウェア・エニックス 情報処理装置,情報表示方法,情報表示プログラム,及び記録媒体
JP2014503098A (ja) * 2011-01-06 2014-02-06 クアルコム,インコーポレイテッド 移動局に翻訳情報サービスを提供する際に使用するための方法および装置
JP2016519797A (ja) * 2013-03-15 2016-07-07 トランスレート アブロード,インコーポレイテッド 外国語の文字セットおよびそれらの翻訳を資源に制約のあるモバイル機器上にリアルタイムで表示するためのシステムおよび方法
JP7493256B2 (ja) 2022-07-27 2024-05-31 アスエネ株式会社 温室効果ガス排出量管理方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63265377A (ja) * 1986-12-19 1988-11-01 Ricoh Co Ltd 光学文字読取装置における辞書作成方法
JPH05274346A (ja) * 1991-09-13 1993-10-22 Casio Comput Co Ltd 電子辞書
JP2004050585A (ja) * 2002-07-19 2004-02-19 Canon Inc Gps内蔵プリンタおよびデータサーバ
JP2004118281A (ja) * 2002-09-24 2004-04-15 Fujitsu Social Science Laboratory Ltd 抽出文字列辞書検索装置及び方法並びにプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63265377A (ja) * 1986-12-19 1988-11-01 Ricoh Co Ltd 光学文字読取装置における辞書作成方法
JPH05274346A (ja) * 1991-09-13 1993-10-22 Casio Comput Co Ltd 電子辞書
JP2004050585A (ja) * 2002-07-19 2004-02-19 Canon Inc Gps内蔵プリンタおよびデータサーバ
JP2004118281A (ja) * 2002-09-24 2004-04-15 Fujitsu Social Science Laboratory Ltd 抽出文字列辞書検索装置及び方法並びにプログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010218041A (ja) * 2009-03-13 2010-09-30 Omron Corp 携帯式文字認識装置、文字認識プログラム及び文字認識方法
JP2011118531A (ja) * 2009-12-01 2011-06-16 Brother Industries Ltd ヘッドマウントディスプレイ
JP2011141750A (ja) * 2010-01-07 2011-07-21 Nec Corp データ翻訳装置、データ翻訳システム、データ翻訳方法およびプログラム
JP2011138473A (ja) * 2010-06-08 2011-07-14 Square Enix Co Ltd リアルタイムなカメラ辞書
JP4790080B1 (ja) * 2010-10-01 2011-10-12 株式会社スクウェア・エニックス 情報処理装置,情報表示方法,情報表示プログラム,及び記録媒体
JP2014503098A (ja) * 2011-01-06 2014-02-06 クアルコム,インコーポレイテッド 移動局に翻訳情報サービスを提供する際に使用するための方法および装置
JP2016519797A (ja) * 2013-03-15 2016-07-07 トランスレート アブロード,インコーポレイテッド 外国語の文字セットおよびそれらの翻訳を資源に制約のあるモバイル機器上にリアルタイムで表示するためのシステムおよび方法
JP7493256B2 (ja) 2022-07-27 2024-05-31 アスエネ株式会社 温室効果ガス排出量管理方法

Also Published As

Publication number Publication date
JP5150035B2 (ja) 2013-02-20

Similar Documents

Publication Publication Date Title
US7305435B2 (en) Internet access via smartphone camera
US20050052558A1 (en) Information processing apparatus, information processing method and software product
KR100664421B1 (ko) 구비된 카메라를 이용한 명함 인식을 위한 휴대용 단말기및 명함 인식 방법
JP4038771B2 (ja) 携帯型情報端末装置および情報処理方法、記録媒体、並びにプログラム
US20120027301A1 (en) Method, device and computer program product for integrating code-based and optical character recognition technologies into a mobile visual search
CN1832513A (zh) 包括用于字符识别的数字摄像头的无线电信终端及其网络
JP2008046893A (ja) 携帯通信端末、情報取得方法及び情報取得プログラム
JP2007018166A (ja) 情報検索装置、情報検索システム、情報検索方法及び情報検索プログラム
US20110305406A1 (en) Business card recognition system
JP5150035B2 (ja) 携帯端末、情報処理方法及び情報処理プログラム
US20140044377A1 (en) Shot image processing system, shot image processing method, mobile terminal, and information processing apparatus
JP2016058057A (ja) 翻訳システム、翻訳方法、コンピュータプログラム、コンピュータが読み取り可能な記憶媒体
JP2010205121A (ja) 情報処理装置および携帯端末
KR20130096796A (ko) 전자책의 리소스 검색 장치 및 방법
JP2004038840A (ja) メモ画像管理装置、メモ画像管理システムおよびメモ画像管理方法
US8509749B2 (en) Mobile communication apparatus and operating method thereof
JP2006221337A (ja) 電子文書提供サーバ、電子文書提供システム、および電子文書提供方法
KR101009974B1 (ko) 코드 패턴을 이용한 지리 정보 제공장치 및 그 방법
JP5670030B2 (ja) 携帯端末、カーナビゲーション装置設定システム及びカーナビゲーション設定方法
JP2016024410A (ja) ガイドマップ及び案内支援システム
JP2003152829A (ja) 通信機
KR102032256B1 (ko) 멀티미디어 데이터의 태깅 방법 및 장치
JP6874988B2 (ja) リンク情報提供方法
JP2006106947A (ja) 辞書検索システム、携帯情報端末および辞書検索方法
JP2012079191A (ja) コードリーダ及びナビゲーションシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070528

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100506

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100607

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20100723

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110107

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110629

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110922

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20110930

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20111202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121019

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121203

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151207

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151207

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151207

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees