JP2010218041A - 携帯式文字認識装置、文字認識プログラム及び文字認識方法 - Google Patents

携帯式文字認識装置、文字認識プログラム及び文字認識方法 Download PDF

Info

Publication number
JP2010218041A
JP2010218041A JP2009061750A JP2009061750A JP2010218041A JP 2010218041 A JP2010218041 A JP 2010218041A JP 2009061750 A JP2009061750 A JP 2009061750A JP 2009061750 A JP2009061750 A JP 2009061750A JP 2010218041 A JP2010218041 A JP 2010218041A
Authority
JP
Japan
Prior art keywords
character
recognized
misidentified
character recognition
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009061750A
Other languages
English (en)
Other versions
JP5223739B2 (ja
Inventor
Chitei Aizawa
知禎 相澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp, Omron Tateisi Electronics Co filed Critical Omron Corp
Priority to JP2009061750A priority Critical patent/JP5223739B2/ja
Publication of JP2010218041A publication Critical patent/JP2010218041A/ja
Application granted granted Critical
Publication of JP5223739B2 publication Critical patent/JP5223739B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephone Function (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】手軽な操作で正確な文字認識を実現する携帯式文字認識装置、文字認識プログラム、及び文字認識方法を提供する。
【解決手段】携帯端末1を用い、画像取得して文字認識する際に設定された対象言語及びカメラ撮影モードと、前記文字認識処理によって文字認識した位置の位置情報を関連付けて記憶し(ステップS12)、文字認識する位置が既に記憶されているか確認し(ステップS2)、既に記憶された位置で再度文字認識する際に、位置情報に関連付けられた対象言語及びカメラ撮影モードの設定内容を読み出し、同条件に設定する条件設定処理を実行した(ステップS13,14)。
【選択図】図4

Description

この発明は、例えば画像データに含まれている文字を認識するような携帯式の文字認識装置、文字認識プログラム、及び文字認識方法に関する。
従来から、名刺読取や翻訳リーダーなど様々な文字認識を利用したアプリケーションがある。
一般に、利用者はこれらのアプリケーションを利用する場合、認識したい対象の文字を画像として取得して、取得した画像の中から文字を認識する。
より正確に文字認識を行うために、利用者は、予め対象言語を設定するとともに、画像を取得するためのライトやマクロレンズ使用の有無やズーム度合いなどのカメラ撮影モードを調整して、文字認識するために適した画像を取得するための設定をする。
ところで、一般に、利用者は、場所(位置)に応じて、おおよそ決まった目的で同じアプリケーションを使用することが多く、よって、対象言語やカメラ撮影モードについて同様の設定をすることが多いと考えられる。
例えば、日本人の利用者が出張や旅行で中国に行き、レストランでメニューに何と書いてあるかを確認する際に、対象言語を中国語に設定して、例えばライトは点灯でマクロレンズを使用するカメラ撮影モードにし、認識したい文字列の大きさがアプリケーションで求められる所定の範囲内の大きさになるようにズーム度合いを調整する。
繰り返し同じ場所(位置)に出張や旅行に行き、例えば「前回行ったときにおいしかったから」といった理由で同じレストランに行き、同じアプリケーションを再度使用する際、利用者は同様の設定をする必要がある。
また、空港などの公共施設において、案内板に何と書いてあるかを確認する際に、利用者は対象言語を中国語に設定して、例えばライトは点灯せずマクロモードも使用しないカメラ撮影モードにし、認識したい文字列の大きさがアプリケーションで求められる所定の範囲内の大きさになるようにズーム度合いを調整する。同様に、繰り返し同じ場所(位置)に行き、同じアプリケーションを再度使用する際に、利用者は同様の設定をする必要がある。
上述したように、一般に、利用者は、対象言語やカメラ撮影モードについて、場所(位置)に応じておおよそ決まった設定をすることが多いと考えられるが、利用者は、アプリケーションを使用しようとするたびに、同様の面倒な手間をかけて同じ設定をする必要があった。
そのような状況において、GPS装置を用いて現在位置を取得し、位置情報に基づいて文字認識に関する設定を行う装置が提案されている(特許文献1、2参照)。
特許文献1の携帯端末は、アプリケーションへの文字入力のための文字認識において、GPS装置を用いて現在位置を取得し、現在位置から読み取る文字の文字種を設定する装置である。この装置は、GPS装置で取得された現在位置に基づいて文字種が自動的に設定されるため、利用者による操作を軽減することができる。
特許文献2の翻訳装置は、GPS装置を用いて現在位置を取得し、現在位置で使用されている文字種を文字認識において優先させる装置である。この装置は、GPS装置で取得された現在位置に基づいて特定された文字種が優先的に認識しやすくなるため、認識精度を向上させることができる。
これらの装置は、取得した画像から文字認識処理する際のソフトウェア上の設定をおこなうものであり、明確に取得された画像に対しては効果的に文字認識を処理することができる。
しかしながら、これらの装置は明確な画像を取得するためのライトやマクロレンズ使用の有無やズーム度合いなどのカメラ撮影モード、いわゆる、ハードウェア上の設定に関する手間が全く軽減されない。
また、このハードウェア上の設定は、認識精度にも大きく影響を与えるものである。このため上述の装置は、例えば、同じ場所(位置)で以前使用した際にはマクロレンズを使用する設定にしていたにもかかわらず、その設定をしなかったために、以前は良く認識できていたものが認識できなくなってしまったりするという問題があった。
このように文字認識処理は、取得された画像の精度に大きく影響を受ける。このため、取得画像に大きな影響を与えるカメラ撮影モードなどのハードウェア上の設定は重要である。そして、上述の装置は利用者にとって面倒な設定作業を要していた。
特開2005−141520号公報 特開2006−302091号公報
この発明は、上述した問題に鑑み、手軽な操作で正確な文字認識を実現する携帯式文字認識装置、文字認識プログラム、及び文字認識方法を提供し、利用者の満足度を向上させることを目的としている。
この発明は、文字認識用のマッチングデータを記憶するマッチングデータ記憶手段と、画像データを取得し、前記マッチングデータに基づいて前記画像データ内の文字を認識する文字認識手段と、位置情報を取得する位置情報取得手段とを備えた携帯式文字認識装置であって、前記文字認識手段が画像取得して文字認識する際に設定された設定条件情報と、前記文字認識手段によって文字認識した位置の前記位置情報とを関連付けて記憶する関連情報記憶手段と、前記文字認識手段によって文字認識する位置が前記関連情報記憶手段に記憶されているか確認する記憶位置確認手段と、前記関連情報記憶手段に記憶された位置で前記文字認識手段が文字認識する際に、前記位置情報に関連付けられた前記設定条件情報を読み出して前記文字認識手段に設定する条件設定手段とを備えたことを特徴とする。
前記マッチングデータは、文字の特徴を示す特徴データで構成するなど、文字認識のマッチングに用いるデータで構成することができる。
前記記憶手段は、ハードディスクや不揮発性メモリなど、データを記憶する手段で構成することができる。
前記画像データは、カラー画像やグレースケール画像やモノクロ2階調画像など、適宜の画像のデータとすることができる。
前記位置情報を取得する位置情報取得手段は、GPS装置や、定点からの無線通信を受信して位置を特定する装置等ができる。
前記文字認識手段は、例えば、CCDカメラやCMOSカメラなどの撮像手段、あるいは、このような撮像手段で撮像した画像のデータを該撮像手段から受信するUSB(Universal Serial Bus)やLAN(Local Area Network)などの通信インターフェースを介して取得された文字画像から特徴データを抽出し、特徴データをマッチングデータの特徴データとマッチングし、どの文字かを認識する手段とすることができる。
前記設定条件情報は、前記文字認識手段が画像取得して文字認識する際に設定する設定条件であり、認識する文字の文字種等のソフトウェア上の設定条件、画像を取得するための撮像手段に関し、ライトやマクロレンズ使用の有無やズーム度合いなどのカメラ撮影モード、いわゆる、ハードウェア上の設定条件とで構成することができる。
前記携帯式文字認識装置は、撮像手段と制御手段と記憶手段とを備えた携帯電話機やPDA(Personal Digital Assistants)やノート型のパーソナルコンピュータなどの情報処理端末で構成するなど、適宜の装置で構成することができる。
この発明により、画像データに対して手軽な操作で正確な文字認識を実現することができ、利用者の満足度を向上させることができる。
詳しくは、文字認識した際に設定した設定条件情報を位置情報取得手段で取得した位置情報と関連付けて記憶しているため、再度、同じ場所(位置)で文字認識する際に、同じ設定条件を読み出して設定できる。したがって、手間を掛けて同じ条件を設定せずとも、前回と同条件で文字認識を実施することができる。
なお、位置情報取得手段によって取得した位置情報に基づいて判定される同じ場所(位置)は、所定の範囲であれば同じ場所(位置)と判定する概念とすることができ、また所定の範囲については任意で設定する構成であってもよい。
この発明の態様として、取得した前記画像データから前記文字認識手段によって認識した認識文字において誤認識であった誤認文字を正しい文字に変更する変更操作を受け付け、変更文字に変更する認識文字変更手段と、前記誤認文字情報と、変更された変更文字情報とを誤認文字変更情報として前記位置情報と関連づけて記憶する誤認文字変更情報記憶手段とを備え、前記記憶位置確認手段によって確認され、前記関連情報記憶手段に記憶された位置で前記文字認識手段が認識した認識文字が、前記誤認文字変更情報記憶手段に誤認文字情報として記憶されているか確認する誤認文字確認手段と、該誤認文字確認手段によって前記認識文字が前記誤認文字変更情報記憶手段に記憶された前記誤認文字と一致すると確認された場合に、前記誤認文字変更情報に基づいて前記変更文字に補正する文字補正手段を備えることができる。
前記認識文字は、文字認識手段によって撮像した画像データ中の文字画像から認識した文字であり、例えばひらがな、カタカナ、漢字、またはこれらの複数など、予め定めた適宜の文字とすることができる。
前記誤認文字は、文字認識手段によって撮像した画像データ中の文字画像から認識した認識文字のうち誤認識した文字であり、前記変更文字は、誤認文字を正しく変更した文字である。
この発明により、以前に誤認文字を変更文字に変更した場所(位置)において、誤認文字と同じ文字を認識した場合に、認識した文字を変更文字に補正することができる。したがって、再度、同じ場所(位置)で誤認文字と同じ文字を認識した場合に、変更操作することなく変更後の正しい文字に補正することができ、利用者の利便性が向上する。
また、この発明の態様として、前記文字補正手段を、前記文字認識手段が認識する認識文字の前記誤認文字に対するマッチング信頼度が第1の所定範囲にあり、かつ、前記変更文字に対するマッチング信頼度が第2の所定範囲にある場合に、前記文字認識手段が認識した認識文字を前記変更文字に補正する構成とすることができる。
これにより、誤認文字と同じ文字を認識した場合に、正しく変更文字に補正する補正の精度を向上し、正確な文字認識を実行することができる。
詳しくは、以前に誤認文字を変更文字に変更した場所(位置)において、誤認文字と近似するとして判定できる文字である、前記誤認文字に対するマッチング信頼度が第1の所定範囲にある文字を認識した場合であって、認識文字が変更文字と近似するとして判定できる文字である、前記変更文字に対するマッチング信頼度が第2の所定範囲にある文字を認識した場合において、認識文字を変更文字に補正する。
したがって、以前に一旦誤認されたが正しく変更された認識文字と同様に、誤認文字と変更文字の両方にある程度近似する認識文字を補正することができ、誤認文字と変更文字のいずれかにのみ近似する認識文字を補正する場合と比較して、認識文字を正確に変更文字に補正することができ、文字の認識精度を向上することができる。
また、この発明の態様として、前記認識文字変更手段によって前記誤認文字を前記変更文字に変更した際の前記文字認識手段が認識した認識文字の前記誤認文字に対する第1マッチング信頼度と、前記変更文字に対する第2マッチング信頼度とを記憶するマッチング信頼度記憶手段を備え、前記第1の所定範囲を、前記第1マッチング信頼度を中心とする所定範囲に設定し、前記第2の所定範囲を、前記第2マッチング信頼度を中心とする所定範囲に設定することができる。
これにより、誤認文字と同じ文字を認識した場合に、正しく変更文字に補正する補正の精度をより向上し、より正確な文字認識を実行することができる。
詳しくは、以前に認識した認識文字と誤認文字とのマッチング信頼度、及び認識文字と変更文字とのマッチング信頼度に基づいて所定の範囲を設定できるため、一旦誤認されたが正しく変更された誤認文字の変更実績に基づく認識文字の補正を実現することができる。
また、この発明の態様として、前記位置取得手段を、GPS装置で構成することができる。
これにより、正確な位置情報を、広範囲にわたって取得できる。したがって、例えば海外で文字認識する場合であっても、正確に位置を把握して文字認識できるため、利用者の利便性をさらに向上することができる。
またこの発明は、文字認識用のマッチングデータを記憶するマッチングデータ記憶手段と、画像データを取得して、前記マッチングデータに基づいて前記画像データ内の文字を認識する文字認識手段と、位置情報を取得する位置情報取得手段とを備えた携帯端末に実行させる文字認識プログラムであって、前記文字認識手段が、前記マッチングデータに基づいて前記画像データ内の文字を認識する文字認識ステップにおいて、画像取得して文字認識する際に設定された設定条件情報と、前記文字認識ステップによって文字認識した位置の前記位置情報とを関連付けて関連情報記憶手段に記憶する関連情報記憶ステップと、前記文字認識ステップによって文字認識する位置が前記関連情報記憶手段に記憶されているか確認する記憶位置確認ステップと、前記関連情報記憶手段に記憶された位置で文字認識する際に、前記位置情報に関連付けられた前記設定条件情報を読み出して同条件に設定する条件設定ステップとを携帯端末に実行させることを特徴とする。
前記文字認識プログラムは、メモリ、チップ、またはハードディスクなど、適宜の記憶媒体に記憶することができる。
この発明により、携帯端末に文字認識プログラムをインストールすれば、画像データに対して手軽な操作で、正確な文字認識を実現することができる。
詳しくは、文字認識した際に設定した設定条件情報を位置情報取得手段で取得した位置情報と関連付けて記憶しているため、再度、同じ場所(位置)において、文字認識プログラムをインストールした携帯端末で文字認識する際に、同じ設定条件を読み出して設定できる。したがって、手間を掛けて同じ条件を設定せずとも、前回と同条件で文字認識を実施することができる。
この発明の態様として、取得した前記画像データから前記文字認識ステップによって認識した認識文字において誤認識であった誤認文字を正しい文字に変更する変更操作を受け付ける変更操作受付けステップと、受付けた変更操作に基づいて誤認文字を変更文字に変更する認識文字変更ステップと、前記誤認文字情報と、変更された変更文字情報とを誤認文字変更情報として、前記位置情報と関連づけて誤認文字変更情報記憶手段に記憶する誤認文字変更情報記憶ステップとを携帯端末に実行させるとともに、前記記憶位置確認ステップにおいて確認された位置で認識した認識文字が、前記誤認文字変更情報記憶手段に誤認文字情報として記憶されているか確認する誤認文字確認ステップと、該誤認文字確認ステップによって前記認識文字が前記誤認文字変更情報記憶手段に記憶された前記誤認文字と一致すると確認された場合に、前記誤認文字変更情報に基づいて前記変更文字に補正する文字補正ステップを携帯端末に実行させることができる。
この発明により、以前に誤認文字を変更文字に変更した場所(位置)において、携帯端末で誤認文字と同じ文字を再度認識した場合に、認識した文字を変更文字に補正することができる。したがって、再度、同じ場所(位置)で誤認文字と同じ文字を認識した場合に、変更操作することなく変更後の正しい文字に補正することができ、利用者の利便性が向上する。
また、この発明は、画像データを取得して、マッチングデータ記憶手段に記憶された文字認識用のマッチングデータに基づいて前記画像データ内の文字を認識する文字認識ステップと、位置情報を取得する位置情報取得ステップとを実行する文字認識方法であって、前記文字認識ステップにおいて、画像取得して文字認識する際に設定された設定条件情報と、前記文字認識ステップによって文字認識した位置の前記位置情報とを関連付けて記憶する関連情報記憶ステップと、前記文字認識ステップによって文字認識する位置が記憶されているか確認する記憶位置確認ステップと、記憶された位置で文字認識する際に、前記位置情報に関連付けられた前記設定条件情報を読み出して同条件に設定する条件設定ステップとを実行することを特徴とする。
これにより、画像データに対して手軽な操作で正確な文字認識を実行することができる。
詳しくは、文字認識した際に設定した設定条件情報を位置情報と関連付けて記憶しているため、再度、同じ場所(位置)において、文字認識する際に、同じ設定条件を読み出して設定できる。したがって、手間を掛けて同じ条件を設定せずとも、前回と同条件で文字認識を実施することができる。
この発明の態様として、取得した前記画像データから前記文字認識ステップによって認識した認識文字において誤認識であった誤認文字を正しい文字に変更する変更操作を受け付ける変更操作受付けステップと、受付けた変更操作に基づいて誤認文字を変更文字に変更する認識文字変更ステップと、前記誤認文字情報と、変更された変更文字情報とを誤認文字変更情報として、前記位置情報と関連づけて誤認文字変更情報記憶手段に記憶する誤認文字変更情報記憶ステップとを実行するとともに、前記記憶位置確認ステップにおいて確認された位置で認識した認識文字が誤認文字情報として記憶されているか確認する誤認文字確認ステップと、該誤認文字確認ステップによって前記認識文字が記憶された前記誤認文字と一致すると確認された場合に、前記誤認文字変更情報に基づいて前記変更文字に補正する文字補正ステップを実行することができる。
この発明により、以前に誤認文字を変更文字に変更した場所(位置)において、誤認文字と同じ文字を認識した場合に、認識した文字を変更文字に補正することができる。したがって、再度、同じ場所(位置)で誤認文字と同じ文字を認識した場合に、変更操作することなく変更後の正しい文字に補正することができ、利用者の利便性が向上する。
この発明により、手軽な操作で正確な文字認識を実現する携帯式文字認識装置、文字認識プログラム、及び文字認識方法を提供し、利用者の満足度を向上させることができる。
携帯端末の斜視図。 携帯端末の構成を示すブロック図。 辞書データ及び関連情報記憶データの構成を説明する説明図。 文字認識プログラムによる文字認識処理のフローチャート。 文字認識に関する設定画面や認識文字の説明図。
この発明の一実施形態を以下図面と共に説明する。
図1は、携帯端末1の斜視図を示し、図2は、携帯端末1の構成のブロック図を示し、図3は辞書データ及び関連情報記憶データの構成を説明する説明図を示す。
携帯端末1は、図1,図2に示すように、画像入力部3、操作部5、画面表示部7及びGPS部9が設けられている。画像入力部3は、画像を撮像するデジタルカメラであり、操作部5は、押下操作されるボタンであり、画面表示部7は、画像を表示する液晶ディスプレイあるいは有機ELディスプレイである。
図2に示すように、携帯端末1は、画像入力部3、操作部5、画面表示部7及びGPS部9に加えて、CPU11、ROM12、及びRAM13が、バス16に接続して設けられている。
画像入力部3は、CCDカメラまたはCMOSカメラなどのデジタルカメラであり、バス16に接続されている。画像入力部3が撮像して得た撮像画像は、デジタル画像データとしてCPU11に送信される。なお、画像入力部3は、CPU11から撮像信号を受けて撮像を開始する。
操作部5は、バス16に接続されている。この操作部5は、利用者に押下操作された押下信号を、バス16を介してCPU11に送信する。
画面表示部7はバス16に接続されており、CPU11から画像データが送られてくると、この画像データの画像を言語設定画面7a、カメラ撮影モード設定画面7bあるいは誤認文字変更画面7cのように表示する。
GPS部9は、図示省略する3以上のGPS衛星からの電波信号を受信し、受信した複数の電波信号に基づいて携帯端末1の位置を算出することができる。
CPU11は、ROM12に記憶されたプログラムに従ってRAM13を一時記憶領域に使用して各種動作を行うプロセッサであり、各部を制御する制御機能21と、文字認識機能22を有している。
この文字認識機能22は、文字列抽出処理部31、文字抽出処理部32、文字認識処理部33、認識信頼度判定処理部34、及び認識結果補正処理部35を有している。
文字列抽出処理部31は、画像データから文字列を抽出する処理を実行する。この文字列の抽出は、例えば画像データを2値化して射影データを取得し、この射影データから文字列と余白を区別する等、適宜の方法により実行する。具体的には、文字画像に対して画素行別の黒画素数から上下方向のヒストグラムを算出し、所定数以上の黒画素の行が連続している範囲を文字列とするなど適宜の方法により実行する。
文字抽出処理部32は、前記文字列から文字を抽出する処理を実行する。例えば、この文字の抽出は、横書き文字に対して画素列別の黒画素数から左右方向のヒストグラムを算出し、所定数以上の黒画素が連続している範囲を1文字とする、あるいは縦書き文字に対して画素行別の黒画素数から上下方向のヒストグラムを算出し、所定数以上の黒画素が連続している範囲を1文字とするなど、適宜の方法により実行する。
文字認識処理部33は、マッチング用辞書データ24のマッチング情報を用いてどの文字のマッチング情報と一致あるいは近似するか判定することで文字を認識する処理と共に、マッチング信頼度を求める処理を実行する。
認識信頼度判定処理部34は、文字認識処理部33で求めたマッチング信頼度(認識信頼度)が所定範囲を超えているか否か判定する処理を実行する。
認識結果補正処理部35は、誤認された文字を正しく変更された変更文字に補正する処理を実行する。
ROM12は、文字認識プログラム23、及びマッチング用辞書データ24、並びに、後述するマッチング信頼度を判定する所定範囲を定める所定許容値αや、同じ位置と判定するためのエリア情報等の文字認識処理に必要な情報を記憶している。
マッチング用辞書データ24は、図3(A)に示すように、文字コード、及びマッチング情報によって構成されるとともに、言語ごとにマッチング用辞書データ24a,24bが存在する。
文字コードは、例えばShift−JISなどの適宜の方式の文字コードである。
マッチング情報は、文字の特徴データを文字別に記憶している。
RAM13は、CPU11が各種制御や演算に使用するデータを一時記憶すると共に、画像メモリ41に文字列画像などの画像を記憶している。さらには、図3(B)に示すように、誤認文字を正しい変更文字に変更した実績に関連する関連情報記憶データ42を記憶している。
詳しくは、一旦誤認された誤認文字を正しい変更文字に変更した変更実績に関連する情報である関連情報記憶データ42には、図3(B)の変更情報管理テーブル42aに示すように、変更処理を行った位置の位置情報、対象言語、カメラ撮影モード、及び変更文字情報等で構成している。
上記位置情報は、GPS部9によって取得した位置情報であり、例えば経緯度や座標値による位置情報とすることができる。
上記対象言語は、後述するように、文字認識する際に、利用者によって設定された言語である。
上記カメラ撮影モードは、正しい変更文字に変更した誤認文字を画像入力部3で撮像した際の画像入力部3の設定であり、ライトの使用の有無、マクロレンズの使用の有無、及びズームの使用の有無で構成している。
上記変更文字情報は、誤認文字のコード、画像入力部3で撮像した文字画像のうちの対象文字部分の誤認文字に対するマッチング信頼度(以下において第1マッチング信頼度という)と、誤認文字を利用者によって正しく変更された変更文字のコード、画像入力部3で撮像した画像のうちの対象文字部分の変更文字に対するマッチング信頼度(以下において第2マッチング信頼度という)とで構成している。
なお、RAM13は不揮発性メモリで構成しているため、携帯端末1の電源をoffにした場合であっても、関連情報記憶データ42は消えることなく記憶することができる。
なお、携帯端末1には、無線通信を行う通信アンテナ、音声出力を行うスピーカ、及び集音を行うマイク等も設けられている。これにより、携帯電話機として利用できるように構成されている。
また、図2に仮想線で示すように、CPU11とROM12は、1つのチップ15に搭載して電子部品として構成してもよい。この場合、チップ15を携帯端末1に備えれば、簡単に文字認識機能を追加することができる。
次に、図4及び図5とともに、携帯端末1における文字認識について説明する。
図4は、携帯端末1のCPU11が文字認識プログラム23に従って実行する文字認識処理のフローチャートであり、図5は文字認識するための設定画面や認識文字についての説明図である。
なお、以下の説明においては、例えば、出張で中国に行き、レストランでメニューに何と書いてあるかを確認するために、中国語を読み取り日本語に翻訳するような翻訳アプリケーションを使用する場合を考えてみる。
具体的には、例えば、図5(c)の誤認文字変更画面7cに示すような少し変わったフォントの文字で書かれた中国のレストランで「香辣鹿肉」という品目について意味を調べようとした場合の翻訳アプリケーションにおける文字認識処理について説明する。
まず、利用者によって携帯端末1の翻訳アプリケーションが起動されると、CPU11は、GPS部9によって現在位置情報を取得する(ステップS1)。そしてCPU11は、取得した現在位置の位置情報が関連情報記憶データ42に記憶された位置であるか確認する(ステップS2)。
なお、現在位置の位置情報と、関連情報記憶データ42に記憶された位置とが同じ場所(位置)であるかの判定は、ROM12に記憶するエリア情報に基づき、関連情報記憶データ42に記憶された位置を含む所定の範囲内に現在位置の位置情報が含まれるか否かを判定する構成である。
携帯端末1を持って初めて訪れる場所(位置)であったり、以前訪れたことがあったが翻訳アプリケーションにおける文字認識処理で誤認された文字を変更した実績のない、関連情報記憶データ42に記憶されていない位置の場合(ステップS2:No)、CPU11は、認識可能な言語を選択許容する言語設定画面7aを画面表示部7(図5(a)参照)に表示する。
この言語設定画面7aには、複数の言語のいずれかを選択するチェックボックス71aをそれぞれの言語に対して備えた選択可能言語一覧表示部71、前画面に戻るための戻るボタン72、確定ボタン73、及びサブメニューを表示するためのサブメニューボタン74を備えている。
この言語設定画面7aにおいて、利用者によってチェックボックス71aにチェックが入力され確定ボタン73が押下されると、CPU11は、ROM12に記憶するマッチング用辞書データ24のうち、該当する言語のマッチング用辞書データ24を読み出して、対象言語を設定する(ステップS3)。
上述したように、中国語のメニューを日本語に翻訳する本実施例においては、図5(a)に示すように、中国語のチェックボックス71aにチェックが入力され確定ボタン73が押下されると、CPU11はマッチング用辞書データ(中国語版)24bをROM12から読み出して、言語設定を完了する。
言語設定が完了したCPU11は、認証対象の文字を含む画像を画像入力部3(カメラ)によって明確に撮影するための撮影モードを設定するカメラ撮影モード設定画面7bを画面表示部7(図5(b)参照)に表示する。
このカメラ撮影モード設定画面7bには画像を撮影するためのライトの使用を設定するライト設定部75、マクロレンズの使用を設定するマクロレンズ設定部76、ズームを設定するためのズーム設定部77、戻るボタン72、確定ボタン73、及びサブメニューボタン74を備えている。
ライト設定部75には使用の有無を設定するためのチェックボックス75aを有無のそれぞれに備えており、同様にマクロレンズ設定部76においても有無のそれぞれにチェックボックス76aを備えている。
ズーム設定部77には、画面表示部7における左右方向にスライドして、望遠(T)と広角(W)とのズーム量を調整するスライドバー77aを備えている。
このカメラ撮影モード設定画面7bにおいて、利用者によってチェックボックス75a,76aにチェックが入力されるとともに、スライドバー77aを適切な位置に調整され、確定ボタン73が押下されると、CPU11は、選択されたカメラ撮影モードを設定する(ステップS4)。
このように設定することで、画像入力部3によって明確な文字画像を撮影し、対象言語の文字認識が可能な状態となるため、携帯端末1を文字認証する対象の文字部分に向けた利用者によってシャッターボタン(図示省略する)が押下されると、CPU11は、画像入力部3による画像撮影を実行して文字画像を取得する(ステップS5)。
画像入力部3によって文字画像を取得したCPU11は、文字列抽出処理部31による文字列抽出処理を実行し、文字画像から文字列を抽出するとともに(ステップS6)、抽出された抽出文字列について、文字認識処理部33により文字認識処理を実行し(ステップS7)、その文字認識処理結果を画面表示部7に表示する(図5(c)参照、ステップS8)。
この文字認識処理では、文字抽出処理部32により文字列から抽出した各文字について、マッチング用辞書データ24を用いて文字認識を実行する。
なお、文字抽出処理部32による文字抽出は、文字と文字の境界を抽出する処理に相当する。例えば、文字列画像について、文字部分が黒になるように2値化され、文字列に垂直方向に黒画素が射影され、その射影データの切れ目を文字と文字の境界の候補とする。
そして、この文字認識処理では、文字認識処理部33により抽出された各文字に対して、マッチング用辞書データ24のうち、対象文字とのマッチング信頼度の高い文字を認証文字82aとして算出する。このときのマッチング信頼度が上述の第1マッチング信頼度となる。
文字認識処理の結果を表示する誤認文字変更画面7cには、文字表示部80、戻るボタン72、確定ボタン73、及びサブメニューボタン74を備えている。
文字表示部80は、文字画像81aを表示する文字画像表示部81と、認識した文字列である認識文字列82aを表示する認識文字列表示部82と、認識文字列82aの各認識文字82bに対する変更候補文字83aを選択可能に表示する変更文字選択ウィンドウ83とを備えている。
この誤認文字変更画面7cにおいて、文字画像表示部81に表示された文字画像81aと同じ認識文字82bで構成される認識文字列82aが認識文字列表示部82に表示されると、すべての文字が正しく認識されているため(ステップS9:No)、利用者によって確定ボタン73が押下されることで、CPU11は「香辣鹿肉」という文字画像81aから認識された「香辣鹿肉」という認識文字82bを確定し、この文字認識処理を終了し、引き続き認識した認識文字列82aに対する翻訳処理を実行する。
逆に、文字画像81aに対して、間違って認識された文字(以下において「誤認文字82c」という)がある場合、誤認文字82cの変更候補文字83aを変更文字選択ウィンドウ83に表示する(ステップS9:Yes)。
詳しくは、図5(c)に示すように、「香辣鹿肉」という文字画像81aに対して、「香辣鹿月」という認識文字列82aが表示された場合、「香辣鹿肉」という認識文字列82aのうち「香」、「辣」、「鹿」の認識文字82bは正しく認識され、「肉」が「月」という誤認文字82cとして誤認識されていることとなる。
このように、認識文字列82aにおいて誤認文字82cがある場合、誤認文字82cである「月」が利用者によって選択されると、CPU11は誤認文字82cである「月」の変更候補文字83aを変更文字選択ウィンドウ83に表示する。
なお、変更文字選択ウィンドウ83で表示される変更候補文字83aは、上述のステップS7で算出されたマッチング信頼度が高い文字を表示する。
そして、変更候補文字83aの中から正しい変更文字83bである「肉」が選択され、確定ボタン73が押下されると、CPU11は「香辣鹿肉」という文字画像81aから認識された「香辣鹿肉」という認識文字82bを確定する(ステップS10)。
CPU11は、ステップS7で算出され、文字画像81aにおける誤認文字82cとして誤認された被誤認部分81bの変更文字83bに対するマッチング信頼度を読み出して、上述したように第2マッチング信頼度とする(ステップS11)。なお、CPU11が、文字画像81aにおける被誤認部分81bと変更文字83bとのマッチング信頼度を改めて算出する構成であってもよい。
さらに、CPU11は認識文字82bを変更文字83bに変更した情報を関連情報記憶データ42に登録して(ステップS12)、この文字認識処理を終了し、引き続き認識した認識文字列82aに対する翻訳処理を実行する。
なお、ステップS12で、登録する内容は、図4(b)に示すように、ステップS1で取得した位置情報、ステップS3で設定した対象言語、ステップS4で設定したカメラ撮影モードの設定内容、及び変更文字情報等を変更情報管理テーブル42aに記憶する。
変更情報管理テーブル42aに記憶する変更文字情報は、誤認された誤認文字82cの文字コードと、ステップS7で算出した文字画像81aのうち被誤認部分81bと誤認文字82cとの第1マッチング信頼度と、ステップS10で変更した変更文字83bの文字コードと、ステップS11で読み出した被誤認部分81bの変更文字83bに対する第2マッチング信頼度とを登録する。
他方、ステップS1で取得した位置情報が関連情報記憶データ42に記憶された位置である場合(ステップS2:Yes)、CPU11は、関連情報記憶データ42に記憶された設定言語を読み出して設定する(ステップS13)とともに、関連情報記憶データ42に記憶されたカメラ撮影モードの設定内容を設定する(ステップS14)。
この状態で、関連情報記憶データ42に記憶した以前の文字認識の際の設定条件と同条件で、画像入力部3による画像撮影して文字認識可能な状態となるため、CPU11は、上述のステップS5〜S7と同様に、画像入力部3による文字画像の取得、文字列抽出処理部31による文字列抽出処理、及び文字認識処理部33による文字認識処理を実行する(ステップS15)。なお、この文字認識処理における対象文字とのマッチング信頼度を「第3マッチング信頼度」とする。
そして、文字認識処理の結果、認識文字列82aのうち、誤認文字として関連情報記憶データ42に記憶された認識文字82bがあるかCPU11は判定する(ステップS16)。
CPU11によって、文字認識処理の結果の認識文字82bには、誤認文字として関連情報記憶データ42に記憶された誤認文字82cは無いと判定された場合(ステップS16:No)、ステップS8に移行する。
他方、文字認識処理の結果の認識文字82bには、誤認文字として関連情報記憶データ42に記憶された誤認文字82cがあると判定された場合(ステップS16:Yes)、CPU11は、ステップS15で算出した第3マッチング信頼度が、ステップS7で算出した第1マッチング信頼度を中心値として所定許容値α1を有する第1の所定範囲内であるか認識信頼度判定処理部34によって判定し、第3マッチング信頼度が第1の所定範囲内にないと判定された場合(ステップS17:No)、ステップS8に移行する。
第3マッチング信頼度が第1の所定範囲内である場合(ステップS17:Yes)、CPU11は、関連情報記憶データ42に誤認文字として記憶されていると判定された誤認文字82cと、関連情報記憶データ42に記憶された変更文字83bとのマッチング信頼度を算出する(ステップS18)。
なお、このときのマッチング信頼度を「第4マッチング信頼度」とする。
そして、CPU11は、第4マッチング信頼度が、ステップS11で算出した第2マッチング信頼度を中心値として所定許容値α2を有する第2の所定範囲内であるか認識信頼度判定処理部34によって判定し、第4マッチング信頼度が第2の所定範囲内にないと判定された場合(ステップS19:No)、ステップS8に移行する。
第4マッチング信頼度が第2の所定範囲内である場合(ステップS19:Yes)、CPU11は、関連情報記憶データ42に誤認文字として記憶されていると判定された誤認文字82cを、認識結果補正処理部35により関連情報記憶データ42に記憶された変更文字83bに補正する(ステップS20)。
さらに、CPU11は、認識文字列82aのうち残る認識文字82bにおいて、関連情報記憶データ42に誤認文字として記憶された認識文字があるか判定し、残っていない場合(ステップS21:No)、ステップS8に移行するとともに、残っている場合(ステップS22:Yes)はステップS17に戻る。
このように、携帯端末1のCPU11は、上述のフローチャートに基づいて画像入力部3によって取得した文字画像から正確に文字を認識して、認識した認識文字列82aに対する翻訳処理を実行することができる。
なお、上記文字認識処理を行う携帯端末1を用いることによって、手軽な操作で明確な画像を取得するとともに、正確な文字認識を実現することができる。また、以前に誤認文字82cを変更文字83bに変更した場所(位置)において、誤認文字82cと同じ認識文字82bを認識した場合に、変更文字選択ウィンドウ83等で操作することなく変更文字83bに補正することができ、利用者の利便性が向上する。
具体的には、繰り返し同じ場所(位置)に出張に行くと、例えば「前回行ったときにおいしかったから」といった理由で繰り返し同じレストランに行ったり、また、繰り返し同じ公共施設を利用したりすることが考えられる。
そのような場合、上記フローチャートに示すとおり、ある場所(位置)で初めて文字認識処理を実行する際に設定した対象言語やカメラ撮影モードが、再度同じ場所(位置)に行って文字認識する際に、位置情報を取得するGPS部9と連動して自動的に設定されるため、面倒な手間を繰り返す必要がなくなる。
これにより、特に海外へ出張や旅行に行った際など、同じ場所(位置)で以前使用した際にはマクロレンズを使用する設定にしていたにもかかわらず、その設定をしなかったために、以前は良く認識できていたものが認識できなくなってしまったりするようなことがなくなる。
また、変更文字83bに変更処理した誤認文字82cについて、同じ場所(位置)で同じ文字画像81aから文字を認識する場合に、同様に誤認識する可能性が非常に高い。しかし、上記文字認識処理を行う携帯端末1では、再度同様の変更操作をせずとも、GPS部9と連動し、関連情報記憶データ42に記憶する関連情報に基づいて自動的に変更されるため、利用者の利便性が向上する。
なお、同じ場所(位置)で同じ文字を認識する場合の誤認識の可能性は対応されていない特別なフォントの場合により可能性が高くなる。
例えば、上述の実施例における文字画像81a(図5(c)参照)のように、少し変わったフォントの文字で書かれた「肉」という文字の左側が「月」という文字の左側に似ていたために「月」に誤認識され、正しい「肉」に変更する必要があった。
なお、メニュー中の文字フォントは、おおよそ統一されているのが一般的であり、このレストランでは、「肉」という文字について文字認識すると同様の誤認識が生じる。しかし、場所(位置)毎に誤認文字82cと変更文字83bとが関連情報記憶データ42に記憶されているため、面倒な変更操作をせずとも正しい変更文字83bとして文字認識することができる。
なお、文字認識処理における認識性能の向上を図るための対策として、その認識できなかった文字を用いてマッチング用辞書に学習させることが考えられる。
この方法によれば、一般に、学習によって、マッチング用辞書が記憶する文字の形状が、対応フォントと認識できなかった文字のフォントの形状との間のものとなるため、特に、対応フォントと認識できなかった文字のフォントの形状の違いが大きいと、これまで認識精度が良好だった文字に対する認識精度を悪くしてしまうおそれがある。すなわち、学習することで、他の場所(位置)でアプリケーションを使用した際に、前回来たときは認識精度が良好だった文字が、あまり認識できなくなってしまうことが考えられる。
これに対し、上述の文字認証処理においては、ステップS15で算出された第3マッチング信頼度が、位置情報とともに関連情報記憶データ42に記憶された誤認文字82cの第1マッチング信頼度を中心値とする第1の所定範囲に入り、ステップS18で算出された第4マッチング信頼度が、位置情報とともに関連情報記憶データ42に記憶された変更文字83bに対する第2マッチング信頼度を中心値とする第2の所定範囲に入る場合に、以前に同じ場所(位置)で行った変更処理の実績に基づいて精度良く誤認文字82cを変更文字83bに補正することができる。
したがって、前回来たときは認識精度が良好だった文字が、あまり認識できなくなってしまうといった不具合が生じることなく、一旦、誤認されたが正しく変更文字83bに変更された誤認文字82cの変更実績に基づく補正を実行し、精度のよい文字認識を行うことができる。
なお、上記実施例においては、携帯端末1による文字認識処理で誤認された文字を変更した場合に、位置情報、対象言語、カメラ撮影モードの設定内容、及び変更文字情報を関連情報記憶データ42に記憶する構成であったが、文字認識処理を実行するたびに、位置情報、対象言語及びカメラ撮影モードを関連情報記憶データ42に記憶させてもよい。
この場合、ステップS3で対象言語を設定し、ステップS4でカメラ撮影モードを設定した後、ステップS1で取得した位置情報とともに対象言語及びカメラ撮影モードを関連情報記憶データ42に記憶させる。
これにより、例えば、携帯端末1による文字認識処理で誤認された文字を変更しなかった場合であっても、関連情報記憶データ42に記憶する位置情報と同じ場所(位置)では同じ設定をすることができる。
なお、このように構成した場合、関連情報記憶データ42に記憶する情報量が多くなり、誤認文字82cの補正のための変更文字情報の抽出が遅くなるおそれがある。したがって、文字認識処理を実行するたび記憶する位置情報、対象言語及びカメラ撮影モードを管理する管理テーブルと、誤認文字82cを変更した際の実績として、位置情報及び変更文字情報とは異なる管理テーブルで管理することが好ましい。
この発明の構成と、上述の実施形態との対応において、
この発明のマッチングデータは、マッチング用辞書データ24に対応し、
以下同様に、
画像データは、文字画像81aに対応し、
マッチングデータ記憶手段は、ROM12に対応し、
文字認識手段及び文字認識ステップは、ステップS5〜S7及びS15に対応し、
位置情報取得手段及びGPS装置は、GPS部9に対応し、
携帯式文字認識装置及び携帯端末は、携帯端末1に対応し、
設定条件情報は、変更情報管理テーブル42aに格納する対象言語及びカメラ撮影モードに対応し、
関連情報記憶手段及び関連情報記憶ステップは、ステップS12に対応し、
記憶位置確認手段及び記憶位置確認ステップは、ステップS2に対応し、
条件設定手段及び条件設定ステップは、ステップS13及びS14に対応し、
認識文字変更手段並びに、変更操作受付けステップ及び認識文字変更ステップは、ステップS10に対応し、
誤認文字変更情報は、変更情報管理テーブル42aに格納する変更文字情報に対応し、
誤認文字変更情報記憶手段及び誤認文字変更情報記憶ステップは、ステップS12に対応し、
誤認文字確認手段及び誤認文字確認ステップは、ステップS16に対応し、
文字補正手段及び文字補正ステップは、ステップS20に対応するが、
この発明は、上述の実施形態の構成のみに限定されるものではなく、多くの実施の形態を得ることができる。
1…携帯端末
9…GPS部
12…ROM
23…文字認識プログラム
24…マッチング用辞書データ
24b…マッチング用辞書データ(中国語版)
42a…変更情報管理テーブル
81a…文字画像
82c…誤認文字
82b…認識文字
83b…変更文字

Claims (9)

  1. 文字認識用のマッチングデータを記憶するマッチングデータ記憶手段と、
    画像データを取得し、前記マッチングデータに基づいて前記画像データ内の文字を認識する文字認識手段と、
    位置情報を取得する位置情報取得手段とを備えた携帯式文字認識装置であって、
    前記文字認識手段が画像取得して文字認識する際に設定された設定条件情報と、前記文字認識手段によって文字認識した位置の前記位置情報とを関連付けて記憶する関連情報記憶手段と、
    前記文字認識手段によって文字認識する位置が前記関連情報記憶手段に記憶されているか確認する記憶位置確認手段と、
    前記関連情報記憶手段に記憶された位置で前記文字認識手段が文字認識する際に、前記位置情報に関連付けられた前記設定条件情報を読み出して前記文字認識手段に設定する条件設定手段とを備えた
    携帯式文字認識装置。
  2. 取得した前記画像データから前記文字認識手段によって認識した認識文字において誤認識であった誤認文字を正しい文字に変更する変更操作を受け付け、変更文字に変更する認識文字変更手段と、
    前記誤認文字情報と、変更された変更文字情報とを誤認文字変更情報として前記位置情報と関連づけて記憶する誤認文字変更情報記憶手段とを備え、
    前記記憶位置確認手段によって確認され、前記関連情報記憶手段に記憶された位置で前記文字認識手段が認識した認識文字が、前記誤認文字変更情報記憶手段に誤認文字情報として記憶されているか確認する誤認文字確認手段と、
    該誤認文字確認手段によって前記認識文字が前記誤認文字変更情報記憶手段に記憶された前記誤認文字と一致すると確認された場合に、前記誤認文字変更情報に基づいて前記変更文字に補正する文字補正手段を備えた
    請求項1に記載の携帯式文字認識装置。
  3. 前記文字補正手段を、
    前記文字認識手段が認識する認識文字の前記誤認文字に対するマッチング信頼度が第1の所定範囲にあり、かつ、前記変更文字に対するマッチング信頼度が第2の所定範囲にある場合に、前記文字認識手段が認識した認識文字を前記変更文字に補正する構成とした
    請求項2に記載の携帯式文字認識装置。
  4. 前記認識文字変更手段によって前記誤認文字を前記変更文字に変更した際の前記文字認識手段が認識した認識文字の前記誤認文字に対する第1マッチング信頼度と、前記変更文字に対する第2マッチング信頼度とを記憶するマッチング信頼度記憶手段を備え、
    前記第1の所定範囲を、前記第1マッチング信頼度を中心とする所定範囲に設定し、
    前記第2の所定範囲を、前記第2マッチング信頼度を中心とする所定範囲に設定した
    請求項3に記載の携帯式文字認識装置。
  5. 前記位置取得手段を、GPS装置で構成した
    請求項1から4のうちいずれかに記載の携帯式文字認識装置。
  6. 文字認識用のマッチングデータを記憶するマッチングデータ記憶手段と、
    画像データを取得して、前記マッチングデータに基づいて前記画像データ内の文字を認識する文字認識手段と、
    位置情報を取得する位置情報取得手段とを備えた携帯端末に実行させる文字認識プログラムであって、
    前記文字認識手段が、前記マッチングデータに基づいて前記画像データ内の文字を認識する文字認識ステップにおいて、
    画像取得して文字認識する際に設定された設定条件情報と、前記文字認識ステップによって文字認識した位置の前記位置情報とを関連付けて関連情報記憶手段に記憶する関連情報記憶ステップと、
    前記文字認識ステップによって文字認識する位置が前記関連情報記憶手段に記憶されているか確認する記憶位置確認ステップと、
    前記関連情報記憶手段に記憶された位置で文字認識する際に、前記位置情報に関連付けられた前記設定条件情報を読み出して同条件に設定する条件設定ステップとを携帯端末に実行させる
    文字認識プログラム。
  7. 取得した前記画像データから前記文字認識ステップによって認識した認識文字において誤認識であった誤認文字を正しい文字に変更する変更操作を受け付ける変更操作受付けステップと、
    受付けた変更操作に基づいて誤認文字を変更文字に変更する認識文字変更ステップと、
    前記誤認文字情報と、変更された変更文字情報とを誤認文字変更情報として、前記位置情報と関連づけて誤認文字変更情報記憶手段に記憶する誤認文字変更情報記憶ステップとを携帯端末に実行させるとともに、
    前記記憶位置確認ステップにおいて確認された位置で認識した認識文字が、前記誤認文字変更情報記憶手段に誤認文字情報として記憶されているか確認する誤認文字確認ステップと、
    該誤認文字確認ステップによって前記認識文字が前記誤認文字変更情報記憶手段に記憶された前記誤認文字と一致すると確認された場合に、前記誤認文字変更情報に基づいて前記変更文字に補正する文字補正ステップを携帯端末に実行させる
    請求項6に記載の文字認識プログラム。
  8. 画像データを取得して、マッチングデータ記憶手段に記憶された文字認識用のマッチングデータに基づいて前記画像データ内の文字を認識する文字認識ステップと、
    位置情報を取得する位置情報取得ステップとを実行する文字認識方法であって、
    前記文字認識ステップにおいて、
    画像取得して文字認識する際に設定された設定条件情報と、前記文字認識ステップによって文字認識した位置の前記位置情報とを関連付けて記憶する関連情報記憶ステップと、
    前記文字認識ステップによって文字認識する位置が記憶されているか確認する記憶位置確認ステップと、
    記憶された位置で文字認識する際に、前記位置情報に関連付けられた前記設定条件情報を読み出して同条件に設定する条件設定ステップとを実行する
    文字認識方法。
  9. 取得した前記画像データから前記文字認識ステップによって認識した認識文字において誤認識であった誤認文字を正しい文字に変更する変更操作を受け付ける変更操作受付けステップと、
    受付けた変更操作に基づいて誤認文字を変更文字に変更する認識文字変更ステップと、
    前記誤認文字情報と、変更された変更文字情報とを誤認文字変更情報として、前記位置情報と関連づけて誤認文字変更情報記憶手段に記憶する誤認文字変更情報記憶ステップとを実行するとともに、
    前記記憶位置確認ステップにおいて確認された位置で認識した認識文字が誤認文字情報として記憶されているか確認する誤認文字確認ステップと、
    該誤認文字確認ステップによって前記認識文字が記憶された前記誤認文字と一致すると確認された場合に、前記誤認文字変更情報に基づいて前記変更文字に補正する文字補正ステップを実行する
    請求項8に記載の文字認識方法。
JP2009061750A 2009-03-13 2009-03-13 携帯式文字認識装置、文字認識プログラム及び文字認識方法 Active JP5223739B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009061750A JP5223739B2 (ja) 2009-03-13 2009-03-13 携帯式文字認識装置、文字認識プログラム及び文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009061750A JP5223739B2 (ja) 2009-03-13 2009-03-13 携帯式文字認識装置、文字認識プログラム及び文字認識方法

Publications (2)

Publication Number Publication Date
JP2010218041A true JP2010218041A (ja) 2010-09-30
JP5223739B2 JP5223739B2 (ja) 2013-06-26

Family

ID=42976860

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009061750A Active JP5223739B2 (ja) 2009-03-13 2009-03-13 携帯式文字認識装置、文字認識プログラム及び文字認識方法

Country Status (1)

Country Link
JP (1) JP5223739B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014130415A (ja) * 2012-12-28 2014-07-10 Nidec Sankyo Corp 文字認識装置、文字認識方法、及び文字認識プログラム
CN115170785A (zh) * 2021-11-22 2022-10-11 荣耀终端有限公司 图像的文字识别方法、电子设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03240183A (ja) * 1990-02-16 1991-10-25 Nippon Telegr & Teleph Corp <Ntt> 認識文字自動修正方式
JPH10232905A (ja) * 1997-02-18 1998-09-02 Toshiba Corp 文字認識装置における学習辞書の更新方法及び文字認識装置
JP2002209262A (ja) * 2001-01-09 2002-07-26 Casio Comput Co Ltd 携帯通信装置
JP2003178067A (ja) * 2001-12-10 2003-06-27 Mitsubishi Electric Corp 携帯端末型画像処理システム、携帯端末およびサーバ
JP2005012318A (ja) * 2003-06-17 2005-01-13 Nec Access Technica Ltd 位置情報取得機能付き携帯電話機
JP2006085461A (ja) * 2004-09-16 2006-03-30 Casio Hitachi Mobile Communications Co Ltd 情報処理装置、情報処理方法及び情報処理プログラム
JP2007004486A (ja) * 2005-06-23 2007-01-11 Nec Saitama Ltd 情報配信システム
JP2008250818A (ja) * 2007-03-30 2008-10-16 Omron Corp 携帯端末装置用のプログラムおよび携帯端末装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03240183A (ja) * 1990-02-16 1991-10-25 Nippon Telegr & Teleph Corp <Ntt> 認識文字自動修正方式
JPH10232905A (ja) * 1997-02-18 1998-09-02 Toshiba Corp 文字認識装置における学習辞書の更新方法及び文字認識装置
JP2002209262A (ja) * 2001-01-09 2002-07-26 Casio Comput Co Ltd 携帯通信装置
JP2003178067A (ja) * 2001-12-10 2003-06-27 Mitsubishi Electric Corp 携帯端末型画像処理システム、携帯端末およびサーバ
JP2005012318A (ja) * 2003-06-17 2005-01-13 Nec Access Technica Ltd 位置情報取得機能付き携帯電話機
JP2006085461A (ja) * 2004-09-16 2006-03-30 Casio Hitachi Mobile Communications Co Ltd 情報処理装置、情報処理方法及び情報処理プログラム
JP2007004486A (ja) * 2005-06-23 2007-01-11 Nec Saitama Ltd 情報配信システム
JP2008250818A (ja) * 2007-03-30 2008-10-16 Omron Corp 携帯端末装置用のプログラムおよび携帯端末装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014130415A (ja) * 2012-12-28 2014-07-10 Nidec Sankyo Corp 文字認識装置、文字認識方法、及び文字認識プログラム
CN115170785A (zh) * 2021-11-22 2022-10-11 荣耀终端有限公司 图像的文字识别方法、电子设备及存储介质

Also Published As

Publication number Publication date
JP5223739B2 (ja) 2013-06-26

Similar Documents

Publication Publication Date Title
US11170248B2 (en) Video capture in data capture scenario
US9589198B2 (en) Camera based method for text input and keyword detection
US9785627B2 (en) Automated form fill-in via form retrieval
JP4995554B2 (ja) 光学式文字認識補正のための知識ベースを利用した個人情報の検索方法
KR101199747B1 (ko) 단어 인식 방법 및 단어 인식용 프로그램의 기록매체 및 정보 처리 장치
JP5896245B2 (ja) テキスト画像のトリミング方法
US10089557B2 (en) Method and apparatus for recognizing characters
US8340426B2 (en) Apparatus and method for recognizing characters
KR101790655B1 (ko) 버스 정보 조회, 피드백 방법, 모바일 단말 및 서버
KR101050866B1 (ko) 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법
JP2014524085A (ja) オブジェクトにおけるテキスト情報を認識するための方法およびシステム
JP2014132453A (ja) 文書内の文字の局所的な拡大縮小、回転および表示位置に対して不変である光学的文字認識のためのワード検出
CN115641594A (zh) 基于ocr技术的身份证识别方法、存储介质及装置
US8773733B2 (en) Image capture device for extracting textual information
JP2006209599A (ja) 携帯端末、文字読取方法および文字読取プログラム
US8768058B2 (en) System for extracting text from a plurality of captured images of a document
JP2015090625A (ja) 帳票読取装置、プログラムおよび帳票読取システム
JP5223739B2 (ja) 携帯式文字認識装置、文字認識プログラム及び文字認識方法
US9641740B2 (en) Apparatus and method for auto-focusing in device having camera
US8908970B2 (en) Textual information extraction method using multiple images
CN110516660B (zh) 基于图像特征的书页内容读取方法及装置
JP2012226085A (ja) 電子機器、制御方法、および制御プログラム
WO2015122039A1 (ja) 翻訳装置
KR20160008407A (ko) 문자 인식 장치 및 방법
JP6705984B2 (ja) 情報処理装置と、その処理方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120312

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120713

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120731

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120912

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130225

R150 Certificate of patent or registration of utility model

Ref document number: 5223739

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160322

Year of fee payment: 3