JP3563911B2 - 文字認識装置 - Google Patents
文字認識装置 Download PDFInfo
- Publication number
- JP3563911B2 JP3563911B2 JP04833497A JP4833497A JP3563911B2 JP 3563911 B2 JP3563911 B2 JP 3563911B2 JP 04833497 A JP04833497 A JP 04833497A JP 4833497 A JP4833497 A JP 4833497A JP 3563911 B2 JP3563911 B2 JP 3563911B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- size
- unit
- image
- recognizable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/12—Detection or correction of errors, e.g. by rescanning the pattern
- G06V30/127—Detection or correction of errors, e.g. by rescanning the pattern with the intervention of an operator
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/166—Normalisation of pattern dimensions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Description
【発明が属する技術分野】
本発明は撮像した文字画像を認識する文字認識装置に関するものである。
【0002】
【従来の技術】
従来の技術として、例えば、特開昭62−80791号公報や特開平6−74729号公報に開示されたものがある。
【0003】
まず、特開昭62−80791号公報には、入力された画像情報を標準パターンとし、この標準パターンに基づいて辞書パターンの格納サイズを設定し、この辞書パターンに基づいて画像情報を認識することが開示されている。
【0004】
また、特開平6−74729号公報には、認識文字との距離を計算し、認識する文字が所定の大きさになるようカメラのズームを行うことが開示されている。
【0005】
【発明が解決しようとする課題】
しかし、上記従来の技術では、一度読み込んだ文字画像を認識できなかった場合に、再度読み込み操作を行わなければならないという問題がある。
【0006】
また、文字画像を読み取った段階ではこれが認識可能であるかどうかは判断できず、認識できなかった場合にはもう一度文字画像を読み込まなければならないという問題がある。
【0007】
また、従来の技術では、認識可能な文字画像まで必要以上の拡大操作を行ってしまうという問題がある。
【0008】
本発明は、上記問題点を解決するために、文字画像の大きさが認識できないものであれば、使用者に対してその旨を報知する文字認識装置を提供すること目的とする。
【0009】
また、本発明は、上記問題点を解決するために、文字種類に応じた複数の認識可能なサイズを記憶し、切り取った文字画像がどの文字の種類のサイズに該当するかを報知する文字認識装置を提供することを目的とする。
【0010】
また、本発明は、上記問題点を解決するために、切り取った文字画像より、文字の種類毎の認識可能なサイズに相当する文字画像を抽出し、報知する文字認識装置を提供することを目的とする。
【0011】
また、本発明は、上記問題点を解決するために、切り取った文字画像の大きさが認識可能なサイズでない場合に、その文字画像を認識可能なサイズに拡大する文字認識装置を提供することを目的とする。
【0012】
【課題を解決するための手段】
本発明は、上記目的を達成するためになされたものであって、請求項1記載の発明は、撮像手段により得られた画像を認識手段により文字として認識する文字認識装置であって、
前記撮像手段により得られた画像から文字画像を切り取る切取手段と、文字の種類毎に認識可能なサイズを記憶する記憶手段と、前記切取手段にて切り取った文字画像の大きさが前記記憶手段に記憶されたどの文字の種類の認識可能なサイズに該当するかを判断する判断手段と、
前記判断手段にて判断した認識可能なサイズの文字の種類を報知する報知手段とを具備することを特徴とする文字認識装置である。
【0014】
また、請求項2記載の発明は、撮像手段により得られた画像を認識手段により文字として認識する文字認識装置であって、
前記撮像手段により得られた画像から文字画像を切り取る切取手段と、
文字の種類毎に認識可能なサイズを記憶する記憶手段と、
前記切取手段にて切り取った文字画像から、該文字画像のサイズが記憶手段に記憶された文字の種類毎の認識可能なサイズに相当する文字画像を前記各サイズ毎に抽出する抽出手段と、
前記抽出手段にて前記各サイズ毎に抽出された文字画像のうち、各サイズの代表的な文字画像の近傍に認識可能な文字の種類を表示する報知手段とを具備することを特徴とする文字認識装置である。
【0016】
【発明の実施の形態】
以下、図をもとに本発明について詳述する。なお、これによって本発明は限定されるものではない。
【0017】
図1は本発明を採用した装置の外観斜視図である。図1(a)は撮影者側から見た装置の外観斜視図であり、図1(b)は撮影者の対面方向から見た装置の外観斜視図である。
【0018】
本発明を採用した装置は本体キャビネット部1と表示部2と画像取込キー3と記憶指示キー4と電源スイッチ5とCCDカメラ部6と把持部7とを有する。
【0019】
本体キャビネット部1は図示していないマイクやスピーカなどを有するものであり、表示部2はCCDカメラ部6により撮影した画像を表示するものであり、薄型で文字画像を表示可能なマトリックス方式からなる液晶表示部と、これを覆う大きさを有するタブレットとによって構成されている。
【0020】
該タブレットは例えば、透明なシート2枚の内側面に透明電極を設け、通電状態において各々の電極が接触しないように、小さな突起状のスペーサが規則正しく印刷されており、指或はペンにて指示することにより透明電極が接触し、選択された位置を透明タブレットにて検出することを可能としている。
【0021】
画像取込キー3は画像の撮影開始を指示するキーであり、記憶指示キー4は読み込んだ画像の記憶を指示するキーである。
【0022】
電源スイッチ5は装置の電源をON/OFFするスイッチであり、CCDカメラ部6は画像を読み込むためのCCDを撮像素子としたCCDカメラ部であり、把持部7は装置を持ちやすくするためものであり、凹状になっている。
【0023】
また、図1の外観斜視図には図示していないが、本発明を採用した装置は外部とのデータのやり取りを行うためのインターフェイス部を備え、外部との通信を行うためのモデム等を内蔵している。
【0024】
次に、図1の装置の操作方法を説明する。
撮影を行う場合、まず、電源スイッチ5で電源をONにし、撮影したい対象にCCDカメラ部6を据え、画像取込キー3を一回押すと、CCDカメラ部6のレンズがとらえた画像が表示部2に表示される。
【0025】
以下、実施例1乃至4について説明する。
【0026】
[実施例1]
実施例1について図1〜図4をもとに説明する。
【0027】
図1において、まず、使用者が画像取込キー3を押すことによって、文字を含んだ文字画像を撮影する。そして、表示部2に表示されている文字画像を切り出す。文字切り出しの処理は従来から用いられている方法を取る。例えば、横1行分の同一色の画素を取り出し合計を求め、その合計が多い部分の縦の列の画素を合計し、多い部分を文字が存在する領域とする。切り出した文字画像が認識可能な大きさであれば文字画像を記憶し、切り出した文字画像が認識不可能なほど小さいものであれば、図3のように表示部2の左下部に「認識できません。」と、警告表示する。
【0028】
以上の操作を図2のブロック図をもとに説明する。
レンズ部8で光を結像し、後に説明を行うズーム機構部9により任意に拡大した被写体像をCCD10の撮像面部に投影する。CCD10ではズーム機構9を介してレンズ部8から投影された光を増幅器11により増幅し、このアナログ信号をA/D変換器12に出力する。A/D変換器12によりデジタル信号に変換された画像信号は1フレーム記憶部13に一旦保存され、文字切り出し部14に出力される。
【0029】
文字切り出し部14では上記に述べた文字切り出し方法により文字表示領域を切り出し、この切り出した文字の情報をサイズ判断部15に出力する。サイズ判断部15ではサイズ記憶部16に予め記憶している基準となる文字サイズと、文字切り出し部14より入力された文字情報の文字サイズとを比較し、基準文字サイズよりも切り出した文字サイズの方が大きければ、OK側の制御線を通して合成部17に切り出した文字情報を出力する。
【0030】
サイズ記憶部16には英数字であれば認識可能なサイズ(例えば8×8ドット)を記憶している英数サイズ記憶部16−1、平仮名や片仮名であれば認識可能な文字サイズ(例えば16×16ドット)を記憶しているひらがなサイズ記憶部16−2、漢字を認識可能な文字サイズ(例えば64×64ドット)を記憶している漢字サイズ記憶部16−3が含まれており、本実施例の場合には切り出した文字のサイズと、漢字サイズ記憶部16−3の内容とを比較している。
【0031】
また、この基準となる文字サイズを英数サイズ、ひらがなサイズ、漢字サイズの3種類のサイズから使用者が任意に選択可能としてもよい。
【0032】
ここで、使用者がスイッチ部23に含まれる記憶指示キー4を押すと、スイッチ部23から制御部22に信号が出力され、記憶部18に表示部2の文字画像を記憶する。
【0033】
また、サイズ判断部15で判断した結果、切り出した文字のサイズが基準文字サイズよりも小さければ、NG側の制御線を通して表示部2に「認識できません。」と警告表示21を行う。
【0034】
以上の処理を図4のフローチャート図をもとに説明する。
まず、STEP1で使用者が画像取込キー3を押したときの画像を読み込み、STEP2で読み込んだ画像から文字を切り出す。次のSTEP3では切り出した文字のサイズを取り込み、STEP4でサイズ記憶部16の基準サイズと切り出した文字サイズとを比較し、認識可能なサイズであるかどうかを判断する。
【0035】
切り出した文字サイズが基準サイズよりも大きければ、STEP5で読み込んだ文字画像全部に対して認識可能かどうかを調べたかを判断する。全部の文字画像を認識可能かどうか調べていないのであればSTEP3に戻り、全部の文字画像に対して認識可能かどうか調べたのであればSTEP6で読み込んだ画像を記憶する。
【0036】
また、STEP4で切り出した文字サイズが基準サイズよりも小さかった場合には、STEP7で表示部2に「認識できません。」と警告する表示を行う。
【0037】
以上の処理によって、読み込んだ文字画像が認識不可能な大きさであれば、認識できないことを表示部に警告表示させることができる。
【0038】
[実施例2]
実施例2について図1、図2、図5〜図7をもとに説明する。
【0039】
図5は実施例2の表示画面例を示す図である。
使用者が画像読込キー3を押したときに表示部2に表示された文字画像から文字を切り出し、英数、平仮名、漢字のうちのどの文字種なら認識可能か、判断する。
【0040】
文字が小さく、英数字しか認識できないときには、図5(a)で示すように、切り出した文字とその文字枠を表示し、この文字枠の上部に”A”と表示する。
【0041】
また、英数字しか認識できないサイズよりも大きい平仮名、片仮名サイズの文字であれば、平仮名、片仮名まで認識できることを使用者に知らせるため、図5(b)で示すように、切り出した文字枠の上部に”Aあ”と表示する。
【0042】
切り出した文字が漢字のように画数の多い複雑な文字でも認識できるサイズであれば、図5(c)で示すように、切り出した文字枠の上部に”Aあ漢”と表示し、英文字、平仮名、片仮名、漢字の何れの文字であっても認識は可能であることを確認できるようにする。
【0043】
さらに、漢字が認識できる文字サイズであれば、英数字や平仮名が認識可能なのは明らかなので、図5(d)に示すように、切り出した文字枠の上部に”漢”とのみ表示してもよい。すなわち、認識可能な最大文字種を表示するだけにしてもよい。
【0044】
また、切り出した文字枠の上部に認識可能文字サイズを表示するのではなく、図6(a)〜(c)のように、認識可能な文字サイズに対応させて、文字枠のパターンに網かけや斜線等で変化を付けてもよい。
【0045】
また、図6(d)に示すように、文字枠の下部に認識可能文字サイズ毎の領域を設け、切り出した文字が認識可能な文字サイズの領域を塗り潰すことで区別してもよい。
【0046】
また、図6(e)で示すように、文字枠を2重、3重とすることで認識可能文字サイズを区別してもよい。
【0047】
以上の処理を図2のブロック図をもとに説明する。
レンズ部8で光を結像し、後に説明を行うズーム機構部9により任意に拡大した被写体像をCCD10の撮像面部に投影する。CCD10ではズーム機構9を介してレンズ部8から投影された光をアナログ信号に変換して増幅器11により増幅し、このアナログ信号をA/D変換器12に出力する。A/D変換器12によりデジタル信号に変換された画像信号は1フレーム記憶部13に一旦保存され、文字切り出し部14に出力される。
【0048】
文字切り出し部14では上記に述べた文字切り出し方法により文字表示領域を切り出し、この切り出した文字の情報をサイズ判断部15に出力する。サイズ判断部15ではサイズ記憶部16に予め記憶している基準となる文字サイズと、文字切り出し部14より入力された文字情報の文字サイズとを比較し、基準文字サイズよりも、切り出した文字サイズの方が大きければ、OK側の制御線を通して合成部17に切り出した文字情報を出力する。
【0049】
サイズ記憶部16には英数字であれば認識可能なサイズ(例えば8×8ドット)を記憶している英数サイズ記憶部16−1、平仮名や片仮名であれば認識可能な文字サイズ(例えば16×16ドット)を記憶しているひらがなサイズ記憶部16−2、漢字を認識可能な文字サイズ(例えば64×64ドット)を記憶している漢字サイズ記憶部16−3が含まれている。
【0050】
例えば切り出した文字のサイズが9×9ドットである場合には、まず漢字サイズ記憶部16−3の内容と比較し、切り出した文字のサイズのほうが小さいので、ひらがなサイズ記憶部16−2の内容と比較する。ひらがなサイズ記憶部16−2の内容との比較の結果、まだ切り出した文字サイズのほうが小さいので、英数サイズ記憶部16−1の内容と比較する。その結果切り出した文字サイズのほうが大きいため、英数サイズで認識できることが分かる。
【0051】
また、サイズ判断部15からOK側の制御線により、合成部17に英数サイズで認識するという情報を出力し、合成部17で切り出した文字の枠線とその上部に”A”の文字を配置し、切り出した文字と合成して、表示部2に表示する。
【0052】
ここで、使用者が記憶指示キー4を押すと、スイッチ部23から制御部22に信号が出力され、記憶部18に表示部2の文字画像を記憶する。
【0053】
以上の処理を図7のフローチャート図をもとに説明する。
まず、STEP8で使用者が画像取込キー3を押したときの画像を読み込み、STEP9で読み込んだ画像から文字を切り出す。次のSTEP10では切り出した文字のサイズを取り込み、STEP11でサイズ記憶部16の漢字サイズ記憶部16−3に記憶された漢字サイズと切り出した文字サイズとを比較し、漢字を認識可能なサイズであるかどうかを判断する。
【0054】
切り出した文字サイズが漢字サイズより小さい場合にはSTEP14に進み、切り出した文字サイズが漢字サイズと同じか大きい場合にはSTEP12で図6(a)のように切り出した文字枠を黒色に設定し、STEP13で漢字サイズであることを記憶し、STEP20に進む。
【0055】
STEP14ではサイズ記憶部16のひらがなサイズ記憶部16−2に記憶されたひらがなサイズと切り出した文字サイズとを比較し、平仮名や片仮名を認識可能なサイズであるかどうかを判断する。
【0056】
切り出した文字サイズがひらがなサイズより小さい場合には、STEP17に進み、切り出した文字サイズがひらがなサイズと同じか大きい場合にはSTEP15で図6(b)のように切り出した文字枠を青色に設定し、STEP16でひらがなサイズであることを記憶し、STEP20に進む。
【0057】
STEP17ではサイズ記憶部16の英数サイズ記憶部16−1に記憶された英数サイズと切り出した文字サイズとを比較し、英数字を認識可能なサイズであるかどうかを判断する。
【0058】
切り出した文字サイズが英数サイズより小さい場合には、STEP20に進み、切り出した文字サイズが英数サイズと同じか大きい場合にはSTEP18で図6(c)のように切り出した文字枠を赤色に設定し、STEP19で英数サイズであることを記憶し、STEP20に進む。
【0059】
STEP20では読み込んだ文字画像全部に対して認識可能かどうかを調べたかを判断する。全部の文字画像を認識可能かどうか調べていないのであればSTEP10に戻り、全部の文字画像に対して認識可能かどうか調べたのであれば、STEP21で読み込んだ画像を表示部2に表示する。
【0060】
次のSTEP22では読み込んだ画像を記憶するかどうかを使用者に判断させ、使用者が画像を記憶すると指定した場合には、記憶指示キー4の入力に応じてSTEP23で読み込んだ画像を記憶する。
【0061】
以上の処理によって、認識する文字画像に関して、複数の文字種類の認識可能な文字を使用者が確認することが可能であり、画像に含まれる使用者が文字認識を必要とする文字に対して文字認識の可否を認識前の目安として確認することができる。
【0062】
[実施例3]
実施例3について図1、図2、図8および図9をもとに説明する。
【0063】
図8は実施例3の表示画面例を示した図である。
使用者が画像取込キー3を押したときに表示部2に表示されていた表示部2の文字を順次切り出していき、英数字、平仮名、漢字の各サイズに該当する文字を探す。
【0064】
仮に、左上から切り出した場合、図8では、まず始めに漢字が認識可能なサイズの文字「名」27を発見し、次に平仮名が認識可能なサイズの文字「登」28を発見し、最後に英数字が認識可能なサイズの文字「請」29を発見する。
【0065】
ここで発見された3種の文字サイズに対応した文字の文字枠上部に、各サイズを示す表示を行い、使用者がこれを基準に認識可能なサイズを確認することができる。
【0066】
以上の処理を図2のブロック図をもとに説明する。
【0067】
レンズ部8で光を結像し、後に説明を行うズーム機構部9により任意に拡大しCCD10の撮像面部に被写体像を投影する。CCD10ではズーム機構9を介してレンズ部8から投影された光をアナログ信号に変換し、増幅器11により増幅して、このアナログ信号をA/D変換器12に出力する。A/D変換器12によりデジタル信号に変換された画像信号は、1フレーム記憶部13に一旦保存され、文字切り出し部14に出力される。
【0068】
文字切り出し部14では上記に述べた文字切り出し方法により文字表示領域を切り出し、この切り出した文字の情報をサイズ判断部15に出力する。
【0069】
サイズ記憶部16には英数字であれば認識可能なサイズ(8×8ドット)を記憶している英数サイズ記憶部16−1、平仮名や片仮名であれば認識可能な文字サイズ(16×16ドット)を記憶しているひらがなサイズ記憶部16−2、漢字を認識可能な文字サイズ(64×64ドット)を記憶している漢字サイズ記憶部16−3が含まれている。
【0070】
サイズ判断部15ではサイズ記憶部16より順次送られてくる(例えば、漢字サイズ、平仮名、片仮名サイズ、英数字サイズ)予め記憶している基準となる文字サイズと、文字切り出し部14より入力された文字情報の文字サイズとを比較し、初めに漢字サイズが認識可能な文字サイズを切り出した文字より検出する。
【0071】
次に平仮名、片仮名サイズ(但し、漢字サイズにて認識可能なサイズは除く)、英数字サイズ(但し平仮名、片仮名サイズ以上のサイズにて認識可能なサイズを除く)の順に認識の可否をサイズに基づき判断する。
【0072】
認識可能な文字サイズが英数サイズである場合、サイズ記憶部16からは認識可能サイズが英数サイズであることを認識部19に出力し、1フレーム記憶部13の内容を、制御部22により認識部19で認識するための文字パターンを記憶する認識データ部20のデータとを比較することにより、文字画像の認識を行い、認識結果を文字画像に置き換えて表示部2に表示する。
【0073】
また、サイズ判断部15からOK側の制御線により、合成部17にそれぞれ、適合するサイズで認識可能なサイズであるとして情報を出力し、合成部17で切り出した文字を囲むように認識可能サイズ枠(16−1〜16−3に記憶されているサイズ)と上部に認識可能サイズを意味する文字情報を配置し、切り出した文字と合成して、表示部2に表示する。
【0074】
以上の処理を英数、ひらがな、漢字全ての文字サイズにおいて各サイズにつき1文字ずつ行う。
【0075】
ここで、使用者が認識に十分な大きさと考えるなら、記憶指示キー4を押し、スイッチ部23からの信号が制御部22に出力され、記憶部18に表示部2の文字画像を記憶する。
【0076】
以上の処理を図9のフローチャート図をもとに説明する。
まず、STEP24で使用者が画像取込キー3を押したときの画像を読み込み、STEP25で読み込んだ画像から文字を切り出す。次のSTEP26では切り出した文字のサイズを取り込み、STEP27で取り込んだ文字サイズが漢字サイズであるかどうかを判断する。切り出した文字サイズが漢字サイズであれば、STEP28で漢字サイズであることと、この文字画像の情報とを保持する。
【0077】
切り出した文字サイズが漢字サイズでなければ、STEP29で切り出した文字全部に対して判断を行ったかどうかを調べ、全部判断し終わっていればSTEP30に進み、全部判断し終わっていなければ、STEP26に戻って漢字サイズの文字を発見するまで、または読み込んだ画像全部を漢字サイズであるかどうか調べ終わるまでSTEP26からSTEP29の処理を繰り返す。
【0078】
STEP30では次に切り出した文字のサイズを取り込み、STEP31で取り込んだ文字サイズがひらがなサイズであるかどうかを判断する。切り出した文字サイズがひらがなサイズであれば、STEP32でひらがなサイズであることと、この文字画像の情報とを保持する。
【0079】
切り出した文字サイズがひらがなサイズでなければ、STEP33で切り出した文字全部に対して判断を行ったかどうかを調べ、全部判断し終わっていればSTEP34に進み、全部判断し終わっていなければ、STEP30に戻ってひらがなサイズの文字を発見するまで、または読み込んだ画像全部をひらがなサイズであるかどうか調べ終わるまでSTEP30からSTEP33の処理を繰り返す。
【0080】
STEP34では次に切り出した文字のサイズを取り込み、STEP35で取り込んだ文字サイズが英数サイズであるかどうかを判断する。切り出した文字サイズが英数サイズであれば、STEP36で英数サイズであることと、この文字画像の情報とを保持する。
【0081】
切り出した文字サイズが英数サイズでなければ、STEP37で切り出した文字全部に対して判断を行ったかどうかを調べ、全部判断し終わっていればSTEP38に進み、全部判断し終わっていなければ、STEP34に戻って英数サイズの文字を発見するまで、または読み込んだ画像全部を英数サイズであるかどうか調べ終わるまでSTEP34からSTEP37の処理を繰り返す。
【0082】
次のSTEP38でSTEP28、STEP32、STEP36の各処理で保持した情報に基づき、各サイズの代表的な文字の近傍に、認識可能なサイズを明記して画面表示を行う。
【0083】
次のSTEP39では読み込んだ画像を記憶するかどうかを使用者に判断させ、使用者が画像を記憶すると指示した場合には、STEP40で読み込んだ画像を記憶する。
【0084】
以上の処理によって、認識する文字画像の中で、漢字サイズ、ひらがなサイズ、英数サイズの各サイズに合致する代表的な文字にのみ、認識可能なサイズを表示させることができる。
【0085】
上記の例では、STEP26、STEP30、STEP34にて、その都度文字サイズの読み込みを行っているが、一度読み込んだ情報を保持することにより、それそれのサイズに対する読み込み回数を削減することもできる。
【0086】
又、認識できた文字の次の文字からを対象として読み込みを行っても良い。この場合、該当文字が有るまでは画面全てを検出するようにする。
【0087】
[実施例4]
実施例4について図1、図2、図10および図11をもとに説明する。
【0088】
図10は実施例3の表示画面例を示した図示である。
使用者が画像読込キー3を押し、文字画像が表示された状態で、液晶タブレットである表示部2の認識したい部分を範囲指定する。ここで、図10(a)に示すように「登録特許 第1234567号」30と表示された部分を範囲指定した場合、この範囲内で文字の切り出し作業を行う。
【0089】
次に、切り出した文字サイズと漢字文字サイズを比較し、切り出した文字のサイズのほうが小さいため、後に説明するズーム機構部9を駆動して図10(b)のように対象文字画像を拡大する。
【0090】
また、ここでは比較対象の文字サイズを漢字サイズとしているが、使用者が任意に設定し、これに合わせた対象文字画像の拡大を行う方法もある。
【0091】
以上の処理を図2のブロック図をもとに説明する。
【0092】
レンズ部8で光を結像し、後に説明を行うズーム機構部9により任意に拡大し、CCD10の撮像面部に被写体像を投影する。CCD10ではズーム機構9を介して、レンズ部8から投影された光をアナログ信号に変換して、増幅器11により増幅して、このアナログ信号をA/D変換器12に出力する。A/D変換器12によりデジタル信号に変換された画像信号は、1フレーム記憶部13に一旦保存され、使用者によって範囲指定された部分のみ文字切り出し部14に出力される。
【0093】
文字切り出し部14では上記に述べた文字切り出し方法により文字表示領域を切り出し、この切り出した文字の情報をサイズ判断部15に出力する。サイズ判断部15では、サイズ記憶部16に予め記憶している基準となる文字サイズと、文字切り出し部14より入力された文字情報の文字サイズとを比較し、基準文字サイズよりも、切り出した文字サイズの方が大きければ、OK側の制御線を通して合成部17に切り出した文字情報を出力する。
【0094】
サイズ記憶部16には英数字であれば認識可能なサイズ(例えば8×8ドット)を記憶している英数サイズ記憶部16−1、平仮名や片仮名であれば認識可能な文字サイズ(例えば16×16ドット)を記憶しているひらがなサイズ記憶部16−2、漢字を認識可能な文字サイズ(例えば64×64ドット)を記憶している漢字サイズ記憶部16−3が含まれている。
【0095】
次に、サイズ判断部15でサイズ記憶部16に予め記憶している基準となる文字サイズと、文字切り出し部14より入力された文字情報の文字サイズとを比較した結果、切り出した文字サイズよりも基準文字サイズの方が大きければ、NG側の制御線を通してスイッチ部25に拡大要求信号を出力する。
【0096】
また、サイズ判断部15からはモード指示部24に信号が出力され、ここからスイッチ部25を導通させる。スイッチ部25がONになれば、モータ部26によりズーム機構部9を駆動させ、レンズ部8から読み取る画像を拡大させ、使用者が設定した文字サイズで認識を行うことができる。
【0097】
ここで、使用者が記憶指示キー4を押すと、スイッチ部23から制御部22に信号が出力され、記憶部18に表示部2の文字画像を記憶する。
【0098】
以上の処理を図11のフローチャート図をもとに説明する。
まず、STEP41で使用者が画像取込キー3を押したときの画像を読み込み、STEP42で読み込んだ画像を表示する。STEP43では使用者が表示された画面の中で認識したい部分を画面上に設けられたタブレット等を用いて範囲指定し、STEP44でこの指定範囲中の文字画像から文字の切り出しを行う。
【0099】
STEP45では切り出した文字が認識可能なサイズを、サイズ判断部15で判断、選択し、STEP46で選択したサイズを認識時の基準サイズとしてサイズ記憶部16に設定する。
【0100】
次に、STEP47で切り出した文字のサイズを取り込み、STEP48で取り込んだ文字サイズがSTEP46で設定された基準サイズと同じかあるいは大きいかを比較することで、認識可能なサイズであるかを判断する。
【0101】
切り出した文字サイズが認識可能サイズであれば、STEP50に進み、切り出した文字が認識不可能な文字であればSTEP49でモータ部26によりズーム機構部9を駆動し読み込む文字画像を拡大撮影する。
【0102】
次に、STEP50で切り出した文字全部に対して判断を行ったかどうかを調べ、全部判断し終わっていればSTEP51に進み、全部判断し終わっていなければ、STEP47に戻って読み込んだ画像全部を英数サイズであるかどうか調べ終わるまでSTEP47からSTEP50の処理を繰り返す。
【0103】
次のSTEP51では読み込んだ画像を記憶するかどうかを使用者に判断させ、使用者が画像を記憶すると指示した場合には、STEP52で読み込んだ画像を記憶する。
【0104】
従って、使用者が認識したい文字が読み込んだ状態では認識不可能であれば、自動的に使用者の望む認識サイズまで拡大することができる。
【0105】
以上の説明にて記憶部18に記憶された文字画像は後に認識部19により、認識データ20のデータと比較され文字認識されることになる。また、文字切り出し等の認識に必要な部分は上記にて説明した文字切り出し部14を共通に使用すれば良い。
【0106】
【発明の効果】
本発明によれば、請求項1記載の発明では、切り取った文字画像がどの文字の種類のサイズに該当するかを報知するので、認識したい文字画像が認識可能かどうかを使用者が判断することができる。
【0108】
また、請求項2記載の発明では、前記抽出手段にて前記各サイズ毎に抽出された文字画像のうち、各サイズの代表的な文字画像の近傍に認識可能な文字の種類を表示する報知手段とを具備することを特徴とする文字認識装置するので、認識したい文字画像が認識可能かどうかを使用者が判断することができる。
【図面の簡単な説明】
【図1】本発明を採用した装置の外観斜視図である。
【図2】本発明を採用した装置のブロック図である。
【図3】実施例1の表示画面例を示す図である。
【図4】実施例1の処理のフローチャート図である。
【図5】実施例2の表示画面例を示す図である。
【図6】実施例2の表示画面例を示す図である。
【図7】実施例2の処理のフローチャート図である。
【図8】実施例3の表示画面例を示す図である。
【図9】実施例3の処理のフローチャート図である。
【図10】実施例4の表示画面例を示す図である。
【図11】実施例4の処理のフローチャート図である。
【符号の説明】
1 本体キャビネット部
2 表示部
3 画像取込キー
4 記憶指示キー
5 電源スイッチ
6 CCDカメラ部
7 把持部
Claims (2)
- 撮像手段により得られた画像を認識手段により文字として認識する文字認識装置であって、
前記撮像手段により得られた画像から文字画像を切り取る切取手段と、文字の種類毎に認識可能なサイズを記憶する記憶手段と、前記切取手段にて切り取った文字画像の大きさが前記記憶手段に記憶されたどの文字の種類の認識可能なサイズに該当するかを判断する判断手段と、
前記判断手段にて判断した認識可能なサイズの文字の種類を報知する報知手段とを具備することを特徴とする文字認識装置。 - 撮像手段により得られた画像を認識手段により文字として認識する文字認識装置であって、
前記撮像手段により得られた画像から文字画像を切り取る切取手段と、
文字の種類毎に認識可能なサイズを記憶する記憶手段と、
前記切取手段にて切り取った文字画像から、該文字画像のサイズが記憶手段に記憶された文字の種類毎の認識可能なサイズに相当する文字画像を前記各サイズ毎に抽出する抽出手段と、
前記抽出手段にて前記各サイズ毎に抽出された文字画像のうち、各サイズの代表的な文字画像の近傍に認識可能な文字の種類を表示する報知手段とを具備することを特徴とする文字認識装置。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP04833497A JP3563911B2 (ja) | 1997-03-04 | 1997-03-04 | 文字認識装置 |
DE69834971T DE69834971T2 (de) | 1997-03-04 | 1998-03-02 | Zeichenerkennungsvorrichtung |
EP98103642A EP0863475B1 (en) | 1997-03-04 | 1998-03-02 | Character recognition device |
US09/033,671 US6252984B1 (en) | 1997-03-04 | 1998-03-03 | Character recognition device |
CN98106466A CN1110008C (zh) | 1997-03-04 | 1998-03-04 | 字符识别设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP04833497A JP3563911B2 (ja) | 1997-03-04 | 1997-03-04 | 文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10247220A JPH10247220A (ja) | 1998-09-14 |
JP3563911B2 true JP3563911B2 (ja) | 2004-09-08 |
Family
ID=12800524
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP04833497A Expired - Fee Related JP3563911B2 (ja) | 1997-03-04 | 1997-03-04 | 文字認識装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US6252984B1 (ja) |
EP (1) | EP0863475B1 (ja) |
JP (1) | JP3563911B2 (ja) |
CN (1) | CN1110008C (ja) |
DE (1) | DE69834971T2 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6563948B2 (en) * | 1999-04-29 | 2003-05-13 | Intel Corporation | Using an electronic camera to build a file containing text |
WO2000074054A2 (en) * | 1999-05-28 | 2000-12-07 | Matsushita Electric Industrial Co., Ltd. | Semiconductor memory card, apparatus for recording data onto the semiconductor memory card, and apparatus for reproducing data of the semiconductor memory card |
JP3554271B2 (ja) * | 2000-12-13 | 2004-08-18 | パナソニック コミュニケーションズ株式会社 | 情報通信装置 |
US6721452B2 (en) | 2001-09-12 | 2004-04-13 | Auburn University | System and method of handwritten character recognition |
US6922487B2 (en) * | 2001-11-02 | 2005-07-26 | Xerox Corporation | Method and apparatus for capturing text images |
KR100474312B1 (ko) * | 2002-12-12 | 2005-03-10 | 엘지전자 주식회사 | 디지털 카메라의 자동 주밍 방법 |
KR20040069865A (ko) * | 2003-01-30 | 2004-08-06 | 삼성전자주식회사 | 영상화면 내의 글자영역 확장장치 및 방법 |
US8873890B2 (en) * | 2004-04-02 | 2014-10-28 | K-Nfb Reading Technology, Inc. | Image resizing for optical character recognition in portable reading machine |
CN101354746B (zh) * | 2007-07-23 | 2011-08-31 | 夏普株式会社 | 文字图像抽出装置及文字图像抽出方法 |
KR101329492B1 (ko) * | 2012-01-25 | 2013-11-13 | 한국과학기술원 | 카메라 렌즈를 조절하여 인식할 문자열을 영상의 중앙에 인식 가능한 크기로 위치시키는 장치 및 그 방법 |
US9286683B1 (en) * | 2013-04-17 | 2016-03-15 | Amazon Technologies, Inc. | Text detection near display screen edge |
JP5821994B2 (ja) * | 2014-04-21 | 2015-11-24 | 富士ゼロックス株式会社 | 画像処理装置、画像形成装置およびプログラム |
US9239961B1 (en) * | 2014-09-24 | 2016-01-19 | Amazon Technologies, Inc. | Text recognition near an edge |
JP6448696B2 (ja) * | 2017-03-22 | 2019-01-09 | 株式会社東芝 | 情報処理装置、方法及びプログラム |
CN115862016A (zh) * | 2023-02-16 | 2023-03-28 | 金现代信息产业股份有限公司 | 一种小尺寸光学字符识别方法及系统 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5966275A (ja) * | 1982-10-08 | 1984-04-14 | Hitachi Denshi Ltd | テレビジヨンカメラ |
US4741045A (en) * | 1983-09-23 | 1988-04-26 | Dest Corporation | Optical character isolation system, apparatus and method |
JPS6280791A (ja) | 1985-10-04 | 1987-04-14 | Toshiba Corp | 文字読取り装置 |
DE69132789T2 (de) * | 1990-05-14 | 2002-05-23 | Canon Kk | Verfahren und Gerät zur Bildverarbeitung |
JPH0674729A (ja) | 1992-08-25 | 1994-03-18 | Nippon Steel Corp | 文字画像入力方法 |
DE69435282D1 (de) * | 1993-07-16 | 2010-04-29 | Sharp Kk | Bilddatenprozessor |
US5588072A (en) * | 1993-12-22 | 1996-12-24 | Canon Kabushiki Kaisha | Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks |
JPH07288722A (ja) * | 1994-04-15 | 1995-10-31 | Canon Inc | 撮像装置 |
JP3095623B2 (ja) * | 1994-06-16 | 2000-10-10 | 松下電器産業株式会社 | 属性判定方法 |
-
1997
- 1997-03-04 JP JP04833497A patent/JP3563911B2/ja not_active Expired - Fee Related
-
1998
- 1998-03-02 DE DE69834971T patent/DE69834971T2/de not_active Expired - Lifetime
- 1998-03-02 EP EP98103642A patent/EP0863475B1/en not_active Expired - Lifetime
- 1998-03-03 US US09/033,671 patent/US6252984B1/en not_active Expired - Fee Related
- 1998-03-04 CN CN98106466A patent/CN1110008C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1201954A (zh) | 1998-12-16 |
EP0863475A3 (en) | 2001-02-07 |
EP0863475B1 (en) | 2006-06-21 |
EP0863475A2 (en) | 1998-09-09 |
CN1110008C (zh) | 2003-05-28 |
DE69834971D1 (de) | 2006-08-03 |
US6252984B1 (en) | 2001-06-26 |
DE69834971T2 (de) | 2007-02-01 |
JPH10247220A (ja) | 1998-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3563911B2 (ja) | 文字認識装置 | |
JP4807284B2 (ja) | カメラ装置、カメラ装置制御プログラム及びカメラ装置制御方法 | |
EP2196943B1 (en) | Image capturing apparatus and face area detecting method | |
JP4548144B2 (ja) | デジタルカメラ装置、及びスルー画像表示方法 | |
JP5467992B2 (ja) | 撮像装置 | |
JP2005286940A (ja) | ディジタル・スチル・カメラおよびその制御方法 | |
JP4663700B2 (ja) | 撮影装置、及び撮影方法 | |
JP2012027687A (ja) | 画像処理装置及びプログラム | |
EP1797712A1 (en) | System and method for checking framing and sharpness of a digital image | |
JP2006293782A (ja) | 画像処理装置及び画像処理プログラム | |
JP2006293783A (ja) | 画像処理装置及び画像処理プログラム | |
JP5604285B2 (ja) | 撮像装置 | |
JP2004023158A (ja) | 画像撮像装置 | |
JP4127521B2 (ja) | ディジタル・カメラおよびその制御方法 | |
EP1668885B1 (en) | Camera, computer, projector and image processing for projecting a size-adjusted image | |
JP2005006255A (ja) | 画像撮像装置 | |
JP2005323015A (ja) | デジタルカメラ | |
JP4561399B2 (ja) | 画像記録方法、及びカメラ装置 | |
KR100816949B1 (ko) | 최적상태 촬상 전자카메라 | |
JP4098889B2 (ja) | 電子カメラおよびその動作制御方法 | |
JP2002298078A (ja) | 文字表示装置、その制御方法、記録媒体およびプログラム | |
JP2006301795A (ja) | 写真撮影装置 | |
JP2005223660A (ja) | デジタルカメラ | |
JP4407301B2 (ja) | デジタルカメラ | |
JP2004005535A (ja) | 文字表示装置、その制御方法、記録媒体およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040316 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040511 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20040511 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040601 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040604 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090611 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100611 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100611 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110611 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120611 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120611 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130611 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |