JP3476680B2 - 文字認識装置および文字認識方法 - Google Patents
文字認識装置および文字認識方法Info
- Publication number
- JP3476680B2 JP3476680B2 JP19522198A JP19522198A JP3476680B2 JP 3476680 B2 JP3476680 B2 JP 3476680B2 JP 19522198 A JP19522198 A JP 19522198A JP 19522198 A JP19522198 A JP 19522198A JP 3476680 B2 JP3476680 B2 JP 3476680B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- recognition
- area
- rectangular area
- string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Input (AREA)
Description
字情報を認識し、認識した情報を用いてアプリケーショ
ンで用いることを可能にする、文字認識装置および文字
認識方法に関するものである。
スキャナ等を使用して文書を画像データとして取り込
み、その画像データを文字として認識しJISコード等
の文字コードに変換するOCR(光学式文字認識)装置
が普及している。OCR機能は新聞・雑誌等の印刷物の
状態にある画像データを文字コードに変換し保存や編集
するのに用いられる。通常のOCRは画像データ全体を
一括して文字認識する。しかし、OCRが必要な部分が
画像データ全体の一部しか必要のない場合は、画像全体
をOCRするのに時間を要する、必要な画像データ部分
とOCRした結果との関連付けを行うのに手間がかかる
不都合が生じる。
法があった。マウスやタブレット等のポインティングデ
バイスでOCRする部分を指定して、指定した部分をO
CRする方法(特開平6−131111号公報)。必要
な部分のみをスキャナで読込む方法(特開平5−274
346号公報)。
のポインティングデバイスでOCRする部分を指定し
て、指定した部分をOCRする方法では、読取った画像
全体又は画像の一部を表示するためには画像で文字が確
認できることを可能とする高解像度の表示装置が必要で
あった。又、表示装置よりポインティングデバイスでO
CR部分を指示する手間が必要であった。
読込む部位をスキャンする操作に慣れを要し、読込む原
稿の文字が小さい時はスキャンする場所を指定するのが
困難であったり、文字が大きい場合はスキャン出来ない
場合があった。
装置は、原稿の読取領域を目視でき、読み取りたい文字
に位置合わせするための認識開始位置が示された読取領
域目視窓と、前記読取領域目視窓から原稿の画像データ
を読み取る読取部とを備え、原稿上を走査して文字を認
識する文字認識装置であって、前記読取部に読み取られ
た前記画像データを記憶する記憶部と、前記記憶部に記
憶された前記画像データに対して文字の矩形領域を求め
る文字矩形領域認識部と、前記文字矩形領域認識部で求
めた矩形領域に対し文字コードに変換する文字認識部と
を備え、前記文字認識部は、前記文字矩形領域認識部で
求めた矩形領域の位置座標を求め、前記読取領域目視窓
のあらかじめ決められた一点に最も近接した位置座標を
持つ矩形領域に対し文字コードに変換することを特徴と
する文字認識装置である。
取領域を目視でき、読み取りたい文字に位置合わせする
ための認識開始位置が示された読取領域目視窓と、前記
読取領域目視窓から原稿の画像データを読み取る読取部
とを備え、原稿上を走査して文字を認識する文字認識装
置であって、前記読取部に読み取られた前記画像データ
を記憶する記憶部と、前記記憶部に記憶された前記画像
データに対して文字列の矩形領域を求める文字列矩形領
域認識部と、前記文字列矩形領域認識部で求めた矩形領
域に対し文字コードに変換する文字認識部とを備え、前
記文字認識部は、前記文字列矩形領域認識部で求めた矩
形領域の位置座標を求め、前記読取領域目視窓のあらか
じめ決められた一点に最も近接した位置座標を持つ矩形
領域に対し文字コードに変換することを特徴とする文字
認識装置である。
取領域を目視でき、読み取りたい文字に位置合わせする
ための認識開始位置が示された読取領域目視窓と、前記
読取領域目視窓から原稿の画像データを読み取る読取部
とを備え、原稿上を走査して文字を認識する文字認識装
置であって、前記読取部に読み取られた前記画像データ
を記憶する記憶部と、前記記憶部に記憶された前記画像
データに対して行領域の位置を求める行領域認識部と、
前記行領域認識部で求めた行領域に対し文字コードに変
換する文字認識部とを備え、前記文字認識部は、前記行
領域認識部で求めた行領域の位置座標を求め、前記読取
領域目視窓のあらかじめ決められた一点に最も近接した
位置座標を持つ行領域に対し文字コードに変換すること
を特徴とする文字認識装置である。
記載の文字認識装置において、前記文字認識部は、あら
かじめ決められた一点に最も近接した位置座標を持つ文
字矩形領域の文字に対する文字コードの候補と、前記文
字矩形領域の周辺の文字矩形領域の文字に対する文字コ
ードの候補とを求め、前記周辺の文字矩形領域の文字に
対する文字コードの候補と言語的特性により関連付けす
ることによって、前記あらかじめ決められた一点に最も
近接した位置座標を持つ文字矩形領域の文字に対する文
字コードの候補から文字を確定することを特徴とする文
字認識装置である。
記載の文字認識装置において、前記文字認識部は、あら
かじめ決められた一点に最も近接した文字の位置座標を
持つ文字矩形領域に対し文字コードに変換した後、先に
認識した文字と同じ行にあり後続する文字矩形領域に対
しても文字コードに変換を行い、後に変換した文字コー
ドを先に認識した文字コードに追加して文字列を生成す
ることを特徴とする文字認識装置である。
記載の文字認識装置において、前記文字認識部は、あら
かじめ決められた一点に最も近接した文字列の位置座標
を持つ文字列矩形領域に対し文字コードに変換した後、
先に認識した文字列と同じ行にあり後続する文字列矩形
領域に対しても文字コードに変換を行い、後に変換した
文字コードを先に認識した文字コードに追加して文字列
を生成することを特徴とする文字認識装置である。
記載の文字認識装置において、表示装置及びスイッチ等
の入力装置を備え、文字認識した文字を表示装置にて表
示後、入力装置により方向を指示することにより、既に
表示してある文字又は文字列が位置する文字矩形領域に
対し指示された方向に隣接する文字の文字矩形領域に対
して文字認識部にて文字コードに変換した文字コード
を、既に表示している文字又は文字列に追加して表示を
行うことを特徴とする文字認識装置である。
記載の文字認識装置において、表示装置及びスイッチ等
の入力装置を備え、文字認識した文字列を表示装置にて
表示後、入力装置により方向を指示することにより、既
に表示してある文字列が位置する文字列矩形領域に対し
指示された方向に隣接する文字列の文字列矩形領域に対
して文字認識部にて文字コードに変換した文字コード
を、既に表示している文字列に追加して表示を行うこと
を特徴とする文字認識装置である。
記載の文字認識装置において、文字矩形領域認識部又は
文字列矩形領域認識部又は行領域認識部は求めた文字矩
形領域又は文字列矩形領域又は行領域が、画像データの
端に接している時は、文字又は文字列が画面の端にあり
文字が欠けている判断し、文字矩形領域又は文字列矩形
領域又は行領域から除外することを特徴とする文字認識
装置である。
1記載の文字認識装置において、文字矩形領域認識部又
は文字列矩形領域認識部は、矩形部位の認識を行う際、
最初に行の矩形範囲の認識を行い、その行の矩形範囲よ
り、あらかじめ決められた一点に近接する行に対して文
字矩形認識又は文字列矩形認識を行うことを特徴とする
文字認識装置である。
10記載の文字認識装置において、求めた行の矩形範囲
が、画像データの端に接している時は、文字又は文字列
が画面の端にあり文字が欠けている判断し、行の矩形範
囲から除外することを特徴とする文字認識装置である。
11記載の文字認識装置において、あらかじめ決められ
た一点を画像データの左上又は左下又は右上又は右下の
一点とし、文字又は文字列の位置座標も文字矩形領域又
は文字列矩形領域の左上又は左下又は右上又は右下とす
ることを特徴とする文字認識装置である。
12記載の文字認識装置において、アプリケーションの
機能を備え、文字画像より文字認識を行い文字コードに
変換した文字又は文字列をアプリケーションの入力文字
として用いることを特徴とする文字認識装置である。
12記載の文字認識装置において、電子辞書の機能を備
え、文字画像より文字認識を行い文字コードに変換した
文字又は文字列を辞書の検索文字として用いることを特
徴とする文字認識装置である。
13記載の文字認識装置において、アプリケーション又
は辞書機能が入力文字として欧文を必要としている時
は、画像データに対し文字列矩形領域認識部で求めた矩
形領域より文字列の位置座標を求め、あらかじめ決めら
れた一点に最も近接した文字列の位置座標を持つ文字列
矩形領域に対し文字認識部にて文字コードに変換するこ
とによる文字入力を行い、アプリケーション又は辞書機
能が入力文字として和文又は漢文を必要としている時
は、画像データに対し文字矩形領域認識部で求めた矩形
領域より文字の位置座標を求め、あらかじめ決められた
一点に最も近接した文字の位置座標を持つ文字矩形領域
に対し文字認識部にて文字コードに変換することによる
文字入力を行うことを特徴とする文字認識装置である。
読取領域を目視でき、読み取りたい文字に位置合わせす
るための認識開始位置が示された読取領域目視窓で認識
開始位置をあわせて原稿を走査し、走査で得た画像デー
タを記憶し、記憶した画像データに対して文字の矩形領
域を求め、求めた矩形領域より文字の位置座標を求め、
あらかじめ決められた一点に最も近接した文字の位置座
標を持つ矩形領域に対して文字コードに変換することを
特徴とする文字認識方法である。
電子辞書で用いたときの実施例を図に基づいて説明す
る。
キャナ装置(図1)にて読取る位置を指定し、読取った
画像(図3)に対し文字の切出しを行い文字認識する装
置にて構成される。請求項7又は8が関連する発明にお
いては、表示装置および方向を指示する入力装置も兼ね
備える。請求項13の発明においてはアプリケーション
の機能を兼ね備える。請求項14の発明においては電子
辞書の機能を兼ね備える。請求項15の発明においては
アプリケーション又は電子辞書の機能を兼ね備える。本
発明では文字の切出しを行う部分を、あらかじめ決めら
れた部位に限定する。使用者はそのOCRが必要な部位
をスキャナ装置(図1)で、目視にて確認してあらかじ
め指定された部位をスキャンし、本発明によるあらかじ
め決められた部位に限定された領域の切出しを行い文字
認識部い文字情報を得る。
ある。図1において1は読取り装置本体で、2はCIS
等のラインスキャナと、ラインスキャナの移動を検出す
るエンコーダを持つ読取り部で本体1と一体になってい
る。3は電子辞書等のアプリケーションの表示を行う表
示部で、4は読取り部での読取りを指示する読取りスイ
ッチで5はアプリケーション等の入力に用いる左右方向
スイッチ及び検索スイッチである。6は原稿を読取る時
に本体部より引き出すガイド板で、7は読取り位置を示
す読取り窓で、読取る原稿が読取り窓7よりが見えるよ
うに置く。このガイド板6の上を読取り部2が本体1と
ともに矢印8のラインスキャナの副走査方向にスライド
移動することにより読取り窓7から見える原稿を読取
る。
を読取り対象となる部分に当て、読取りスイッチ4を押
し、読取り部2と本体を8の副走査方向にスライド移動
することにより、図3の読取り画像を得ることが出来
る。このように本装置では目視で読取り位置を確認した
部分を読取り画像として読取ることが出来る。
び画像等の処理をするCPUで、10はアプリケーショ
ン・OCR・スキャナ制御等のプログラムとOCR辞書
データが入ったROMで、11は読み込んだ画像データ
・文字矩形データ・認識結果データ・表示データ等を収
納するRAMで、12は原稿を読み込むためのCISに
よるラインセンサで、ラインセンサで読取った画像は画
像処理回路13で増幅・A/D変換後、2値化される。
2値化された画像はエンコーダ14で副走査方向の移動
が検出された時、DMAコントローラ15にて、RAM
11に画像データとして転送され、RAM11で画像デ
ータとして蓄積される。16は入力装置で、図1の読取
りスイッチ4及び検索スイッチ・左右方向スイッチ5に
より入力することにCPUに対し割り込みを発生しキー
入力が押されたことを検出する。17は表示メモリで、
表示メモリの内容を図1の表示部3に該当する液晶表示
装置18で表示する。
発明は次のように実施される。
7・9・10・11・13・14を用いたときの画像読
取・認識の実施例を図5・6・7・8・9に示すフロー
チャートに従い説明する。また、請求項3・12を実施
する場合の変更点を本実施例の後半に記す。
に本装置のガイド板6を本体より引き出し読取りスイッ
チ4を押す。本実施例の文字認識装置の読取りスイッチ
4がおされたことにより割り込みが発生すると図5の処
理が実行される。S1においてイメージバッファ等のメ
モリの初期化とワークの確保を実施する。ここで、表示
文字数を示す変数NDを1、処理中の文字を示す変数N
と読取り開始位置を示す変数NSを0に、認識結果が入
る文字配列Sの要素を文字が入っていないことを意味す
る0にする。
回路13とエンコーダ14とDMAコントローラ15の
初期化を行い読み取りの準備を実施する。
の判定を行い、文字入力画面で無ければ終了処理として
S4に処理を移し、S4にてスキャナ部のハードのOF
F処理を行い、S5でS1で確保したワークを解放し割
り込みを終了する。
S6に処理を移し、読取りスイッチが押されたかどうか
判定し、押されていない場合はS3に処理を移し読取り
スイッチが押されるまでS3とS6の処理を繰り返す。
位置19に読み取りたい文字が来るように読取り窓7を
見ながら読取り装置を置く。ここでは図10の原稿の3
行目の「矩形」を読み取りたいものとする。置いた後使
用者は再び読取りスイッチ4を押す。スイッチ4が再び
押されたことによりS6からS7に処理が移る。使用者
は読取り部2を本体とともに矢印8のラインスキャナの
副走査方向にスライド移動することにより読取り窓7か
ら見える原稿を読取る。
像処理回路13で2値化し、エンコーダ14で副走査方
向の移動が検出された時、2値化された画像はDMAコ
ントローラ15にて、RAM11にラインセンサの1ラ
イン分転送され、RAM11には画像データとして配列
Dに次のように蓄積される。
実施される。行認識は図12の式に示すように黒の数を
横方向にカウントし、図13の表のような配列を得る。
ントされていない。配列Hの最大値に対し64分の1以
下の部分を行間とすることにより行間を求めることが出
来る。
字の行は次の行矩形位置に存在する。
了位置,Y座標終了位置) 次にS9にて、S8で求めた行矩形領域に対し認識を実
施する行の抽出を行う。
る。ここで1行目はY座標開始位置が画面の上端を示す
0をとるため、1行目は画面の上端に接しており情報が
欠けていると判断されるため、2行目の矩形領域を認識
領域として用いる。
に対し、文字の矩形領域を求める。文字矩形認識は図1
4の式に示すように行矩形領域に対し黒の数を縦方向に
カウントすることにより行う。行認識同様、文字間の部
分はカウントされてないため、配列Vの最大値に対し3
2分の1以下の部分が行のY方向幅の32分の1以上連
続する部分を文字間とすることにより文字間を求めるこ
とが出来る。
−50=72となるので72/32=2以上、配列Vの
最大値に対し32分の1以下の部分が連続する部分を文
字間とする。図11の2行目の画像では文字間を区切り
とすると文字は次の矩形位置に存在する。
は求めた文字数Mが0であるならば、読取りミスとして
S4に処理を移し終了処理を行い割り込みを終了し、M
が0でないならば、S12に処理を移す。
座標を決める。この時、1文字目の矩形領域のX座標開
始位置が画像の左端を示す0をとるため、画面に左端に
接していると判断できるため、1文字目を認識対象から
除外し、S10で求めた文字矩形領域の2文字目を1文
字目として位置座標を求める。最後の文字に関してもX
座標終了位置が画面の右端を示す1023の値をとるな
らば認識対象から除外する。また、画面に接していると
判断して文字位置座標から除外したときは文字数を示す
Mの値も除外した文字数に応じて減らす。
を位置座標とするので次の通りとなる。
し認識開始位置19に最も近い文字を求める。
(128,0)であるため3文字目となる。その値を処
理文字を示す変数N及び文字開始位置を示す変数NSに
入れる。ここで変数N及びNSの取る値は1文字目が0
となるため2となる。
が0ならばS16に処理を移し0以外ならばS15の処
理を行う。S15では、N−1に該当する文字矩形領域
に対しパターンマッチングにより文字認識しN−1に該
当する文字の候補を求める。ここで、図11の例では最
初はNは2となるため、N−1は1となりこれはS12
で求めた文字座標位置の2文字目、S10で求めた文字
矩形領域の3文字目の「た」に当たる。ここで文字候補
を次の配列Tに入れる。
3の値を取る Tは構造対でメンバーとして次のものを持つ T[A][B].CODE 文字候補の文字コード T[A][B].PER 文字候補の的中率(%) ここでは「た」に対し次の様に文字候補が選ばれたとす
る。
素を入れるため、PERの大きい順に並ぶ。そして、S
16に処理を移す。
域に対しパターンマッチングにより文字認識し変数Nに
該当する文字の候補を求める。ここで、図11の例では
最初はNは2となるため、S12で求めた文字座標位置
の3文字目、S10で求めた文字矩形領域の4文字目の
「矩」に当たる。ここで文字候補を配列T[N]に入れ
る。ここでは「矩」に対し次の様に文字候補が選ばれた
とする。
−1(文字数−1)の値を比較し処理する文字が最後の
文字かどうか判断し、最後の文字と判断したときはS2
4に処理を移し、最後の文字で無いときはS18の処理
を行う。
形領域に対しパターンマッチングにより文字認識しN+
1に該当する文字の候補を求める。
N+1は3となり、S12で求めた文字座標位置の4文
字目、S10で求めた文字矩形領域の5文字目の「形」
に当たる。ここで文字候補を配列T[N+1]に入れ
る。ここでは「形」に対し次の様に文字候補が選ばれた
とする。
であるか判断し、0の時はS21の処理を、0でないと
きはS20に処理を移す。
に該当する文字矩形領域の文字を決定する。
素とT[N][0..3]の各要素に対し辞書を検索し
熟語が存在するか検索する。熟語が存在するときはT
[N][0..3]の熟語が存在した要素のPERに対
し、T[N−1][0..3]の熟語の対になるPER
を加算する。N=2の時の例では「た」に対する文字候
補と「矩」に対する文字候補との組み合わせでは熟語が
存在しないのでPERの加算は行わない。
とT[N+1][0..3]の各要素に対し辞書を検索
し熟語が存在するか検索する。熟語が存在するときはT
[N][0..3]の熟語が存在した要素のPERに対
し、T[N+1][0..3]の熟語の対になるPER
を加算する。図11の例では最初はN=2となり、
「矩」に対する文字候補と「形」に対する文字候補との
組み合わせでは「矩形」という熟語が存在するので、T
[2][0]のPER35%に対しT[3][0]のP
ER70%を加算するのでT[2][0]のPERは1
05%となる。すなわち、T[2][0..3]の配列
は次の様になる。
大きい値を取る要素を文字として確定し、そのCODE
の値を認識結果を示す文字配列SのS[N]に代入す
る。
[2][0..3]の各要素の中でPERが一番大きい
のはT[2][0]であるため、T[2][0]のCO
DE「矩」がS[2]の値となる。そして、処理をS2
2に移す。
値が0であると判断したとき、すなわち認識開始文字の
前に文字が無い場合実行され、文字候補配列Tを参照し
変数Nに該当する文字矩形領域の文字を決定する。配列
T[N][0..3]の各要素とT[N+1][0..
3]の各要素に対し辞書を検索し熟語が存在するか検索
する。熟語が存在するときはT[N][0..3]の熟
語が存在した要素のPERに対し、T[N+1]
[0..3]の熟語の対になるPERを加算する。
Rの中で最も大きい値を取る要素を文字として確定し、
そのCODEの値を認識結果を示す文字配列SのS
[N]に代入する。そして、処理をS22に移す。
れ、認識結果の文字配列Sの要素のうち認識開始位置を
示すNSから表示文字数ND文字分表示メモリ17にキ
ャラクタ展開し、表示装置18(表示部3)に表示す
る。すなわちS[NS]からS[NS+ND−1]を表
示する。次にS23で処理する文字を示す変数Nに1加
算し、再び処理をS17に戻し後続する文字の認識を行
う。
の値が最後の文字と判断したとき実行され、処理する文
字を示すNの値が0であるか判断し、0の時はS26の
処理を、0でないときはS25に処理を移す。S25で
は文字候補配列Tを参照し変数Nに該当する文字矩形領
域の文字を決定する。配列T[N−1][0..3]の
各要素とT[N][0..3]の各要素に対し辞書を検
索し熟語が存在するか検索する。熟語が存在するときは
T[N][0..3]の熟語が存在した要素のPERに
対し、T[N−1][0..3]の熟語の対になるPE
Rを加算する。
Rの中で最も大きい値を取る要素を文字として確定し、
そのCODEの値を認識結果を示す文字配列SのS
[N]に代入する。そして、処理をS27に移す。
の値が0であると判断したとき、すなわちS12で求め
た文字位置が1文字分しかない時実行され、文字候補配
列T[N][0..3]の各要素のPERの中で最も大
きい値を取る要素を文字として確定し、そのCODEの
値を認識結果を示す配列SのS[N]に代入する。そし
て、処理をS27に移す。
れ、認識結果の文字配列Sの要素のうち認識開始位置を
示すNSから表示文字数ND文字分表示メモリ17にキ
ャラクタ展開し、表示装置18(表示部3)に表示す
る。すなわちS[NS]からS[NS+ND−1]を表
示する。以上でS9で求めた行領域の認識が終了したの
で、図5のS4に処理を移し、終了処理を行い割り込み
を終了する。
すと割り込みが発生し図7のフローチャートが実行され
る。
れ、入力画面で無い場合は本割り込みは終了され、入力
画面であると判断されると、S29の処理が実行され
る。S29で表示文字数を示す変数NDに1加算され、
S30で認識結果の文字配列Sの要素のうち認識開始位
置を示すNSから表示文字数ND文字分表示メモリ17
にキャラクタ展開し、表示装置18(表示部3)に表示
する。すなわちS[NS]からS[NS+ND−1]を
表示する。そして、割り込みを終了する。
すと割り込みが発生し図8のフローチャートが実行され
る。S31で入力画面であるかの判断が実施され、入力
画面で無い場合は本割り込みは終了され、入力画面であ
ると判断されると、S32の処理が実行される。
っているか判断し、文字が入っていない場合は最初の文
字決定前なので左側の文字の認識は行うことが出来ない
ため本割り込みは終了し、文字が入っているとS33の
処理が実行される。S33で認識開始位置を示すNSの
値が0であるか判断し、NSが0であると表示文字の前
に文字がないので本割り込みは終了され、0以外だとS
34の処理が実行される。
1であるか判断し、1の時はS37の処理を、1でない
ときはS35に処理を移す。S35では、NS−2に該
当する文字矩形領域に対しパターンマッチングにより文
字認識しNS−2に該当する文字の候補を求める。図1
1の例では最初はNSは2となるため、NS−2は0と
なり、S12で求めた文字座標位置の1文字目、S10
で求めた文字矩形領域の2文字目の「め」に当たる。こ
こで文字候補を配列T[NS−2]に入れる。
選ばれたとする そして、S36に処理を移す。
S−1に該当する文字矩形領域の文字を決定する。まず
配列T[NS−2][0..3]の各要素とT[NS−
1][0..3]の各要素に対し辞書を検索し熟語が存
在するか検索する。熟語が存在するときはT[NS−
1][0..3]の熟語が存在した要素のPERに対
し、T[NS−2][0..3]の熟語の対になるPE
Rを加算する。
「め」に対する文字候補と「た」に対する文字候補との
組み合わせでは「求めた」という熟語が存在するので、
T[1][0]のPER60%に対しT[0][0]の
PER40%を加算するのでT[1][0]のPERは
100%となる。次に配列T[NS−1][0..3]
の各要素とT[NS][0..3]の各要素に対し辞書
を検索し熟語が存在するか検索する。熟語が存在すると
きはT[NS−1][0..3]の熟語が存在した要素
のPERに対し、T[NS][0..3]の熟語の対に
なるPERを加算する。
「た」に対する文字候補と「矩」に対する文字候補との
組み合わせでは熟語が存在しないのでPERの加算は行
わない。
次の様になる。
で最も大きい値を取る要素を文字として確定し、そのC
ODEの値を認識結果を示す文字配列SのS[NS−
1]に代入する。
[1][0..3]の各要素の中でPERが一番大きい
のはT[1][0]であるため、T[1][0]のCO
DE「た」がS[1]の値となる。そして、処理をS3
8に移す。
Sの値が1であると判断したとき、すなわち認識開始位
置の前に文字が1文字分しかない時実行され、文字候補
配列Tを参照し変数NS−1に該当する文字矩形領域の
文字を決定する。配列T[NS−1][0..3]の各
要素とT[NS][0..3]の各要素に対し辞書を検
索し熟語が存在するか検索する。熟語が存在するときは
T[NS−1][0..3]の熟語が存在した要素のP
ERに対し、T[NS][0..3]の熟語の対になる
PERを加算する。次にT[NS−1][0..3]の
各要素のPERの中で最も大きい値を取る要素を文字と
して確定し、そのCODEの値を認識結果を示す文字配
列SのS[NS−1]に代入する。そして、処理をS3
8に移す。
文字認識開始位置を示すNSの値を1引き、表示文字数
を示すNDの値を1加算する。S39で認識結果の文字
配列Sの要素のうち認識開始位置を示すNSから表示文
字数ND文字分表示メモリ17にキャラクタ展開し、表
示装置18(表示部3)に表示する。すなわちS[N
S]からS[NS+ND−1]を表示する。そして、割
り込みを終了する。
と割り込みが発生し図9のフローチャートが実行され
る。S40で入力画面であるかの判断が実施され、入力
画面で無い場合は本割り込みは終了され、入力画面であ
ると判断されると、S41では、読取りスイッチによる
図5・6の割込処理を中止する。そして、S42では認
識結果の文字配列Sの要素のうち認識開始位置を示すN
Sから表示文字数ND文字の内容を電子辞書のキーワー
ドにして検索し、検索した内容を表示メモリ17に展開
し、表示装置18(表示部3)に表示する。そして、割
り込みを終了する。
入力画面で原稿を読み取りたい時に本装置のガイド板6
を本体より引き出し読取りスイッチ4を押し、図10に
示す原稿に対し認識開始位置19に読み取りたい文字が
来るように読取り窓7を見ながら読取り装置を置き、再
び読取りスイッチ4を押しスキャンする。そして、必要
とされる文字が表示されるまで右方向スイッチ5を入力
し、必要な文字が表示された後(図15)、検索スイッ
チ5を入力することにより、図16に示す辞書表示を得
ることが出来る。また、認識開始位置より前の文字を参
照する必要があるときは左方向スイッチを押すと良い。
実施するために、表示及びキー操作後に追加認識するた
めには、図6のS22とS23の間に図17の処理を追
加すると良い。ここでS43は右方向スイッチの割込が
発生し表示文字数を示すNDが加算されるまで、認識を
中断するための判断で、NDが加算されるまでS43を
繰り返し、NDが加算されると処理をS23に移す。
置を左上に移動し、図6のS13で認識開始位置の座標
を(0,0)にすると請求項12となる。
識開始位置とした場合図6のS9で下の行を抽出し、図
6のS12で文字位置座標決定する際図6のS10で求
めた文字矩形領域の左下を文字位置座標とし、S13で
認識開始位置の座標を(0,359)にすると良い。
3とS14の間に図18の処理を追加すると良い。ここ
でS44は図6のS10で設定しS12で補正した文字
数を示す変数Mと、S13で求めた認識開始文字を示す
変数NSを用い、表示文字数を示すNDを次の式で決定
する。
す文字配列Sに認識結果が反映された文字を順次表示す
ることが出来る。
9・10・11・13・14を用いたときの画像読取・
認識の実施例を図19・20・21・22・23に示す
フローチャートに従い説明する。また、請求項12を実
施する場合の変更点を本実施例の後半に記す。
に本装置のガイド板6を本体より引き出し読取りスイッ
チ4を押す。本実施例の文字認識装置の読取りスイッチ
4がおされたことにより割り込みが発生すると図19の
処理が実行される。
リの初期化とワークの確保を実施する。ここで、表示文
字列数を示す変数WDを1、処理中の文字列を示す変数
Wと読取り開始位置を示す変数WSを0に、認識結果が
入る文字列配列へのポインタの配列Jの要素を文字が入
っていないことを意味する0にする。S46においてラ
インセンサ12と画像処理回路13とエンコーダ14と
DMAコントローラ15の初期化を行い読み取りの準備
を実施する。S47にて表示部3が文字入力画面かどう
かの判定を行い、文字入力画面で無ければ終了処理とし
てS48に処理を移し、S48にてスキャナ部のハード
のOFF処理を行い、S49でS45で確保したワーク
を解放し割り込みを終了する。
はS50に処理を移し、読取りスイッチが押されたかど
うか判定し、押されていない場合はS47に処理を移し
読取りスイッチが押されるまでS47とS50の処理を
繰り返す。
位置19に読み取りたい文字列が来るように読取り窓7
を見ながら読取り装置を置く。ここでは図24の原稿の
3行目の「in preparation for」を
読み取りたいものとする。置いた後使用者は再び読取り
スイッチ4を押す。スイッチ4が再び押されたことによ
りS50からS51に処理が移る。使用者は読取り部2
を本体とともに矢印8のラインスキャナの副走査方向に
スライド移動することにより読取り窓7から見える原稿
を読取る。S51ではラインセンサで読取った画像を画
像処理回路13で2値化し、エンコーダ14で副走査方
向の移動が検出された時、2値化された画像はDMAコ
ントローラ15にて、RAM11にラインセンサの1ラ
イン分転送され、RAM11には画像データとして配列
Dに次のように蓄積される。
なり白の時は0 X座標:0−1023 (左が0) Y座標:0−359 (上が0) 蓄積された画像は図25に示す画像となる。
識が実施される。行認識は図12の式に示すように黒の
数を横方向にカウントすることにより実施する。行間の
部分はカウントないため、配列Hの最大値に対し64分
の1以下の部分を行間とすることにより行間を求めるこ
とが出来る。図25の画像では行間を区切りとすると文
字の行は次の行矩形位置に存在する。
了位置,Y座標終了位置) 次にS53にて、S52で求めた行矩形領域に対し認識
を実施する行の抽出を行う。
る。ここで1行目はY座標開始位置が画面の上端を示す
0をとるため、1行目は画面の上端に接しており情報が
欠けていると判断されるため、2行目の矩形領域を認識
領域として用いる。S54においてS53で求めた行の
矩形領域に対し、文字列の矩形領域を求める。
行矩形領域に対し黒の数を縦方向にカウントすることに
より行う。文字間の部分はカウントされてないため、配
列Vの最大値に対し32分の1以下の部分が行のY方向
幅の4分の1以上連続する部分を文字間とすることによ
り文字間を求めることが出来る。
−62=66となるので66/4=16以上、配列Vの
最大値に対し32分の1以下の部分が連続する部分を文
字間とする。図25の2行目の画像では文字列間を区切
りとすると文字列は次の矩形位置に存在する。
了位置,Y座標終了位置)ここで求めた文字列数を変数
Rに代入し処理をS55に移す。
求めた文字列数Rが0であるならば、読取りミスとして
S48に処理を移し終了処理を行い割り込みを終了し、
Rが0でないならば、S56に処理を移す。S56はS
54で求めた文字列に対して位置座標を決める。
始位置が画像の左端を示す0をとるため、画面に左端に
接していると判断できるため、1文字列目を認識対象か
ら除外し、S54で求めた文字列矩形領域の2文字列目
を1文字列目として位置座標を求める。最後の文字列に
関してもX座標終了位置が画面の右端を示す1023の
値をとるならば認識対象から除外する。また、画面に接
していると判断して文字列位置座標から除外したときは
文字列数を示すRの値も除外した文字列数に応じて減ら
す。図25の例では文字列矩形領域の左上の部分を位置
座標とするので次の通りとなる。
し認識開始位置20に最も近い文字列を求める。
(300,0)であるため2文字列目となる。その値を
処理文字列を示す変数W及び文字列開始位置を示す変数
WSに入れる。ここで変数W及びWSの取る値は1文字
列目が0となるため1となる。
す変数Wと文字数を示す変数Rと比較しW<R−1なら
処理する文字列があるとして、S59に処理を移し、W
<Rで無いならば処理する文字がないので、S48に処
理を移し割込の終了を実施する。S59では、変数Wに
該当する文字列矩形領域に対しパターンマッチング等に
より文字列認識する。認識結果をワークに入れ、その先
頭文字のポインタをJ[W]に入れる。
S56で求めた文字列座標位置の2文字列目、S54で
求めた文字列矩形領域の3文字列目の”in”に当た
る。”in”の認識結果に対しワークを確保しその’
i’のアドレスを示すポインタをJ[1]に入れる。次
にS60で、認識結果の文字列ポインタ配列Jの要素の
うち認識開始位置を示すWSから表示文字列数WD文字
列分表示メモリ17にキャラクタ展開し、表示装置18
(表示部3)に表示する。すなわちJ[WS]からJ
[WS+WD−1]が指すアドレスポインタの文字列を
表示する。次にS61で処理する文字列を示す変数Wに
1加算し、再び処理をS58に戻し後続する文字列の認
識を行う。
すと割り込みが発生し図21のフローチャートが実行さ
れる。S62で入力画面であるかの判断が実施され、入
力画面で無い場合は本割り込みは終了され、入力画面で
あると判断されると、S63の処理が実行される。S6
3で表示文字列数を示す変数WDに1加算され、S64
で認識結果の文字列ポインタ配列Jの要素のうち認識開
始位置を示すWSから表示文字列数WD文字列分表示メ
モリ17にキャラクタ展開し、表示装置18(表示部
3)に表示する。すなわちJ[WS]からJ[WS+W
D−1]が指すアドレスポインタの文字列を表示する。
そして、割り込みを終了する。
すと割り込みが発生し図22のフローチャートが実行さ
れる。S65で入力画面であるかの判断が実施され、入
力画面で無い場合は本割り込みは終了され、入力画面で
あると判断されると、S66の処理が実行される。
に文字列が入っているか判断し、文字列が入っていない
場合は最初の文字列決定前なので左側の文字列の認識は
行うことが出来ないため本割り込みは終了し、文字列が
入っているとS67の処理が実行される。S67で認識
開始位置を示すWSの値が0であるか判断し、WSが0
であると表示文字列の前に文字列がないので本割り込み
は終了され、0以外だとS68の処理が実行される。
列矩形領域に対しパターンマッチング等により文字列認
識する。認識結果をワークに入れ、その先頭文字のポイ
ンタをJ[WS−1]に入れる。図25の例では最初は
WSは1となるため、S56で求めた文字列座標位置の
1文字列目、S54で求めた文字列矩形領域の2文字列
目の”equipment”に当たる。”equipm
ent”の認識結果に対しワークを確保しその’e’の
アドレスを示すポインタをJ[0]に入れる。S69
で、文字列認識開始位置を示すWSの値を1引き、表示
文字列数を示すWDの値を1加算する。次にS70で、
認識結果の文字列ポインタ配列Jの要素のうち認識開始
位置を示すWSから表示文字列数WD文字列分表示メモ
リ17にキャラクタ展開し、表示装置18(表示部3)
に表示する。すなわちJ[WS]からJ[WS+WD−
1]が指すアドレスポインタの文字列を表示する。
と割り込みが発生し図23のフローチャートが実行され
る。S71で入力画面であるかの判断が実施され、入力
画面で無い場合は本割り込みは終了され、入力画面であ
ると判断されると、S72で、読取りスイッチによる図
19・20の割込処理のタスクを中止する。そして、S
73では認識結果の文字列ポインタ配列Jの要素のうち
認識開始位置を示すWSから表示文字数WD文字列の内
容を電子辞書のキーワードにして検索し、検索した内容
を表示メモリ17に展開し、表示装置18(表示部3)
に表示する。そして、割り込みを終了する。
入力画面で原稿を読み取りたい時に本装置のガイド板6
を本体より引き出し読取りスイッチ4を押し、図24に
示す原稿に対し認識開始位置20に読み取りたい文字列
が来るように読取り窓7を見ながら読取り装置を置き、
再び読取りスイッチ4を押しスキャンする。そして、必
要とされる文字列が表示されるまで右方向スイッチ5を
入力し、必要な文字列が表示された後(図27)、検索
スイッチ5を入力することにより、図28に示す辞書表
示を得ることが出来る。また、認識開始位置より前の文
字列を参照する必要があるときは左方向スイッチを押す
と良い。
置を左上に移動し、図20のS57で認識開始位置の座
標を(0,0)にすると請求項12となる。
識開始位置とした場合図20のS53で下の行を抽出
し、図20のS56で文字列位置座標決定する際のS5
4で求めた文字列矩形領域の左下を文字列位置座標と
し、S57で認識開始位置の座標を(0,359)にす
ると良い。
を実施するために、表示及びキー操作後に追加認識する
ためには、図20のS60とS61の間に図29の処理
を追加すると良い。ここでS74は右方向スイッチの割
込が発生し表示文字列数を示すWDが加算されるまで、
認識を中断するための判断で、WDが加算されるまでS
74を繰り返し、WDが加算されると処理をS61に移
す。
きの画像読取・認識の実施例を図30に示すフローチャ
ート及び、実施例1及び実施例2に追記する形で説明す
る。
で原稿を読み取りたい時に本装置のガイド板6を本体よ
り引き出し読取りスイッチ4を押す。本実施例の文字認
識装置の読取りスイッチ4がおされたことにより割り込
みが発生すると図30の処理が実行される。S75にお
いて現在使用中のアプリケーションの入力画面が、英和
辞書等の英語入力のアプリケーションか和英辞書等の日
本語入力のアプリケーションか判断する。英語入力の場
合はS76に処理を移し、日本語入力の場合はS79に
処理を移す。
きは、S76にて右方向スイッチが押されたときの割り
込み処理を図7のS28に設定し、S77にて左方向ス
イッチが押されたときの割り込み処理を図8のS31に
設定し、S78にて検索スイッチが押されたときの割り
込み処理を図9のS40に設定する。そして図5のS1
に処理を移し実施例1を実行するS75において英語入
力と判断されたときは、S79にて右方向スイッチが押
されたときの割り込み処理を図21のS62に設定し、
S80にて左方向スイッチが押されたときの割り込み処
理を図22のS65に設定し、S81にて検索スイッチ
が押されたときの割り込み処理を図23のS71に設定
する。そして図19のS45処理を移し実施例2を実行
する。
ンの入力画面が、英和辞書等の英語入力のアプリケーシ
ョンの時は文字列認識を行い、和英辞書等の日本語入力
のアプリケーションの時は文字認識を行うことを切り換
えることが可能となる。
い原稿の必要な文字を目視で確認した後スキャンする
と、読み取った画像に対して、文字認識することが出来
る。読取った画像の確認をする必要が無いため、文字認
識した結果を表示する簡単な表示装置でユーザーインタ
ーフェースを確立することが可能となる。文字認識する
部分も画像全体のうちの一部であるため、文字認識時間
も少なくて済む。文字認識部分は目視にて確認するた
め、位置の指定も容易になる。また、キーボード入力の
ように読みが解らない文字も入力可能とし、操作キーも
最小限になるので、操作の容易性と入力速度の向上が可
能となり、装置の小型化が可能となる。特に携帯機器に
用いた場合、携帯機器の入力デバイスはサイズ等の制限
が多いため、操作性の向上は大きいものとなる。以下
に、請求項ごとの効果を記す。
の原稿に対し本請求項は効果があり、入力したい原稿の
必要な文字を目視をしながらスキャンすると必要な文字
を認識することが出来る。
原稿に対し本請求項は効果があり、入力したい原稿の必
要な文字を目視をしながらスキャンすると必要な文字列
を認識することが出来る。
原稿の必要な行を目視をしながらスキャンすると必要な
行を認識することが出来る。
の原稿に対し本請求項は効果があり、入力したい原稿の
必要な文字を目視をしながらスキャンすると必要な文字
を認識することが出来、この時周囲の文字を参照し文字
認識の補正を行うため、認識率の向上が期待できる。
の原稿に対し本請求項は効果があり、入力したい原稿の
必要な文字又は文字列を目視をしながらスキャンすると
必要な文字以降の文字列を認識することが出来る。ま
た、必要な文字数をキーにより指示するようにすると必
要な文字列を容易に得ることが出来る。
原稿に対し本請求項は効果があり、入力したい原稿の必
要な文字列を目視をしながらスキャンすると必要な文字
列以降の文字列を認識することが出来る。また、必要な
文字列数をキーにより指示するようにすると必要な文字
列を容易に得ることが出来る。
の原稿に対し本請求項は効果があり、入力したい原稿の
必要な文字又は文字列を目視をしながらスキャンし、必
要な文字数が得られるまで追加の操作を行うのみで必要
な文字列を認識することが出来る。また、追加の操作後
文字認識するように構成すると、追加の操作を実施する
までの間文字認識は実施しないので、その間に検索準備
等の別のタスクを実施することも可能で、またその間低
消費電力モードにすると節電することが可能となる。
原稿に対し本請求項は効果があり、入力したい原稿の必
要な文字列を目視をしながらスキャンし、必要な文字列
数が得られるまで追加の操作を行うのみで必要な文字列
を認識することが出来る。また、追加の操作後文字認識
するように構成すると、追加の操作を実施するまでの間
文字認識は実施しないので、その間に検索準備等の別の
タスクを実施することも可能で、またその間低消費電力
モードにすると節電することが可能となる。
以外の文字の一部をスキャンしたときも、必要な文字を
得ることを可能とし、使用性の向上が得られる。
文字列の領域の認識は限られた行のみ認識するため速度
の向上が得られる。
以外の部分をスキャンしても行単位で必要な行を切り出
すため、請求項5・6・7・8と組み合わせて実施する
ことにより、後続する文字を一つの行で抽出する事が可
能とする。
報をアプリケーションの入力文字として直接用いること
を可能とするため、アプリケーション機器のキーボード
等の入力デバイスの操作が不要になり、入力文字が多い
場合は入力の高速化を可能とする。
ーションを実施する時入力する文字が原稿に印刷されて
いる場合、使用者は必要な文字が入るように原稿をスキ
ャンすると、文字または文字列の認識結果がアプリケー
ションの入力文字となり入力の利便性が向上する。
報を電子辞書の入力文字として直接用いることを可能と
するため、電子辞書のキーボード等の入力デバイスの操
作が不要になり、入力文字が多い場合は入力の高速化を
可能とする。
ーション又は辞書の入力画面が欧文を要求する時は、例
えば英和辞書の入力に用いる時は、文字列により文字入
力を可能とするため、入力したい語を容易に確定するこ
とが出来る。また、入力画面が和文を要求する時は、例
えば和英辞書の入力に用いる時は、1文字ずつの文字入
力を可能とするため、必要な文字数入力することが出来
る。そして、入力する言語に応じて認識方法・認識辞書
を変えることも可能となるので認識率の向上を図ること
が出来る。
る。
きの割込処理フローチャート1である。
きの割込処理フローチャート2である。
きの割込処理フローチャートである。
きの割込処理フローチャートである。
の割込処理フローチャートである。
ある。
る。
フを示す図である。
ント式を示す図である。
である。
である。
追加フローチャートである。
追加フローチャートである。
ときの割込処理フローチャート1である。
ときの割込処理フローチャート2である。
ときの割込処理フローチャートである。
ときの割込処理フローチャートである。
きの割込処理フローチャートである。
ある。
ウント式を示す図である。
である。
である。
追加フローチャートである。
ある。
Claims (16)
- 【請求項1】原稿の読取領域を目視でき、読み取りたい
文字に位置合わせするための認識開始位置が示された読
取領域目視窓と、 前記読取領域目視窓から原稿の画像データを読み取る読
取部とを備え、 原稿上を走査して文字を認識する文字認識装置であっ
て、 前記読取部に読み取られた 前記画像データを記憶する記
憶部と、前記記憶部に記憶された前記 画像データに対して文字の
矩形領域を求める文字矩形領域認識部と、前記 文字矩形領域認識部で求めた矩形領域に対し文字コ
ードに変換する文字認識部とを備え、 前記文字認識部は、前記 文字矩形領域認識部で求めた矩
形領域の位置座標を求め、前記読取領域目視窓のあらか
じめ決められた一点に最も近接した位置座標を持つ矩形
領域に対し文字コードに変換することを特徴とする文字
認識装置。 - 【請求項2】原稿の読取領域を目視でき、読み取りたい
文字に位置合わせするための認識開始位置が示された読
取領域目視窓と、 前記読取領域目視窓から原稿の画像データを読み取る読
取部とを備え、 原稿上を走査して文字を認識する文字認識装置であっ
て、 前記読取部に読み取られた 前記画像データを記憶する記
憶部と、前記記憶部に記憶された前記 画像データに対して文字列
の矩形領域を求める文字列矩形領域認識部と、前記 文字列矩形領域認識部で求めた矩形領域に対し文字
コードに変換する文字認識部とを備え、 前記文字認識部は、前記 文字列矩形領域認識部で求めた
矩形領域の位置座標を求め、前記読取領域目視窓のあら
かじめ決められた一点に最も近接した位置座標を持つ矩
形領域に対し文字コードに変換することを特徴とする文
字認識装置。 - 【請求項3】原稿の読取領域を目視でき、読み取りたい
文字に位置合わせするための認識開 始位置が示された読
取領域目視窓と、 前記読取領域目視窓から原稿の画像データを読み取る読
取部とを備え、 原稿上を走査して文字を認識する文字認識装置であっ
て、 前記読取部に読み取られた 前記画像データを記憶する記
憶部と、前記記憶部に記憶された前記 画像データに対して行領域
の位置を求める行領域認識部と、前記 行領域認識部で求めた行領域に対し文字コードに変
換する文字認識部とを備え、 前記文字認識部は、前記行領域 認識部で求めた行領域の
位置座標を求め、前記読取領域目視窓のあらかじめ決め
られた一点に最も近接した位置座標を持つ行領域に対し
文字コードに変換することを特徴とする文字認識装置。 - 【請求項4】請求項1記載の文字認識装置において、前
記文字認識部は、あらかじめ決められた一点に最も近接
した位置座標を持つ文字矩形領域の文字に対する文字コ
ードの候補と、前記文字矩形領域の周辺の文字矩形領域
の文字に対する文字コードの候補とを求め、前記周辺の
文字矩形領域の文字に対する文字コードの候補と言語的
特性により関連付けすることによって、前記あらかじめ
決められた一点に最も近接した位置座標を持つ文字矩形
領域の文字に対する文字コードの候補から文字を確定す
ることを特徴とする文字認識装置。 - 【請求項5】請求項1記載の文字認識装置において、前
記文字認識部は、あらかじめ決められた一点に最も近接
した文字の位置座標を持つ文字矩形領域に対し文字コー
ドに変換した後、先に認識した文字と同じ行にあり後続
する文字矩形領域に対しても文字コードに変換を行い、
後に変換した文字コードを先に認識した文字コードに追
加して文字列を生成することを特徴とする文字認識装
置。 - 【請求項6】請求項2記載の文字認識装置において、前
記文字認識部は、あらかじめ決められた一点に最も近接
した文字列の位置座標を持つ文字列矩形領域に対し文字
コードに変換した後、先に認識した文字列と同じ行にあ
り後続する文字列矩形領域に対しても文字コードに変換
を行い、後に変換した文字コードを先に認識した文字コ
ードに追加して文字列を生成することを特徴とする文字
認識装置。 - 【請求項7】請求項1記載の文字認識装置において、表
示装置及びスイッチ等の入力装置を備え、文字認識した
文字を表示装置にて表示後、入力装置により方向を指示
することにより、既に表示してある文字又は文字列が位
置する文字矩形領域に対し指示された方向に隣接する文
字の文字矩形領域に対して文字認識部にて文字コードに
変換した文字コードを、既に表示している文字又は文字
列に追加して表示を行うことを特徴とする文字認識装
置。 - 【請求項8】請求項2記載の文字認識装置において、表
示装置及びスイッチ等の入力装置を備え、文字認識した
文字列を表示装置にて表示後、入力装置により方向を指
示することにより、既に表示してある文字列が位置する
文字列矩形領域に対し指示された方向に隣接する文字列
の文字列矩形領域に対して文字認識部にて文字コードに
変換した文字コードを、既に表示している文字列に追加
して表示を行うことを特徴とする文字認識装置。 - 【請求項9】請求項1記載の文字認識装置において、文
字矩形領域認識部又は文字列矩形領域認識部又は行領域
認識部は求めた文字矩形領域又は文字列矩形領域又は行
領域が、画像データの端に接している時は、文字又は文
字列が画面の端にあり文字が欠けている判断し、文字矩
形領域又は文字列矩形領域又は行領域から除外すること
を特徴とする文字認識装置。 - 【請求項10】請求項1記載の文字認識装置において、
文字矩形領域認識部又は文字列矩形領域認識部は、矩形
部位の認識を行う際、最初に行の矩形範囲の認識を行
い、その行の矩形範囲より、あらかじめ決められた一点
に近接する行に対して文字矩形認識又は文字列矩形認識
を行うことを特徴とする文字認識装置。 - 【請求項11】請求項10記載の文字認識装置におい
て、求めた行の矩形範囲が、画像データの端に接してい
る時は、文字又は文字列が画面の端にあり文字が欠けて
いる判断し、行の矩形範囲から除外することを特徴とす
る文字認識装置。 - 【請求項12】請求項11記載の文字認識装置におい
て、あらかじめ決められた一点を画像データの左上又は
左下又は右上又は右下の一点とし、文字又は文字列の位
置座標も文字矩形領域又は文字列矩形領域の左上又は左
下又は右上又は右下とすることを特徴とする文字認識装
置。 - 【請求項13】請求項12記載の文字認識装置におい
て、アプリケーションの機能を備え、文字画像より文字
認識を行い文字コードに変換した文字又は文字列をアプ
リケーションの入力文字として用いることを特徴とする
文字認識装置。 - 【請求項14】請求項12記載の文字認識装置におい
て、電子辞書の機能を備え、文字画像より文字認識を行
い文字コードに変換した文字又は文字列を辞書の検索文
字として用いることを特徴とする文字認識装置。 - 【請求項15】請求項13記載の文字認識装置におい
て、アプリケーション又は辞書機能が入力文字として欧
文を必要としている時は、画像データに対し文字列矩形
領域認識部で求めた矩形領域より文字列の位置座標を求
め、あらかじめ決められた一点に最も近接した文字列の
位置座標を持つ文字列矩形領域に対し文字認識部にて文
字コードに変換することによる文字入力を行い、アプリ
ケーション又は辞書機能が入力文字として和文又は漢文
を必要としている時は、画像データに対し文字矩形領域
認識部で求めた矩形領域より文字の位置座標を求め、あ
らかじめ決められた一点に最も近接した文字の位置座標
を持つ文字矩形領域に対し文字認識部にて文字コードに
変換することによる文字入力を行うことを特徴とする文
字認識装置。 - 【請求項16】原稿の読取領域を目視でき、読み取りた
い文字に位置合わせするための認識開始位置が示された
読取領域目視窓で認識開始位置をあわせて原稿を走査
し、走査で得た画像データを記憶し、記憶した画像デー
タに対して文字の矩形領域を求め 、求めた矩形領域より
文字の位置座標を求め、あらかじめ決められた一点に最
も近接した文字の位置座標を持つ矩形領域に対して文字
コードに変換することを特徴とする文字認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP19522198A JP3476680B2 (ja) | 1998-07-10 | 1998-07-10 | 文字認識装置および文字認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP19522198A JP3476680B2 (ja) | 1998-07-10 | 1998-07-10 | 文字認識装置および文字認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000029984A JP2000029984A (ja) | 2000-01-28 |
JP3476680B2 true JP3476680B2 (ja) | 2003-12-10 |
Family
ID=16337490
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP19522198A Expired - Fee Related JP3476680B2 (ja) | 1998-07-10 | 1998-07-10 | 文字認識装置および文字認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3476680B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE60327736D1 (de) | 2002-12-26 | 2009-07-09 | Canon Kk | Bildverarbeitungsapparatur und Bildverarbeitungsverfahren |
US20060045346A1 (en) * | 2004-08-26 | 2006-03-02 | Hui Zhou | Method and apparatus for locating and extracting captions in a digital image |
-
1998
- 1998-07-10 JP JP19522198A patent/JP3476680B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000029984A (ja) | 2000-01-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6766069B1 (en) | Text selection from images of documents using auto-completion | |
EP0854434B1 (en) | Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof | |
US4903311A (en) | Character region extracting method and apparatus capable of implementing the method | |
JPH06274680A (ja) | 文書認識方法およびシステム | |
JP2001175807A (ja) | テキスト領域選択方法 | |
JPH03122773A (ja) | 画像形成装置 | |
JP2713622B2 (ja) | 表形式文書読取装置 | |
JPS63155386A (ja) | 帳票デ−タ読取装置 | |
US4941195A (en) | Optical character reader | |
JP4443194B2 (ja) | 携帯端末の文字認識における処理対象選択方法および携帯端末 | |
JPH0554073A (ja) | デジタル翻訳装置 | |
JP3476680B2 (ja) | 文字認識装置および文字認識方法 | |
EP0766193B1 (en) | Optical character reader with skew correction | |
US5638466A (en) | Method and apparatus for deskewing images of symbols having a non-linear baseline | |
JPH08180068A (ja) | 電子ファイリング装置 | |
KR19980058361A (ko) | 한글 문자 인식 방법 및 시스템 | |
KR20050003075A (ko) | 문자인식기능과 전자사전을 구비하는 휴대통신장치및 문자인식기능을 구비하는 전자사전 | |
JP2000082110A (ja) | 罫線消去装置および文字画像抽出装置および罫線消去方法および文字画像抽出方法および記録媒体 | |
JPH06131111A (ja) | 文字認識装置及び文字認識方法 | |
JPH06150056A (ja) | 表認識装置 | |
JPH05120472A (ja) | 文字認識装置 | |
JP2002157550A (ja) | 文字認識装置、文字認識方法、および記録媒体 | |
JPH06149888A (ja) | 電子ファイリングシステム | |
JPH09152957A (ja) | 画像表示制御装置および方法 | |
JPH05120471A (ja) | 文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20030916 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080926 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080926 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090926 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090926 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100926 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110926 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120926 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130926 Year of fee payment: 10 |
|
LAPS | Cancellation because of no payment of annual fees |