JP3476680B2 - 文字認識装置および文字認識方法 - Google Patents

文字認識装置および文字認識方法

Info

Publication number
JP3476680B2
JP3476680B2 JP19522198A JP19522198A JP3476680B2 JP 3476680 B2 JP3476680 B2 JP 3476680B2 JP 19522198 A JP19522198 A JP 19522198A JP 19522198 A JP19522198 A JP 19522198A JP 3476680 B2 JP3476680 B2 JP 3476680B2
Authority
JP
Japan
Prior art keywords
character
recognition
area
rectangular area
string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP19522198A
Other languages
English (en)
Other versions
JP2000029984A (ja
Inventor
孝和 永坂
克治 永井
成一郎 三木
英幸 ▲廣▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP19522198A priority Critical patent/JP3476680B2/ja
Publication of JP2000029984A publication Critical patent/JP2000029984A/ja
Application granted granted Critical
Publication of JP3476680B2 publication Critical patent/JP3476680B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、新聞・雑誌等の文
字情報を認識し、認識した情報を用いてアプリケーショ
ンで用いることを可能にする、文字認識装置および文字
認識方法に関するものである。
【0002】
【従来の技術】パーソナルコンピュータ等の情報機器に
スキャナ等を使用して文書を画像データとして取り込
み、その画像データを文字として認識しJISコード等
の文字コードに変換するOCR(光学式文字認識)装置
が普及している。OCR機能は新聞・雑誌等の印刷物の
状態にある画像データを文字コードに変換し保存や編集
するのに用いられる。通常のOCRは画像データ全体を
一括して文字認識する。しかし、OCRが必要な部分が
画像データ全体の一部しか必要のない場合は、画像全体
をOCRするのに時間を要する、必要な画像データ部分
とOCRした結果との関連付けを行うのに手間がかかる
不都合が生じる。
【0003】この問題を解決するため、次の様な解決方
法があった。マウスやタブレット等のポインティングデ
バイスでOCRする部分を指定して、指定した部分をO
CRする方法(特開平6−131111号公報)。必要
な部分のみをスキャナで読込む方法(特開平5−274
346号公報)。
【0004】
【発明が解決しようとする課題】マウスやタブレット等
のポインティングデバイスでOCRする部分を指定し
て、指定した部分をOCRする方法では、読取った画像
全体又は画像の一部を表示するためには画像で文字が確
認できることを可能とする高解像度の表示装置が必要で
あった。又、表示装置よりポインティングデバイスでO
CR部分を指示する手間が必要であった。
【0005】必要な部分のみをスキャナで読込む方法は
読込む部位をスキャンする操作に慣れを要し、読込む原
稿の文字が小さい時はスキャンする場所を指定するのが
困難であったり、文字が大きい場合はスキャン出来ない
場合があった。
【0006】
【課題を解決するための手段】請求項1記載の文字認識
装置は、原稿の読取領域を目視でき、読み取りたい文字
に位置合わせするための認識開始位置が示された読取領
域目視窓と、前記読取領域目視窓から原稿の画像データ
を読み取る読取部とを備え、原稿上を走査して文字を認
識する文字認識装置であって、前記読取部に読み取られ
前記画像データを記憶する記憶部と、前記記憶部に記
憶された前記画像データに対して文字の矩形領域を求め
る文字矩形領域認識部と、前記文字矩形領域認識部で求
めた矩形領域に対し文字コードに変換する文字認識部
を備え、前記文字認識部は、前記文字矩形領域認識部で
求めた矩形領域の位置座標を求め、前記読取領域目視窓
あらかじめ決められた一点に最も近接した位置座標を
つ矩形領域に対し文字コードに変換することを特徴と
する文字認識装置である。
【0007】請求項2記載の文字認識装置は、原稿の読
取領域を目視でき、読み取りたい文字に位置合わせする
ための認識開始位置が示された読取領域目視窓と、前記
読取領域目視窓から原稿の画像データを読み取る読取部
とを備え、原稿上を走査して文字を認識する文字認識装
置であって、前記読取部に読み取られた前記画像データ
を記憶する記憶部と、前記記憶部に記憶された前記画像
データに対して文字列の矩形領域を求める文字列矩形
認識部と、前記文字列矩形領域認識部で求めた矩形領
域に対し文字コードに変換する文字認識部を備え、前
記文字認識部は、前記文字列矩形領域認識部で求めた矩
形領域の位置座標を求め、前記読取領域目視窓のあらか
じめ決められた一点に最も近接した位置座標を持つ矩
領域に対し文字コードに変換することを特徴とする文字
認識装置である。
【0008】請求項3記載の文字認識装置は、原稿の読
取領域を目視でき、読み取りたい文字に位置合わせする
ための認識開始位置が示された読取領域目視窓と、前記
読取領域目視窓から原稿の画像データを読み取る読取部
とを備え、原稿上を走査して文字を認識する文字認識装
置であって、前記読取部に読み取られた前記画像データ
を記憶する記憶部と、前記記憶部に記憶された前記画像
データに対して行領域の位置を求める行領域認識部と、
前記領域認識部で求めた行領域に対し文字コードに変
換する文字認識部を備え、前記文字認識部は、前記行
領域認識部で求めた行領域の位置座標を求め、前記読取
領域目視窓のあらかじめ決められた一点に最も近接し
置座標を持つ行領域に対し文字コードに変換すること
を特徴とする文字認識装置である。
【0009】請求項4記載の文字認識装置は、請求項1
記載の文字認識装置において、前記文字認識部は、あら
かじめ決められた一点に最も近接した位置座標を持つ
字矩形領域の文字に対する文字コードの候補と、前記
字矩形領域の周辺の文字矩形領域の文字に対する文字コ
ードの候補を求め、前記周辺の文字矩形領域の文字
対する文字コードの候補と言語的特性により関連付け
ることによって、前記あらかじめ決められた一点に最も
近接した位置座標を持つ文字矩形領域の文字に対する文
字コードの候補から文字を確定することを特徴とする文
字認識装置である。
【0010】請求項5記載の文字認識装置は、請求項1
記載の文字認識装置において、前記文字認識部は、あら
かじめ決められた一点に最も近接した文字の位置座標を
持つ文字矩形領域に対し文字コードに変換した後、先に
認識した文字と同じ行にあり後続する文字矩形領域に対
しても文字コードに変換を行い、後に変換した文字コー
ドを先に認識した文字コードに追加して文字列を生成す
ることを特徴とする文字認識装置である。
【0011】請求項6記載の文字認識装置は、請求項2
記載の文字認識装置において、前記文字認識部は、あら
かじめ決められた一点に最も近接した文字列の位置座標
を持つ文字列矩形領域に対し文字コードに変換した後、
先に認識した文字列と同じ行にあり後続する文字列矩形
領域に対しても文字コードに変換を行い、後に変換した
文字コードを先に認識した文字コードに追加して文字列
を生成することを特徴とする文字認識装置である。
【0012】請求項7記載の文字認識装置は、請求項1
記載の文字認識装置において、表示装置及びスイッチ等
の入力装置を備え、文字認識した文字を表示装置にて表
示後、入力装置により方向を指示することにより、既に
表示してある文字又は文字列が位置する文字矩形領域に
対し指示された方向に隣接する文字の文字矩形領域に対
して文字認識部にて文字コードに変換した文字コード
を、既に表示している文字又は文字列に追加して表示を
行うことを特徴とする文字認識装置である。
【0013】請求項8記載の文字認識装置は、請求項2
記載の文字認識装置において、表示装置及びスイッチ等
の入力装置を備え、文字認識した文字列を表示装置にて
表示後、入力装置により方向を指示することにより、既
に表示してある文字列が位置する文字列矩形領域に対し
指示された方向に隣接する文字列の文字列矩形領域に対
して文字認識部にて文字コードに変換した文字コード
を、既に表示している文字列に追加して表示を行うこと
を特徴とする文字認識装置である。
【0014】請求項9記載の文字認識装置は、請求項1
記載の文字認識装置において、文字矩形領域認識部又は
文字列矩形領域認識部又は行領域認識部は求めた文字矩
形領域又は文字列矩形領域又は行領域が、画像データの
端に接している時は、文字又は文字列が画面の端にあり
文字が欠けている判断し、文字矩形領域又は文字列矩形
領域又は行領域から除外することを特徴とする文字認識
装置である。
【0015】請求項10記載の文字認識装置は、請求項
1記載の文字認識装置において、文字矩形領域認識部又
は文字列矩形領域認識部は、矩形部位の認識を行う際、
最初に行の矩形範囲の認識を行い、その行の矩形範囲よ
り、あらかじめ決められた一点に近接する行に対して文
字矩形認識又は文字列矩形認識を行うことを特徴とする
文字認識装置である。
【0016】請求項11記載の文字認識装置は、請求項
10記載の文字認識装置において、求めた行の矩形範囲
が、画像データの端に接している時は、文字又は文字列
が画面の端にあり文字が欠けている判断し、行の矩形範
囲から除外することを特徴とする文字認識装置である。
【0017】請求項12記載の文字認識装置は、請求項
11記載の文字認識装置において、あらかじめ決められ
た一点を画像データの左上又は左下又は右上又は右下の
一点とし、文字又は文字列位置座標も文字矩形領域又
は文字列矩形領域の左上又は左下又は右上又は右下とす
ることを特徴とする文字認識装置である。
【0018】請求項13記載の文字認識装置は、請求項
12記載の文字認識装置において、アプリケーションの
機能を備え、文字画像より文字認識を行い文字コードに
変換した文字又は文字列をアプリケーションの入力文字
として用いることを特徴とする文字認識装置である。
【0019】請求項14記載の文字認識装置は、請求項
12記載の文字認識装置において、電子辞書の機能を備
え、文字画像より文字認識を行い文字コードに変換した
文字又は文字列を辞書の検索文字として用いることを特
徴とする文字認識装置である。
【0020】請求項15記載の文字認識装置は、請求項
13記載の文字認識装置において、アプリケーション又
は辞書機能が入力文字として欧文を必要としている時
は、画像データに対し文字列矩形領域認識部で求めた矩
形領域より文字列の位置座標を求め、あらかじめ決めら
れた一点に最も近接した文字列の位置座標を持つ文字列
矩形領域に対し文字認識部にて文字コードに変換するこ
とによる文字入力を行い、アプリケーション又は辞書機
能が入力文字として和文又は漢文を必要としている時
は、画像データに対し文字矩形領域認識部で求めた矩形
領域より文字の位置座標を求め、あらかじめ決められた
一点に最も近接した文字の位置座標を持つ文字矩形領域
に対し文字認識部にて文字コードに変換することによる
文字入力を行うことを特徴とする文字認識装置である。
【0021】請求項16記載の文字認識方法は、原稿の
読取領域を目視でき、読み取りたい文字に位置合わせす
るための認識開始位置が示された読取領域目視窓で認識
開始位置をあわせて原稿を走査し、走査で得た画像デー
タを記憶し、記憶した画像データに対して文字の矩形領
域を求め、求めた矩形領域より文字の位置座標を求め、
あらかじめ決められた一点に最も近接した文字の位置座
標を持つ矩形領域に対して文字コードに変換することを
特徴とする文字認識方法である。
【0022】
【発明の実施の形態】以下に、本発明の文字認識装置を
電子辞書で用いたときの実施例を図に基づいて説明す
る。
【0023】本発明は読取り位置を目視で確認可能なス
キャナ装置(図1)にて読取る位置を指定し、読取った
画像(図3)に対し文字の切出しを行い文字認識する装
置にて構成される。請求項7又は8が関連する発明にお
いては、表示装置および方向を指示する入力装置も兼ね
備える。請求項13の発明においてはアプリケーション
の機能を兼ね備える。請求項14の発明においては電子
辞書の機能を兼ね備える。請求項15の発明においては
アプリケーション又は電子辞書の機能を兼ね備える。本
発明では文字の切出しを行う部分を、あらかじめ決めら
れた部位に限定する。使用者はそのOCRが必要な部位
をスキャナ装置(図1)で、目視にて確認してあらかじ
め指定された部位をスキャンし、本発明によるあらかじ
め決められた部位に限定された領域の切出しを行い文字
認識部い文字情報を得る。
【0024】図1は、本発明が用いるスキャナの一例で
ある。図1において1は読取り装置本体で、2はCIS
等のラインスキャナと、ラインスキャナの移動を検出す
るエンコーダを持つ読取り部で本体1と一体になってい
る。3は電子辞書等のアプリケーションの表示を行う表
示部で、4は読取り部での読取りを指示する読取りスイ
ッチで5はアプリケーション等の入力に用いる左右方向
スイッチ及び検索スイッチである。6は原稿を読取る時
に本体部より引き出すガイド板で、7は読取り位置を示
す読取り窓で、読取る原稿が読取り窓7よりが見えるよ
うに置く。このガイド板6の上を読取り部2が本体1と
ともに矢印8のラインスキャナの副走査方向にスライド
移動することにより読取り窓7から見える原稿を読取
る。
【0025】図2は読取り対象となる原稿で読取り窓7
を読取り対象となる部分に当て、読取りスイッチ4を押
し、読取り部2と本体を8の副走査方向にスライド移動
することにより、図3の読取り画像を得ることが出来
る。このように本装置では目視で読取り位置を確認した
部分を読取り画像として読取ることが出来る。
【0026】図4は文字認識装置の構成図で9は制御及
び画像等の処理をするCPUで、10はアプリケーショ
ン・OCR・スキャナ制御等のプログラムとOCR辞書
データが入ったROMで、11は読み込んだ画像データ
・文字矩形データ・認識結果データ・表示データ等を収
納するRAMで、12は原稿を読み込むためのCISに
よるラインセンサで、ラインセンサで読取った画像は画
像処理回路13で増幅・A/D変換後、2値化される。
2値化された画像はエンコーダ14で副走査方向の移動
が検出された時、DMAコントローラ15にて、RAM
11に画像データとして転送され、RAM11で画像デ
ータとして蓄積される。16は入力装置で、図1の読取
りスイッチ4及び検索スイッチ・左右方向スイッチ5に
より入力することにCPUに対し割り込みを発生しキー
入力が押されたことを検出する。17は表示メモリで、
表示メモリの内容を図1の表示部3に該当する液晶表示
装置18で表示する。
【0027】上のように構成された文字認識装置にて本
発明は次のように実施される。
【0028】(実施例1)本発明の請求項1・4・5・
7・9・10・11・13・14を用いたときの画像読
取・認識の実施例を図5・6・7・8・9に示すフロー
チャートに従い説明する。また、請求項3・12を実施
する場合の変更点を本実施例の後半に記す。
【0029】使用者は入力画面で原稿を読み取りたい時
に本装置のガイド板6を本体より引き出し読取りスイッ
チ4を押す。本実施例の文字認識装置の読取りスイッチ
4がおされたことにより割り込みが発生すると図5の処
理が実行される。S1においてイメージバッファ等のメ
モリの初期化とワークの確保を実施する。ここで、表示
文字数を示す変数NDを1、処理中の文字を示す変数N
と読取り開始位置を示す変数NSを0に、認識結果が入
る文字配列Sの要素を文字が入っていないことを意味す
る0にする。
【0030】S2においてラインセンサ12と画像処理
回路13とエンコーダ14とDMAコントローラ15の
初期化を行い読み取りの準備を実施する。
【0031】S3にて表示部3が文字入力画面かどうか
の判定を行い、文字入力画面で無ければ終了処理として
S4に処理を移し、S4にてスキャナ部のハードのOF
F処理を行い、S5でS1で確保したワークを解放し割
り込みを終了する。
【0032】S3にて文字入力画面と判定された場合は
S6に処理を移し、読取りスイッチが押されたかどうか
判定し、押されていない場合はS3に処理を移し読取り
スイッチが押されるまでS3とS6の処理を繰り返す。
【0033】使用者は図10に示す原稿に対し認識開始
位置19に読み取りたい文字が来るように読取り窓7を
見ながら読取り装置を置く。ここでは図10の原稿の3
行目の「矩形」を読み取りたいものとする。置いた後使
用者は再び読取りスイッチ4を押す。スイッチ4が再び
押されたことによりS6からS7に処理が移る。使用者
は読取り部2を本体とともに矢印8のラインスキャナの
副走査方向にスライド移動することにより読取り窓7か
ら見える原稿を読取る。
【0034】S7ではラインセンサで読取った画像を画
像処理回路13で2値化し、エンコーダ14で副走査方
向の移動が検出された時、2値化された画像はDMAコ
ントローラ15にて、RAM11にラインセンサの1ラ
イン分転送され、RAM11には画像データとして配列
Dに次のように蓄積される。
【0035】 D[X座標][Y座標] 黒の時は1となり白の時は0 X座標:0−1023 (左が0) Y座標:0−359 (上が0) 蓄積された画像は図11に示す画像となる。
【0036】そして、図6のS8に処理が移り行認識が
実施される。行認識は図12の式に示すように黒の数を
横方向にカウントし、図13の表のような配列を得る。
【0037】図13の表で解るように行間の部分はカウ
ントされていない。配列Hの最大値に対し64分の1以
下の部分を行間とすることにより行間を求めることが出
来る。
【0038】図11の画像では行間を区切りとすると文
字の行は次の行矩形位置に存在する。
【0039】 1行目 (0,0)−(1023,42) 2行目 (0,50)−(1023,122) 3行目 (0,130)−(1023,207) 4行目 (0,320)−(1023,360) 注:(X座標開始位置,Y座標開始位置)−(X座標終
了位置,Y座標終了位置) 次にS9にて、S8で求めた行矩形領域に対し認識を実
施する行の抽出を行う。
【0040】図11の例では一番上の行の認識を実施す
る。ここで1行目はY座標開始位置が画面の上端を示す
0をとるため、1行目は画面の上端に接しており情報が
欠けていると判断されるため、2行目の矩形領域を認識
領域として用いる。
【0041】S10においてS9で求めた行の矩形領域
に対し、文字の矩形領域を求める。文字矩形認識は図1
4の式に示すように行矩形領域に対し黒の数を縦方向に
カウントすることにより行う。行認識同様、文字間の部
分はカウントされてないため、配列Vの最大値に対し3
2分の1以下の部分が行のY方向幅の32分の1以上連
続する部分を文字間とすることにより文字間を求めるこ
とが出来る。
【0042】図11の例では2行目のY方向幅は122
−50=72となるので72/32=2以上、配列Vの
最大値に対し32分の1以下の部分が連続する部分を文
字間とする。図11の2行目の画像では文字間を区切り
とすると文字は次の矩形位置に存在する。
【0043】 1文字目(求) (0,50)−(20,122) 2文字目(め) (26,50)−(73,122) 3文字目(た) (82,50)−(125,122) 4文字目(矩) (132,50)−(182,122) 5文字目(形) (186,50)−(236,122) 6文字目(領) (240,50)−(283,122) 7文字目(域) (290,50)−(342,122) 8文字目(よ) (350,50)−(390,122) 注:(X座標開始位置,Y座標開始位置)−(X座標終了位置,Y座標終了位 置) ここで求めた文字数を変数Mに代入する。
【0044】図11の例ではMは20となる。S11で
は求めた文字数Mが0であるならば、読取りミスとして
S4に処理を移し終了処理を行い割り込みを終了し、M
が0でないならば、S12に処理を移す。
【0045】S12でS10で求めた文字に対して位置
座標を決める。この時、1文字目の矩形領域のX座標開
始位置が画像の左端を示す0をとるため、画面に左端に
接していると判断できるため、1文字目を認識対象から
除外し、S10で求めた文字矩形領域の2文字目を1文
字目として位置座標を求める。最後の文字に関してもX
座標終了位置が画面の右端を示す1023の値をとるな
らば認識対象から除外する。また、画面に接していると
判断して文字位置座標から除外したときは文字数を示す
Mの値も除外した文字数に応じて減らす。
【0046】図11の例では文字矩形領域の左上の部分
を位置座標とするので次の通りとなる。
【0047】 1文字目(め) (26,50) [S10で求めた2文字目] 2文字目(た) (82,50) [S10で求めた3文字目] 3文字目(矩) (132,50) [S10で求めた4文字目] 4文字目(形) (186,50) [S10で求めた5文字目] 5文字目(領) (240,50) [S10で求めた6文字目] 6文字目(域) (290,50) [S10で求めた7文字目] 7文字目(よ) (350,50) [S10で求めた8文字目] 注:(X座標位置,Y座標位置) M=19(最初の「求」が削除されたため1減算) 次にS13に処理を移し、S12で求めた座標位置に対
し認識開始位置19に最も近い文字を求める。
【0048】図11の例では認識開始位置19の座標は
(128,0)であるため3文字目となる。その値を処
理文字を示す変数N及び文字開始位置を示す変数NSに
入れる。ここで変数N及びNSの取る値は1文字目が0
となるため2となる。
【0049】次にS14に処理を移しS13で求めたN
が0ならばS16に処理を移し0以外ならばS15の処
理を行う。S15では、N−1に該当する文字矩形領域
に対しパターンマッチングにより文字認識しN−1に該
当する文字の候補を求める。ここで、図11の例では最
初はNは2となるため、N−1は1となりこれはS12
で求めた文字座標位置の2文字目、S10で求めた文字
矩形領域の3文字目の「た」に当たる。ここで文字候補
を次の配列Tに入れる。
【0050】T[A][B] A:文字位置の変数Nに該当する値 B:A番目の文字に対する候補の要素を示す添字で0−
3の値を取る Tは構造対でメンバーとして次のものを持つ T[A][B].CODE 文字候補の文字コード T[A][B].PER 文字候補の的中率(%) ここでは「た」に対し次の様に文字候補が選ばれたとす
る。
【0051】 またTの2番目の添字に関しては、的中率が高い順に要
素を入れるため、PERの大きい順に並ぶ。そして、S
16に処理を移す。
【0052】S16では、変数Nに該当する文字矩形領
域に対しパターンマッチングにより文字認識し変数Nに
該当する文字の候補を求める。ここで、図11の例では
最初はNは2となるため、S12で求めた文字座標位置
の3文字目、S10で求めた文字矩形領域の4文字目の
「矩」に当たる。ここで文字候補を配列T[N]に入れ
る。ここでは「矩」に対し次の様に文字候補が選ばれた
とする。
【0053】 そして、S17に処理を移す。
【0054】S17では処理する文字を示すNの値とM
−1(文字数−1)の値を比較し処理する文字が最後の
文字かどうか判断し、最後の文字と判断したときはS2
4に処理を移し、最後の文字で無いときはS18の処理
を行う。
【0055】次にS18では、N+1に該当する文字矩
形領域に対しパターンマッチングにより文字認識しN+
1に該当する文字の候補を求める。
【0056】図11の例ではNは最初は2となるため、
N+1は3となり、S12で求めた文字座標位置の4文
字目、S10で求めた文字矩形領域の5文字目の「形」
に当たる。ここで文字候補を配列T[N+1]に入れ
る。ここでは「形」に対し次の様に文字候補が選ばれた
とする。
【0057】 そして、S19に処理を移す。
【0058】S19では処理する文字を示すNの値が0
であるか判断し、0の時はS21の処理を、0でないと
きはS20に処理を移す。
【0059】S20では文字候補配列Tを参照し変数N
に該当する文字矩形領域の文字を決定する。
【0060】まず配列T[N−1][0..3]の各要
素とT[N][0..3]の各要素に対し辞書を検索し
熟語が存在するか検索する。熟語が存在するときはT
[N][0..3]の熟語が存在した要素のPERに対
し、T[N−1][0..3]の熟語の対になるPER
を加算する。N=2の時の例では「た」に対する文字候
補と「矩」に対する文字候補との組み合わせでは熟語が
存在しないのでPERの加算は行わない。
【0061】次に、配列T[N][0..3]の各要素
とT[N+1][0..3]の各要素に対し辞書を検索
し熟語が存在するか検索する。熟語が存在するときはT
[N][0..3]の熟語が存在した要素のPERに対
し、T[N+1][0..3]の熟語の対になるPER
を加算する。図11の例では最初はN=2となり、
「矩」に対する文字候補と「形」に対する文字候補との
組み合わせでは「矩形」という熟語が存在するので、T
[2][0]のPER35%に対しT[3][0]のP
ER70%を加算するのでT[2][0]のPERは1
05%となる。すなわち、T[2][0..3]の配列
は次の様になる。
【0062】 次にT[N][0..3]の各要素のPERの中で最も
大きい値を取る要素を文字として確定し、そのCODE
の値を認識結果を示す文字配列SのS[N]に代入す
る。
【0063】図11の例では最初はN=2となり、T
[2][0..3]の各要素の中でPERが一番大きい
のはT[2][0]であるため、T[2][0]のCO
DE「矩」がS[2]の値となる。そして、処理をS2
2に移す。
【0064】S21はS18で処理する文字を示すNの
値が0であると判断したとき、すなわち認識開始文字の
前に文字が無い場合実行され、文字候補配列Tを参照し
変数Nに該当する文字矩形領域の文字を決定する。配列
T[N][0..3]の各要素とT[N+1][0..
3]の各要素に対し辞書を検索し熟語が存在するか検索
する。熟語が存在するときはT[N][0..3]の熟
語が存在した要素のPERに対し、T[N+1]
[0..3]の熟語の対になるPERを加算する。
【0065】次にT[N][0..3]の各要素のPE
Rの中で最も大きい値を取る要素を文字として確定し、
そのCODEの値を認識結果を示す文字配列SのS
[N]に代入する。そして、処理をS22に移す。
【0066】S22はS20またはS21の次に実行さ
れ、認識結果の文字配列Sの要素のうち認識開始位置を
示すNSから表示文字数ND文字分表示メモリ17にキ
ャラクタ展開し、表示装置18(表示部3)に表示す
る。すなわちS[NS]からS[NS+ND−1]を表
示する。次にS23で処理する文字を示す変数Nに1加
算し、再び処理をS17に戻し後続する文字の認識を行
う。
【0067】S24は、S17で処理する文字を示すN
の値が最後の文字と判断したとき実行され、処理する文
字を示すNの値が0であるか判断し、0の時はS26の
処理を、0でないときはS25に処理を移す。S25で
は文字候補配列Tを参照し変数Nに該当する文字矩形領
域の文字を決定する。配列T[N−1][0..3]の
各要素とT[N][0..3]の各要素に対し辞書を検
索し熟語が存在するか検索する。熟語が存在するときは
T[N][0..3]の熟語が存在した要素のPERに
対し、T[N−1][0..3]の熟語の対になるPE
Rを加算する。
【0068】次にT[N][0..3]の各要素のPE
Rの中で最も大きい値を取る要素を文字として確定し、
そのCODEの値を認識結果を示す文字配列SのS
[N]に代入する。そして、処理をS27に移す。
【0069】S26は、S24で処理する文字を示すN
の値が0であると判断したとき、すなわちS12で求め
た文字位置が1文字分しかない時実行され、文字候補配
列T[N][0..3]の各要素のPERの中で最も大
きい値を取る要素を文字として確定し、そのCODEの
値を認識結果を示す配列SのS[N]に代入する。そし
て、処理をS27に移す。
【0070】S27はS25またはS26の次に実行さ
れ、認識結果の文字配列Sの要素のうち認識開始位置を
示すNSから表示文字数ND文字分表示メモリ17にキ
ャラクタ展開し、表示装置18(表示部3)に表示す
る。すなわちS[NS]からS[NS+ND−1]を表
示する。以上でS9で求めた行領域の認識が終了したの
で、図5のS4に処理を移し、終了処理を行い割り込み
を終了する。
【0071】入力画面で使用者が右方向スイッチ5を押
すと割り込みが発生し図7のフローチャートが実行され
る。
【0072】S28で入力画面であるかの判断が実施さ
れ、入力画面で無い場合は本割り込みは終了され、入力
画面であると判断されると、S29の処理が実行され
る。S29で表示文字数を示す変数NDに1加算され、
S30で認識結果の文字配列Sの要素のうち認識開始位
置を示すNSから表示文字数ND文字分表示メモリ17
にキャラクタ展開し、表示装置18(表示部3)に表示
する。すなわちS[NS]からS[NS+ND−1]を
表示する。そして、割り込みを終了する。
【0073】入力画面で使用者が左方向スイッチ5を押
すと割り込みが発生し図8のフローチャートが実行され
る。S31で入力画面であるかの判断が実施され、入力
画面で無い場合は本割り込みは終了され、入力画面であ
ると判断されると、S32の処理が実行される。
【0074】S32で認識結果の文字配列Sに文字が入
っているか判断し、文字が入っていない場合は最初の文
字決定前なので左側の文字の認識は行うことが出来ない
ため本割り込みは終了し、文字が入っているとS33の
処理が実行される。S33で認識開始位置を示すNSの
値が0であるか判断し、NSが0であると表示文字の前
に文字がないので本割り込みは終了され、0以外だとS
34の処理が実行される。
【0075】S34は、認識開始位置を示すNSの値が
1であるか判断し、1の時はS37の処理を、1でない
ときはS35に処理を移す。S35では、NS−2に該
当する文字矩形領域に対しパターンマッチングにより文
字認識しNS−2に該当する文字の候補を求める。図1
1の例では最初はNSは2となるため、NS−2は0と
なり、S12で求めた文字座標位置の1文字目、S10
で求めた文字矩形領域の2文字目の「め」に当たる。こ
こで文字候補を配列T[NS−2]に入れる。
【0076】ここでは「め」に対し次の様に文字候補が
選ばれたとする そして、S36に処理を移す。
【0077】S36では文字候補配列Tを参照し変数N
S−1に該当する文字矩形領域の文字を決定する。まず
配列T[NS−2][0..3]の各要素とT[NS−
1][0..3]の各要素に対し辞書を検索し熟語が存
在するか検索する。熟語が存在するときはT[NS−
1][0..3]の熟語が存在した要素のPERに対
し、T[NS−2][0..3]の熟語の対になるPE
Rを加算する。
【0078】図11の例では最初はNS=2となり、
「め」に対する文字候補と「た」に対する文字候補との
組み合わせでは「求めた」という熟語が存在するので、
T[1][0]のPER60%に対しT[0][0]の
PER40%を加算するのでT[1][0]のPERは
100%となる。次に配列T[NS−1][0..3]
の各要素とT[NS][0..3]の各要素に対し辞書
を検索し熟語が存在するか検索する。熟語が存在すると
きはT[NS−1][0..3]の熟語が存在した要素
のPERに対し、T[NS][0..3]の熟語の対に
なるPERを加算する。
【0079】図11の例では最初はNS=2となり、
「た」に対する文字候補と「矩」に対する文字候補との
組み合わせでは熟語が存在しないのでPERの加算は行
わない。
【0080】すなわち、T[1][0..3]の配列は
次の様になる。
【0081】 次にT[NS−1][0..3]の各要素のPERの中
で最も大きい値を取る要素を文字として確定し、そのC
ODEの値を認識結果を示す文字配列SのS[NS−
1]に代入する。
【0082】図11の例では最初はNS=2となり、T
[1][0..3]の各要素の中でPERが一番大きい
のはT[1][0]であるため、T[1][0]のCO
DE「た」がS[1]の値となる。そして、処理をS3
8に移す。
【0083】S37は、S34で認識開始位置を示すN
Sの値が1であると判断したとき、すなわち認識開始位
置の前に文字が1文字分しかない時実行され、文字候補
配列Tを参照し変数NS−1に該当する文字矩形領域の
文字を決定する。配列T[NS−1][0..3]の各
要素とT[NS][0..3]の各要素に対し辞書を検
索し熟語が存在するか検索する。熟語が存在するときは
T[NS−1][0..3]の熟語が存在した要素のP
ERに対し、T[NS][0..3]の熟語の対になる
PERを加算する。次にT[NS−1][0..3]の
各要素のPERの中で最も大きい値を取る要素を文字と
して確定し、そのCODEの値を認識結果を示す文字配
列SのS[NS−1]に代入する。そして、処理をS3
8に移す。
【0084】S38はS36・S37の次に実行され、
文字認識開始位置を示すNSの値を1引き、表示文字数
を示すNDの値を1加算する。S39で認識結果の文字
配列Sの要素のうち認識開始位置を示すNSから表示文
字数ND文字分表示メモリ17にキャラクタ展開し、表
示装置18(表示部3)に表示する。すなわちS[N
S]からS[NS+ND−1]を表示する。そして、割
り込みを終了する。
【0085】入力画面で使用者が検索スイッチ5を押す
と割り込みが発生し図9のフローチャートが実行され
る。S40で入力画面であるかの判断が実施され、入力
画面で無い場合は本割り込みは終了され、入力画面であ
ると判断されると、S41では、読取りスイッチによる
図5・6の割込処理を中止する。そして、S42では認
識結果の文字配列Sの要素のうち認識開始位置を示すN
Sから表示文字数ND文字の内容を電子辞書のキーワー
ドにして検索し、検索した内容を表示メモリ17に展開
し、表示装置18(表示部3)に表示する。そして、割
り込みを終了する。
【0086】以上の処理を実施することにより使用者は
入力画面で原稿を読み取りたい時に本装置のガイド板6
を本体より引き出し読取りスイッチ4を押し、図10に
示す原稿に対し認識開始位置19に読み取りたい文字が
来るように読取り窓7を見ながら読取り装置を置き、再
び読取りスイッチ4を押しスキャンする。そして、必要
とされる文字が表示されるまで右方向スイッチ5を入力
し、必要な文字が表示された後(図15)、検索スイッ
チ5を入力することにより、図16に示す辞書表示を得
ることが出来る。また、認識開始位置より前の文字を参
照する必要があるときは左方向スイッチを押すと良い。
【0087】1文字表示後、辞書検索準備等のタスクを
実施するために、表示及びキー操作後に追加認識するた
めには、図6のS22とS23の間に図17の処理を追
加すると良い。ここでS43は右方向スイッチの割込が
発生し表示文字数を示すNDが加算されるまで、認識を
中断するための判断で、NDが加算されるまでS43を
繰り返し、NDが加算されると処理をS23に移す。
【0088】本実施例1において認識開始位置19の位
置を左上に移動し、図6のS13で認識開始位置の座標
を(0,0)にすると請求項12となる。
【0089】また、請求項12にて読取り窓の左下を認
識開始位置とした場合図6のS9で下の行を抽出し、図
6のS12で文字位置座標決定する際図6のS10で求
めた文字矩形領域の左下を文字位置座標とし、S13で
認識開始位置の座標を(0,359)にすると良い。
【0090】請求項3を実施するためには、図6のS1
3とS14の間に図18の処理を追加すると良い。ここ
でS44は図6のS10で設定しS12で補正した文字
数を示す変数Mと、S13で求めた認識開始文字を示す
変数NSを用い、表示文字数を示すNDを次の式で決定
する。
【0091】ND=M−NS このようにすることにより、認識が終了し認識結果を示
す文字配列Sに認識結果が反映された文字を順次表示す
ることが出来る。
【0092】(実施例2)本発明の請求項2・6・8・
9・10・11・13・14を用いたときの画像読取・
認識の実施例を図19・20・21・22・23に示す
フローチャートに従い説明する。また、請求項12を実
施する場合の変更点を本実施例の後半に記す。
【0093】使用者は入力画面で原稿を読み取りたい時
に本装置のガイド板6を本体より引き出し読取りスイッ
チ4を押す。本実施例の文字認識装置の読取りスイッチ
4がおされたことにより割り込みが発生すると図19の
処理が実行される。
【0094】S45においてイメージバッファ等のメモ
リの初期化とワークの確保を実施する。ここで、表示文
字列数を示す変数WDを1、処理中の文字列を示す変数
Wと読取り開始位置を示す変数WSを0に、認識結果が
入る文字列配列へのポインタの配列Jの要素を文字が入
っていないことを意味する0にする。S46においてラ
インセンサ12と画像処理回路13とエンコーダ14と
DMAコントローラ15の初期化を行い読み取りの準備
を実施する。S47にて表示部3が文字入力画面かどう
かの判定を行い、文字入力画面で無ければ終了処理とし
てS48に処理を移し、S48にてスキャナ部のハード
のOFF処理を行い、S49でS45で確保したワーク
を解放し割り込みを終了する。
【0095】S47にて文字入力画面と判定された場合
はS50に処理を移し、読取りスイッチが押されたかど
うか判定し、押されていない場合はS47に処理を移し
読取りスイッチが押されるまでS47とS50の処理を
繰り返す。
【0096】使用者は図24に示す原稿に対し認識開始
位置19に読み取りたい文字列が来るように読取り窓7
を見ながら読取り装置を置く。ここでは図24の原稿の
3行目の「in preparation for」を
読み取りたいものとする。置いた後使用者は再び読取り
スイッチ4を押す。スイッチ4が再び押されたことによ
りS50からS51に処理が移る。使用者は読取り部2
を本体とともに矢印8のラインスキャナの副走査方向に
スライド移動することにより読取り窓7から見える原稿
を読取る。S51ではラインセンサで読取った画像を画
像処理回路13で2値化し、エンコーダ14で副走査方
向の移動が検出された時、2値化された画像はDMAコ
ントローラ15にて、RAM11にラインセンサの1ラ
イン分転送され、RAM11には画像データとして配列
Dに次のように蓄積される。
【0097】D[X座標][Y座標] 黒の時は1と
なり白の時は0 X座標:0−1023 (左が0) Y座標:0−359 (上が0) 蓄積された画像は図25に示す画像となる。
【0098】そして、図20のS52に処理が移り行認
識が実施される。行認識は図12の式に示すように黒の
数を横方向にカウントすることにより実施する。行間の
部分はカウントないため、配列Hの最大値に対し64分
の1以下の部分を行間とすることにより行間を求めるこ
とが出来る。図25の画像では行間を区切りとすると文
字の行は次の行矩形位置に存在する。
【0099】 1行目 (0,0)−(1023,26) 2行目 (0,62)−(1023,128) 3行目 (0,168)−(1023,230) 4行目 (0,254)−(1023,328) 注:(X座標開始位置,Y座標開始位置)−(X座標終
了位置,Y座標終了位置) 次にS53にて、S52で求めた行矩形領域に対し認識
を実施する行の抽出を行う。
【0100】図25の例では一番上の行の認識を実施す
る。ここで1行目はY座標開始位置が画面の上端を示す
0をとるため、1行目は画面の上端に接しており情報が
欠けていると判断されるため、2行目の矩形領域を認識
領域として用いる。S54においてS53で求めた行の
矩形領域に対し、文字列の矩形領域を求める。
【0101】文字列矩形認識は図26の式に示すように
行矩形領域に対し黒の数を縦方向にカウントすることに
より行う。文字間の部分はカウントされてないため、配
列Vの最大値に対し32分の1以下の部分が行のY方向
幅の4分の1以上連続する部分を文字間とすることによ
り文字間を求めることが出来る。
【0102】図25の例では2行目のY方向幅は128
−62=66となるので66/4=16以上、配列Vの
最大値に対し32分の1以下の部分が連続する部分を文
字間とする。図25の2行目の画像では文字列間を区切
りとすると文字列は次の矩形位置に存在する。
【0103】 1文字列目 (0,62)−(30,128) (?l) 2文字列目 (72,62)−(370,128)(equipment) 3文字列目 (396,62)−(454,128)(in) 4文字列目 (496,62)−(820,128)(preparatio n) 5文字列目 (850,62)−(944,128)(for) 6文字列目 (978,62)−(1023,128)(t?) 注:(X座標開始位置,Y座標開始位置)−(X座標終
了位置,Y座標終了位置)ここで求めた文字列数を変数
Rに代入し処理をS55に移す。
【0104】図25の例ではRは6となる。S55では
求めた文字列数Rが0であるならば、読取りミスとして
S48に処理を移し終了処理を行い割り込みを終了し、
Rが0でないならば、S56に処理を移す。S56はS
54で求めた文字列に対して位置座標を決める。
【0105】この時、1文字列目の矩形領域のX座標開
始位置が画像の左端を示す0をとるため、画面に左端に
接していると判断できるため、1文字列目を認識対象か
ら除外し、S54で求めた文字列矩形領域の2文字列目
を1文字列目として位置座標を求める。最後の文字列に
関してもX座標終了位置が画面の右端を示す1023の
値をとるならば認識対象から除外する。また、画面に接
していると判断して文字列位置座標から除外したときは
文字列数を示すRの値も除外した文字列数に応じて減ら
す。図25の例では文字列矩形領域の左上の部分を位置
座標とするので次の通りとなる。
【0106】 1文字列目 (72,62)(equipment) 2文字列目 (396,62)(in) 3文字列目 (496,62)(preparation) 4文字列目 (850,62)(for) 注:(X座標位置,Y座標位置) R=4 次にS57に処理を移し、S56で求めた座標位置に対
し認識開始位置20に最も近い文字列を求める。
【0107】図25の例では認識開始位置20の座標は
(300,0)であるため2文字列目となる。その値を
処理文字列を示す変数W及び文字列開始位置を示す変数
WSに入れる。ここで変数W及びWSの取る値は1文字
列目が0となるため1となる。
【0108】次にS58に処理を移し、処理文字列を示
す変数Wと文字数を示す変数Rと比較しW<R−1なら
処理する文字列があるとして、S59に処理を移し、W
<Rで無いならば処理する文字がないので、S48に処
理を移し割込の終了を実施する。S59では、変数Wに
該当する文字列矩形領域に対しパターンマッチング等に
より文字列認識する。認識結果をワークに入れ、その先
頭文字のポインタをJ[W]に入れる。
【0109】図25の例では最初はWは1となるため、
S56で求めた文字列座標位置の2文字列目、S54で
求めた文字列矩形領域の3文字列目の”in”に当た
る。”in”の認識結果に対しワークを確保しその’
i’のアドレスを示すポインタをJ[1]に入れる。次
にS60で、認識結果の文字列ポインタ配列Jの要素の
うち認識開始位置を示すWSから表示文字列数WD文字
列分表示メモリ17にキャラクタ展開し、表示装置18
(表示部3)に表示する。すなわちJ[WS]からJ
[WS+WD−1]が指すアドレスポインタの文字列を
表示する。次にS61で処理する文字列を示す変数Wに
1加算し、再び処理をS58に戻し後続する文字列の認
識を行う。
【0110】入力画面で使用者が右方向スイッチ5を押
すと割り込みが発生し図21のフローチャートが実行さ
れる。S62で入力画面であるかの判断が実施され、入
力画面で無い場合は本割り込みは終了され、入力画面で
あると判断されると、S63の処理が実行される。S6
3で表示文字列数を示す変数WDに1加算され、S64
で認識結果の文字列ポインタ配列Jの要素のうち認識開
始位置を示すWSから表示文字列数WD文字列分表示メ
モリ17にキャラクタ展開し、表示装置18(表示部
3)に表示する。すなわちJ[WS]からJ[WS+W
D−1]が指すアドレスポインタの文字列を表示する。
そして、割り込みを終了する。
【0111】入力画面で使用者が左方向スイッチ5を押
すと割り込みが発生し図22のフローチャートが実行さ
れる。S65で入力画面であるかの判断が実施され、入
力画面で無い場合は本割り込みは終了され、入力画面で
あると判断されると、S66の処理が実行される。
【0112】S66で認識結果の文字列ポインタ配列J
に文字列が入っているか判断し、文字列が入っていない
場合は最初の文字列決定前なので左側の文字列の認識は
行うことが出来ないため本割り込みは終了し、文字列が
入っているとS67の処理が実行される。S67で認識
開始位置を示すWSの値が0であるか判断し、WSが0
であると表示文字列の前に文字列がないので本割り込み
は終了され、0以外だとS68の処理が実行される。
【0113】S68では、変数WS−1に該当する文字
列矩形領域に対しパターンマッチング等により文字列認
識する。認識結果をワークに入れ、その先頭文字のポイ
ンタをJ[WS−1]に入れる。図25の例では最初は
WSは1となるため、S56で求めた文字列座標位置の
1文字列目、S54で求めた文字列矩形領域の2文字列
目の”equipment”に当たる。”equipm
ent”の認識結果に対しワークを確保しその’e’の
アドレスを示すポインタをJ[0]に入れる。S69
で、文字列認識開始位置を示すWSの値を1引き、表示
文字列数を示すWDの値を1加算する。次にS70で、
認識結果の文字列ポインタ配列Jの要素のうち認識開始
位置を示すWSから表示文字列数WD文字列分表示メモ
リ17にキャラクタ展開し、表示装置18(表示部3)
に表示する。すなわちJ[WS]からJ[WS+WD−
1]が指すアドレスポインタの文字列を表示する。
【0114】入力画面で使用者が検索スイッチ5を押す
と割り込みが発生し図23のフローチャートが実行され
る。S71で入力画面であるかの判断が実施され、入力
画面で無い場合は本割り込みは終了され、入力画面であ
ると判断されると、S72で、読取りスイッチによる図
19・20の割込処理のタスクを中止する。そして、S
73では認識結果の文字列ポインタ配列Jの要素のうち
認識開始位置を示すWSから表示文字数WD文字列の内
容を電子辞書のキーワードにして検索し、検索した内容
を表示メモリ17に展開し、表示装置18(表示部3)
に表示する。そして、割り込みを終了する。
【0115】以上の処理を実施することにより使用者は
入力画面で原稿を読み取りたい時に本装置のガイド板6
を本体より引き出し読取りスイッチ4を押し、図24に
示す原稿に対し認識開始位置20に読み取りたい文字列
が来るように読取り窓7を見ながら読取り装置を置き、
再び読取りスイッチ4を押しスキャンする。そして、必
要とされる文字列が表示されるまで右方向スイッチ5を
入力し、必要な文字列が表示された後(図27)、検索
スイッチ5を入力することにより、図28に示す辞書表
示を得ることが出来る。また、認識開始位置より前の文
字列を参照する必要があるときは左方向スイッチを押す
と良い。
【0116】本実施例2において認識開始位置20の位
置を左上に移動し、図20のS57で認識開始位置の座
標を(0,0)にすると請求項12となる。
【0117】また、請求項12にて読取り窓の左下を認
識開始位置とした場合図20のS53で下の行を抽出
し、図20のS56で文字列位置座標決定する際のS5
4で求めた文字列矩形領域の左下を文字列位置座標と
し、S57で認識開始位置の座標を(0,359)にす
ると良い。
【0118】1文字列表示後、辞書検索準備等のタスク
を実施するために、表示及びキー操作後に追加認識する
ためには、図20のS60とS61の間に図29の処理
を追加すると良い。ここでS74は右方向スイッチの割
込が発生し表示文字列数を示すWDが加算されるまで、
認識を中断するための判断で、WDが加算されるまでS
74を繰り返し、WDが加算されると処理をS61に移
す。
【0119】(実施例3)本発明の請求項15用いたと
きの画像読取・認識の実施例を図30に示すフローチャ
ート及び、実施例1及び実施例2に追記する形で説明す
る。
【0120】実施例1及び2と同様に使用者は入力画面
で原稿を読み取りたい時に本装置のガイド板6を本体よ
り引き出し読取りスイッチ4を押す。本実施例の文字認
識装置の読取りスイッチ4がおされたことにより割り込
みが発生すると図30の処理が実行される。S75にお
いて現在使用中のアプリケーションの入力画面が、英和
辞書等の英語入力のアプリケーションか和英辞書等の日
本語入力のアプリケーションか判断する。英語入力の場
合はS76に処理を移し、日本語入力の場合はS79に
処理を移す。
【0121】S75において日本語入力と判断されたと
きは、S76にて右方向スイッチが押されたときの割り
込み処理を図7のS28に設定し、S77にて左方向ス
イッチが押されたときの割り込み処理を図8のS31に
設定し、S78にて検索スイッチが押されたときの割り
込み処理を図9のS40に設定する。そして図5のS1
に処理を移し実施例1を実行するS75において英語入
力と判断されたときは、S79にて右方向スイッチが押
されたときの割り込み処理を図21のS62に設定し、
S80にて左方向スイッチが押されたときの割り込み処
理を図22のS65に設定し、S81にて検索スイッチ
が押されたときの割り込み処理を図23のS71に設定
する。そして図19のS45処理を移し実施例2を実行
する。
【0122】以上の処理により使用中のアプリケーショ
ンの入力画面が、英和辞書等の英語入力のアプリケーシ
ョンの時は文字列認識を行い、和英辞書等の日本語入力
のアプリケーションの時は文字認識を行うことを切り換
えることが可能となる。
【0123】
【発明の効果】本発明を実施することにより、入力した
い原稿の必要な文字を目視で確認した後スキャンする
と、読み取った画像に対して、文字認識することが出来
る。読取った画像の確認をする必要が無いため、文字認
識した結果を表示する簡単な表示装置でユーザーインタ
ーフェースを確立することが可能となる。文字認識する
部分も画像全体のうちの一部であるため、文字認識時間
も少なくて済む。文字認識部分は目視にて確認するた
め、位置の指定も容易になる。また、キーボード入力の
ように読みが解らない文字も入力可能とし、操作キーも
最小限になるので、操作の容易性と入力速度の向上が可
能となり、装置の小型化が可能となる。特に携帯機器に
用いた場合、携帯機器の入力デバイスはサイズ等の制限
が多いため、操作性の向上は大きいものとなる。以下
に、請求項ごとの効果を記す。
【0124】請求項1記載の発明によれば、特に日本語
の原稿に対し本請求項は効果があり、入力したい原稿の
必要な文字を目視をしながらスキャンすると必要な文字
を認識することが出来る。
【0125】請求項2記載の発明によれば、特に欧文の
原稿に対し本請求項は効果があり、入力したい原稿の必
要な文字を目視をしながらスキャンすると必要な文字列
を認識することが出来る。
【0126】請求項3記載の発明によれば、入力したい
原稿の必要な行を目視をしながらスキャンすると必要な
行を認識することが出来る。
【0127】請求項4記載の発明によれば、特に日本語
の原稿に対し本請求項は効果があり、入力したい原稿の
必要な文字を目視をしながらスキャンすると必要な文字
を認識することが出来、この時周囲の文字を参照し文字
認識の補正を行うため、認識率の向上が期待できる。
【0128】請求項5記載の発明によれば、特に日本語
の原稿に対し本請求項は効果があり、入力したい原稿の
必要な文字又は文字列を目視をしながらスキャンすると
必要な文字以降の文字列を認識することが出来る。ま
た、必要な文字数をキーにより指示するようにすると必
要な文字列を容易に得ることが出来る。
【0129】請求項6記載の発明によれば、特に欧文の
原稿に対し本請求項は効果があり、入力したい原稿の必
要な文字列を目視をしながらスキャンすると必要な文字
列以降の文字列を認識することが出来る。また、必要な
文字列数をキーにより指示するようにすると必要な文字
列を容易に得ることが出来る。
【0130】請求項7記載の発明によれば、特に日本語
の原稿に対し本請求項は効果があり、入力したい原稿の
必要な文字又は文字列を目視をしながらスキャンし、必
要な文字数が得られるまで追加の操作を行うのみで必要
な文字列を認識することが出来る。また、追加の操作後
文字認識するように構成すると、追加の操作を実施する
までの間文字認識は実施しないので、その間に検索準備
等の別のタスクを実施することも可能で、またその間低
消費電力モードにすると節電することが可能となる。
【0131】請求項8記載の発明によれば、特に欧文の
原稿に対し本請求項は効果があり、入力したい原稿の必
要な文字列を目視をしながらスキャンし、必要な文字列
数が得られるまで追加の操作を行うのみで必要な文字列
を認識することが出来る。また、追加の操作後文字認識
するように構成すると、追加の操作を実施するまでの間
文字認識は実施しないので、その間に検索準備等の別の
タスクを実施することも可能で、またその間低消費電力
モードにすると節電することが可能となる。
【0132】請求項9記載の発明によれば、必要な文字
以外の文字の一部をスキャンしたときも、必要な文字を
得ることを可能とし、使用性の向上が得られる。
【0133】請求項10記載の発明によれば、文字又は
文字列の領域の認識は限られた行のみ認識するため速度
の向上が得られる。
【0134】請求項11記載の発明によれば、必要な行
以外の部分をスキャンしても行単位で必要な行を切り出
すため、請求項5・6・7・8と組み合わせて実施する
ことにより、後続する文字を一つの行で抽出する事が可
能とする。
【0135】請求項12記載の発明によれば、原稿の情
報をアプリケーションの入力文字として直接用いること
を可能とするため、アプリケーション機器のキーボード
等の入力デバイスの操作が不要になり、入力文字が多い
場合は入力の高速化を可能とする。
【0136】請求項13記載の発明によれば、アプリケ
ーションを実施する時入力する文字が原稿に印刷されて
いる場合、使用者は必要な文字が入るように原稿をスキ
ャンすると、文字または文字列の認識結果がアプリケー
ションの入力文字となり入力の利便性が向上する。
【0137】請求項14記載の発明によれば、原稿の情
報を電子辞書の入力文字として直接用いることを可能と
するため、電子辞書のキーボード等の入力デバイスの操
作が不要になり、入力文字が多い場合は入力の高速化を
可能とする。
【0138】請求項15記載の発明によれば、アプリケ
ーション又は辞書の入力画面が欧文を要求する時は、例
えば英和辞書の入力に用いる時は、文字列により文字入
力を可能とするため、入力したい語を容易に確定するこ
とが出来る。また、入力画面が和文を要求する時は、例
えば和英辞書の入力に用いる時は、1文字ずつの文字入
力を可能とするため、必要な文字数入力することが出来
る。そして、入力する言語に応じて認識方法・認識辞書
を変えることも可能となるので認識率の向上を図ること
が出来る。
【図面の簡単な説明】
【図1】本発明の読取装置の外観図である。
【図2】本発明の読取対象の原稿を示す図である。
【図3】本発明の読取装置の読み取り画像を示す図であ
る。
【図4】本発明読み取り装置の構成図である。
【図5】本発明の実施例1の読取りスイッチを押したと
きの割込処理フローチャート1である。
【図6】本発明の実施例1の読取りスイッチを押したと
きの割込処理フローチャート2である。
【図7】本発明の実施例1の右方向スイッチを押したと
きの割込処理フローチャートである。
【図8】本発明の実施例1の左方向スイッチを押したと
きの割込処理フローチャートである。
【図9】本発明の実施例1の検索スイッチを押したとき
の割込処理フローチャートである。
【図10】本発明の実施例1の原稿を示す図である。
【図11】本発明の実施例1の読み取り画像を示す図で
ある。
【図12】本発明の行認識のカウント式を示す図であ
る。
【図13】本発明の行認識の変数Hの添字と要素のグラ
フを示す図である。
【図14】本発明の実施例1の文字矩形領域認識のカウ
ント式を示す図である。
【図15】本発明の実施例1の入力時の表示例を示す図
である。
【図16】本発明の実施例1の検索後の表示例を示す図
である。
【図17】請求項7を実施するための実施例1に対する
追加フローチャートである。
【図18】請求項3を実施するための実施例1に対する
追加フローチャートである。
【図19】本発明の実施例2の読取りスイッチを押した
ときの割込処理フローチャート1である。
【図20】本発明の実施例2の読取りスイッチを押した
ときの割込処理フローチャート2である。
【図21】本発明の実施例2の右方向スイッチを押した
ときの割込処理フローチャートである。
【図22】本発明の実施例2の左方向スイッチを押した
ときの割込処理フローチャートである。
【図23】本発明の実施例2の検索スイッチを押したと
きの割込処理フローチャートである。
【図24】本発明の実施例2の原稿を示す図である。
【図25】本発明の実施例2の読み取り画像を示す図で
ある。
【図26】本発明の実施例2の文字列矩形領域認識のカ
ウント式を示す図である。
【図27】本発明の実施例2の入力時の表示例を示す図
である。
【図28】本発明の実施例2の検索後の表示例を示す図
である。
【図29】請求項8を実施するための実施例2に対する
追加フローチャートである。
【図30】実施例3を実施するためのフローチャートで
ある。
【符号の説明】
1 読み取り装置本体 2 読み取り部 3 表示部 4 読み取りスイッチ 5 方向スイッチ・検索スイッチ 6 ガイド板 7 読み取り窓 8 読み取り部副走査移動方向 9 CPU 10 ROM 11 RAM 12 ラインセンサ 13 画像処理回路 14 エンコーダ 15 DMAコントローラ15 16 入力装置 17 表示メモリ 18 表示装置 19 認識開始位置(実施例1) 20 認識開始位置(実施例2)
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ▲廣▼ 英幸 大阪府大阪市阿倍野区長池町22番22号 シャープ株式会社内 (56)参考文献 特開 平5−233695(JP,A) 特開 平5−35911(JP,A) 特開 平3−271976(JP,A) 特開 平9−81671(JP,A) 特開 昭63−273166(JP,A) 特開 昭59−35279(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82

Claims (16)

    (57)【特許請求の範囲】
  1. 【請求項1】原稿の読取領域を目視でき、読み取りたい
    文字に位置合わせするための認識開始位置が示された読
    取領域目視窓と、 前記読取領域目視窓から原稿の画像データを読み取る読
    取部とを備え、 原稿上を走査して文字を認識する文字認識装置であっ
    て、 前記読取部に読み取られた 前記画像データを記憶する記
    憶部と、前記記憶部に記憶された前記 画像データに対して文字の
    矩形領域を求める文字矩形領域認識部と、前記 文字矩形領域認識部で求めた矩形領域に対し文字コ
    ードに変換する文字認識部を備え 前記文字認識部は、前記 文字矩形領域認識部で求めた矩
    形領域の位置座標を求め、前記読取領域目視窓のあらか
    じめ決められた一点に最も近接した位置座標を持つ矩
    領域に対し文字コードに変換することを特徴とする文字
    認識装置。
  2. 【請求項2】原稿の読取領域を目視でき、読み取りたい
    文字に位置合わせするための認識開始位置が示された読
    取領域目視窓と、 前記読取領域目視窓から原稿の画像データを読み取る読
    取部とを備え、 原稿上を走査して文字を認識する文字認識装置であっ
    て、 前記読取部に読み取られた 前記画像データを記憶する記
    憶部と、前記記憶部に記憶された前記 画像データに対して文字列
    の矩形領域を求める文字列矩形領域認識部と、前記 文字列矩形領域認識部で求めた矩形領域に対し文字
    コードに変換する文字認識部を備え 前記文字認識部は、前記 文字列矩形領域認識部で求めた
    矩形領域の位置座標を求め、前記読取領域目視窓のあら
    かじめ決められた一点に最も近接した位置座標を持つ矩
    形領域に対し文字コードに変換することを特徴とする文
    字認識装置。
  3. 【請求項3】原稿の読取領域を目視でき、読み取りたい
    文字に位置合わせするための認識開 始位置が示された読
    取領域目視窓と、 前記読取領域目視窓から原稿の画像データを読み取る読
    取部とを備え、 原稿上を走査して文字を認識する文字認識装置であっ
    て、 前記読取部に読み取られた 前記画像データを記憶する記
    憶部と、前記記憶部に記憶された前記 画像データに対して行領域
    の位置を求める行領域認識部と、前記領域認識部で求めた行領域に対し文字コードに変
    換する文字認識部を備え 前記文字認識部は、前記行領域 認識部で求めた行領域の
    位置座標を求め、前記読取領域目視窓のあらかじめ決め
    られた一点に最も近接した位置座標を持つ行領域に対
    字コードに変換することを特徴とする文字認識装置。
  4. 【請求項4】請求項1記載の文字認識装置において、
    記文字認識部は、あらかじめ決められた一点に最も近接
    した位置座標を持つ文字矩形領域の文字に対する文字コ
    ードの候補と、前記文字矩形領域の周辺の文字矩形領域
    の文字に対する文字コードの候補を求め、前記周辺の
    文字矩形領域の文字に対する文字コードの候補と言語的
    特性により関連付けすることによって、前記あらかじめ
    決められた一点に最も近接した位置座標を持つ文字矩形
    領域の文字に対する文字コードの候補から文字を確定す
    ることを特徴とする文字認識装置。
  5. 【請求項5】請求項1記載の文字認識装置において、
    記文字認識部は、あらかじめ決められた一点に最も近接
    した文字の位置座標を持つ文字矩形領域に対し文字コー
    ドに変換した後、先に認識した文字と同じ行にあり後続
    する文字矩形領域に対しても文字コードに変換を行い、
    後に変換した文字コードを先に認識した文字コードに追
    加して文字列を生成することを特徴とする文字認識装
    置。
  6. 【請求項6】請求項2記載の文字認識装置において、
    記文字認識部は、あらかじめ決められた一点に最も近接
    した文字列の位置座標を持つ文字列矩形領域に対し文
    コードに変換した後、先に認識した文字列と同じ行にあ
    り後続する文字列矩形領域に対しても文字コードに変換
    を行い、後に変換した文字コードを先に認識した文字コ
    ードに追加して文字列を生成することを特徴とする文字
    認識装置。
  7. 【請求項7】請求項1記載の文字認識装置において、表
    示装置及びスイッチ等の入力装置を備え、文字認識した
    文字を表示装置にて表示後、入力装置により方向を指示
    することにより、既に表示してある文字又は文字列が位
    置する文字矩形領域に対し指示された方向に隣接する文
    字の文字矩形領域に対して文字認識部にて文字コードに
    変換した文字コードを、既に表示している文字又は文字
    列に追加して表示を行うことを特徴とする文字認識装
    置。
  8. 【請求項8】請求項2記載の文字認識装置において、表
    示装置及びスイッチ等の入力装置を備え、文字認識した
    文字列を表示装置にて表示後、入力装置により方向を指
    示することにより、既に表示してある文字列が位置する
    文字列矩形領域に対し指示された方向に隣接する文字列
    の文字列矩形領域に対して文字認識部にて文字コードに
    変換した文字コードを、既に表示している文字列に追加
    して表示を行うことを特徴とする文字認識装置。
  9. 【請求項9】請求項1記載の文字認識装置において、文
    字矩形領域認識部又は文字列矩形領域認識部又は行領域
    認識部は求めた文字矩形領域又は文字列矩形領域又は行
    領域が、画像データの端に接している時は、文字又は文
    字列が画面の端にあり文字が欠けている判断し、文字矩
    形領域又は文字列矩形領域又は行領域から除外すること
    を特徴とする文字認識装置。
  10. 【請求項10】請求項1記載の文字認識装置において、
    文字矩形領域認識部又は文字列矩形領域認識部は、矩形
    部位の認識を行う際、最初に行の矩形範囲の認識を行
    い、その行の矩形範囲より、あらかじめ決められた一点
    に近接する行に対して文字矩形認識又は文字列矩形認識
    を行うことを特徴とする文字認識装置。
  11. 【請求項11】請求項10記載の文字認識装置におい
    て、求めた行の矩形範囲が、画像データの端に接してい
    る時は、文字又は文字列が画面の端にあり文字が欠けて
    いる判断し、行の矩形範囲から除外することを特徴とす
    る文字認識装置。
  12. 【請求項12】請求項11記載の文字認識装置におい
    て、あらかじめ決められた一点を画像データの左上又は
    左下又は右上又は右下の一点とし、文字又は文字列
    置座標も文字矩形領域又は文字列矩形領域の左上又は左
    下又は右上又は右下とすることを特徴とする文字認識装
    置。
  13. 【請求項13】請求項12記載の文字認識装置におい
    て、アプリケーションの機能を備え、文字画像より文字
    認識を行い文字コードに変換した文字又は文字列をアプ
    リケーションの入力文字として用いることを特徴とする
    文字認識装置。
  14. 【請求項14】請求項12記載の文字認識装置におい
    て、電子辞書の機能を備え、文字画像より文字認識を行
    い文字コードに変換した文字又は文字列を辞書の検索文
    字として用いることを特徴とする文字認識装置。
  15. 【請求項15】請求項13記載の文字認識装置におい
    て、アプリケーション又は辞書機能が入力文字として欧
    文を必要としている時は、画像データに対し文字列矩形
    領域認識部で求めた矩形領域より文字列の位置座標を求
    め、あらかじめ決められた一点に最も近接した文字列の
    位置座標を持つ文字列矩形領域に対し文字認識部にて文
    字コードに変換することによる文字入力を行い、アプリ
    ケーション又は辞書機能が入力文字として和文又は漢文
    を必要としている時は、画像データに対し文字矩形領域
    認識部で求めた矩形領域より文字の位置座標を求め、あ
    らかじめ決められた一点に最も近接した文字の位置座標
    を持つ文字矩形領域に対し文字認識部にて文字コードに
    変換することによる文字入力を行うことを特徴とする文
    字認識装置。
  16. 【請求項16】原稿の読取領域を目視でき、読み取りた
    い文字に位置合わせするための認識開始位置が示された
    読取領域目視窓で認識開始位置をあわせて原稿を走査
    し、走査で得た画像データを記憶し、記憶した画像デー
    タに対して文字の矩形領域を求め 求めた矩形領域より
    文字の位置座標を求め、あらかじめ決められた一点に最
    も近接した文字の位置座標を持つ矩形領域に対して文字
    コードに変換することを特徴とする文字認識方法。
JP19522198A 1998-07-10 1998-07-10 文字認識装置および文字認識方法 Expired - Fee Related JP3476680B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP19522198A JP3476680B2 (ja) 1998-07-10 1998-07-10 文字認識装置および文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP19522198A JP3476680B2 (ja) 1998-07-10 1998-07-10 文字認識装置および文字認識方法

Publications (2)

Publication Number Publication Date
JP2000029984A JP2000029984A (ja) 2000-01-28
JP3476680B2 true JP3476680B2 (ja) 2003-12-10

Family

ID=16337490

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19522198A Expired - Fee Related JP3476680B2 (ja) 1998-07-10 1998-07-10 文字認識装置および文字認識方法

Country Status (1)

Country Link
JP (1) JP3476680B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60327736D1 (de) 2002-12-26 2009-07-09 Canon Kk Bildverarbeitungsapparatur und Bildverarbeitungsverfahren
US20060045346A1 (en) * 2004-08-26 2006-03-02 Hui Zhou Method and apparatus for locating and extracting captions in a digital image

Also Published As

Publication number Publication date
JP2000029984A (ja) 2000-01-28

Similar Documents

Publication Publication Date Title
US6766069B1 (en) Text selection from images of documents using auto-completion
EP0854434B1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
US4903311A (en) Character region extracting method and apparatus capable of implementing the method
JPH06274680A (ja) 文書認識方法およびシステム
JP2001175807A (ja) テキスト領域選択方法
JPH03122773A (ja) 画像形成装置
JP2713622B2 (ja) 表形式文書読取装置
JPS63155386A (ja) 帳票デ−タ読取装置
US4941195A (en) Optical character reader
JP4443194B2 (ja) 携帯端末の文字認識における処理対象選択方法および携帯端末
JPH0554073A (ja) デジタル翻訳装置
JP3476680B2 (ja) 文字認識装置および文字認識方法
EP0766193B1 (en) Optical character reader with skew correction
US5638466A (en) Method and apparatus for deskewing images of symbols having a non-linear baseline
JPH08180068A (ja) 電子ファイリング装置
KR19980058361A (ko) 한글 문자 인식 방법 및 시스템
KR20050003075A (ko) 문자인식기능과 전자사전을 구비하는 휴대통신장치및 문자인식기능을 구비하는 전자사전
JP2000082110A (ja) 罫線消去装置および文字画像抽出装置および罫線消去方法および文字画像抽出方法および記録媒体
JPH06131111A (ja) 文字認識装置及び文字認識方法
JPH06150056A (ja) 表認識装置
JPH05120472A (ja) 文字認識装置
JP2002157550A (ja) 文字認識装置、文字認識方法、および記録媒体
JPH06149888A (ja) 電子ファイリングシステム
JPH09152957A (ja) 画像表示制御装置および方法
JPH05120471A (ja) 文字認識装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030916

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080926

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080926

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090926

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090926

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100926

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110926

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120926

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130926

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees