JP3476680B2

JP3476680B2 - 文字認識装置および文字認識方法

Info

Publication number: JP3476680B2
Application number: JP19522198A
Authority: JP
Inventors: 孝和永坂; 克治永井; 成一郎三木; 英幸 ▲廣▼
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1998-07-10
Filing date: 1998-07-10
Publication date: 2003-12-10
Anticipated expiration: 2018-07-10
Also published as: JP2000029984A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、新聞・雑誌等の文
字情報を認識し、認識した情報を用いてアプリケーショ
ンで用いることを可能にする、文字認識装置および文字
認識方法に関するものである。

【０００２】

【従来の技術】パーソナルコンピュータ等の情報機器に
スキャナ等を使用して文書を画像データとして取り込
み、その画像データを文字として認識しＪＩＳコード等
の文字コードに変換するＯＣＲ（光学式文字認識）装置
が普及している。ＯＣＲ機能は新聞・雑誌等の印刷物の
状態にある画像データを文字コードに変換し保存や編集
するのに用いられる。通常のＯＣＲは画像データ全体を
一括して文字認識する。しかし、ＯＣＲが必要な部分が
画像データ全体の一部しか必要のない場合は、画像全体
をＯＣＲするのに時間を要する、必要な画像データ部分
とＯＣＲした結果との関連付けを行うのに手間がかかる
不都合が生じる。

【０００３】この問題を解決するため、次の様な解決方
法があった。マウスやタブレット等のポインティングデ
バイスでＯＣＲする部分を指定して、指定した部分をＯ
ＣＲする方法（特開平６−１３１１１１号公報）。必要
な部分のみをスキャナで読込む方法（特開平５−２７４
３４６号公報）。

【０００４】

【発明が解決しようとする課題】マウスやタブレット等
のポインティングデバイスでＯＣＲする部分を指定し
て、指定した部分をＯＣＲする方法では、読取った画像
全体又は画像の一部を表示するためには画像で文字が確
認できることを可能とする高解像度の表示装置が必要で
あった。又、表示装置よりポインティングデバイスでＯ
ＣＲ部分を指示する手間が必要であった。

【０００５】必要な部分のみをスキャナで読込む方法は
読込む部位をスキャンする操作に慣れを要し、読込む原
稿の文字が小さい時はスキャンする場所を指定するのが
困難であったり、文字が大きい場合はスキャン出来ない
場合があった。

【０００６】

【課題を解決するための手段】請求項１記載の文字認識
装置は、原稿の読取領域を目視でき、読み取りたい文字
に位置合わせするための認識開始位置が示された読取領
域目視窓と、前記読取領域目視窓から原稿の画像データ
を読み取る読取部とを備え、原稿上を走査して文字を認
識する文字認識装置であって、前記読取部に読み取られ
た前記画像データを記憶する記憶部と、前記記憶部に記
憶された前記画像データに対して文字の矩形領域を求め
る文字矩形領域認識部と、前記文字矩形領域認識部で求
めた矩形領域に対し文字コードに変換する文字認識部と
を備え、前記文字認識部は、前記文字矩形領域認識部で
求めた矩形領域の位置座標を求め、前記読取領域目視窓
のあらかじめ決められた一点に最も近接した位置座標を
持つ矩形領域に対し文字コードに変換することを特徴と
する文字認識装置である。

【０００７】請求項２記載の文字認識装置は、原稿の読
取領域を目視でき、読み取りたい文字に位置合わせする
ための認識開始位置が示された読取領域目視窓と、前記
読取領域目視窓から原稿の画像データを読み取る読取部
とを備え、原稿上を走査して文字を認識する文字認識装
置であって、前記読取部に読み取られた前記画像データ
を記憶する記憶部と、前記記憶部に記憶された前記画像
データに対して文字列の矩形領域を求める文字列矩形領
域認識部と、前記文字列矩形領域認識部で求めた矩形領
域に対し文字コードに変換する文字認識部とを備え、前
記文字認識部は、前記文字列矩形領域認識部で求めた矩
形領域の位置座標を求め、前記読取領域目視窓のあらか
じめ決められた一点に最も近接した位置座標を持つ矩形
領域に対し文字コードに変換することを特徴とする文字
認識装置である。

【０００８】請求項３記載の文字認識装置は、原稿の読
取領域を目視でき、読み取りたい文字に位置合わせする
ための認識開始位置が示された読取領域目視窓と、前記
読取領域目視窓から原稿の画像データを読み取る読取部
とを備え、原稿上を走査して文字を認識する文字認識装
置であって、前記読取部に読み取られた前記画像データ
を記憶する記憶部と、前記記憶部に記憶された前記画像
データに対して行領域の位置を求める行領域認識部と、
前記行領域認識部で求めた行領域に対し文字コードに変
換する文字認識部とを備え、前記文字認識部は、前記行
領域認識部で求めた行領域の位置座標を求め、前記読取
領域目視窓のあらかじめ決められた一点に最も近接した
位置座標を持つ行領域に対し文字コードに変換すること
を特徴とする文字認識装置である。

【０００９】請求項４記載の文字認識装置は、請求項１
記載の文字認識装置において、前記文字認識部は、あら
かじめ決められた一点に最も近接した位置座標を持つ文
字矩形領域の文字に対する文字コードの候補と、前記文
字矩形領域の周辺の文字矩形領域の文字に対する文字コ
ードの候補とを求め、前記周辺の文字矩形領域の文字に
対する文字コードの候補と言語的特性により関連付けす
ることによって、前記あらかじめ決められた一点に最も
近接した位置座標を持つ文字矩形領域の文字に対する文
字コードの候補から文字を確定することを特徴とする文
字認識装置である。

【００１０】請求項５記載の文字認識装置は、請求項１
記載の文字認識装置において、前記文字認識部は、あら
かじめ決められた一点に最も近接した文字の位置座標を
持つ文字矩形領域に対し文字コードに変換した後、先に
認識した文字と同じ行にあり後続する文字矩形領域に対
しても文字コードに変換を行い、後に変換した文字コー
ドを先に認識した文字コードに追加して文字列を生成す
ることを特徴とする文字認識装置である。

【００１１】請求項６記載の文字認識装置は、請求項２
記載の文字認識装置において、前記文字認識部は、あら
かじめ決められた一点に最も近接した文字列の位置座標
を持つ文字列矩形領域に対し文字コードに変換した後、
先に認識した文字列と同じ行にあり後続する文字列矩形
領域に対しても文字コードに変換を行い、後に変換した
文字コードを先に認識した文字コードに追加して文字列
を生成することを特徴とする文字認識装置である。

【００１２】請求項７記載の文字認識装置は、請求項１
記載の文字認識装置において、表示装置及びスイッチ等
の入力装置を備え、文字認識した文字を表示装置にて表
示後、入力装置により方向を指示することにより、既に
表示してある文字又は文字列が位置する文字矩形領域に
対し指示された方向に隣接する文字の文字矩形領域に対
して文字認識部にて文字コードに変換した文字コード
を、既に表示している文字又は文字列に追加して表示を
行うことを特徴とする文字認識装置である。

【００１３】請求項８記載の文字認識装置は、請求項２
記載の文字認識装置において、表示装置及びスイッチ等
の入力装置を備え、文字認識した文字列を表示装置にて
表示後、入力装置により方向を指示することにより、既
に表示してある文字列が位置する文字列矩形領域に対し
指示された方向に隣接する文字列の文字列矩形領域に対
して文字認識部にて文字コードに変換した文字コード
を、既に表示している文字列に追加して表示を行うこと
を特徴とする文字認識装置である。

【００１４】請求項９記載の文字認識装置は、請求項１
記載の文字認識装置において、文字矩形領域認識部又は
文字列矩形領域認識部又は行領域認識部は求めた文字矩
形領域又は文字列矩形領域又は行領域が、画像データの
端に接している時は、文字又は文字列が画面の端にあり
文字が欠けている判断し、文字矩形領域又は文字列矩形
領域又は行領域から除外することを特徴とする文字認識
装置である。

【００１５】請求項１０記載の文字認識装置は、請求項
１記載の文字認識装置において、文字矩形領域認識部又
は文字列矩形領域認識部は、矩形部位の認識を行う際、
最初に行の矩形範囲の認識を行い、その行の矩形範囲よ
り、あらかじめ決められた一点に近接する行に対して文
字矩形認識又は文字列矩形認識を行うことを特徴とする
文字認識装置である。

【００１６】請求項１１記載の文字認識装置は、請求項
１０記載の文字認識装置において、求めた行の矩形範囲
が、画像データの端に接している時は、文字又は文字列
が画面の端にあり文字が欠けている判断し、行の矩形範
囲から除外することを特徴とする文字認識装置である。

【００１７】請求項１２記載の文字認識装置は、請求項
１１記載の文字認識装置において、あらかじめ決められ
た一点を画像データの左上又は左下又は右上又は右下の
一点とし、文字又は文字列の位置座標も文字矩形領域又
は文字列矩形領域の左上又は左下又は右上又は右下とす
ることを特徴とする文字認識装置である。

【００１８】請求項１３記載の文字認識装置は、請求項
１２記載の文字認識装置において、アプリケーションの
機能を備え、文字画像より文字認識を行い文字コードに
変換した文字又は文字列をアプリケーションの入力文字
として用いることを特徴とする文字認識装置である。

【００１９】請求項１４記載の文字認識装置は、請求項
１２記載の文字認識装置において、電子辞書の機能を備
え、文字画像より文字認識を行い文字コードに変換した
文字又は文字列を辞書の検索文字として用いることを特
徴とする文字認識装置である。

【００２０】請求項１５記載の文字認識装置は、請求項
１３記載の文字認識装置において、アプリケーション又
は辞書機能が入力文字として欧文を必要としている時
は、画像データに対し文字列矩形領域認識部で求めた矩
形領域より文字列の位置座標を求め、あらかじめ決めら
れた一点に最も近接した文字列の位置座標を持つ文字列
矩形領域に対し文字認識部にて文字コードに変換するこ
とによる文字入力を行い、アプリケーション又は辞書機
能が入力文字として和文又は漢文を必要としている時
は、画像データに対し文字矩形領域認識部で求めた矩形
領域より文字の位置座標を求め、あらかじめ決められた
一点に最も近接した文字の位置座標を持つ文字矩形領域
に対し文字認識部にて文字コードに変換することによる
文字入力を行うことを特徴とする文字認識装置である。

【００２１】請求項１６記載の文字認識方法は、原稿の
読取領域を目視でき、読み取りたい文字に位置合わせす
るための認識開始位置が示された読取領域目視窓で認識
開始位置をあわせて原稿を走査し、走査で得た画像デー
タを記憶し、記憶した画像データに対して文字の矩形領
域を求め、求めた矩形領域より文字の位置座標を求め、
あらかじめ決められた一点に最も近接した文字の位置座
標を持つ矩形領域に対して文字コードに変換することを
特徴とする文字認識方法である。

【００２２】

【発明の実施の形態】以下に、本発明の文字認識装置を
電子辞書で用いたときの実施例を図に基づいて説明す
る。

【００２３】本発明は読取り位置を目視で確認可能なス
キャナ装置（図１）にて読取る位置を指定し、読取った
画像（図３）に対し文字の切出しを行い文字認識する装
置にて構成される。請求項７又は８が関連する発明にお
いては、表示装置および方向を指示する入力装置も兼ね
備える。請求項１３の発明においてはアプリケーション
の機能を兼ね備える。請求項１４の発明においては電子
辞書の機能を兼ね備える。請求項１５の発明においては
アプリケーション又は電子辞書の機能を兼ね備える。本
発明では文字の切出しを行う部分を、あらかじめ決めら
れた部位に限定する。使用者はそのＯＣＲが必要な部位
をスキャナ装置（図１）で、目視にて確認してあらかじ
め指定された部位をスキャンし、本発明によるあらかじ
め決められた部位に限定された領域の切出しを行い文字
認識部い文字情報を得る。

【００２４】図１は、本発明が用いるスキャナの一例で
ある。図１において１は読取り装置本体で、２はＣＩＳ
等のラインスキャナと、ラインスキャナの移動を検出す
るエンコーダを持つ読取り部で本体１と一体になってい
る。３は電子辞書等のアプリケーションの表示を行う表
示部で、４は読取り部での読取りを指示する読取りスイ
ッチで５はアプリケーション等の入力に用いる左右方向
スイッチ及び検索スイッチである。６は原稿を読取る時
に本体部より引き出すガイド板で、７は読取り位置を示
す読取り窓で、読取る原稿が読取り窓７よりが見えるよ
うに置く。このガイド板６の上を読取り部２が本体１と
ともに矢印８のラインスキャナの副走査方向にスライド
移動することにより読取り窓７から見える原稿を読取
る。

【００２５】図２は読取り対象となる原稿で読取り窓７
を読取り対象となる部分に当て、読取りスイッチ４を押
し、読取り部２と本体を８の副走査方向にスライド移動
することにより、図３の読取り画像を得ることが出来
る。このように本装置では目視で読取り位置を確認した
部分を読取り画像として読取ることが出来る。

【００２６】図４は文字認識装置の構成図で９は制御及
び画像等の処理をするＣＰＵで、１０はアプリケーショ
ン・ＯＣＲ・スキャナ制御等のプログラムとＯＣＲ辞書
データが入ったＲＯＭで、１１は読み込んだ画像データ
・文字矩形データ・認識結果データ・表示データ等を収
納するＲＡＭで、１２は原稿を読み込むためのＣＩＳに
よるラインセンサで、ラインセンサで読取った画像は画
像処理回路１３で増幅・Ａ／Ｄ変換後、２値化される。
２値化された画像はエンコーダ１４で副走査方向の移動
が検出された時、ＤＭＡコントローラ１５にて、ＲＡＭ
１１に画像データとして転送され、ＲＡＭ１１で画像デ
ータとして蓄積される。１６は入力装置で、図１の読取
りスイッチ４及び検索スイッチ・左右方向スイッチ５に
より入力することにＣＰＵに対し割り込みを発生しキー
入力が押されたことを検出する。１７は表示メモリで、
表示メモリの内容を図１の表示部３に該当する液晶表示
装置１８で表示する。

【００２７】上のように構成された文字認識装置にて本
発明は次のように実施される。

【００２８】（実施例１）本発明の請求項１・４・５・
７・９・１０・１１・１３・１４を用いたときの画像読
取・認識の実施例を図５・６・７・８・９に示すフロー
チャートに従い説明する。また、請求項３・１２を実施
する場合の変更点を本実施例の後半に記す。

【００２９】使用者は入力画面で原稿を読み取りたい時
に本装置のガイド板６を本体より引き出し読取りスイッ
チ４を押す。本実施例の文字認識装置の読取りスイッチ
４がおされたことにより割り込みが発生すると図５の処
理が実行される。Ｓ１においてイメージバッファ等のメ
モリの初期化とワークの確保を実施する。ここで、表示
文字数を示す変数ＮＤを１、処理中の文字を示す変数Ｎ
と読取り開始位置を示す変数ＮＳを０に、認識結果が入
る文字配列Ｓの要素を文字が入っていないことを意味す
る０にする。

【００３０】Ｓ２においてラインセンサ１２と画像処理
回路１３とエンコーダ１４とＤＭＡコントローラ１５の
初期化を行い読み取りの準備を実施する。

【００３１】Ｓ３にて表示部３が文字入力画面かどうか
の判定を行い、文字入力画面で無ければ終了処理として
Ｓ４に処理を移し、Ｓ４にてスキャナ部のハードのＯＦ
Ｆ処理を行い、Ｓ５でＳ１で確保したワークを解放し割
り込みを終了する。

【００３２】Ｓ３にて文字入力画面と判定された場合は
Ｓ６に処理を移し、読取りスイッチが押されたかどうか
判定し、押されていない場合はＳ３に処理を移し読取り
スイッチが押されるまでＳ３とＳ６の処理を繰り返す。

【００３３】使用者は図１０に示す原稿に対し認識開始
位置１９に読み取りたい文字が来るように読取り窓７を
見ながら読取り装置を置く。ここでは図１０の原稿の３
行目の「矩形」を読み取りたいものとする。置いた後使
用者は再び読取りスイッチ４を押す。スイッチ４が再び
押されたことによりＳ６からＳ７に処理が移る。使用者
は読取り部２を本体とともに矢印８のラインスキャナの
副走査方向にスライド移動することにより読取り窓７か
ら見える原稿を読取る。

【００３４】Ｓ７ではラインセンサで読取った画像を画
像処理回路１３で２値化し、エンコーダ１４で副走査方
向の移動が検出された時、２値化された画像はＤＭＡコ
ントローラ１５にて、ＲＡＭ１１にラインセンサの１ラ
イン分転送され、ＲＡＭ１１には画像データとして配列
Ｄに次のように蓄積される。

【００３５】Ｄ［Ｘ座標］［Ｙ座標］黒の時は１となり白の時は０Ｘ座標：０−１０２３（左が０）Ｙ座標：０−３５９（上が０）蓄積された画像は図１１に示す画像となる。

【００３６】そして、図６のＳ８に処理が移り行認識が
実施される。行認識は図１２の式に示すように黒の数を
横方向にカウントし、図１３の表のような配列を得る。

【００３７】図１３の表で解るように行間の部分はカウ
ントされていない。配列Ｈの最大値に対し６４分の１以
下の部分を行間とすることにより行間を求めることが出
来る。

【００３８】図１１の画像では行間を区切りとすると文
字の行は次の行矩形位置に存在する。

【００３９】１行目（０，０）−（１０２３，４２）２行目（０，５０）−（１０２３，１２２）３行目（０，１３０）−（１０２３，２０７）４行目（０，３２０）−（１０２３，３６０）注：（Ｘ座標開始位置，Ｙ座標開始位置）−（Ｘ座標終
了位置，Ｙ座標終了位置）次にＳ９にて、Ｓ８で求めた行矩形領域に対し認識を実
施する行の抽出を行う。

【００４０】図１１の例では一番上の行の認識を実施す
る。ここで１行目はＹ座標開始位置が画面の上端を示す
０をとるため、１行目は画面の上端に接しており情報が
欠けていると判断されるため、２行目の矩形領域を認識
領域として用いる。

【００４１】Ｓ１０においてＳ９で求めた行の矩形領域
に対し、文字の矩形領域を求める。文字矩形認識は図１
４の式に示すように行矩形領域に対し黒の数を縦方向に
カウントすることにより行う。行認識同様、文字間の部
分はカウントされてないため、配列Ｖの最大値に対し３
２分の１以下の部分が行のＹ方向幅の３２分の１以上連
続する部分を文字間とすることにより文字間を求めるこ
とが出来る。

【００４２】図１１の例では２行目のＹ方向幅は１２２
−５０＝７２となるので７２／３２＝２以上、配列Ｖの
最大値に対し３２分の１以下の部分が連続する部分を文
字間とする。図１１の２行目の画像では文字間を区切り
とすると文字は次の矩形位置に存在する。

【００４３】１文字目（求）（０，５０）−（２０，１２２）２文字目（め）（２６，５０）−（７３，１２２）３文字目（た）（８２，５０）−（１２５，１２２）４文字目（矩）（１３２，５０）−（１８２，１２２）５文字目（形）（１８６，５０）−（２３６，１２２）６文字目（領）（２４０，５０）−（２８３，１２２）７文字目（域）（２９０，５０）−（３４２，１２２）８文字目（よ）（３５０，５０）−（３９０，１２２）注：（Ｘ座標開始位置，Ｙ座標開始位置）−（Ｘ座標終了位置，Ｙ座標終了位置）ここで求めた文字数を変数Ｍに代入する。

【００４４】図１１の例ではＭは２０となる。Ｓ１１で
は求めた文字数Ｍが０であるならば、読取りミスとして
Ｓ４に処理を移し終了処理を行い割り込みを終了し、Ｍ
が０でないならば、Ｓ１２に処理を移す。

【００４５】Ｓ１２でＳ１０で求めた文字に対して位置
座標を決める。この時、１文字目の矩形領域のＸ座標開
始位置が画像の左端を示す０をとるため、画面に左端に
接していると判断できるため、１文字目を認識対象から
除外し、Ｓ１０で求めた文字矩形領域の２文字目を１文
字目として位置座標を求める。最後の文字に関してもＸ
座標終了位置が画面の右端を示す１０２３の値をとるな
らば認識対象から除外する。また、画面に接していると
判断して文字位置座標から除外したときは文字数を示す
Ｍの値も除外した文字数に応じて減らす。

【００４６】図１１の例では文字矩形領域の左上の部分
を位置座標とするので次の通りとなる。

【００４７】１文字目（め）（２６，５０）［Ｓ１０で求めた２文字目］２文字目（た）（８２，５０）［Ｓ１０で求めた３文字目］３文字目（矩）（１３２，５０）［Ｓ１０で求めた４文字目］４文字目（形）（１８６，５０）［Ｓ１０で求めた５文字目］５文字目（領）（２４０，５０）［Ｓ１０で求めた６文字目］６文字目（域）（２９０，５０）［Ｓ１０で求めた７文字目］７文字目（よ）（３５０，５０）［Ｓ１０で求めた８文字目］注：（Ｘ座標位置，Ｙ座標位置）Ｍ＝１９（最初の「求」が削除されたため１減算）次にＳ１３に処理を移し、Ｓ１２で求めた座標位置に対
し認識開始位置１９に最も近い文字を求める。

【００４８】図１１の例では認識開始位置１９の座標は
（１２８，０）であるため３文字目となる。その値を処
理文字を示す変数Ｎ及び文字開始位置を示す変数ＮＳに
入れる。ここで変数Ｎ及びＮＳの取る値は１文字目が０
となるため２となる。

【００４９】次にＳ１４に処理を移しＳ１３で求めたＮ
が０ならばＳ１６に処理を移し０以外ならばＳ１５の処
理を行う。Ｓ１５では、Ｎ−１に該当する文字矩形領域
に対しパターンマッチングにより文字認識しＮ−１に該
当する文字の候補を求める。ここで、図１１の例では最
初はＮは２となるため、Ｎ−１は１となりこれはＳ１２
で求めた文字座標位置の２文字目、Ｓ１０で求めた文字
矩形領域の３文字目の「た」に当たる。ここで文字候補
を次の配列Ｔに入れる。

【００５０】Ｔ［Ａ］［Ｂ］Ａ：文字位置の変数Ｎに該当する値Ｂ：Ａ番目の文字に対する候補の要素を示す添字で０−
３の値を取るＴは構造対でメンバーとして次のものを持つＴ［Ａ］［Ｂ］．ＣＯＤＥ文字候補の文字コードＴ［Ａ］［Ｂ］．ＰＥＲ文字候補の的中率（％）ここでは「た」に対し次の様に文字候補が選ばれたとす
る。

【００５１】またＴの２番目の添字に関しては、的中率が高い順に要
素を入れるため、ＰＥＲの大きい順に並ぶ。そして、Ｓ
１６に処理を移す。

【００５２】Ｓ１６では、変数Ｎに該当する文字矩形領
域に対しパターンマッチングにより文字認識し変数Ｎに
該当する文字の候補を求める。ここで、図１１の例では
最初はＮは２となるため、Ｓ１２で求めた文字座標位置
の３文字目、Ｓ１０で求めた文字矩形領域の４文字目の
「矩」に当たる。ここで文字候補を配列Ｔ［Ｎ］に入れ
る。ここでは「矩」に対し次の様に文字候補が選ばれた
とする。

【００５３】そして、Ｓ１７に処理を移す。

【００５４】Ｓ１７では処理する文字を示すＮの値とＭ
−１（文字数−１）の値を比較し処理する文字が最後の
文字かどうか判断し、最後の文字と判断したときはＳ２
４に処理を移し、最後の文字で無いときはＳ１８の処理
を行う。

【００５５】次にＳ１８では、Ｎ＋１に該当する文字矩
形領域に対しパターンマッチングにより文字認識しＮ＋
１に該当する文字の候補を求める。

【００５６】図１１の例ではＮは最初は２となるため、
Ｎ＋１は３となり、Ｓ１２で求めた文字座標位置の４文
字目、Ｓ１０で求めた文字矩形領域の５文字目の「形」
に当たる。ここで文字候補を配列Ｔ［Ｎ＋１］に入れ
る。ここでは「形」に対し次の様に文字候補が選ばれた
とする。

【００５７】そして、Ｓ１９に処理を移す。

【００５８】Ｓ１９では処理する文字を示すＮの値が０
であるか判断し、０の時はＳ２１の処理を、０でないと
きはＳ２０に処理を移す。

【００５９】Ｓ２０では文字候補配列Ｔを参照し変数Ｎ
に該当する文字矩形領域の文字を決定する。

【００６０】まず配列Ｔ［Ｎ−１］［０．．３］の各要
素とＴ［Ｎ］［０．．３］の各要素に対し辞書を検索し
熟語が存在するか検索する。熟語が存在するときはＴ
［Ｎ］［０．．３］の熟語が存在した要素のＰＥＲに対
し、Ｔ［Ｎ−１］［０．．３］の熟語の対になるＰＥＲ
を加算する。Ｎ＝２の時の例では「た」に対する文字候
補と「矩」に対する文字候補との組み合わせでは熟語が
存在しないのでＰＥＲの加算は行わない。

【００６１】次に、配列Ｔ［Ｎ］［０．．３］の各要素
とＴ［Ｎ＋１］［０．．３］の各要素に対し辞書を検索
し熟語が存在するか検索する。熟語が存在するときはＴ
［Ｎ］［０．．３］の熟語が存在した要素のＰＥＲに対
し、Ｔ［Ｎ＋１］［０．．３］の熟語の対になるＰＥＲ
を加算する。図１１の例では最初はＮ＝２となり、
「矩」に対する文字候補と「形」に対する文字候補との
組み合わせでは「矩形」という熟語が存在するので、Ｔ
［２］［０］のＰＥＲ３５％に対しＴ［３］［０］のＰ
ＥＲ７０％を加算するのでＴ［２］［０］のＰＥＲは１
０５％となる。すなわち、Ｔ［２］［０．．３］の配列
は次の様になる。

【００６２】次にＴ［Ｎ］［０．．３］の各要素のＰＥＲの中で最も
大きい値を取る要素を文字として確定し、そのＣＯＤＥ
の値を認識結果を示す文字配列ＳのＳ［Ｎ］に代入す
る。

【００６３】図１１の例では最初はＮ＝２となり、Ｔ
［２］［０．．３］の各要素の中でＰＥＲが一番大きい
のはＴ［２］［０］であるため、Ｔ［２］［０］のＣＯ
ＤＥ「矩」がＳ［２］の値となる。そして、処理をＳ２
２に移す。

【００６４】Ｓ２１はＳ１８で処理する文字を示すＮの
値が０であると判断したとき、すなわち認識開始文字の
前に文字が無い場合実行され、文字候補配列Ｔを参照し
変数Ｎに該当する文字矩形領域の文字を決定する。配列
Ｔ［Ｎ］［０．．３］の各要素とＴ［Ｎ＋１］［０．．
３］の各要素に対し辞書を検索し熟語が存在するか検索
する。熟語が存在するときはＴ［Ｎ］［０．．３］の熟
語が存在した要素のＰＥＲに対し、Ｔ［Ｎ＋１］
［０．．３］の熟語の対になるＰＥＲを加算する。

【００６５】次にＴ［Ｎ］［０．．３］の各要素のＰＥ
Ｒの中で最も大きい値を取る要素を文字として確定し、
そのＣＯＤＥの値を認識結果を示す文字配列ＳのＳ
［Ｎ］に代入する。そして、処理をＳ２２に移す。

【００６６】Ｓ２２はＳ２０またはＳ２１の次に実行さ
れ、認識結果の文字配列Ｓの要素のうち認識開始位置を
示すＮＳから表示文字数ＮＤ文字分表示メモリ１７にキ
ャラクタ展開し、表示装置１８（表示部３）に表示す
る。すなわちＳ［ＮＳ］からＳ［ＮＳ＋ＮＤ−１］を表
示する。次にＳ２３で処理する文字を示す変数Ｎに１加
算し、再び処理をＳ１７に戻し後続する文字の認識を行
う。

【００６７】Ｓ２４は、Ｓ１７で処理する文字を示すＮ
の値が最後の文字と判断したとき実行され、処理する文
字を示すＮの値が０であるか判断し、０の時はＳ２６の
処理を、０でないときはＳ２５に処理を移す。Ｓ２５で
は文字候補配列Ｔを参照し変数Ｎに該当する文字矩形領
域の文字を決定する。配列Ｔ［Ｎ−１］［０．．３］の
各要素とＴ［Ｎ］［０．．３］の各要素に対し辞書を検
索し熟語が存在するか検索する。熟語が存在するときは
Ｔ［Ｎ］［０．．３］の熟語が存在した要素のＰＥＲに
対し、Ｔ［Ｎ−１］［０．．３］の熟語の対になるＰＥ
Ｒを加算する。

【００６８】次にＴ［Ｎ］［０．．３］の各要素のＰＥ
Ｒの中で最も大きい値を取る要素を文字として確定し、
そのＣＯＤＥの値を認識結果を示す文字配列ＳのＳ
［Ｎ］に代入する。そして、処理をＳ２７に移す。

【００６９】Ｓ２６は、Ｓ２４で処理する文字を示すＮ
の値が０であると判断したとき、すなわちＳ１２で求め
た文字位置が１文字分しかない時実行され、文字候補配
列Ｔ［Ｎ］［０．．３］の各要素のＰＥＲの中で最も大
きい値を取る要素を文字として確定し、そのＣＯＤＥの
値を認識結果を示す配列ＳのＳ［Ｎ］に代入する。そし
て、処理をＳ２７に移す。

【００７０】Ｓ２７はＳ２５またはＳ２６の次に実行さ
れ、認識結果の文字配列Ｓの要素のうち認識開始位置を
示すＮＳから表示文字数ＮＤ文字分表示メモリ１７にキ
ャラクタ展開し、表示装置１８（表示部３）に表示す
る。すなわちＳ［ＮＳ］からＳ［ＮＳ＋ＮＤ−１］を表
示する。以上でＳ９で求めた行領域の認識が終了したの
で、図５のＳ４に処理を移し、終了処理を行い割り込み
を終了する。

【００７１】入力画面で使用者が右方向スイッチ５を押
すと割り込みが発生し図７のフローチャートが実行され
る。

【００７２】Ｓ２８で入力画面であるかの判断が実施さ
れ、入力画面で無い場合は本割り込みは終了され、入力
画面であると判断されると、Ｓ２９の処理が実行され
る。Ｓ２９で表示文字数を示す変数ＮＤに１加算され、
Ｓ３０で認識結果の文字配列Ｓの要素のうち認識開始位
置を示すＮＳから表示文字数ＮＤ文字分表示メモリ１７
にキャラクタ展開し、表示装置１８（表示部３）に表示
する。すなわちＳ［ＮＳ］からＳ［ＮＳ＋ＮＤ−１］を
表示する。そして、割り込みを終了する。

【００７３】入力画面で使用者が左方向スイッチ５を押
すと割り込みが発生し図８のフローチャートが実行され
る。Ｓ３１で入力画面であるかの判断が実施され、入力
画面で無い場合は本割り込みは終了され、入力画面であ
ると判断されると、Ｓ３２の処理が実行される。

【００７４】Ｓ３２で認識結果の文字配列Ｓに文字が入
っているか判断し、文字が入っていない場合は最初の文
字決定前なので左側の文字の認識は行うことが出来ない
ため本割り込みは終了し、文字が入っているとＳ３３の
処理が実行される。Ｓ３３で認識開始位置を示すＮＳの
値が０であるか判断し、ＮＳが０であると表示文字の前
に文字がないので本割り込みは終了され、０以外だとＳ
３４の処理が実行される。

【００７５】Ｓ３４は、認識開始位置を示すＮＳの値が
１であるか判断し、１の時はＳ３７の処理を、１でない
ときはＳ３５に処理を移す。Ｓ３５では、ＮＳ−２に該
当する文字矩形領域に対しパターンマッチングにより文
字認識しＮＳ−２に該当する文字の候補を求める。図１
１の例では最初はＮＳは２となるため、ＮＳ−２は０と
なり、Ｓ１２で求めた文字座標位置の１文字目、Ｓ１０
で求めた文字矩形領域の２文字目の「め」に当たる。こ
こで文字候補を配列Ｔ［ＮＳ−２］に入れる。

【００７６】ここでは「め」に対し次の様に文字候補が
選ばれたとするそして、Ｓ３６に処理を移す。

【００７７】Ｓ３６では文字候補配列Ｔを参照し変数Ｎ
Ｓ−１に該当する文字矩形領域の文字を決定する。まず
配列Ｔ［ＮＳ−２］［０．．３］の各要素とＴ［ＮＳ−
１］［０．．３］の各要素に対し辞書を検索し熟語が存
在するか検索する。熟語が存在するときはＴ［ＮＳ−
１］［０．．３］の熟語が存在した要素のＰＥＲに対
し、Ｔ［ＮＳ−２］［０．．３］の熟語の対になるＰＥ
Ｒを加算する。

【００７８】図１１の例では最初はＮＳ＝２となり、
「め」に対する文字候補と「た」に対する文字候補との
組み合わせでは「求めた」という熟語が存在するので、
Ｔ［１］［０］のＰＥＲ６０％に対しＴ［０］［０］の
ＰＥＲ４０％を加算するのでＴ［１］［０］のＰＥＲは
１００％となる。次に配列Ｔ［ＮＳ−１］［０．．３］
の各要素とＴ［ＮＳ］［０．．３］の各要素に対し辞書
を検索し熟語が存在するか検索する。熟語が存在すると
きはＴ［ＮＳ−１］［０．．３］の熟語が存在した要素
のＰＥＲに対し、Ｔ［ＮＳ］［０．．３］の熟語の対に
なるＰＥＲを加算する。

【００７９】図１１の例では最初はＮＳ＝２となり、
「た」に対する文字候補と「矩」に対する文字候補との
組み合わせでは熟語が存在しないのでＰＥＲの加算は行
わない。

【００８０】すなわち、Ｔ［１］［０．．３］の配列は
次の様になる。

【００８１】次にＴ［ＮＳ−１］［０．．３］の各要素のＰＥＲの中
で最も大きい値を取る要素を文字として確定し、そのＣ
ＯＤＥの値を認識結果を示す文字配列ＳのＳ［ＮＳ−
１］に代入する。

【００８２】図１１の例では最初はＮＳ＝２となり、Ｔ
［１］［０．．３］の各要素の中でＰＥＲが一番大きい
のはＴ［１］［０］であるため、Ｔ［１］［０］のＣＯ
ＤＥ「た」がＳ［１］の値となる。そして、処理をＳ３
８に移す。

【００８３】Ｓ３７は、Ｓ３４で認識開始位置を示すＮ
Ｓの値が１であると判断したとき、すなわち認識開始位
置の前に文字が１文字分しかない時実行され、文字候補
配列Ｔを参照し変数ＮＳ−１に該当する文字矩形領域の
文字を決定する。配列Ｔ［ＮＳ−１］［０．．３］の各
要素とＴ［ＮＳ］［０．．３］の各要素に対し辞書を検
索し熟語が存在するか検索する。熟語が存在するときは
Ｔ［ＮＳ−１］［０．．３］の熟語が存在した要素のＰ
ＥＲに対し、Ｔ［ＮＳ］［０．．３］の熟語の対になる
ＰＥＲを加算する。次にＴ［ＮＳ−１］［０．．３］の
各要素のＰＥＲの中で最も大きい値を取る要素を文字と
して確定し、そのＣＯＤＥの値を認識結果を示す文字配
列ＳのＳ［ＮＳ−１］に代入する。そして、処理をＳ３
８に移す。

【００８４】Ｓ３８はＳ３６・Ｓ３７の次に実行され、
文字認識開始位置を示すＮＳの値を１引き、表示文字数
を示すＮＤの値を１加算する。Ｓ３９で認識結果の文字
配列Ｓの要素のうち認識開始位置を示すＮＳから表示文
字数ＮＤ文字分表示メモリ１７にキャラクタ展開し、表
示装置１８（表示部３）に表示する。すなわちＳ［Ｎ
Ｓ］からＳ［ＮＳ＋ＮＤ−１］を表示する。そして、割
り込みを終了する。

【００８５】入力画面で使用者が検索スイッチ５を押す
と割り込みが発生し図９のフローチャートが実行され
る。Ｓ４０で入力画面であるかの判断が実施され、入力
画面で無い場合は本割り込みは終了され、入力画面であ
ると判断されると、Ｓ４１では、読取りスイッチによる
図５・６の割込処理を中止する。そして、Ｓ４２では認
識結果の文字配列Ｓの要素のうち認識開始位置を示すＮ
Ｓから表示文字数ＮＤ文字の内容を電子辞書のキーワー
ドにして検索し、検索した内容を表示メモリ１７に展開
し、表示装置１８（表示部３）に表示する。そして、割
り込みを終了する。

【００８６】以上の処理を実施することにより使用者は
入力画面で原稿を読み取りたい時に本装置のガイド板６
を本体より引き出し読取りスイッチ４を押し、図１０に
示す原稿に対し認識開始位置１９に読み取りたい文字が
来るように読取り窓７を見ながら読取り装置を置き、再
び読取りスイッチ４を押しスキャンする。そして、必要
とされる文字が表示されるまで右方向スイッチ５を入力
し、必要な文字が表示された後（図１５）、検索スイッ
チ５を入力することにより、図１６に示す辞書表示を得
ることが出来る。また、認識開始位置より前の文字を参
照する必要があるときは左方向スイッチを押すと良い。

【００８７】１文字表示後、辞書検索準備等のタスクを
実施するために、表示及びキー操作後に追加認識するた
めには、図６のＳ２２とＳ２３の間に図１７の処理を追
加すると良い。ここでＳ４３は右方向スイッチの割込が
発生し表示文字数を示すＮＤが加算されるまで、認識を
中断するための判断で、ＮＤが加算されるまでＳ４３を
繰り返し、ＮＤが加算されると処理をＳ２３に移す。

【００８８】本実施例１において認識開始位置１９の位
置を左上に移動し、図６のＳ１３で認識開始位置の座標
を（０，０）にすると請求項１２となる。

【００８９】また、請求項１２にて読取り窓の左下を認
識開始位置とした場合図６のＳ９で下の行を抽出し、図
６のＳ１２で文字位置座標決定する際図６のＳ１０で求
めた文字矩形領域の左下を文字位置座標とし、Ｓ１３で
認識開始位置の座標を（０，３５９）にすると良い。

【００９０】請求項３を実施するためには、図６のＳ１
３とＳ１４の間に図１８の処理を追加すると良い。ここ
でＳ４４は図６のＳ１０で設定しＳ１２で補正した文字
数を示す変数Ｍと、Ｓ１３で求めた認識開始文字を示す
変数ＮＳを用い、表示文字数を示すＮＤを次の式で決定
する。

【００９１】ＮＤ＝Ｍ−ＮＳこのようにすることにより、認識が終了し認識結果を示
す文字配列Ｓに認識結果が反映された文字を順次表示す
ることが出来る。

【００９２】（実施例２）本発明の請求項２・６・８・
９・１０・１１・１３・１４を用いたときの画像読取・
認識の実施例を図１９・２０・２１・２２・２３に示す
フローチャートに従い説明する。また、請求項１２を実
施する場合の変更点を本実施例の後半に記す。

【００９３】使用者は入力画面で原稿を読み取りたい時
に本装置のガイド板６を本体より引き出し読取りスイッ
チ４を押す。本実施例の文字認識装置の読取りスイッチ
４がおされたことにより割り込みが発生すると図１９の
処理が実行される。

【００９４】Ｓ４５においてイメージバッファ等のメモ
リの初期化とワークの確保を実施する。ここで、表示文
字列数を示す変数ＷＤを１、処理中の文字列を示す変数
Ｗと読取り開始位置を示す変数ＷＳを０に、認識結果が
入る文字列配列へのポインタの配列Ｊの要素を文字が入
っていないことを意味する０にする。Ｓ４６においてラ
インセンサ１２と画像処理回路１３とエンコーダ１４と
ＤＭＡコントローラ１５の初期化を行い読み取りの準備
を実施する。Ｓ４７にて表示部３が文字入力画面かどう
かの判定を行い、文字入力画面で無ければ終了処理とし
てＳ４８に処理を移し、Ｓ４８にてスキャナ部のハード
のＯＦＦ処理を行い、Ｓ４９でＳ４５で確保したワーク
を解放し割り込みを終了する。

【００９５】Ｓ４７にて文字入力画面と判定された場合
はＳ５０に処理を移し、読取りスイッチが押されたかど
うか判定し、押されていない場合はＳ４７に処理を移し
読取りスイッチが押されるまでＳ４７とＳ５０の処理を
繰り返す。

【００９６】使用者は図２４に示す原稿に対し認識開始
位置１９に読み取りたい文字列が来るように読取り窓７
を見ながら読取り装置を置く。ここでは図２４の原稿の
３行目の「ｉｎｐｒｅｐａｒａｔｉｏｎｆｏｒ」を
読み取りたいものとする。置いた後使用者は再び読取り
スイッチ４を押す。スイッチ４が再び押されたことによ
りＳ５０からＳ５１に処理が移る。使用者は読取り部２
を本体とともに矢印８のラインスキャナの副走査方向に
スライド移動することにより読取り窓７から見える原稿
を読取る。Ｓ５１ではラインセンサで読取った画像を画
像処理回路１３で２値化し、エンコーダ１４で副走査方
向の移動が検出された時、２値化された画像はＤＭＡコ
ントローラ１５にて、ＲＡＭ１１にラインセンサの１ラ
イン分転送され、ＲＡＭ１１には画像データとして配列
Ｄに次のように蓄積される。

【００９７】Ｄ［Ｘ座標］［Ｙ座標］黒の時は１と
なり白の時は０Ｘ座標：０−１０２３（左が０）Ｙ座標：０−３５９（上が０）蓄積された画像は図２５に示す画像となる。

【００９８】そして、図２０のＳ５２に処理が移り行認
識が実施される。行認識は図１２の式に示すように黒の
数を横方向にカウントすることにより実施する。行間の
部分はカウントないため、配列Ｈの最大値に対し６４分
の１以下の部分を行間とすることにより行間を求めるこ
とが出来る。図２５の画像では行間を区切りとすると文
字の行は次の行矩形位置に存在する。

【００９９】１行目（０，０）−（１０２３，２６）２行目（０，６２）−（１０２３，１２８）３行目（０，１６８）−（１０２３，２３０）４行目（０，２５４）−（１０２３，３２８）注：（Ｘ座標開始位置，Ｙ座標開始位置）−（Ｘ座標終
了位置，Ｙ座標終了位置）次にＳ５３にて、Ｓ５２で求めた行矩形領域に対し認識
を実施する行の抽出を行う。

【０１００】図２５の例では一番上の行の認識を実施す
る。ここで１行目はＹ座標開始位置が画面の上端を示す
０をとるため、１行目は画面の上端に接しており情報が
欠けていると判断されるため、２行目の矩形領域を認識
領域として用いる。Ｓ５４においてＳ５３で求めた行の
矩形領域に対し、文字列の矩形領域を求める。

【０１０１】文字列矩形認識は図２６の式に示すように
行矩形領域に対し黒の数を縦方向にカウントすることに
より行う。文字間の部分はカウントされてないため、配
列Ｖの最大値に対し３２分の１以下の部分が行のＹ方向
幅の４分の１以上連続する部分を文字間とすることによ
り文字間を求めることが出来る。

【０１０２】図２５の例では２行目のＹ方向幅は１２８
−６２＝６６となるので６６／４＝１６以上、配列Ｖの
最大値に対し３２分の１以下の部分が連続する部分を文
字間とする。図２５の２行目の画像では文字列間を区切
りとすると文字列は次の矩形位置に存在する。

【０１０３】１文字列目（０，６２）−（３０，１２８）（？ｌ）２文字列目（７２，６２）−（３７０，１２８）（ｅｑｕｉｐｍｅｎｔ）３文字列目（３９６，６２）−（４５４，１２８）（ｉｎ）４文字列目（４９６，６２）−（８２０，１２８）（ｐｒｅｐａｒａｔｉｏｎ）５文字列目（８５０，６２）−（９４４，１２８）（ｆｏｒ）６文字列目（９７８，６２）−（１０２３，１２８）（ｔ？）注：（Ｘ座標開始位置，Ｙ座標開始位置）−（Ｘ座標終
了位置，Ｙ座標終了位置）ここで求めた文字列数を変数
Ｒに代入し処理をＳ５５に移す。

【０１０４】図２５の例ではＲは６となる。Ｓ５５では
求めた文字列数Ｒが０であるならば、読取りミスとして
Ｓ４８に処理を移し終了処理を行い割り込みを終了し、
Ｒが０でないならば、Ｓ５６に処理を移す。Ｓ５６はＳ
５４で求めた文字列に対して位置座標を決める。

【０１０５】この時、１文字列目の矩形領域のＸ座標開
始位置が画像の左端を示す０をとるため、画面に左端に
接していると判断できるため、１文字列目を認識対象か
ら除外し、Ｓ５４で求めた文字列矩形領域の２文字列目
を１文字列目として位置座標を求める。最後の文字列に
関してもＸ座標終了位置が画面の右端を示す１０２３の
値をとるならば認識対象から除外する。また、画面に接
していると判断して文字列位置座標から除外したときは
文字列数を示すＲの値も除外した文字列数に応じて減ら
す。図２５の例では文字列矩形領域の左上の部分を位置
座標とするので次の通りとなる。

【０１０６】１文字列目（７２，６２）（ｅｑｕｉｐｍｅｎｔ）２文字列目（３９６，６２）（ｉｎ）３文字列目（４９６，６２）（ｐｒｅｐａｒａｔｉｏｎ）４文字列目（８５０，６２）（ｆｏｒ）注：（Ｘ座標位置，Ｙ座標位置）Ｒ＝４次にＳ５７に処理を移し、Ｓ５６で求めた座標位置に対
し認識開始位置２０に最も近い文字列を求める。

【０１０７】図２５の例では認識開始位置２０の座標は
（３００，０）であるため２文字列目となる。その値を
処理文字列を示す変数Ｗ及び文字列開始位置を示す変数
ＷＳに入れる。ここで変数Ｗ及びＷＳの取る値は１文字
列目が０となるため１となる。

【０１０８】次にＳ５８に処理を移し、処理文字列を示
す変数Ｗと文字数を示す変数Ｒと比較しＷ＜Ｒ−１なら
処理する文字列があるとして、Ｓ５９に処理を移し、Ｗ
＜Ｒで無いならば処理する文字がないので、Ｓ４８に処
理を移し割込の終了を実施する。Ｓ５９では、変数Ｗに
該当する文字列矩形領域に対しパターンマッチング等に
より文字列認識する。認識結果をワークに入れ、その先
頭文字のポインタをＪ［Ｗ］に入れる。

【０１０９】図２５の例では最初はＷは１となるため、
Ｓ５６で求めた文字列座標位置の２文字列目、Ｓ５４で
求めた文字列矩形領域の３文字列目の”ｉｎ”に当た
る。”ｉｎ”の認識結果に対しワークを確保しその’
ｉ’のアドレスを示すポインタをＪ［１］に入れる。次
にＳ６０で、認識結果の文字列ポインタ配列Ｊの要素の
うち認識開始位置を示すＷＳから表示文字列数ＷＤ文字
列分表示メモリ１７にキャラクタ展開し、表示装置１８
（表示部３）に表示する。すなわちＪ［ＷＳ］からＪ
［ＷＳ＋ＷＤ−１］が指すアドレスポインタの文字列を
表示する。次にＳ６１で処理する文字列を示す変数Ｗに
１加算し、再び処理をＳ５８に戻し後続する文字列の認
識を行う。

【０１１０】入力画面で使用者が右方向スイッチ５を押
すと割り込みが発生し図２１のフローチャートが実行さ
れる。Ｓ６２で入力画面であるかの判断が実施され、入
力画面で無い場合は本割り込みは終了され、入力画面で
あると判断されると、Ｓ６３の処理が実行される。Ｓ６
３で表示文字列数を示す変数ＷＤに１加算され、Ｓ６４
で認識結果の文字列ポインタ配列Ｊの要素のうち認識開
始位置を示すＷＳから表示文字列数ＷＤ文字列分表示メ
モリ１７にキャラクタ展開し、表示装置１８（表示部
３）に表示する。すなわちＪ［ＷＳ］からＪ［ＷＳ＋Ｗ
Ｄ−１］が指すアドレスポインタの文字列を表示する。
そして、割り込みを終了する。

【０１１１】入力画面で使用者が左方向スイッチ５を押
すと割り込みが発生し図２２のフローチャートが実行さ
れる。Ｓ６５で入力画面であるかの判断が実施され、入
力画面で無い場合は本割り込みは終了され、入力画面で
あると判断されると、Ｓ６６の処理が実行される。

【０１１２】Ｓ６６で認識結果の文字列ポインタ配列Ｊ
に文字列が入っているか判断し、文字列が入っていない
場合は最初の文字列決定前なので左側の文字列の認識は
行うことが出来ないため本割り込みは終了し、文字列が
入っているとＳ６７の処理が実行される。Ｓ６７で認識
開始位置を示すＷＳの値が０であるか判断し、ＷＳが０
であると表示文字列の前に文字列がないので本割り込み
は終了され、０以外だとＳ６８の処理が実行される。

【０１１３】Ｓ６８では、変数ＷＳ−１に該当する文字
列矩形領域に対しパターンマッチング等により文字列認
識する。認識結果をワークに入れ、その先頭文字のポイ
ンタをＪ［ＷＳ−１］に入れる。図２５の例では最初は
ＷＳは１となるため、Ｓ５６で求めた文字列座標位置の
１文字列目、Ｓ５４で求めた文字列矩形領域の２文字列
目の”ｅｑｕｉｐｍｅｎｔ”に当たる。”ｅｑｕｉｐｍ
ｅｎｔ”の認識結果に対しワークを確保しその’ｅ’の
アドレスを示すポインタをＪ［０］に入れる。Ｓ６９
で、文字列認識開始位置を示すＷＳの値を１引き、表示
文字列数を示すＷＤの値を１加算する。次にＳ７０で、
認識結果の文字列ポインタ配列Ｊの要素のうち認識開始
位置を示すＷＳから表示文字列数ＷＤ文字列分表示メモ
リ１７にキャラクタ展開し、表示装置１８（表示部３）
に表示する。すなわちＪ［ＷＳ］からＪ［ＷＳ＋ＷＤ−
１］が指すアドレスポインタの文字列を表示する。

【０１１４】入力画面で使用者が検索スイッチ５を押す
と割り込みが発生し図２３のフローチャートが実行され
る。Ｓ７１で入力画面であるかの判断が実施され、入力
画面で無い場合は本割り込みは終了され、入力画面であ
ると判断されると、Ｓ７２で、読取りスイッチによる図
１９・２０の割込処理のタスクを中止する。そして、Ｓ
７３では認識結果の文字列ポインタ配列Ｊの要素のうち
認識開始位置を示すＷＳから表示文字数ＷＤ文字列の内
容を電子辞書のキーワードにして検索し、検索した内容
を表示メモリ１７に展開し、表示装置１８（表示部３）
に表示する。そして、割り込みを終了する。

【０１１５】以上の処理を実施することにより使用者は
入力画面で原稿を読み取りたい時に本装置のガイド板６
を本体より引き出し読取りスイッチ４を押し、図２４に
示す原稿に対し認識開始位置２０に読み取りたい文字列
が来るように読取り窓７を見ながら読取り装置を置き、
再び読取りスイッチ４を押しスキャンする。そして、必
要とされる文字列が表示されるまで右方向スイッチ５を
入力し、必要な文字列が表示された後（図２７）、検索
スイッチ５を入力することにより、図２８に示す辞書表
示を得ることが出来る。また、認識開始位置より前の文
字列を参照する必要があるときは左方向スイッチを押す
と良い。

【０１１６】本実施例２において認識開始位置２０の位
置を左上に移動し、図２０のＳ５７で認識開始位置の座
標を（０，０）にすると請求項１２となる。

【０１１７】また、請求項１２にて読取り窓の左下を認
識開始位置とした場合図２０のＳ５３で下の行を抽出
し、図２０のＳ５６で文字列位置座標決定する際のＳ５
４で求めた文字列矩形領域の左下を文字列位置座標と
し、Ｓ５７で認識開始位置の座標を（０，３５９）にす
ると良い。

【０１１８】１文字列表示後、辞書検索準備等のタスク
を実施するために、表示及びキー操作後に追加認識する
ためには、図２０のＳ６０とＳ６１の間に図２９の処理
を追加すると良い。ここでＳ７４は右方向スイッチの割
込が発生し表示文字列数を示すＷＤが加算されるまで、
認識を中断するための判断で、ＷＤが加算されるまでＳ
７４を繰り返し、ＷＤが加算されると処理をＳ６１に移
す。

【０１１９】（実施例３）本発明の請求項１５用いたと
きの画像読取・認識の実施例を図３０に示すフローチャ
ート及び、実施例１及び実施例２に追記する形で説明す
る。

【０１２０】実施例１及び２と同様に使用者は入力画面
で原稿を読み取りたい時に本装置のガイド板６を本体よ
り引き出し読取りスイッチ４を押す。本実施例の文字認
識装置の読取りスイッチ４がおされたことにより割り込
みが発生すると図３０の処理が実行される。Ｓ７５にお
いて現在使用中のアプリケーションの入力画面が、英和
辞書等の英語入力のアプリケーションか和英辞書等の日
本語入力のアプリケーションか判断する。英語入力の場
合はＳ７６に処理を移し、日本語入力の場合はＳ７９に
処理を移す。

【０１２１】Ｓ７５において日本語入力と判断されたと
きは、Ｓ７６にて右方向スイッチが押されたときの割り
込み処理を図７のＳ２８に設定し、Ｓ７７にて左方向ス
イッチが押されたときの割り込み処理を図８のＳ３１に
設定し、Ｓ７８にて検索スイッチが押されたときの割り
込み処理を図９のＳ４０に設定する。そして図５のＳ１
に処理を移し実施例１を実行するＳ７５において英語入
力と判断されたときは、Ｓ７９にて右方向スイッチが押
されたときの割り込み処理を図２１のＳ６２に設定し、
Ｓ８０にて左方向スイッチが押されたときの割り込み処
理を図２２のＳ６５に設定し、Ｓ８１にて検索スイッチ
が押されたときの割り込み処理を図２３のＳ７１に設定
する。そして図１９のＳ４５処理を移し実施例２を実行
する。

【０１２２】以上の処理により使用中のアプリケーショ
ンの入力画面が、英和辞書等の英語入力のアプリケーシ
ョンの時は文字列認識を行い、和英辞書等の日本語入力
のアプリケーションの時は文字認識を行うことを切り換
えることが可能となる。

【０１２３】

【発明の効果】本発明を実施することにより、入力した
い原稿の必要な文字を目視で確認した後スキャンする
と、読み取った画像に対して、文字認識することが出来
る。読取った画像の確認をする必要が無いため、文字認
識した結果を表示する簡単な表示装置でユーザーインタ
ーフェースを確立することが可能となる。文字認識する
部分も画像全体のうちの一部であるため、文字認識時間
も少なくて済む。文字認識部分は目視にて確認するた
め、位置の指定も容易になる。また、キーボード入力の
ように読みが解らない文字も入力可能とし、操作キーも
最小限になるので、操作の容易性と入力速度の向上が可
能となり、装置の小型化が可能となる。特に携帯機器に
用いた場合、携帯機器の入力デバイスはサイズ等の制限
が多いため、操作性の向上は大きいものとなる。以下
に、請求項ごとの効果を記す。

【０１２４】請求項１記載の発明によれば、特に日本語
の原稿に対し本請求項は効果があり、入力したい原稿の
必要な文字を目視をしながらスキャンすると必要な文字
を認識することが出来る。

【０１２５】請求項２記載の発明によれば、特に欧文の
原稿に対し本請求項は効果があり、入力したい原稿の必
要な文字を目視をしながらスキャンすると必要な文字列
を認識することが出来る。

【０１２６】請求項３記載の発明によれば、入力したい
原稿の必要な行を目視をしながらスキャンすると必要な
行を認識することが出来る。

【０１２７】請求項４記載の発明によれば、特に日本語
の原稿に対し本請求項は効果があり、入力したい原稿の
必要な文字を目視をしながらスキャンすると必要な文字
を認識することが出来、この時周囲の文字を参照し文字
認識の補正を行うため、認識率の向上が期待できる。

【０１２８】請求項５記載の発明によれば、特に日本語
の原稿に対し本請求項は効果があり、入力したい原稿の
必要な文字又は文字列を目視をしながらスキャンすると
必要な文字以降の文字列を認識することが出来る。ま
た、必要な文字数をキーにより指示するようにすると必
要な文字列を容易に得ることが出来る。

【０１２９】請求項６記載の発明によれば、特に欧文の
原稿に対し本請求項は効果があり、入力したい原稿の必
要な文字列を目視をしながらスキャンすると必要な文字
列以降の文字列を認識することが出来る。また、必要な
文字列数をキーにより指示するようにすると必要な文字
列を容易に得ることが出来る。

【０１３０】請求項７記載の発明によれば、特に日本語
の原稿に対し本請求項は効果があり、入力したい原稿の
必要な文字又は文字列を目視をしながらスキャンし、必
要な文字数が得られるまで追加の操作を行うのみで必要
な文字列を認識することが出来る。また、追加の操作後
文字認識するように構成すると、追加の操作を実施する
までの間文字認識は実施しないので、その間に検索準備
等の別のタスクを実施することも可能で、またその間低
消費電力モードにすると節電することが可能となる。

【０１３１】請求項８記載の発明によれば、特に欧文の
原稿に対し本請求項は効果があり、入力したい原稿の必
要な文字列を目視をしながらスキャンし、必要な文字列
数が得られるまで追加の操作を行うのみで必要な文字列
を認識することが出来る。また、追加の操作後文字認識
するように構成すると、追加の操作を実施するまでの間
文字認識は実施しないので、その間に検索準備等の別の
タスクを実施することも可能で、またその間低消費電力
モードにすると節電することが可能となる。

【０１３２】請求項９記載の発明によれば、必要な文字
以外の文字の一部をスキャンしたときも、必要な文字を
得ることを可能とし、使用性の向上が得られる。

【０１３３】請求項１０記載の発明によれば、文字又は
文字列の領域の認識は限られた行のみ認識するため速度
の向上が得られる。

【０１３４】請求項１１記載の発明によれば、必要な行
以外の部分をスキャンしても行単位で必要な行を切り出
すため、請求項５・６・７・８と組み合わせて実施する
ことにより、後続する文字を一つの行で抽出する事が可
能とする。

【０１３５】請求項１２記載の発明によれば、原稿の情
報をアプリケーションの入力文字として直接用いること
を可能とするため、アプリケーション機器のキーボード
等の入力デバイスの操作が不要になり、入力文字が多い
場合は入力の高速化を可能とする。

【０１３６】請求項１３記載の発明によれば、アプリケ
ーションを実施する時入力する文字が原稿に印刷されて
いる場合、使用者は必要な文字が入るように原稿をスキ
ャンすると、文字または文字列の認識結果がアプリケー
ションの入力文字となり入力の利便性が向上する。

【０１３７】請求項１４記載の発明によれば、原稿の情
報を電子辞書の入力文字として直接用いることを可能と
するため、電子辞書のキーボード等の入力デバイスの操
作が不要になり、入力文字が多い場合は入力の高速化を
可能とする。

【０１３８】請求項１５記載の発明によれば、アプリケ
ーション又は辞書の入力画面が欧文を要求する時は、例
えば英和辞書の入力に用いる時は、文字列により文字入
力を可能とするため、入力したい語を容易に確定するこ
とが出来る。また、入力画面が和文を要求する時は、例
えば和英辞書の入力に用いる時は、１文字ずつの文字入
力を可能とするため、必要な文字数入力することが出来
る。そして、入力する言語に応じて認識方法・認識辞書
を変えることも可能となるので認識率の向上を図ること
が出来る。

【図面の簡単な説明】

【図１】本発明の読取装置の外観図である。

【図２】本発明の読取対象の原稿を示す図である。

【図３】本発明の読取装置の読み取り画像を示す図であ
る。

【図４】本発明読み取り装置の構成図である。

【図５】本発明の実施例１の読取りスイッチを押したと
きの割込処理フローチャート１である。

【図６】本発明の実施例１の読取りスイッチを押したと
きの割込処理フローチャート２である。

【図７】本発明の実施例１の右方向スイッチを押したと
きの割込処理フローチャートである。

【図８】本発明の実施例１の左方向スイッチを押したと
きの割込処理フローチャートである。

【図９】本発明の実施例１の検索スイッチを押したとき
の割込処理フローチャートである。

【図１０】本発明の実施例１の原稿を示す図である。

【図１１】本発明の実施例１の読み取り画像を示す図で
ある。

【図１２】本発明の行認識のカウント式を示す図であ
る。

【図１３】本発明の行認識の変数Ｈの添字と要素のグラ
フを示す図である。

【図１４】本発明の実施例１の文字矩形領域認識のカウ
ント式を示す図である。

【図１５】本発明の実施例１の入力時の表示例を示す図
である。

【図１６】本発明の実施例１の検索後の表示例を示す図
である。

【図１７】請求項７を実施するための実施例１に対する
追加フローチャートである。

【図１８】請求項３を実施するための実施例１に対する
追加フローチャートである。

【図１９】本発明の実施例２の読取りスイッチを押した
ときの割込処理フローチャート１である。

【図２０】本発明の実施例２の読取りスイッチを押した
ときの割込処理フローチャート２である。

【図２１】本発明の実施例２の右方向スイッチを押した
ときの割込処理フローチャートである。

【図２２】本発明の実施例２の左方向スイッチを押した
ときの割込処理フローチャートである。

【図２３】本発明の実施例２の検索スイッチを押したと
きの割込処理フローチャートである。

【図２４】本発明の実施例２の原稿を示す図である。

【図２５】本発明の実施例２の読み取り画像を示す図で
ある。

【図２６】本発明の実施例２の文字列矩形領域認識のカ
ウント式を示す図である。

【図２７】本発明の実施例２の入力時の表示例を示す図
である。

【図２８】本発明の実施例２の検索後の表示例を示す図
である。

【図２９】請求項８を実施するための実施例２に対する
追加フローチャートである。

【図３０】実施例３を実施するためのフローチャートで
ある。

【符号の説明】

１読み取り装置本体２読み取り部３表示部４読み取りスイッチ５方向スイッチ・検索スイッチ６ガイド板７読み取り窓８読み取り部副走査移動方向９ＣＰＵ１０ＲＯＭ１１ＲＡＭ１２ラインセンサ１３画像処理回路１４エンコーダ１５ＤＭＡコントローラ１５１６入力装置１７表示メモリ１８表示装置１９認識開始位置（実施例１）２０認識開始位置（実施例２）

───────────────────────────────────────────────────── フロントページの続き (72)発明者 ▲廣▼ 英幸大阪府大阪市阿倍野区長池町22番22号シャープ株式会社内 (56)参考文献特開平５−233695（ＪＰ，Ａ) 特開平５−35911（ＪＰ，Ａ) 特開平３−271976（ＪＰ，Ａ) 特開平９−81671（ＪＰ，Ａ) 特開昭63−273166（ＪＰ，Ａ) 特開昭59−35279（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06K 9/00 - 9/82

Claims

(57)【特許請求の範囲】

【請求項１】原稿の読取領域を目視でき、読み取りたい
文字に位置合わせするための認識開始位置が示された読
取領域目視窓と、前記読取領域目視窓から原稿の画像データを読み取る読
取部とを備え、原稿上を走査して文字を認識する文字認識装置であっ
て、前記読取部に読み取られた前記画像データを記憶する記
憶部と、前記記憶部に記憶された前記画像データに対して文字の
矩形領域を求める文字矩形領域認識部と、前記文字矩形領域認識部で求めた矩形領域に対し文字コ
ードに変換する文字認識部とを備え、前記文字認識部は、前記文字矩形領域認識部で求めた矩
形領域の位置座標を求め、前記読取領域目視窓のあらか
じめ決められた一点に最も近接した位置座標を持つ矩形
領域に対し文字コードに変換することを特徴とする文字
認識装置。
【請求項２】原稿の読取領域を目視でき、読み取りたい
文字に位置合わせするための認識開始位置が示された読
取領域目視窓と、前記読取領域目視窓から原稿の画像データを読み取る読
取部とを備え、原稿上を走査して文字を認識する文字認識装置であっ
て、前記読取部に読み取られた前記画像データを記憶する記
憶部と、前記記憶部に記憶された前記画像データに対して文字列
の矩形領域を求める文字列矩形領域認識部と、前記文字列矩形領域認識部で求めた矩形領域に対し文字
コードに変換する文字認識部とを備え、前記文字認識部は、前記文字列矩形領域認識部で求めた
矩形領域の位置座標を求め、前記読取領域目視窓のあら
かじめ決められた一点に最も近接した位置座標を持つ矩
形領域に対し文字コードに変換することを特徴とする文
字認識装置。
【請求項３】原稿の読取領域を目視でき、読み取りたい
文字に位置合わせするための認識開始位置が示された読
取領域目視窓と、前記読取領域目視窓から原稿の画像データを読み取る読
取部とを備え、原稿上を走査して文字を認識する文字認識装置であっ
て、前記読取部に読み取られた前記画像データを記憶する記
憶部と、前記記憶部に記憶された前記画像データに対して行領域
の位置を求める行領域認識部と、前記行領域認識部で求めた行領域に対し文字コードに変
換する文字認識部とを備え、前記文字認識部は、前記行領域認識部で求めた行領域の
位置座標を求め、前記読取領域目視窓のあらかじめ決め
られた一点に最も近接した位置座標を持つ行領域に対し
文字コードに変換することを特徴とする文字認識装置。
【請求項４】請求項１記載の文字認識装置において、前
記文字認識部は、あらかじめ決められた一点に最も近接
した位置座標を持つ文字矩形領域の文字に対する文字コ
ードの候補と、前記文字矩形領域の周辺の文字矩形領域
の文字に対する文字コードの候補とを求め、前記周辺の
文字矩形領域の文字に対する文字コードの候補と言語的
特性により関連付けすることによって、前記あらかじめ
決められた一点に最も近接した位置座標を持つ文字矩形
領域の文字に対する文字コードの候補から文字を確定す
ることを特徴とする文字認識装置。
【請求項５】請求項１記載の文字認識装置において、前
記文字認識部は、あらかじめ決められた一点に最も近接
した文字の位置座標を持つ文字矩形領域に対し文字コー
ドに変換した後、先に認識した文字と同じ行にあり後続
する文字矩形領域に対しても文字コードに変換を行い、
後に変換した文字コードを先に認識した文字コードに追
加して文字列を生成することを特徴とする文字認識装
置。
【請求項６】請求項２記載の文字認識装置において、前
記文字認識部は、あらかじめ決められた一点に最も近接
した文字列の位置座標を持つ文字列矩形領域に対し文字
コードに変換した後、先に認識した文字列と同じ行にあ
り後続する文字列矩形領域に対しても文字コードに変換
を行い、後に変換した文字コードを先に認識した文字コ
ードに追加して文字列を生成することを特徴とする文字
認識装置。
【請求項７】請求項１記載の文字認識装置において、表
示装置及びスイッチ等の入力装置を備え、文字認識した
文字を表示装置にて表示後、入力装置により方向を指示
することにより、既に表示してある文字又は文字列が位
置する文字矩形領域に対し指示された方向に隣接する文
字の文字矩形領域に対して文字認識部にて文字コードに
変換した文字コードを、既に表示している文字又は文字
列に追加して表示を行うことを特徴とする文字認識装
置。
【請求項８】請求項２記載の文字認識装置において、表
示装置及びスイッチ等の入力装置を備え、文字認識した
文字列を表示装置にて表示後、入力装置により方向を指
示することにより、既に表示してある文字列が位置する
文字列矩形領域に対し指示された方向に隣接する文字列
の文字列矩形領域に対して文字認識部にて文字コードに
変換した文字コードを、既に表示している文字列に追加
して表示を行うことを特徴とする文字認識装置。
【請求項９】請求項１記載の文字認識装置において、文
字矩形領域認識部又は文字列矩形領域認識部又は行領域
認識部は求めた文字矩形領域又は文字列矩形領域又は行
領域が、画像データの端に接している時は、文字又は文
字列が画面の端にあり文字が欠けている判断し、文字矩
形領域又は文字列矩形領域又は行領域から除外すること
を特徴とする文字認識装置。
【請求項１０】請求項１記載の文字認識装置において、
文字矩形領域認識部又は文字列矩形領域認識部は、矩形
部位の認識を行う際、最初に行の矩形範囲の認識を行
い、その行の矩形範囲より、あらかじめ決められた一点
に近接する行に対して文字矩形認識又は文字列矩形認識
を行うことを特徴とする文字認識装置。
【請求項１１】請求項１０記載の文字認識装置におい
て、求めた行の矩形範囲が、画像データの端に接してい
る時は、文字又は文字列が画面の端にあり文字が欠けて
いる判断し、行の矩形範囲から除外することを特徴とす
る文字認識装置。
【請求項１２】請求項１１記載の文字認識装置におい
て、あらかじめ決められた一点を画像データの左上又は
左下又は右上又は右下の一点とし、文字又は文字列の位
置座標も文字矩形領域又は文字列矩形領域の左上又は左
下又は右上又は右下とすることを特徴とする文字認識装
置。
【請求項１３】請求項１２記載の文字認識装置におい
て、アプリケーションの機能を備え、文字画像より文字
認識を行い文字コードに変換した文字又は文字列をアプ
リケーションの入力文字として用いることを特徴とする
文字認識装置。
【請求項１４】請求項１２記載の文字認識装置におい
て、電子辞書の機能を備え、文字画像より文字認識を行
い文字コードに変換した文字又は文字列を辞書の検索文
字として用いることを特徴とする文字認識装置。
【請求項１５】請求項１３記載の文字認識装置におい
て、アプリケーション又は辞書機能が入力文字として欧
文を必要としている時は、画像データに対し文字列矩形
領域認識部で求めた矩形領域より文字列の位置座標を求
め、あらかじめ決められた一点に最も近接した文字列の
位置座標を持つ文字列矩形領域に対し文字認識部にて文
字コードに変換することによる文字入力を行い、アプリ
ケーション又は辞書機能が入力文字として和文又は漢文
を必要としている時は、画像データに対し文字矩形領域
認識部で求めた矩形領域より文字の位置座標を求め、あ
らかじめ決められた一点に最も近接した文字の位置座標
を持つ文字矩形領域に対し文字認識部にて文字コードに
変換することによる文字入力を行うことを特徴とする文
字認識装置。
【請求項１６】原稿の読取領域を目視でき、読み取りた
い文字に位置合わせするための認識開始位置が示された
読取領域目視窓で認識開始位置をあわせて原稿を走査
し、走査で得た画像データを記憶し、記憶した画像デー
タに対して文字の矩形領域を求め、求めた矩形領域より
文字の位置座標を求め、あらかじめ決められた一点に最
も近接した文字の位置座標を持つ矩形領域に対して文字
コードに変換することを特徴とする文字認識方法。