JPH09114919A - 文字認識装置及び方法及び記憶媒体 - Google Patents

文字認識装置及び方法及び記憶媒体

Info

Publication number
JPH09114919A
JPH09114919A JP7268795A JP26879595A JPH09114919A JP H09114919 A JPH09114919 A JP H09114919A JP 7268795 A JP7268795 A JP 7268795A JP 26879595 A JP26879595 A JP 26879595A JP H09114919 A JPH09114919 A JP H09114919A
Authority
JP
Japan
Prior art keywords
character
recognition
area
order
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7268795A
Other languages
English (en)
Inventor
Shigeo Fukuoka
茂雄 福岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP7268795A priority Critical patent/JPH09114919A/ja
Publication of JPH09114919A publication Critical patent/JPH09114919A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 認識順序の判定ミスによる認識結果の文章の
継りの修正を効率良く行なうことを可能にする。 【解決手段】 認識対象の画像を画像メモリ7に格納し
た後、領域判別部12、組方向判別部11でもって判別
した結果に基づいて文字領域の認識順序を認識順序判別
部10が判別する。この結果に従って文字認識部9が文
字認識する。認識対象の画像及びその中に含まれる文字
領域とその認識順序を示す情報、更には、認識して得ら
れた文字を表示装置14に表示する。ここでマウス1等
により文字領域の認識順次を修正する指示があった場合
には、その指示された順序に従って認識結果の文字列の
順番も変更して表示装置14に表示出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は文字認識装置及び方
法及び記憶媒体に関するものである。
【0002】
【従来の技術】一般に、この種の装置では、以下のよう
な手順を踏んで文字認識処理を行う。 (1)画像メモリに書き込まれた画像データを領域分割
手段により文字領域と非文字領域、非文字領域内文字領
域に分割する。 (2)文字領域、非文字領域内文字領域を組方向判別手
段により、組方向を判別する。
【0003】また、文字領域、非文字領域内文字領域を
認識順序判別手段により、認識順序を決定する。 (3)オペレーターは、領域分割、組方向判別、認識順
序判別の結果を確認し、間違いがあれば修正する。 (4)文字領域、非文字領域内文字領域を文字認識手段
により文字認識を行なう。 (5)文字認識結果をオペレーターが確認、修正をす
る。
【0004】
【発明が解決しようとする課題】一般の文字認識処理で
上記工程(3)の修正作業を行なわないと、装置の処理
に文字領域の認識順序を任せることになるので、認識結
果の文章の継りがおかしくなることがある。
【0005】この場合、認識結果の修正手段にカット&
ペーストの機能を持たせて、オペレーターが表示手段に
表示された文章を見ながら、或領域の文字列を別の位置
に移動させる作業(所謂カット&ペースト)を行なって
いた。
【0006】例えば文字領域が2つ程度であればさほど
問題はないが、ある程度以上ある場合、操作者としては
認識結果の文章を読むことで継りの悪い部分を見つけ、
カット&ペースト作業を何度も行わなくてはならない。
【0007】
【課題を解決するための手段】本発明はかかる問題点に
鑑みなされたものであり、認識順序の判定ミスによる認
識結果の文章の継りの修正を効率良く行なうことを可能
にする文字認識装置及び方法及び記憶媒体を提供しよう
とするものである。
【0008】この課題を解決するため、例えば本発明の
文字認識装置は以下の構成を備える。すなわち、与えら
れた画像中の文字領域に含まれる文字を認識する文字認
識装置であって、前記画像及び当該画像中の文字領域に
対する標準の認識順序を示す情報、当該認識順序で認識
された結果である文字列を表示する表示手段と、前記文
字領域の認識順序を修正する修正手段と、該修正手段の
修正結果に応じて、各領域の認識結果の文字列の出力順
序を変更する変更手段とを備える。
【0009】ここで、本発明の好適な実施形態に従え
ば、修正手段は、所定のポインティングデバイスでもっ
て修正する領域を指定することで成されることが望まし
い。これによって、簡単な操作でもって認識結果の文章
の継りを修正することができる。
【0010】
【発明の実施の形態】以下、添付図面に従って本発明に
係る実施形態の一例を詳細に説明する。
【0011】図2に実施形態におけるシステムの構成を
示す。
【0012】図示において、1は表示画面上の所望とす
る位置を指定するポインティングデバイスの1つマウス
であり、2は各種指示或いは文字を入力するためのキー
ボードである。3は原稿画像を読み取るスキャナ、4は
ハードディスク装置等の磁気記録装置、5はネットワー
ク6と本システムとを接続するためのLANインタフェ
ースである。符号3〜5(6)は、文字認識対象の画像
発生源を示しており、これらを介して入力された画像デ
ータは画像メモリ7に格納される。8は本システムの動
作処理中にワークエリアとして使用するワークメモリで
ある。
【0013】9は実際に文字認識処理を行う文字認識部
であり、内部には文字認識処理に使用する辞書が含まれ
る。10は認識順序判別部、11は組方向判別部である
(詳細は後述する)。12は文字領域か非文字領域かを
判別する領域判別部であり、13はマウス1やキーボー
ド2からの指示に基づいて認識結果を修正する認識結果
修正部である。そして、14は各種情報を表示する表示
装置である。
【0014】上記構成における実施形態の動作処理手順
を図3のフローチャートに従って説明する。
【0015】先ず、ステップS11において、スキャナ
3〜LANインタフェース6を介して認識対象の画像を
画像メモリ7に入力する。次に、ステップS12におい
て、画像メモリ7に書き込まれた画像データを領域分割
部12により文字領域、非文字領域、非文字領域内文字
領域に分割する。そして、ステップS13で組方向判別
部11により組方向を判別する。
【0016】尚、文字領域・非文字領域の識別及び組方
向の識別処理であるが、実施形態では公知のものを採用
するものとする。すなわち、かかる機能を有するもので
あれば如何なるものを採用しても良い。
【0017】さて、ステップS14に処理が進むと、領
域判別の結果と組方向判別の結果を用い、文字認識順序
判別部10により、文字領域と非文字領域内文字領域の
文字認識順序を決定する。
【0018】ここで、領域分割の結果から文字領域と非
文字領域内文字領域を合わせてn個あったとする。認識
順序判別部10により1からnまでの番号が文字領域、
非文字領域内文字領域に付けられる。番号が小さいほど
認識順序が前であることを意味する。
【0019】そして、ステップS16では、番号の小さ
い文字領域から順番に文字認識部9により文字認識を行
なう。この後、ステップS17で、文字認識結果を文字
認識結果修正部により修正する。
【0020】文字認識修正手部では、表示装置14に画
像データと文字認識結果を表示したのちに、マウス1や
キーボード2を用いて処理する。
【0021】また、領域分割結果から文字領域、非文字
領域、非文字領域内文字領域を画像データ上に矩形とし
て重ねて表示する。このとき、各領域は色分けするか矩
形の線を実線、点線などで区別するなどして各領域の区
別をしやすくする。
【0022】文字領域と非文字領域内文字領域には組方
向と認識順序が付いているため、これらの情報も領域の
矩形内に矢印や番号で表示する。
【0023】実施形態における動作処理手順は以上であ
る。以下、本実施形態の特徴部分であるステップS17
を説明する。
【0024】このステップS17では、認識順序の判定
ミスにより認識結果の文章の継りがおかしくなっている
部分を修正する。
【0025】図4は認識対象の画像データ(もしくは原
稿)を示しており、図5はこの画像を領域分割、組方向
判別、認識順序判別を行なった結果を示している。この
結果を使って文字認識を行なった結果は図6に示す通り
であるが、意図した認識結果は図7に示す通りであった
とする。すなわち、図5においては、文字1、文字3、
文字2の領域の順に従って認識すべきところ、文字1、
文字2、文字3の順に認識されてしまった場合である。
【0026】図1のフローチャートに従って、実施形態
における認識結果の修正処理を説明する。尚、この時点
では、文字認識処理自身は終了していることは先に説明
した通りである。
【0027】まず、ステップS1で、表示装置14に図
8のように認識対象の画像データと文字認識結果を表示
し、画像部分に装置が自動的に決定した領域分割結果、
認識順序判別結果などを重ねて表示する。
【0028】認識結果の並びがおかしくなっている、す
なわち、2番と3番の領域の認識順序が違っていること
は、この表示画面をみればわかるので、この順番を画面
上で修正する。
【0029】認識結果の判定ミスをしている部分の矩形
内に表示されている番号にマウス1などのポインティン
グデバイスのカーソルを合わせてボタンをクリックして
番号の入力モードに移行する(ステップS2、S3、S
5)。この状態でキーボード2から新しい番号を入力す
る。
【0030】そして番号の入力モードを終了し、番号が
変わったことにより影響を受けるその他の文字領域や非
文字領域内文字領域の認識順序を番号が重ならないよう
に変更する(ステップS7)。
【0031】この作業により、認識結果は図7のように
修正され、表示装置には図9のように表示される(ステ
ップS8)。
【0032】最初の文字認識処理が完了した段階では、
図10に示す符号20で示すように、各文字領域に対す
る認識結果の格納先(ポインタ)は破線で示されるよう
に関連付けられていた。そして、上記処理を行うこと
で、このポインタテーブル20の内容であるアドレスを
符号21で示すように変更する。この変更処理後、修正
されたテーブル21に従って認識結果の文字コードに基
づくパターンを画面に表示しなおすことで、図9のよう
な結果を得る。但し、これ以外にも様々な処理の仕方が
考えられるので、これによって本発明が限定されるもの
ではない。
【0033】尚、図示していないが、修正作業を終了さ
せるボタンにカーソルを移動して、マウス1のボタンを
クリックすると、本処理を終了する。
【0034】以上説明したように本実施形態に従えば、
本来文字認識結果の修正手段のカット&ペースト機能を
用いて修正していた作業と比較し、認識順序を指定する
作業がそのまま認識結果の文字の並びに反映させること
ができ、操作者に与える負担は激減する。
【0035】尚、実施形態では、文字領域の順番を修正
するとき、領域をマウス等のポインティングデバイスで
もって指定し、その指定された領域の番号をキーボード
から入力するものとしたが、これによって本発明が限定
されるものではない。
【0036】例えば、2つの文字領域をポインティング
デバイスで指定し、その2つ文字領域の指定が検出され
た時点で、その2つの順番を入れ替える。かかる操作に
よれば、2つの入力装置を操作することなく、順番を修
正することも可能になる。
【0037】また、上記実施形態における図2は、本シ
ステムを構成の概念図であったが、具体的な装置或いは
システムの構成の一例を図11に示す。
【0038】図中、31は装置或いはシステム全体の制
御を司るCPU、32はブートプログラム等を記憶して
いるROM、33はCPUのワーク領域及び先に説明し
た図1及び図3のフローチャートに対応するプログラム
を展開するRAMである。34は認識対象の画像データ
を展開する画像メモリ、35はキーボード及びマウスで
ある。36はイメージスキャナやLANインタフェース
等の認識対象の画像データを入力する画像入力部であ
り、37は本装置のOS(オペレーティングシステム)
や先に説明したフローチャートに対応するプログラムを
格納しているハードディスク装置等の外部記憶装置、3
8は表示画面に対応し、表示イメージを展開するVRA
Mであり、39はVRAM38に展開されたイメージを
表示する表示装置である。尚、外部記憶装置37は、先
に説明したように画像入力部としても機能する。また、
この外部記憶装置37には、文字認識にかかる辞書ファ
イル等も格納されていることになる。
【0039】本装置に電源が投入されると、先ず、RO
M32のブートプログラムに従って外部記憶装置38か
らOS部分がRAM33にロードされ、しかる後、操作
者の指定により文字認識処理に係るプログラムをRAM
33にロードし、処理を開始する。
【0040】従って、図2における各処理部は、上記構
成の場合には、全てCPU31が行うことになる。
【0041】尚、本発明は、複数の機器(例えばホスト
コンピュータ、インターフェース機器、リーダ、プリン
タ等)から構成されるシステムに適用しても、1つの機
器からなる装置(例えば複写機、ファクシミリ等)に適
用しても良い。
【0042】また、本発明の目的は、上述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
憶した記憶媒体を、システム或いは装置に供給し、その
システム或いは装置のコンピュータ(またはCPUやM
PU)が記憶媒体に格納されたプログラムコードを読出
して実行することによっても、達成されることは言うま
でのもない。
【0043】この場合、記憶媒体から読み出されたプロ
グラムコード自体が本発明の新規な機能を実現すること
になり、そのプログラムコードを記憶した記憶媒体は本
発明を構成することになる。
【0044】プログラムコードを供給するための記憶媒
体としては、例えばフロッピーディスク、ハードディス
ク、光ディスク、光磁気ディスク、CD−ROM、CD
−R、磁気テープ、不揮発性のメモリカード、ROM等
を用いることができる。
【0045】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼動しているOSなどが実
際の処理の一部または全部を行ない、その処理によって
実施形態の機能が実現される場合も含まれることは言う
までもない。
【0046】更に、記憶媒体から読み出されたプログラ
ムコードが、コンピュータに挿入された拡張機能ボード
やコンピュータに接続された機能拡張ユニットに備わる
メモリに書き込まれた後、そのプログラムコードの指示
に基づき、その機能拡張ボードや機能拡張ユニットに備
わるCPUなどが実際の処理の一部または全部を行な
い、その処理によって前述した実施形態の機能が実現さ
れる場合も含まれることは言うまでもない。
【0047】本発明を上記記憶媒体に適用する場合、そ
の記憶媒体には、先に説明したフローチャートに対応す
るプログラムコードを格納することになるが、簡単に説
明すると、図12のメモリマップ例に示す各モジュール
を記憶媒体に格納することになる。すなわち、少なくと
も、認識対象の画像及び当該画像中の文字領域に対する
標準の認識順序を示す情報、当該認識順序で認識された
結果である文字列を表示させる表示モジュールと、文字
領域の認識順序を修正する修正モジュール、そして、こ
の修正結果に応じて、各領域の認識結果の文字列の出力
順序を変更する変更モジュールを記憶媒体に格納すれば
良い。
【0048】
【発明の効果】以上説明したように本発明によれば、認
識順序の判定ミスによる認識結果の文章の継りの修正を
効率良く行なうことが可能になり、操作者に与える負担
を軽減させることも可能になる。
【0049】
【図面の簡単な説明】
【図1】実施形態における修正処理の内容を示すフロー
チャートである。
【図2】実施形態におけるシステムの構成概念図であ
る。
【図3】実施形態における文字認識手順を示すフローチ
ャートである。
【図4】文字認識を行なう画像の一例を示す図である。
【図5】図4の原稿画像を標準の処理でもって領域分
割、組方向判別、認識順序判別した結果を示す図であ
る。
【図6】図5の結果から文字認識を行なった結果の文字
列を示す図である。
【図7】修正後の認識結果の文字列を示す図である。
【図8】修正前の表示装置に表示される画面の一例を示
す図である。
【図9】修正後の表示装置に表示される画面の一例を示
す図である。
【図10】実施形態における修正処理による処理内容を
示す図である。
【図11】装置の具体的構成を示すブロック図である。
【図12】実施形態における記憶媒体の格納モジュール
を示す図である。
【符号の説明】
1 マウス 2 キーボード 3 スキャナ 4 磁気記録装置 5 LANインタフェース 6 LAN 7 画像メモリ 8 ワークメモリ 9 文字認識部 10 認識順序判別部 11 組方向判別部 12 領域判別部 13 認識結果修正部 14 表示装置

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 与えられた画像中の文字領域に含まれる
    文字を認識する文字認識装置であって、 前記画像及び当該画像中の文字領域に対する標準の認識
    順序を示す情報、当該認識順序で認識された結果である
    文字列を表示する表示手段と、 前記文字領域の認識順序を修正する修正手段と、 該修正手段の修正結果に応じて、各領域の認識結果の文
    字列の出力順序を変更する変更手段とを備えることを特
    徴とする文字認識装置。
  2. 【請求項2】 前記修正手段は、所定のポインティング
    デバイスでもって修正する領域を指定することで成され
    ることを特徴とする請求項第1項に記載の文字認識装
    置。
  3. 【請求項3】 与えられた画像中の文字領域に含まれる
    文字を認識する文字認識方法であって、 前記画像及び当該画像中の文字領域に対する標準の認識
    順序を示す情報、当該認識順序で認識された結果である
    文字列を表示する表示工程と、 前記文字領域の認識順序を修正する修正工程と、 該修正工程の修正結果に応じて、各領域の認識結果の文
    字列の出力順序を変更する変更工程とを備えることを特
    徴とする文字認識方法。
  4. 【請求項4】 前記修正工程は、所定のポインティング
    デバイスでもって修正する領域を指定することで成され
    ることを特徴とする請求項第3項に記載の文字認識方
    法。
  5. 【請求項5】 情報処理装置がメモリに読み込み実行す
    ることで、与えられた画像中の文字領域に含まれる文字
    を認識させる記憶媒体であって、 前記画像及び当該画像中の文字領域に対する標準の認識
    順序を示す情報、当該認識順序で認識された結果である
    文字列を表示させる表示工程の手順コードと、 前記文字領域の認識順序を修正する修正工程の手順コー
    ドと、 該修正工程の修正結果に応じて、各領域の認識結果の文
    字列の出力順序を変更する変更工程の手順コードとを備
    えることを特徴とする記憶媒体。
  6. 【請求項6】 前記修正工程は、所定のポインティング
    デバイスでもって修正する領域を指定することで成され
    ることを特徴とする請求項第5項に記載の記憶媒体。
JP7268795A 1995-10-17 1995-10-17 文字認識装置及び方法及び記憶媒体 Withdrawn JPH09114919A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7268795A JPH09114919A (ja) 1995-10-17 1995-10-17 文字認識装置及び方法及び記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7268795A JPH09114919A (ja) 1995-10-17 1995-10-17 文字認識装置及び方法及び記憶媒体

Publications (1)

Publication Number Publication Date
JPH09114919A true JPH09114919A (ja) 1997-05-02

Family

ID=17463380

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7268795A Withdrawn JPH09114919A (ja) 1995-10-17 1995-10-17 文字認識装置及び方法及び記憶媒体

Country Status (1)

Country Link
JP (1) JPH09114919A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008171356A (ja) * 2007-01-15 2008-07-24 Ricoh Co Ltd 画像処理装置、画像形成装置、画像処理方法、画像処理プログラムおよび記録媒体
JP2019040251A (ja) * 2017-08-22 2019-03-14 キヤノン株式会社 スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008171356A (ja) * 2007-01-15 2008-07-24 Ricoh Co Ltd 画像処理装置、画像形成装置、画像処理方法、画像処理プログラムおよび記録媒体
JP2019040251A (ja) * 2017-08-22 2019-03-14 キヤノン株式会社 スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム

Similar Documents

Publication Publication Date Title
JP2003308480A (ja) オンライン手書き文字パターン認識編集装置及び方法並びに当該方法を実現するコンピュータ実行可能なプログラム
JP2835178B2 (ja) 文書読取装置
US5233672A (en) Character reader and recognizer with a specialized editing function
JPH09114919A (ja) 文字認識装置及び方法及び記憶媒体
JPH07175629A (ja) 文字コード変換装置
KR100351087B1 (ko) 문자 인식 오류 수정 방법 및 장치, 및 문자 인식 오류수정 프로그램을 기록한 컴퓨터에 의해 판독가능한 기록매체
JPH0696288A (ja) 文字認識装置及び機械翻訳装置
JPH0991371A (ja) 文字表示装置
JP4263089B2 (ja) 情報処理装置、情報処理方法、プログラム及び記録媒体
JPS61131082A (ja) Ocrのリジエクト文字表示方式
JPH11224306A (ja) 文字認識装置及びその方法
JP2001266067A (ja) 文字認識装置および方法ならびに文字認識プログラムを記録したコンピュータで読取可能な記録媒体
JPH1069494A (ja) 画像検索方法とその装置
JPH09218922A (ja) 文字認識装置及びその方法
JPH1011530A (ja) 画像入出力方法及び装置
JPH09218741A (ja) 情報処理装置及びその制御方法
JPH1040248A (ja) 文書処理装置及び文書管理方法
JPH04302070A (ja) 文字認識装置及び方法
JPH06325202A (ja) 文字列修正装置
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JPH11203400A (ja) 文字入力装置および文字入力方法,並びに文字入力方法をコンピュータに実行させるプログラムを記録した機械読み取り可能な記録媒体
JPH09146947A (ja) 文字領域の順序付け方法及び装置
JPH05341983A (ja) 情報処理システム
JPH05313878A (ja) プログラムのコーディング支援方式
JPH09288718A (ja) 文字処理装置及びその方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20030107