JPH03214378A

JPH03214378A - 文字認識装置

Info

Publication number: JPH03214378A
Application number: JP2009986A
Authority: JP
Inventors: Keiko Abe; 阿部　惠子; Takayuki Fujikawa; 藤川　孝之; Susumu Takasaki; 高崎　進; Katsumasa Sakai; 酒井　勝正; Hiromichi Aoki; 青木　宏導
Original assignee: Sony Corp; Toppan Printing Co Ltd
Current assignee: Sony Corp; Toppan Inc
Priority date: 1990-01-19
Filing date: 1990-01-19
Publication date: 1991-09-19
Also published as: KR910014842A; US5271067A

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は、例えば印刷文書の文字を認識して文字コード
に変換する場合ｊご使用して好適な文字認識装置：ご関
する。

〔発明の概要〕

本発明は、例えば印刷文書の文字を認識して文字コード
に変換する場合に使用して好適な文字認識装置に関し、
認識結果の文字のうちで修正対象となる文字が生じた場
合、その修正対象となる文字及びこの文字の周辺の原文
書のイメージを表示することにより、原文書を参照する
ことなく修正作業ができると共に、分離文字等が誤って
認識されていることを原文書のイメージによって容易に
確認できる様にしたものである。

〔従来の技術〕

例えば活版印刷において作業者が活字を拾う工程を自動
化するためには、タイプ印刷等で作成された原稿の各文
字を認識して文字コードに変換する文字認識装置が必要
である。

第６図は特開昭６２　−７４１８１　号公報で開示され
ている従来の文字認識装百を示し、この第６図において
、（１〕は原稿読取部であり、この原稿読取部（１）か
ら原稿の１ページ分の濃淡に対応する原文字信号Ｓ１が
文字列切出し部（２）に供給される。この原文字信号Ｓ
１は原稿を所定の密度でドット分解し、黒いドットをハ
イレベル“１″、白いドットを口−レベル“０”で表わ
したものであるが、各ドットの濃度を複数ビットの２進
数で表わす場合もある。

文字列切出し部（２）は第１段前処理８（３）、第２段
前処理部（４）及び第３段前処理部（５）より構成され
、原文字信号Ｓ１には第１段前処理部（３）において雑
音の除去及び原稿の回転補正がなされ、第２段前処理部
（４）において文字領域ＡＲ　（第７図参照）がその他
の領域（写真、図面等の領域）かろ区分されてその文字
領域、へＲに含まれるイメージデータだけが抽出され、
第３段前処理部（５）においてその抽出された文字領域
ＡＲに含まれる文字列ＡＰＩ，ＡＲ２，・・・・に対応
する文字列信号Ｓ４が抽出される。

この文字列信号Ｓ４の抽出を行なうには、第７図で示す
如く、文字領域ＡＲの各ドノトの位置を水平方向にとっ
たＸ軸と垂直方向にとったＹ軸とよりなる（Ｘ，Ｙ）座
標で表わし、各ドットの“１”又は“０゜の値をＹ軸上
に投影して和をとることによりＹ投影信号Ｓｙを生成す
る。そして、このＹ投影信号ｓｙを所定の闇値レベルで
２値化すると、この２値化した信号の内のハイレベル“
１”の区間が夫々文字列Ａ　Ｒｌ．　Ａ　Ｒ２，・・・
・に対応する如くなり、文字列信号Ｓ４は後続の文字切
出し部（６）に供給される。

文字切出し部（６）においては、例えば第８図Ａに示す
１番目の文字列ＡＲｉ　の文字列信号Ｓ４をＸ軸上に投
影してＸ投影信号Ｓｘ　を生成し、このＸ投影信号ＳＸ
を最小レベル（値が１）の闇値ＴＨＩで２値化すること
により粗切出し信号Ｄ　Ｔｌ（第８図Ｃ）を得て、この
Ｘ投影信号Ｓｘ　を中程度のレベルの閾値ＴＨ２（第８
図Ｄ）で２値化することにより細切出し信号ＤＴ２（第
８図Ｅ）を得る。同様に粗切出し信号ＤＴＩ　がハイレ
ベル゛′１”の区間だけで個々にＹ投影信号Ｓｙ　を生
成することにより、Ｙ方向の切出し信号を生成すること
ができる。

そして、最終的に第８図７へ：こ示す如く、例えば文字
「て」についてはこの文字に外接する外接枠（９）の内
部でハイレベル“１″となると共に、分離文字である「
い」については分離されている各部に外接する外接枠（
１１），　（１２）　　の内部でハイレベル“１″とな
る切出し信号が得られ、入力される文字列信号Ｓ４から
その切出し信号がハイレベル“１″となる部分だけを順
次切出した信号が基本矩形切出し文字信号Ｓ７となる。

尚、第８図Ｅの細切出し信号ＤＴ２　は各文字のより微
細な構造を調べる場合に使用される。また、第８図Ａの
分離文字である「い」については外接枠（１１），　（
１２）　　が２個あるため、後に文字識別の段階で統合
を行なう必要がある。

（７）は文字識別部を示し、この文字識別部（７）は基
本矩形切出し文字信号Ｓ７を各外接枠毎に取込んで文字
認識を行なう。具体的には、先ず位置による分類を行な
い、第８図Ａの文字例ＡＲｉ　　に対して上半分の範囲
に存在する文字（「″」，７”二，一゛」など）及び下
半分に存在する文字（・１。二ｒ．　　，，　ｒ，　　
，など）を第１特徴文字としてパタ一ンマッチングを行
って、対応する文字コード（ＪＩＳコードなど）を付与
する。これで識別ができない場合には、外接枠の幅をＷ
１高さをｈとして、縦横比ｈ　／　ｗ及び相対的大きさ
による分類を行なう。即ち、縦横比ｈ／ｗがＱ＜ｈ／ｗ
＜０．５の範囲に入るか、１．５＜ｈ／ｗの範囲に入る
かによって分類を行なう。更に、平均的な大きさの外接
枠の幅をｗＲ　．高さをｈ１　として、縦相対比ｈ／ｂ
ｉｔ及び横相対比ｗ　／　ｗヨの値が夫々０〈ｈ／ｈＲ
＜０．５及び（］＜ｗ／ｗａ＜０．５の範囲に入るか否
かによって分類を行ない。上述の範囲に入る文字を第２
特徴文字としてパターンマッチングを行なう。

また、第１及び第２特徴文字に分類されない文字に対し
ては個別に記憶されているドットパターンとのパターン
マンチングを行ない、所定の合致度が得ちれた場合に｛
よその文字コードを付与する。

それでも認識できない文字が残った場合には、その外接
枠を更に複数の微少外接粋に分離する再切出し及び後に
続く外接枠と合７体させる統合の動作が実効される。尚
、最終的に認識できない文字が残った場合には、その文
字には認識できない文字であることを示すリジェクトコ
ードが付与される。

その文字識別部（７）で生成された原稿の１ページ分の
文字コードは文字の位置や大きさを示す情報と共に所定
の記憶装置に記憶される。更に、認識結果が正しいかど
うかをオペレータが判定できる様に、その文字コードに
対応する文字のビデオ信号が陰極線管等の表示部（８）
に供給され、この表示邪（８）の表示画面には原稿に対
応した形式で認識結果としての一群の文字が表示される
。この場合、認識できなかった文字の部分には高輝度の
矩形のブランクが表示される。従って、修正対象文字や
認識できなし）文字が存在する場合には、オペレータは
ワードプロセンサと同じ要領でその部分に所望の文字を
打込むことができる。

上このように、原稿の濃淡に対応する原文字信号Ｓ１を
生成し、この信号Ｓ１を１個の文字に外接する外接枠て
切出して切出し文字信号Ｓ７を生成し、この切出し文字
信号Ｓ７に対応する文字を特定するという文字認識のア
ルゴリズム自体は基本的には確立しているということが
できる。

〔発明が解決しようとする課題〕

しかしながら、その文字認識のアルゴリズムを用いた文
字認識装置を実際にオフィスに設定してオペレータが使
用した結果、操作性において種々の不都合があることが
判明した。

その不都合の１つは、認識結果の文字の修正に手間がか
かることである。即ち、従来の文字認識装置では認識で
きない文字はブランク表示となるが、その文字がどのよ
うな文字であるかは実際に原稿を見て確認しないと判ら
ないため、予め原稿のコピーを取るか、原稿読取部（１
）にセットしてある原稿を取出すか何れかの作業が必要
となり作業に手間がかかる不都合がある。

これに閲して、修正対象となる文字（認識できない文字
を含む〉に対応する原稿のド７｝パターンを表示するこ
とも考えられるが、修正対象となる文字のド，ｌ−パタ
ーンを裏示しただけでは、分離文字を誤って切出して認
識しているような場合にその分離文字の一部のドットパ
ターンのみから原稿に印書されている分離文字の全体の
形を予測することはできない不都合がある。

更に、文字認識装置が原稿にある語「購読」を誤って「
講読」と認識して表示したような場合、オペレータには
原稿にある語が「購読」なのか「講話」なのか判然とし
ないことがある。このとき、表示されている文字「講」
に対応する原稿の文字「Ｗｋ　＝のドットパターンだけ
を表示してもオペレータには依然として原稿にある語が
実際に「購読」なのか確証が持てないことがある。

本発明は斯る点に鑑み、文字認識装置において文字の修
正を行なう場合に、オペレータが原文書を参照すること
なく修正作業ができると共に分離文字であっても正確に
修正ができるようにすることを目的とする。

：課題を解決するための手段二本発明による文字認２装置は、原文書（１４）の濃淡に
対応する原文字信号Ｓ１を生成する原稿読取部（１３）
と、その原文字信号Ｓ１から１個の文字に対応する切出
し文字信号Ｓ７を順次切出す文字切出し部（２２．　２
３）と、その切出し文字信号Ｓ７に対応する文字を識別
する文字識別部（１９）と、その識別した文字をその原
文書（１４）に対応させて表示する表示部（２０）とを
有し、その表示された文字のうちで修正対象となる文字
（例えば第４図のカーソル（３２）の内部）が生じた場
合、その原文字信号Ｓ１を用いてその修正対象となる文
字及びこの文字の周辺のイメージをその表示部（２０）
に（例えば第４図の周辺イメージ表示領域（３３）に）
表示するようにしたものである。

〔作用〕

斯かる本発明によれば、修正対象となる文字に対応する
原文書（１４）の文字及びこの文字の周辺のイメージが
例えばドットパターンのままでその表示部（２０）に表
示される。従って、オペレータは原文書（ｌ４）を参照
することなく２文字の修正作業を行なうことができる。

更に、分離文字を誤って切出して認識しているような場
合には、分離文字の一部だけでなく全体に対応する原文
書（ｌ４）の部分が例えばドットパターンのままでその
表示部（２０）に表示されるので、分離文字であっても
正確に修正をすることができる。

Ｃ実施例〕以下、本発明による文字認識装置の一実施例につき第１
図〜第５図を参照して説明しよう。

第１図は本例の文字認識装置のシステム構成を示し、こ
の第１図において、（１３）はドキュメントフィダーと
イメージリーグとよりなるスキャナー（１４）はこのス
キャナーにセントされた原稿であり、スキャナー（１３
）は原稿（ｌ４）の１ページ全体を例えば４００　Ｘ４
００ｄｐ＋　（ドノト／インチ）の読取り密度でド７｝
分解し、各ドットの濃淡に対応した原文字信号Ｓ１を生
成する。

（１５）はイメージデータ入出力ボード、（１６）はホ
ストコンピュータ、（２１）はプリンターを示し、イメ
ージデータ入出力ボード（１５）は原文字信号Ｓ１の所
定部分をホストコンビニータ（１６）に供給すると共に
、ホストコンピュータ（１６）から出力される印字用の
信号をプリンター（１６）に供給する。（１７）はホス
トコンビニータ（１６）を操作するためのキーボード、
（１ｇ）はホストコンピュータ（１６）に各種座標を人
力するための座標人カユニッ｝　、（１９）はキャラク
タ識別ボードを示し、ホストコンピュータ（１６）が原
文字信号Ｓ１から１個の文字の外接枠の内部でハイレベ
ル“１”となる切出し信号を用いて切出した基本矩形切
出し文字信号Ｓ７を順次そのキャラクタ識別ボード（１
９）に供給すると、キマラクタ識別ボード（１９）はそ
の切出し文字信号Ｓ７に対応する文字の文字コードＣ（
その文字の認識ができない場合にはりジエクトコード）
をホストコンピュータ（１６）に供給する。

（２０）は陰極線管よりなる表示装置を示し、この表示
装置（２０）の表示画面の所定領域には原稿（１４）の
１ページ分の文字を認識し２た結果を原稿（１４）に対
応した形式で表示する如くなす。また、この表示装置（
２０）の表示画面には必要に応じて原稿（１４）の１ペ
ージ分又は所定部分のドットパターンそのものをも表示
できる如くなす。

第２図は第１図例のプリンター（２１）に関する処理部
分を除くより詳細な構成を示し、この第２図のイメージ
データ入出力ボード（１５）において、（２２）は原稿
（１４）の１ページ分以上のドットパターンを記憶でき
るメモリを有するイメージデータ人力部、（２３）は同
じく原稿（１４）の１ページ分以上のドットパターンを
記憶できるバックアップメモリであり、スキャナー（１
３）より出力された原稿（１４）の１ページ分の原文字
信号Ｓ１をイメージデータ入力部（２２）に記憶する。

また、このイメージデータ入力部（２２）に記憶されて
いる原文字信号Ｓ１の所望の部分を随時バックアップメ
モリ（２３）に移送すると共に、その所望の部分は文字
がなし）白紙状体に対応する（例えばゼロレベル“０”
の）原文字信号で置換する如くなし、この所望の部分が
置換えられた原文字消号Ｓ１を原文字信号Ｓ２と称し、
この原文字信号Ｓ２の所定部分を原文字信号Ｓ３と称す
る。

ホストコンピュータ（１６）において、（２４）は中央
処理ユニット（以下ｒｃＰＵＪと称す）　、（２５）は
メインメモリ、（２６）は表示装置（２０）用のビデオ
信号用ＲＡＭ　（以下ｒＶＲＡＭＪと称す）　、（２７
＞は文字コードを入力してこの文字コードに対応する所
定の字体のドットパターン即ちフォントを出力するキア
ラクタＲＯＭよりなるフォントテーブルを示し、オペレ
ータがキーボード（１７）及び座標入力ユニット（１８
）を介してＣＰＵ（２４）に各種コマンド、データ及び
座標データを供給すると、ＣＰＵ（２４）はこれに対応
して本例の文字認識装置の全体の動作を制御する。

また、原文字信号Ｓ２及びＳ３を夫々随時メインメモ！
Ｊ　（２５＞及びＶ　Ｒ　，Ａ．　Ｍ　（２６）に供給
する。この場合、Ｃ　Ｐ　Ｕ（２４）及びメインメモリ
（２５）が第６図例の文字列切出し部（２）及び文字切
出し部（６）ｊこ対応し、メインメモ’Ｊ（２５）かみ
続出された１文字の外接枠の内部に対応する基本矩形切
出し文字信号Ｓ７を順次キャラクタ識別ボード（１９）
に供給し、キャラクタ識別ボード（１９）より送信され
て来る文字コードＣをメインメモリ（２５）を介してフ
ォントテーブル（２７）のアドレスバスに供給し、この
フォントテーブル（２７）のデータパスに現われるフォ
ントデータをＶ　Ｒ　Ａ　Ｍ（２６）の所定領域に書込
む如くなす。また、本例のホストコンピュータ（１６）
　、キーボード（１７）、座標入力二二７｝（１８）及
び表示装置（２０）よりなるンステムはワードプロセノ
サとしての機能をも具えてし）る。

キャラクタ識別ボード（１９）において、（２８）は文
字の認識部、（３０）は各種字体のフォントデータを文
字コードく本例て：まＪＩＳコード）に対応させて記憶
している認識辞書部を示し、認識部（２８）及び認識辞
書部（３０）が基本的に東６図の文字識別部（７）に対
応する。本例の認識辞書部（３０）は大分順文字用の大
分類辞書部と細分類文字用の細分類辞書部とに分かれ、
大分類辞書部には前述した如《位置によって分類された
第１特徴文字並びに外接枠の相対的大きさ（縦嘆比ｈ／
ｗ）、縦相対比ｈ／ｈ１及び横相対比Ｗ　／　Ｗ　Ｒ　
の値によって分類された第２特徴文字の例えば縦２４ド
ッ｝Ｘ横２４ドットに正規化されたフォントデータが夫
々格納されている。尚、一般に文字の大まかな特徴は文
字の外接枠の各辺の近傍のドットパターンによってモ表
わされるため、各文字の外接枠の四辺の近傍のドットパ
ターンを四辺データ（又は周辺データ）として数値化し
て、この四辺データが所定の範囲に収まった文字（大分
類文字）のフォントデータを大分類辞書部に格納する如
くなしてもよい。

一方、細分類辞書部には大分類辞書部に含まれない他の
全ての文字（細分類文字）の正規化されたフォントデー
タが文字コードに対応して格納されている。

（２９）は辞書作成部を示し、この辞書作成部（２９）
はオペレータによって辞書作成モードが設定された場合
には、供給されて来る１文字分の基本矩形切出し文字信
号によって表わされるフォントデータが大分類文字に対
応するか細分類文字に対応するかを判別し、大分類文字
に対応するときはそのフォントデータを正規化して認識
辞書部（３０）の大分類辞書部の所定の文字コードの領
域に書込み、細分類文字に対応するときにはそのフォン
トデータを正規化して認識辞書部（３０）の細分類辞書
部の所定の文字コードの領域に書込む如《なす。これに
よって、ユーザ側で簡便に種々の字体に対応できる認識
辞書部（３０）を作成することができる。

キアラクタ識別ボード（１９）の認識Ｂ（２Ｂ）はオペ
レータによって文字認識モードが設定された場合、供給
されて来る基本矩形切出し文字信号Ｓ７が大分類文字に
対応するときには認識辞書部（３０）の大分類文字部の
フォントデータを順次第１の先入れ先出し（ＦＩＦＯ）
　レジスタに書込み、細分類文字に対応するときには細
分類文字部の゜フォントデータを順次第２のＦＩＦＯレ
ジスタに書込む。また、この動作と平行して認識部（２
８）はその基本矩形切出し文字信号Ｓ７に対応するドッ
トパターンを正規化して順次竿３のＦＩＦ○レジスタに
書込む。そして、認識部（２８）は第３のＦＩＦ○レジ
スタ中の認識対象となる文字のドットパターンと第１の
ＦＩＦＯレジスタ中の一連のフォントデータ及び第２の
ＦＩＦＯレジスタ中の一連のフォントデータとを順次比
較することにより、その認識対象となる文字のドットパ
ターンに最も近いフォントデータに対応する文字コード
を優先順位の高い順に１０個生成し、この文字コードを
ホストコンピュータ（１６）のメインメモリの所定領域
に書込む如くなす。

その優先順位を決定するには、例えば２４Ｘ２４ドット
の個々のドットについて認識対象となる文字のドットパ
ターンと認識辞書部（３０）より読出したフォントデー
タとを比較して、両者の値が異なっているドットの総和
を評価値となし、この評価値が小さい順に優先順位を高
く設定する。またこの最も優先順位の高い文字コードの
評価値が所定値以下の場合には、文字認識が行なわれた
ものとみなしてその最も優先順位の高い文字コードを認
識対象となる文字の文字コードＣとしてメインメモ’Ｊ
　（２５）の原稿（１４）に対応して定められた領域に
書込む。同時に認識！（２８）はとの文字コードＣと共
にその文字の大きさを示すデータ及びその文字の平均的
な外接枠の中での位置を示すデータをメインメモＵ（２
５＞に書込む如くなす。一方、最も優先順位の高い文字
コードの評価値が所定値を超える場合には、認識部（２
８）は文字認識ができなかったものとみなしてｌリジエ
クトコードをそのメインメモＩＪ（２５）の原稿（１４
）に対応して定められた領域に書込む如くなす。上述の
文字認識の動作はパイプライン方式で高速に実行される
。

第３図は本例の表示装置（２０）の表示画面（２ＯＡ）
を示し、この表示画面（２ＯＡ）　　には、原稿（１４
）の１ページ分の文字を参照した認識結果を表示する認
識結果表示領域ク３１）を設ける。本例では原稿（１４
）は第４図に示す如く縦書きであるが、認識結果は横書
きで表示している。（３２）は修正対象となる文字を指
示するためのカーソルを示し、このカーソル（３２）は
キーボード（１７）又は座標入力ユニント（１８）によ
って認識結果の任意の文字の上に移動することができる
。

第３図例ではカーソル（３２）が文字「や」の上に在る
ので、表示画面（２ＯＡ）　　の認識結果表示領域（３
１）に近接する領域（３４）及び（３５）に夫々「対象
文字」の語及び「や」の文字が表示される。（３６）は
機能釦領域を示し、この領域（３６）には「候補」、「
コード」及び「かな漢字」の文字が表示されており、こ
れらの機能釦は座標人カユニッ｝　（１８）によって選
択することができる。例えば「候補」が選択されると、
表示画面（２ＯＡ）　　の一部に修正対象となる文字に
最も近いと認識された１０個の文字のパターンが優先順
位の高い順に表示され、ニコード」が選択されるとその
修正対象文字を文字コードで直接指定できるようになり
、「かな漢字」が選択されるとその修正対象文字をかな
／漢字変換で入力できるようになる。

また、（３７）は再認識釦、（３８）　ｊま文字統合釦
を示し、これろの釦（３７），　（３８）　　を座標人
力ユニント（１８）で選択することにより、修正対象文
字の統合処理をオペレータがマニュアル操作で実行でき
るようになる。

本例ではその認識結果表示領域（３１）の近傍に面積が
ＷＸＷの周辺イメージ表示領域（３３）を設け、この周
辺イメージ表示領域（３３）には修正対象となる文字に
対応する原稿（１４）　（第４図参照）上の文字「や」
を中心として幅１７０ドット×高さ１７０　　ドットの
領域のドットパターンをそのまま表示する。

具体的には第２図において、Ｃ　Ｐ　Ｕ（２４）はイメ
ージデータ人力部（２２）に記憶されている１ページ分
の原文字信号Ｓ２（本例では原文字信号Ｓ１そのもの）
の内で補正対象となる文字を中心として１７０　Ｘ１７
０ドットの領域の原文字信号Ｓ３を読出して、この原文
字信号Ｓ３を拡大（補間）又は縮小（間引き）してＶ　
Ｒ　Ａ　Ｍ（２６）の所定領域に書込む如くなす。従っ
て、第３図の表示画面（２０＾）中の周辺イメージ表示
領域（３３）には修正対象となる文字「や」に対応する
原稿（１４）上の文字「や」及びこの文字の周辺の例え
ば８個の文字（第４図の領域（１４Ａ）　　内の文字）
のイメージがドノトパターンとしてそのまま表示される
。

このように修正対象の文字及びその周辺の文字のイメー
ジが表示されると、オペレータは原稿（１４）を参照す
ることなく修正対象となる文字を前後の文字等に合わせ
て修正することができるので、修正の効率が改善される
利益がある。また、修正対象となる文字が連なっている
ような場合（例えば「講読」を「購読」又は「講話」に
修正する場合）には、何れか１つの文字を修正対象に指
定するだけで、原稿上の対応する一連の文字のイメージ
が周辺イメージ表示領域（３３）に表示されるので、オ
ペレータは文字の修正を効率的に且つ正確に実行するこ
とができる。

第５図を参照して本例の文字認識装置の動作の他の例に
ついて説明するに、原稿（１４）のイメージが第５図Ａ
の如くであると仮定して、この原稿（１４）の領域（１
４Ｂ）　　の中心に分離文字１に二が存在するとする。

この場合、この原稿（１４）を認識した結果、その分離
文字口に」を誤って１一二」及び認識できない文字の集
合であると認識すると、第５図已に示す如く、表示装胃
（２０）の認識結果表示領域（３１）には町こ！の文字
の位置（矢印（４０）で示す位置）にリジェクトコード
：，一対応するブランクの表示（３９）及び文字「こ」
が表示される。

そして、オペレータがその認識結果が誤りであると判断
してブランクの表示（３９）の所に修正対象文字を示す
カーソルを移動すると、第５図Ｃに示す如く、周辺イメ
ージ表示領域（３３）には原稿ク１４）の領域（１４Ｂ
）　　のイメージがドットパターンとして表示される。

従って、この周辺イメージ表示領域（３３）の略中央（
４１）　！こある文字二に，によってオペレータは本例
の装置が分離文字二に」を誤って認識したことを容易に
知る二とができる。

このように本例によれば、分離文字を更に細分化して誤
って認識しているような場合にも、細分化された部分を
修正対象に指定するだけで、その周辺イメージ表示領域
（３３）にはその分離文字全体の原稿（１４）上でのイ
メージが表示されるので、分離文字であっても正確に修
正ができる利益がある。

尚、第３図！ごおいて、周辺イメージ表示領域（３３）
は伊］えば認識結果表示領域（３１）中のカーソル（３
２）の近傍に設けてもよく、また、表示装！（２０）と
は別体に設けた液晶パネル上などに表示してもよい。

このように本発明は上述実施例に限定されず、本発明の
要旨を逸脱しない範囲で種々の構成を採り得ることは勿
論である。

〔発明の効果〕

本発明によれば、オペレータが原文書を参照することな
く効率的に文字の修正作業を行なえると共に、分離文字
であっても正確に修正できる実用上の利益がある。

【図面の簡単な説明】

第１図は本発明の一実施例の文字認識装置のシステム構
成を示す一部斜視図を含む正面図、第２図は笑１図例の
要部のより詳細な構成を示す一部斜視図を含む構成図、
第３図は一実施例の表示画面（２ＯＡ）　　の構成例を
示す正面図、第４図は原稿の一例を示す線図、第５図；
ま一実施例の動作の他の例の説明に供する線図、第６図
；ま従来の文字認識装百の全体構成を示すブロック図、
第７図及び第８図は夫々従来の文字列及び原矩形の切出
し動作の説明に供する線図である。（１３）はスキャナー、（１４）は原稿、（１５）はイ
メージデータ入出力ボー｝、（１６）はホストコンピュ
ータ、（１９）はキャラクタ識別ボート、（２０）は表
示装置、（２４）は中央処理ユニット、（２５）はメイ
ンメモリ、（２８）は認識部、（２９）は認識辞書部で
ある。代理人松隈秀盛Ｗ５　　図

Claims

【特許請求の範囲】原文書の濃淡に対応する原文字信号を生成する原稿読取
部と、上記原文字信号から１個の文字に対応する切出し
文字信号を順次切出す文字切出し部と、上記切出し文字
信号に対応する文字を識別する文字識別部と、上記識別
した文字を上記原文書に対応させて表示する表示部とを
有し、上記表示された文字のうちで修正対象となる文字が生じ
た場合、上記原文字信号を用いて上記修正対象となる文
字及び該文字の周辺のイメージを上記表示部に表示する
ようにしたことを特徴とする文字認識装置。