JPH03214379A

JPH03214379A - 文字認識装置

Info

Publication number: JPH03214379A
Application number: JP2009988A
Authority: JP
Inventors: Takayuki Fujikawa; 藤川　孝之; Keiko Abe; 阿部　惠子; Susumu Takasaki; 高崎　進; Katsumasa Sakai; 酒井　勝正; Hiromichi Aoki; 青木　宏導
Original assignee: Sony Corp; Toppan Printing Co Ltd
Current assignee: Sony Corp; Toppan Inc
Priority date: 1990-01-19
Filing date: 1990-01-19
Publication date: 1991-09-19

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は、例えば印刷文書の文字を認識して文字コート
に変換する場合に使用して好適な文字認識装置に関する
。

〔発明の概要〕

本発明は、例えば印刷文書の文字を認識して文字コード
に変換する場合に使用して好適な文字認識装置に関し、
原文書のイメージに対応する原文字信号から１個の文字
に対応する切出し文字信号を順次切出す文字切出し部と
、その切出し文字信号に対応する文字を識別する文字識
別部と、その識別した文字及びこの文字の文字情報を記
憶する記憶部と、その識別した文字をその原文書に対応
させて表示する表示部と、同一文字検索指示手段とを有
し、文字認識後にその表示部に表示されている文字の中
で修正対象となる文字が指定された後にその同一文字検
索指示手段が操作されたときに、その修正対象に設定さ
れた文字と同一で他の位置に存在する文字及びこの文字
の文字情報を表示することにより、同一の修正対象文字
が多数存在する場合の修正効率を改善するようにしたも
のである。

〔従来の技術〕

例えば活版印刷において作業者が活字を拾う工程を自動
化するためには、タイプ印刷等で作成された原稿の各文
字を認識して文字コードに変換する文字認識装置が必要
である。

第６図は特開昭６２−７４１８１号公報で開示されてい
る従来の文字認識装置を示し、この第６図において、（
１）は原稿読取部であり、この原稿読取部（１）から原
稿の１ページ分の濃淡に対応する原文字信号Ｓ１が文字
列切出し部（２）に供給される。この原文字信号Ｓｌは
原稿を所定の密度でドット分解し、黒いドットをハイレ
ベル“１”、白いドットをローレヘル“０゛で表わした
ものであるが、各ドットの濃度を複数ビットの２進数で
表わす場合もある。

文字列切出し部（２）は第１段前処理部（３）、第２段
前処理部（４）及び第３段前処理部（５）より構成され
、原文字信号Ｓ１には第１段前処理部（３）において雑
音の除去及び原稿の回転補正がなされ、第２段前処理部
（４）において文字領域ＡＲ（第７図参照）がその他の
領域（写真、図面等の領域）から区分されてその文字領
域ＡＲに含まれるイメージデータだけが抽出され、第３
段前処理部（５）においてその抽出された文字領域ＡＲ
に含まれる文字列ＡＲＩ，ＡＲ２，・・・・に対応する
文字列信号Ｓ４が抽出される。

この文字列信号Ｓ４の抽出を行なうには、第７図で示す
如く、文字領域ＡＲの各ドットの位置を水平方向にとっ
たＸ軸と垂直方向にとったＹ軸とよりなる（Ｘ，Ｙ）座
標で表わし、各ドットの“１”又は“′０”の値をＹ軸
上に投影して和をとることによりＹ投影信号Ｓｙを生成
する。そして、このＹ投影信号Ｓｙを所定の閾値レベル
で２値化すると、この２値化した信号の内のハイレベル
“１”の区間が夫々文字列ＡＲＬＡＲ２，・・・・に対
応する如くなり、文字列信号Ｓ４は後続の文字切出し部
（６）に供給される。

文字切出し部（６）においては、例えば第８図Ａに示す
ｉ番目の文字列Ａ　Ｒ　ｉの文字列信号Ｓ４をＸ軸上に
投影してＸ投影信号Ｓ，ｘを生成し、このＸ投影信号Ｓ
ｘを最小レベル（値が１）の閾値Ｔｌ−１１で２値化す
ることにより粗切出し信号Ｄ　Ｔｌ（第８図Ｃ）を得て
、このＸ投影信号Ｓｘを中程度のレベルの閾値ＴＨ２（
第８図Ｄ）で２値化することにより細切出し信号Ｄ　Ｔ
２（第８図Ｅ）を得る。同様に粗切出し信号ＤＴＩがハ
イレベル″１′の区間だけで個々にＹ投影信号Ｓｙを生
成することにより、Ｙ方向の切出し信号を生成すること
ができる。

そして、最終的に第８図Ａに示す如く、例えば文字「て
」についてはこの文字に外接する外接枠（９）の内部で
ハイレベル“１′となると共に、分離文字である「い」
については分離されている各部に外接する外接枠（１１
）　，　（１２）の内部でハイレベル“′１“となる切
出し信号が得られ、入力される文字列信号Ｓ４からその
切出し信号がハイレヘル“１″となる部分だけを順次切
出した信号が基本矩形切出し文字信号Ｓ７となる。

尚、第８図Ｅの細切出し信号ＤＴ２は各文字のより微細
な構造を調べる場合に使用される。また、第８図Ａの分
離文字である「い」については外接枠（１１）　，　（
１２）が２個あるため、後に文字識別の段階で統合を行
なう必要がある。

（７）は文字識別部を示し、この文字識別部（７）は基
本矩形切出し文字信号Ｓ７を各外接枠毎に取込んで文字
認識を行なう。具体的には、先ず位置による分類を行な
い、第８図Ａの文字例ＡＲｉに対して上半分の範囲に存
在する文字（ｒ’，，ｒ”」，ｒ　，など）及び下半分
に存在する文字（「。」，ｒ，，，ｒ，，など）を第１
特徴文字としてパターンマッチングを行って、対応する
文字コード（ＪＩＳコードなど）を付与する。これで識
別ができない場合には、外接枠の幅をＷ、高さをｈとし
て、縦横比ｈ　／　ｗ及び相対的大きさによる分類を行
なう。即ち、縦横比ｈ　／　ｗがＯ＜ｈ／ｗ＜０．５の
範囲に入るか、１．５＜ｈ／ｗの範囲に入るかによって
分類を行なう。更に、平均的な大きさの外接枠の幅をＷ
Ｒ、高さをｈＲとして、縦相対比ｈ／ｈＲ及び横相対比
Ｗ　／　Ｗ　，Ｉの値が夫々０〈ｈ／ｈ，Ｉ＜ｏ．ｓ及
びＯ　＜　ｗ　／　ＷＲ＜０．５の範囲に入るか否かに
よって分類を行ない。７上述の範囲に入る文字を第２特
徴文字としてパターンマソチングを行なう。

また、第１及び第２特徴文字に分類されない文字に対し
ては個別に記憶されているドットパターンとのパターン
マッチングを行ない、所定の合致度が得られた場合には
その文字コードを付与する。

それでも認識できない文字が残った場合には、その外接
枠を更に複数の微少外接枠に分離する再切出し及び後に
続く外接枠と合体させる統合の動作が実効される。尚、
最終的に認識できない文字が残った場合には、その文字
には認識できない文字であることを示すリジェクトコー
ドが付与される。

その文字識別部（７）で生成された原稿の１ページ分の
文字コードは文字の位置や大きさを示す情報と共に所定
の記憶装置に記憶される。更に、認識結果が正しいかど
うかをオペレータが判定できる様に、その文字コードに
対応する文字のビデオ信号が陰極線管等の表示部（８）
に供給され、この表示部（８）の表示画面には原稿に対
応した形式で認識結果としての一群の文字が表示される
。この場合、認識できなかった文字の部分には高輝度の
矩形のブランクが表示される。従って、修正対象文字や
認識できない文字が存在する場合には、オペレータはワ
ードプロセソサと同じ要領でその部分に所望の文字を打
込むことができる。

上述のように、原稿の濃淡に対応する原文字信号Ｓ１を
生成し、この信号Ｓ１を１個の文字に外接する外接枠で
切出して切出し文字信号Ｓ７を生成し、この切出し文字
信号Ｓ７に対応する文字を特定するという文字認識のア
ルゴリズム自体は基本的には確立しているということが
できる。

〔発明が解決しようとする課題〕

しかしながら、その文字認識のアルゴリズムを用いた文
字認識装置を実際にオフィスに設定してオペレータが使
用した結果、操作性において種々の不都合があることが
判明した。

その不都合の１つは、文字認識後にこの認識結果の修正
作業を行なう場合の効率が悪かったことである。即ち、
従来は認識績果として表示部（８）に表示されている文
面の中に同一の修正対象文字が多数存在する場合であっ
ても、オペレータが個別にその修正対象文字をカーソル
で指定して修正作業を行なう必要があり修正効率が悪か
った。

更に、一般に文字認識結果の誤りを修正する場合には、
その誤りに対応する原稿の文字の確認等の作業が必要に
なり修正効率は極めて悪かった。

本発明は斯かる点に鑑み、文字認識後に同一の修正対象
文字が多数存在する場合に、修正効率を改善することを
目的とする。

〔課題を解決するための手段〕

本発明による文字認識装置は、原文書（１４）のイメー
ジに対応する原文字信号Ｓ１から１個゛の文字に対応す
る切出し文字信号Ｓ７を順次切出す文字切出し部（２４
．２５）と、その切出し文字信号Ｓ７に対応する文字を
識別する文字識別部（１９）と、その識別した文字及び
この文字の文字情報（他の候補文字、原文書でのイメー
ジなど）を記憶する記憶部（２５）と、その識別した文
字をその原文書（１４）に対応させて表示する表示部（
２０）と、同一文字検索指示手段（３７．３８）とを有
し、文字認識後にその表示部（２０）に表示されている
文字の中で修正対象となる文字が指定された後にその同
一文字検索指示手段（３７．３８）が操作されたときに
、その修正対象に設定された文字と同一で他の位置（４
５．４６）に存在する文字及びこの文字の文字情報を表
示するようにしたものである。

〔作用］斯かる本発明によれば、その表示部（２０）に表示され
た文面の中に同一の修正対象文字が多数存在する場合に
はその文字を修正対象に設定した後に同一文字検索指示
手段（３７．３８）を操作することにより、その修正対
象文字と同一で他の位置（４５．４６）に存在する文字
が表示されるのでオペレータが個別にその表示部（２０
）に表示された文面の中をサーチする必要がない。また
、その同一の文字の表示と共にこの文字の文字情報も表
示されるため、この文字に対応する原稿（１４）の部分
を参照することなく効率的にこの文字の修正を行なうこ
とができる。

更に、その修正対象文字に設定された文字が認識できな
い文字であるとしてリジェクトコードを付された文字（
表示部（２０）では例えばブランク表示されている）で
あるような場合には、同時に表示される文字情報によっ
て修正効率を大幅に向上することができる。

［実施例］以下、本発明による文字認識装置の一実施例につき第１
図〜第５図を参照して説明しよう。

第１図は本例の文字認識装置のシステム構成を示し、こ
の第１図において、（１３）はドキュメントフィダーと
イメージリーダとよりなるスキャナー（ｌ４）はこのス
キャナーにセントされた原稿であり、スキャナー（１３
）は原稿（１４）の１ページ全体を例えば４００　Ｘ　
４００ｄｐｉ　（ドット／インチ）の読取り密度でドノ
ト分解し、各ドットの濃淡に対応した原文字信号Ｓｌを
生成する。

（１５）はイメージデータ入出力ボード、（１６）はホ
ストコンピュータ、（２１）はプリンターを示し、イメ
ージデータ入出力ボード（１５）は原文字信号Ｓ１の所
定部分をホストコンピュータ（１６）に供給すると共に
、ホストコンピュータ（ｌ６）から出力される印字用の
信号をプリンター（１６）に供給する。（１７）はホス
トコンピュータ（１６）を操作するためのキーボード、
（１８）はホストコンピュータ（１６）に各種座標を入
力するための座標入力ユニット、（１９）はキャラクタ
識別ボードを示し、ホストコンピュータ（１６）が原文
字信号Ｓ１から１個の文字の外接枠の内部でハイレベル
“′ｌ”となる切出し信号を用いて切出した基本矩形切
出し文字信号Ｓ７を順次そのキャラクタ識別ボード（１
９）に供給すると、キャラクタ識別ボード（１９）はそ
の切出し文字信号Ｓ７に対応する文字の文字コードＣ（
その文字の認識ができない場合にはりジェクトコード）
をホストコンピュータ（１６）に供給する。

（２０）は陰掻線管よりなる表示装置を示し、この表示
装置（２０）の表示画面の所定領域には原稿（１４）の
１ページ分の文字を認識した結果を原稿（１４）に対応
した形式で表示する如くなす。また、この表示装置（２
０）の表示画面には必要に応じて原稿（１４）の１ペー
ジ分又は所定部分のドットパターンそのものをも表示で
きる如くなす。

第２図は第１図例のプリンター（２１）に関する処理部
分を除くより詳細な構成を示し、この第２図のイメージ
データ入出力ボード（１５）において、（２２）は原稿
（１４）の１ページ分以上のドットパターンを記憶でき
るメモリを有するイメージデータ入力部、（２３）は同
じく原稿（１４）の１ページ分以上のドントパターンを
記憶できるパックアップメモリであり、スキャナー（１
３）より出力された原稿（１４）の１ページ分の原文字
信号Ｓ１をイメージデータ入力部（２２）に記憶する。

また、このイメージデータ入力部（２２）に記憶されて
いる原文字信号Ｓ１の所望の部分を随時ハソクア，プメ
モリ（２３）に移送すると共に、その所望の部分は文字
がない白紙状体に対応する（例えばゼロレヘル“０”゜
の）原文字信号で置換する如くなし、この所望の部分が
置換えられた原文字信号Ｓ１を原文字信号Ｓ２と称し、
この原文字信号Ｓ２の所定部分を原文字信号Ｓ３と称す
る。

ホストコンピュータ（１６）において、（２４）は中央
処理ユニット（以下ｒＣＰＵ，と称す）　、（２５）は
メインメモリ、（２６）は表示装置（２０）用のビデオ
信号用ＲＡＭ　（以下ｒＶＲＡＭｊと称す）　、（２７
）は文字コードを入力してこの文字コードに対応する所
定の字体のドットパターン即ちフォントを出力するキャ
ラクタＲＯＭよりなるフォントテーブルを示し、オペレ
ータがキーボード（１７）及び座標入力ユニット（１８
）を介してＣ　Ｐ　Ｕ　（２４）に各種コマンド、デー
タ及び座標データを供給すると、ＣＰＵ（２４）はこれ
に対応して本例の文字認識装置の全体の動作を制御する
。

また、原文字信号Ｓ２及びＳ３を夫々随時メインメモリ
（２５）及びＶ　Ｒ　Ａ　Ｍ　（２６）に供給する。こ
の場合、Ｃ　Ｐ　Ｕ　（２４）及びメインメモリ（２５
）が第６図例の文字列切出し部（２）及び文字切出し部
（６）に対応し、メインメモリ（２５）から跣出された
１文字の外接粋の内部に対応する基本矩形切出し文字信
号Ｓ７を順次キャラクタ識別ボード（１９）に供給し、
キャラクタ識別ボード（１９）より送信されて来る文字
コードＣをメインメモリ（２５）を介してフォントテー
ブル（２７）のアドレスハスに供給し、このフォントテ
ーブル（２７）のデータパスに現われるフォントデータ
をＶＲＡＭ（２６）の所定領域に書込む如くなす。また
、本例のホストコンピュータ（１６）、キーボード（１
７）、座標入力ユニノト（１８）及び表示装置（２０）
よりなるシステムはワードプロセノサとしての機能をも
具えている。

キャラクタ識別ボード（ｌ９）において、（２８）は文
字の認識部、（３０）は各種字体のフォントデータを文
字コード（本例ではＪＩＳコード）に対応させて記憶し
ている認識辞書部を示し、認識部（２８）及び認識辞書
部（３０）が基本的に第６図の文字識別部（７）に対応
する。本例の認識辞書部（３０）は大分類文字用の大分
類辞書部と細分類文字用の細分類辞書部とに分かれ、大
分類辞書部には前述した如く位置によって分類された第
１特徴文字並びに外接枠の相対的大きさ（縦横比ｈ／ｗ
）、縦相対比ｈ／ｈ．及び横相対比ｗ／ｗ，ｌの値によ
って分類された第２特徴文字の例えば縦２４ドット×横
２４ドットに正規化されたフォントデータが夫々格納さ
れている。尚、一般に文字の大まかな特徴は文字の外接
枠の各辺の近傍のドットパターンによっても表わされる
ため、各文字の外接枠の四辺の近傍のドットパターンを
四辺データ（又は周辺データ）として数値化して、この
四辺データが所定の範囲に収まった文字（大分類文字）
のフォントデータを大分類辞書部に格納する如くなして
もよい。

一方、細分類辞書部には大分類辞書部に含まれない他の
全ての文字（細分類文字）の正規化されたフォントデー
タが文字コードに対応して格納されている。

（２９）は辞書作成部を示し、この辞書作成部（２９）
はオペレータによって辞書作成モードが設定された場合
には、供給されて来る１文字分の基本矩形切出し文字信
号によって表わされるフォントデータが大分類文字に対
応するか細分類文字に対応するかを判別し、大分類文字
に対応するときはそのフォントデータを正規化して認識
辞書部（３ｏ）の大分類辞書部の所定の文字コードの領
域に書込み、細分類文字に対応するときにはそのフォン
トデータを正規化して認識辞書部（３０）の細分類辞書
部の所定の文字コードの領域に書込む如くなす。これに
よって、ユーザ側で簡便に種々の字体に対応できる認識
辞書部（３０）を作成することができる。

キャラクタ識別ボード（ｌ９）の認識部（２８）はオペ
レータによって文字認識モードが設定された場合、供給
されて来る基本矩形切出し文字信号Ｓ７が大分類文字に
対応するときには認識辞書部（３０）の大分類文字部の
フォントデータを順次第１の先入れ先出し（ＦＩＦＯ）
レジスタに書込み、細分類文字に対応するときには細分
類文字部のフォントデータを順次第２のＦＩＦＯレジス
タに書込む。また、この動作と平行して認識部（２８）
はその基本矩形切出し文字信号Ｓ７に対応するドノトパ
ターンを正規化して順次第３のＦＩＦＯレジスタに書込
む。そして、認識部（２８）は第３のＦＩＦＯレジスタ
中の認識対象となる文字のドットパターンと第１のＦＩ
ＦＯレジスタ中の一連のフォントデータ及び第２のＦＩ
ＦＯレジスタ中の一連のフォントデータとを順次比較す
ることにより、その認識対象となる文字のドットパター
ンに最も近いフォントデータに対応する文字コードを優
先順位の高い順に１０個生成し、この文字コードをホス
トコンピュータ（１６）のメインメモリの所定領域に書
込む如くなす。

その優先順位を決定するには、例えば２４　Ｘ　２４ド
ットの個々のドットについて認識対象となる文字のドッ
トパターンと認識辞書部（３０）より読出したフォント
データとを比較して、両者の値が異なっているドットの
総和を評価値となし、この評価値が小さい順に優先順位
を高く設定する。またこの最も優先順位の高い文字コー
ドの評価値が所定値以下の場合には、文字認識が行なわ
れたものとみなしてその最も優先順位の高い文字コート
を認識対象となる文字の文字コードＣとしてメインメモ
リ（２５）の原稿（１４）に対応し℃定められた領域に
書込む。同時に認識部（２８）はその文字コードＣと共
にその文字の大きさを示すデータ及びその文字の平均的
な外接枠の中での位置を示すデータをメインメモリ（２
５）に書込む如くなす。一方、最も優先順位の高い文字
コードの評価値が所定値を超える場合には、認識部（２
８）は文字認識ができなかったものとみなして！リジエ
クトコードをそのメインメモリ（２５）の原稿（ｌ４）
に対応して定められた領域に書込む如くなす。また、文
字認識の結果があいまいな文字については、文字コード
Ｃと共に所定のコードをそのメインメモリ（２５）の所
定領域に書込む。上述の文字認識の動作はパイプライン
方式で高速に実行される。

第３図は本例の表示装置（２０）の表示画面（２０＾）
を示し、この表示画面（２０Ａ）には、原稿（１４）の
１ページ分の文字を参照した認識結果を表示する認識結
果表示領域（３１）及び修正対象となる文字の文字情報
等を表示する文字情報表示領域（３２）を設ける。（３
３）は修正対象となる文字を指示するためのカーソルを
示し、このカーソル（３３）はキーボート（１７）又は
座標入カユニソ｝　（１８）によって認識結果の任意の
文字の上に移動することができる。

第３図例ではカーソル（３３）が文字「子」の上に在る
ので、表示画面（２０Ａ）の文字情報表示領域（３２）
の中の領域（３５）及び（３６）に夫々「対象文字」の
語及び「子」の文字が表示される。（３９）は機能釦領
域を示し、この領域（３９）には「候補Ｊ　（３９Ａ）
、「コード」及び「かな漢字」等の文字が表示されてお
り、これらの機能釦は座標入力ユニット（１８）によっ
て選択することができる。例えば候補（３９Ａ）が選択
されると、文字情報表示領域（３２）の一部に修正対象
となる文字に最も近いと認識された１０個の文字（候補
文字）のパターンが候補文字群（４３）として優先順位
の高い順に表示され、「コード」が選択されるとその修
正対象文字を文字コードで直接指定できるようになり、
「かな漢字」が選択されるとその修正対象文字をかな／
漢字変換で入力できるようになる。また゛、候補文字群
（４３）において、０〜９の数値ＮＡは優先順位、数値
ＮＢはその候補文字と修正対象文主の元のイメージとの
異なるドットの数の総和（評価値）　、（４４）はその
候補文字のパターンを示し、（４２）はその修正対象文
字の２４　Ｘ　２４ドットに正規化されたドットパター
ン（切出し文字イメージ）を示す。

また、（４１）は再認識釦、（４０）はバックスペース
釦を示し、再認識釦（４１）を座標人カユニッ｝　（１
８）で選択することにより、文字を学習した後に再認識
を実行できるようになる。

本例ではその文字情報表示領域（３２）の中に面積がＷ
ｘＷの周辺イメージ表示領域（３４）を設け、この周辺
イメージ表示領域（３４）には修正対象となる文字に対
応する原稿（１４）上の文字「子」を中心として幅１７
０ドット×高さ　１７０ドントの領域のドットパターン
をそのまま表示する。具体的には第２図において、Ｃ　
Ｐ　Ｕ　（２４）はイメージデータ入力部（２２）に記
憶されている１ページ分の原文字信号Ｓ２（本例では原
文字信号Ｓ１そのもの）の内で補正対象となる文字を中
心として１７０　Ｘ　１７０　｝”　ントの領域の原文
字信号Ｓ３を読出して、この原文字信号Ｓ３を拡大（補
間）又は縮小（間引き）してＶ　Ｒ　Ａ　Ｍ　（２６）
の所定領域に書込む如くなす。従って、第３図の表示画
面（２０Ａ）中の周辺イメージ表示領域（３４）には修
正対象となる文字「子」に対応する原稿（１４）上の文
字「子Ｊ及びこの文字の周辺の例えば８個の文字のイメ
ージがドットパターンとしてそのまま表示される。

このように修正対象の文字及びその周辺の文字のイメー
ジが表示されると、オペレータは原稿（１４）を参照す
ることな《修正対象となる文字を前後の文字等に合わせ
て修正することができるので、修正の効率が改善される
利益がある。

また、文字情報表示領域（３２）において、（３７）は
修正対象を示すカーソル（３３）をその次の同一コード
を有する文字にジャンプさせるための釦（ｎｅｘｔ釦）
　、（３８）はそのカーソル（３３）をその手前の同一
コードを有する文字にジャンプさせるための釦（ｐｒｅ
ｖ釦）を示し、文字認識後の修正作業中に第３図に示す
如く、修正対象文字として文字「子」を指定した後に座
標入力ユニット（１８）によってｎｅｘ　ｔ釦（３７）
を選択すると、力２−ソル（３３）は位置（４５）にあ
る文字「子」の上に移動する。一方、第３図の状態でｐ
ｒｅｖ釦（３８）を選択すると、カーソル（３３）は位
置（４６）にある文字「子」の上に移動する。

本例の文字認識装置において原稿（１４）の認識を行な
った後に、その認識結果の修正を行なう場合の動作につ
き説明するに、その認識結果には同一の修正対象文字が
多数存在するものとする。この場合その同一の修正対象
文字の検索は第４図に示す手順に従って行なわれる。

先ず、オペレータが座標入力ユニット（１８）を操作し
て第３図に示す如くカーソル（３３）を修正対象文字「
子」の上に移動すると（第４図のステップ（１０１））
、Ｃ　Ｐ　Ｕ　（２４）は修正対象文字として文字コー
ドが文字「子」と同一の文字をセソトする（ステップ（
１０２）　）。この場合、第３図の文字情報表示領域（
３２）には原稿（１４）上での周辺イメージのドットパ
ターン（領域（３４））、文字「子」の正規化された切
出し文字イメージ（４２）及び１０個の候補文字（子，
干．千，予．辛・・・・）よりなる候補文字群（４３）
が表示される。この文字情報を用いてオペレ一夕はその
文字「子」を所望の文字に修正する（ステップ（１０３
））。本例では原稿（１４）上での周辺イメージのみな
らず１０個の候補文字が表示されているので、スキャナ
ー（１３）にセットされている原稿（１４）を取出して
確認する作業を行なうことなく、極めて効率的に修正作
業を実施できる利益がある。

続いて同一文字の検索を続行するか否かを判断し（ステ
ソブ（１０４））、検索を終了するときにはステップ（
１１０）に移行して他の作業（認識結果の最終ファイル
化など）を行ない、検索を続行するときにはステップ（
１０５）又は（１０８）へ移行する。

ステップ（１０５）へ移行してオペレータがｎｅｘｔ釦
（３７）を選択した場合には、Ｃ　Ｐ　Ｕ　（２４）は
第３図のカーソル（３３）が存在する位置より後の位置
に文字「子」と同じ文字コードを有する文字が存在する
かどうか検索を行なう（ステップ（１０６））。本例で
はＣ　Ｐ　Ｕ　（２４）は位置（４５）に在る文字「子
」の上にカーソル（３３）を移動して、文字情報表示領
域（３２）にはその位置（４５）に対応する原稿（１４
）上の文字の文字情報を表示する（ステノ２プ（１０７
））。この場合、認識結果は文字「子」であっても、領
域（３４）に表示される周辺イメージのドットパターン
及び候補文字群（４３）の内容は第３図の状態と必ずし
も一致しないことがあるため、オペレータはステップ（
１０３）に移行してその文字情報に対応した修正を行な
う。

また、ステップ（１０４）から（１０８）へ移行してオ
ペレータがｐｒｅｖ釦（３８）を選択した場合には、Ｃ
ＰＵ　（２４）は第３図のカーソル（３３）が存在する
位置より前の位置に文字「子」と同じ文字コードを有す
る文字が存在するかどうか検索を行なう（ステップ（１
０９））。本例ではＣ　Ｐ　Ｕ　（２４）は位置（４６
）に在る文字「子」の上にカーソル（３３）を移行して
文字情報表示領域（３２）にはその位置（４６）に対応
す，る原稿（１４）上の文字の文字情報を表示して（ス
テップ（１０７））、ステソブ（１０３）に戻る。この
ようにｎｅｘｔ釦（３７）又はｐｒｅｖ釦（３８）を操
作してステップ（１０３）〜ステップ（１０７）の動作
を繰返すことにより、認識結果表示領域（３１）に表示
されている文面中の文字「子」を全て迅速に修正するこ
とができる。

上述のように本例によればｎｅｘｔ釦（３７）及びｐｒ
ｅｖ釦（３８）が設けられており、認識結果の内の予め
修正対象に指定された文字と同一の文字コードを有し他
の位置に存在する文字の上に瞬時に修正対象を示すカー
ソル（３３）を移動させることができるので、オペレー
タがその認識結果の内容をサーチする必要がなく同一の
修正対象文字が多数存在する場合の修正効率を大幅に改
善できる利益がある。

また、オペレータがサーチする場合には見落しの可能性
があるが、本例ではＣ　Ｐ　ＴＪ　（２４）が検索する
ので修正対象文字を全て確実に指定することができる。

次に、第２図例の文字認識装置の認識結果の修正動作の
他の例につき説明するに、本例では修正対象となる文字
は認識されずにリジエクトコードを付された文字及びリ
ジェクトコードを付されるまでは行かなかったが認識結
果があいまいであると判断された文字であるとする。こ
の場合第５図に示す如く、表示画面（２０Ａ）の認識結
果表示領域（３ｌ）においてはりジエクトコ，一ドを付
された文字の部分は高輝度のブランク（４７Ａ）　，　
（４７Ｂ）　，・・・・で表示され、あいまいであると
判断された文字（４８Ａ），（４８Ｂ）　，・・・・は
白黒が反転したパターンで表示される。そして、リジェ
クトコードを付された文字については対応する原稿（１
４）上での文字に拘わらず同一の文字であるとして扱い
、あいまいであると判定された文字についてもそれらが
互いに異なる文字コードを有しても同一の文字であると
して扱う如くなす。

即ち、第５図に示す如く、修正対象を示すカーソル（３
３）をブランク（４７Ｃ）の上に設定した後にｎｅｘ　
ｔ釦（３７）　（又はｐｒｅｖ釦（３Ｂ））を選択する
と、カーソノ喧３３）はブランク（４７Ｄ）　（又はブ
ランク（４７Ｂ））の上に移動し、文字情報表示領域（
３２）にはそのブランク（４７Ｄ）　（又はブランク（
４７Ｂ））に対応する原稿（１４）上の文字の文字情報
が表示されるので、オペレータはそれらリジエクトコー
ドを付された文字を効率的に修正することができる。同
様に、修正対象文字を示すカーソル（３３）を例えば文
字（４８Ｂ）の上に設定した後にｎｅｘｔ釦（３７）を
選択するとカーソル（３３）は文字（４８Ｃ）の上に移
動し、文字情報表示領域（３２）にはその文字（４８Ｃ
）に対応する文字情報が表示されるので、オペレータは
それラアイマいであると判定された文字を効率的に修正
することができる。

尚、上述実施例では修正対象となる文字について全て文
字情報を表示するようにしていたが、文字認識の結果を
ファイル化して後日修正作業を実行するような場合に、
全ての文字の文字情報をファイル化しておくのは記憶装
置の記憶容量を大きくすることが必要となり得策ではな
い。そこで、このように認識結果をファイル化して保存
する場合には、リジェクトコードを付された文字及びあ
いまいであると判定された文字についてのみ周辺イメー
ジのドットパターン、正規化された切出し文字イメージ
及び１０個の候補文字を同時にファイル化しておいても
よい。更に周辺イメージについては省略してもよい。従
って、後日修正作業を行なう場合に、通常の正確に認識
された文字を修正対象に指定しても文字情報鵜表示され
ないが、正確に認識された文字については文字情報が存
在しなくとも一般に修正作業には支障はない。

このように本発明は上述実施例に限定されず、本発明の
要旨を逸脱しない範囲で種々の構成を採り得ることは勿
論である。

（発明の効果〕本発明によれば、認識結果の中に同一の修正対象文字が
多数存在する場合に、修正効率を改善できる利益がある
。

【図面の簡単な説明】

第１図は本発明の一実施例の文字認識装置のシステム構
成を示す一部斜視図を含む正面図、第２図は第１図例の
要部のより詳細な構成を示す一部斜視図を含む構成図、
第３図は一実施例の表示画面（２ＯＡ）の構成例を示す
正面図、第４図は一実施例の動作を示すフローチャート
図、第５図は一実施例の表示画面（２０Ａ）の他の例を
示す線図、第６図は従来の文字認識装置の全体構成を示
すブロノク図、第７図及び第８図は夫々従来の文字列及
び原矩形の切出し動作の説明に供する線図である。（１３）はスキャナー、（１４）は原稿、（１５）はイ
メージデータ入出力ボート、（１６）はホストコンピュ
ータ、（１９）はキャラクタ識別ボート、（２０）は表
示装置、（２４）は中央処理ユニット、（２５）はメイ
ンメモリ、（２８）は認識部、（２９）は認識辞書部、
（３７）はｎｅｘ　ｔ釦、（３８）はｐｒｅｖ釦である
。代理人松隈秀盛一実施イダ１１の動４乍第４図表示ｊａ面の４芒のイ列第５図

Claims

【特許請求の範囲】

原文書のイメージに対応する原文字信号から１個の文字
に対応する切出し文字信号を順次切出す文字切出し部と
、上記切出し文字信号に対応する文字を識別する文字識
別部と、上記識別した文字及び該文字の文字情報を記憶
する記憶部と、上記識別した文字を上記原文書に対応さ
せて表示する表示部と、同一文字検索指示手段とを有し
、文字認識後に上記表示部に表示されている文字の内で
修正対象となる文字が指示された後に上記同一文字検索
指示手段が操作されたときに、上記修正対象に指定され
た文字と同一で他の位置に存在する文字及び該文字の文
字情報を表示するようにしたことを特徴とする文字認識
装置。