JPH03214281A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH03214281A
JPH03214281A JP2009624A JP962490A JPH03214281A JP H03214281 A JPH03214281 A JP H03214281A JP 2009624 A JP2009624 A JP 2009624A JP 962490 A JP962490 A JP 962490A JP H03214281 A JPH03214281 A JP H03214281A
Authority
JP
Japan
Prior art keywords
character
characters
signal
corrected
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009624A
Other languages
English (en)
Inventor
Takayuki Fujikawa
藤川 孝之
Keiko Abe
阿部 惠子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2009624A priority Critical patent/JPH03214281A/ja
Publication of JPH03214281A publication Critical patent/JPH03214281A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 口産業上の利用分野〕 本発明は、例えば印刷文書の文字を認識して文字コード
に変換する場合に使用して好適な文字認識装置に関する
〔発明の概要: 本発明は、例えば印刷文書の文字を認識して文字コード
に変換する場合に使用して好適な文字認R装置に関し、
原文書のイメージに対応する原文字信号から1個の文字
分の切出し文字信号を順次生成する文字切出し部と、そ
の切出し文字信号に対応する文字を識別する文字識別部
と、その識別した文字を表示する表示部と、文字認識後
の修正作業中に修正して得られた文字を表示する修正履
歴表示部とを有し、文字認識後の修正作業中にその修正
履歴表示部に表示された文字を随時修正箇所に組込むこ
とにより、修正頻度の高い文字の修正が効率的にできる
ようにしたものである。
〔従来の技術〕
例えば活版印刷において作業者が活字を拾う工程を自動
化するためには、タイプ印刷等で作成された原稿の各文
字を認識して文字コードに変換する文字認識装置が必要
である。
第6図は特開昭62 −74181 号公報で開示され
ている従来の文字認識装置を示し、この第6図において
、(1)は原稿読取部であり、この原稿読取部(1)か
ら原稿の1ページ分の濃淡に対応する原文字信号S1が
文字列切出し部(2)に供給される。この原文字信号S
1は原稿を所定の密度でドット分解し、黒いドットをハ
イレベル“1”、白いドットをローレベル“0”で表わ
したものであるが、各ドットの濃度を複数ビットの2進
数で表わす場合もある。
文字列切出し部(2)は第1段前処理部(3)、第2段
前処理部(4つ及び第3段前処理部(5)より構成され
、原文字信号S1には第1段前処理部(3)において雑
音の除去及び原稿の回転補正がなされ、第2段前処理部
(4)において文字領域AR(第7図参照)がその他の
領域(写真、図面等の領域)から区分されてその文字領
域A Rに含まれるイメージデータだけが抽出され、第
3段前処理R(5)においてその抽出された文字領域A
 Rに含まれる文字列API,AR2,・・・・に対応
する文字列信号S4が抽出される。
この文字列信号S4の抽出を行なうには、第7図で示す
如く、文字領域ARの各ドットの位置を水平方向にとっ
たX軸と垂直方向にとったY軸とよりなる(X,Y)座
標で表わし、各ドットの“1”又は“0”の値をY軸上
に投影して和をとることによりY投影信号Syを生成す
る。そして、このY投影信号syを所定の閾値レベルで
2値化すると、この2値化した信号の内のハイレベル“
1”の区間が夫々文字列A Rl, A R2,・・・
・に対応する如くなり、文字列信号S4は後続の文字切
出し部(6)に供給される。
文字切出し部(6)においては、例えば第8図八に示す
1番目の文字列ARi の文字列信号S4をX軸上に投
影してX投影信号SX を生成し、このX投影信号Sx
を最小レベル(値が1)の閾値THIで2値化すること
により粗切出し信号D Tl(第8図C)を得て、この
X投影信号SXを中程度のレベルの闇値T H2(第8
図D)で2値化することにより細切出し信号DT2(第
8図E)を得る。同様に粗切出し信号DTI が71イ
レベル“1”の区間だけて個々にY投影信号Sy を生
成することにより、Y方向の切出し信号を生成すること
ができる。
そして、最絆的に第8図Aに示す如く、例えば文字「て
」についてはこの文字に外接する外接枠(9)の内部で
ハイレベル“1”となると共に、分離文字である「い」
については分離されている各部に外接する外接枠(11
), (12)  の内部で71イレベル“1”となる
切出し信号が得られ、入力される文字列信号S4からそ
の切出し信号がノ1イレベル“1″となる部分だけを順
次切出した信号が基本矩形切出し文字信号S7となる。
尚、第8図Eの細切出し信号DT2 は各文字のより微
細な構造を調べる場合に使用される。また、第8図Aの
分離文字である「い」については外接枠(11), (
12)  が2個あるため、後に文字識別の段階で統合
を行なう必要がある。
(7)は文字識別部を示し、この文字識別部(7〕は基
本矩形切出し文字信号S7を各外接枠毎に取込んで文字
認識を行なう。具体的には、先ず位置による分顎を行な
い、第8図八の文字例ARi  に対して上半分の範囲
に存在する文字(r’4,r”.1,゛゜」など〉及び
下半分に存在する文字(roJ,r」.r,」など)を
第1特徴文字としてパターンマッチングを行って、対応
する文字コード(J I Sコードなど)を付与する。
これで識別ができない場合には、外接枠の幅をW1高さ
をhとして、縦横比h / w及び相対的大きさによる
分類を行なう。即ち、縦横比b/wが0<h/w<0.
5の範囲に入るか、1.5<h/wの範囲に入るかによ
って分類を行なう。更に、平均的な大きさの外接枠の幅
をWR、高さをh,として、縦相対比h/ha及び横相
対比w / w ,の値が夫々0〈h/L<0.5及び
0 < w / wil<Q, 5 の範囲に入るか否
かによって分類を行ない。上述の範囲に入る文字を第2
特徴文字としてパターンマッチングを行なう。
また、第1及び第2特徴文字に分類されない文字に対し
ては個別に記憶されているドブトノ々ターンとのパター
ンマノチングを行ない、所定の合致度が得ちれた場合に
はその文字コードを付与する。
それでも認識できない文字が残った場合には、その外接
枠を更に複数の微少外接枠に分離する再切出し及び後に
続く外接枠と合体させる統合の動作が実効される。尚、
最終的に認識できない文字が残った場合には、その文字
には認識できない文字であることを示すリジエクトコー
ドが付与される。
その文字識別部(7〕で生成された原稿の1ページ分の
文字コードは文字の位置や大きさを示す情報と共に所定
の記憶装置に記憶される。更に、認識結果が正しいかど
うかをオペレータが判定できる様に、その文字コードに
対応する文字のビデオ信号が陰極線管等の表示部(8)
に供給され、この表示部(8)の表示画面には原稿に対
応した形式で認識結果としての一群の文字が表示される
。この場合、認識できなかった文字の部分には高輝度の
矩形のブランクが表示される。従って、修正対象文字や
認識できなし)文字が存在する場合には、オペレータは
フードプロセッサと同じ要領でその部分に所望の文字を
打込むことができる。
上述のように、原稿の濃淡に対応する原文字信号S1を
生成し、この信号S1を1個の文字に外接する外接枠で
切出して切出し文字信号S7を生成し、この切出し文字
信号S7に対応する文字を特定するという文字認識のア
ルゴリズム自体は基本的には確立しているということが
できる。
〔発明が解決しようとする課題〕
しかしながら、その文字認識のアルゴリズムを用いた文
字認識装置を実際にオフィスに設定してオペレータが使
用した結果、操作性において種々の不都合があることが
判明した。
その不都合の1つは、修正頻度の高い文字の修正に手間
取ることである。即ち、認識対象とする原稿によっては
特定のよく使用される文字の字体が変則字体である場合
があり、このような原稿の認識結果においてはその特定
の文字が全て誤認識となるため、これら誤認識された文
字を個々に修正するのでは修正効率が極めて悪い。
本発明は斯かる点に鑑み、修正頻度の高い文字の修正が
効率的にできるようるすることを目的とする。
〔課題を解決するための手段〕
本発明による文字認識装置は、原文書(14)のイメー
ジに対応する原文字信号S1から1個の文字分の切出し
文字信号を順次生成する文字切出し部(24. 25)
と、その切出し文字信号S7に対応する文字を識別する
文字識別部(19)と、その識別した文字を表示する表
示部<31)と、文字認識後の修正作業中に修正して得
みれた文字を表示する修正履歴表示部(39)とを有し
、文字認識後の修正作業中にそ゛の修正履歴表示部(3
9)に表示された文字(例えば「罹」)を随時修正箇所
(41B)〜(41E)  に組込むようにしたもので
ある。
口作用〕 斯かる本発明によれば、認識結果の中に同一の修正対象
文字が多数存在する場合には、その内の1つの文字をか
な漢字変換又はお首検索等によって生成した所望の文字
で置換えた後に、この修正して得られた文字を修正履歴
表示4%(39)に表示する。そして、残りの同一の修
正対象文字についてはその修正履歴表示部(39)に表
示された文字を組込むだけで迅速に修正が行なわれる。
従って、修正頻度の高い文字の修正を効率的に行なうこ
とができる。
〔実施例〕
以下、本発明による文字認識装置の一実施例につき第1
図〜第5図を参照して説明しよう。
第1図は本例の文字認識装置のシステム構成を示し、こ
の第1図において、(13)はドキュメントフィダーと
イメージリーダとよりなるスキャナー(14)はこのス
キ〒ナーにセットされた原稿であり、スキャナー(13
)は原稿(14)の1ページ全体を例えば400 x4
00dpi (ドット/インチ)の読取り密度でドット
分解し、各ドットの濃淡に対応した原文字信号S1を生
成する。
(15)はイメージデータ入出力ボード、(16)はホ
ストコンピュータ、(21)はプリンターを示し、イメ
ージデータ入出力ボード(15)は原文字信号S1の所
定部分をホストコンピュータ(16)に供給すると共に
、ホストコンピュータ(16)から出力される印字用の
信号をプリンター(16)に供給する。(l7)はホス
トコンビュータ(16)を操作するためのキーボード、
(18)はホストコンピュータ(16)に各種座標を人
力するための座標人力ユニット、(19) ハ−1−ヤ
ラクタ識別ボードを示し、ホストコンピュータ(16)
が原文字信号Slから1個の文字の外接枠の内部でハイ
レベル“1″となる切出し信号を用いて切出した基本矩
形切出し文字信号S7を順次そのキャラクタ識別ボード
ク19)に供給すると、キャラクタ識別ボード(19)
はその切出し文字信号S7に対応する文字の文字コード
C(その文字のil2識ができない場合にはりジェクト
コード)をホストコンピュータ(16)に供給する。
(20)は陰極線管よりなる表示装置を示し、この表示
装置(20)の表示画面の所定領域には原稿(14冫の
1ページ分の文字を認識した結果を原稿(14)に対応
した形式で表示する如くなす。また、この表示装ffi
 (20>の表示画面には必要に応じて原稿(14)の
1ページ分又は所定部分のドットパターンそのものをも
表示できる如くなす。
第2図は第1図例のプリンター(21)に関する処理部
分を除くより詳細な構成を示し、この第2図のイメージ
データ入出力ボード(15)において、(22)は原稿
(14)の1ページ分以上のドットパターンを記憶でき
るメモリを有するイメージデーク入力部、(23)は同
じく原稿(14)の1ページ分以上のドットパターンを
記憶できるバックアップメモリであり、スキャナー(1
3)より出力された原稿(14)の1ページ分の原文字
信号S1をイメージデータ人力部(22)に記憶する。
また、このイメージデータ人力部(22)に記憶されて
いる原文字信号S1の所望の部分を随時バックアップメ
モ’j (23)に移送すると共に、その所望の部分は
文字がない白紙状体に対応する(例えばゼロレベル“O
″の〉原文字信号で置換する如くなし、この所望の部分
が置換えろれた原文字信号S1を原文字信号S2と称し
、この原文字信号S2の所定部分を原文字信号S3と称
する。
ホストコンピュータ(16)において、(24)は中央
処理ユニット(以下rcPUJと称す’) 、(25)
はメインメモ!J、(26)は表示装置(20)用のビ
デオ信号用RAM (以下rVRAM.と称す) 、(
27>は文字コードを人力してこの文字コードに対応す
る所定の字体のドットパターン即ちフォントを出力する
キャラクタROMよりなるフォントテーブルを示し、オ
ペレータがキーボード(17)及び座標入力ユニット(
18)を介してC P U (24)に各種コマンド、
データ及び座標データを供給すると、CPU(24)は
これに対応して本例の文字認識装置の全体の動作を制御
する。
また、原文字信号S2及びS3を夫々随時メインメモ’
J (25)及びV R A M(26)に供給する。
この場合、C P U(24)及びメインメモリ(25
)が第6図例の文字列切出し部(2)及び文字切出し部
(6)に対応し、メインメモ’J(25)から読出され
た1文字の外接枠の内部に対応する基本矩形切出し文字
信号S7を順次キャラクタ識別ボード(19)に供給し
、キャラクタ識別ボード(19)より送信されて来る文
字コードCをメインメモリ(25)を介して7オントテ
−ブル(27)のアドレスバスに供給し、このフォント
テーブル(27》のデータパスに現われるフォントデー
タをV R A M(26)の所定領域に書込む如くな
す。また、本例のホストコンビュータ(16) 、キー
ボード(17)、座標人力ユニッ} (18)及び表示
装置(20)よりなるシステムはワードプロセッサとし
ての機能をも具えている。
キャラクタ識別ボード(19)において、(28)は文
字の認識部、(30)は各種字体のフォントデータを文
字コード(本例ではJISコード)に対応させて記憶し
ている認識辞書部を示し、認識部(28)及び認識辞書
部(30)が基本的に第6図の文字識別部(7)に対応
する。本例の認識辞書部(30)は大分類文字用の大分
類辞書部と細分類文字用の細分類辞書部とに分かれ、大
分類辞書部には前述した如く位置によって分類された第
1特徴文字並びに外接枠の相対的大きさ(縦横比h/w
)、縦相対比h/hR 及び慣相対比w/w,の値によ
って分類された第2特徴文字の例えば縦24ドット×横
24ドZトに正規化されたフォントデータが夫々格納さ
れている。尚、一般に文字の大まかな特徴は文字の外接
枠の各辺の近傍のドットパターンによっても表わされる
ため、各文字の外接枠の四辺の近傍のドットパターンを
四辺データ(又は周辺データ)として数値化して、この
四辺データが所定の範囲に収まった文字(大分類文字)
のフォントデータを大分類辞書部に格納する如くなして
もよい。
一方、細分類辞書部には大分類辞書部に含まれない他の
全ての文字(細分類文字)の正規化されたフォントデー
タが文字コードに対応して格納されている。
(29)は辞書作成部を示し、この辞書作成部(29)
はオペレータによって辞書作成モードが設定された場合
には、供給されて来る1文字分の基本矩形切出し文字信
号によって表わされるフォントデータが大分類文字に対
応するか細分類文字に対応するかを判別し、大分類文字
に対応するときはそのフォントデータを正規化して認識
辞書部(30)の大分類辞書部の所定の文字コードの領
域に書込み、細分順文字に対応するときにはそのフォン
トデー夕を正規化して認識辞書部(30)の細分類辞書
部の所定の文字コードの領域に書込む如くなす。これに
よって、ユーザ側で簡便に種々の字体に対応できる認識
辞書部(30)を作成することができる。
キャラクタ識別ボード(19)の認識部(28〉はオペ
レータによって文字認識モードが設定された場合、供給
されて来る基本矩形切出し文字信号S7が大分類文字に
対応するときには認識辞書部(30)の大分類文字部の
フォントデータを順次第1の先入れ先出し(FIFO)
レジスタに書込み、細分類文字に対応するときには細分
類文字部のフォントデータを順次第2のFIFOレジス
タに書込む。また、この動作と平行して認識部(28)
はその基本矩形切出し文字信号S7に対応するドットパ
ターンを正規化して順次第3のFIFOレジスタに書込
む。そして、認識部(28)は第3のFIF○レジスタ
中の認識対象となる文字のドットパターンと第1のFI
FOレジスタ中の一連のフォントデータ及び第2のFI
FOレジスタ中の一連のフォントデータとを順次比較す
ることにより、その認識対象となる文字のドットパター
ンに最も近いフォントデータに対応する文字コードを優
先順位の高い順に10個生成し、この文字コードをホス
トコンピュータ(16)のメインメモリの所定領域に書
込む如くなす。
その優先順位を決定するには、例えば24X24ドット
の個々のドットについて認識対象となる文字のドットパ
ターンと認識辞書部(30)より読出したフォントデー
タとを比較して、両者の値が異なっているドットの総和
を評価値となし、この評価値が小さい順に優先順位を高
く設定する。またこの最も優先順位の高い文字コードの
評価値が所定値以下の場合には、文字認識が行なわれた
ものとみなしてその最も優先順位の高い文字コードを認
識対象となる文字の文字コードCとしてメインメモ!J
 (25)の原稿<14)に対応して定められた領域に
書込む。同時に認識部(28)はその文字コードCと共
にその文字の大きさを示すデータ及びその文字の平均的
な外接枠の中での位置を示すデータをメイン2メモ’J
(25)に書込む如くなす。一方、最も優先順位の高い
文字コードの評価値が所定値を超える場合には、認識部
(28)は文字認識ができなかったものとみなしてリジ
エクトコードをそのメインメモ!J (25)の原稿(
14)に対応して定められた領域に書込む如くなす。上
述の文字認識の動作はパイプライン方式で高速に実行さ
れる。
第3図は本例の表示装置(20)の表示画面(2OA)
を示し、この表示画面(2OA)  には、原稿(14
)の1ページ分の文字を参照した認識結果を表示する認
識結果表示領域(3l)を設ける。本例では原稿(14
)は縦書きであるが、認識結果は横書きで表示している
。ク32)は修正対象となる文字を指示するためのカー
ソルを示し、このカーソル(32)はキーボード(17
)又は座標入力ユニット(18)によって&HRi結果
の任意の文字の上に移動する二とができる。
第3図例ではカーソル(32)が文字1羅一の上に在る
ので、表示画面(2OA>  の認識結果表示領域(3
1)に近接する領域(34)及び(35)に夫々こ対象
文字.の語及び″羅一の文字が表示される。(36)は
機能釦領域を示し、この領域(3G)には候補釦(36
A)、コード釦(36B) 等が表示されており、十字
のカーソル(43)を座標人カユニッ} (I8)を用
いて所望の釦の上に移動した後に、座標入力スイッチを
操作することによってその所望の釦を選択することがで
きる。例えば、候補釦(36A)  が選択されると修
正対象文字に最も近いと判定された10個の文字のパタ
ーンが優先順位の高い順に表示され、コード釦(36B
)  が選択されると修正対象文字をJISコードで人
力できるようになり、かな漢字釦(36C)及び部首画
数釦<36E)  は漢字の入力の際に使用され、テー
ブル釦(36D) が選択されるとJISコードと対応
する文字パターンの一覧表が表示され、外字登録釦(3
6F)  及び学習削除釦(36G)  は特殊な字体
の文字等を登録する場合に使用される。また、(37)
は再認識釦、(38)はバックスペース釦を示し、再f
l2識釦(37)は修正対象文字だけを再認識する場合
に使用される。
(39)は修正履歴表示部を示し、この修正履歴表示!
(39)には、文字認識後の修正によって得られた文字
を修正頻度の高い順に左から10個表示する如くなす。
この修正頻度は原稿の数ページ内における修正頻度又は
所定期間内における修正頻度等の何れでも任意に設定す
ることができる。この修正頻度はC P U(24)に
よって計数される。
本例ではその認識結果表示領域(31)の近傍に面積が
WxWの周辺イメージ表示領域(33)を設け、この周
辺イメージ表示領域(33)には修正対象となる文字に
対応する原稿(14)上の文字「罹」を中心として幅1
70ドット×高さ170  ドットの領域のドットパタ
ーンをそのまま表示する。具体的には第2図において、
C P U(24)はイメージデータ入力部(22)に
記憶されている1ページ分の原文字信号32(本例では
原文字信号S1そのもの)の内で修正対象上なる文字を
中心として170 X170ドットの領域の原文字信号
S3を読出して、この原文字信号S3を拡大(補間)又
は縮小(開引き)してV R A M (26>の所定
領域に書込む如くなす。従って、第3図の表示画面(2
OA)  中の周辺イメージ表示領域(33〉には修正
対象となる文字「羅」に対応する原稿(14)上の文字
「罹」及びこの文字の周辺の例えば8個の文字のイメー
ジがドットパターンとしてそのまま表示される。
このように修正対象の文字及びその周辺の文字のイメー
ジが表示されると、オペレータは原稿(14)を参照す
ることなく修正対象となる文字を前後の文字等に合わせ
て修正することができるので、修正の効率が改善される
利益がある。
本例の文字認識装置によって認識結果を修正する場合の
動作につき第4図のフローチアートを参照して説明する
に、認識結果としては第3図の認識結果表示領域(31
)に表示されている文面を用いる。
この場合、先ずオペレータは本来「罹病」であるべき所
が全て「羅病」と誤認識されることに気づいて、位if
 (41A)〜(41E)  に表示されている文字1
一羅.を全で修正対象文字とみなす。尚、リジェクトコ
ードを付すまでは行かないが認識結果があいまいである
文字については、例えば白黒を反転して表示等すること
により、修正対象文字をオペレータが容易にサーチする
ことができる。そして、オペレータが最初の位置(41
A)  の「羅」に修正対象を示すカーソル(32)を
移動させて座標入力スイッチを操作すると、表示領域(
33)及び(34)にはその修正対象文字に対応する原
稿(14)上の文字に関するイメージが表示されるので
、それらのイメージからもオペレータは正しい文字が「
罹」であることを知ることができる。次に、オペレータ
は機能釦領域(36)のかな漢字釦(36C)及び部首
画数釦(36E) 等を選択することによってその位置
(41^)に正しい文字V罹」を表示する。この文字「
罹」が修正の結果得られた文字であり、この文字「罹」
は修正履歴表示部(39)の左端の第1欄(39A) 
 にも表示される。この修正の結果得られた文字の文字
コードはメインメモIJ(25)の対応するファイルの
中及びC P U (24)の修正頻度計数用のレジス
タにも書込まれると共に、この文字の修正頻度は1に設
定される。
続いてオペレータは更に文字修正を行なうか否かを判断
し(第4図のステップ(101))、文字修正を行なう
場合にはステップ(102)  に移行して修正対象と
する文字の修正を行なう。例えば位置(41B)に在る
文字「羅」を「罹」に修正するには、力一ソル(32)
をその位置(41B)  の上に移動して座一標入カス
イッチを操作した後に、修正履歴表示部(39)中の文
字F罹」が表示されている第1欄(39^)上にカーソ
ル(43)を移動させて座標入力スイッチを操作する。
これに応じて、その第1欄(39A)  中の文字が位
置(41B)  に表示され、対応するメインメモ!J
 (25>中のファイルの中にその文字の文字コードが
記録されると共に、C P U(24)の修正頻度計数
用のレジスタにおいてその文字「罹」に対応する修正頻
度が2に増分される(ステップ(103))。
続いて、C P U (24)は修正の結果得ろれた文
字の種類が10種類以上であるか否かを調べ(ステップ
(104))、10種類以上であるときには修正頻度が
上位10位までの文字を選び、これら10個の文字を修
正履歴表示部(39)の第1欄(39A)〜第10欄(
39J)に修正頻度の高し1順に表示する(ステップ(
105))。
一方、修正の結果得られた文字の種類が10種類未満で
あるときには、C P U(24)はこれらの文字を全
て修正頻度の高い順に修正履歴表示部(39)の所定の
欄に表示するくステップ(106))。この後動作はス
テップ(101)  に戻り、オペレータは更に修正を
行なうか否かを判断し、位置(41E)  までの文字
「羅」の修正が終了した場合には、ステップ(102)
に移行して別の種類の修正対象文字の修正を行なう。
第3図例では更に、認識結果表示領域(31)の位置(
42A)  において本来「職業」となるべき部分が璽
織業」と誤認識されているため、その文字「織」の上に
カーソル(32)を移動して本来の正しい文字「職」を
表示させる如くなす。これに応じてステップ(105)
  にて終正履歴表示部(39)の第2欄(39B)に
修正後の文字である「職」が表示される。また、位置(
42B)  にも誤認識された文字「織」が表示されて
いるが、この文字の修正は修正履歴表示部(39)の第
2欄(39B>  をカーソル(43)によって選択す
るだけで行なうことができる。そして、修正対象文字が
尽きたときには、オペレータはスftプ(101)  
かみステップ(107)  に移行して修正作業を終了
する。
上述のように本例によれば、それまでの修正作業によっ
て得られた文字が修正履歴表示部(39)に表示されて
おり、その修正履歴表示部(39)に表示された文字を
随時認識結果表示領域(3l)の修正箇所に組込むこと
ができるため、過去に修正した文字と同じ種類の文字を
極めて効率的に修正することができる利益がある。
更に、その修正履歴表示部(39)においては修正の結
果得みれた文字が修正頻度の高い順に表示されており、
修正対象となる文字の種類が10種類を超えた場合でも
修正頻度の高い上位10位までの文字が常に表示されて
いるため、修正頻度の高い文字ほど効率的に修正ができ
る利益がある。
尚、上述実施例においては誤認識した文字を修正対象と
してし)るが、認識できないとしてリジエクトコードを
付された文字を修正対象とするような場合にも本発明は
適用できる。リジエクトコードを付された文字について
は第5図の認識結果表示領域(31)に示す如《ブラン
ク (44A)〜(44D)  によって表示される。
そして、例えばブランク(44^)に対応する文字を機
能釦領域(36)の各種釦の選択によって修正すること
によりこの修正された文字が修正履歴表示部(39)に
表示され、次にブランク(44B)〜(44D)  に
対応する文字の中にブランク(44^)に対応する文字
と同じ文字が存在する場合には、その修正履歴表示!(
39)の文字を選択するだけで迅速に文字の修正を行な
うことができる。
このように本発明は上述実施例に限定されず、本発明の
要旨を逸脱しない範囲で種々の構成を採り得ることは勿
論である。
〔発明の効果〕
本発明によれば、修正頻度の高い文字を効率的に修正で
きる利益がある。
【図面の簡単な説明】
第1図は本発明の一実施例の文字認識装置のンステム構
成を示す一部斜視図を含む正面図、第2図は第1図例の
要邦のより詳細な構成を示す一部斜視図を含む構成図、
第3図は一実施例の表示画面(2OA)  の構成例を
示す正面図、第4図は一実施例の修正履歴表示動作を示
すフローチャート図、第5図は一実施例の表示画面の他
の例を示す正面図、vJ6図は従来の文字認識装置の全
体構成を示すブロック図、第7図及び第8図は夫々従来
の文字列及び原矩形の切出し動作の説明に供する線図で
ある。 (13)はスキャナー、(14)は原稿、(15)はイ
メージデータ入出力ボート、(16)はホストコンピュ
ータ、(19)はキャラクタ識別ボート、(20)は表
示装置、(24)は中央処理ユニット、(25)はメイ
ンメ′モリ、(2g)は認識部、(29)は認識辞書部
、(39)は修正履歴表示部である。 代 理 人 松 隈 秀 盛 イ昂正雇歴表示動作 第4図 表示iIT7のイこのイタ1j 第5図

Claims (1)

  1. 【特許請求の範囲】  原文書のイメージに対応する原文字信号から1個の文
    字分の切出し文字信号を順次生成する文字切出し部と、
    上記切出し文字信号に対応する文字を識別する文字識別
    部と、上記識別した文字を表示する表示部と、文字認識
    後の修正作業中に修正して得られた文字を表示する修正
    履歴表示部とを有し、 文字認識後の修正作業中に上記修正履歴表示部に表示さ
    れた文字を随時修正箇所に組込むようにしたことを特徴
    とする文字認識装置。
JP2009624A 1990-01-19 1990-01-19 文字認識装置 Pending JPH03214281A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009624A JPH03214281A (ja) 1990-01-19 1990-01-19 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009624A JPH03214281A (ja) 1990-01-19 1990-01-19 文字認識装置

Publications (1)

Publication Number Publication Date
JPH03214281A true JPH03214281A (ja) 1991-09-19

Family

ID=11725418

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009624A Pending JPH03214281A (ja) 1990-01-19 1990-01-19 文字認識装置

Country Status (1)

Country Link
JP (1) JPH03214281A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0585944A3 (en) * 1992-09-04 1994-12-07 Canon Kk Information processing method and device.
JP2015055891A (ja) * 2013-09-10 2015-03-23 株式会社東芝 文字認識結果検証装置及び文字読取システム
JP2015090623A (ja) * 2013-11-06 2015-05-11 株式会社東芝 帳票読取装置、プログラムおよび帳票読取システム
JP2020071619A (ja) * 2018-10-30 2020-05-07 ウイングアーク1st株式会社 光学式文字認識結果の修正支援装置および修正支援用プログラム
JP2021056732A (ja) * 2019-09-30 2021-04-08 キヤノン株式会社 データ処理システム、データ処理方法、および、プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0585944A3 (en) * 1992-09-04 1994-12-07 Canon Kk Information processing method and device.
JP2015055891A (ja) * 2013-09-10 2015-03-23 株式会社東芝 文字認識結果検証装置及び文字読取システム
JP2015090623A (ja) * 2013-11-06 2015-05-11 株式会社東芝 帳票読取装置、プログラムおよび帳票読取システム
JP2020071619A (ja) * 2018-10-30 2020-05-07 ウイングアーク1st株式会社 光学式文字認識結果の修正支援装置および修正支援用プログラム
JP2021056732A (ja) * 2019-09-30 2021-04-08 キヤノン株式会社 データ処理システム、データ処理方法、および、プログラム

Similar Documents

Publication Publication Date Title
US6970601B1 (en) Form search apparatus and method
EP0439951B1 (en) Data processing
US4903312A (en) Character recognition with variable subdivisions of a character region
JPH11120293A (ja) 文字認識/修正方式
WO1990001198A1 (en) Character recognition apparatus
US5271067A (en) Optical character recognition apparatus
JPH03214281A (ja) 文字認識装置
US6088478A (en) Method and apparatus for distinguishing bold face characters
JP4810853B2 (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JP3172498B2 (ja) イメージ認識用特徴値抽出方法、およびその装置、イメージ解析プログラムを格納する記憶媒体
JP2893781B2 (ja) 文字認識装置
JP4117648B2 (ja) 帳票、帳票処理方法、帳票処理プログラム、帳票処理プログラムを記録した記録媒体及び帳票処理装置
JPH03214379A (ja) 文字認識装置
JPH03214350A (ja) 部首検索方法
JP2976990B2 (ja) 文字認識装置
JPH03214287A (ja) 文字認識装置
JP2747136B2 (ja) 文字認識装置
JP3377719B2 (ja) 文字認識装置及びコンピュータ読み取り可能な記録媒体
JPH08297718A (ja) 文字切り出し装置及び文字認識装置
JPH03214377A (ja) 文字認識装置
JP2755299B2 (ja) 画像処理方法
JPH03214380A (ja) 文字認識装置
KR930007083B1 (ko) 문자인식에서의 후보문자 분류방법
JP2931485B2 (ja) 文字切出し装置及び方法
JP3662967B2 (ja) 文字ループ候補抽出装置及び文字補完装置