JPS63204487A - 文字読取方法 - Google Patents

文字読取方法

Info

Publication number
JPS63204487A
JPS63204487A JP62037230A JP3723087A JPS63204487A JP S63204487 A JPS63204487 A JP S63204487A JP 62037230 A JP62037230 A JP 62037230A JP 3723087 A JP3723087 A JP 3723087A JP S63204487 A JPS63204487 A JP S63204487A
Authority
JP
Japan
Prior art keywords
character
characters
identification
character pattern
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62037230A
Other languages
English (en)
Inventor
Sueji Miyahara
末治 宮原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP62037230A priority Critical patent/JPS63204487A/ja
Publication of JPS63204487A publication Critical patent/JPS63204487A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は記録媒体上の文字を走査して光学的に読取り
、その読取った画像パターンから文字を識別する文字読
取方法に関する。
〔従来の技術〕
従来の文字読取装置は第3図に示すように、記録媒体1
上の文字を、文字読取装置2の走査・光電変換部3によ
って走査・光電変換を行って量子化した後、前処理部4
における画像メモリ41に格納し、文字切出し部42に
よって画像メモリ41の中から個々の文字パターンを切
出して識別部5に送出する。識別部5では、文字識別部
51により切出された文字パターンがどのカテゴリに所
属するかを判別し、その結果(識別結果、候補文字、類
似度、文字パターンなど)を確認修正部6の記憶部61
に格納する。確認修正部6では人出力制御部62の制御
により記憶部61の情報を文字パターン生成部6,3か
ら生成される文字情報に変換して出力表示部64やプリ
ンタ(表記せず)に出力・表示し、リジェクト文字や誤
読文字、あるいは出力フォーマットの良否を確認して不
備な点があれば情報入力部65からの入力に基づいて修
正する。
従来、この種の誤読文字の検出方法は、識別部5の読取
結果を出力表示部64の表示領域に表示した文字、ある
いはプリンタによって用紙に印刷した文字と、記録媒体
1上の文字とを人間が目視によって照合しながら誤読文
字を検出する方法や、2人の人間による読み合せによっ
て誤読文字を検出する方法、あるいは読取結果の文字パ
ターン列と記録媒体上の文字パターン列とを表示装置の
表示81に表示し、人間が目視によって照合しながら誤
読文字を検出する方法がとられていた。
〔発明が解決しようとする問題点〕
このような構成をとっていたため、人間が誤読文字を検
出するには記録媒体上の文字と、表示あるいは用紙へ出
力された識別結果の文字とを、目視か音読かで逐一照合
させる必要があり、読取対象である記録媒体が文字読取
装置から排出されるまで検出作業が始められない。読取
結果と記録媒体上の文字とを交互に見比べて照合をとる
ため検出精度が確保できず、検出速度も早くならない。
検出精度を確保するため誤読文字検出作業を複数回行な
わなければならず多大な時間を要するという欠点があっ
た。
〔問題点を解決するための手段〕
この発明によれば、前処理部において読取対象である文
字パターンの大きさや文字の印字位置を検出し、識別部
において記録媒体上の文字が何という文字フォント(明
枡体、ゴシック体、などの活字文字デザインなど)で記
録されているかを識別、あるいは理解、あるいは指示を
受け、読取結果を表示する際に文字パターン生成部の中
から記録媒体上の文字と同じフォント、同じ大きさでそ
の識別文字と画像メモリの文字パターンとを重ねて表示
することにより、誤読文字の検出を容易に行なえるよう
にしたものである。
〔作 用〕
この発明は文字読取装置の誤読文字検出のために、前記
の解決手段をとったので、読取結果に含まれる誤読文字
の検出が効率よく行なえるように作用する。
〔実施例〕
第1図はこの発明の1実施例の構成を示し、第3図と対
応する部分に同一符号が付けられである。
この発明では識別部5に文字識別部51の他に、特にフ
ォント識別・理解部52が設けられている。
この文字読取装置は次のように動作する。文字読取装置
2に!!置された文書などの記録媒体lは、逐次的に走
査・光電変換部3によって電気信号に変換され、量子化
された後に画像メモリ41に格納される。画像メモリ4
1に格納された画像パターンは文字切出し部42により
1文字ずつの文字パターンが検出されて切出された後、
次段の識別部5に入力される。文字識別部51では文字
パターンの特徴が抽出され、予め用意された文字認識辞
書(既知の文字パターンの特徴、あるいは条件)との照
合を行なうか、あるいは条件の一致を判定して何という
カテゴリであるかを識別し、そのカテゴリに対応する文
字コード(候補文字、類似度なども含む)や文字パター
ン情報(文字の大きさ、記録位置などの情報を含む)と
を記憶部61に送出する。
一方、文字フォントi別・理解部52では、文字線幅の
計測結果、あるいは各々の文字フォントパターンで作成
された複数種の認識辞書の中からどの文字フォントの認
識辞書で識別できたかを示す情報、あるいは記録媒体上
に記録された文字フォントを示す記号や文字を文字識別
部51で読取った結果から理解した情報を記憶部61に
送出する。確認修正部6は前記の読取動作と並行して、
記憶部61から識別結果の情報と画像メモリ41からの
文字切出し部42で切出した文字パターンとを読み出し
、文字の識別結果に対しては文字パターン生成部63の
中から文字フォントa別・理解の結果に対応するフォン
トの文字パターンを選択し、入出力制御部62の制御に
よって文字の大きさや文字位置の整合をとり、2つの文
字パターンを重ね合わせて出力表示部64に表示する。
出力表示部64に表示された文字パターンから誤読文字
が検出できた場合は情報入力部65から修正のため情報
を人力して、記憶部61内の読取結果を正しい文字コー
ドに修正する。
いま記録媒体l上の入カバターン7が第2図Aに示すよ
うに“技”であるとし、これを走査・光電変換した画像
メモリ41上の文字パターンを“赤色”で出力表示部6
4に表示し、識別結果の文字パターンを″“青色”で表
示するように異ならせて表示すれば、両大学パターンが
一致する場合は表示パターンの全てが“黄色″で表示さ
れ、文字パターンが一致しない場合は第2図Bに示すよ
うに、文字パターンの一致する部分が“黄色”71、一
致しない部分が“赤色”72と“青色”73とで表示さ
れ、誤読文字であることが直ちに検知できる。識別中の
文字の文字切出し部42で切出した画像メモリ41の文
字パターンを識別部5を通じて記憶部61に記憶し、そ
の文字パターンと、識別した文字から文字パターン生成
部63で作った文字パターンとを重ね合せ表示してもよ
い。
さらに、このようにして一致しない文字が検出できた場
合は、その状態、あるいは一致しない文字を操作員が指
示することにより、画像メモリ上の文字パターンと識別
結果からの生成文字パターンとを対にして並べて出力表
示部64に表示すると共に、読取結果として記憶部61
に存在する候補文字も表示して情報入力部65からの指
示によって正しい候補文字を選択できるようになってい
る。また、読取結果から生成する文字パターンのフォン
ト種別を情報入力部64などの外部から入力することに
より文字フォント認識・理解部52が存在しない場合に
もこの発明方法を適用できる。
このような構成になっているから、文字読取装置2の識
別と、操作員の読取結果の確認・修正の処理とを独立に
並行して行なうことができると共に、読取結果を確認す
るための文字パターン表示を画像メモリ41上の文字パ
ターンに重ねて表示することにより確認や誤読文字の検
出が容易になり、確認や修正の作業が効率よく行なえる
ようになるため文字読取装置2の処理効率や文書の校正
速度および校正精度を向上させることができる。
さらに文字読取装置2の読取り傾向に従って、画像メモ
リ41上の文字パターンと読取結果から生成する文字パ
ターンとを並べて表示するカテゴリを予め指定しておけ
ば、さらに処理効率を上げることができる。
また、記憶部61をフロッピーディスク等の外部記憶装
置に移行できるものにすれば、誤読文字やりジェクト文
字の多いデータは、第1図中の確認修正部6のみの修正
専用の装置を用いて修正することができ、文字読取装置
2を存効に使用することができる。
〔発明の効果〕
以上説明したようにこの発明では、確認修正処理におい
ては、誤読文字を検出するための読取結果の表示や用紙
出力を画像メモリ上の文字パターンと、読取結果からの
生成されるフォント対応の文字パターンとを重ねて表示
したり、対にして並べて表示することにより文字パター
ン間の差違の検出を容易にしたことから読取対象に適し
た処理ができること、および、誤読文字に対しても操作
員の指示によって候補文字や文字像が表示できるように
したため、修正処理において記録媒体を見なくても誤読
文字の修正が短時間でできるなどの効果がある。また、
記録媒体上の文字の識別と誤読文字やりジェクト文字の
修正とを互いに独立して同時に行えるようにできるから
、文字読取装置の処理効率を上げることができる利点が
ある。なお、この方法は読取結果の表示と情報の入力と
が同一表示面上でできる確認修正部を用いた場合に、そ
の効果は更に増大する。
【図面の簡単な説明】
第1図はこの発明の構成例を示すブロック図、第2図は
この発明における出力表示部の表示面上への文字パター
ン表示例を示す図、第3図は従来の文字読取修正方法の
構成を示すブロック図である。

Claims (1)

    【特許請求の範囲】
  1. (1)記録媒体上の文字を走査して光電変換する光学的
    走査手段と、 その光学的走査手段によって得られた画像パターンを記
    憶する画像メモリと、 その画像パターンから個々の文字を検出して切出す前処
    理手段と、 その前処理手段から送られて来る文字パターンを識別す
    ると共に、記録媒体上の文字が何という文字フォントで
    あるかを識別、あるいは理解、あるいは指示することが
    できる識別手段と、 その識別手段によって得られた識別結果を保持する記憶
    手段と、 その識別結果の文字を識別、あるいは理解、あるいは指
    示された文字フォントで表示するために、一種、あるい
    は多種フォントの文字パターンを生成する文字パターン
    生成手段と、 その文字パターン生成手段によって生成された文字パタ
    ーンと上記光電変換によって得られた画像メモリ上の文
    字パターンとを表示し、識別結果の確認と修正を行なう
    確認修正手段とを備え、その確認修正手段の表示領域に
    識別結果を表示して確認する際に、上記前処理手段にお
    いて検出された個々の文字位置と文字大きさの情報と、
    上記識別手段において識別されたカテゴリ情報、および
    文字フォントの情報とを用いて、上記文字パターン生成
    手段によって生成した文字パターンと上記画像メモリの
    文字パターンとを重ねて表示することにより、誤読文字
    の検出を容易にすることを特徴とする文字読取方法。
JP62037230A 1987-02-20 1987-02-20 文字読取方法 Pending JPS63204487A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62037230A JPS63204487A (ja) 1987-02-20 1987-02-20 文字読取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62037230A JPS63204487A (ja) 1987-02-20 1987-02-20 文字読取方法

Publications (1)

Publication Number Publication Date
JPS63204487A true JPS63204487A (ja) 1988-08-24

Family

ID=12491801

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62037230A Pending JPS63204487A (ja) 1987-02-20 1987-02-20 文字読取方法

Country Status (1)

Country Link
JP (1) JPS63204487A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01241684A (ja) * 1988-03-24 1989-09-26 Toshiba Corp 文書読取り装置
JPH01292587A (ja) * 1988-05-20 1989-11-24 Canon Inc 画像処理方法
JPH04133176A (ja) * 1990-09-26 1992-05-07 Mitsubishi Electric Corp 図面入力装置
JPH09223191A (ja) * 1996-02-20 1997-08-26 Sharp Corp 手書き文字入力表示装置
JP2010231440A (ja) * 2009-03-26 2010-10-14 Fuji Xerox Co Ltd 情報処理装置およびプログラム
JP2012027524A (ja) * 2010-07-20 2012-02-09 Sharp Corp 画像処理装置、画像処理方法およびそのプログラム
JP2012146147A (ja) * 2011-01-12 2012-08-02 Hitachi Solutions Ltd 文書処理装置、及び文書処理プログラム
JP5651798B1 (ja) * 2014-07-01 2015-01-14 株式会社Tkc 手書きを利用した文字検索システム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01241684A (ja) * 1988-03-24 1989-09-26 Toshiba Corp 文書読取り装置
JPH01292587A (ja) * 1988-05-20 1989-11-24 Canon Inc 画像処理方法
JPH04133176A (ja) * 1990-09-26 1992-05-07 Mitsubishi Electric Corp 図面入力装置
JP2577821B2 (ja) * 1990-09-26 1997-02-05 三菱電機株式会社 図面入力装置
JPH09223191A (ja) * 1996-02-20 1997-08-26 Sharp Corp 手書き文字入力表示装置
JP2010231440A (ja) * 2009-03-26 2010-10-14 Fuji Xerox Co Ltd 情報処理装置およびプログラム
JP2012027524A (ja) * 2010-07-20 2012-02-09 Sharp Corp 画像処理装置、画像処理方法およびそのプログラム
JP2012146147A (ja) * 2011-01-12 2012-08-02 Hitachi Solutions Ltd 文書処理装置、及び文書処理プログラム
JP5651798B1 (ja) * 2014-07-01 2015-01-14 株式会社Tkc 手書きを利用した文字検索システム
JP2016014989A (ja) * 2014-07-01 2016-01-28 株式会社Tkc 手書きを利用した文字検索システム

Similar Documents

Publication Publication Date Title
US4962432A (en) Selective retrieval of data from microfilm images of different forms by reading a memory index form cord (bar code) recorded on each image frame
JP2001096872A (ja) プリンタ装置および印刷物検査装置
JPS63204487A (ja) 文字読取方法
JPH0291789A (ja) 文字認識方法
JPH06131495A (ja) 画像情報抽出方式
JP2894111B2 (ja) 光学式活字文字認識装置における認識結果の総合判定方式
JPH05298484A (ja) 光学的文字読取装置
JPS58109973A (ja) 印字文字エコ−チエツク機能付印字装置
JP2925270B2 (ja) 文字読取装置
JPH0388085A (ja) 光学的文字読取装置
JPH02268385A (ja) 光学的文字読取装置
JP3160458B2 (ja) 文字読取装置及び文字読取方法
JP4218179B2 (ja) パターン検出装置及び方法
JPH0528314A (ja) 光学的文字読取装置
JPS6095689A (ja) 光学的文字読取装置
JPH02217977A (ja) 光学的文字読取装置
JP2570571B2 (ja) 光学文字読取装置
JPS60160486A (ja) 光学的文字読取装置
JPH0272497A (ja) 光学的文字読取装置
JPH01278367A (ja) 画像情報記録・読取方法
JPH0628521A (ja) 光学的文字読取装置
JPH10134181A (ja) マークエリア検出方法
JPS62138981A (ja) 情報認識装置
JPS62295192A (ja) 光学文字画像読取装置
JPH0498586A (ja) 画像生成装置