JPH02105981A - 会話型文字認識方式 - Google Patents

会話型文字認識方式

Info

Publication number
JPH02105981A
JPH02105981A JP63259075A JP25907588A JPH02105981A JP H02105981 A JPH02105981 A JP H02105981A JP 63259075 A JP63259075 A JP 63259075A JP 25907588 A JP25907588 A JP 25907588A JP H02105981 A JPH02105981 A JP H02105981A
Authority
JP
Japan
Prior art keywords
character
area
characters
recognition
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63259075A
Other languages
English (en)
Inventor
Atsushi Matsutani
松谷 淳
Miyuki Maeda
前田 みゆき
Kotaro Yamashita
山下 廣太郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP63259075A priority Critical patent/JPH02105981A/ja
Publication of JPH02105981A publication Critical patent/JPH02105981A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、用紙上の文字または記号を読み取り。
文字認識する会話型文字認識方式に関し、特に新聞の切
り抜きや名刺等、フリーフォーマットの用紙上に存在す
る文字を認識するのに好適な会話型文字認識方式に関す
る。
〔従来技術〕
従来の文字認識システムでは、入力された文字を画像と
して表示して、オペレータがマウス等のポインティング
デバイスにより認識対象領域を指示して文字認識を行っ
ていた。
また、伝票の所定の枠内に記された文字を認識する場合
、伝票の認識領域や文字の区切りに関する情報をシステ
ム内に有し、その情報に従って1文字ずつ文字LEi2
を行っていた。
例えば、特開昭62−120588号公報に記載されて
いる方法では、@染上に記された文字°をOCRで読み
取って文字LLaする場合、帳票上の第1文字目が記入
された枠の左端位置と、最終文字が記入された枠の右端
位置とを示すマークを設け、このマークによって帳票の
有効領域と文字切り出し位置情報を1文字毎に算出し1
手書き文字認識の際の文字切り出し精度を向上させてい
る。
また、特開昭63−37487号公報に記載されている
装置では、帳票等、認識対象領域の候補(枠等)が既に
示されている文書において、入力画像の認識対象領域を
ポインティングデバイスによって1点のみを指定するこ
とにより簡易に決定している。
さらに、特開昭63−37490号公報に記載されてい
る装置では、帳票等の定型文書において認識対象画像の
認識対象領域を指定するとともに、その領域に記入され
ている文字種を指定することにより、例えば数字のOと
英字のOのように類似形状の文字を含んだ場合の認識精
度を向上させている。
〔発明が解決しようとする課題〕
上記従来技術では、特定のます目的に書かれた文字を認
識することはできるが、フリーフォーマットの用紙上に
存在する文字を認識することはできなかった。
すなわち、フリーフォーマットの用紙上に存在する文字
をOCRを用いて画像データとして読み取ることは可能
であるが、その画像のどこからどこまでが文字か、ある
いは文字の切れ目はどこかを認識することは非常に是し
いため、フリーフォーマットの用紙上に存在する文字を
文字データとして認識するには、複雑な文字の切れ目判
定処理を行う必要があり、正確性に欠ける上、認識時間
装置の大型化、価格等にも問題があった。
また、文字位置を認識させるため、用紙上の文字にマー
クを付加する方法では、文字が存在する用紙上の文字列
の原形を損ねるという問題があった。
さらに、OA化が進んだ企業では、新聞や名刺あるいは
過去の統計表等のフリーフォーマツ1−の用紙上に存在
する文字をコンピュータの中にデータとして取り込みた
いという要望が多く、短時間で容易に文字認識を行う方
法が求められている。
本発明の目的は、このような問題を改善し、新聞、名刺
、表等のフリーフォーマットの用紙上に存在する文字を
会話形式により簡単な処理で短時間に認識し、かつその
用紙上の文字列を損ねることがない会話型文字L&識右
方式提供することにある。
〔課題を解決するための手段〕
上記目的を達成するため、本発明の会話型文字認識方式
は、認識対象文字を含む画像を光学的に読み取る装置と
、読み取った画像を表示する装置と、表示画面上の位置
および数字を含むデータを入力する装置とを偏え1表示
装置が表示した読取画像中、認識対象文字が存在する領
域を指示して、指示された領域内の文字を認識する光学
画像読取装置の文字認識方式において1表示された読取
画像の中から認識対象文字が存在する領域を指示すると
ともに、その領域に存在する認識文字数を指示して、そ
の領域を認識文字数で等分し、等分された領域の文字パ
ターンを切り出して認識することに特徴がある。
また、上記認識対象文字が存在する領域を指示する場合
1表示された画像上の3点で決定される長方形領域によ
り、その領域を指示することに特徴がある。
〔作用〕
本発明においては、読取装置が紙上の文字を画像として
読み取り、表示装置に表示する。
ここで、利用者はタッチペンあるいはマウス等のポイン
ティングデバイスを用い、表示画像中、文字認識する領
域を指示し、かつ表示した読取画像を見ながら、その領
域内の文字数を指示する。
これにより1文字領域を指示された文字数で分割し1分
割した枠内ごとに文字認識を行い、特別な文字の切り出
し処理を行うことなく、簡単にフリーフォーマットの文
字列の認識できる。
また、従来の方法で文字の切り出し処理を行った場合に
比べ、認識時間を短縮して認ra率を向上することがで
きる。
〔実施例〕
以下、本発明の一実施例を図面により説明する。
第2図は、本発明の会話型文字認識方式により、名刺上
の文字を認識する際の画面表示過程を示す説明図である
本実施例では、利用者が入手した名刺11上の文字を認
識する際、まず名刺11をスキャナで読み取り、(a)
に示すような画面12を表示する。
この画面12上部はスキャナで読み取った名刺11の画
像データを表示する画像表示部14であり1名刺11に
印刷された会社名■と、役職名および氏名■と、住所お
よび電話番号■とが画像として表示される。なお、■〜
■の文字間隔はそれぞれ異なる。
また、その下部は認識した文字を表示する認識文字表示
部15であり、(a)では、まだ文字認識が行われてい
ないため、空欄となっている。
次に、利用者がタッチペン等のポインティングデバイス
を用い、画面12上で直接文字認識する長方形の領域(
文字領域)の2点を指示すると。
(b)のように、指示した文字領域を点線で表示する。
この場合、会社名■(日立株式会社)が文字領域として
指示され、表示されている。
さらに、利用者が文字領域を見て、分割領域数。
つまり文字領域内の文字数をキーボード等で入力する。
この場合1日立株式会社の文字数6を入力する。
これにより、直方形の文字領域を文字数等分し、(C)
のように分割領域を実線で区切って表示する。
利用者は、1個の分割領域に1文字ずつ正しく入ってい
れば、OKの指示を行う。また1個の分割領域に複数の
文字が入っていたり、1文字が2個の分割領域にまたが
っている場合にはNoの指示を行う。
次に、OKの指示があった場合には、それぞれの分割領
域ごとに1文字の文字認識を行い、(d)に示すように
、その結果を認識文字表示部15に表示する。なお、N
oの指示があれば1文字領域を再び指示し直す。
こうして、会社名■の文字認識が終了すると、役職名お
よび氏名■と住所および電話番号■との文字認識を同様
の画面表示で順次行う。
なお、本実施例では、文字領域や分割領域を点線や実線
で表示しているが1例えば背景の色を変えて表示するこ
とも考えられる。
第3図は1本発明の会話型文字認識方式を実現する文字
認識システムの構成図である。
第3図において、11はフリーフォーマットの用紙(例
えば名刺)、13はCRT22の画面をタッチすること
により文字領域を入力するタッチペン、21は名刺や文
書等の紙上の文字を光学的に読み取るスキャナ、22は
スキャナ21が読み取った画像および認識結果を表示す
るCRT、23は文字領域内の文字数等を入力するキー
ボード、24はスキャナ21が読み取った画像から、入
力された指示に従って文字認識処理等を行うCPU。
25は認識した文字および読み取った画像を保持する文
書ファイルである。
このCPU24は、利用者がタッチペン13で指示した
文字領域を、キーボード23から入力された認識文字数
で等分し、等分した領域の文字パターンを切り出して認
識処理する。
なお、本実施例では、文字領域を指定するためにタッチ
ペン13を用いたが、画面上の点を入力できるものなら
ば、他のポインティングデバイスを用いることもできる
第1図は、本発明の一実施例における会話型文字認識方
式を示すフローチャート、第4図は本発明の一実施例に
おいて2点を指定して文字領域を決める場合の誤入力側
図、第5図は本発明の一実施例において複数行の文字処
理に対して文字数を指定する方法の説明図である。
第3図の文字認識システムでは、第1図のように、まず
名刺11等の文字をスキャナ21で読み取り(101)
、読み取った画像をCRT22画面の画像表示部14(
第2図参照)に表示する(102)。
利用者がタッチペン13を用いて2点を指示すると、そ
の2点で決定される長方形の文字領域を画面に表示しく
103)、さらにその文字領域内の文字数をキーボード
23から入力すると、その文字数分に文字領域を等分し
く104)、その分割状況を表示する(105)。
さらに、利用者が文字領域の分割がOKである旨を示す
と、分割した文字領域を順に1文字ずつ文字認識し、そ
の認識結果を認識文字表示部15(第2図参照)に表示
する(106,107)。
また、文字が等間隔で書かれていない等の理由により1
分割がOKでない場合には、ステップ103に戻り、等
間隔の部分ごとに文字領域を指定し直す。
このように、会話形式で文字認識を行うことにより、特
別な文字切り出し処理を行うことなく、フリーフォーマ
ットの文字認識を行うことが可能である。
なお、本実施例では、2点を指定することにより、その
2点を左上および右上の頂点とする長方形を文字領域と
しているが、第4図に示すように、2点A1.A、を頂
点とし、誤まって斜めに読み取る場合がある。
これに対応するため、3点A工〜A、を入力する方法を
採用することもできる。この方法によれば。
誤まって斜めに読み取った画像を回転処理により正常に
直す必要はない。
また、第5図に示すように、複数行の文字列を1度で認
識するため、文字数の指定をn行m列(nXm)という
形式で行い(第5図では3X9)、縦をn等分、横をm
等分して文字認識を行うこともできる。
また、文字列の配列方向については、本実施例のように
横方向を前提とする以外にも、縦方向か横方向かの何れ
か一方を入力する方法としてもよい。
第6図〜第10図は、本発明の会話型文字認識方式によ
り表形式の書類上に存在する表内データを文字認識する
場合の表示画面例図である。
第3図の文字認識システムにおいて1表形式の書類上の
文字をスキャナ21で読み取り、読み取った画像をCR
T22に表示する場合、第6図のように、利用者はタッ
チペン13を用いて画面12の画像表示部14にある文
字領域を決定する2点を指示し、その文字領域は点線で
表示される。
さらに、利用者はその表示を見て文字領域内のデータ数
(行数)をキーボード23から入力する。
これにより、第7図のように、システムは文字領域を点
線で示すようにデータ数等分して分割状況を表示する。
なお、分割領域内の上部や下部に罫線があり、以降の文
字認識が難しい場合には、第8図のように、分割領域の
周りの一定部分をカットして、分割領域を小さくする。
また、どのくらい小さくするか、上下左右の何れをカッ
トするか等はキーボード23から入力して指示する。
さらに、その分割が正しく行われていれば、利用者はO
Kの指示を行い、さらに分割領域内を1文字ずつ区切っ
て認識するため5分割領域に入り得る文字数をキーボー
ド23から入力し、第9図のように、その文字数で列方
向に分割して分割状況を点線で表示する。
その結果、1個の升目領域内に1文字が正しく入ってい
れば、利用者はOKの指示を行う。
これにより、システムは升目ごとに文字認識を行い、一
定ピクセル以下しか画素がない升目は空白と見做して1
行ごとに文字認識を繰返し、第10図のように、認識文
字表示部15に表示する。
〔発明の効果〕
本発明によれば1文字の切れ目の判定等、複雑な処理を
行うことなく、フリーフォーマットの文字を認識するこ
とができるため1名刺、新聞、表等の文字を小型で安価
な装置で短時間に認識し、コンピュータのデータとして
取り込むことができる。
【図面の簡単な説明】
第1図は本発明の一実施例における会話型文字認識方式
を示すフローチャート、第2図は本発明の会話型文字認
識方式により1名刺上の文字を認識する際の画面表示過
程を示す説明図、第3図は本発明の会話型文字認識方式
を実現する文字認識システムの構成図、第4図は本発明
の一実施例において2点を指定して文字領域を決める場
合の誤入力例図、第5図は本発明の一実施例において複
数行の文字処理に対して文字数を指定する方法の説明図
、第6図〜第10図は本発明の会話型文字認識方式によ
り表形式の書類上に存在する表内データを文字認識する
場合の表示画面例図である。 11:名刺、12:画面、13:タッチペン。 14:画像表示部、15:認識文字表示部、21:スキ
ャナ、22 : CRT、23:キーボード、24:C
PU、25:文書ファイル。 特許出願人 株式会社 日立製作所

Claims (1)

  1. 【特許請求の範囲】 1、認識対象文字を含む画像を光学的に読み取る装置と
    、読み取った画像を表示する装置と、該表示装置の画面
    上の位置および数字を含むデータを入力する装置とを備
    え、該表示装置が表示した読取画像中、認識対象文字が
    存在する領域を指示して、該指示領域内の文字を認識す
    る光学画像読取装置の文字認識方式において、上記読取
    画像中、認識対象文字が存在する領域を指示するととも
    に、該領域に存在する認識文字数を指示して、該領域を
    該認識文字数で等分し、等分された領域の文字パターン
    を切り出して認識することを特徴とする会話型文字認識
    方式。 2、上記認識対象文字が存在する領域を指示する場合、
    表示された画像上の3点で決定される長方形領域で該領
    域を指示することを特徴とする請求項1記載の会話型文
    字認識方式。
JP63259075A 1988-10-14 1988-10-14 会話型文字認識方式 Pending JPH02105981A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63259075A JPH02105981A (ja) 1988-10-14 1988-10-14 会話型文字認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63259075A JPH02105981A (ja) 1988-10-14 1988-10-14 会話型文字認識方式

Publications (1)

Publication Number Publication Date
JPH02105981A true JPH02105981A (ja) 1990-04-18

Family

ID=17328976

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63259075A Pending JPH02105981A (ja) 1988-10-14 1988-10-14 会話型文字認識方式

Country Status (1)

Country Link
JP (1) JPH02105981A (ja)

Similar Documents

Publication Publication Date Title
EP1739574B1 (en) Method of identifying words in an electronic document
US5392130A (en) Analyzing an image showing a row/column representation
EP3940589B1 (en) Layout analysis method, electronic device and computer program product
JPH03161891A (ja) 表形式文書読取装置
JPH11120293A (ja) 文字認識/修正方式
JPH02201588A (ja) 文字読取装置
JP7035656B2 (ja) 情報処理装置及びプログラム
JP2008108114A (ja) 文書処理装置および文書処理方法
US8824806B1 (en) Sequential digital image panning
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JP3171626B2 (ja) 文字認識の処理領域・処理条件指定方法
JPH02105981A (ja) 会話型文字認識方式
JP7178445B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JPH0384681A (ja) 名刺情報の入力処理方法
JP2682873B2 (ja) 表形式文書の認識装置
JPH08297718A (ja) 文字切り出し装置及び文字認識装置
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JP2021157375A (ja) 情報処理装置及びプログラム
JPH0610447Y2 (ja) 画像処理装置
JPH058670U (ja) 光学的文字読取装置
JP2023067314A (ja) 新聞電子版システム
JPS6326789A (ja) 文字認識装置
JP2001307020A (ja) 文字認識装置
JPS61206087A (ja) 文書読取装置
JP2006119942A (ja) 文字列領域切り出し装置