JPH04191992A - 情報処理装置 - Google Patents

情報処理装置

Info

Publication number
JPH04191992A
JPH04191992A JP2321010A JP32101090A JPH04191992A JP H04191992 A JPH04191992 A JP H04191992A JP 2321010 A JP2321010 A JP 2321010A JP 32101090 A JP32101090 A JP 32101090A JP H04191992 A JPH04191992 A JP H04191992A
Authority
JP
Japan
Prior art keywords
character
data
input
describer
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2321010A
Other languages
English (en)
Inventor
Toru Futaki
徹 二木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2321010A priority Critical patent/JPH04191992A/ja
Publication of JPH04191992A publication Critical patent/JPH04191992A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は情報処理装置に関し、特にOCR(光学式文字
読取り装M)を用いて、複数の利用者がデータ入力を行
う情報処理装置に関するものである。
〔従来の技術〕
従来のOCRの機能を利用する情報処理装置として、キ
ーワード登録に利用するファイリングシステムを例にと
り、以下で説明する。
第7図はファイリングしようとするシートの例を示す、
7o1および702はキーワードとして登録される手書
き文字である。704はデータベースのデータとして登
録する画像である。なお、このシートがスキャナがら読
み込まれてメモリに展開された場合、符号703で示さ
れる領域をインデックスデータと呼び、符号704で示
される領域をイメージデータと呼び、領域703と領域
704とを合わせて画像データと呼ぶこととすス− 第8図は従来のファイリング装置のブロック図である。
ここで、801は画像を読み込んで2値の電気信号に変
換する画像データ入力部である。
802は画像データを一時的に記憶しておくメモリであ
る。803は予め定められたフォーマット情報にしたが
って文字画像データと図形データとを分離する領域分離
部である。
804は画像データを記憶してお(イメージデータ記憶
部である。805は文字画像データに対して文字の切り
出しおよび認識の処理を行う文字認識部である。806
は認識処理に用いる辞書である。
807は認識された文字列をキーワードとして、そのキ
ーワードに対応する画像データをポイントさせて記憶す
るインデックス登録部である。
808は検索時に入力されたキーワードに該当する画像
データを画像記憶部から取り出して(るインデックス検
索部である。809は検索の際にキーワードを入力する
ためキーボードおよびそのインターフェイスからなるイ
ンデックス入力部である。 810は検索された画像デ
ータをデイスプレィあるいはプリンタに出力する出力部
である。
[発明が解決しようとする課題〕 上述の従来の装置においては、文字画像を認識し、それ
をコードに変換することによってインデックスの入力を
行っているが、汚い字や癖字によってインデックスが筆
記された場合には、正しいインデックスが得られず、こ
のため誤まったファイリングが行われるという問題点が
あった。
本発明の目的は、上述の問題点を解決し、入力文字デー
タの認識の誤りを低減可能な情報処理装置を提供するこ
とにある。
[課題を解決するための手段] このような目的を達成するために、本発明は、手書き文
字データに対して文字認識の処理を行なう文字認識手段
と、前記手書き文字データの筆記者を登録する登録手段
と、前記手書き文字データの前記認識結果から前記筆記
者の字のていねいさを表す指標を計算する計算手段と、
前記筆記者と前記指標とを対応可能に記憶する記憶手段
と、この記憶手段から随時前記筆記者を前記指標に基づ
いて表示する手段とを備えたものである。
〔作 用〕
本発明においては、入力しようとする手書き文字データ
に対して、情報処理装置に、この手書き文字データの筆
記者を登録する手段と、入力データの認識結果から筆記
者の字のていねいさを表す指標を計算する手段と、筆記
者と上記指標とを対応可能に記憶する手段と、随時この
筆記者を指標に基づいて表示する手段を設けることによ
り、字のていねいでない認識の困難な筆記者を知ること
が可能となる。これは、該当者に対する筆記の指導や装
置の使用を禁止すること等に役立ち、誤りの少ないデー
タ入力を可能にする。
〔実施例〕
以下、図面を参照して本発明の詳細な説明する。
第1図は本発明の第1の実施例を表すブロック図である
。ここで、1olなレル110は、それぞれ第8図の従
来例の801ないし810と同じである。
111はインデックスデータの認識結果からID番号だ
け取り出すID検出部である。112は認識結果から文
字のきれいさを表す指標を計算する品質指標計算部であ
る。113はID番号および品質指標を記憶しておく品
質指標記憶部である。114は品質指標記憶部の内容を
要求に応じて出力部へ送る品質指標参照部である。11
5は参照要求を受付ける参照要求入力部である。
第2図は実施例のファイリングシステムに用いる登録シ
ートの一例を示す。201は筆記者を一意に特定するこ
とのできる番号(以下ID番号と呼ぶ)である。202
および203は画像データを検索する際に用いるインデ
ックスとなる情報である。
204はイメージデータである。
第3図は本実施例のハードウェア構成を示す。
ココテ、301けデータの址去七l−1e l:+餅彬
導−・−合要求を入力するためのキーボードである。3
02はCPU(中央処理装置)である。303はROM
 (リードオンリメモリ)である。304はRAM (
ランダムアクセスメモリ)である。305は画像を電気
信号Iこ変換するスキャナである。306はイメージデ
ータを記憶しておくハードディスクである。307は検
索結果や照合結果を表示すデイスプレィである。
308はバスである。
最初に、データをファイリングする際の動作番こついて
説明する。まず、スキャナ305から画像データ全体を
取り込み、予め定められたフォーマット情報にしたがっ
て、位置によりインデックスデータ領域とイメージデー
タ領域と番こ分離する。
イメージデータはそのままイメージデータ記憶部104
に格納される。一方、インデックスデータは文字認識部
105へ送られ、フォーマット情報番こしたがって一文
字ずつ切り出され、その特徴が抽出され、辞書106と
照合されるという認識処理を受ける。
フォーマット情報にはインデックスデータのどの部分が
ID番号201であるかという情報も含まれており、こ
の情報にしたがって、10番号検出部illは認識結果
の文字列の中からID番号だけを取り出す。
品質指標計算部112は、文字認識部105から出力さ
れるすべての認識結果に基づいて、記入されている文字
のきれいさの程度を表す指票な計算する。この指標を品
質指標と呼ぶ。
品質指標の計算方法を第4図を用いて説明する。文字認
識部105では入力文字と辞書に登録されている標準パ
ターンとの距離を計算し、最も近い標準パターンを選び
出し第1候補文字として出力する。入力文字が標準パタ
ーンと完全に一致した場合、この距離は0になる。
本実施例では第4図に示すように、文字認識部105か
らは第1候補文字とともにその候補文字に対する距離が
出力される。このとき、i番目の入力文字の第1候補文
字に対する距離をdi、全体の文字数をNとすると、品
質指標Eは、 で定義される。すなわち、入力文字と第1候補文字との
距離の平均値を計算していることになる。
したがって、正確には、この指標は辞書に登録されてい
る標準パターンに近い文字が書かれているかどうかを表
していることになる。計算された品質指標は品質指標記
憶部113に格納される。
第5図に品質指標記憶部113に格納されるデータ構造
を示す。まず、入力のID番号をID番号の欄501と
比較し、同じID番号に対する品質指数が格納されてい
れば、新たな入力である品質指数を欄502に加算し、
カウンタ503の値を1つ増やす。
今までに入力のなかったID番号であれば、行504に
ID番号および品質指数を追加し、カウンタ503の欄
を1とする。
次に、品質指数の照合について説明する。データのファ
イリング作業が何回か行われた後に、ファイリング装置
の管理者は過去に登録を行った人の記入文字の評価を行
うため品質指数記憶部113を参照する。
すなわち、参照要求入力部115を通じて品質指標憶部
の内容を参−照する要求を品質保証参照部114に送る
。参照部114では要求に従って、今までに記憶された
品質指数からID番号ごとに平均品質指数を計算し、出
力部110に送る。ID番号がMの平均品質指数E工は
次式で定義される。
E、=EM/に ただし、Ellは品質指数記憶部に格納されている、I
D番号がMの品質指数の累積値であり、欄502に記憶
されている値である。Kは累積された回数を表す値50
3である。
平均品質指数E、(M=1.2.・・・)のデイスプレ
ィへの出力例を第6図に示す。同側では、EMの大きさ
によってソーティングし、E2の大きい順にID番号、
平均品質指数および登録回数を表示している。
本ファイリング装置の管理者は、この出力結果によって
EMの大きい、すなわち、平均的に標準パターンとの差
の大きい悪事や癖字を書く人を特定し、そのような人に
対して、認識に適した字形の指導を行なったり、さらに
は使用不可IDまたは使用可能IDのどちらかを登録す
るようにし、この登録IDと入力IDとを比較させるこ
とにより、ファイリング装置の使用を禁止することもで
きる。
以上本発明の一実施例について説明したが、他の実施例
として次のようなものが挙げられる。
(1) ID番号は、登録者またはその属するグループ
等を特定できる記号列であれば、番号でなくとも個人名
あるいはグループ名等でもよい。
(2)文字の品質指標Eは、認識部からの出力であであ
る候補文字及びそれへの距離に基づいて種々の定義が可
能である。
たとえば i番目の文字に対する第2候補への距離d i : i番目の文字に対する第1候補への距離この場合は数値
が大きいほど文字の品質が高いことになる。
(3) ID番号を誤って認識しないように、予めID
番号を印刷したシートを各人が利用するようにしたり、
キーボードから直接入力したり装置の利用のためのパス
ワードやIDカードを設けてこれから得るようにしても
よい。
(4)文字の品質の悪い人を特定するためには第6図の
如き表示ではなく、品質指数にしきい値を設け、それよ
り劣る者についてだけ表示してもよい。その場合、ID
番号のみを表示してもよいし、さらに、IDと筆記者名
を対応可能に記憶し、筆記者名を表示するようにしても
よい。
[発明の効果] 以上説明したように、本発明においては、OCRにより
データ入力する際に、筆記者を一意に特定できるID番
号を同時に記憶し、入力データの文字認識結果に基づい
て筆記者の記入文字の品質評価を行うようにしたので、
これらの結果を随時参照することによって悪事や癖字を
書く傾向にある人を見つけ出すことができるという効果
がある。
従って、そのような人に対して筆記の指導やデータ入力
の禁止を指示することによって、情報処理装置に誤認識
しやすいデータが入力されるのを低減させることができ
る。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、 第2図は本発明の一実施例で用いるファイリング用シー
トを示す図、 第3図は本発明の一実施例のハードウェア構成図、 第4図は本発明の一実施例の文字認識結果と距離の例を
示す図、 第5図は本発明の一実施例の品質指数記憶部のデータ構
造を示す図、 第6図は本発明の一実施例の平均品質指数表示例を示す
図、 第7図は従来の装置におけるファイリングシートを示す
図、 第8図は従来のファイリング装置を示すブロック図であ
る。 101・・・画像データ入力部、 102・・・画像メモリ、 103・・・領域分離部、 104・・・イメージデータ記憶部、 105・・・文字認識部、 106・・・辞書、 107・・・インデックス登録部、 108・・・インデックス検索部、 109・・・インデックス入力部、 110・・・出力部、 111・・・ID番号検出部、 112・・・品質指標計算部、 113・・・品質指標記憶部、 114・・・品質指標参照部、 115・・・参照要求入力部、 301・・・キーボード、 302・・・cpu (中央処理装置)、303・・・
ROM (リードオンリメモリ)、304・・・RAM
 (ランダムアクセスメモリ)、305・・・スキャナ
、 306・・・ハードディスク、 307・・・デイスプレィ、 308・・・バス。 $、、発朗発明実旋イク11にお1↑るファイリングシ
ートの一1列を示す図 第2図 本企朗の一実施例の文字誌溢 系吉呆と距本1のイ列を示す図 第4図 本発明の一実施例の品質a数記11!部のデ゛−タ構を
Σホす図 溶5図 、t−今朝の一実施イダ1の平均品貿4I父の表示例を
ホす図 第6図 ファイリシゲシートの一例を取す図 第7図

Claims (1)

  1. 【特許請求の範囲】 1)手書き文字データに対して文字認識の処理を行なう
    文字認識手段と、 前記手書き文字データの筆記者を登録する登録手段と、 前記手書き文字データの前記認識結果から前記筆記者の
    字のていねいさを表す指標を計算する計算手段と、 前記筆記者と前記指標とを対応可能に記憶する記憶手段
    と、 この記憶手段から随時前記筆記者を前記指標に基づいて
    表示する手段と を備えたことを特徴とする情報処理装置。
JP2321010A 1990-11-27 1990-11-27 情報処理装置 Pending JPH04191992A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2321010A JPH04191992A (ja) 1990-11-27 1990-11-27 情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2321010A JPH04191992A (ja) 1990-11-27 1990-11-27 情報処理装置

Publications (1)

Publication Number Publication Date
JPH04191992A true JPH04191992A (ja) 1992-07-10

Family

ID=18127786

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2321010A Pending JPH04191992A (ja) 1990-11-27 1990-11-27 情報処理装置

Country Status (1)

Country Link
JP (1) JPH04191992A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002278984A (ja) * 2001-03-22 2002-09-27 Fujitsu Ltd 文書管理装置
JP2014211836A (ja) * 2013-04-22 2014-11-13 大日本印刷株式会社 データ管理システム及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002278984A (ja) * 2001-03-22 2002-09-27 Fujitsu Ltd 文書管理装置
JP2014211836A (ja) * 2013-04-22 2014-11-13 大日本印刷株式会社 データ管理システム及びプログラム

Similar Documents

Publication Publication Date Title
JP3427692B2 (ja) 文字認識方法および文字認識装置
KR100339446B1 (ko) 주소 인식 장치 및 주소 인식 방법
CN111753767A (zh) 一种作业自动批改的方法、装置、电子设备和存储介质
KR100249055B1 (ko) 문자인식장치및방법
JP3452774B2 (ja) 文字認識方法
JP2713622B2 (ja) 表形式文書読取装置
JPH0684006A (ja) オンライン手書き文字認識方法
CN111753120A (zh) 一种搜题的方法、装置、电子设备和存储介质
US5909509A (en) Statistical-based recognition of similar characters
JPH04191992A (ja) 情報処理装置
JP2004171316A (ja) Ocr装置及び文書検索システム及び文書検索プログラム
JPH08263587A (ja) 文書入力方法および文書入力装置
JP3979288B2 (ja) 文書検索装置および文書検索プログラム
JP2020181419A (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP3958722B2 (ja) イメージデータ文書検索システム
JP3812719B2 (ja) 文書検索装置
CN112883727B (zh) 一种确定人物间关联关系的方法及装置
US11315351B2 (en) Information processing device, information processing method, and information processing program
JPH0991385A (ja) 文字認識辞書追加方法及びこれを用いた端末ocr装置
JP3924899B2 (ja) テキスト検索装置およびテキスト検索方法
JP4584507B2 (ja) 住所認識装置、記録媒体及びプログラム
JP2962911B2 (ja) 文字認識装置
JP2020181568A (ja) 情報処理装置、情報処理方法及び情報処理プログラム
KR100292352B1 (ko) 형태소 분석을 이용한 인식기의 편집방법
JP2000181989A (ja) 文字認識装置及びその方法並びにその方法をプログラムとして記録したコンピュータ読み取り可能な記録媒体