JPH0962859A - イメージ読取装置 - Google Patents

イメージ読取装置

Info

Publication number
JPH0962859A
JPH0962859A JP7245265A JP24526595A JPH0962859A JP H0962859 A JPH0962859 A JP H0962859A JP 7245265 A JP7245265 A JP 7245265A JP 24526595 A JP24526595 A JP 24526595A JP H0962859 A JPH0962859 A JP H0962859A
Authority
JP
Japan
Prior art keywords
data
item
image
block
key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7245265A
Other languages
English (en)
Inventor
Takeshi O
斌 王
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP7245265A priority Critical patent/JPH0962859A/ja
Publication of JPH0962859A publication Critical patent/JPH0962859A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Processing Or Creating Images (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 本発明は、項目枠が設定されていない資料
を読み取る際に、キー項目位置を自動判別し、このキー
項目位置に基づいて他の項目を分割して項目別に文字認
識するイメージ読取装置を提供することである。 【解決手段】 CPU2は、読取データ分割処理におい
て、イメージリーダー7により複数の項目データからな
るレコードブロックデータを複数記録した用紙、本実施
の形態では住所録から、そのレコードデータのイメージ
が読み取られると、そのイメージデータを物理行に分割
し、その物理行のデータ行毎に項目ブロック特定部9に
より項目別特徴メモリ11に格納されている各項目特徴
を参照して、キー項目(氏名ブロック)位置を特定し、
このキー項目位置に基づいて一人分の他の項目ブロック
を特定し、その特定した一人分の項目ブロック毎に文字
認識部5により文字列を認識して住所録メモリ12に出
力する処理を実行する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、イメージ読取装置
に係り、詳細には、複数の項目データからなるレコード
データを複数記録した用紙からイメージを読み取って、
その項目別データに認識して記憶するイメージ読取装置
に関する。
【0002】
【従来の技術】従来のパーソナルコンピュータやワード
プロセッサーに接続されるイメージスキャナ等のイメー
ジ読取装置では、例えば、予め罫線で区切られた項目枠
に文字データが印刷された資料を読み取ってデータベー
スとして利用する場合、その資料から読み取ったイメー
ジから項目枠毎に文字列を認識して項目データを取得し
て、データベースを作成することが可能となっている。
【0003】
【発明が解決しようとする課題】しかしながら、このよ
うな従来のイメージ読取装置にあっては、予め罫線で区
切られた項目枠に文字データが印刷された資料を読み取
ってデータベースとして利用する場合、その資料から読
み取ったイメージから項目枠毎に文字列を認識して項目
データを取得するようになっていたため、項目枠が設定
されていない項目データを読み取った場合、イメージ読
み取りによる文字列の認識だけでは、項目間の区別がで
きず、自動的に項目データを取得することができないと
いう問題点があった。
【0004】また、罫線で区切られていない資料をイメ
ージリーダーで読み取らせる場合は、ユーザーが項目枠
を意識してイメージリーダーの読取範囲を設定する等の
操作が必要となり、イメージ読取操作が煩雑になって操
作性を低下させる。
【0005】本発明の課題は、項目枠が設定されていな
い資料を読み取る際に、キー項目位置を自動判別し、こ
のキー項目位置に基づいて他の項目を分割して項目別に
文字認識するイメージ読取装置を提供することである。
【0006】
【課題を解決するための手段】請求項1記載の発明は、
複数の項目データからなるレコードブロックデータを複
数記録した用紙から、そのレコードデータのイメージを
読み取る読取手段と、この読取手段により読み取られた
イメージの内容を文字認識して文字列データを得る文字
認識手段と、この文字認識手段により得られた文字列デ
ータに基づいて、前記レコードデータの中でキーとなる
キー項目データの項目位置を特定する特定手段と、この
特定手段により特定されたキー項目データの位置を基準
にして、前記文字列データを前記各レコードブロックに
分割する分割手段と、この分割手段により分割された個
々のレコードブロック毎に、複数の項目データを抽出し
て、項目別に記憶する記憶手段と、を備えたことを特徴
としている。
【0007】この請求項1記載の発明のイメージ読取装
置によれば、読取手段により、複数の項目データからな
るレコードブロックデータを複数記録した用紙から、そ
のレコードデータのイメージが読み取られると、文字認
識手段により、この読み取られたイメージの内容が文字
認識されて文字列データが得られ、特定手段により、こ
の得られた文字列データに基づいて、前記レコードデー
タの中でキーとなるキー項目データの項目位置が特定さ
れ、分割手段により、この特定されたキー項目データの
位置を基準にして、前記文字列データが前記各レコード
ブロックに分割されると、この分割された個々のレコー
ドブロック毎に、複数の項目データが抽出されて、記憶
手段に項目別に記憶される。
【0008】したがって、罫線の無い資料を読み取る際
に、ユーザーが項目枠を意識してイメージリーダーの読
取範囲を設定する等の操作を必要とすることなく、自動
的に項目データを抽出してデータベースを作成すること
ができる。その結果、イメージリーダーを利用してイメ
ージ読取機能を備えたコンピュータシステムやワードプ
ロセッサー等において、イメージ読取操作時の操作性の
向上とイメージ読取機能の向上を図ることができる。
【0009】
【発明の実施の形態】以下、図1〜図3を参照して本発
明の実施の形態を詳細に説明する。図1〜図3は、本発
明を適用したコンピュータシステムの一実施の形態を示
す図である。まず、構成を説明する。図1は、本実施の
形態のコンピュータシステム1の要部ブロック構成を示
す図である。この図1において、コンピュータシステム
1は、CPU2、入力部3、ROM4、文字認識部5、
認識辞書6、イメージリーダー7、イメージメモリ8、
項目ブロック特定部9、ワークメモリ10、項目別特徴
メモリ11及び住所録メモリ12により構成されてお
り、各部はバス13に接続されている。
【0010】CPU(Central Processing Unit )2
は、ROM4に格納されている各種制御プログラムに従
ってコンピュータシステム1内の各部を制御する中央演
算装置であり、入力部3から入力される項目、数値、数
式等の各種データ処理を実行するとともに、後述する読
取データ分割処理において、イメージリーダー7により
複数の項目データからなるレコードブロックデータを複
数記録した用紙、本実施の形態では住所録から、そのレ
コードデータのイメージが読み取られると、そのイメー
ジデータを物理行に分割し、その物理行のデータ行毎に
項目ブロック特定部9により項目別特徴メモリ11に格
納されている各項目特徴を参照して、キー項目(氏名ブ
ロック)位置を特定し、このキー項目位置に基づいて一
人分の他の項目ブロックを特定し、その特定した一人分
の項目ブロック毎に文字認識部5により文字列を認識し
て住所録メモリ12に出力する処理を実行する。
【0011】入力部3は、ファンクションキー、数値キ
ー、文字キー及び他キーを有し、ユーザーによる各キー
入力操作に応じた各種指示信号をCPU2に出力する。
ROM(Read Only Memory)4は、CPU2が実行する
各種制御プログラム、各種データ処理プログラム及び読
取データ分割処理プログラム等を記憶する。文字認識部
5は、イメージリーダー7により読み取られたイメージ
の文字データを、認識辞書6に格納された辞書データを
参照して認識する文字認識処理を実行する。認識辞書6
は、文字認識部5において文字認識処理を実行する際に
参照するための辞書データを格納する。
【0012】イメージリーダー7は、セットされた読み
取り対象の原稿上を走査されて、イメージを所定の解像
度で読み取ってイメージメモリ8に蓄積する。イメージ
メモリ8は、イメージリーダー7により読み取られたイ
メージデータを記憶するメモリである。
【0013】項目ブロック特定部9は、上記CPU2に
より実行される読取データ分割処理に際して読取イメー
ジデータの文字認識結果から分割される物理行データの
項目ブロックの位置を特定する処理を実行し、その位置
を特定した項目ブロックの内容を、項目別特徴メモリ1
1に格納されている各項目(氏名,住所,電話番号等)
を参照して特定する処理を、ワークメモリ12のメモリ
エリアを利用して実行する。ワークメモリ10は、項目
ブロック特定部9において項目ブロックを特定する処理
を実行する際に、物理行データを展開して処理するメモ
リエリアを形成するメモリである。
【0014】項目別特徴メモリ11は、項目ブロック特
定部9において項目ブロックを特定するのに必要な各項
目の特徴を格納するメモリであり、図中に示すように
(氏名)、(住所)、(電話番号)等の各項目の特徴
(文字ピッチ、文字種、行内での位置、文字数等)を格
納し、例えば、(氏名)では、文字ピッチ:大きく、姓
と名の間にスペースがあり,文字種:漢字と仮名(数字
と記号がない),行内での位置:行の先頭である確立が
大きい,文字数:4文字と5文字が多いを特徴とし、
(住所)では地名や漢字とカタカナと数字で構成される
ことを特徴とし、(電話番号)では半角数値で構成され
ることを特徴とする。
【0015】住所録メモリ12は、上記CPU2により
実行される読取データ分割処理に際して読取イメージデ
ータから分割される物理行データ毎に特定される項目デ
ータ(氏名、住所及び電話番号)を住所録として記憶す
るメモリエリアを形成する。次に、本実施の形態の動作
を説明する。図2に示す住所録をイメージリーダー7に
より読み取って、上記CPU2により実行される読取デ
ータ分割処理について図3に示すフローチャートに基づ
いて説明する。イメージリーダー7により図2に示す住
所録が読み取られ、その読み取ったイメージデータがイ
メージメモリ8に記憶されると、そのイメージメモリ8
に記憶されたイメージデータからデータの有無やデータ
間のスペースの有無等の判別により、図2に示すように
一人目データ、二人目データ、三人目データというよう
に物理行に分割する(ステップS1)。
【0016】そして、項目ブロック特定部9により、そ
の分割した物理行をワークメモリ10に展開して、最初
のデータ行について、その項目間のスペースをチェック
することにより各項目ブロックを認識する(ステップS
2)。次いで、その認識した最初のデータ行の項目ブロ
ック毎にデータをチェックして、氏名ブロックを特定す
る処理を実行する(ステップS3)。このとき、項目別
特徴メモリ11に格納されている(氏名)の特徴とし
て、上記文字ピッチ:大きく、姓と名の間にスペースが
あり,文字種:漢字と仮名(数字と記号がない),行内
での位置:行の先頭である確立が大きい,文字数:4文
字と5文字が多いことに基づいて、氏名ブロックを特定
する。そして、その特定した氏名ブロック内の氏名を文
字認識部5により文字認識する。
【0017】次いで、その物理行の2行目のデータ行の
項目間のスペースをチェックすることにより各項目ブロ
ックを認識し(ステップS4)、データ行が終了したか
否かを判別する(ステップS5)。データ行が終了して
いないと判別した場合は、ステップS3と同様に氏名ブ
ロックを特定する処理を実行し(ステップS6)、氏名
データの有無を判別する(ステップS7)。氏名データ
が無いと判別した場合は、ステップS4に戻って、次の
データ行の認識処理を繰り返し実行する。
【0018】また、氏名データが有ると判別した場合
は、その2番目の氏名データを含むデータ行までのデー
タを文字認識部5により文字認識し、その文字認識結果
を一人分データとして住所録メモリ12に出力し(ステ
ップS8)、2番目の氏名を含むデータ行を先頭として
次の処理へ移行し(ステップS9)、ステップS4に戻
って、次のデータ行を認識する処理を繰り返し実行す
る。
【0019】また、ステップS5において、その物理行
のデータ行が終了したと判別した場合は、そのデータ終
了までのデータを一人分のデータとして住所録メモリ1
2に出力して(ステップS10)、本処理を終了する。
以上の読取イメージ分割処理により、図2に示した住所
録において氏名をキー項目として住所及び電話番号の各
項目データが一人分として抽出されて住所録メモリ12
に出力されて格納される。
【0020】以上のように、本実施の形態のコンピュー
タシステム1では、住所録がイメージリーダー7により
読み取られた場合、その物理行を分割し、その物理行内
のデータ行毎に各項目ブロック位置を認識し、その項目
ブロックの中から氏名ブロックをキーブロックとして抽
出し、この氏名キーブロックに基づいて他の項目ブロッ
クを含む一人分のデータ内容を文字認識して住所録メモ
リ12に出力するようにしたため、図2に示した罫線の
無い住所録を読み取る際に、ユーザーが一人分の項目枠
を意識してイメージリーダー7の読取範囲を設定する等
の操作を必要とすることなく、自動的に一人分の項目デ
ータを抽出して住所録を作成することができる。
【0021】その結果、イメージリーダーを利用したイ
メージ読取機能を備えたコンピュータシステムあるいわ
ワードプロセッサー等において、イメージ読取操作時の
操作性の向上とイメージ読取機能の向上を図ることがで
きる。なお、上記実施の形態では、氏名ブロックの特定
を項目別特徴に基づいて行ったが、項目行の氏名ブロッ
クの行内位置の関係を特定して、座標の比較により氏名
ブロックの有無を決定するアルゴリズムも考えられる。
【0022】
【発明の効果】請求項1記載の発明のイメージ読取装置
によれば、罫線の無い資料を読み取る際に、ユーザーが
項目枠を意識してイメージリーダーの読取範囲を設定す
る等の操作を必要とすることなく、自動的に項目データ
を抽出してデータベースを作成することができる。その
結果、イメージリーダーを利用してイメージ読取機能を
備えたコンピュータシステムやワードプロセッサー等に
おいて、イメージ読取操作時の操作性の向上とイメージ
読取機能の向上を図ることができる。
【図面の簡単な説明】
【図1】本発明を適用したコンピュータシステムの要部
ブロック構成図。
【図2】図1のイメージリーダーにより読み出される住
所録の一例を示す図。
【図3】図1のCPUにより実行される読取データ分割
処理のフローチャート。
【符号の説明】
1 コンピュータシステム 2 CPU 3 入力部 4 ROM 5 文字認識部 6 認識辞書 7 イメージリーダー 8 イメージメモリ 9 項目ブロック特定部 10 ワークメモリ 11 項目別特徴メモリ 12 住所録メモリ 13 バス

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】複数の項目データからなるレコードブロッ
    クデータを複数記録した用紙から、そのレコードデータ
    のイメージを読み取る読取手段と、 この読取手段により読み取られたイメージの内容を文字
    認識して文字列データを得る文字認識手段と、 この文字認識手段により得られた文字列データに基づい
    て、前記レコードデータの中でキーとなるキー項目デー
    タの項目位置を特定する特定手段と、 この特定手段により特定されたキー項目データの位置を
    基準にして、前記文字列データを前記各レコードブロッ
    クに分割する分割手段と、 この分割手段により分割された個々のレコードブロック
    毎に、複数の項目データを抽出して、項目別に記憶する
    記憶手段と、 を備えたことを特徴とするイメージ読取装置。
JP7245265A 1995-08-29 1995-08-29 イメージ読取装置 Pending JPH0962859A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7245265A JPH0962859A (ja) 1995-08-29 1995-08-29 イメージ読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7245265A JPH0962859A (ja) 1995-08-29 1995-08-29 イメージ読取装置

Publications (1)

Publication Number Publication Date
JPH0962859A true JPH0962859A (ja) 1997-03-07

Family

ID=17131116

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7245265A Pending JPH0962859A (ja) 1995-08-29 1995-08-29 イメージ読取装置

Country Status (1)

Country Link
JP (1) JPH0962859A (ja)

Similar Documents

Publication Publication Date Title
JPH0962859A (ja) イメージ読取装置
JP2000029983A (ja) 文書読取装置
JP3825829B2 (ja) 登録情報検索装置及びその方法
JPH08212230A (ja) 文書検索方法及び文書検索装置
JPH0384681A (ja) 名刺情報の入力処理方法
JP3317767B2 (ja) データベース自動作成装置
JPH09160907A (ja) 文書処理装置及び方法
JPH07152856A (ja) 光学的文字読取装置
JPH0991305A (ja) 情報処理方法及び装置
JP3720405B2 (ja) 領域識別装置及び方法
JP2641768B2 (ja) 文章処理装置
JPH0573027A (ja) 個人筆跡辞書作成装置及び個人筆跡辞書を用いた文字出力処理装置
JPH01137383A (ja) 文字認識装置
JPH04286063A (ja) 文書処理装置及び方法
JPH10269311A (ja) 帳票処理単位指定方法
JPH0520300A (ja) 文書処理装置
JPS62229438A (ja) 文書処理装置
JP2682456B2 (ja) 光学文字読取装置
JPH04218885A (ja) 光学的文字読取装置における文字認識方法
JPH07249034A (ja) 文字列抽出処理装置
JPH01103467A (ja) 文書出力方式
JPH02136970A (ja) 英単語検索装置
JPH0338787A (ja) 文字認識処理装置
JPH08263591A (ja) 文字認識装置及び方法
JPH0877168A (ja) 書体情報設定装置