JPS59103177A - 名刺読取装置 - Google Patents

名刺読取装置

Info

Publication number
JPS59103177A
JPS59103177A JP57212099A JP21209982A JPS59103177A JP S59103177 A JPS59103177 A JP S59103177A JP 57212099 A JP57212099 A JP 57212099A JP 21209982 A JP21209982 A JP 21209982A JP S59103177 A JPS59103177 A JP S59103177A
Authority
JP
Japan
Prior art keywords
business card
character
dictionary
scanner
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57212099A
Other languages
English (en)
Inventor
Kunio Ono
大野 邦夫
Masahiko Hase
雅彦 長谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP57212099A priority Critical patent/JPS59103177A/ja
Publication of JPS59103177A publication Critical patent/JPS59103177A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 この発明は、名刺に印刷された文字を読み取り、計算機
に入力するための名刺読取装置に関するものである。
名刺の管理は1枚数が多くなると複雑になるため、内容
を計算機に入力し、データベースに登録することにより
検索・管理等が行なわれている。
しかしながら従来は、鍵盤からデータを手操作で入力し
なければならず、この入力作業が複雑であるという欠点
があった。
また、印刷された文字を読み取る装置は既に存在し、漢
字の読み取りが可能なものも検討されているが、名刺に
印刷されている漢字のように各種サイズの文字が混在し
、しかも住所のように5ポイント程度の極めて小さな漢
字の読み取りまでできるものは存在しなかった。
この発明は、各種文字サイズの印刷文字を読み取り、か
つ5ポイント程度の極めて小さな漢字の読み取りを可能
としたことを特徴とし、その目的は、日常よく用いられ
る名刺を読み取ることにある。以下図面についてこの発
明を説明する。
第1図はこの発明の一実施例であって、1は名刺、2は
ズームレンズ付名刺読取スキャナ(以下ズームレンズ付
スキャナという)、3は画像ノくラフツメモリ、4は画
像処理部、5はコード変換部16は印刷漢字識別辞書、
Tはデータ分類部、8は都道府県名識別辞書、9は所属
識別用語辞書、10はキーボードデイスプンイ、11は
名刺データ記憶部である・ これを動作するには1名刺1をズームンンズ付スキャナ
2によりパターン情報として入力し、画像バッファメモ
リ3に蓄積する。この際、ズームンンズ付スキャナ2は
、低倍率とし解像度は1゜本/門程度以上であればよい
名刺1は白黒情報であるから、各画素は、本来ならば1
ビツトでよいのであるが、印刷の濃淡。
紙の種類のばらつきを考慮すると、1バイト程度必要と
なる。また、名刺1の大きさは、約55市×90悶程度
であり、10本/關で画素に分解すると、名刺一枚のパ
ターン情報は、約500にノくイトとなる。したがって
1画像バッファメモリ3はパターン情報のエリアとして
500にバイト必要とする。
次に画像処理部4において、印字領域の抽出を行なう。
これは3つの段階に分類される。まず、第1段階では、
特定の濃度について、名刺1の長辺方向を画像バッファ
メモリ3上で走査し、短辺方向に対する頻度分布を求め
る。その代表的な結果を第2図(b)に示す。大抵の名
刺1は縦書の場合は、第2図(a)のように紙面を縦長
に、横書の場合は(図示せず)、紙面を横長に使うもの
であり、そのため、文字列部分において鋭いピークを持
ち、他の余白部分はバックグランドノイズとなる。バッ
クグランドノイズレベルL以上にスライスレベルを設定
すれば、文字列が文字列を構成する文字の幅で抽出され
る。通常は、この第1段階の操作により文字列が抽出さ
れる。
第2段階として、各文字列を直角方向に画像バッファメ
モリ3上で走査し、第1段階と同様にして頻度分布を求
める。その代表例を第3図に示す。
列と直角方向の頻度分布においても、スライスレベルL
′を設定し、そのレベルと文字列の重なった部分を列か
ら分離して抽出する。その結果、文字に相当する部分が
概略抽出させるが、上下に分がれた文字(例えば「二」
、「前」、「員」等)は同一文字でありながら分離して
抽出されてしまう。
そこで、次の第3段階として印刷されている漢字は、は
V正方形であるということを利用し、抽出された文字部
分を補正する。第4図にその一例を示す。
次に姓名部分の抽出を行なう。これは最もサイズの大き
い文字部分を抽出することにより行なわれる。この際、
肩書部分の分離も同時に行なわれる。その状況を第5図
に示す。
以上の処理で、各文字に対応した文字枠が抽出され、各
文字枠に基づいて文字認識を行なうことが可能となる。
次に、コード変換部5において、印刷漢字識別辞書6を
用い文字認識処理を行なう。この場合、文字読み取りの
マトリクスサイズとして、64×64程度が要求される
ため、前述の処理で切り出された文字枠がマトリクスサ
イズに丁度対応するようにズームンンズ付スキャナ2の
倍率をフットルールし、再走査を行なう。通常はこの段
階で、すべての文字が認識されコード化される。この段
階で、文字列のうちの姓名および姓名の上の小さな文字
で印刷された肩書は分類可能である。
次に、データ分類部7において、識別されコード化され
た文字列の分類を行なう。住所の判定には、都道府県名
識別辞書8を用いる。この辞書には、全国都道府県およ
び主要な市が登録されており、文字列照合を行なうこと
により住所の文字列を識別する。住所が2個所記載され
ている名刺もあるが、これについても辞書を用いること
により、2個所として同定される。
通常、電話番号は、住所の後の「電話」またはr 置J
という文字の後に印刷されている。また、電話番号は、
最初にOで始まる市外局番と市内局番および4桁の加入
者番号から構成され、全桁数は、9〜11桁である。以
上の条件を用い、電話番号を同定することが可能である
次の段階として、所属識別を行なう。通常の名刺1の構
成は、第6図(a)、  (b)のようなものが多い。
これらの図において、Aは姓名、Bは肩書、Cは住所、
Dは電話番号、Eは所属を示している。
もし、この例に該当する文字列構成の名刺であるならば
、この段階以前にA−Dの文字列は、各々姓名、肩書、
住所、電話番号ということで同定される。したがって、
残存する文字タトEが唯一の残存文字列であれば、これ
は所属を示すと推定される。また、所属の文字列には、
一般の企業、官庁。
各種機関の名称として用いられる用語(例えば「・・・
株式会社」、「・・・太字J、r・・・部J、r、、、
課j等)が含まれているのが普通であり、所属識別用語
辞書9によりこれらの用語がマンチすれば、より高い確
率で同定することが可能である。さらに、残った文字列
については「その他のデータ」として分類する。
なお、肩書Bが第6図(C)のように姓名Aの上部にな
い場合もあり得るので、このような場合のために、肩書
B特有の用語(例えば「・・・課長」。
[・・・部長J、r・・・博士」等)を辞書として用意
し、マツチングをとり、一致すれば肩書レコードにする
方法も考えられる。以上のプルセスをまとめると、第7
図のようになる。
なお、以上は一応縦書の場合を想定して書いたが、横書
の場合も全く同様となる。第6図(a)〜(C)に対応
する横書の場合の様式は、第8図(、)〜(e)のよう
になり、横書においてもこのような社章等の図形が印刷
されている場合、これらを自動的に判別し、抽出するこ
とはかなり醋しい。
そのため、図形情報については、キーボートデイスブン
イ10によりオペメータ操作で事前にマスクするのが現
実的な方法である。
OCR辞書で同定できない漢字あるいは誤って認識され
た文字も分類整理する以前に、オベンータにより入力あ
るいは訂正されることが望ましい。
以上2点のオペンータ操作は、第7図においてキーボー
トデイスブンイ10と破線で示しである。
以上分類されたデータは、名刺データ記憶部11におい
て検索・管理し易い形に配列・記憶される。
このような構造になっているので、一般の名刺1をズー
ムVンズ付スキャナ2に入力するだけで名刺データベー
スを作成することができる。
第9図はこの発明の他の実施例で、第1図のズームンン
ズ付スキャナ20代りに、2方向微動台12、自動焦点
ンンズ13を用いたものである。
以上説明したように、この発明は、名刺に印刷された文
字を読み取り、計算機に入力するために必要な文字列を
切り出し、自動的に分類し整理するので、容易Kfデー
タース化等の処理が可能となり、名刺の管理が容易にな
る。
また、この発明は名刺読取スキャナをズームンンズ付ま
たは2方向微動台と自動焦点ンンズ付としたので、名刺
全体の文字列の配置を概略をよんでから、各文字認識の
ための精密処理を順次行なうことができるので、画像バ
ッファメモリの容量を格段と減少できる利点がある。
【図面の簡単な説明】
第1図はこの発明の一実施例の構成を示すブロック図、
第2図(a)、 ’(b)は文字列を抽出する手法の原
理説明のための名刺の平面図と出力信号の波形図、第3
図は文字を切り出すアルゴリズムを示す原理図、第4図
は上下に分離した構造の文字を補正し、文字枠を与える
ことを意味する原理図、第5図は姓名および肩書を分離
し、文字枠を適確に与えることを示す原理図、第6図(
a)〜(e)はEtc 41’の名刺の代表的文字列配
置例を示す図、第7図はこの発明の実施例の処理手順を
まとめた70−チヤト、第8図(a)〜(c)は横書の
名刺の代表的文字列配置例を示す図、第9図はこの発明
の他の実施例の構成を示すブロック図である。 図中、1は名刺、2はズームンンズ刊スキャナ、3は画
像バッフ7メモリ、4は画像処理部、5はコード変換部
、6は印刷漢字識別辞書、Tはデータ分類部、8は都道
府県名識別辞書、9は所属識別用語辞書、10はキーボ
ードディスプレイ、11は名刺データ記憶部、12は2
方向微動台、13は自動焦点ンンズである。 第2図 (a) 名刹の短辺方向 第3図 第5図 員   國 第6図 (a)

Claims (1)

    【特許請求の範囲】
  1. 名刺読取スキャナ、画像バッファメモリ、画像処理部、
    コード変換部、印刷漢字識別辞書、データ分類部、都道
    府県名識別辞書、所属識別用語辞書1名刺データ記憶部
    から構成される名刺読取装置において、前記名刺読取ス
    キャナをズームレンズ付または2方向微動台と自動焦点
    レンズ付としたことを特徴とする名刺読取装置。
JP57212099A 1982-12-04 1982-12-04 名刺読取装置 Pending JPS59103177A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57212099A JPS59103177A (ja) 1982-12-04 1982-12-04 名刺読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57212099A JPS59103177A (ja) 1982-12-04 1982-12-04 名刺読取装置

Publications (1)

Publication Number Publication Date
JPS59103177A true JPS59103177A (ja) 1984-06-14

Family

ID=16616860

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57212099A Pending JPS59103177A (ja) 1982-12-04 1982-12-04 名刺読取装置

Country Status (1)

Country Link
JP (1) JPS59103177A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6363871U (ja) * 1986-10-15 1988-04-27
JPH01113292A (ja) * 1987-10-27 1989-05-01 Map Japan Kk 名刺管理装置
JPH03142694A (ja) * 1989-10-30 1991-06-18 Mitsubishi Electric Corp 文書読取装置
WO2004086292A1 (en) * 2003-03-26 2004-10-07 Motorola Inc Method and device for classifying field types of a digital image

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6363871U (ja) * 1986-10-15 1988-04-27
JPH0521160Y2 (ja) * 1986-10-15 1993-05-31
JPH01113292A (ja) * 1987-10-27 1989-05-01 Map Japan Kk 名刺管理装置
JPH03142694A (ja) * 1989-10-30 1991-06-18 Mitsubishi Electric Corp 文書読取装置
WO2004086292A1 (en) * 2003-03-26 2004-10-07 Motorola Inc Method and device for classifying field types of a digital image

Similar Documents

Publication Publication Date Title
Casey et al. Intelligent forms processing system
US5134669A (en) Image processing system for documentary data
JP2575539B2 (ja) 書類上の金額フィールドの位置特定方法および識別方法
US7421126B2 (en) Method and system for searching form features for form identification
JP4533273B2 (ja) 画像処理装置及び画像処理方法、プログラム
US5237628A (en) System and method for automatic optical data entry
CN101855640B (zh) 尤其是用于移动无线设备的图像分析方法
US7596271B2 (en) Image processing system and image processing method
JPH0221383A (ja) 光学文字読取装置
CN103996055B (zh) 基于影像档案电子资料识别系统中分类器的识别方法
JP2890482B2 (ja) 文書画像再配置ファイリング装置
JPH01279368A (ja) キャラクタデータの転送方式
JPH09223240A (ja) 文書電子化装置
JP3335009B2 (ja) 画像処理方法及び画像処理装置
JPS5947641A (ja) 名刺デ−タベ−ス作成装置
JPS59103177A (ja) 名刺読取装置
JP2002342343A (ja) 文書管理システム
CN1426017A (zh) 一种校对多个电子文件的方法及其系统
JPH08180068A (ja) 電子ファイリング装置
US6678427B1 (en) Document identification registration system
JPH07152856A (ja) 光学的文字読取装置
JP2000331117A (ja) 文書読取システム
JPH0922442A (ja) イメージ・ドキュメント資料の電子管理システム
JPH0743718B2 (ja) マルチメディア文書構造化方式
JPH0589279A (ja) 文字認識装置