JPS58112176A - 光学的文字読取装置 - Google Patents

光学的文字読取装置

Info

Publication number
JPS58112176A
JPS58112176A JP56209508A JP20950881A JPS58112176A JP S58112176 A JPS58112176 A JP S58112176A JP 56209508 A JP56209508 A JP 56209508A JP 20950881 A JP20950881 A JP 20950881A JP S58112176 A JPS58112176 A JP S58112176A
Authority
JP
Japan
Prior art keywords
character
pitch
text
vertical projection
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP56209508A
Other languages
English (en)
Inventor
Hiromi Nanba
難波 広海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Tokyo Shibaura Electric Co Ltd filed Critical Toshiba Corp
Priority to JP56209508A priority Critical patent/JPS58112176A/ja
Priority to US06/423,322 priority patent/US4512032A/en
Publication of JPS58112176A publication Critical patent/JPS58112176A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (発明の技術分野) 本発明はワードプロセッサへテキスト(文章)を入力す
るための光学的文字読取装置に関する。
(発明の技術的背景とその問題点) ワードプロセッサへのテキスト入力用光学的文字読取装
置では、通常のタイプライタで印字したテキストを絖み
取る必要がある。一般にタイプライタの文字の印字、、
ピッチは、lOピッチ(1インチ当D10文字の印字)
と12ピツチ(1インチ当り12文字の印字)のいずれ
かである。従来のテキスト入力用の光学的文字読取装置
では、読み取るテキストの印字ピッチを操作員が判断し
、操作パネル上のスイッチによって文字の印字ピッチの
指定をしていた。しかし、これでは操作が煩わしく、シ
かも文字の印字ピッチの指定をまちがえるとラインバッ
ファがら一文字分の文字パターン適切に切抄出せず読取
率が悪くなるという欠点があった。
(発明の目的) 本発明の目的は、テキストの印字ピッチを検出すること
ができる光学的文字読取装置を提供するととKある。
(発明の概要) テキストの1行を光電変換して得た2値化された文字パ
ターンをラインバッファに格納する。
ラインバッファに格納された1行分の文字パターンの垂
直射影をとる。この垂直射影から各文字パターンの中心
位置を求める。ある文字パターンの中心位置から、いく
つか離れた文字パターンの中心位置までの距離を求める
。この距離が予じめlOピッチと12ピツチ用に各々設
定されたある範Hの距離の中に入るか否かで、lOピッ
チであるか12ピツチであるかを判断する。
(発明の実施例) 以下、図面を用いて本発明の一実施例を詳細に説明する
。第1図は本発明の光学的文字読取装置を示すブロック
図である。光電変換部(2)は、図示しない搬送機構に
よって搬送され副走査されているテキストが印字された
帳票に対して、副走査方向く対し直角の方向に主走査を
行ない光電変換して得た信号を2値化し、帳票上の文字
イメージを2値化された文字パターンとして出力する。
ラインバッファ(3)は、テキストの1行分の文字イメ
ージを光電変換して得た2値化された文字パターンを格
納する。認識部(4)は、ラインバッファ(3)から切
り出して得た1文字分の未知の文字パターンと辞書0)
から順次読み出ス標準パターンとのパターンマツチング
認識を行なって、未知の文字パターンが何であるかを認
識し、その結果を文字コードとして出力する。
辞書(1)は、複数の各フォント(字形)ごとに各文字
の標準パターンを格納している。バッファメモリ(5)
は、認識部(荀から出力される文字コードを1時格納す
る。インタフェース部(6)は、バッファメモリ(〜に
格納されている文字コードを外部の装置へ出力する機能
を有する。シフトレジスタ(呻は、OR回路(ηの出力
を入力し、その出力をOR回路(7)の一方の入力端子
及び制御部(9)へ与えている。このシフトレジスタ(
8)の格納できるピット数は、光電変換部C)が主走査
して得た2値化パターンのビット数と同一であることが
必要である。ラインバッファ(3)にテキストの1行分
の2値化された文字パターンが格納された時点で、シフ
トレジスタ(8) K ifラインバッファ(3)K格
納されている文字パターンの垂直射影が形成されている
。垂直射影とは、文字パターンをXY座標軸や第1現象
に置いてY軸方向に光を当てたときX軸に形成される影
のことである。制御部(9)は、光学的文字読取装置全
体の制御をする。ワーキングメモリ(10) ti、l
[御部(3)のワークメモリである。
以下に動作を説明する。帳票に印字されたテキストの1
行分を光電変換して得た文字パターンがラインバッファ
(3) K格納されている状態とシフトレジスタ(8)
K形成され几垂直射影の状態を第5図に示す。フィンバ
ッファ(3)には、“Counter5 ”という文字
パターンが格納されている。シフトレジスタ<8) に
おいて、黒い部分が垂直射影であり、ビット“l”に対
応する。
白い部分は、ビット“0”K対応する。まず制御部(9
)はシフトレジスタ(8)に格納されている全ビットを
読み出してくる。制御部(9)はこの読み出したピッ)
列をサーチしてラインバッファG)に格納されている各
文字パターンの左右端の位置を求める。この位置はライ
ンバッファ(3)の左端を基準として求める。例えばラ
インバッファ(3)の左端に格納された文字パ1ターン
″C”の左端の位置XLl、右端の位置XRIは、第5
図KblJ示した通りである。具体的には、シフトレジ
スタ(8)から読み出したビット列を左からサーチして
一番初めにビット“l#があるのは何ビット目かを計数
する。光電変換の一走査における解像度、即ち1mmf
i炒のビット数を確認しておけば、この計数値から位置
XL1が求まる。
文字パターン“C”の右端は、ビット列を左からサーチ
して一番初めにビット“l”からビット“O”K変わる
位置までのビット数を計数し、解像度から位置XR1を
求める。
以下同様に−)インバッファ(3)の左端を基準とした
各文字パターンの左端と右端の位置、を求める。
次に制御部(9)は、各文字パターンの中心位置XCを
次式によって求める。
XCj = (xa i −XL i ) /2.ただ
しi = 1−n 。
その結果全ての文字パターンについて求めた左端位置、
右端位置、中心位置それぞれの値をワーキングメモリ(
7)に第3図に示すような状態で格納する。
第4図は隣接する文字の垂直射影が分離している場合の
行において、例えば1行中の左黍がら数えて1番目の文
字の中心位置XCiを基準位置とした場合に1行中の左
から数えて第i+(1m−1)番目、第i+fi番目、
第1+(n +1)番目それぞれの文字の中心位置との
関係を10ピツチ及び12ピツチそれぞれの場合につい
て示している。0印は文字を表わし、その中心に縦に引
いた繍は、文字の中心位置を表わしている。タイプされ
た文字は、印字ずれや文字の形状等により左右に多少ず
れることがある。
第41において、このずれは文字の中心から延びた左右
の矢印でその杵容範囲を示している。
この左右のずれを含んだ文字の中心位置が10ピツチと
12ピツチとで重なりあっていなければ、ある定数に、
L、M、Nを設定する仁とにより、次式を用いてlOピ
ッチと12ピツチの判定できる。
即ち、 K≦XC1−1−a−XCi≦L(1)式M≦
X Ci +n −X Ci≦N   (2)式従って
、1行中の左から数えてi番目の文字の中心位置とこの
i番目の文字から数えてn番目の文字の中心位置との距
離が王妃(1)式の条件を満していれば、その行は12
ピツチで印字されていると判定することができる。同様
K(2)式の条件を満せば、その行は10ピツチで印字
されていると判定することができる。
上記(1)式、伐)式において、10ピツチか12ピツ
チかを判定するのに最適なnの値Fi3である。即ち、
ある文字の中心位置とその文字から数えて3番目の文字
の中心位置との距離がある設定した定数に、L、M、N
を用いた上、+r4(1)式または(2式のいずれかの
条件を満しているか否かでlOピッチか12ピツチかを
判断するのが最適である。n=3が最適である理由は、
次の通りである。第4図において、Dとは12ピツチに
おける隣合う文字の位置ずれのない理想状態における中
心位置間の距離であり、具体的にはn=25.4(mm
)+12(個)=2.12(mm)である。また、同様
にCD+g)とはlOピッチにおける隣合う文字の位置
ずれのない理想状態における中心位置間の距離で゛あり
、具体的には(D+g)=25.4(mm)+10 (
僻) =2.54 (mm )である。従ってg;α4
2(ffll1m)である。
n = 3が最適であるということは、この値を用いた
場合が一番誤判定する率が小さいということである。即
ち、第4図において、 D−(n−1)gとngとD−ngの3つの値がそれぞ
れ一番大きくなるとき、特ic n gが大きくなると
きが一番誤判定をしない。この3つの値それぞれが大き
いときがn = 3であるということは第2図に示した
グラフを参照すればよくわかろう第2図には、7=l1
g、 Y=D−11fly=D −(n−1) gの3
つの直線が示されている。この図から文字数が3、即ち
n = 3のときが3つの直線のy座標の位置゛の差が
一番大きくなっていることがわかる。
従って、第5図に示したように隣接する文字の垂直射影
が分離している場合には、ある文字の中心位置を基準と
してそこから3つ目の文字の中心位置までの距離が、n
=3に対応して予じめ設定された定数に、L、M、Nを
上記(1)式と(2)弐に代入し、その条件が満された
か否かで10ピツチか12ピツチかの判定をする。この
ときどの文字を基準としてもよく、また必ずしもn =
 3でなくてもよい。従って、nが色々な値のときKお
ける定数に、L、M、Nを求めて記憶しておく必要があ
る。
第6図に示すように垂直射影の一部が接続している場合
のピッチの判定は次のようKする。
前述と同様に文字パターン“t”の垂直射影の中心位置
XC4と3文字隣りの文字パターン“5#の垂直射影の
中心位置XC7との距離Pがn = 3の場合の上記(
1)式、(乃式の条件を満すか否かで判定する。または
、文字パターン“C”の垂直射影の中心位置XC2と文
字パターン“t ”の垂直射影の中心位置XC4との距
離0がn = 3の場合の上記(1)式、 (2)式の
条件を満すか否かで判定する。
第7図に示すような場合のピッチの判定は次のようにす
る。前述と同様に文字パターン“e″垂直射影の中心位
置と文字パター°ン“5”の垂直射影の中心位置との距
離をn = 2の場合において上記(1)式とC)式を
用いて判定する。また他の方法として、垂直射影の幅か
らもピッチの判定もできるつ例えば第7図の文字パター
ン3つ分の垂直射影が接続しているような場合に有効で
ある。即ち、ある定数B、8.T、Uを設け、nR≦X
R1−XLi≦n 8    C3)式nT≦XR1−
XLi≦n U    (4)式良だし、iとnは正の
整数で、iは1行中の文字の位置即ち、左から数えてい
くつ目の文字であるかを示す。nは文字数である。
(3)式が成立すれば12ピツチ、(4)式が成立すれ
ば1.0ピツチと判定することができる。尚、この場合
にもn == 3が最適であり、換言すれば3文字分の
垂直射影が接続している場合がピッチの判定に最適であ
る。
更に1前述しえいずれの方法でもピッチの判定ができな
い場合がある。一般的に垂直射影が接続する性能性は、
10ピツチより12ピツチの方が嵩いことから、この場
合は12ピツチと暫定的に判定するとよい。
(発明の効果) 文字ピッチの検出ができるので、操作機によるスイッチ
での文字ピッチの指定が不要になるとともKIRfった
文字ピッチの指定が無くなる。
正しい文字ピッチの判定が精度よくできるため、ライン
バッファから一文字分の文字パターンが正確に切抄出せ
るため、読取率が向上する。
【図面の簡単な説明】
第1図は本発明の光学的文字読取装置を示すブロック図
、第2図は第4図に示す”gsD−ng%D−(n−x
)gの関係をグラフ化した図、第3図は第1図に示した
ワーキングメモリの格納内容を示す図、第4図は文字ピ
ッチの判定の原理を示す図、第5図乃至第7図は第1図
に示したラインバッファとシフトレジスタ、の格納内容
を示す図である。 (1)・−・・・・・・辞書 (2>・・・−・・・・光電変換部 O)・・・・・・・・・ラインバッファ(4)−・・・
・・・・認識部 (5)・・・−・・・・バッファメモリ(6)・・・・
・・・・・インタフェース部(7)・・・・・・・・・
OR回路 (8)・・・・・・・・・シフトレジスタ(9)・・・
・・・・・・制御部 (10)・・・・・・ワーキングメモリ(7317) 
 代理人 弁理士 則近憲佑(7801)  代理人 
弁理士 山王 −flS5図 第  6 図 第  7  図 スし3      訃6

Claims (4)

    【特許請求の範囲】
  1. (1)  テキストが印字された帳票を読み取る光学的
    文字m填装置であって、前記帳票上のテキストイメージ
    を光電変換し2値化された量子化パターンを作成する手
    段と、この2値化された量子化パターンからテキストの
    1行以内の垂直射影を作成する手段と、前記作成された
    各量子化パターンに対応する前記作成された各垂直射影
    の中心の座標値を求める手段と、前記作成された垂直射
    影のうち任意の2つの垂直射影の中心位置間距離が定数
    にとLの範囲内にあるか判定する第1の判定手段と、前
    記中心位置間距離が定数MとNO範囲内にあるが判定す
    る第2の4!lJ定手段とを具備し、前記第1及び第2
    の判定結果によりて前記印字されたテキストの文字ピッ
    チがlOピッチか12ピツチかを判定することを特徴と
    する光学的文字読職装置。
  2. (2)前記中心位置間距離は、ある文字の量子化パター
    ンに対応する垂直射影の中心から3つとなりの文字の量
    子化パターンに対応する垂直射影の中心までの距離であ
    るととtl−特徴とする特許請求の範囲第1項記載の光
    学的文字読増装置。
  3. (3)テキストが印字された帳票を読み取る光学的文字
    読取値蓋であって、前記帳票上のテキストイメージを光
    電変換し2値化された量子化パターンを作成する手段と
    、この2値化された量子化パターンからテキス)1行以
    内の垂直射影を作成する手段と、仁の垂直射影のうち複
    数の前記量子化パターンが重なりて作成された垂直射影
    の左右端間距離を求める手段と、この求めた左右端間距
    離が定数Rと8の範囲内にあるか判定する第1の判定手
    段と、前記左右端間距離が定数TとUの範囲内にあるか
    判定する第2の判定手段とを具備し、前虻第1及び第2
    の判定結果によって前記印字されたテキストの文字ピッ
    チがlOピッチか゛12ピッチかを判定することを特徴
    とする光学的文字読取装置。
  4. (4)  前記第1及び第2の判定が不可能であるとき
    12ピツチと判定することを特徴とする特許請求の範囲
    第1項乃至第3項記載の光学的文字11!増装置。
JP56209508A 1981-12-26 1981-12-26 光学的文字読取装置 Pending JPS58112176A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP56209508A JPS58112176A (ja) 1981-12-26 1981-12-26 光学的文字読取装置
US06/423,322 US4512032A (en) 1981-12-26 1982-09-24 Optical character recognition apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56209508A JPS58112176A (ja) 1981-12-26 1981-12-26 光学的文字読取装置

Publications (1)

Publication Number Publication Date
JPS58112176A true JPS58112176A (ja) 1983-07-04

Family

ID=16573955

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56209508A Pending JPS58112176A (ja) 1981-12-26 1981-12-26 光学的文字読取装置

Country Status (2)

Country Link
US (1) US4512032A (ja)
JP (1) JPS58112176A (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4887301A (en) * 1985-06-05 1989-12-12 Dest Corporation Proportional spaced text recognition apparatus and method
DE3783974T2 (de) * 1986-07-11 1993-05-27 Sumitomo Electric Industries Optischer buchstabenleser.
EP0457547B1 (en) * 1990-05-15 2000-04-26 Canon Kabushiki Kaisha Information recognition apparatus and method
JPH04270485A (ja) * 1991-02-26 1992-09-25 Sony Corp 印刷文字認識装置
KR102001191B1 (ko) * 2011-06-30 2019-10-01 구글 엘엘씨 라인을 따른 텍스트 이미지 렌더링
US8400453B2 (en) * 2011-06-30 2013-03-19 Google Inc. Rendering a text image following a line
US8760451B2 (en) 2011-06-30 2014-06-24 Google Inc. Rendering a text image using texture map character center encoding with character reference encoding
JP5508359B2 (ja) * 2011-08-03 2014-05-28 シャープ株式会社 文字認識装置、文字認識方法及びプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3219974A (en) * 1960-11-14 1965-11-23 Control Data Corp Means for determining separation locations between spaced and touching characters
US4292622A (en) * 1980-02-21 1981-09-29 Hendrix Electronics, Inc. System and method for processing horizontal line characteristics in an image
US4377803A (en) * 1980-07-02 1983-03-22 International Business Machines Corporation Algorithm for the segmentation of printed fixed pitch documents
US4365234A (en) * 1980-10-20 1982-12-21 Hendrix Electronics, Inc. Segmentation system and method for optical character scanning

Also Published As

Publication number Publication date
US4512032A (en) 1985-04-16

Similar Documents

Publication Publication Date Title
CA1160347A (en) Method for recognizing a machine encoded character
EP0054439B1 (en) Character segmentation method
US4153897A (en) Method and device for detecting the similarity between standard and unknown patterns
US4513442A (en) Method for locating and circumscribing text areas on a master which may contain text, graphics and/or image areas
EP0552791B1 (en) Apparatus and method for extracting outline data and encoding image data using the outline data
JPS58112176A (ja) 光学的文字読取装置
EP0524797B1 (en) Image processing method and apparatus
AU613013B2 (en) Data acquisition control method and system for a hand held reader
JP2747136B2 (ja) 文字認識装置
JP2957739B2 (ja) 行方向判定装置
JPS59180783A (ja) 光学的文字読取装置
EP0080533B1 (en) Character separating system in use for an optical character reader
JP2578767B2 (ja) 画像処理方法
JP2957740B2 (ja) 行方向判定装置
JPS62290984A (ja) パタ−ン情報入力用紙、及び、該用紙を用いたパタ−ン情報認識方法
JP2578768B2 (ja) 画像処理方法
JPH03141482A (ja) 文字切出し装置
JPS6394385A (ja) 印字文字ピツチ検出装置
JPS5856076A (ja) 光学的文字読取装置
JPS62281094A (ja) パタ−ン情報認識方法
JPH0576673B2 (ja)
JPH04190473A (ja) 光学式文字読取装置
JPS6041396B2 (ja) 宛名検出装置
JPH0782526B2 (ja) 文字ワク検出装置
JPS5864575A (ja) 光学式文字読取装置