JP2665226B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP2665226B2
JP2665226B2 JP63014282A JP1428288A JP2665226B2 JP 2665226 B2 JP2665226 B2 JP 2665226B2 JP 63014282 A JP63014282 A JP 63014282A JP 1428288 A JP1428288 A JP 1428288A JP 2665226 B2 JP2665226 B2 JP 2665226B2
Authority
JP
Japan
Prior art keywords
character
line
space
pitch
codes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63014282A
Other languages
English (en)
Other versions
JPH01189789A (ja
Inventor
正之 石上
道義 立川
寛美 石崎
隆邦 嶺脇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP63014282A priority Critical patent/JP2665226B2/ja
Publication of JPH01189789A publication Critical patent/JPH01189789A/ja
Application granted granted Critical
Publication of JP2665226B2 publication Critical patent/JP2665226B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔技術分野〕 本発明は、文字認識装置に係り、特に文字認識装置に
おける原稿の空白部分の処理(スペーシング処理、改行
処理)に関する。
〔従来の技術〕
一般に文字認識装置は、テキスト・イメージからテキ
スト行を切出し、そのテキスト行から文字を切出し、そ
の文字の認識を行う。また、読取り原稿の空間部分は、
スペース文字または空白行として処理する。
しかし、従来の文字認識装置は、文字間空白部分の処
理(スペーシング処理)や行間の空白部分の処理(改行
処理)の際に、空白部分を何文字分または何行分として
扱うかの指定を装置利用者が簡単に行うことができない
ため、認識結果の出力形式の自由度に欠けるなどの問題
があった。
〔目 的〕
本発明の目的は、読取り原稿の空白部分を何文字分ま
たは何行分として扱うかの指定を装置利用が容易に行う
ことができるようにした文字認識装置を提供することに
ある。
〔構 成〕
本発明は文字認識装置において、行間および文字間の
空白部の白画素数をそれぞれ計数する手段と、指定され
た標準文字ピッチおよび標準行ピッチのデータを保持す
る手段と、前記計数手段により計数された行間の空白部
の白画素数と前記標準行ピッチとから該空白部に対応し
た改行コード数を決定する手段と、前記計数手段により
計数された文字間の空白部の白画素数と前記標準文字ピ
ッチとから該空間部に対応したスペースコード数を決定
する手段と、前記決定手段により行間または文字間の空
白部に対して決定された数の改行コードまたはスペース
コードを認識結果の該空白部に対応した位置に挿入する
手段とを設けることを特徴とするものである。
〔実施例〕
以下、本発明の一実施例について図面を用い説明す
る。
第1図は本発明に係る文字認識装置の概略構成図であ
る。1はホストコンピュータとのインターフェイス部、
2は原稿読取り用スキャナとのインターフェイス部、3
は文字切出し処理部、4はテキスト・イメージを格納す
るイメージメモリ、5は文字認識処理を行う認識処理部
である。文字切出し処理部3は行切出し、文字切出しの
ほか装置全体の制御を行うもので、プロセッサ31、プロ
グラムROM32、ローカルメモリ33および認識処理部5と
のインターフェイス部34よりなっている。
動作を説明すると、スキャナにより原稿が読取られ、
そのテキスト・イメージがインターフェイス部2を通じ
て入力し、これはプロセッサ31の制御によりイメージメ
モリ4に格納される。
テキスト・イメージが格納されると、プロセッサ31に
よりテキスト・イメージ上のテキスト行の切出しが実行
され、行切出し情報(位置情報)がローカルメモリ33に
格納される。次にマイクロプロセッサ31によりテキスト
行の文字切出しが行われ、文字切出し情報(位置情報)
がローカルメモリ33に格納される。
マイクロプロセッサ31は、文字切出し情報に基づき、
イメージセンサ4より文字のイメージを読出して認識処
理部5に転送し、文字認識を行わせ、認識処理部5から
認識結果の文字コードを受取ると、それをローカルメモ
リ33に順次格納する。同様の動作により、テキスト・イ
メージ上の文字が順次認識され、認識結果がローカルメ
モリ33に蓄積される。
プロセッサ31は、行切出しの際に行間の空白部の白画
素数(行と行の間隔)Liを計数し、それをローカルメモ
リ33に格納する。またプロセッサ31は、文字切出しの際
に文字間の空白部の白画素数Ciを計数し、それをローカ
ルメモリ33に格納する。
各テキスト行の最後の文字を認識した時に、プロセッ
サ31は当該行に続く行間空間部の白画素数Liを標準行ピ
ッチLpで割算し、その結果N(小数点以下は切捨て)を
当該行間空白部に対応する改行コード(CR)数とし、ロ
ーカルメモリ33に直前の認識結果文字コードに続けてN
個の改行コードを格納する。すなわち、行間の空白部を
N行分の空白行と判断し、それに対応した個数の改行コ
ードを認識結果に挿入する。なお、各行の最後の文字の
次に必ず改行コードが挿入されるが、これは上記N個の
改行コードには含まれない。
また、各文字を認識した時に、プロセッサ31は次の文
字との間の空白部と白画素数Ciを標準文字ピッチで割算
し、その結果(小数点以下は切捨て)Mを当該文字間空
白部に対応したスペースコード(SP)数とし、ローカル
メモリ33に直前の認識結果文字コードに続けてM個のス
ペースコードを格納する。すなわち、文字間の空白部を
M字分の空白文字と判断し、それに対応した個数のスペ
ースコードを認識結果に挿入する。なお、行の先頭の空
白部も文字間の空白部と同様に扱い、行の先頭の文字の
認識の前に同様のスペースコード数の算出、認識結果へ
のスペースコードの挿入を行う。
このようにして、スペースコードおよび改行コードを
挿入した認識結果データがローカルメモリ33に蓄積さ
れ、これはプロセッサ31の制御によりインターフェイス
部1を介してホストコンピュータへ転送される。
なお、標準行ピッチLpおよび標準文字ピッチCpは、装
置利用者によりホストコンピュータを介して任意に指定
されるものである。そのデータはインターフェイス部1
を通じて文字切出し処理部3に入力され、プロセッサ31
の制御によりローカルメモリ33に格納される。
以上説明したプロセッサ31のプログラム処理による機
能を図示すれば第2図のようになる。51はテキスト行の
切出しを行うための手段、52は文字行切出しを行うため
の手段、53は行間空白部の白画素数Liを計数するための
手段、54は文字間空白部の白画素数Ciを計数するための
手段、55は改行コード数Nおよびスペースコード数Mを
算出するための手段、56は決定されたN個の改行コード
またはM個のスペースコードを認識結果に挿入するため
の手段、57は各部の動作制御、イメージメモリ4へのイ
メージ、標準行ピツチと標準文字ピッチのデータ、認識
結果データのローカルメモリ33への格納、認識結果デー
タのホストコンピュータへの転送などの制御を行う手段
である。
次に、前述の文字間空白部の処理(スペーシング処
理)と行間空白部の処理(改行処理)について、具体例
により説明する。
第3図に示すような原稿を与える。図において、●印
は文字イメージである。
この原稿の場合、図示のようなLpおよびCpが指定され
たとすると、最終的に第4図に示す認識結果データが得
られる。第4図中の●印は文字コード、SPはスペースコ
ード、CRは改行コードである。
第3図の原稿中の最初の行では、文字間の空白部の白
画素数C1,C2,C3を標準文字ピッチCpで割算すると、 C1÷Cp≒3 C2÷Cp≒1 C3÷Cp≒1 となる。したがって、スペースコードが最初の文字コー
ドの前に3個、2番目の文字コードの前後に1個、それ
ぞれ挿入される。
また、先頭行と次の行の空白部の白画素数L1を標準行
ピッチLpで割算すると、 L1÷Lp≒1 となる。したがって、最初の行の後に改行コードが1
個、挿入される。
なお、第5図に示すようにCwのピッチで文字イメージ
(●印)が配列したテキスト行の場合、Cp=Cwに指定し
たときは、その認識結果は第6図(a)に示すようにな
る。しかし、同じテキスト行でも、Cp=Cw/2に指定した
ときは、その認識結果は第6図(b)のようになる。行
間空白部についても、同様である。
このように、標準文字ピッチCpと標準行ピッチLpの指
定により、原稿の空白部分の処理(スペーシング処理、
改行処理)の内容を利用者が任意に変更し、望ましい形
式の認識結果出力を得ることができる。
なお、改行コード数またはスペースコード数を求める
割算の結果の小数点以下を切捨てたが、四捨五入を行っ
てもよい。
〔効 果〕
以上の説明から明らかなように、本発明によれば、読
取り原稿の空白部を何文字分のスペース文字または何行
分の空白行として扱うかを、標準文字ピッチまたは標準
行ピッチの指定を通じて利用者が容易に制御し、望まし
い形式でに認識結果を出力できるなどの効果が得られ
る。
【図面の簡単な説明】
第1図は本発明の一実施例に係る文字認識装置の概略構
成図、第2図は第1図中の文字切出し処理部の機能ブロ
ック図、第3図は読取り原稿の一例を示す図、第4図は
第3図の原稿の最終的な認識結果を示す図、第5図はテ
キスト行の一例を示す図、第6図は標準文字ピッチを変
えて第5図のテキスト行を認識した結果を示す図であ
る。 3……文字切出し処理部、 4……イメージメモリ、5……認識処理部、 31……プロセッサ、32……プログラムROM、 33……ローカルメモリ、51……行切出し手段、 52……文字切出し手段、 53,54……計数手段、 55……コード数決定手段、 56……コード挿入手段。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 嶺脇 隆邦 東京都大田区中馬込1丁目3番6号 株 式会社リコー内 (56)参考文献 特開 昭60−153575(JP,A) 特開 昭58−56076(JP,A)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】テキスト・イメージからテキスト行を切出
    し、テキスト行から文字を切出して認識する文字認識装
    置において、行間および文字間の空白部の白画素数をそ
    れぞれ計数する手段と、指定された標準文字ピッチおよ
    び標準行ピッチのデータを保持する手段と、前記計数手
    段により計数された行間の空白部の白画素数と前記標準
    行ピッチとから該空白部に対応した改行コード数を決定
    する手段と、前記計数手段により計数された文字間の空
    白部の白画素数と前記標準文字ピッチとから該空間部に
    対応したスペースコード数を決定する手段と、前記各決
    定手段により行間または文字間の空白部に対して決定さ
    れた数の改行コードまたはスペースコードを認識結果の
    該空白部に対応した位置に挿入する手段とを有すること
    を特徴とする文字認識装置。
JP63014282A 1988-01-25 1988-01-25 文字認識装置 Expired - Lifetime JP2665226B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63014282A JP2665226B2 (ja) 1988-01-25 1988-01-25 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63014282A JP2665226B2 (ja) 1988-01-25 1988-01-25 文字認識装置

Publications (2)

Publication Number Publication Date
JPH01189789A JPH01189789A (ja) 1989-07-28
JP2665226B2 true JP2665226B2 (ja) 1997-10-22

Family

ID=11856735

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63014282A Expired - Lifetime JP2665226B2 (ja) 1988-01-25 1988-01-25 文字認識装置

Country Status (1)

Country Link
JP (1) JP2665226B2 (ja)

Also Published As

Publication number Publication date
JPH01189789A (ja) 1989-07-28

Similar Documents

Publication Publication Date Title
JPH03161873A (ja) データベース構築機能を有する電子フアイリング装置
US6275608B1 (en) Image processing method and apparatus and memory medium
US5854860A (en) Image filing apparatus having a character recognition function
JP2665226B2 (ja) 文字認識装置
JP2001052110A (ja) 文書処理方法、文書処理プログラムを記録した記録媒体及び文書処理装置
JP4281236B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JPH0991385A (ja) 文字認識辞書追加方法及びこれを用いた端末ocr装置
JPH09204511A (ja) ファイリング装置
JP2570571B2 (ja) 光学文字読取装置
JP2512065B2 (ja) 文書ファイル装置
JP2004164376A (ja) 識別コード添付帳票、帳票読取プログラム、及び帳票作成プログラム
JP2005050094A (ja) 光学的文字読取装置
JPH07152856A (ja) 光学的文字読取装置
JP3919390B2 (ja) 文字認識装置
JP2556476B2 (ja) 識別子登録方法
JP3060237B2 (ja) 日本語文字認識装置
JP2002024743A (ja) 画像読取システムおよび画像読取方法
JP2539026B2 (ja) 文字切り出し装置
JPH10198705A (ja) 文書画像処理装置および文書画像処理方法および情報記録媒体
JPH05135150A (ja) 画像処理装置
JP2000182030A (ja) 画像切出し方法及び画像切出し装置
JP2001266069A (ja) 光学式文字読取方法
JPH021354A (ja) 記録装置
JPH02195474A (ja) 名刺情報管理システム
JPS58139281A (ja) 光学的文字読取装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080620

Year of fee payment: 11