JPH0365588B2 - - Google Patents

Info

Publication number
JPH0365588B2
JPH0365588B2 JP57171716A JP17171682A JPH0365588B2 JP H0365588 B2 JPH0365588 B2 JP H0365588B2 JP 57171716 A JP57171716 A JP 57171716A JP 17171682 A JP17171682 A JP 17171682A JP H0365588 B2 JPH0365588 B2 JP H0365588B2
Authority
JP
Japan
Prior art keywords
character
character type
stored
dictionary
read
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57171716A
Other languages
English (en)
Other versions
JPS5960691A (ja
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed filed Critical
Priority to JP57171716A priority Critical patent/JPS5960691A/ja
Publication of JPS5960691A publication Critical patent/JPS5960691A/ja
Publication of JPH0365588B2 publication Critical patent/JPH0365588B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は光学文字読取装置(以下、OCR)に
関する。特に、ユーザが任意の文字種登録をする
ことができるOCRに関するものである。
〔発明の技術的背景とその問題点〕
OCRは人手を介さず自動的に文字の認識を行
うものであり、必然的に高い読取り精度が要求さ
れる。そのための一手段として、一般に、その読
取対象となる文字フイールドの文字の字体(手書
か、活字か等)や字種(数字か、英字か、カナか
等)を予め指定し、指定された内容に従つて文字
を認識する手法が用いられている。この指定デー
タのことをフオーマツトコントロールデータ
(FC)という。
しかしながら、予め登録されている字種は、例
えば第1図に示すように決められており、ユーザ
において字種を自由に選択できないようになつて
いる。そのためある文字がすでに登録されている
以外の字種として登録したい場合、例えば記号
SAにおける「*」、「¥」の文字を削除し、これ
に代えて「」」の文字を新たに登録し、記号SAと
して登録する文字を第2図に示す如くしたい場合
にはOCRそのものを改良する必要があつた。な
お、N,A,K,SA,SB,SCは字種を示して
おり、Nは数字、Aは英字、Kはカナ文字、SA
〜SCは各種記号類である。
〔発明の目的〕
そこで、本発明はユーザ側においてOCRの改
造等をしなくても字種を任意に登録しうるOCR
を提供することを目的とする。
〔発明の概要〕
各文字ごとにその文字コード及びユーザが指定
する字種を定義するフラグ情報とその文字の標準
パターンの格納されている辞書のアドレスとを一
体的に関連づけてテーブルに登録する。文字認識
のときには、このテーブルを参照して帳票の文字
フイールドに指定されている字種にフラグが立つ
ている文字の標準パターンを読み出し、認識処理
する。各文字に対するユーザによる字種の指定
は、OCRの帳票を読取らせること又はキーボー
ドによる入力によつて前記テーブルに登録する。
〔発明の実施例〕
以下、本発明を図示する実施例に基づいて詳述
する。
第3図に本発明によるOCRの実施例を示す。
この第3図において、図示しない光電変換部によ
り読取られた文字パターンのうち1文字分の量子
化パターン1がパターンメモリ2に入力され、パ
ターンメモリ2はこれを格納する。格納された入
力文字パターン3は次いで認識部4へ送られる。
認識部4は入力文字パターン3と辞書メモリ5
に予め登録されている標準パターンとの比較照合
を行ないマツチング法等により入力文字パターン
を認識し、その読取結果9を出力する。詳細は後
述するが辞書メモリ5は第4図aに示すように、
エントリーテーブル13と辞書部14とから構成
される。辞書部14には、文字認識用の標準パタ
ーンが格納されている。エントリーテーブル13
は、後述する。字種登録用メモリ6は入力された
字種登録データを一時的に格納するメモリであ
る。字種登録データの入力手段としては本OCR
の光電変換部を利用するか、あるいはキーボード
KBを用いるかの手段があるが詳しくは後述の動
作説明で述べる。
制御部11はOCRの認識動作を総括的に制御
するものである。
次に動作を説明する。まず、字種登録データの
入力手段としては上述の通りであるが、当該
OCR自体を利用して第5図に示すような登録用
のシート18を用意し、その記入欄19に新に登
録したい文字を手書又はプリントにより書込んだ
ものを読取る。このシートを利用した方がキーボ
ードKBから直接入力するより便利と考えられる
ので、以下の説明はOCR利用の手法を用いるも
のとする。
まず、ユーザーは、このOCRで読取ることの
できるすべての文字(記号も含む)をどの字種と
して登録したらよいかを決定したら、字種登録用
シート18に記入する。具体的には第5図に示す
ように、記号Aという字種に「+」、「−」、「=」、
「*」、「¥」、「%」という記号を登録したいとき
は、シート18の「記号A」と印刷されている文
字の右側の記入欄19にその文字を記入する。こ
のようにして登録したい文字を記入したシート1
8を本発明のOCRに読取らせる。このときOCR
の読取モードを字種登録モードとする。このモー
ド指定は、操作スイツチ等で行なう。字種登録モ
ードが指定されると、制御部11はこのモード用
の制御を行なう。
即ち、図示しない光電変換部によりシート18
を読取る。こうして読取られて得た文字パターン
は、1文字分ずつパターンメモリ2に格納する。
認識部4はこのパターンメモリ2に格納されたパ
ターンと辞書メモリ5に格納されている標準パタ
ーンとのマツチングを取り、認識結果である文字
コードを字種登録用メモリ6に格納する。この字
種登録メモリ6へ文字コードを格納するとき、各
字種ごとに区別して格納する。制御部11は、字
種登録用メモリ6に格納された文字コードを1つ
ずつ読出して来る。制御部11は、この読出した
文字コードにその文字コードで表わされる文字を
どの字種に登録するかを示すフラグ情報と、その
文字コードで表わされる文字の標準パターンが格
納されている辞書部14のアドレス情報を付加し
てエントリーテーブル13に格納する。エントリ
ーテーブル13の詳細を第4図bに示す。エント
リーテーブル13は、アドレス部15、文字コー
ド部16、字種登録部17から構成されている。
文字コード部16は、字種登録用メモリ6に格納
された文字コードが格納される。アドレス部15
は、文字コード部16に格納された文字コードで
表わされる文字の標準パターンが格納されている
辞書部14のアドレスが格納される。字種登録部
17は、文字コード部16に格納された文字コー
ドで表わされる文字がどの字種に登録されている
かを示すフラグ情報が格納される。この字種登録
部17は7ビツトで構成されており、右側から
各々のビツトは英字A、数字N、カナ文字K、記
号ASA、記号BSB、漢字AKA、漢子BKBの各字種
に対応しており、それぞれのフラグ情報として活
用される。
制御部11が字種登録用メモリ6から、シート
18の2行目の記入欄19の左端に記入された文
字「A」を読取つて得た文字コードを読出したと
する。制御部11はこの文字コードで表わされる
文字「A」が英字として登録されるべきであるこ
とから、字種登録部17に格納する情報として
“0000001”のフラグ情報を作成し、文字コードの
前に接続する。また、文字「A」の標準パターン
が格納されている辞書部14のアドレスを文字コ
ードの後に接続する。こうしてエントリーテーブ
ル13に格納される文字「A」の情報が作成され
る。次に制御部は、この作成された情報をエント
リーテーブル13に格納する。以下同様に制御部
11は、字種登録用メモリ16から順次文字コー
ドを読出し、フラグ情報とアドレスを付加してエ
ントリーテーブル13に格納する。この動作がす
べての文字コードに対して行なわれると字種の登
録が終了する。
このようにして字種登録がされたOCRの具体
的動作を説明する。今、フオーマツトコントロー
ルデータで数字の字種が指定されている文字フイ
ールドに記入された文字のパターンが認識部4に
入力されたとする。認識部4はエントリーテーブ
ル13を参照し、字種登録部17の右端のビツト
が“1”となつている文字コードのアドレスをア
ドレス部15から読出す。認識部4は、この読出
したアドレスを用いて字種が数字と登録されてい
る文字の標準パターンを辞書部14から読出し、
マツチングを取る。
〔発明の効果〕
ユーザーがOCRの改造を必要とせずに、文字
に対する字種の指定が任意にできる。これによ
り、帳票の文字フイールドにユーザー仕様に合つ
たきめの細い読取字種の指定ができ、読取り精度
が向上する。
【図面の簡単な説明】
第1図は文字の字種を示す説明図、第2図は特
定の新字種の例を示す説明図、第3図は本発明に
よるOCRの一実施例を示すブロツク図、第4図
aは辞書メモリの構成例を示す説明図、bはエン
トリーテーブルを示す説明図、第5図は字種登録
用の登録シートの例を示す説明図である。 3……入力文字パターン、4……認識部、5…
…辞書メモリ、6……字種登録用メモリ、11…
…制御部、13……エントリーテーブル、14…
…辞書部。

Claims (1)

  1. 【特許請求の範囲】 1 読取対象である各文字ごとに標準パターンが
    格納される辞書と、 前記読取対象である各文字に対して任意の字種
    を登録するための字種登録手段と、 前記読取対象である各文字ごとに、前記字種登
    録手段によつて登録された字種と、前記辞書にお
    ける標準パターンが格納されているアドレス情報
    とを対応付けて格納し、前記各文字と字種との対
    応関係が前記字種登録手段により変更可能とされ
    た格納手段と、 前記辞書に格納されている標準パターンを用い
    て文字認識する認識部とを具備し、 前記文字認識を行う際に指定された字種に対応
    する、前記格納手段に格納された前記登録字種の
    各文字についての前記アドレス情報で位置付けら
    れた標準パターンを前記辞書から読み出すことを
    特徴とする光学文字読取装置。 2 前記字種登録手段を、キーボードとして構成
    することを特徴とする特許請求の範囲第1項記載
    の光学文字読取装置。 3 文字を読み取るための読取手段をさらに具備
    し、 前記字種登録手段を、前記読取手段と兼用した
    ことを特徴とする特許請求の範囲第1項記載の光
    学文字読取装置。
JP57171716A 1982-09-30 1982-09-30 光学文字読取装置 Granted JPS5960691A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57171716A JPS5960691A (ja) 1982-09-30 1982-09-30 光学文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57171716A JPS5960691A (ja) 1982-09-30 1982-09-30 光学文字読取装置

Publications (2)

Publication Number Publication Date
JPS5960691A JPS5960691A (ja) 1984-04-06
JPH0365588B2 true JPH0365588B2 (ja) 1991-10-14

Family

ID=15928345

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57171716A Granted JPS5960691A (ja) 1982-09-30 1982-09-30 光学文字読取装置

Country Status (1)

Country Link
JP (1) JPS5960691A (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63782A (ja) * 1986-06-20 1988-01-05 Ricoh Co Ltd パタ−ン認識装置
JPS63158679A (ja) * 1986-12-23 1988-07-01 Matsushita Electric Ind Co Ltd 文字認識装置
JPH07117994B2 (ja) * 1988-02-10 1995-12-18 沖電気工業株式会社 文字認識後処理方法
JP5239419B2 (ja) * 2008-03-14 2013-07-17 オムロン株式会社 文字認識プログラム、文字認識電子部品、文字認識装置、文字認識方法、およびデータ構造

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS556642A (en) * 1978-06-29 1980-01-18 Fujitsu Ltd Character recognition unit

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS556642A (en) * 1978-06-29 1980-01-18 Fujitsu Ltd Character recognition unit

Also Published As

Publication number Publication date
JPS5960691A (ja) 1984-04-06

Similar Documents

Publication Publication Date Title
US4727511A (en) Multitype characters processing method and terminal device
JPH0330177B2 (ja)
JPH0365588B2 (ja)
JP2740335B2 (ja) 自動セル属性判定機能を有する表読取装置
JPH0256053A (ja) 文書作成装置
JPS6010348B2 (ja) 半角・全角文字の自動変換方式
JP2634926B2 (ja) かな漢字変換装置
JP2629040B2 (ja) 日本語処理システム
JPS595335A (ja) 日本語入力装置
JPS59100941A (ja) 仮名漢字変換装置
JPS5972511A (ja) 一般コ−ドによる特殊コ−ド入力装置
JPS6385593A (ja) ワ−ドプロセツサ
JP3273778B2 (ja) 仮名漢字変換装置及び仮名漢字変換方法
JP2988046B2 (ja) かな漢字変換装置
JPH0689275A (ja) 文書作成装置
JPH0357506B2 (ja)
JPS5896376A (ja) 日本語入力装置
JPS6120176A (ja) ロ−マ字−中国語変換装置
JPS62119665A (ja) ワ−ドプロセツサ
JPS62125426A (ja) データ入力装置
JPH06103419A (ja) 単語辞書編成方式
JPS60207948A (ja) カナ漢字変換処理装置
JPS59231585A (ja) 電子機器
Daneliuk et al. Computer processing of non-Roman scripts
JPH0527117B2 (ja)