JPH055144B2 - - Google Patents
Info
- Publication number
- JPH055144B2 JPH055144B2 JP59139685A JP13968584A JPH055144B2 JP H055144 B2 JPH055144 B2 JP H055144B2 JP 59139685 A JP59139685 A JP 59139685A JP 13968584 A JP13968584 A JP 13968584A JP H055144 B2 JPH055144 B2 JP H055144B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- characters
- type
- unit
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000605 extraction Methods 0.000 claims description 6
- 230000000295 complement effect Effects 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P20/00—Technologies relating to chemical industry
- Y02P20/50—Improvements relating to the production of bulk chemicals
- Y02P20/52—Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts
Landscapes
- Character Discrimination (AREA)
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、文字字種を指定したフイールド(帳
票上の文字枠の連続した部分)に誤つて記入され
た他の字種でも正しく読み取ることが出来る文字
認識装置に関する。
票上の文字枠の連続した部分)に誤つて記入され
た他の字種でも正しく読み取ることが出来る文字
認識装置に関する。
情報処理システムに投入されるデータを光学的
に読み取る端末装置である文字認識装置は、小切
手の口座番号、銀行の口座番号、郵便番号、各種
張票類等の自動読み取り認識装置として、情報処
理技術の発達に伴いその利用範囲が急速に拡大さ
れて来た。
に読み取る端末装置である文字認識装置は、小切
手の口座番号、銀行の口座番号、郵便番号、各種
張票類等の自動読み取り認識装置として、情報処
理技術の発達に伴いその利用範囲が急速に拡大さ
れて来た。
読み取り認識する文字としては、主に印刷され
た文字や手書き文字であり、又文字認識の対象と
しては数字、英字、カナ文字、漢字、署名等があ
る。この様な各種の文字を認識する文字認識装置
は各種各層の人が取り扱うため、取扱いが便利で
しかもどこにでも置ける大きさで構成する必要が
ある。
た文字や手書き文字であり、又文字認識の対象と
しては数字、英字、カナ文字、漢字、署名等があ
る。この様な各種の文字を認識する文字認識装置
は各種各層の人が取り扱うため、取扱いが便利で
しかもどこにでも置ける大きさで構成する必要が
ある。
又その処理においては、より正確にしかも迅速
に文字を認識することが重要な課題であり、この
ような課題を克服した文字認識装置の開発が要望
されていた。
に文字を認識することが重要な課題であり、この
ような課題を克服した文字認識装置の開発が要望
されていた。
上述の様な従来の文字認識装置について、図面
を参照して説明する。
を参照して説明する。
第2図は従来一般に使用されている文字認識装
置のブロツクダイヤグラムを示す。
置のブロツクダイヤグラムを示す。
第2図の文字認識装置は、
規定された様式に沿つて文字を記入する帳票
1、帳票1上の文字を光学的に読取り読取つた文
字パターンの濃度値、或いはコントラスト値を電
気信号に変換する観測部2、 観測部2の出力信号を特徴付けるパラメタの検
出を行う特徴抽出部3、 検出された特徴パラメタにもとづいて文字カテ
ゴリの識別、即ち各フイールドに指定された字種
情報に対応した字種の標準文字パターンを格納す
る辞書を選択し、この選択した辞書に基づいて認
識を行う文字認識部4、 文字カテゴリに属する文字パターンが持つべき
特徴パラメタ(標準文字パターン)が各字種(英
数、数字、片仮名、平仮名等)毎に分類して格納
されている文字認識辞書5、 入力される帳票1のフオーマツトに関する情報
(指定される字種も含む)を記憶しているフオー
マツト情報記憶部6、 から構成されている。
1、帳票1上の文字を光学的に読取り読取つた文
字パターンの濃度値、或いはコントラスト値を電
気信号に変換する観測部2、 観測部2の出力信号を特徴付けるパラメタの検
出を行う特徴抽出部3、 検出された特徴パラメタにもとづいて文字カテ
ゴリの識別、即ち各フイールドに指定された字種
情報に対応した字種の標準文字パターンを格納す
る辞書を選択し、この選択した辞書に基づいて認
識を行う文字認識部4、 文字カテゴリに属する文字パターンが持つべき
特徴パラメタ(標準文字パターン)が各字種(英
数、数字、片仮名、平仮名等)毎に分類して格納
されている文字認識辞書5、 入力される帳票1のフオーマツトに関する情報
(指定される字種も含む)を記憶しているフオー
マツト情報記憶部6、 から構成されている。
入力される帳票1に記入された文字は、観測部
2で電気信号に変換され特徴抽出部3に出力され
る。特徴抽出部3は観測部2が読取り出力する電
気信号から文字を特徴付けるパラメタの検出を行
い文字認識部4に出力する。
2で電気信号に変換され特徴抽出部3に出力され
る。特徴抽出部3は観測部2が読取り出力する電
気信号から文字を特徴付けるパラメタの検出を行
い文字認識部4に出力する。
文字認識部4は文字認識辞書5とフオーマツト
情報記憶部6とにより、フイールドに指定された
文字字種の識別と、特徴パラメタにもとづく文字
カテゴリの識別を行い、これら識別情報により帳
票1に記入された文字を認識しその結果を出力す
る。
情報記憶部6とにより、フイールドに指定された
文字字種の識別と、特徴パラメタにもとづく文字
カテゴリの識別を行い、これら識別情報により帳
票1に記入された文字を認識しその結果を出力す
る。
しかし、帳票1上のフイールドに記入する文字
字種の指定がある文字認識装置で、もし記入者が
誤つて指定以外の文字字種で記入した場合、従来
の装置で読取らせると、誤読又はリジエクトする
と言う問題点があつた。
字種の指定がある文字認識装置で、もし記入者が
誤つて指定以外の文字字種で記入した場合、従来
の装置で読取らせると、誤読又はリジエクトする
と言う問題点があつた。
本発明は、上記問題点を解消した新規な文字認
識装置を実現することを目的とするものであり、
該問題点は、複数の字種を記憶する記憶手段と、
認識した文字の字種を判定し認識する判定・認識
手段とを設けてなる本発明による文字認識装置に
より解決される。
識装置を実現することを目的とするものであり、
該問題点は、複数の字種を記憶する記憶手段と、
認識した文字の字種を判定し認識する判定・認識
手段とを設けてなる本発明による文字認識装置に
より解決される。
即ち、複数の文字が同一の字種で書かれていれ
ば字種を安定して判定出来ることを利用して、帳
票上に記入された文字を認識するために選別され
た複数の候補文字と、記憶されているフオーマツ
ト情報とからフイールド内に書かれた字種の推定
を行い結果を出力することにより、指定された字
種以外の誤つた字種で記入されていても正確に認
識することが可能となる。
ば字種を安定して判定出来ることを利用して、帳
票上に記入された文字を認識するために選別され
た複数の候補文字と、記憶されているフオーマツ
ト情報とからフイールド内に書かれた字種の推定
を行い結果を出力することにより、指定された字
種以外の誤つた字種で記入されていても正確に認
識することが可能となる。
以下本発明の要旨を第1図に示す実施例により
具体的に説明する。
具体的に説明する。
第1図Aは本発明に係る文字認識装置の一実施
例を示すブロツクダイヤグラム、第1図Bは字種
を誤つて記入した帳票の例、第1図Cは第1図B
に示す帳票の認識結果例をそれぞれ示す。
例を示すブロツクダイヤグラム、第1図Bは字種
を誤つて記入した帳票の例、第1図Cは第1図B
に示す帳票の認識結果例をそれぞれ示す。
図中において、aは名前領域、bはフリガナ領
域、cは認識順位領域をそれぞれ示し、全図を通
じて同一記号は同一対象物又は内容を示す。
域、cは認識順位領域をそれぞれ示し、全図を通
じて同一記号は同一対象物又は内容を示す。
本実施例は第2図で説明した従来の構成部分
と、フオーマツト情報記憶部6の出力情報と文字
認識部4からの候補文字を使いフイールド内に書
かれた字種の推定を行う字種判定・認識部7とか
ら構成されている。
と、フオーマツト情報記憶部6の出力情報と文字
認識部4からの候補文字を使いフイールド内に書
かれた字種の推定を行う字種判定・認識部7とか
ら構成されている。
本実施例に使用する帳票1の一部分は第1図B
に示す様に名前領域aとフリガナ領域bからな
り、本帳票1のフオーマツト情報では、フリガナ
領域bは片仮名の記入を指定しているが、平仮名
で記入されることも有り得る旨の情報をフオーマ
ツト情報記憶部6に記憶させて置く。
に示す様に名前領域aとフリガナ領域bからな
り、本帳票1のフオーマツト情報では、フリガナ
領域bは片仮名の記入を指定しているが、平仮名
で記入されることも有り得る旨の情報をフオーマ
ツト情報記憶部6に記憶させて置く。
尚本実施例では間違つて平仮名でフリガナ領域
bに記入した場合とする。
bに記入した場合とする。
この状態で帳票1が入力され、文字認識部4か
ら第1図Cに示す候補文字が認識順位領域cに示
す様な形式で順位を持つて字種判定・認識部7に
出力される。
ら第1図Cに示す候補文字が認識順位領域cに示
す様な形式で順位を持つて字種判定・認識部7に
出力される。
字種判定・認識部7では入力された候補文字を
一定の判定手段、即ち本実施例では、フイールド
内候補文字の全ての文字数の中で数が多い方の字
種で記入されているものと判定する判定手段で判
定する。
一定の判定手段、即ち本実施例では、フイールド
内候補文字の全ての文字数の中で数が多い方の字
種で記入されているものと判定する判定手段で判
定する。
第1図Cに示す候補文字の場合、1位から5位
までの候補文字の全ての文字数15の中で平仮名が
10、片仮名が5であるため、帳票1に記入された
文字は平仮名と判定し、平仮名の候補文字で最上
位にある「ますい」が認識文字として出力され
る。
までの候補文字の全ての文字数15の中で平仮名が
10、片仮名が5であるため、帳票1に記入された
文字は平仮名と判定し、平仮名の候補文字で最上
位にある「ますい」が認識文字として出力され
る。
尚フリガナ領域bの(ま)、(す)、(い)に対す
る侯補文字の選択は、認識順位領域cの(ま)に
対応する侯補文字「ま」、「き」、「キ」、「も」、
「モ」の内、片仮名「キ」、「モ」は削除され、残
り「ま」、「き」、「も」の内一番特徴が近似してい
る文字として「ま」が1位に選択される。以下
(す)、(い)も同様にして選択され、平仮名の侯
補文字で最上位に「ますい」が選出される。
る侯補文字の選択は、認識順位領域cの(ま)に
対応する侯補文字「ま」、「き」、「キ」、「も」、
「モ」の内、片仮名「キ」、「モ」は削除され、残
り「ま」、「き」、「も」の内一番特徴が近似してい
る文字として「ま」が1位に選択される。以下
(す)、(い)も同様にして選択され、平仮名の侯
補文字で最上位に「ますい」が選出される。
以上のような本発明によれば、記入者が指定さ
れた字種に対して誤つた字種で記入しても、正し
く認識出来るため、記入し直しや再入力する手間
が掛からないと言う効果がある。
れた字種に対して誤つた字種で記入しても、正し
く認識出来るため、記入し直しや再入力する手間
が掛からないと言う効果がある。
第1図Aは本発明に係る文字認識装置の一実施
例を示すブロツクダイヤグラム、第1図Bは字種
を誤つて記入した帳票の例、第1図Cは第1図B
に示す帳票の認識結果例、第2図は従来一般に使
用されている文字認識装置のブロツクダイヤグラ
ム、をそれぞれ示す。 図において、1は帳票、2は観測部、3は特徴
抽出部、4は文字認識部、5は文字認識辞書、6
はフオーマツト情報記憶部、7は字種判定・認識
部、をそれぞれ示す。
例を示すブロツクダイヤグラム、第1図Bは字種
を誤つて記入した帳票の例、第1図Cは第1図B
に示す帳票の認識結果例、第2図は従来一般に使
用されている文字認識装置のブロツクダイヤグラ
ム、をそれぞれ示す。 図において、1は帳票、2は観測部、3は特徴
抽出部、4は文字認識部、5は文字認識辞書、6
はフオーマツト情報記憶部、7は字種判定・認識
部、をそれぞれ示す。
Claims (1)
- 【特許請求の範囲】 1 帳票上の文字枠の連続した部分に、指定され
た字種で記入された文字と、指定以外の字種で誤
記入された文字を読み取り認識する文字認識装置
であつて、 複数の字種の文字パターンを格納する文字認識
辞書5と、入力される帳票のフオーマツトに関す
る情報や指定される字種と誤記入される可能性の
ある字種を記憶するフオーマツト情報記憶部6
と、観測部2の出力信号から文字の特徴を抽出す
る特徴抽出部3と、候補文字を認識する文字認識
部4と、字種判定・認識部7より構成され、 文字認識部4では、フオーマツト情報記憶部6
から読出した指定された字種と、誤記入される可
能性のある字種と、特徴抽出部3で抽出した文字
の特徴と、文字認識辞書5に基づいて文字を判定
し、第1位から第n位までの順位をもつて侯補文
字を認識し、字種判定・認識部7に送出され、 字種判定・認識部7では、候補文字の全ての文
字数の中で数の多い字種を記入された字種と判定
し、該字種で候補文字の最上位にある文字を認識
文字として出力することを特徴とする文字認識装
置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59139685A JPS6118080A (ja) | 1984-07-05 | 1984-07-05 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59139685A JPS6118080A (ja) | 1984-07-05 | 1984-07-05 | 文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6118080A JPS6118080A (ja) | 1986-01-25 |
JPH055144B2 true JPH055144B2 (ja) | 1993-01-21 |
Family
ID=15251041
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59139685A Granted JPS6118080A (ja) | 1984-07-05 | 1984-07-05 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6118080A (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63163586A (ja) * | 1986-12-25 | 1988-07-07 | Pentel Kk | 文書認識システム |
JP6798055B1 (ja) * | 2020-03-24 | 2020-12-09 | 株式会社東芝 | 情報処理装置、情報処理方法、プログラムおよび順序情報 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS55140976A (en) * | 1979-04-21 | 1980-11-04 | Nippon Telegr & Teleph Corp <Ntt> | Character selection processing system |
JPS5672782A (en) * | 1979-11-16 | 1981-06-17 | Toshiba Corp | Character read system |
JPS5699583A (en) * | 1980-01-09 | 1981-08-10 | Nippon Telegr & Teleph Corp <Ntt> | Character decision processing system |
-
1984
- 1984-07-05 JP JP59139685A patent/JPS6118080A/ja active Granted
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS55140976A (en) * | 1979-04-21 | 1980-11-04 | Nippon Telegr & Teleph Corp <Ntt> | Character selection processing system |
JPS5672782A (en) * | 1979-11-16 | 1981-06-17 | Toshiba Corp | Character read system |
JPS5699583A (en) * | 1980-01-09 | 1981-08-10 | Nippon Telegr & Teleph Corp <Ntt> | Character decision processing system |
Also Published As
Publication number | Publication date |
---|---|
JPS6118080A (ja) | 1986-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0938057B1 (en) | Mail address reading apparatus and mail sorting apparatus | |
US3996557A (en) | Character recognition system and method | |
JPH055144B2 (ja) | ||
JPS592191A (ja) | 手書き日本語文の認識処理方式 | |
JPS63146187A (ja) | 文字認識装置 | |
JPS6316795B2 (ja) | ||
JP2877380B2 (ja) | 光学的文字読取装置 | |
JPS6074094A (ja) | 文字認識装置 | |
JPS6160184A (ja) | 光学的文字読取装置 | |
JP2677271B2 (ja) | 文字認識装置 | |
JPS63188284A (ja) | 文字読取装置 | |
JP2784004B2 (ja) | 文字認識装置 | |
JPS5668880A (en) | Character reader | |
JP2749425B2 (ja) | 記事抽出方式 | |
JPH04309B2 (ja) | ||
JPS6129976A (ja) | 文字認識方法 | |
JP2578767B2 (ja) | 画像処理方法 | |
JP2000181989A (ja) | 文字認識装置及びその方法並びにその方法をプログラムとして記録したコンピュータ読み取り可能な記録媒体 | |
JPS6174087A (ja) | 単語読み取り装置 | |
JPS6041394B2 (ja) | 文字読取方法 | |
JPS60201486A (ja) | 手書文書読取方法 | |
JPH0420506B2 (ja) | ||
JPS61163477A (ja) | 文字認識装置 | |
JPS6121581A (ja) | 文字認識装置 | |
JPH0475554B2 (ja) |