JPS607586A - 文字情報認識装置 - Google Patents
文字情報認識装置Info
- Publication number
- JPS607586A JPS607586A JP58115036A JP11503683A JPS607586A JP S607586 A JPS607586 A JP S607586A JP 58115036 A JP58115036 A JP 58115036A JP 11503683 A JP11503683 A JP 11503683A JP S607586 A JPS607586 A JP S607586A
- Authority
- JP
- Japan
- Prior art keywords
- character
- recognition
- characters
- character information
- circuit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
発明の技術分野
本発明は光学式文字読取認識装置に関するものであシ、
よシ特定的には漢字を含む異体字及び外字等の間接的な
認識対象文字を認識結果の候補に対応する文字を選択す
ることによシ選択可能とする光学式文字読取認識装置に
関する・ 技術の背景及び従来技術と問題点 光学式文字読取認識装置(OCR)は、主として英数字
を対象としたものはすでに数多く用いられている。漢字
を認識し得るようにしたOCRも一部存在するが、一般
に漢字は字体が複雑で個人差が英数字以上存在し認識が
難しい、類似したものが多くその識別が難しい、同じ字
であっても新旧種々の字体がある等の外、字数も多く、
それらが経済的、応答性等の観点から実用的レベルのも
のにおいて自動的な認識のみによシ高い認識率を得るも
のはなく、利用者を介在させて最終的に認識判断を行な
っているものが多い。
よシ特定的には漢字を含む異体字及び外字等の間接的な
認識対象文字を認識結果の候補に対応する文字を選択す
ることによシ選択可能とする光学式文字読取認識装置に
関する・ 技術の背景及び従来技術と問題点 光学式文字読取認識装置(OCR)は、主として英数字
を対象としたものはすでに数多く用いられている。漢字
を認識し得るようにしたOCRも一部存在するが、一般
に漢字は字体が複雑で個人差が英数字以上存在し認識が
難しい、類似したものが多くその識別が難しい、同じ字
であっても新旧種々の字体がある等の外、字数も多く、
それらが経済的、応答性等の観点から実用的レベルのも
のにおいて自動的な認識のみによシ高い認識率を得るも
のはなく、利用者を介在させて最終的に認識判断を行な
っているものが多い。
そのような利用者を介在させて装置の認識結果に対し文
字修正を行なうようにした方式の従来のものとしては、
認識結果として複数の候補を抽出しそれらの候補から正
解(利用者の所望するもの)を選択する方式、又は、「
音」又は「訓」等の読みを入力し所望の文字を選択する
ようにした方式がある。しかしながらいずれも、認識辞
書が登録されていす間接的な認識対象である異体字、外
字等(後述)を入力することが容易に行なえないという
問題点がある。また後者については、同音語については
選択し得ないという問題点がある。また上記異体字、外
字等を直接的な認識対象語として認識辞書を作成し登録
しておくことは認識辞書として登録するには相当の記憶
容量を有し、それらの文字の使用頻度が余シ高くないこ
とがら登録効果が高くなく、さらにそのように認識辞書
を増加させると全体としての認識応答性が低下するとい
う観点から、異体字等は直接的な認識対象文字としてい
ない。
字修正を行なうようにした方式の従来のものとしては、
認識結果として複数の候補を抽出しそれらの候補から正
解(利用者の所望するもの)を選択する方式、又は、「
音」又は「訓」等の読みを入力し所望の文字を選択する
ようにした方式がある。しかしながらいずれも、認識辞
書が登録されていす間接的な認識対象である異体字、外
字等(後述)を入力することが容易に行なえないという
問題点がある。また後者については、同音語については
選択し得ないという問題点がある。また上記異体字、外
字等を直接的な認識対象語として認識辞書を作成し登録
しておくことは認識辞書として登録するには相当の記憶
容量を有し、それらの文字の使用頻度が余シ高くないこ
とがら登録効果が高くなく、さらにそのように認識辞書
を増加させると全体としての認識応答性が低下するとい
う観点から、異体字等は直接的な認識対象文字としてい
ない。
発明の目的
本発明の目的は上記従来技術における問題点を解決し直
接的な認識対象文字はもとよシ間接的な認識対象文字と
しての異体字等を容易且つ効率良く選択し得る文字情報
装置を提供することにある。
接的な認識対象文字はもとよシ間接的な認識対象文字と
しての異体字等を容易且つ効率良く選択し得る文字情報
装置を提供することにある。
発明の構成
本発明においては、光学的に文字情報を入力し該文字情
報をそれに対応する正規の文字として認識する光学式文
字読取認識装置において、予め登録され認識対象とされ
ている文字とは異なる文字を前記認識対象文字と所定の
関連をもって記憶し、成る文字情報の認識によシ抽出さ
れた複斂の前記認識対象文字と共に前記所定の関連する
認識対象外文字を抽出させ、上記抽出された文字情報を
任意に選択し得るようにしたことを特徴とする、文字情
報認識装置が提供される。
報をそれに対応する正規の文字として認識する光学式文
字読取認識装置において、予め登録され認識対象とされ
ている文字とは異なる文字を前記認識対象文字と所定の
関連をもって記憶し、成る文字情報の認識によシ抽出さ
れた複斂の前記認識対象文字と共に前記所定の関連する
認識対象外文字を抽出させ、上記抽出された文字情報を
任意に選択し得るようにしたことを特徴とする、文字情
報認識装置が提供される。
発明の実施例
本発明の一実施例について添付図面を参照して下記に述
べる。
べる。
第1図は本発明にもとづく文字情報認識装置を図示して
おシ、紙葉上の文字情報を光学的に走査し読取る読取部
1、該読取情報を記憶しておく記憶部2、該記憶部に記
憶された読取情報から対象となる文字を認識するだめの
認識処理部4、認識結果その他の情報を出力する表示器
4、及び利用者が指示入力を印加するためのキーピード
5を有している。
おシ、紙葉上の文字情報を光学的に走査し読取る読取部
1、該読取情報を記憶しておく記憶部2、該記憶部に記
憶された読取情報から対象となる文字を認識するだめの
認識処理部4、認識結果その他の情報を出力する表示器
4、及び利用者が指示入力を印加するためのキーピード
5を有している。
認識処理部4は、バッファ回路31、特徴抽出回路32
、照合回路33、認識辞書部34、間接的認識対象文字
選択回路35、及び間接的認識対象文字連結辞書部36
から構成され図示の如く接続されている。バッファ回路
31は記憶部2がら読取情報を抽し一時的に保存してお
くものである。
、照合回路33、認識辞書部34、間接的認識対象文字
選択回路35、及び間接的認識対象文字連結辞書部36
から構成され図示の如く接続されている。バッファ回路
31は記憶部2がら読取情報を抽し一時的に保存してお
くものである。
ここで読取情報は読取部1で光学的に読取った際所定ノ
閾値レベルで二値化されたディジタル信号である。、バ
ッファ回路31のa取情報について特徴抽出回路32に
おいてその特徴抽出を行ない、その特徴データについて
認識辞書部34に記憶された特徴データと照合回路33
において、例えば距離計1によシ最も類似度の高いもの
から順に抽出し、それらの特徴データに相当する認識結
果としての文字情報を表示器4に出力する。
閾値レベルで二値化されたディジタル信号である。、バ
ッファ回路31のa取情報について特徴抽出回路32に
おいてその特徴抽出を行ない、その特徴データについて
認識辞書部34に記憶された特徴データと照合回路33
において、例えば距離計1によシ最も類似度の高いもの
から順に抽出し、それらの特徴データに相当する認識結
果としての文字情報を表示器4に出力する。
直接的な認識対象語についてはその特徴・母ターンが認
識辞書として予め認識辞書部34に登録されている。こ
の登録に際しては特徴ノ4ターンを作成するのに比較的
手間がか\ること、その記憶に相当記憶客月゛を要すこ
となどから認識の対象とすべき全ての文字情報について
認識辞書の作成、登録を行なわない。このため、例えば
認識辞書部34に登録された直接的認識対象文字「斎」
に対しその異体字としての「齋」、「斉」、或いは直接
的認識対象文字「奈」に対してその異体字として「捺」
等を認識辞書部34に特徴パターンとして登録する代わ
シに文字連結辞書部36に直接的認識対象文字に従属す
るものとして登録しておく。
識辞書として予め認識辞書部34に登録されている。こ
の登録に際しては特徴ノ4ターンを作成するのに比較的
手間がか\ること、その記憶に相当記憶客月゛を要すこ
となどから認識の対象とすべき全ての文字情報について
認識辞書の作成、登録を行なわない。このため、例えば
認識辞書部34に登録された直接的認識対象文字「斎」
に対しその異体字としての「齋」、「斉」、或いは直接
的認識対象文字「奈」に対してその異体字として「捺」
等を認識辞書部34に特徴パターンとして登録する代わ
シに文字連結辞書部36に直接的認識対象文字に従属す
るものとして登録しておく。
この登録は特徴・ぐターンを作成する場合に比し手間が
相当少なくてすみ、記憶部i)も著しく少なくて良い。
相当少なくてすみ、記憶部i)も著しく少なくて良い。
すなわち間接的に認識対象として登録しておく。
例えば文字「奈」が読取られ認識する場合について述べ
る。%微油出回路32はその文字情報について特徴・ぐ
ターンを抽出する。この特徴・ぐターンについて照合回
路33が認識辞書部34の特徴パターンとを距離計算し
最も類似度の高い直接認識対象文字を抽出する。照合回
路33を介しで表示器4に認識すべき読取文字をそのま
\復元した文字情報(第2図における符号11で示した
もの)と類似度の高い順から対応する直接認識対象文字
(第2図における符号12で示しだもの、よシ詳細には
第3図における符号121で示した)「斎」、「斉」、
「妄」などを表示する。
る。%微油出回路32はその文字情報について特徴・ぐ
ターンを抽出する。この特徴・ぐターンについて照合回
路33が認識辞書部34の特徴パターンとを距離計算し
最も類似度の高い直接認識対象文字を抽出する。照合回
路33を介しで表示器4に認識すべき読取文字をそのま
\復元した文字情報(第2図における符号11で示した
もの)と類似度の高い順から対応する直接認識対象文字
(第2図における符号12で示しだもの、よシ詳細には
第3図における符号121で示した)「斎」、「斉」、
「妄」などを表示する。
利用者はそれらの中に所望の文字があればキー日?−ド
5を介して選択することができる。しかしながら上記例
示においては直接認識対象文字としては登録されていな
い異体字であるから、上記の段階では表示されていない
。そこで利用者はキーボード5を介して間接認識対象文
字の表示を要求する。
5を介して選択することができる。しかしながら上記例
示においては直接認識対象文字としては登録されていな
い異体字であるから、上記の段階では表示されていない
。そこで利用者はキーボード5を介して間接認識対象文
字の表示を要求する。
この要求によシ文字選択回路35が作動し、連結辞書部
36のデータを参照して上記抽出された文字情報と関連
ある文字情報を第3図符号122で示した如く表示する
。候補1の異体字として所望の文字情報「齋」が見出さ
れたら利用者はキー?−ド5を介してそれを指示する。
36のデータを参照して上記抽出された文字情報と関連
ある文字情報を第3図符号122で示した如く表示する
。候補1の異体字として所望の文字情報「齋」が見出さ
れたら利用者はキー?−ド5を介してそれを指示する。
これによシ間接的対象文字が選択される。
直接的対象文字情報と間接的対象文字情報との連結づけ
は任意に行なうことができる。例えば上記例示の如く「
斎」に対してrjlltfJ、r斉」を連結することが
できる一方、「斉」が直接的対象文字情報である場合、
その文字1a報に対し「斎」。
は任意に行なうことができる。例えば上記例示の如く「
斎」に対してrjlltfJ、r斉」を連結することが
できる一方、「斉」が直接的対象文字情報である場合、
その文字1a報に対し「斎」。
「齋」等を連結することができる。これらは相互に関連
ある文字である場合について述べたが、直接的対象文字
情報と間接的対象文字情報との連結づけは例えばrAJ
に対して[αJ、r2Jに対して「α」等のように自由
に設定することができる。
ある文字である場合について述べたが、直接的対象文字
情報と間接的対象文字情報との連結づけは例えばrAJ
に対して[αJ、r2Jに対して「α」等のように自由
に設定することができる。
本発明の実施に際しては種々の変形形態を採ることがで
きる。また本発明における文字情報は、漢字、平仮名、
カタ仮名、英数字等種々の文字情報、図形情報等を包含
するものとする。
きる。また本発明における文字情報は、漢字、平仮名、
カタ仮名、英数字等種々の文字情報、図形情報等を包含
するものとする。
発明の効果
以上に述べたように本発明によれば容易且つ効率よく直
接的な認識対象文字はもとよシ間接的な認識対象文字を
選択することができる。
接的な認識対象文字はもとよシ間接的な認識対象文字を
選択することができる。
また本発明によれば(直接的な認識対象文字の数を適切
化し記憶容量の削減と直接的な認識対象文字(一般に頻
度の高いもの)の認識応答性を向上させつつ、比較的少
ない記憶容量で認識対象文字数を増加させることができ
る。
化し記憶容量の削減と直接的な認識対象文字(一般に頻
度の高いもの)の認識応答性を向上させつつ、比較的少
ない記憶容量で認識対象文字数を増加させることができ
る。
さらに本発明によれば、音読、訓読などの識別も不要で
且つ、対象文字を確実に選択することができる。
且つ、対象文字を確実に選択することができる。
第1図は本発明の一実施例としての文字情報認識装置の
回路図、 第2図は第1図装置によって得られた認識情報の表示例
を示す図、 第3図は第2図の一部を示す表示図、 である。 (符号の説明) 1・・・読取部、2・・・記憶部、3・・・認識処理部
、31・・・入力・ぐッファ、32・・・特徴抽出回路
、33・・・照合回路、34・・・認識辞書部、35・
・・認識対象外文字選択回路、36・・・認識対象外文
字連結辞書部、4・・・表示器、5・・・キーボード。 47
回路図、 第2図は第1図装置によって得られた認識情報の表示例
を示す図、 第3図は第2図の一部を示す表示図、 である。 (符号の説明) 1・・・読取部、2・・・記憶部、3・・・認識処理部
、31・・・入力・ぐッファ、32・・・特徴抽出回路
、33・・・照合回路、34・・・認識辞書部、35・
・・認識対象外文字選択回路、36・・・認識対象外文
字連結辞書部、4・・・表示器、5・・・キーボード。 47
Claims (1)
- 1、光学的に文字情報を入力し該文字情報をそれに対応
する正規の文字として認識する光学式文字読取認識装置
において、予め登録され認識対象とされている文字とは
異なる文字を前記認識対象文字と所定の関連をもって記
憶し、成る文字情報の認識によシ抽出された複数の前記
認識対象文字と共に前記所定の関連する認識対象外文字
を抽出させ、上記抽出さ、れた文字情報を任意に選択し
得るようにしたことを特徴とする、文字情報認識装置0
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58115036A JP2538543B2 (ja) | 1983-06-28 | 1983-06-28 | 文字情報認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58115036A JP2538543B2 (ja) | 1983-06-28 | 1983-06-28 | 文字情報認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS607586A true JPS607586A (ja) | 1985-01-16 |
JP2538543B2 JP2538543B2 (ja) | 1996-09-25 |
Family
ID=14652611
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58115036A Expired - Lifetime JP2538543B2 (ja) | 1983-06-28 | 1983-06-28 | 文字情報認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2538543B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62289383A (ja) * | 1986-06-06 | 1987-12-16 | Sumitomo Metal Ind Ltd | 高周波溶接装置の溶接電力測定方法 |
JPH03175593A (ja) * | 1989-12-04 | 1991-07-30 | Sony Corp | オンライン文字認識装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58192180A (ja) * | 1982-05-04 | 1983-11-09 | Comput Basic Mach Technol Res Assoc | 文字読取装置 |
-
1983
- 1983-06-28 JP JP58115036A patent/JP2538543B2/ja not_active Expired - Lifetime
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58192180A (ja) * | 1982-05-04 | 1983-11-09 | Comput Basic Mach Technol Res Assoc | 文字読取装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62289383A (ja) * | 1986-06-06 | 1987-12-16 | Sumitomo Metal Ind Ltd | 高周波溶接装置の溶接電力測定方法 |
JPH0571357B2 (ja) * | 1986-06-06 | 1993-10-07 | Sumitomo Metal Ind | |
JPH03175593A (ja) * | 1989-12-04 | 1991-07-30 | Sony Corp | オンライン文字認識装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2538543B2 (ja) | 1996-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3452774B2 (ja) | 文字認識方法 | |
Sfikas et al. | Using attributes for word spotting and recognition in polytonic greek documents | |
JPS607586A (ja) | 文字情報認識装置 | |
JPS592191A (ja) | 手書き日本語文の認識処理方式 | |
KR970059977A (ko) | 온라인 문자 인식 방법 및 온라인 문자 인식 장치 | |
JPH09282418A (ja) | 認識方式複合化装置および方法 | |
JP3274014B2 (ja) | 文字認識装置および文字認識方法 | |
JPS5842904B2 (ja) | 手書きカナ・漢字の文字認識装置 | |
JPH0896081A (ja) | 文字認識装置及び文字認識方法 | |
JP2640472B2 (ja) | 文字認識方法 | |
Premaratne et al. | Recognition of printed sinhala characters using linear symmetry | |
JPS6059487A (ja) | 手書文字認識装置 | |
JPS6142083A (ja) | 文字認識装置 | |
JPS6160189A (ja) | 光学的文字読取装置 | |
JP2746345B2 (ja) | 文字認識の後処理方法 | |
JP2677271B2 (ja) | 文字認識装置 | |
Aida-zade et al. | Intelligent reading system based on mobile platform | |
JPS61133487A (ja) | 文字認識装置 | |
JP3138665B2 (ja) | 手書き文字認識方式および記録媒体 | |
JPH06139277A (ja) | 電子辞書装置 | |
JP2002149641A (ja) | 手書文字認識装置、及び手書文字認識プログラムを記録した記録媒体 | |
Kruatrachue et al. | Automatic Thai and English fonts identification without character recognition | |
JP2851865B2 (ja) | 文字認識装置 | |
JP3481850B2 (ja) | 文字認識装置 | |
JPS60138689A (ja) | 文字認識方法 |