JP2538543B2 - 文字情報認識装置 - Google Patents

文字情報認識装置

Info

Publication number
JP2538543B2
JP2538543B2 JP58115036A JP11503683A JP2538543B2 JP 2538543 B2 JP2538543 B2 JP 2538543B2 JP 58115036 A JP58115036 A JP 58115036A JP 11503683 A JP11503683 A JP 11503683A JP 2538543 B2 JP2538543 B2 JP 2538543B2
Authority
JP
Japan
Prior art keywords
character
recognition
character information
information
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58115036A
Other languages
English (en)
Other versions
JPS607586A (ja
Inventor
敬久 藤井
幸和 蕪山
栄一郎 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP58115036A priority Critical patent/JP2538543B2/ja
Publication of JPS607586A publication Critical patent/JPS607586A/ja
Application granted granted Critical
Publication of JP2538543B2 publication Critical patent/JP2538543B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 発明の技術分野 本発明は光学式文字読取認識装置に関するものであ
り、より特定的には漢字を含む異体字及び外字等の間接
的な認識対象文字を認識結果の候補に対応する文字を選
択することにより選択可能とする光学式文字読取認識装
置に関する。
技術の背景及び従来技術と問題点 光学式文字読取認識装置(OCR)は、主として英数字
を対象としたものはすでに数多く用いられている。漢字
を認識し得るようにしたOCRも一部存在するが、一般に
漢字は字体が複雑で個人差が英数字以上存在し認識が難
しい、類似したものが多くその識別が難しい、同じ字で
あっても新旧種々の字体がある等の外、字数も多く、そ
れらが経済的、応答性等の観点から実用的レベルのもの
において自動的な認識のみにより高い認識率を得るもの
はなく、利用者を介在させて最終的に認識判断を行なっ
ているものが多い。
そのような利用者を介在させて装置の認識結果に対し
文字修正を行なうようにした方式の従来のものとして
は、認識結果として複数の候補を抽出しそれらの候補か
ら正解(利用者の所望するもの)を選択する方式、又
は、「音」又は「訓」等の読みを入力し所望の文字を選
択するようにした方式がある。しかしながらいずれも、
認識辞書が登録されていず間接的な認識対象である異体
字、外字等(後述)を入力することが容易に行なえない
という問題点がある。また後者については、同音語につ
いては選択し得ないという問題点がある。また上記異体
字、外字等を直接的な認識対象語として認識辞書を作成
し登録しておくことは認識辞書として登録するには相当
の記憶容量を有し、それらの文字の使用頻度が余り高く
ないことから登録効果が高くなく、さらにそのように認
識辞書を増加させると全体としての認識応答性が低下す
るという観点から、異体字等は直接的な認識対象文字と
していない。
発明の目的 本発明の目的は上記従来技術における問題点を解決し
直接的な認識対象文字はもとより間接的な認識対象文字
としての異体字等を容易且つ効率良く選択し得る文字情
報装置を提供することにある。
発明の構成 本発明においては、光学的に文字情報を入力し該文字
情報をそれに対応する正規の文字として認識する光学式
文字読取認識装置において、予め登録され認識対象とさ
れている文字と意味上の相互関連性を有し、該文字とは
字体の異なる文字を前記認識対象文字と所定の関連をも
って記憶し、或る文字情報の認識により抽出された複数
の前記認識対象文字と共に前記所定の関連する文字を抽
出させ、上記抽出された文字情報を任意に選択し得るよ
うにしたことを特徴とする、文字情報認識装置が提供さ
れる。
発明の実施例 本発明の一実施例について添付図面を参照して下記に
述べる。
第1図は本発明にもとづく文字情報認識装置を図示し
ており、紙葉上の文字情報を光学的に走査し読取る読取
部1、該読取情報を記憶しておく記憶部2、該記憶部に
記憶された読取情報から対象となる文字を認識するため
の認識処理部3、認識結果その他の情報を出力する表示
器4、及び利用者が指示入力を印加するためのキーボー
ド5を有している。
認識処理部3は、バッファ回路31、特徴抽出回路32、
照合回路33、認識辞書部34、間接的認識対象文字選択回
路35、及び間接的認識対象文字連結辞書部36から構成さ
れ図示の如く接続されている。バッファ回路31は記憶部
2から読取情報を抽し一時的に保存しておくものであ
る。ここで読取情報は読取部1で光学的に読取った際所
定の閾値レベルで二値化されたディジタル信号である。
バッファ回路31の読取情報について特徴抽出回路32にお
いてその特徴抽出を行ない、その特徴データについて認
識辞書部34に記憶された特徴データと照合回路33におい
て、例えば距離計算等により最も類似度の高いものから
順に抽出し、それらの特徴データに相当する認識結果と
しての文字情報を表示器4に出力する。
直接的な認識対象語についてはその特徴パターンが認
識辞書として予め認識辞書部34に登録されている。この
登録に際しては特徴パターンを作成するのに比較的手間
がかゝること、その記憶に相当記憶容量を要することな
どから認識の対象とすべき全ての文字情報について認識
辞書の作成、登録を行なわない。このため、例えば認識
辞書部34に登録された直接的認識対象文字「斎」に対し
その異体字としての「齋」、「斉」、或いは直接的認識
対象文字「奈」に対してその異体字として「捺」等を認
識辞書部34に特徴パターンとして登録する代わりに文字
連結辞書部36に直接的認識対象文字に従属するものとし
て登録しておく。この登録は特徴パターンを作成する場
合に比し手間が相当少なくてすみ、記憶容量も著しく少
なくて良い。すなわち間接的に認識対象として登録して
おく。
例えば文字「齋」が読取られ認識する場合について述
べる。特徴抽出回路32はその文字情報について特徴パタ
ーンを抽出する。この特徴パターンについて照合回路33
が認識辞書部34の特徴パターンとを距離計算し最も類似
度の高い直接認識対象文字を抽出する。照合回路33を介
して表示器4に認識すべき読取文字をそのまゝ復元した
文字情報(第2図における符号11で示したもの)と類似
度の高い順から対応する直接認識対象文字(第2図にお
ける符号12で示したもの、より詳細には第3図における
符号121で示した)「斎」、「斉」、「妄」などを表示
する。
利用者はそれらの中に所望の文字があればキーボード
5を介して選択することができる。しかしながら上記例
示においては直接認識対象文字としては登録されていな
い異体字であるから、上記の段階では表示されていな
い。そこで利用者はキーボード5を介して間接認識対象
文字の表示を要求する。
この要求により文字選択回路35が作動し、連結辞書部
36のデータを参照して上記抽出された文字情報と関連あ
る文字情報を第3図符号122で示した如く表示する。候
補1の異体字として所望の文字情報「齋」が見出された
ら利用者はキーボード5を介してそれを指示する。これ
により間接的対象文字が選択される。
直接的対象文字情報と間接的対象文字情報との連結づ
けは任意に行なうことができる。例えば上記例示の如く
「斎」に対して「齋」,「斉」を連結することができる
一方、「斉」が直接的対象文字情報である場合、その文
字情報に対し「斎」,「齋」等を連結することができ
る。これらは相互に字体が似ている文字の場合について
述べたが、直接的対象文字情報と間接的対象文字情報と
の連結づけは、例えば「A」に対して「α」,「2」に
対して「α」等のように自由に設定することができる。
なお、上記の「A」に対する「α」は、相互に意味上の
関連性を有し字体が異なるものである。この連結づけの
場合は、所望の文字を入力させたいとき、意味上の相互
関連性のある文字を入力させることにより、所望の文字
を候補として抽出することができ、それを選択して入力
することができるものである。
本発明の実施に際しては種々の変形形態を採ることが
できる。また本発明における文字情報は、漢字、平仮
名、カタ仮名、英数字等種々の文字情報、図形情報等を
包含するものとする。
発明の効果 以上に述べたように本発明によれば容易且つ効率よく
直接的な認識対象文字はもとより間接的な認識対象文字
を選択することができる。
また本発明によれば、直接的な認識対象文字の数を適
切化し記憶容量の削減と直接的な認識対象文字(一般に
頻度の高いもの)の認識応答性を向上させつつ、比較的
少ない記憶容量で認識対象文字数を増加させることがで
きる。
さらに本発明によれば、音読、訓読などの識別も不要
で且つ、対象文字を確実に選択することができる。
【図面の簡単な説明】
第1図は本発明の一実施例としての文字情報認識装置の
回路図、 第2図は第1図装置によって得られた認識情報の表示例
を示す図、 第3図は第2図の一部を示す表示部、 である。 (符号の説明) 1…読取部、2…記憶部、3…認識処理部、31…入力バ
ッファ、32…特徴抽出回路、33…照合回路、34…認識辞
書部、35…認識対象外文字選択回路、36…認識対象外文
字連結辞書部、4…表示器、5…キーボード。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】光学的に文字情報を入力し該文字情報をそ
    れに対応する正規の文字として認識する光学式文字読取
    認識装置において、 予め登録され認識対象とされている文字と意味上の相互
    関連性を有し、該文字とは字体の異なる文字を前記認識
    対象文字と所定の関連をもって記憶し、 或る文字情報の認識により抽出された複数の前記認識対
    象文字と共に前記所定の関連する文字を抽出させ、上記
    抽出された文字情報を任意に選択し得るようにしたこと
    を特徴とする、文字情報認識装置。
JP58115036A 1983-06-28 1983-06-28 文字情報認識装置 Expired - Lifetime JP2538543B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58115036A JP2538543B2 (ja) 1983-06-28 1983-06-28 文字情報認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58115036A JP2538543B2 (ja) 1983-06-28 1983-06-28 文字情報認識装置

Publications (2)

Publication Number Publication Date
JPS607586A JPS607586A (ja) 1985-01-16
JP2538543B2 true JP2538543B2 (ja) 1996-09-25

Family

ID=14652611

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58115036A Expired - Lifetime JP2538543B2 (ja) 1983-06-28 1983-06-28 文字情報認識装置

Country Status (1)

Country Link
JP (1) JP2538543B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62289383A (ja) * 1986-06-06 1987-12-16 Sumitomo Metal Ind Ltd 高周波溶接装置の溶接電力測定方法
JP2865210B2 (ja) * 1989-12-04 1999-03-08 ソニー株式会社 文字認識装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58192180A (ja) * 1982-05-04 1983-11-09 Comput Basic Mach Technol Res Assoc 文字読取装置

Also Published As

Publication number Publication date
JPS607586A (ja) 1985-01-16

Similar Documents

Publication Publication Date Title
JP3452774B2 (ja) 文字認識方法
KR19980042782A (ko) 문자 인식 장치 및 방법
KR19980018029A (ko) 문자 인식 장치
JPS63182793A (ja) 文字切り出し方式
JPH08263478A (ja) 中国語簡繁体字文書変換装置
JP2538543B2 (ja) 文字情報認識装置
JPH08263587A (ja) 文書入力方法および文書入力装置
JP3727422B2 (ja) 文字認識装置及びその方法
JPH10269204A (ja) 中国語文書自動校正方法及びその装置
JPH09282418A (ja) 認識方式複合化装置および方法
JP4101345B2 (ja) 文字認識装置
JP2002063197A (ja) 検索装置、記録媒体およびプログラム
JPS592191A (ja) 手書き日本語文の認識処理方式
JPS5842904B2 (ja) 手書きカナ・漢字の文字認識装置
JP2640472B2 (ja) 文字認識方法
JP3360030B2 (ja) 文字認識装置および文字認識方法および文字認識方法をプログラムの形で記録した記録媒体
JP3209197B2 (ja) 文字認識装置及び文字認識プログラムを記録した記録媒体
JP2746345B2 (ja) 文字認識の後処理方法
JP3007697B2 (ja) 単語照合装置及び単語照合方法
JP3151866B2 (ja) 英文字認識方法
JPS6095689A (ja) 光学的文字読取装置
JPH0340434B2 (ja)
JPH0922441A (ja) 光学文字読取装置
JPS6061875A (ja) パターン認識装置における標準パターン作成方法
JP2851865B2 (ja) 文字認識装置