JPS62290986A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS62290986A
JPS62290986A JP61134094A JP13409486A JPS62290986A JP S62290986 A JPS62290986 A JP S62290986A JP 61134094 A JP61134094 A JP 61134094A JP 13409486 A JP13409486 A JP 13409486A JP S62290986 A JPS62290986 A JP S62290986A
Authority
JP
Japan
Prior art keywords
radical
character
standard feature
feature value
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61134094A
Other languages
English (en)
Inventor
Yutaka Ota
裕 大田
Yasushi Nishimura
康 西村
Tetsuo Tomimoto
富本 哲雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP61134094A priority Critical patent/JPS62290986A/ja
Publication of JPS62290986A publication Critical patent/JPS62290986A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 3、発明の詳細な説明 産業上の利用分野 本発明は漢字を認識対象文字とした文字認識装置に関す
るものである。
従来の技術 近年、漢字の文字読み取り装置は入力文字から特徴抽出
した特徴値と予め装置に記憶した各文字の標準文字の特
徴値とを照合し、合致度の大きい文字を読み取り結果と
して出力している。さらに文字読み取り装置に文字の読
み取りの識別力を持たせるため、入力された文字画像を
複数部分に分割して各部分ごとに特徴抽出した特1衣値
と、予め文字読み取り装置に記憶しておいた各部分ごと
の標準文字の特徴値と照合し、各部の照合結果の実質的
な総和である合致度を各文字ごとに算出し、合致度の大
きい文字を読み取り結果として出力している。
発明が解決しようとする問題点 しかしながら上記のような構成では、同じ部首に属する
文字のように共通な部分を持つ文字、たとえば「薬」と
c葉」や「烏コと「島」などの識別が困難であるという
問題があるので、部首など共通部分を持つ文字が多い漢
字の読み取り装置において読み取り精度向上が困難であ
るという問題点を有していた。これはつぎの理由による
共通な部分を持つ文字の識別は残りの共通でない部分で
識別する必要がある。つまり、文字読み取り装置におい
て共通な部分を持つ文字は、複数の部分に分割した文字
画像のうち共通部分でない部分で得られた特徴値の差異
によって識別しなくてはならない。しかしながら各文字
ごとに標準文字の特徴値を認識辞書として持つ文字読み
取り装置では共通な部分についての標準文字の特徴値が
異なるので共通な部分についての照合結果が文字ごとに
異なる。そして、この差異が各文字の照合結果に加算さ
れるので、共通でない部分で得られた特徴値の差異だけ
を取り出すことができないからである。
本発明は上記問題点に迄み、同じ部首に属する文字のよ
うに共通な部分を持つ文字の識別を安定に実現する文字
認識装置を提供するものである。
問題点を解決するための手段 上記問題点を解決するために本発明の文字認識装置は、
認識対象文字のうち同じ部首に属する文字のように共通
な部分を持つ文字についてどの部分が共通であるかの情
報を格納した部首情報記憶手段と、部首などの共通な部
分について共通部分を持つ漢字の標準特徴値を参照して
部首などの共通な部分についての標準特徴値を算出する
部首標準特徴算出手段と、認識対象文字のうち同じ部首
に属する文字のように共通な部分を持つ文字の共通部分
について前記部首標準特徴値算出手段より出力される部
首などの共通な部分についての標準特徴値を用いて入力
文字との照合処理をするように更新標準特徴値を出力す
る認識辞書更新装置を具備するという構成を備えたもの
である。
作用 本発明は上記した構成によって同じ部首に属する文字の
ように共通な部分を持つ文字について、共通な部分の標
準文字の特徴値として部首標準特徴算出手段から出力さ
れる部首標準特徴値を共通に使用し、共通でない部分の
標準文字の特徴値として予め各文字ごとに格納されてい
た標準文字の特徴値を使用する。したがって、同じ部首
に属する文字のように共通な部分を持つ文字、たとえば
「薬」と「葉」や「烏」と「島」などの識別における入
力文字と予め装置に格納された標準文字との照合におい
て、共通な部分の照合結果は入力文字から特徴抽出され
た特徴値と共通部分の部首標準特徴値との照合処理によ
って得られ、共通でない部分の照合結果は入力文字から
特徴抽出された特徴値と各文字の共通でない部分の標準
特徴値との照合処理によって得られる。各文字の照合結
果は共通な部分の照合結果と共通でない部分の照合結果
との実質的な加算により得られるが、共通部分について
は同じ部首標準特徴値との照合結果となるので、共通で
ない部分の照合結果の差だけが各文字の標準文字との照
合結果の差として出力される。したがって、本発明の文
字読み取り装置は同じ部首に属する文字のように共通な
部分を持つ文字についての識別力を得ることとなる。
実施例 以下本発明の一実施例の文字認識装置について、図面を
参照しながら説明する。
第1図は本発明の一実施例における文字読み取り装置の
ブロック図を示すものである。第1図において、1は観
測手段、2は特徴抽出手段、3は部首情報入力手段、4
は部首情報記憶手段、5は第1認識辞書記憶手段、6は
部首標準特徴値算出手段、7は認識辞書更新手段、8は
第2認識辞書記憶手段、9は識別手段、10は候補文字
判定手段、11は入力文字の画像信号、12は入力文字
の特徴値、13は漢字の部首情報、14は標準特徴値、
15は部首標準特徴値、16は更新標準特徴値、17は
照合結果信号、18は文字コードである。
以上のように構成された文字読み取り装置について、以
下第1図及び第2図、第3図、第4図、第5図を用いて
その動作を説明する。
まず観測手段1で紙に記録された文字を光学的に読み取
り光電変換回路で電気的な信号に変換した入力文字の画
像信号11を得る。特徴抽出手段2は入力文字の画像信
号11を入力として特徴抽出を行ない入力文字の特徴値
12を出力する。第2図は第1図の特徴抽出手段2とし
て使用した文字線の横交差数を求める特徴抽出の説明図
であり、入力文字画像201を上・中・下の3部に分割
してそれぞれ2個の特徴値を得、合計6個の入力文字の
特徴値202を得ている。また、第1図の第1認識辞書
記憶手段5には各認識対象文字の標準特徴値14を格納
している。第3図は第1図の第1認識辞書記憶手段5に
格納された標準特徴値14の説明図であり、「薬」の標
準文字から求めた6個の標準特徴値301と「葉」の標
準文字から求めた6個の標準特徴値302を示している
。さて、第1図のおいて部首情報記憶手段4には同じ部
首に属する文字のように共通な部分を持つ文字について
どの部分が共通かを部首情報入力手段3により予め入力
して格納しておく。部首標準特徴算出手段6は部首など
共通な部分についてのそれぞれの部首などの共通部分を
持つ文字の標準特徴値の相加平均を算出し部首標準特徴
値15として出力する。認識辞書更新手段7は部首情報
記憶手段4を参照して各文字の各部分について、その部
分がいずれかの部首などの共通部分に属していれば部首
標準特徴値15を更新標準特徴値16として出力し、属
していなければそれぞれの文字の標準特徴値14を更新
標準特徴値16として出力する。そして、第2認識辞書
記録手段8は更新標準特徴値16を格納する。第4図は
第1図の更新標準特徴値16の説明図であり401は「
薬」の更新標準特徴値であり402は「葉」の更新標準
特徴値である。401と402のc、 、C!、C:l
、C−について説明する。「薬」と「葉」の上部(くさ
かんむりの部分)と下部が同じ文字線形状をしているこ
とが部首情報記憶手段に格納されているとき、部首標準
特徴算出手段は第3図で示した「葉」と「葉」の標準特
徴値301.302の上部と下部にあたる部分について
それぞれ平均を求めて部首標準特徴値を出力する。つま
り、A。
とB+の相加平均であるC1を、A2とB2の相加平均
であるC2を、A、とB3の相加平均であるC1を、A
4とB4の相加平均であるC4を出力する。認識辞書更
新手段は前記部首情報記憶手段に格納された漢字の部首
情報を参照して「薬」と「葉」の上部と下部が同じ文字
線形状をしていることを与えられ、「薬」と「葉」の上
部と下部については部首標準特徴値C+ 、Cz 、C
s 、Chを更新標準特徴値として出力している。つぎ
に、401と402のA3、]13+、A4、Baにつ
いて説明する。前記認識辞書更新手段は前記部首情報記
憶手段に格納された漢字の部首情報を参照して「薬」と
「葉」の中部が同じ部首でないことを与えられ、「薬」
と「葉」の中部については「薬」と「葉」それぞれの文
字の標準特徴値つまり第3図におけるA3 、Aa 、
B2 、Baを更新標準特徴値として出力している。さ
て、第5図は、識別手段による照合処理の説明図である
。第2図の入力文字の特徴値202と第4図の「薬」と
「葉」それぞれの文字の更新標準特徴値401.402
との照合処理として各部分での差の絶対値を求めたもの
が第5図の501.502である。各文字ごとに各部の
照合結果の和を照合結果信号それぞれ503.504と
して出力する。照合結果信号503.504は各対象文
字の標準文字と入力文字の不一致度に相当しており、第
1図の候補文字判定手段10は照合結果信号17の小さ
い文字を読み取りの候補文字とじて出力する。
以上のように、部首情報記憶手段4を参照して各文字の
各部分について、その部分がいずれかの部首などの共通
部分に属していれば部首標準特徴値15を更新標準特徴
値16として出力し、属していなければそれぞれの文字
の標準特徴値14を更新標準特徴値16として出力する
認識辞書更新手段7を設けることにより、「薬」と「葉
」の照合結果信号503.504の差には「薬」と「葉
」の共通部分でない中部の入力文字と標準文字の照合結
果の差のみが反映しており、「薬」と「葉」の差異を強
調し識別力を高めた文字認識を可能にすることができる
なお、本実施例において特徴抽出手段2は横交差数とし
たが本発明の特徴抽出手段はこの特徴に限るものでなく
、特徴抽出手段2は文字画像を分割して各部分ごとに特
徴を求めることができる特徴抽出であればいずれの特徴
抽出でもよい。
また、本実施例において標準特徴値14及び部首標準特
徴値15、更新標準特徴値16は標準文字1文字の特徴
値としたが、複数の文字の平均値を標準特徴値としても
よいし複数の文字の平均値と標準偏差を標準特徴値とし
てもよい。とくに複数の文字の平均値と標準偏差を標準
特徴値として用いた場合、本実施例における「薬」と「
葉」の上部(くさかんむりの部分)および下部について
、「薬」と「葉」の両方の文字の平均と標準偏差を求め
たことになり、「薬」と「葉」の上部および下部の入力
文字の特徴値の変動に対して安定な読み取りを可能にす
る効果が得られる。しかも「薬」と「葉」の差異を強調
し識別力を高めた効果は失わないという優れた効果であ
る。
発明の効果 以上のように本発明は認識対象文字のうち同じ部首に属
する文字のように共通な部分を持つ文字についてどの部
分が共通であるかの情報を格納した部首情報記憶手段と
、部首などの共通な部分についての標準特徴値である部
首標準特徴値を算出する部首標準特徴算出手段と、認識
対象文字のうち同じ部首に属する文字のように共通な部
分を持つ文字の共通部分について前記部首標準特徴値を
更新標準特徴値として出力する認識辞書更新装置を設け
ることにより、同じ部首に属する文字のように共通な部
分を持つ文字、たとえば「薬」と「葉」や「鳥」と「島
」などの識別力を高めることができる。
しかも次のような効果も奏する。各部首の標準特徴値を
複数の認識対象文字の特徴値から算出するので部首が字
形変形した文字の読み取り率を向上させることができる
【図面の簡単な説明】
第1図は本発明の一実施例における文字認識装置のブロ
ック図、第2図は第1図の特徴抽出手段の説明図、第3
図は第1図の標準特徴値物の説明図、第4図は第1図の
更新標準特徴値拝の説明図、第5図は第1図の識別手段
今の説明図である。 1・・・・・・観測手段、2・・・・・・特徴抽出手段
、3・・・・・・部首情報入力手段、4・・・・・・部
首情報記憶手段、5・・・・・・第1認識辞書記憶手段
、6・・・・・・部首標準特徴値算出手段、7・・・・
・・認識辞書更新手段、8・・・・・・第2認識辞書記
憶手段、9・・・・・・識別手段、10・・・・・・候
補文字判定手段、11・・・・・・入力文字の画像信号
、12・・・・・・入力文字の特徴値、13・・・・・
・漢字の部首情報、14・・・・・・標準特徴値、15
・・・・・・部首標準特徴値、16・・・・・・更新標
準特徴値、17・・・・・・照合結果信号、18・・・
・・・文字コード。 代理人の氏名 弁理士 中尾敏男 ほか1名第2図 第 3 図 、307         .302 第4図 第 5 図

Claims (1)

    【特許請求の範囲】
  1. 入力文字を観測し入力文字の画像信号を出力する観測手
    段と、前記観測手段より出力される前記入力文字の画像
    信号に応答した入力文字の特徴値を出力する特徴抽出手
    段と、認識対象漢字がいずれの部首に属するかを知らせ
    る漢字の部首情報を入力する部首情報入力手段と、前記
    漢字の部首情報を格納する部首情報記憶手段と、認識対
    象文字についてそれぞれ標準文字の特徴値である標準特
    徴値を格納している第1認識辞書記憶手段と、前記部首
    情報記憶手段より出力される前記漢字の部首情報を参照
    し前記第1認識辞書記憶手段に格納された前記標準特徴
    値のうち同じ部首に属する漢字の前記標準特徴値より算
    出した部首標準特徴値を出力する部首標準特徴値算出手
    段と、各認識対象文字ごとに前記部首情報記憶手段より
    出力される前記漢字の部首情報に応答して前記第1認識
    辞書記憶手段に格納された前記標準特徴値まはた前記部
    首標準特徴値算出手段より出力された部首標準特徴値の
    いずれかを選択し更新標準特徴値として出力する認識辞
    書更新手段と、前記認識辞書更新手段より出力された前
    記更新標準特徴値を格納する第2認識辞書記憶手段と、
    前記特徴抽出手段より出力された前記入力文字の特徴値
    と前記第2認識辞書記憶手段に格納された各認識対象文
    字の前記更新標準特徴値との照合処理をなし各認識対象
    文字の照合結果に応答した照合結果信号を出力する識別
    手段と、前記識別手段より出力される前記照合結果信号
    を受け候補文字を選択して候補文字に対応した文字コー
    ドを出力する候補文字判定手段を具備してなることを特
    徴とする文字認識装置。
JP61134094A 1986-06-10 1986-06-10 文字認識装置 Pending JPS62290986A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61134094A JPS62290986A (ja) 1986-06-10 1986-06-10 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61134094A JPS62290986A (ja) 1986-06-10 1986-06-10 文字認識装置

Publications (1)

Publication Number Publication Date
JPS62290986A true JPS62290986A (ja) 1987-12-17

Family

ID=15120291

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61134094A Pending JPS62290986A (ja) 1986-06-10 1986-06-10 文字認識装置

Country Status (1)

Country Link
JP (1) JPS62290986A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01258088A (ja) * 1988-04-07 1989-10-16 Fujitsu Ltd オンライン手書き文字認識方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01258088A (ja) * 1988-04-07 1989-10-16 Fujitsu Ltd オンライン手書き文字認識方式

Similar Documents

Publication Publication Date Title
KR100249055B1 (ko) 문자인식장치및방법
JPS63182793A (ja) 文字切り出し方式
JPS62290986A (ja) 文字認識装置
JP2000331122A (ja) 文字認識方法および装置
JPH01201789A (ja) 文字読取装置
JP2538543B2 (ja) 文字情報認識装置
JPS6379192A (ja) 文字認識装置
JPH0223490A (ja) 文字読取システム
JP2570311B2 (ja) 文字列認識装置
JPS61163472A (ja) 文字認識装置
JP2878772B2 (ja) 光学的文字読取装置
JP2851865B2 (ja) 文字認識装置
JPS59106084A (ja) 文字読取り装置
JPH0438024B2 (ja)
JPS6334682A (ja) 文字認識装置
JPH0347554B2 (ja)
JPH0514952B2 (ja)
JPS5818777A (ja) 文字認識方式
JPS59149572A (ja) 文字認識装置
JPS6379191A (ja) 文字認識装置
JPS6053919B2 (ja) 実時間手書文字認識方式
JPH0353392A (ja) 文字認識装置
JPH02166587A (ja) 単語検索方式
JPS62280985A (ja) 光学文字読み取り装置
JPH02181286A (ja) 単語検索方式