JPH11175659A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH11175659A JPH11175659A JP9363975A JP36397597A JPH11175659A JP H11175659 A JPH11175659 A JP H11175659A JP 9363975 A JP9363975 A JP 9363975A JP 36397597 A JP36397597 A JP 36397597A JP H11175659 A JPH11175659 A JP H11175659A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- unit
- character
- sub
- extracting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】
【解決手段】 入力文字パタン1を走査してその走査方
向の文字線成分を表すサブパタンをサブパタン抽出部2
2と23で抽出する。このとき、それぞれ異なる文字線
成分判定基準を適用し、2種のサブパタンを抽出して特
徴マトリクス抽出部28に送る。 【効果】 2種以上の異なる基準を適用して、2組以上
の入力文字パタンの特徴を得て、標準パタンと比較すれ
ば、標準パタンを多数用意しなくても、入力文字のかす
れや汚れ等が原因となる誤認識を防止できる。
向の文字線成分を表すサブパタンをサブパタン抽出部2
2と23で抽出する。このとき、それぞれ異なる文字線
成分判定基準を適用し、2種のサブパタンを抽出して特
徴マトリクス抽出部28に送る。 【効果】 2種以上の異なる基準を適用して、2組以上
の入力文字パタンの特徴を得て、標準パタンと比較すれ
ば、標準パタンを多数用意しなくても、入力文字のかす
れや汚れ等が原因となる誤認識を防止できる。
Description
【0001】
【発明の属する技術分野】本発明は、文書や帳票等に記
入された文字のイメージを読み取って文字認識処理を実
行する文字認識装置に関する。
入された文字のイメージを読み取って文字認識処理を実
行する文字認識装置に関する。
【0002】
【従来の技術】情報処理装置へのデータ入力を簡略化し
効率化するために、文字認識装置が広く使用されてい
る。この装置は、文書や帳票に印刷された文字あるいは
手書き文字をイメージデータとして読み取り、1文字分
ずつ切り出した文字パタンから特徴抽出を行い、得られ
た特徴と予め用意した標準パタンの特徴とを比較し、文
字を認識する。認識された文字について、文字コードが
その認識結果として取り出される。
効率化するために、文字認識装置が広く使用されてい
る。この装置は、文書や帳票に印刷された文字あるいは
手書き文字をイメージデータとして読み取り、1文字分
ずつ切り出した文字パタンから特徴抽出を行い、得られ
た特徴と予め用意した標準パタンの特徴とを比較し、文
字を認識する。認識された文字について、文字コードが
その認識結果として取り出される。
【0003】文字パタンから抽出される特徴は、同一の
文字であっても文字の種類によって異なる。従って、同
一の文字に対して複数種類の標準パタンを用意して、異
なるフォントを使用した文書に対応するようにしてい
る。また、字が潰れたりあるいはかすれたりしたような
場合に、認識を誤ることがある。そこで、数種類の想定
される状態ごとに文字認識を行うための標準パタンを用
意して、認識率を高めるといった方法が採用されていた
(共立出版株式会社「パタン認識第5ページの図1.3
パタン認識過程」)。
文字であっても文字の種類によって異なる。従って、同
一の文字に対して複数種類の標準パタンを用意して、異
なるフォントを使用した文書に対応するようにしてい
る。また、字が潰れたりあるいはかすれたりしたような
場合に、認識を誤ることがある。そこで、数種類の想定
される状態ごとに文字認識を行うための標準パタンを用
意して、認識率を高めるといった方法が採用されていた
(共立出版株式会社「パタン認識第5ページの図1.3
パタン認識過程」)。
【0004】
【発明が解決しようとする課題】ところで、上記のよう
な従来の技術には次のような解決すべき課題があった。
手書き文字も用紙等に印刷された文字も、コピーをした
り汚れが付着した場合には、文字のイメージがかすれた
り途切れたりあるいは汚れによる点や線が加わることに
よって、誤認識を生じることが多い。即ち、汚れを文字
を構成する点や線と認識したり、あるいは連続する線が
かすれているためこれを不連続な線と認識したりするこ
とによって、誤認識を生じる。
な従来の技術には次のような解決すべき課題があった。
手書き文字も用紙等に印刷された文字も、コピーをした
り汚れが付着した場合には、文字のイメージがかすれた
り途切れたりあるいは汚れによる点や線が加わることに
よって、誤認識を生じることが多い。即ち、汚れを文字
を構成する点や線と認識したり、あるいは連続する線が
かすれているためこれを不連続な線と認識したりするこ
とによって、誤認識を生じる。
【0005】こうした誤認識を防ぐために、文字認識の
ための標準パタンを同一文字について何種類も用意する
と、標準パタンを記憶させておくための記憶装置が大容
量化する。これでは装置の大規模化を招き、高価格化の
要因となる。
ための標準パタンを同一文字について何種類も用意する
と、標準パタンを記憶させておくための記憶装置が大容
量化する。これでは装置の大規模化を招き、高価格化の
要因となる。
【0006】
【課題を解決するための手段】本発明は以上の点を解決
するため次の構成を採用する。 〈構成1〉文字を含むイメージデータから切り取った入
力文字パタンの特徴を抽出する特徴抽出部と、標準文字
パタンの特徴を記憶する辞書部と、上記特徴抽出部の出
力する入力文字パタンの特徴と上記辞書部に記憶した標
準文字パタンの特徴とを比較して、文字識別を行う識別
部とを備え、上記特徴抽出部は、少なくとも2種以上の
異なる基準を適用して、同一の入力文字パタンに対し
て、それぞれ内容の異なる2組以上の特徴を出力するこ
とを特徴とする文字認識装置。
するため次の構成を採用する。 〈構成1〉文字を含むイメージデータから切り取った入
力文字パタンの特徴を抽出する特徴抽出部と、標準文字
パタンの特徴を記憶する辞書部と、上記特徴抽出部の出
力する入力文字パタンの特徴と上記辞書部に記憶した標
準文字パタンの特徴とを比較して、文字識別を行う識別
部とを備え、上記特徴抽出部は、少なくとも2種以上の
異なる基準を適用して、同一の入力文字パタンに対し
て、それぞれ内容の異なる2組以上の特徴を出力するこ
とを特徴とする文字認識装置。
【0007】〈構成2〉構成1に記載の装置において、
入力文字パタンを走査して、その走査方向の文字線成分
を表すサブパタンを抽出するサブパタン抽出部と、この
サブパタン抽出部の出力から上記入力文字パタンの特徴
を抽出する特徴マトリクス抽出部とを備え、上記サブパ
タン抽出部が少なくとも2つ以上設けられ、各サブパタ
ン抽出部は、それぞれ異なる文字線成分判定基準を適用
して上記サブパタンを抽出することを特徴とする文字認
識装置。
入力文字パタンを走査して、その走査方向の文字線成分
を表すサブパタンを抽出するサブパタン抽出部と、この
サブパタン抽出部の出力から上記入力文字パタンの特徴
を抽出する特徴マトリクス抽出部とを備え、上記サブパ
タン抽出部が少なくとも2つ以上設けられ、各サブパタ
ン抽出部は、それぞれ異なる文字線成分判定基準を適用
して上記サブパタンを抽出することを特徴とする文字認
識装置。
【0008】〈構成3〉構成1に記載の装置において、
入力文字パタンの輪郭線の歪みを修正するフィルタ部
と、このフィルタ部の出力から上記入力文字パタンの特
徴を抽出する特徴マトリクス抽出部とを備え、上記フィ
ルタ部が少なくとも2つ以上設けられ、各フィルタ部
は、それぞれ異なる修正基準を適用して上記入力文字パ
タンの修正をすることを特徴とする文字認識装置。
入力文字パタンの輪郭線の歪みを修正するフィルタ部
と、このフィルタ部の出力から上記入力文字パタンの特
徴を抽出する特徴マトリクス抽出部とを備え、上記フィ
ルタ部が少なくとも2つ以上設けられ、各フィルタ部
は、それぞれ異なる修正基準を適用して上記入力文字パ
タンの修正をすることを特徴とする文字認識装置。
【0009】〈構成4〉構成1に記載の装置において、
入力文字パタンを2値化する2値化部と、この2値化部
の出力から上記入力文字パタンの特徴を抽出する特徴マ
トリクス抽出部とを備え、上記2値化部が少なくとも2
つ以上設けられ、各2値化部は、それぞれ異なる閾値を
適用して上記入力文字パタンの2値化することを特徴と
する文字認識装置。
入力文字パタンを2値化する2値化部と、この2値化部
の出力から上記入力文字パタンの特徴を抽出する特徴マ
トリクス抽出部とを備え、上記2値化部が少なくとも2
つ以上設けられ、各2値化部は、それぞれ異なる閾値を
適用して上記入力文字パタンの2値化することを特徴と
する文字認識装置。
【0010】
【発明の実施の形態】以下、本発明の実施の形態を具体
例を用いて説明する。 〈具体例1〉図1は、本発明の具体例1による特徴抽出
部のブロック図を示す。この図は、文字認識装置に組み
込まれた特徴抽出部分を詳細に示したブロック図であ
る。まず、この図の説明を行う前に、文字認識部全体の
構成を説明する。図2は、一般の文字認識装置のブロッ
ク図である。この装置は、走査部10、イメージ記憶部
11、文字切り出し部12、特徴抽出部13、識別部1
4、辞書部15、結果比較部16、結果出力部17によ
り構成される。
例を用いて説明する。 〈具体例1〉図1は、本発明の具体例1による特徴抽出
部のブロック図を示す。この図は、文字認識装置に組み
込まれた特徴抽出部分を詳細に示したブロック図であ
る。まず、この図の説明を行う前に、文字認識部全体の
構成を説明する。図2は、一般の文字認識装置のブロッ
ク図である。この装置は、走査部10、イメージ記憶部
11、文字切り出し部12、特徴抽出部13、識別部1
4、辞書部15、結果比較部16、結果出力部17によ
り構成される。
【0011】走査部10は、例えば帳票5に記入された
文字6を読み取って、これをイメージデータとして電気
信号化する部分である。イメージ記憶部11は、走査部
10が取り込んだイメージデータを一時記憶するバッフ
ァメモリから構成される。文字切り出し部12は、イメ
ージ記憶部11に記憶されているイメージから1文字単
位に文字パタンを切り出す処理を行う部分である。特徴
抽出部13は、文字切り出し部12から得られた入力文
字パタンの特徴を抽出する部分である。
文字6を読み取って、これをイメージデータとして電気
信号化する部分である。イメージ記憶部11は、走査部
10が取り込んだイメージデータを一時記憶するバッフ
ァメモリから構成される。文字切り出し部12は、イメ
ージ記憶部11に記憶されているイメージから1文字単
位に文字パタンを切り出す処理を行う部分である。特徴
抽出部13は、文字切り出し部12から得られた入力文
字パタンの特徴を抽出する部分である。
【0012】識別部14は、辞書部15に記憶されてい
る標準文字パタンの特徴と特徴抽出部13から出力され
た入力文字パタンの特徴とを比較して、文字識別を行う
部分である。結果記憶部16は、識別部14で文字識別
を行った結果を文字コード群として記憶する部分であ
る。結果出力部17は、結果記憶部16に記憶されたデ
ータを外部装置に出力する処理を行う部分である。
る標準文字パタンの特徴と特徴抽出部13から出力され
た入力文字パタンの特徴とを比較して、文字識別を行う
部分である。結果記憶部16は、識別部14で文字識別
を行った結果を文字コード群として記憶する部分であ
る。結果出力部17は、結果記憶部16に記憶されたデ
ータを外部装置に出力する処理を行う部分である。
【0013】再び図1に戻って、上記特徴抽出部13
は、この図に示すように、パタンレジスタ20、線幅計
算部21、サブパタン抽出部22,23、文字枠検出部
24、文字枠分割決定部25、切換部26、制御部27
及び特徴マトリクス抽出部28から構成される。パタン
レジスタ20は、図2に示した文字切り出し部12から
入力する入力文字パタン1を一時記憶するためのメモリ
である。
は、この図に示すように、パタンレジスタ20、線幅計
算部21、サブパタン抽出部22,23、文字枠検出部
24、文字枠分割決定部25、切換部26、制御部27
及び特徴マトリクス抽出部28から構成される。パタン
レジスタ20は、図2に示した文字切り出し部12から
入力する入力文字パタン1を一時記憶するためのメモリ
である。
【0014】線幅計算部21は、入力文字パタン中の文
字の線幅Wを計算する部分である。この線幅Wは、例え
ば文字パタンを2×2ドットに対応する窓で走査したと
きに2×2ドット分の窓中の全ての点が黒ドットになる
ような窓の個数Qと、文字パタンの全黒ドット数Aに基
づいて次のようにして計算される。W=A/(A−Q)
字の線幅Wを計算する部分である。この線幅Wは、例え
ば文字パタンを2×2ドットに対応する窓で走査したと
きに2×2ドット分の窓中の全ての点が黒ドットになる
ような窓の個数Qと、文字パタンの全黒ドット数Aに基
づいて次のようにして計算される。W=A/(A−Q)
【0015】サブパタン抽出部22,23は、それぞれ
後で説明するような異なる文字線成分判定基準を適用し
て、サブパタンを抽出する部分である。文字枠検出部2
4は、パタンレジスタ20に格納された文字パタンに外
接する文字枠を検出し、その結果を文字枠分割決定部2
5へ出力する部分である。文字枠分割決定部25は、そ
の文字枠の中をX軸方向とY軸方向に所定数に分割する
部分である。
後で説明するような異なる文字線成分判定基準を適用し
て、サブパタンを抽出する部分である。文字枠検出部2
4は、パタンレジスタ20に格納された文字パタンに外
接する文字枠を検出し、その結果を文字枠分割決定部2
5へ出力する部分である。文字枠分割決定部25は、そ
の文字枠の中をX軸方向とY軸方向に所定数に分割する
部分である。
【0016】切換部26は、サブパタン抽出部22とサ
ブパタン抽出部23の出力を受け入れていずれか一方を
特徴マトリクス抽出部28に向けて出力する部分であ
る。制御部27は、切換部26の出力を交互に切り換え
る制御を行う部分である。この切り換えによって、サブ
パタン抽出部22から得られた特徴マトリクスとサブパ
タン抽出部23から得られた特徴マトリクスに基づいて
図に示すように入力文字パタンの特徴2−1,2−2
が、それぞれ識別部へ出力される構成となっている。
ブパタン抽出部23の出力を受け入れていずれか一方を
特徴マトリクス抽出部28に向けて出力する部分であ
る。制御部27は、切換部26の出力を交互に切り換え
る制御を行う部分である。この切り換えによって、サブ
パタン抽出部22から得られた特徴マトリクスとサブパ
タン抽出部23から得られた特徴マトリクスに基づいて
図に示すように入力文字パタンの特徴2−1,2−2
が、それぞれ識別部へ出力される構成となっている。
【0017】次に、以上の構成の装置の動作を説明す
る。図3には、具体例1の特徴抽出部動作説明図を示
す。図において、入力文字パタンは、例えば「土」とい
う文字とする。ここには、当初図に示すような汚れ30
が付着しているものとする。ここで、サブパタン抽出部
22,23(図1)は、パタンレジスタ20に記憶され
た入力文字パタンを取り出して、文字線成分の抽出処理
を行う。例えば、図3に示すように、走査方向7を水平
方向に設定した場合に、全面に渡ってスキャンを実行
し、黒ドットの連続する長さが閾値T以上の部分を検出
し、その部分の黒ドットを残してサブパタンを得るとい
う動作を行う。この閾値Tは、nを任意の整数とした場
合に、T=n×Wというように選定する。
る。図3には、具体例1の特徴抽出部動作説明図を示
す。図において、入力文字パタンは、例えば「土」とい
う文字とする。ここには、当初図に示すような汚れ30
が付着しているものとする。ここで、サブパタン抽出部
22,23(図1)は、パタンレジスタ20に記憶され
た入力文字パタンを取り出して、文字線成分の抽出処理
を行う。例えば、図3に示すように、走査方向7を水平
方向に設定した場合に、全面に渡ってスキャンを実行
し、黒ドットの連続する長さが閾値T以上の部分を検出
し、その部分の黒ドットを残してサブパタンを得るとい
う動作を行う。この閾値Tは、nを任意の整数とした場
合に、T=n×Wというように選定する。
【0018】例えば、図1に示したサブパタン抽出部2
2ではT=2W、サブパタン抽出部23ではT=3Wと
したとき、図3(b)と(c)に示したようなサブパタ
ンが得られる。(b)はサブパタン抽出部22の出力で
あって、閾値Tがサブパタン抽出部23のそれよりも小
さいことから、汚れ30に相当する黒ドット32,33
がサブパタンとして抽出されている。
2ではT=2W、サブパタン抽出部23ではT=3Wと
したとき、図3(b)と(c)に示したようなサブパタ
ンが得られる。(b)はサブパタン抽出部22の出力で
あって、閾値Tがサブパタン抽出部23のそれよりも小
さいことから、汚れ30に相当する黒ドット32,33
がサブパタンとして抽出されている。
【0019】一方、サブパタン抽出部23の出力は、
(c)に示すように、「土」という文字の水平方向のス
トローク31と34のみを抽出している。サブパタン抽
出部22,23は、こうした処理を走査方向を変更しな
がら複数回繰り返す。
(c)に示すように、「土」という文字の水平方向のス
トローク31と34のみを抽出している。サブパタン抽
出部22,23は、こうした処理を走査方向を変更しな
がら複数回繰り返す。
【0020】上記のような水平方向の走査により得られ
たサブパタンを水平サブパタン(HSP)と呼ぶ。垂直
方向に走査されて得られたサブパタンは垂直サブパタン
(VSP)と呼ぶ。更に、右斜め45゜方向に走査され
たサブパタンを右斜めサブパタン(RSP)、左斜め4
5゜の操作により得られたサブパタンを左斜めサブパタ
ン(LSP)と呼ぶ。これらは図示していないが、いず
れも図1に示すサブパタン抽出部22,23から出力さ
れ、切換部26を通じて特徴マトリクス抽出部28に入
力する。
たサブパタンを水平サブパタン(HSP)と呼ぶ。垂直
方向に走査されて得られたサブパタンは垂直サブパタン
(VSP)と呼ぶ。更に、右斜め45゜方向に走査され
たサブパタンを右斜めサブパタン(RSP)、左斜め4
5゜の操作により得られたサブパタンを左斜めサブパタ
ン(LSP)と呼ぶ。これらは図示していないが、いず
れも図1に示すサブパタン抽出部22,23から出力さ
れ、切換部26を通じて特徴マトリクス抽出部28に入
力する。
【0021】文字枠分割決定部25は、文字枠検出部2
4から検出された文字パタンに外接する文字枠内をN×
Mの領域に分割する。例えば、この例では、N=M=5
というように選定する。そして、文字枠の水平方向X
軸、垂直方向をY軸とした場合に、分割点の座標(x,
y)を決定する。
4から検出された文字パタンに外接する文字枠内をN×
Mの領域に分割する。例えば、この例では、N=M=5
というように選定する。そして、文字枠の水平方向X
軸、垂直方向をY軸とした場合に、分割点の座標(x,
y)を決定する。
【0022】特徴マトリクス抽出部28は、文字枠分割
決定部25により決定された分割点座標によって、切換
部26から出力されるVSP、HSP、RSP、LSP
の各サブパタンの文字枠領域をN×Mの領域に分割す
る。そして、各領域の黒ドット数Bijを計数する。次
に、線幅Wを使用して、文字線長Lijを次の式により求
める。 Lij=Bij/W
決定部25により決定された分割点座標によって、切換
部26から出力されるVSP、HSP、RSP、LSP
の各サブパタンの文字枠領域をN×Mの領域に分割す
る。そして、各領域の黒ドット数Bijを計数する。次
に、線幅Wを使用して、文字線長Lijを次の式により求
める。 Lij=Bij/W
【0023】上記の式は、(N×M)×4次元の特徴マ
トリクスである。その後、VSP特徴マトリクスは文字
枠のY軸方向の長さΔyで、HSP特徴マトリクスはX
軸方向の長さΔxで、RSPとLSPの特徴マトリクス
は、(Δx+Δy)/2で正規化を行う。こうして、最
終的に(N×M)×4次元の文字パタンの大きさで正規
化した特徴マトリクスを作成する。
トリクスである。その後、VSP特徴マトリクスは文字
枠のY軸方向の長さΔyで、HSP特徴マトリクスはX
軸方向の長さΔxで、RSPとLSPの特徴マトリクス
は、(Δx+Δy)/2で正規化を行う。こうして、最
終的に(N×M)×4次元の文字パタンの大きさで正規
化した特徴マトリクスを作成する。
【0024】こうして得られた特徴マトリクスは、図2
に示した特徴抽出部13から識別部14に入力される。
識別部14は、特徴抽出部13から出力される特徴マト
リクスfiと辞書部15に格納された標準文字パタンの
特徴マトリクスfmとを比較する。これらの比較は、両
者の対応する部分の数値を比較して、その差の2乗を総
和して平方根を求めることより距離Dを得る。 D={Σ(fm−fi)^2}^(1/2) この結果は、図2に示す結果記憶部16に記憶される。
図1に示した制御部27は、サブパタン抽出部22の出
力について、上記の処理を行った後、サブパタン抽出部
23の出力について同様の処理を行わせる。そして、両
方の結果を結果記憶部16に記憶させる。
に示した特徴抽出部13から識別部14に入力される。
識別部14は、特徴抽出部13から出力される特徴マト
リクスfiと辞書部15に格納された標準文字パタンの
特徴マトリクスfmとを比較する。これらの比較は、両
者の対応する部分の数値を比較して、その差の2乗を総
和して平方根を求めることより距離Dを得る。 D={Σ(fm−fi)^2}^(1/2) この結果は、図2に示す結果記憶部16に記憶される。
図1に示した制御部27は、サブパタン抽出部22の出
力について、上記の処理を行った後、サブパタン抽出部
23の出力について同様の処理を行わせる。そして、両
方の結果を結果記憶部16に記憶させる。
【0025】こうして、結果記憶部16には同一の入力
文字パタンに対し、2組の特徴と標準文字パタンとの比
較結果が記憶される。結果記憶部16に記憶されたこれ
らの距離計算結果に対して距離の小さいものから順に順
位分けを行い、これを認識結果として結果出力部17を
通じて外部回路に送り出す。こうして文字認識用の候補
が得られることになる。
文字パタンに対し、2組の特徴と標準文字パタンとの比
較結果が記憶される。結果記憶部16に記憶されたこれ
らの距離計算結果に対して距離の小さいものから順に順
位分けを行い、これを認識結果として結果出力部17を
通じて外部回路に送り出す。こうして文字認識用の候補
が得られることになる。
【0026】なお、上記の例では、サブパタン抽出部を
2種類設けるようにしたが、それぞれ文字線成分判定基
準の異なる3種類以上のサブパタン抽出部を設けてもよ
い。また、各サブパタン抽出部は、走査方向毎に異なる
閾値を用いてサブパタンを抽出するようにしてもよい。
2種類設けるようにしたが、それぞれ文字線成分判定基
準の異なる3種類以上のサブパタン抽出部を設けてもよ
い。また、各サブパタン抽出部は、走査方向毎に異なる
閾値を用いてサブパタンを抽出するようにしてもよい。
【0027】〈具体例1の効果〉以上のように、サブパ
タン抽出部の文字線成分判定基準を変化させて、入力文
字パタンに対して複数種類のサブパタンを抽出すること
により、入力文字パタンが変形したり汚れを伴った場合
でも、これらの影響を緩和したサブパタンを得ることが
可能になる。従って、より標準文字パタンに近い特徴抽
出結果が得られる。このため、標準文字パタンは、こう
した変形や汚れに対応したものを別に用意する必要がな
くなり、辞書部の記憶容量を小型化することが可能にな
る。
タン抽出部の文字線成分判定基準を変化させて、入力文
字パタンに対して複数種類のサブパタンを抽出すること
により、入力文字パタンが変形したり汚れを伴った場合
でも、これらの影響を緩和したサブパタンを得ることが
可能になる。従って、より標準文字パタンに近い特徴抽
出結果が得られる。このため、標準文字パタンは、こう
した変形や汚れに対応したものを別に用意する必要がな
くなり、辞書部の記憶容量を小型化することが可能にな
る。
【0028】〈具体例2〉図4には、具体例2の特徴抽
出部ブロック図を示す。この図に示す特徴抽出部13
は、図2に示した特徴抽出部13を変形したもので、フ
ィルタ部40,41、パタンレジスタ42,43、切換
部44、制御部45、線幅計算部46、サブパタン抽出
部47、文字枠検出部48、文字枠分割決定部49、特
徴マトリクス抽出部50によって構成されている。
出部ブロック図を示す。この図に示す特徴抽出部13
は、図2に示した特徴抽出部13を変形したもので、フ
ィルタ部40,41、パタンレジスタ42,43、切換
部44、制御部45、線幅計算部46、サブパタン抽出
部47、文字枠検出部48、文字枠分割決定部49、特
徴マトリクス抽出部50によって構成されている。
【0029】フィルタ部40は、入力文字パタンの輪郭
線の歪みを修正する機能を持つ部分である。図5を用い
て、このフィルタ部の機能を説明する。図5は、具体例
2の特徴抽出部動作説明図である。図の(a)に示す入
力文字パタンは、「土」という文字であって、かすれを
生じたことによってパタンの各部に欠損が生じている。
例えば、図4に示したフィルタ部40は、こうした入力
文字パタンの輪郭線の歪みを修正し、滑らかにする機能
を持つ。従って、図5(a)に示した入力文字パタン
を、図5(b)に示したようなパタンに修正して出力を
する。これが図4に示すパタンレジスタ42に記憶され
る。
線の歪みを修正する機能を持つ部分である。図5を用い
て、このフィルタ部の機能を説明する。図5は、具体例
2の特徴抽出部動作説明図である。図の(a)に示す入
力文字パタンは、「土」という文字であって、かすれを
生じたことによってパタンの各部に欠損が生じている。
例えば、図4に示したフィルタ部40は、こうした入力
文字パタンの輪郭線の歪みを修正し、滑らかにする機能
を持つ。従って、図5(a)に示した入力文字パタン
を、図5(b)に示したようなパタンに修正して出力を
する。これが図4に示すパタンレジスタ42に記憶され
る。
【0030】一方、フィルタ部41は、例えばこのよう
なフィルタ機能を持たないものとし、入力文字パタンが
そのままパタンレジスタ43に記憶されるものとする。
切換部44は、パタンレジスタ42の出力とパタンレジ
スタ43の出力とを受け入れていずれか一方を選択し、
後続回路に出力する機能を持つ。制御部45は、この切
換部44の切り換えを制御する部分である。
なフィルタ機能を持たないものとし、入力文字パタンが
そのままパタンレジスタ43に記憶されるものとする。
切換部44は、パタンレジスタ42の出力とパタンレジ
スタ43の出力とを受け入れていずれか一方を選択し、
後続回路に出力する機能を持つ。制御部45は、この切
換部44の切り換えを制御する部分である。
【0031】線幅計算部46の機能は、図1に示した線
幅計算部21と同一である。また、文字枠検出部48の
機能は、図1に示した文字枠検出部24と同一で、文字
枠分割決定部49の機能は、図1に示した文字枠分割決
定部25と同一であるものとする。更に、サブパタン抽
出部22と同一で、特徴マトリクス抽出部50の機能
は、図1に示した特徴マトリクス抽出部28と同一とす
る。以上の構成の装置は次のように動作する。
幅計算部21と同一である。また、文字枠検出部48の
機能は、図1に示した文字枠検出部24と同一で、文字
枠分割決定部49の機能は、図1に示した文字枠分割決
定部25と同一であるものとする。更に、サブパタン抽
出部22と同一で、特徴マトリクス抽出部50の機能
は、図1に示した特徴マトリクス抽出部28と同一とす
る。以上の構成の装置は次のように動作する。
【0032】図4において、まず制御部45は切換部4
4を制御し、フィルタ処理が行われた入力文字パタンを
格納したパタンレジスタ42の出力を後続回路に出力す
る。線幅計算部46は、その文字の線幅を計算し、サブ
パタン抽出部47は、走査方向の文字線成分を抽出す
る。文字枠検出部48は文字の外枠を検出し、文字枠分
割決定部49は文字枠分割のための座標を決定する。特
徴マトリクス抽出部50は、既に具体例1で説明したと
同様にして、入力文字パタンの特徴マトリクスを作成す
る。以下の処理は具体例1と全く同一であるので、重複
する説明は省略する。
4を制御し、フィルタ処理が行われた入力文字パタンを
格納したパタンレジスタ42の出力を後続回路に出力す
る。線幅計算部46は、その文字の線幅を計算し、サブ
パタン抽出部47は、走査方向の文字線成分を抽出す
る。文字枠検出部48は文字の外枠を検出し、文字枠分
割決定部49は文字枠分割のための座標を決定する。特
徴マトリクス抽出部50は、既に具体例1で説明したと
同様にして、入力文字パタンの特徴マトリクスを作成す
る。以下の処理は具体例1と全く同一であるので、重複
する説明は省略する。
【0033】次に、制御部45は切換部44を走査し
て、パタンレジスタ43に記憶されたフィルタ処理をさ
れていない入力文字パタンを後続回路に出力する。そし
て、その入力文字パタンについても同様にして特徴マト
リクスが抽出され、特徴抽出部13から後続回路に送ら
れる。上記の例では、図5(a)と(b)を比較して明
らかなように、フィルタ処理を行った後の文字パタンを
標準文字パタンと比較した場合に、最も距離が短い値が
得られるということが明らかである。
て、パタンレジスタ43に記憶されたフィルタ処理をさ
れていない入力文字パタンを後続回路に出力する。そし
て、その入力文字パタンについても同様にして特徴マト
リクスが抽出され、特徴抽出部13から後続回路に送ら
れる。上記の例では、図5(a)と(b)を比較して明
らかなように、フィルタ処理を行った後の文字パタンを
標準文字パタンと比較した場合に、最も距離が短い値が
得られるということが明らかである。
【0034】しかしながら、文字の形状やその他の条件
によって、フィルタ処理の程度に差を付けた場合、いず
れか一方のフィルタ処理を行った場合に、最も標準文字
パタンに近い結果が得られることがある。即ち、この具
体例では、2種以上の異なる修正基準を持つフィルタ部
を用意し、いずれかのフィルタ部を選択することによっ
てより標準パタンに近い特徴の抽出が可能となる。な
お、上記のフィルタ部は、2種類を設け、一方は図5に
示すようなフィルタ機能を持たない構成としたが、2種
以上のそれぞれ程度の異なるフィルタ機能を持つフィル
タを用いて2組以上の特徴を得て処理を行うことが好ま
しい。
によって、フィルタ処理の程度に差を付けた場合、いず
れか一方のフィルタ処理を行った場合に、最も標準文字
パタンに近い結果が得られることがある。即ち、この具
体例では、2種以上の異なる修正基準を持つフィルタ部
を用意し、いずれかのフィルタ部を選択することによっ
てより標準パタンに近い特徴の抽出が可能となる。な
お、上記のフィルタ部は、2種類を設け、一方は図5に
示すようなフィルタ機能を持たない構成としたが、2種
以上のそれぞれ程度の異なるフィルタ機能を持つフィル
タを用いて2組以上の特徴を得て処理を行うことが好ま
しい。
【0035】〈具体例2の効果〉以上のように、フィル
タ処理方法を変化させ、入力文字パタンに対し複数種類
のフィルタ処理を施し、入力文字パタンのかすれやノイ
ズを緩和することが可能になる。これによって、具体例
1と同様に、辞書部に記憶しておく標準文字パタンの記
憶容量を少なくすることができる。更に、例えばファク
シミリ等により送信された文字について、入力文字パタ
ンのかすれやノイズを効果的に緩和し、正確な文字認識
が可能となるという効果がある。
タ処理方法を変化させ、入力文字パタンに対し複数種類
のフィルタ処理を施し、入力文字パタンのかすれやノイ
ズを緩和することが可能になる。これによって、具体例
1と同様に、辞書部に記憶しておく標準文字パタンの記
憶容量を少なくすることができる。更に、例えばファク
シミリ等により送信された文字について、入力文字パタ
ンのかすれやノイズを効果的に緩和し、正確な文字認識
が可能となるという効果がある。
【0036】〈具体例3〉図6には、具体例3の特徴抽
出部ブロック図を示す。この特徴抽出部は、2値化部6
0と、制御部61、パタンレジスタ62、線幅計算部6
3、サブパタン抽出部64、文字枠検出部65、文字枠
分割決定部66及び特徴マトリクス抽出部67から構成
される。2値化部60は、入力文字パタンのイメージを
走査して、2値化しビットマップデータを得る部分であ
る。
出部ブロック図を示す。この特徴抽出部は、2値化部6
0と、制御部61、パタンレジスタ62、線幅計算部6
3、サブパタン抽出部64、文字枠検出部65、文字枠
分割決定部66及び特徴マトリクス抽出部67から構成
される。2値化部60は、入力文字パタンのイメージを
走査して、2値化しビットマップデータを得る部分であ
る。
【0037】図7には、具体例3の特徴抽出部動作説明
図を示す。図の(a)は、入力文字イメージを示し、
(b)と(c)は、それぞれ異なる閾値を用いて2値化
処理を行った処理結果を示す。図6に示した2値化部6
0は、制御部61の制御によって、それぞれ異なる閾値
で2値化処理を繰り返し実行するよう構成されている。
図を示す。図の(a)は、入力文字イメージを示し、
(b)と(c)は、それぞれ異なる閾値を用いて2値化
処理を行った処理結果を示す。図6に示した2値化部6
0は、制御部61の制御によって、それぞれ異なる閾値
で2値化処理を繰り返し実行するよう構成されている。
【0038】図7(a)に示す入力文字イメージは、か
すれ等の原因によって、濃淡を持つものと仮定する。従
って、このイメージを2値化処理する場合に、閾値を高
く、即ち濃度の濃いもののみを黒ドットにするような処
理を行うと、図7(b)に示すように、線幅が実質的に
細い文字パタンが得られる。また、濃度の薄いものまで
黒ドットとするように2値化をすると、(c)に示すよ
うに、(a)に示す画像に近いビットマップデータが得
られる。
すれ等の原因によって、濃淡を持つものと仮定する。従
って、このイメージを2値化処理する場合に、閾値を高
く、即ち濃度の濃いもののみを黒ドットにするような処
理を行うと、図7(b)に示すように、線幅が実質的に
細い文字パタンが得られる。また、濃度の薄いものまで
黒ドットとするように2値化をすると、(c)に示すよ
うに、(a)に示す画像に近いビットマップデータが得
られる。
【0039】なお、(c)の場合には、比較的薄い色の
汚れ等も文字パタンの一部として2値化してしまうこと
がある。従って、(b)、(c)のいずれの処理を行っ
た場合に元の文字に最も近いビットマップデータが得ら
れるかは、元の文字の汚れや変形の度合いによって異な
る。いずれの場合においても、こうして2値化処理の際
の閾値を異ならせた出力を後続回路に出力し、これまで
説明したと同様の処理によって2組以上の特徴抽出を行
う。その他の動作はこれまでの具体例と全く同様であ
る。
汚れ等も文字パタンの一部として2値化してしまうこと
がある。従って、(b)、(c)のいずれの処理を行っ
た場合に元の文字に最も近いビットマップデータが得ら
れるかは、元の文字の汚れや変形の度合いによって異な
る。いずれの場合においても、こうして2値化処理の際
の閾値を異ならせた出力を後続回路に出力し、これまで
説明したと同様の処理によって2組以上の特徴抽出を行
う。その他の動作はこれまでの具体例と全く同様であ
る。
【0040】〈具体例3の効果〉以上のように、例えば
濃淡のある多値イメージが入力文字パタンとして入力さ
れた場合、そのイメージからそれぞれ閾値の異なる2値
化処理を行ったビットマップデータを得て、特徴抽出を
行うようにすれば、入力文字のかすれや潰れ、汚れ等が
緩和された文字パタンを得ることが可能になる。従っ
て、これまでの具体例と同様に、標準文字パタンを記憶
した辞書部を小型化することが可能になる。更に、いわ
ゆるグレースケールを含む多値イメージによって記入さ
れた文字等をより正確に認識処理することができるとい
う効果がある。
濃淡のある多値イメージが入力文字パタンとして入力さ
れた場合、そのイメージからそれぞれ閾値の異なる2値
化処理を行ったビットマップデータを得て、特徴抽出を
行うようにすれば、入力文字のかすれや潰れ、汚れ等が
緩和された文字パタンを得ることが可能になる。従っ
て、これまでの具体例と同様に、標準文字パタンを記憶
した辞書部を小型化することが可能になる。更に、いわ
ゆるグレースケールを含む多値イメージによって記入さ
れた文字等をより正確に認識処理することができるとい
う効果がある。
【0041】〈その他〉以上のように、具体例1、具体
例2、具体例3は、それぞれ特徴抽出部に、サブパタン
抽出部やフィルタ部あるいは2値化部を設けて、少なく
とも2種以上の異なる基準を適用して、同一の入力文字
パタンに対して内容の異なる2組以上の特徴を出力する
ようにした。この場合に、上記以外の各種の条件によっ
て特徴を抽出するようにしてもよいし、また例えば上記
のサブパタン抽出部とフィルタ部を合わせて持ち、これ
らの条件をそれぞれ組み合わせて多種の特徴を得るよう
にしても同様の効果が得られる。
例2、具体例3は、それぞれ特徴抽出部に、サブパタン
抽出部やフィルタ部あるいは2値化部を設けて、少なく
とも2種以上の異なる基準を適用して、同一の入力文字
パタンに対して内容の異なる2組以上の特徴を出力する
ようにした。この場合に、上記以外の各種の条件によっ
て特徴を抽出するようにしてもよいし、また例えば上記
のサブパタン抽出部とフィルタ部を合わせて持ち、これ
らの条件をそれぞれ組み合わせて多種の特徴を得るよう
にしても同様の効果が得られる。
【図1】具体例1の特徴抽出部ブロック図である。
【図2】文字認識装置のブロック図である。
【図3】具体例1の特徴抽出部動作説明図である。
【図4】具体例2の特徴抽出部ブロック図である。
【図5】具体例2の特徴抽出部動作説明図である。
【図6】具体例3の特徴抽出部ブロック図である。
【図7】具体例3の特徴抽出部動作説明図である。
1 入力文字パタン 2−1,2−2 入力文字パタンの特徴 13 特徴抽出部 22,23 サブパタン抽出部 28 特徴マトリクス抽出部
Claims (4)
- 【請求項1】 文字を含むイメージデータから切り取っ
た入力文字パタンの特徴を抽出する特徴抽出部と、 標準文字パタンの特徴を記憶する辞書部と、 前記特徴抽出部の出力する入力文字パタンの特徴と前記
辞書部に記憶した標準文字パタンの特徴とを比較して、
文字識別を行う識別部とを備え、 前記特徴抽出部は、少なくとも2種以上の異なる基準を
適用して、同一の入力文字パタンに対して、それぞれ内
容の異なる2組以上の特徴を出力することを特徴とする
文字認識装置。 - 【請求項2】 請求項1に記載の装置において、 入力文字パタンを走査して、その走査方向の文字線成分
を表すサブパタンを抽出するサブパタン抽出部と、この
サブパタン抽出部の出力から前記入力文字パタンの特徴
を抽出する特徴マトリクス抽出部とを備え、 前記サブパタン抽出部が少なくとも2つ以上設けられ、
各サブパタン抽出部は、それぞれ異なる文字線成分判定
基準を適用して前記サブパタンを抽出することを特徴と
する文字認識装置。 - 【請求項3】 請求項1に記載の装置において、 入力文字パタンの輪郭線の歪みを修正するフィルタ部
と、このフィルタ部の出力から前記入力文字パタンの特
徴を抽出する特徴マトリクス抽出部とを備え、 前記フィルタ部が少なくとも2つ以上設けられ、各フィ
ルタ部は、それぞれ異なる修正基準を適用して前記入力
文字パタンの修正をすることを特徴とする文字認識装
置。 - 【請求項4】 請求項1に記載の装置において、 入力文字パタンを2値化する2値化部と、この2値化部
の出力から前記入力文字パタンの特徴を抽出する特徴マ
トリクス抽出部とを備え、 前記2値化部が少なくとも2つ以上設けられ、各2値化
部は、それぞれ異なる閾値を適用して前記入力文字パタ
ンの2値化することを特徴とする文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9363975A JPH11175659A (ja) | 1997-12-17 | 1997-12-17 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9363975A JPH11175659A (ja) | 1997-12-17 | 1997-12-17 | 文字認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH11175659A true JPH11175659A (ja) | 1999-07-02 |
Family
ID=18480668
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9363975A Pending JPH11175659A (ja) | 1997-12-17 | 1997-12-17 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH11175659A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101085699B1 (ko) | 2010-02-17 | 2011-11-23 | 고려대학교 산학협력단 | 문자 획 너비 계산을 이용한 문자 영역 추출 장치 및 방법 |
-
1997
- 1997-12-17 JP JP9363975A patent/JPH11175659A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101085699B1 (ko) | 2010-02-17 | 2011-11-23 | 고려대학교 산학협력단 | 문자 획 너비 계산을 이용한 문자 영역 추출 장치 및 방법 |
US8744189B2 (en) | 2010-02-17 | 2014-06-03 | Samsung Electronics Co., Ltd | Character region extracting apparatus and method using character stroke width calculation |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
US7292375B2 (en) | Method and apparatus for color image processing, and a computer product | |
US6160913A (en) | Method and apparatus for digital halftone dots detection and removal in business documents | |
JP2001092919A (ja) | 2次元バーコードのねじれ角決定法 | |
JPH096957A (ja) | 濃度画像の2値化方法および画像2値化装置 | |
CN111814673A (zh) | 一种修正文本检测边界框的方法、装置、设备及存储介质 | |
US8229214B2 (en) | Image processing apparatus and image processing method | |
US6983071B2 (en) | Character segmentation device, character segmentation method used thereby, and program therefor | |
CN111445402A (zh) | 一种图像去噪方法及装置 | |
KR100295360B1 (ko) | 쉐이딩알고리즘을이용한영상처리방법 | |
JPH11175659A (ja) | 文字認識装置 | |
JPH07230525A (ja) | 罫線認識方法及び表処理方法 | |
JP4732626B2 (ja) | 帳票処理方法および装置並びにプログラム | |
JPH05342412A (ja) | グラディエントベクトルの抽出方式及び文字認識用特徴抽出方式 | |
JP3545227B2 (ja) | 画像処理方法及び装置、光学式文字読取装置 | |
Deivalakshmi | A simple system for table extraction irrespective of boundary thickness and removal of detected spurious lines | |
JP3210224B2 (ja) | 文字認識装置 | |
JP3277977B2 (ja) | 文字認識方法 | |
JPH0644404A (ja) | 印刷物の検査装置 | |
JP2674475B2 (ja) | 文字読取装置 | |
JP2902904B2 (ja) | 文字認識装置 | |
JPH02166583A (ja) | 文字認識装置 | |
JP3127413B2 (ja) | 文字認識装置 | |
JPH05128305A (ja) | 領域分割方法 | |
JPH05174179A (ja) | 文書画像処理装置 |