JP2902097B2 - 情報処理装置及び文字認識装置 - Google Patents
情報処理装置及び文字認識装置Info
- Publication number
- JP2902097B2 JP2902097B2 JP2291059A JP29105990A JP2902097B2 JP 2902097 B2 JP2902097 B2 JP 2902097B2 JP 2291059 A JP2291059 A JP 2291059A JP 29105990 A JP29105990 A JP 29105990A JP 2902097 B2 JP2902097 B2 JP 2902097B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- word
- block
- information processing
- character block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
【発明の詳細な説明】 (産業上の利用分野) この発明は、複数の文字ブロックで構成された文書画
像から各文字ブロックを、これら間の接続関係を判定し
てこの順に出力することが出来る情報処理装置と、この
情報処理装置を具える文字認識装置とに関するものであ
る。
像から各文字ブロックを、これら間の接続関係を判定し
てこの順に出力することが出来る情報処理装置と、この
情報処理装置を具える文字認識装置とに関するものであ
る。
(従来の技術) 機械が媒体上の文書画像から該文書が持つ情報を正確
に得ることが出来れば、種々の機能を持つ情報処理装
置、例えば文字認識装置、認識した文字を音声により出
力するような装置、認識した文字を翻訳する装置等の構
築が可能になる。
に得ることが出来れば、種々の機能を持つ情報処理装
置、例えば文字認識装置、認識した文字を音声により出
力するような装置、認識した文字を翻訳する装置等の構
築が可能になる。
しかし、文書画像には、例えば第2図に示すように、
罫線或いは空白(図示例は空白)と、文字列が密に配列
され上述の空白により周囲と隔れた複数の文字ブロック
11a〜11dとで構成された文書画像11があり、このような
文書画像11の認識処理に当っては、書式既知の文字画像
の処理とは異なり、文字ブロックを抽出し各文字ブロッ
ク間の接続関係を判定するという特別の処置が必要にな
る。
罫線或いは空白(図示例は空白)と、文字列が密に配列
され上述の空白により周囲と隔れた複数の文字ブロック
11a〜11dとで構成された文書画像11があり、このような
文書画像11の認識処理に当っては、書式既知の文字画像
の処理とは異なり、文字ブロックを抽出し各文字ブロッ
ク間の接続関係を判定するという特別の処置が必要にな
る。
そこで、これを行い得る従来装置として、例えば文献
(電子情報通信学会技術研究報告PRU86−33)に開示
された書式未知文書の自動読取装置があった。
(電子情報通信学会技術研究報告PRU86−33)に開示
された書式未知文書の自動読取装置があった。
この文献に開示されている装置では、書式未知の文書
より、周辺分布特徴、線密度特徴、外接矩形特徴を用い
て、見出し文字ブロックや本文文字ブロック等の文書構
成要素が抽出され、さらにこれら各文字ブロックから各
文字が抽出され、さらに各文字に対して特徴抽出が行な
われて各文字が認識される。
より、周辺分布特徴、線密度特徴、外接矩形特徴を用い
て、見出し文字ブロックや本文文字ブロック等の文書構
成要素が抽出され、さらにこれら各文字ブロックから各
文字が抽出され、さらに各文字に対して特徴抽出が行な
われて各文字が認識される。
また、この際、各文字ブロックの接続順序は、例えば
文献(電子情報通信学会論文誌,(1986.3),VOl.J69
−D,No.3,p.404)に開示されているように、下記(1)
式に従い各文字ブロックの文書中における順序評価値h
が算出され、このhが小さい順とされるのが一般的であ
った。
文献(電子情報通信学会論文誌,(1986.3),VOl.J69
−D,No.3,p.404)に開示されているように、下記(1)
式に従い各文字ブロックの文書中における順序評価値h
が算出され、このhが小さい順とされるのが一般的であ
った。
h=XC+ε・YC …(1) ここで、XCは各文字ブロックの左上隅点のX座標、YC
は各文字ブロックの左上隅点のY座標、εは0.1程度の
定数をそれぞれ示す。
は各文字ブロックの左上隅点のY座標、εは0.1程度の
定数をそれぞれ示す。
(発明が解決しようとする課題) しかしながら、上述した文献に開示された自動読取装
置では、第2図に示した文書画像において各ブロック11
a〜11dの正規な接続関係が11a→11c→11b→11dというよ
うな場合であっても、上記位置評価値hに従うため11a
→11b→11c→11dという接続関係であると判断されてし
まい、各文字ブロックの正確な順序判定をすることが出
来ないという問題点があった。
置では、第2図に示した文書画像において各ブロック11
a〜11dの正規な接続関係が11a→11c→11b→11dというよ
うな場合であっても、上記位置評価値hに従うため11a
→11b→11c→11dという接続関係であると判断されてし
まい、各文字ブロックの正確な順序判定をすることが出
来ないという問題点があった。
従って、この自動読取装置を文字認識装置に適用した
場合、正しい順序で文字認識を行うことが出来ないため
正確な認識結果を得ることが出来ないことになる。ま
た、これを防止するためには、オペレータによる修正作
業が必要となるが、この作業は煩雑であるため、文字認
識装置の処理性能の著しい低下、操作性の悪化につなが
るので好ましいことではない。
場合、正しい順序で文字認識を行うことが出来ないため
正確な認識結果を得ることが出来ないことになる。ま
た、これを防止するためには、オペレータによる修正作
業が必要となるが、この作業は煩雑であるため、文字認
識装置の処理性能の著しい低下、操作性の悪化につなが
るので好ましいことではない。
この発明はこのような点に鑑みなされたものであり、
従ってこの発明の目的は、文字ブロック間の接続関係を
正確に判定することが出来る情報処理装置及びこれを具
える文字認識装置を提供することにある。
従ってこの発明の目的は、文字ブロック間の接続関係を
正確に判定することが出来る情報処理装置及びこれを具
える文字認識装置を提供することにある。
(課題を解決するための手段) この目的の達成を図るため、この出願の第一発明によ
れば、文書画像より文字ブロックを抽出するための文字
ブロック抽出部を具える情報処理装置において、 抽出された文字ブロックより文字パタンを切り出す文
字切り出し部と、 前述の切り出された文字パタンを認識する文字認識部
と、 前述の認識された文字パタン列より単語を切り出す単
語切り出し部と、 文字ブロック毎に、前述の切り出された単語の中から
特徴となる単語を選択する特徴単語選択部と、 前述の選択された特徴単語を文字ブロック毎に記憶す
るための特徴単語記憶部と、 各ブロック別の特徴単語を各文字ブロック間相互で比
較・照合する特徴単語照合部と、 前記特徴単語の比較・照合結果に基づいて各文字ブロ
ック間の接続関係を判定し、該判定結果に基づいて文字
ブロックを出力する文字ブロック選択部とを具えたこと
を特徴とする。
れば、文書画像より文字ブロックを抽出するための文字
ブロック抽出部を具える情報処理装置において、 抽出された文字ブロックより文字パタンを切り出す文
字切り出し部と、 前述の切り出された文字パタンを認識する文字認識部
と、 前述の認識された文字パタン列より単語を切り出す単
語切り出し部と、 文字ブロック毎に、前述の切り出された単語の中から
特徴となる単語を選択する特徴単語選択部と、 前述の選択された特徴単語を文字ブロック毎に記憶す
るための特徴単語記憶部と、 各ブロック別の特徴単語を各文字ブロック間相互で比
較・照合する特徴単語照合部と、 前記特徴単語の比較・照合結果に基づいて各文字ブロ
ック間の接続関係を判定し、該判定結果に基づいて文字
ブロックを出力する文字ブロック選択部とを具えたこと
を特徴とする。
なお、この第一発明の実施に当り、前述の特徴単語選
択部は、単語を構成する文字数に基づいて特徴単語を選
択する構成とするのが好適である。または、文字ブロッ
ク中の単語の中で、予め登録しておいた一般単語と一致
しない単語を、特徴単語として選択する構成とするのが
好適である。
択部は、単語を構成する文字数に基づいて特徴単語を選
択する構成とするのが好適である。または、文字ブロッ
ク中の単語の中で、予め登録しておいた一般単語と一致
しない単語を、特徴単語として選択する構成とするのが
好適である。
さらにこの第一発明の実施に当り、前述の特徴単語照
合部は、前述の特徴単語の比較・照合において着目文字
ブロックと他の文字ブロックとに共通に現われる単語数
を計数する構成とするのが好適である。
合部は、前述の特徴単語の比較・照合において着目文字
ブロックと他の文字ブロックとに共通に現われる単語数
を計数する構成とするのが好適である。
さらにこの発明の実施に当り、前述の文字ブロック選
択部は、前述の共通単語数が予め定めた値以上でありか
つ最も大きい値を示した文字ブロックを、着目文字ブロ
ックと接続される他の文字ブロックと判定する構成とす
るのが好適である。
択部は、前述の共通単語数が予め定めた値以上でありか
つ最も大きい値を示した文字ブロックを、着目文字ブロ
ックと接続される他の文字ブロックと判定する構成とす
るのが好適である。
また、この出願の第二発明の文字認識装置によれば、
第一発明の情報処理装置と、該情報処理装置から出力さ
れる文字ブロックの文字を認識する文字認識段とを具え
たことを特徴とする。
第一発明の情報処理装置と、該情報処理装置から出力さ
れる文字ブロックの文字を認識する文字認識段とを具え
たことを特徴とする。
(作用) この出願の第一発明の情報処理装置によれば、文書画
像から抽出された各文字ブロック毎の特徴単語を選択
し、さらに各文字ブロックの特徴単語同士を比較・照合
してこの結果に基づいて各文字ブロックの接続関係を判
定し、これに基づいた接続順で文字ブロックが出力され
る。つまり、各文字ブロックは文章の内容が加味された
接続関係で出力される。従って、各文字ブロックのレイ
アウトに規則性の無い文書から文字ブロックを抽出し出
力する場合でも、単に各文字ブロックの文書画像中の位
置座標に基づいて各文字ブロックを出力していた従来装
置に比べ、各ブロックは正しい順序で出力される。
像から抽出された各文字ブロック毎の特徴単語を選択
し、さらに各文字ブロックの特徴単語同士を比較・照合
してこの結果に基づいて各文字ブロックの接続関係を判
定し、これに基づいた接続順で文字ブロックが出力され
る。つまり、各文字ブロックは文章の内容が加味された
接続関係で出力される。従って、各文字ブロックのレイ
アウトに規則性の無い文書から文字ブロックを抽出し出
力する場合でも、単に各文字ブロックの文書画像中の位
置座標に基づいて各文字ブロックを出力していた従来装
置に比べ、各ブロックは正しい順序で出力される。
また、この第二発明の文字認識装置によれば、上述の
ように正しい順序で出力される文字ブロックについて文
字認識がなされる。このため、レイアウトに規則性の無
い文書の文字認識を文書に即して行うことが出来る。
ように正しい順序で出力される文字ブロックについて文
字認識がなされる。このため、レイアウトに規則性の無
い文書の文字認識を文書に即して行うことが出来る。
(実施例) 以下、この出願の第一発明の情報処理装置及び第二発
明の文字認識装置の実施例について、第一発明の情報処
理装置を適用した文字認識装置の例により説明する。
明の文字認識装置の実施例について、第一発明の情報処
理装置を適用した文字認識装置の例により説明する。
文字認識装置の構成の説明 第1図は、実施例の情報処理装置200を組み込んだ実
施例の文字認識装置100の構成を概略的に示したブロッ
ク図である。なお、この文字認識装置100の説明を容易
とするために、以下の説明においては認識対象の文書画
像例を挙げて説明する。ここでは、空白及び文字ブロッ
ク11a〜11dで構成される第2図に示すような文書画像11
を、認識対象の文書画像例とする。
施例の文字認識装置100の構成を概略的に示したブロッ
ク図である。なお、この文字認識装置100の説明を容易
とするために、以下の説明においては認識対象の文書画
像例を挙げて説明する。ここでは、空白及び文字ブロッ
ク11a〜11dで構成される第2図に示すような文書画像11
を、認識対象の文書画像例とする。
この文字認識装置100は、光電変換部110、実施例の情
報処理装置200、文字認識段120及び出力端子130を具え
る。また、この情報処理装置200は、文字ブロック抽出
部210、文字切り出し部220、文字認識部230、単語切り
出し部240、特徴単語選択部250、特徴単語記憶部260、
特徴単語照合部270及び文字ブロック選択部280を具え、
また、文字認識段120は、文字切り出し部122及び文字認
識部124を具える。
報処理装置200、文字認識段120及び出力端子130を具え
る。また、この情報処理装置200は、文字ブロック抽出
部210、文字切り出し部220、文字認識部230、単語切り
出し部240、特徴単語選択部250、特徴単語記憶部260、
特徴単語照合部270及び文字ブロック選択部280を具え、
また、文字認識段120は、文字切り出し部122及び文字認
識部124を具える。
次に、各構成成分の詳細について説明する。
光電変換部110は、例えば従来公知のイメージセンサ
等で構成出来、文字・図形等(以下、文字と称する。)
が記載された例えば第2図に示すような文書画像11から
の光信号Sを、例えば文字線部を黒ビット及び背景部を
白ビットで表現した2値のディジタル信号(これを入力
画像データという。)に変換し、この入力画像データを
文字ブロック抽出部210に出力するものである。
等で構成出来、文字・図形等(以下、文字と称する。)
が記載された例えば第2図に示すような文書画像11から
の光信号Sを、例えば文字線部を黒ビット及び背景部を
白ビットで表現した2値のディジタル信号(これを入力
画像データという。)に変換し、この入力画像データを
文字ブロック抽出部210に出力するものである。
文字ブロック抽出部210は、光電変換部110より入力さ
れた入力画像データより文書画像の文字ブロックに対応
するデータ(これを文字ブロックデータと称する。)を
抽出しこれを文字ブロック選択部280及び文字切り出し
部220に夫々出力するものである。例えば第2図に示す
文書画像11の例で説明すれば、文字列が規則正しく密に
配列し空白等により周囲と隔れている領域11a〜11d(こ
れらの領域各々が文字ブロックになる。)に対応する入
力画像データ部分を抽出し、文字ブロック選択部280及
び文字切り出し部220に夫々出力する。
れた入力画像データより文書画像の文字ブロックに対応
するデータ(これを文字ブロックデータと称する。)を
抽出しこれを文字ブロック選択部280及び文字切り出し
部220に夫々出力するものである。例えば第2図に示す
文書画像11の例で説明すれば、文字列が規則正しく密に
配列し空白等により周囲と隔れている領域11a〜11d(こ
れらの領域各々が文字ブロックになる。)に対応する入
力画像データ部分を抽出し、文字ブロック選択部280及
び文字切り出し部220に夫々出力する。
ここで、文字ブロックデータの抽出は従来公知の種々
の方法で行うことが出来るが、この実施例では以下に説
明するような方法で行う。
の方法で行うことが出来るが、この実施例では以下に説
明するような方法で行う。
先ず、入力画像データを縦方向(第2図中yで示す方
向に相当する方向)に走査し周辺分布を作成する。次
に、この周辺分布において、黒ビット数が0から1以上
に変化する走査線より1以上から0に変化する直前の走
査線までで規定される領域を列方向の1ブロックとして
検出する。次に、この列方向の1ブロックに対応する入
力画像データ部分を、今度は横方向(第2図中xで示す
方向に相当する方向)に走査し横方向の周辺分布を作成
する。そして、この横方向の周辺分布において、黒ビッ
ト数が0から1以上に変化する走査線より1以上から0
に変化する直前の走査線までで規定される領域の幅が閾
値THより大きかったならばこの領域と前述の列方向のブ
ロックとの重複部分のデータを文字ブロックデータとし
て抽出する。なお、閾値THは、例えば、文書中の汚れ等
により文字ブロックが誤って決定されないようにするた
めの値であり、この実施例の場合は140としてある。
向に相当する方向)に走査し周辺分布を作成する。次
に、この周辺分布において、黒ビット数が0から1以上
に変化する走査線より1以上から0に変化する直前の走
査線までで規定される領域を列方向の1ブロックとして
検出する。次に、この列方向の1ブロックに対応する入
力画像データ部分を、今度は横方向(第2図中xで示す
方向に相当する方向)に走査し横方向の周辺分布を作成
する。そして、この横方向の周辺分布において、黒ビッ
ト数が0から1以上に変化する走査線より1以上から0
に変化する直前の走査線までで規定される領域の幅が閾
値THより大きかったならばこの領域と前述の列方向のブ
ロックとの重複部分のデータを文字ブロックデータとし
て抽出する。なお、閾値THは、例えば、文書中の汚れ等
により文字ブロックが誤って決定されないようにするた
めの値であり、この実施例の場合は140としてある。
文字切り出し部220は、文字ブロック抽出部210より入
力された文字ブロックデータより文字行を切り出し、さ
らにこの文字行より1文字ずつの文字パタンを切り出
し、さらにこれら文字パタンを順次文字認識部230に出
力するものである。ここで、文字行の切り出し及びこの
文字行からの文字パタンの切り出しは、例えば、入力画
像データから文字ブロックデータを周辺分布に基づいて
抽出した上述の手順と同様な手順で行うことが出来る。
力された文字ブロックデータより文字行を切り出し、さ
らにこの文字行より1文字ずつの文字パタンを切り出
し、さらにこれら文字パタンを順次文字認識部230に出
力するものである。ここで、文字行の切り出し及びこの
文字行からの文字パタンの切り出しは、例えば、入力画
像データから文字ブロックデータを周辺分布に基づいて
抽出した上述の手順と同様な手順で行うことが出来る。
文字認識部230は、文字切り出し部220より入力された
文字パタンの特徴抽出を行いさらに特徴マトリクスを作
成し、さらに、この特徴マトリクスと、予め用意された
図示しない辞書マトリクスとの類似度を算出し、類似度
の最も高い辞書マトリクスの文字名を当該文字パタンの
認識結果として単語切り出し部240に出力するものであ
る。ここで、上述の特徴抽出は従来公知の種々の方法で
行うことが出来るが、この実施例の場合は以下に説明す
るような方法で行う。
文字パタンの特徴抽出を行いさらに特徴マトリクスを作
成し、さらに、この特徴マトリクスと、予め用意された
図示しない辞書マトリクスとの類似度を算出し、類似度
の最も高い辞書マトリクスの文字名を当該文字パタンの
認識結果として単語切り出し部240に出力するものであ
る。ここで、上述の特徴抽出は従来公知の種々の方法で
行うことが出来るが、この実施例の場合は以下に説明す
るような方法で行う。
先ず、文字パタンについてその文字線部に外接する例
えば方形の枠を検出し、これを文字枠とする。さらに当
該文字パタンの線幅Wを例えば下記(2)式で示すよう
な周知の近似式を用いて算出する。
えば方形の枠を検出し、これを文字枠とする。さらに当
該文字パタンの線幅Wを例えば下記(2)式で示すよう
な周知の近似式を用いて算出する。
W=1/{1−(Q/A)} …(2) 但し、(2)式において、Qは文字パタンを構成する
各点をこれらの点が(2×2)個づつの範囲で見られる
窓で走査したときの、この窓内の点全てが黒ビットとな
る窓の数であり、またAは文字枠内の黒ビットの総数で
ある。
各点をこれらの点が(2×2)個づつの範囲で見られる
窓で走査したときの、この窓内の点全てが黒ビットとな
る窓の数であり、またAは文字枠内の黒ビットの総数で
ある。
さらに、この文字パタンを複数の方向に走査を行って
各走査列毎の黒ビットの連続個数を検出し、この黒ビッ
トの連続個数と、上述の線幅Wとに基づいて上述の複数
の方向毎に対応したサブパターンをそれぞれ抽出する。
そして、この文字パターンの上述の文字枠内を各サブパ
タンについて(N×M)個の領域(M,Nは定数)に分割
し、さらに各分割領域内の文字線長を表わす特徴量を各
分割領域毎に計算し、この特徴量を文字枠の大きさで正
規化して特徴マトリクスを得る。この実施例では、特徴
量を(dX+dY)/2なる値で除することによって正規化す
る。ここで、dXは文字枠の水平方向の長さ、dYは文字枠
の垂直方向の長さである。
各走査列毎の黒ビットの連続個数を検出し、この黒ビッ
トの連続個数と、上述の線幅Wとに基づいて上述の複数
の方向毎に対応したサブパターンをそれぞれ抽出する。
そして、この文字パターンの上述の文字枠内を各サブパ
タンについて(N×M)個の領域(M,Nは定数)に分割
し、さらに各分割領域内の文字線長を表わす特徴量を各
分割領域毎に計算し、この特徴量を文字枠の大きさで正
規化して特徴マトリクスを得る。この実施例では、特徴
量を(dX+dY)/2なる値で除することによって正規化す
る。ここで、dXは文字枠の水平方向の長さ、dYは文字枠
の垂直方向の長さである。
また、上述の類似度は、この実施例の場合以下に示す
(3)式に基いて求める。
(3)式に基いて求める。
但し、(3)式において、Rは類似度、fiは被認識文
字の文字パタンの特徴マトリクスの要素値、giは辞書マ
トリクスの要素値、NXMは被認識文字の特徴マトリクス
及び辞書マトリクスの次元数をそれぞれ示す。
字の文字パタンの特徴マトリクスの要素値、giは辞書マ
トリクスの要素値、NXMは被認識文字の特徴マトリクス
及び辞書マトリクスの次元数をそれぞれ示す。
単語切り出し部240は、文字切り出し部より入力され
た文字パタン列より単語(単語文字列と称する場合もあ
る。)を切り出しこれを特徴単語選択部に出力するもの
である。ここで、単語の切り出しは、従来公知の種々の
方法で行うことが出来るが、この実施例の場合は以下に
説明するような方法で行う。
た文字パタン列より単語(単語文字列と称する場合もあ
る。)を切り出しこれを特徴単語選択部に出力するもの
である。ここで、単語の切り出しは、従来公知の種々の
方法で行うことが出来るが、この実施例の場合は以下に
説明するような方法で行う。
先ず、各文字パターンの行方向(第2図中のxで示す
方向に相当する方向)における始点座標及び終点座標よ
り単語領域を抽出する。具体的には、当該行のi番目の
文字に対応する文字パタンが下記の(4)式を満足する
場合には当該文字を単語の開始文字であると判断し、こ
の文字から次の単語の開始文字直前の文字までを単語領
域とする。
方向に相当する方向)における始点座標及び終点座標よ
り単語領域を抽出する。具体的には、当該行のi番目の
文字に対応する文字パタンが下記の(4)式を満足する
場合には当該文字を単語の開始文字であると判断し、こ
の文字から次の単語の開始文字直前の文字までを単語領
域とする。
Xsi−Xei-1>T …(4) 但し、 Xsi,Xsj:文字パタン始点座標 Xei,Xej:文字パタン終点座標 i,j:当該行中の文字番号 n:当該行中の文字数 次に、単語切り出し部240は、この単語領域内の各文
字パタンの、文字認識部230より入力された認識結果文
字名で構成される列を単語文字列(単語と称することも
ある。)として特徴単語選択部250に出力する。
字パタンの、文字認識部230より入力された認識結果文
字名で構成される列を単語文字列(単語と称することも
ある。)として特徴単語選択部250に出力する。
単語選択部250は、単語切り出し部240より入力された
単語文字列より各文字ブロックの特徴となるような単語
文字列を選択し(この選択された単語文字列を特徴単語
と称する。)これを特徴単語記憶部260に出力するもの
である。
単語文字列より各文字ブロックの特徴となるような単語
文字列を選択し(この選択された単語文字列を特徴単語
と称する。)これを特徴単語記憶部260に出力するもの
である。
特徴単語を選択する方法としては種々の方法が考えら
れるが、この実施例では以下に説明するように、選択対
象となっている単語文字列の文字列長に着目して特徴単
語を選択するものとする。
れるが、この実施例では以下に説明するように、選択対
象となっている単語文字列の文字列長に着目して特徴単
語を選択するものとする。
具体的には、単語文字列の文字列長さをlとすると、
下記(5)式の条件を満たす文字列長の単語文字列即ち
文字列長が予め定めた閾値k以上の単語文字列を当該文
字ブロックの特徴単語として選択する。但し、kはこの
実施例の場合6としてある。
下記(5)式の条件を満たす文字列長の単語文字列即ち
文字列長が予め定めた閾値k以上の単語文字列を当該文
字ブロックの特徴単語として選択する。但し、kはこの
実施例の場合6としてある。
l≧k …(5) 特徴単語記憶部260は、特徴単語選択部250より入力さ
れた特徴単語をこれが所属していた文字ブロック番号と
対応づけて記憶するものである。特徴単語記憶部260
は、従来公知のメモリにより構成出来る。なお、この場
合、説明の都合上、文字ブロック番号は、第2図中に示
した11a〜11dとする。
れた特徴単語をこれが所属していた文字ブロック番号と
対応づけて記憶するものである。特徴単語記憶部260
は、従来公知のメモリにより構成出来る。なお、この場
合、説明の都合上、文字ブロック番号は、第2図中に示
した11a〜11dとする。
第2図に示した文書画像11の各文字ブロック11a〜11d
各々からは、この実施例の場合、文字列長さlが6以上
の単語が特徴単語として特徴単語選択部250により夫々
選択される。従って特徴単語記憶部260には、文字ブロ
ック別に第1表のように特徴単語が記憶される。なお、
第1表においては特徴単語の一部のみ示してあることは
理解されたい。
各々からは、この実施例の場合、文字列長さlが6以上
の単語が特徴単語として特徴単語選択部250により夫々
選択される。従って特徴単語記憶部260には、文字ブロ
ック別に第1表のように特徴単語が記憶される。なお、
第1表においては特徴単語の一部のみ示してあることは
理解されたい。
特徴単語照合部270は、特徴単語記憶部より各文字ブ
ロック別の特徴単語を読み込み各ブロック別特徴単語を
相互に比較・照合するものである。特にこの実施例の特
徴単語照合部270は、異なる文字ブロック中に共通の特
徴単語が存在するか否かを検定すると共に着目文字ブロ
ックと他の各文字ブロックとの間において共通の特徴単
語数を各他の文字ブロック別に計数する構成としてあ
る。
ロック別の特徴単語を読み込み各ブロック別特徴単語を
相互に比較・照合するものである。特にこの実施例の特
徴単語照合部270は、異なる文字ブロック中に共通の特
徴単語が存在するか否かを検定すると共に着目文字ブロ
ックと他の各文字ブロックとの間において共通の特徴単
語数を各他の文字ブロック別に計数する構成としてあ
る。
この特徴単語照合部270の機能について、第1表に示
した各文字ブロック別の特徴単語に対する動作により説
明すれば次のようになる。
した各文字ブロック別の特徴単語に対する動作により説
明すれば次のようになる。
文字ブロック11aを着目文字ブロックとした場合、特
徴単語照合部270は、文字ブロック11aと11cとの間にお
いて「lasers」、「weapons」及び「intelligence」と
いう3つの単語を共通の特徴単語として見出すと共に共
通特徴単語数3を計数する。同様に、文字ブロック11a
と11dとの間において「president」を共通の特徴単語と
して見出すと共に共通特徴単語数1を計数する。また、
文字ブロック11aと11bとの間においては、共通な特徴単
語は見出せないため共通特徴単語数は0とする。特徴単
語照合部270は、文字ブロック11b,11cについても、文字
ブロック11aの場合と同様な手順で共通な特徴単語数を
計数する。しかし、第2図の文書画像例の場合、文字ブ
ロック11bと文字ブロック11c,11dとの間に共通特徴単語
はなく、文字ブロック11cと文字ブロック11dとの間にも
共通特徴単語はない。従って、第2図に示さた文書画像
の各文字ブロックの共通特徴単語の計数結果は、以下の
第2表のようになる。この計数結果は文字ブロック選択
部280に出力される。
徴単語照合部270は、文字ブロック11aと11cとの間にお
いて「lasers」、「weapons」及び「intelligence」と
いう3つの単語を共通の特徴単語として見出すと共に共
通特徴単語数3を計数する。同様に、文字ブロック11a
と11dとの間において「president」を共通の特徴単語と
して見出すと共に共通特徴単語数1を計数する。また、
文字ブロック11aと11bとの間においては、共通な特徴単
語は見出せないため共通特徴単語数は0とする。特徴単
語照合部270は、文字ブロック11b,11cについても、文字
ブロック11aの場合と同様な手順で共通な特徴単語数を
計数する。しかし、第2図の文書画像例の場合、文字ブ
ロック11bと文字ブロック11c,11dとの間に共通特徴単語
はなく、文字ブロック11cと文字ブロック11dとの間にも
共通特徴単語はない。従って、第2図に示さた文書画像
の各文字ブロックの共通特徴単語の計数結果は、以下の
第2表のようになる。この計数結果は文字ブロック選択
部280に出力される。
文字ブロック選択部280は、特徴単語照合部270から入
力される比較・照合結果に基づいて各文字ブロック間の
持続関係を判定し、該判定結果に基づいて文字ブロック
を出力するものである。特にこの実施例の文字ブロック
選択部280は、特徴単語照合部270から入力された第2表
に示すような共通特徴単語数と、文字ブロック抽出部21
0より入力されている各文字ブロックデータとに基づい
て各文字ブロックの接続順序を決定しこの順序で各文字
ブロックデータを文字認識段120の文字切り出し部122に
出力する構成としてある。ここでの接続順序決定手順は
以下の通りである。
力される比較・照合結果に基づいて各文字ブロック間の
持続関係を判定し、該判定結果に基づいて文字ブロック
を出力するものである。特にこの実施例の文字ブロック
選択部280は、特徴単語照合部270から入力された第2表
に示すような共通特徴単語数と、文字ブロック抽出部21
0より入力されている各文字ブロックデータとに基づい
て各文字ブロックの接続順序を決定しこの順序で各文字
ブロックデータを文字認識段120の文字切り出し部122に
出力する構成としてある。ここでの接続順序決定手順は
以下の通りである。
先ず、各文字ブロックの位置座標に基づき各文字ブロ
ックの仮の接続順序を決定する。この仮の接続順序の決
定は、この実施例の場合、下記(6)式に従い各文字ブ
ロックの文書画像における位置評価値Ei(但し、iは文
字ブロック番号であり、この例では第2図中の11a〜11d
とする。)を求め、このEiが小さな順により行うものと
する。
ックの仮の接続順序を決定する。この仮の接続順序の決
定は、この実施例の場合、下記(6)式に従い各文字ブ
ロックの文書画像における位置評価値Ei(但し、iは文
字ブロック番号であり、この例では第2図中の11a〜11d
とする。)を求め、このEiが小さな順により行うものと
する。
Ei=yei+F・xei …(6) 但し、(6)式において、xeiは当該文字ブロックに
外接する矩形の左上隅点のx座標であり、yeiは前記左
上隅点のy座標であり、fは予め定めた定数でありこの
実施例の場合10である。なお、x,y座標は第2図中に示
すx,y座標系による。
外接する矩形の左上隅点のx座標であり、yeiは前記左
上隅点のy座標であり、fは予め定めた定数でありこの
実施例の場合10である。なお、x,y座標は第2図中に示
すx,y座標系による。
従って、第2図に示した文書画像の各文字ブロックの
仮の接続順序は、11a→11b→11c→11dとなる。
仮の接続順序は、11a→11b→11c→11dとなる。
次に、文字ブロック選択部280は、特徴単語照合部270
より出力されている共通特徴単語数に基づいて、上記仮
の接続順序を以下に説明するように修正する。
より出力されている共通特徴単語数に基づいて、上記仮
の接続順序を以下に説明するように修正する。
先ず、着目文字ブロックの他の文字ブロックに対する
各共通特徴単語数が予め定めた特定の値P以上であるか
否かを検定し、P以上の値を示した他の文字ブロックは
着目文字ブロックに対し接続関係があるものと判定す
る。但し、共通特徴単語数がP以上となる他の文字ブロ
ックが複数存在した場合は、これらの中で共通特徴単語
数が最も多い文字ブロックを着目文字ブロックに対し最
も接続関係があると判定するものとする。
各共通特徴単語数が予め定めた特定の値P以上であるか
否かを検定し、P以上の値を示した他の文字ブロックは
着目文字ブロックに対し接続関係があるものと判定す
る。但し、共通特徴単語数がP以上となる他の文字ブロ
ックが複数存在した場合は、これらの中で共通特徴単語
数が最も多い文字ブロックを着目文字ブロックに対し最
も接続関係があると判定するものとする。
次に、このように着目文字ブロックに対し接続関係が
あると判定された他の文字ブロックを、当該着目文字ブ
ロックの次の順序に位置する文字ブロックとして、仮の
接続順序の修正を行う。
あると判定された他の文字ブロックを、当該着目文字ブ
ロックの次の順序に位置する文字ブロックとして、仮の
接続順序の修正を行う。
なお、この実施例では、P=2とする。また、上記仮
の接続順序において上位にある側の文字ブロックを着目
文字ブロックと順次に定め、上記判定及び修正を順に行
うものとする。
の接続順序において上位にある側の文字ブロックを着目
文字ブロックと順次に定め、上記判定及び修正を順に行
うものとする。
第2図に示した文書画像の例の場合は、第2表に示し
たように、文字ブロック11aと文字ブロック11cとの間で
共通特徴単語数が3でありP以上の値であるので、文字
ブロック選択部280は、文字ブロック11aと文字ブロック
11cとは接続関係があるものと判定し、さらに、11a→11
b→11c→11dであった仮の接続順序を、11a→11c→11b→
11dという接続順序に修正する。そして、この文字ブロ
ック選択部280は、この修正された接続順序に従い各文
字ブロックデータを文字認識段120の文字切り出し部122
に順次に出力する。
たように、文字ブロック11aと文字ブロック11cとの間で
共通特徴単語数が3でありP以上の値であるので、文字
ブロック選択部280は、文字ブロック11aと文字ブロック
11cとは接続関係があるものと判定し、さらに、11a→11
b→11c→11dであった仮の接続順序を、11a→11c→11b→
11dという接続順序に修正する。そして、この文字ブロ
ック選択部280は、この修正された接続順序に従い各文
字ブロックデータを文字認識段120の文字切り出し部122
に順次に出力する。
文字認識段120の文字切り出し部122は、文字ブロック
選択部280より入力された文字ブロックデータより、文
字行を切り出しさらにこの文字行より1文字づつの文字
パタンを切り出しこのデータを文字認識部124に順次に
出力するものである。なお、この文字切り出し部122
は、例えば、情報処理装置200内の文字切り出し部220と
同様な構成とすれば良い。
選択部280より入力された文字ブロックデータより、文
字行を切り出しさらにこの文字行より1文字づつの文字
パタンを切り出しこのデータを文字認識部124に順次に
出力するものである。なお、この文字切り出し部122
は、例えば、情報処理装置200内の文字切り出し部220と
同様な構成とすれば良い。
文字認識段120の文字認識部124は、文字切り出し部12
2より入力された文字パタンを認識しこれにより得られ
た認識結果文字名を出力端子130より後段の装置(例え
ばディスプレイ、コンピュータ等)に出力するものであ
る。なお、この文字認識部124は、例えば、情報処理装
置200内の文字認識部230と同様な構成とすれば良い。
2より入力された文字パタンを認識しこれにより得られ
た認識結果文字名を出力端子130より後段の装置(例え
ばディスプレイ、コンピュータ等)に出力するものであ
る。なお、この文字認識部124は、例えば、情報処理装
置200内の文字認識部230と同様な構成とすれば良い。
この実施例の文字認識装置100によれば、情報処理装
置200が文書画像から各文字ブロックを切り出しこれら
を文字認識段120に出力する際に、各文字ブロック内に
関連性のある単語が存在するか否かを判定し関連性のあ
る単語を含む文字ブロック同士が接続されるような順序
で各ブロックが順に出力される。このため、文字認識段
120は、文書の流れに即ちた認識が行えるので、例え
ば、認識結果を音声合成に用いる場合や翻訳する場合
に、文字ブロック間で突然意味が通じること等が起こら
ず、正確な音声合成や翻訳が行える。
置200が文書画像から各文字ブロックを切り出しこれら
を文字認識段120に出力する際に、各文字ブロック内に
関連性のある単語が存在するか否かを判定し関連性のあ
る単語を含む文字ブロック同士が接続されるような順序
で各ブロックが順に出力される。このため、文字認識段
120は、文書の流れに即ちた認識が行えるので、例え
ば、認識結果を音声合成に用いる場合や翻訳する場合
に、文字ブロック間で突然意味が通じること等が起こら
ず、正確な音声合成や翻訳が行える。
上述においては、この出願の情報処理装置及び文字認
識装置の実施例について説明したが、この発明は上述の
実施例のみに限られるものではなく以下に説明するよう
な種々の変更を加えることが出来る。
識装置の実施例について説明したが、この発明は上述の
実施例のみに限られるものではなく以下に説明するよう
な種々の変更を加えることが出来る。
例えば、上述の実施例では、特徴単語選択部250は、
単語切り出し部240から切り出された単語文字列の文字
列長lに着目しl≧kなる条件式を満足する単語を特徴
単語として選択する構成としていたが、例えば、一般文
書中に搬出する一般単語を登録した一般単語辞書を予め
用意しておき、対象文字ブロック内の単語のうち該一般
単語辞書に未登録の単語を選び出しこれを当該対象文字
ブロックの特徴単語とする構成としても良い。
単語切り出し部240から切り出された単語文字列の文字
列長lに着目しl≧kなる条件式を満足する単語を特徴
単語として選択する構成としていたが、例えば、一般文
書中に搬出する一般単語を登録した一般単語辞書を予め
用意しておき、対象文字ブロック内の単語のうち該一般
単語辞書に未登録の単語を選び出しこれを当該対象文字
ブロックの特徴単語とする構成としても良い。
また、上述の実施例では、情報処理装置200に文字切
り出し部220及び文字認識部230を設け、文字認識段120
に文字切り出し部122及び文字認識部124を設けた構成と
していたが、文字切り出し部220及び124を1つの文字切
り出し部で共用し文字認識部230及び124を1つの文字認
識部で共用する構成としても勿論良い。
り出し部220及び文字認識部230を設け、文字認識段120
に文字切り出し部122及び文字認識部124を設けた構成と
していたが、文字切り出し部220及び124を1つの文字切
り出し部で共用し文字認識部230及び124を1つの文字認
識部で共用する構成としても勿論良い。
また、文字ブロックの抽出、文字行の切り出し、文字
パタンの切り出し、また文字認識に当っての特徴マトリ
クスの作成や類似度計算、単語切り出し等は、実施例で
説明した方法に限られるものではなく他の好適な方法を
用い得ることは明らかである。
パタンの切り出し、また文字認識に当っての特徴マトリ
クスの作成や類似度計算、単語切り出し等は、実施例で
説明した方法に限られるものではなく他の好適な方法を
用い得ることは明らかである。
また、上述の実施例では第一発明の情報処理装置を文
字認識装置に適用していたが、この情報処理装置は、文
字ブロックの接続順序を決定しこの順序に従い文字ブロ
ックを順次に出力する画像処理装置、さらに、文字領域
の接続関係を抽出して文書のレイアウト構造を抽出する
装置等にも適用出来る。
字認識装置に適用していたが、この情報処理装置は、文
字ブロックの接続順序を決定しこの順序に従い文字ブロ
ックを順次に出力する画像処理装置、さらに、文字領域
の接続関係を抽出して文書のレイアウト構造を抽出する
装置等にも適用出来る。
(発明の効果) 上述した説明からも明らかなように、この出願の第一
発明の情報処理装置によれば、文書画像から抽出された
各文字ブロック毎の特徴単語を選択し、さらに各文字ブ
ロックの特徴単語同士を比較・照合してこの結果に基づ
いて各文字ブロックの接続関係を判定し、これに基づい
た接続順で文字ブロックを出力することが出来る。従っ
て、各文字ブロックのレイアウトに規則性の無い文書か
ら文字ブロックを抽出し出力する場合でも、単に各文字
ブロックの文書画像中の位置座標に基づいて各文字ブロ
ックを出力していた従来装置に比べ、各ブロックを正し
い接続順序で出力出来る。
発明の情報処理装置によれば、文書画像から抽出された
各文字ブロック毎の特徴単語を選択し、さらに各文字ブ
ロックの特徴単語同士を比較・照合してこの結果に基づ
いて各文字ブロックの接続関係を判定し、これに基づい
た接続順で文字ブロックを出力することが出来る。従っ
て、各文字ブロックのレイアウトに規則性の無い文書か
ら文字ブロックを抽出し出力する場合でも、単に各文字
ブロックの文書画像中の位置座標に基づいて各文字ブロ
ックを出力していた従来装置に比べ、各ブロックを正し
い接続順序で出力出来る。
また、この第二発明の文字認識装置によれば、上述の
ように正しい順序で出力される文字ブロックについて文
字認識を行うことが出来る。このため、例えば、レイア
ウトに規則性の無い文書の文字認識を文書の流れに即し
て行うことが出来るので、高性能な文字認識装置を実現
出来る。
ように正しい順序で出力される文字ブロックについて文
字認識を行うことが出来る。このため、例えば、レイア
ウトに規則性の無い文書の文字認識を文書の流れに即し
て行うことが出来るので、高性能な文字認識装置を実現
出来る。
第1図は、実施例の説明に供するブロック図であり、実
施例の情報処理装置を組み込んだ実施例の文字認識装置
の構成を概略的に示したブロック図、 第2図は、処理対象の文書画像例を示した図である。 S……文書画像からの光信号 11……文書画像 11a〜11d……文字ブロック 100……文字認識装置、110……光電変換部 120……文字認識段、122……文字切り出し部 124……文字認識部、130……出力端子 200……情報処理装置 210……情報処理装置 210……文字ブロック抽出部 220……文字切り出し部 230……文字認識部、240……単語切出し部 250……特徴単語選択部 260……特徴単語記憶部 270……特徴単語照合部 280……文字ブロック選択部。
施例の情報処理装置を組み込んだ実施例の文字認識装置
の構成を概略的に示したブロック図、 第2図は、処理対象の文書画像例を示した図である。 S……文書画像からの光信号 11……文書画像 11a〜11d……文字ブロック 100……文字認識装置、110……光電変換部 120……文字認識段、122……文字切り出し部 124……文字認識部、130……出力端子 200……情報処理装置 210……情報処理装置 210……文字ブロック抽出部 220……文字切り出し部 230……文字認識部、240……単語切出し部 250……特徴単語選択部 260……特徴単語記憶部 270……特徴単語照合部 280……文字ブロック選択部。
フロントページの続き (72)発明者 山下 義征 東京都港区虎ノ門1丁目7番12号 沖電 気工業株式会社内 (58)調査した分野(Int.Cl.6,DB名) G06K 9/72
Claims (6)
- 【請求項1】文書画像より文字ブロックを抽出するため
の文字ブロック抽出部を具える情報処理装置において、 抽出された文字ブロックより文字パタンを切り出す文字
切り出し部と、 前記切り出された文字パタンを認識する文字認識部と、 前記認識された文字パタン列より単語を切り出す単語切
り出し部と、 文字ブロック毎に、前記切り出された単語の中から特徴
となる単語を選択する特徴単語選択部と、 前記選択された特徴単語を文字ブロック毎に記憶するた
めの特徴単語記憶部と、 各ブロック別の特徴単語を各文字ブロック間相互で比較
・照合する特徴単語照合部と、 前記特徴単語の比較・照合結果に基づいて各文字ブロッ
ク間の接続関係を判定し、該判定結果に基づいて文字ブ
ロックを出力する文字ブロック選択部とを具えたこと を特徴とする情報処理装置。 - 【請求項2】請求項1に記載の情報処理装置において、 前記特徴単語選択部は、単語を構成する文字数に基づい
て特徴単語を選択することを特徴とする情報処理装置。 - 【請求項3】請求項1に記載の情報処理装置において、 前記特徴単語照合部は、前記特徴単語の比較・照合にお
いて着目文字ブロックと他の文字ブロックとに共通に現
われる単語数を計数することを特徴とする情報処理装
置。 - 【請求項4】請求項3に記載の情報処理装置において、 前記文字ブロック選択部は、前記共通単語数が予め定め
た値以上でありかつ最も大きい値を示した文字ブロック
を、着目文字ブロックと接続される他の文字ブロックと
判定することを特徴とする情報処理装置。 - 【請求項5】請求項1に記載の情報処理装置において、 前記特徴単語選択部は、文字ブロック中の単語の中で、
予め登録しておいた一般単語と一致しない単語を、特徴
単語として選択することを特徴とする情報処理装置。 - 【請求項6】請求項1〜5のいずれか1項に記載の情報
処理装置と、該情報処理装置から出力される文字ブロッ
クの文字を認識する文字認識段とを具えたことを特徴と
する文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2291059A JP2902097B2 (ja) | 1990-10-29 | 1990-10-29 | 情報処理装置及び文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2291059A JP2902097B2 (ja) | 1990-10-29 | 1990-10-29 | 情報処理装置及び文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04163681A JPH04163681A (ja) | 1992-06-09 |
JP2902097B2 true JP2902097B2 (ja) | 1999-06-07 |
Family
ID=17763902
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2291059A Expired - Lifetime JP2902097B2 (ja) | 1990-10-29 | 1990-10-29 | 情報処理装置及び文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2902097B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7801358B2 (en) * | 2006-11-03 | 2010-09-21 | Google Inc. | Methods and systems for analyzing data in media material having layout |
CN109598185B (zh) * | 2018-09-04 | 2022-09-20 | 创新先进技术有限公司 | 图像识别翻译方法、装置、设备及可读存储介质 |
-
1990
- 1990-10-29 JP JP2291059A patent/JP2902097B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH04163681A (ja) | 1992-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3453134B2 (ja) | 複数の記号ストリングの等価性を判定する方法 | |
JP3139521B2 (ja) | 自動言語決定装置 | |
EP0472313B1 (en) | Image processing method and apparatus therefor | |
JPH05242292A (ja) | 分離方法 | |
JPH0772905B2 (ja) | 記号列の認識方法 | |
JP2902097B2 (ja) | 情報処理装置及び文字認識装置 | |
US20030123730A1 (en) | Document recognition system and method using vertical line adjacency graphs | |
JP2788506B2 (ja) | 文字認識装置 | |
JP2993533B2 (ja) | 情報処理装置及び文字認識装置 | |
JP3083609B2 (ja) | 情報処理装置及びそれを用いた文字認識装置 | |
JP3115139B2 (ja) | 文字切り出し方法 | |
JP3345246B2 (ja) | 文字認識装置及び文字認識方法 | |
JP3135290B2 (ja) | 画像処理方法及び装置 | |
JPH07141465A (ja) | 文書画像の傾き検出方法 | |
JP2827288B2 (ja) | 文字認識装置 | |
JP3276554B2 (ja) | フォーマット認識装置及び文字読取り装置 | |
JP2918363B2 (ja) | 文字分類方法及び文字認識装置 | |
JP3084833B2 (ja) | 特徴抽出装置 | |
JP3428504B2 (ja) | 文字認識装置 | |
JP3207566B2 (ja) | 文字認識方法 | |
JP2576080B2 (ja) | 文字切出し方法 | |
JP3145264B2 (ja) | 文字切出し装置 | |
JP2954218B2 (ja) | 画像処理方法及び装置 | |
JPS6343788B2 (ja) | ||
JP2977244B2 (ja) | 文字認識方法及び文字認識装置 |