JP2794042B2 - 表形式文書の認識装置 - Google Patents
表形式文書の認識装置Info
- Publication number
- JP2794042B2 JP2794042B2 JP1214934A JP21493489A JP2794042B2 JP 2794042 B2 JP2794042 B2 JP 2794042B2 JP 1214934 A JP1214934 A JP 1214934A JP 21493489 A JP21493489 A JP 21493489A JP 2794042 B2 JP2794042 B2 JP 2794042B2
- Authority
- JP
- Japan
- Prior art keywords
- lines
- line
- ruled line
- candidate
- space
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Input (AREA)
Description
【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、表またはこれと同等の構造を含む文書
(以下、表形式文書ともいう)から表の罫線および行間
空白を抽出することで、これらに囲まれた枠内の文字を
正しく認識することが可能な表形式文書の認識装置に関
する。
(以下、表形式文書ともいう)から表の罫線および行間
空白を抽出することで、これらに囲まれた枠内の文字を
正しく認識することが可能な表形式文書の認識装置に関
する。
従来、この種の文字認識装置では、専ら表の罫線のみ
を切り出して文字を認識するようにしている(必要なら
ば、例えば昭和63年電子情報通信学会春季全国大会予稿
集,D−232「文書入力のための表構造の認識」の項参照
のこと)。
を切り出して文字を認識するようにしている(必要なら
ば、例えば昭和63年電子情報通信学会春季全国大会予稿
集,D−232「文書入力のための表構造の認識」の項参照
のこと)。
ところで、表形式文書を構成する罫線の種類として
は、普通は実線,破線,点線などが考えられるが、その
他にも表の中には文字列と文字列との間の行間空白部分
を、表が見辛くなるなどの理由を含めて、人は頭の中で
表の構造を認識し、その部分に罫線を仮想的に引いて表
を理解するようにしている。例えば、住所録や電話帳な
どは最初の氏名,住所,電話番号…という項目を区別す
る以外は罫線はよく省略されるが、それがなくても人は
実質的に罫線の切り出しを行なっている。
は、普通は実線,破線,点線などが考えられるが、その
他にも表の中には文字列と文字列との間の行間空白部分
を、表が見辛くなるなどの理由を含めて、人は頭の中で
表の構造を認識し、その部分に罫線を仮想的に引いて表
を理解するようにしている。例えば、住所録や電話帳な
どは最初の氏名,住所,電話番号…という項目を区別す
る以外は罫線はよく省略されるが、それがなくても人は
実質的に罫線の切り出しを行なっている。
つまり、上記の如き行間空白をも罫線の一種として抽
出しなければ不充分であるにも関わらず、従来は罫線の
みの抽出に終始しており、このため表の構造を正しく認
識できない、という問題が生じている。
出しなければ不充分であるにも関わらず、従来は罫線の
みの抽出に終始しており、このため表の構造を正しく認
識できない、という問題が生じている。
したがって、この発明の課題は行間空白をも罫線の一
種として抽出することにより、表形式文書を正しく認識
し得るようにすることにある。
種として抽出することにより、表形式文書を正しく認識
し得るようにすることにある。
表またはこれと同等の構造を含む文書(表形式文書)
の画像データを入力する画像入力部と、この画像データ
から罫線を認識するとともに、罫線の外接枠を処理領域
として一定幅に分割された各帯領域の投影データから同
一行間空白の連結候補群を検出することにより、罫線と
同等の意味をもつ行間空白を行間罫線として認識する罫
線認識部と、前記画像データのうち罫線および行間空白
で囲まれる文字を認識する文字認識部とを設ける。
の画像データを入力する画像入力部と、この画像データ
から罫線を認識するとともに、罫線の外接枠を処理領域
として一定幅に分割された各帯領域の投影データから同
一行間空白の連結候補群を検出することにより、罫線と
同等の意味をもつ行間空白を行間罫線として認識する罫
線認識部と、前記画像データのうち罫線および行間空白
で囲まれる文字を認識する文字認識部とを設ける。
従来の文字認識装置に対し、罫線と同等の意味をもつ
行間空白を行間罫線として認識する罫線認識部を設ける
ことにより表の構造、ひいては表内の文字を正しく認識
できるようにし、認識率を高める。
行間空白を行間罫線として認識する罫線認識部を設ける
ことにより表の構造、ひいては表内の文字を正しく認識
できるようにし、認識率を高める。
第1図はこの発明の実施例を示すブロック図である。
同図において、1は表形式文書、2はホストCPU、3は
画像入力部、4は画像メモリ、5は罫線認識部、6は文
字認識部である。
同図において、1は表形式文書、2はホストCPU、3は
画像入力部、4は画像メモリ、5は罫線認識部、6は文
字認識部である。
すなわち、ホストCPU2で制御される画像入力部3によ
って、表形式文書1を2値化画像データに変換し、画像
メモリ4に格納する。そして、罫線認識部5によりこの
画像メモリ4の処理領域を指定して罫線、およびこの罫
線と同等の意味をもつ行間空白を行間罫線として抽出
し、これらにより文字枠を当てはめ、文字認識部6でこ
の文字枠内の文字を認識する。
って、表形式文書1を2値化画像データに変換し、画像
メモリ4に格納する。そして、罫線認識部5によりこの
画像メモリ4の処理領域を指定して罫線、およびこの罫
線と同等の意味をもつ行間空白を行間罫線として抽出
し、これらにより文字枠を当てはめ、文字認識部6でこ
の文字枠内の文字を認識する。
以下、行間空白の切り出し方法について説明する。な
お、ここでは第2図に示す如き文書を例とし、この文書
から罫線の部分を削除した第3図の如き2値化画像デー
タから切り出しを行なうものとする。また、罫線につい
ては従来と同様の適宜な手法にて抽出するものとする。
お、ここでは第2図に示す如き文書を例とし、この文書
から罫線の部分を削除した第3図の如き2値化画像デー
タから切り出しを行なうものとする。また、罫線につい
ては従来と同様の適宜な手法にて抽出するものとする。
第2図の2値化画像から求められる罫線の最小外接枠
Fを行間空白の処理領域として、或る一定幅(帯)に従
って例えば第4図のように分割し、この各帯毎に第5図
の如く投影をとる。次に、この投影データから文字候
補,行間候補を検出するが、そのために投影データを第
6図のように或るレベルVで再度2値化し、この2値化
データから“0"が一定幅以上連続する個所を行間候補、
また“1"が一定幅以上連続する個所を文字候補として、
第7図のように抽出する。第7図のLは行間候補、L0は
着目行間候補、Mは文字候補をそれぞれ示している。
Fを行間空白の処理領域として、或る一定幅(帯)に従
って例えば第4図のように分割し、この各帯毎に第5図
の如く投影をとる。次に、この投影データから文字候
補,行間候補を検出するが、そのために投影データを第
6図のように或るレベルVで再度2値化し、この2値化
データから“0"が一定幅以上連続する個所を行間候補、
また“1"が一定幅以上連続する個所を文字候補として、
第7図のように抽出する。第7図のLは行間候補、L0は
着目行間候補、Mは文字候補をそれぞれ示している。
さて、行間候補は空白部分をすべて抽出するため、そ
の大きさは様々であり、場合によっては帯全体が行間候
補となることもあり得ることから、次に行間候補の分割
を実行する。このため、第8図のように、或る着目する
行間候補L0に対し、それに隣接している前後の帯の候補
群Lの中、L0に重なる行間候補の数をカウントする。第
8図の例では前方向に3候補、後方向に2候補重なって
いる。そして、第9図のように、カウントした結果の多
かった方向、ここでは前方向の3候補にならって、既に
求められている罫線の傾きを使って分割のずれ幅Hを計
算し、そのずれ幅Hをもとに着目候補L0を元の幅内で分
割する。こうして取り出された複数の候補を新たに分割
候補Dとする。
の大きさは様々であり、場合によっては帯全体が行間候
補となることもあり得ることから、次に行間候補の分割
を実行する。このため、第8図のように、或る着目する
行間候補L0に対し、それに隣接している前後の帯の候補
群Lの中、L0に重なる行間候補の数をカウントする。第
8図の例では前方向に3候補、後方向に2候補重なって
いる。そして、第9図のように、カウントした結果の多
かった方向、ここでは前方向の3候補にならって、既に
求められている罫線の傾きを使って分割のずれ幅Hを計
算し、そのずれ幅Hをもとに着目候補L0を元の幅内で分
割する。こうして取り出された複数の候補を新たに分割
候補Dとする。
次に、分割候補Dについて、それに隣接している帯の
候補群の中から、一番重なりの大きな候補を検出してこ
れを同じ行間の候補として連結し、続いてその候補の中
から次の候補を同様にして検出して連続して行く。この
処理を候補が検出されなくなるまで繰り返し、第10図の
ように同一行間空白の連結候補群Jを決定する。また、
このような連結処理を間違いなく行なうために、元々行
間候補から分割されて得た分割候補と分割候補の間に挟
まれた行間空白にも注目する。例えば、第11図に示す行
間候補Lが前後方向のカウントの結果、第12図に示すよ
うに2つの分割候補Dに分割されたとすると、残りの行
間空白Eの部分は文字候補のまとまりと比較して、行間
ではあるが文字列の一部である可能性がある。そこで、
行間あるいは分割候補との間にあり、その間の幅が或る
レベルW以上の条件を満たせば、これを仮の文字候補P
として第13図の如く代入する。このようにすることで、
例えば第14図のような候補群G,G1の連結のままではその
接合部分のところが罫線として、本来は不必要であるの
に抽出されてしまうことになる。これを第15図のよう
に、仮の文字候補Pを代入することで、文字候補群G1に
連結することにより、不必要な罫線と理解できる。
候補群の中から、一番重なりの大きな候補を検出してこ
れを同じ行間の候補として連結し、続いてその候補の中
から次の候補を同様にして検出して連続して行く。この
処理を候補が検出されなくなるまで繰り返し、第10図の
ように同一行間空白の連結候補群Jを決定する。また、
このような連結処理を間違いなく行なうために、元々行
間候補から分割されて得た分割候補と分割候補の間に挟
まれた行間空白にも注目する。例えば、第11図に示す行
間候補Lが前後方向のカウントの結果、第12図に示すよ
うに2つの分割候補Dに分割されたとすると、残りの行
間空白Eの部分は文字候補のまとまりと比較して、行間
ではあるが文字列の一部である可能性がある。そこで、
行間あるいは分割候補との間にあり、その間の幅が或る
レベルW以上の条件を満たせば、これを仮の文字候補P
として第13図の如く代入する。このようにすることで、
例えば第14図のような候補群G,G1の連結のままではその
接合部分のところが罫線として、本来は不必要であるの
に抽出されてしまうことになる。これを第15図のよう
に、仮の文字候補Pを代入することで、文字候補群G1に
連結することにより、不必要な罫線と理解できる。
そして、最終的に求められた連結罫線候補群の正当性
について、それが行間候補(L)であったか、分割候補
(D)であったか、文字候補(M)であったか、あるい
は仮の文字候補(P)であったのかをカウントし、次の
条件、 (L)のカウント数+(D)のカウント数> (M)のカウント数 を考慮して判別する。第16図のような連結候補群がある
場合の、各カウント数はL=4,D=2,M=1であるから条
件を満たしており、したがって行間空白が存在すると考
えることができる。また、上記の条件を満たしたものに
ついては、同一行間空白の候補群の領域を、帯の投影と
は直角方向に投影をとり(部分投影)、この投影データ
で“0"の部分が或るレベル以上連続していれば、第17図
のように同一行間空白として両端の位置が検出され、同
一行間空白Kが決定される。
について、それが行間候補(L)であったか、分割候補
(D)であったか、文字候補(M)であったか、あるい
は仮の文字候補(P)であったのかをカウントし、次の
条件、 (L)のカウント数+(D)のカウント数> (M)のカウント数 を考慮して判別する。第16図のような連結候補群がある
場合の、各カウント数はL=4,D=2,M=1であるから条
件を満たしており、したがって行間空白が存在すると考
えることができる。また、上記の条件を満たしたものに
ついては、同一行間空白の候補群の領域を、帯の投影と
は直角方向に投影をとり(部分投影)、この投影データ
で“0"の部分が或るレベル以上連続していれば、第17図
のように同一行間空白として両端の位置が検出され、同
一行間空白Kが決定される。
この発明によれば、表形式文書で表を構成する実線,
破線などの罫線以外に、これと同様に扱われる行間空白
部分も行間罫線として切り出すようにしたので、これを
用いて表を構成することの多い住所録や電話帳などの表
構造を理解し、その結果にもとづいて枠内の文字を認識
することによって、各項目間のデータの対応付けが可能
となり、データベースの作成も容易になる、という利点
が得られる。
破線などの罫線以外に、これと同様に扱われる行間空白
部分も行間罫線として切り出すようにしたので、これを
用いて表を構成することの多い住所録や電話帳などの表
構造を理解し、その結果にもとづいて枠内の文字を認識
することによって、各項目間のデータの対応付けが可能
となり、データベースの作成も容易になる、という利点
が得られる。
第1図はこの発明の実施例を示すブロック図、第2図は
文書例を説明するための説明図、第3図は第2図から罫
線を削除した例を説明するための説明図、第4図は第2
図の帯分割方法の一例を説明するための説明図、第5図
は第4図の垂直軸上の投影データを説明するための説明
図、第6図は投影データの再2値化方法を説明するため
の説明図、第7図は行間候補の抽出例を説明するための
説明図、第8図は着目行間候補の例を説明するための説
明図、第9図はその分割例を説明するための説明図、第
10図は行間候補の連結例を説明するための説明図、第11
図は仮の文字候補を必要とする例を説明するための説明
図、第12図は行間空白を説明するための説明図、第13図
は仮の文字候補の抽出方法を説明するための説明図、第
14図は仮の文字候補を代入する前の状態を説明するため
の説明図、第15図は仮の文字候補を代入した後の状態を
説明するための説明図、第16図は条件式を満足する候補
群の例を説明するための説明図、第17図はその部分投影
データを説明するための説明図である。 符号説明 1……表形式文書、2……ホストCPU、3……画像入力
部、4……画像メモリ、5……罫線認識部、6……文字
認識部、F……最小外接枠、V……2値化レベル、L…
…行間候補、L0……着目行間候補、M……文字候補、H
……分割ずれ幅、J……連結候補群、G……文字候補
群、G1……行間候補群、E……行間空白、W……レベル
幅、P……仮の文字候補、K……罫線。
文書例を説明するための説明図、第3図は第2図から罫
線を削除した例を説明するための説明図、第4図は第2
図の帯分割方法の一例を説明するための説明図、第5図
は第4図の垂直軸上の投影データを説明するための説明
図、第6図は投影データの再2値化方法を説明するため
の説明図、第7図は行間候補の抽出例を説明するための
説明図、第8図は着目行間候補の例を説明するための説
明図、第9図はその分割例を説明するための説明図、第
10図は行間候補の連結例を説明するための説明図、第11
図は仮の文字候補を必要とする例を説明するための説明
図、第12図は行間空白を説明するための説明図、第13図
は仮の文字候補の抽出方法を説明するための説明図、第
14図は仮の文字候補を代入する前の状態を説明するため
の説明図、第15図は仮の文字候補を代入した後の状態を
説明するための説明図、第16図は条件式を満足する候補
群の例を説明するための説明図、第17図はその部分投影
データを説明するための説明図である。 符号説明 1……表形式文書、2……ホストCPU、3……画像入力
部、4……画像メモリ、5……罫線認識部、6……文字
認識部、F……最小外接枠、V……2値化レベル、L…
…行間候補、L0……着目行間候補、M……文字候補、H
……分割ずれ幅、J……連結候補群、G……文字候補
群、G1……行間候補群、E……行間空白、W……レベル
幅、P……仮の文字候補、K……罫線。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06K 9/00 - 9/82
Claims (1)
- 【請求項1】表またはこれと同等の構造を含む文書(表
形式文書)の画像データを入力する画像入力部と、 この画像データから罫線を認識するとともに、罫線の外
接枠を処理領域として一定幅に分割された各帯領域の投
影データから同一行間空白の連結候補群を検出すること
により、罫線と同等の意味をもつ行間空白を行間罫線と
して認識する罫線認識部と、 前記画像データのうち罫線および行間空白で囲まれる文
字を認識する文字認識部と、 を備えてなることを特徴とする表形式文書の認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1214934A JP2794042B2 (ja) | 1989-08-23 | 1989-08-23 | 表形式文書の認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1214934A JP2794042B2 (ja) | 1989-08-23 | 1989-08-23 | 表形式文書の認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0378892A JPH0378892A (ja) | 1991-04-04 |
JP2794042B2 true JP2794042B2 (ja) | 1998-09-03 |
Family
ID=16663995
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1214934A Expired - Fee Related JP2794042B2 (ja) | 1989-08-23 | 1989-08-23 | 表形式文書の認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2794042B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5884560B2 (ja) * | 2012-03-05 | 2016-03-15 | オムロン株式会社 | 文字認識のための画像処理方法、およびこの方法を用いた文字認識装置およびプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS55157072A (en) * | 1979-05-07 | 1980-12-06 | Fujitsu Ltd | Control system for document data |
JPH0664624B2 (ja) * | 1984-03-02 | 1994-08-22 | 日本電気株式会社 | 光学文字読取方式 |
JP2559356B2 (ja) * | 1984-08-24 | 1996-12-04 | 株式会社日立製作所 | 文書画像処理方法 |
-
1989
- 1989-08-23 JP JP1214934A patent/JP2794042B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH0378892A (ja) | 1991-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3139521B2 (ja) | 自動言語決定装置 | |
JP3452774B2 (ja) | 文字認識方法 | |
KR970017047A (ko) | 문서 화상으로부터의 타이틀 추출 장치 및 방법 | |
JP2794042B2 (ja) | 表形式文書の認識装置 | |
JPH08320914A (ja) | 表認識方法および装置 | |
JP2000090194A (ja) | 画像処理方法および画像処理装置 | |
JP2918666B2 (ja) | 文字画像切出し方法 | |
JP3188154B2 (ja) | 文字認識処理方法 | |
JP2936426B2 (ja) | 英文字認識装置 | |
JP2976445B2 (ja) | 文字認識装置 | |
JPH0210472B2 (ja) | ||
JPH0713994A (ja) | 文字認識装置 | |
JP2985243B2 (ja) | 文字認識方法 | |
JPH03142691A (ja) | 表形式文書認識方式 | |
JP2746345B2 (ja) | 文字認識の後処理方法 | |
JP2931485B2 (ja) | 文字切出し装置及び方法 | |
JP2917310B2 (ja) | 単語照合における単語辞書検索方式 | |
JP3151866B2 (ja) | 英文字認識方法 | |
JP3116452B2 (ja) | 英文字認識装置 | |
JP3100786B2 (ja) | 文字認識後処理方式 | |
JP2509992B2 (ja) | 分離文字の統合方式 | |
JP2576984B2 (ja) | 文字認識処理装置 | |
JP3377719B2 (ja) | 文字認識装置及びコンピュータ読み取り可能な記録媒体 | |
JP2002014981A (ja) | 文書ファイリング装置 | |
JPH06162263A (ja) | 文字認識装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080626 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090626 Year of fee payment: 11 |
|
LAPS | Cancellation because of no payment of annual fees |