JPH10240901A - 文書ファイリング装置及び文書ファイリング方法 - Google Patents

文書ファイリング装置及び文書ファイリング方法

Info

Publication number
JPH10240901A
JPH10240901A JP9037869A JP3786997A JPH10240901A JP H10240901 A JPH10240901 A JP H10240901A JP 9037869 A JP9037869 A JP 9037869A JP 3786997 A JP3786997 A JP 3786997A JP H10240901 A JPH10240901 A JP H10240901A
Authority
JP
Japan
Prior art keywords
document
item
layout
character
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9037869A
Other languages
English (en)
Other versions
JP3598711B2 (ja
Inventor
Yasuhiro Okada
康裕 岡田
Fumio Yoda
文夫 依田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP3786997A priority Critical patent/JP3598711B2/ja
Publication of JPH10240901A publication Critical patent/JPH10240901A/ja
Application granted granted Critical
Publication of JP3598711B2 publication Critical patent/JP3598711B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 レイアウト変動の大きい文書から自動的に文
書項目を抽出する。 【解決手段】 文書の画像を蓄積するイメージファイル
と、文書の種類ごとに文書構造のレイアウト規則を記憶
する文書レイアウト知識ファイルと、文書の種類および
文書項目ごとの記述内容を記憶する文書コンテンツ知識
ファイルと、文書レイアウト知識ファイルに記述された
知識に従い文書画像のレイアウトを解析するレイアウト
解析手段と、文書画像から切り出された文字パターンを
認識する文字認識手段と、レイアウト解析手段と文字認
識手段で得られる文書レイアウト情報および文字認識結
果と文書レイアウト知識ファイルおよび文書コンテンツ
知識ファイルの内容を照合することにより文書を構成す
る項目ごとに文字認識結果を分類する文書項目分類手段
を備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、文書内の文字を
認識して得られる文字認識結果あるいは文書のイメージ
をファイリングする際、文書を構成する項目を自動的に
分類しファイリングする文書ファイリング装置及びその
方法に関するものである。
【0002】
【従来の技術】従来の項目自動分類を行う文書ファイリ
ング装置は、文書構造のレイアウト情報を用いて文書項
目の分類を行っていた。以下、特開平8−87528号
公報に示された文書ファイリング装置を例にとり動作を
説明する。
【0003】図44に示すとおり従来の文書ファイリン
グ装置は、イメージファイル1に格納された文書画像か
ら画像処理手段390により文字列等のパターン成分を
抽出した後、この文字列等のパターン成分を文書レイア
ウトに関する規則を格納した文書レイアウト知識ファイ
ル8と照合する。照合結果をもとに文書を構成する各項
目に対応付けて文字認識結果を蓄積手段5に保持し、検
索手段6により文書項目ごとの検索を可能にし、出力手
段7で出力している。
【0004】従来の文書ファイリング装置の一動作例を
図面を用いて説明する。従来の文書ファイリング装置に
おいて、図4(b)に示す文書のレイアウト情報を文書
レイアウト知識ファイル8に保持し、図4(a)に示す
文書画像に対して項目分類を試みる場合、文書レイアウ
ト知識ファイル8には図9に示すように項目ごとの座標
情報が格納されている。ここで、図9の座標情報70に
格納された座標及びサイズの値は文書の幅と高さそれぞ
れを100とした時の百分比で格納されている。
【0005】文書画像の項目分類においては、まず画像
処理手段390で文字列等のパターン成分を抽出し、文
書レイアウト知識ファイル8と照合できるレイアウト情
報を抽出する。具体的には文書画像に対して文字列切り
出し及び文字切り出しを行い、文字列の座標情報を得
る。図4(a)に示す文書画像の文字列切り出し及び文
字切り出し結果を図10に示す。図10で黒正方形は文
字切り出し結果80,破線矩形は文字列切り出し結果を
示す。
【0006】次に図10の各文字列に対して、座標・サ
イズを抽出する。抽出した結果を図11に示す。図11
においてブロックは各文字列に対応して連番をふり、各
ブロックの左上点座標と幅,高さを抽出する。
【0007】最後に、図9に示した文書レイアウト知識
ファイルの内容と、図11のレイアウト情報との照合を
とる。照合は下記(1)式に従って、各ブロックと項目
との照合度pijを算出することにより実現する。例え
ば、図9の座標情報70からタイトルの項目に対応する
領域の面積は60(幅)×5(高さ)=300,図11
の第3ブロック104に対応する領域の面積は50
(幅)×5(高さ)=250,両者の重なりあう領域の
面積は250であるので、第3ブロック104に対する
タイトルとの照合度Pは100×250×2/(300
+250)=91となる。すべてのブロックに対して上
記の照合度の算出を行い、図12に示す照合度を得る。
各項目で照合度が最大となるブロックを、対応付け結果
として出力する。図12の場合、項目「論文番号」10
0に対しては第2ブロック103,項目「タイトル」1
01に対しては第3ブロック104,項目「著者」10
2に対しては第4ブロック105が対応付けられ、正し
い結果が得られる。
【0008】 pij=100×(項目iとブロックjの重なり領域の面積)×2/(項目iの面積 +ブロックjの面積)・・・(1)
【0009】上記に示した手段により、項目に対応する
記入量が大きく変動して項目の位置ずれが発生する等の
理由で文書レイアウト変動が大きい、図5(a)乃至図
5(b)に示すような文書に対して項目分類を行った場
合の例を次に示す。上記と同様の動作により、図5
(a)に示す文書画像に対する各文書項目の座標情報を
抽出し、図13に示す文書レイアウト知識ファイルを得
る。
【0010】文書画像の項目分類においては上記の例と
同様に、文字列の座標情報を得る。図5(b)に示す文
書画像の各文字列に対して座標・サイズを抽出する。こ
こで、文書レイアウト知識ファイルを作成した図5
(a)に示す文書画像では、複数の連続する文字列で構
成される項目も存在するため、文書レイアウト知識ファ
イルと照合するレイアウト情報も、図14に示すように
複数文字列を対象として座標・サイズを抽出する。図1
4においては、開始ブロックから終了ブロックまでの連
続する複数文字列に対する座標・サイズ情報を示した。
【0011】次に、図13に示した文書レイアウト知識
ファイルの内容と、図14のレイアウト情報との照合を
とる。照合は上記の例と同様に、(1)式を用いて行
う。図15に照合度の算出結果を示す。この結果、会議
名称に対しては第2ブロックと第3ブロック,開催場所
に対しては第4ブロック,開催日時に対しては第5ブロ
ック,出席者に対しては第6ブロックと第7ブロックが
対応付き、図5(b)の項目分類結果30が照合結果と
して得られ、誤った結果が出力される。
【0012】また、表の論理構造が固定した表形式文書
に対する項目分類は、文書レイアウト知識ファイル8に
表の構造を記述した情報を保持して、文書画像から抽出
した表の構造とを照合することにより、従来の文書ファ
イリング装置でも実現できる。しかし、図6(a)及び
図6(b)に示すような表の論理構造が変動する表形式
文書に対して文書項目の分類を行う場合、文書画像から
抽出した表の構造と、文書レイアウト知識ファイル8に
格納された表の構造が大きく異なり、誤った項目分類が
行なわれる。
【0013】また、従来の文書ファイリング装置では、
図7(a)及び図7(b)に示すように文書項目の境界
がレイアウトの情報のみで分割できないような文書に対
しては誤った項目分類が行なわれる。例えば、図7
(a)に示す文書画像を元に文書レイアウト知識ファイ
ル8を作成し、図7(b)に示す文書画像の項目分類を
行った場合、図7(b)の項目分類結果B50の誤った
結果が出力される。
【0014】さらに、図8(a)及び図8(b)に示す
ように文書項目の一部が省略された文書に対しては、省
略された文書項目を同定することができず、誤った項目
分類が行なわれる。例えば、図8(a)に示す文書画像
を元にタイトル61,著者62,英字著者63,著者所
属64の4項目に対して文書レイアウト知識ファイルを
作成しておき、英文著者が省略された図8(b)の文書
画像に対して項目分類を行った場合、図8(b)の項目
分類結果C60が各項目に対して抽出され、誤った結果
として出力される。
【0015】
【発明が解決しようとする課題】上記のように従来の文
書ファイリング装置は、文書のレイアウト情報のみを用
いて文書項目の分類を行っているため、レイアウト変動
の大きい文書に対して、正しく文書項目ごとの分類を行
うことが困難である。
【0016】また、表形式の文書に対しては表の論理構
造が変動するような文書画像に対して正しく文書項目を
分類することができない。
【0017】さらに、文書項目の境界がレイアウトの情
報のみで分割できない文書画像,文書項目の一部が省略
された文書画像に対して正しく文書項目を分類すること
ができない。
【0018】この発明は上記の課題を解決し、レイアウ
ト変動が大きく,項目の省略が発生しても正しく文書の
項目を自動分類する文書ファイリング装置及びその方法
を提供することを目的とする。
【0019】
【課題を解決するための手段】請求項1の発明は上記の
課題を解決するため、文書の画像を蓄積するイメージフ
ァイルと、文書の種類ごとに文書構造のレイアウト規則
を記憶する文書レイアウト知識ファイルと、文書の種類
および文書項目ごとの記述内容の規則を記憶する文書コ
ンテンツ知識ファイルと、文書レイアウト知識ファイル
に記述された知識に従い文書画像のレイアウトを解析す
るレイアウト解析手段と、文書画像から切り出された文
字パターンを認識する文字認識手段と、レイアウト解析
手段と文字認識手段で得られる文書レイアウト情報およ
び文字認識結果と文書レイアウト知識ファイルおよび文
書コンテンツ知識ファイルの内容を照合することにより
文書を構成する項目ごとに文字認識結果を分類する文書
項目分類手段と、文書項目分類手段により得た文書項目
ごとに分類された文字認識結果を蓄積する蓄積手段と、
検索要求を受けて蓄積手段に対して検索を行い検索要求
を満たす文書を同定する検索手段と、検索手段により同
定された文書の文書画像あるいは文字認識結果をイメー
ジファイルあるいは文字認識結果ファイルから出力する
出力手段を有することを特徴とする。
【0020】請求項2の発明は、レイアウト解析手段
を、文書を構成する罫線を抽出する罫線抽出手段と罫線
で囲まれる領域を抽出する候補領域抽出手段とで構成し
たことを特徴とする。
【0021】請求項3の発明は、文書項目分類手段に使
用字種判定手段を設け、文書コンテンツ知識ファイルに
格納された文書項目を構成する字種情報と照合するよう
に構成したことを特徴とする。
【0022】請求項4の発明は、省略可能性指示手段を
設け、項目の対応関係を求める際に省略の可能性のある
項目に対しては空の項目を対応付けるように文書項目分
類手段を構成したことを特徴とする。
【0023】請求項5の発明は、文書項目分類手段を文
書項目の相対的な位置関係とコンテンツの分布内容に従
い、文書項目の分類を行う弛緩整合文書項目分類手段で
構成したことを特徴とする。
【0024】請求項6の発明は、文書の画像を読取りイ
メージファイルに蓄積する画像蓄積ステップと、文書の
種類ごとに文書構造のレイアウト規則が記憶された文書
レイアウト知識ファイルの知識に従い上記イメージファ
イルに蓄積された文書画像のレイアウトを解析するレイ
アウト解析ステップと、このレイアウト解析ステップに
より文書画像から切り出された文字パターンを認識する
文字認識ステップと、上記レイアウト解析ステップで得
られる文書レイアウト情報と上記文書レイアウト知識フ
ァイルの内容および上記文字認識ステップで得られる文
字認識結果と文書の種類および文書項目ごとの記述内容
が記憶された文書コンテンツ知識ファイルの内容を照合
することにより文書を構成する項目ごとに文字認識結果
を分類する文書項目分類ステップと、この文書項目分類
ステップによって得られた文書項目ごとに分類された文
字認識結果を文字認識結果ファイルに格納する文字認識
結果記憶ステップとを有することを特徴とする。
【0025】
【発明の実施の形態】
実施の形態1 以下、この発明を実施の形態に基づいて説明する。図1
は、請求項1の発明の文書ファイリング装置の構成図で
ある。イメージファイル1にはスキャナー等によって読
み出された(図2の読取りステップS1)文書画像が保
持され(図2の画像蓄積ステップS2)、イメージファ
イル1に格納された文書画像はレイアウト解析手段2に
入力される。レイアウト解析手段2では、予め作成した
読取対象文書のレイアウト知識を格納した文書レイアウ
ト知識ファイル8を参考にして、文字列,文字の座標情
報等の文書レイアウトに関する情報を文書画像から抽出
する文書レイアウト解析をする(図2のレイアウト解析
ステップS3)。次に文字認識手段3でレイアウト解析
手段2によるレイアウト解析の結果、1文字ごとに切り
出された文字画像を文字コードに変換する(図2の文字
認識ステップS4)。文書項目分類手段4では、レイア
ウト解析の結果得られた文書レイアウト情報と文書レイ
アウト知識ファイル8とを比較すると共に、文字認識手
段3によって得られた文字コードと文書の記述内容に関
する知識を格納した文書コンテンツ知識ファイル9とを
比較して文書項目ごとに文字認識結果を自動的に分類す
る(図2の文書項目分類ステップS5)。蓄積手段5で
は、文書項目分類手段4によって得られる文書項目ごと
の文字認識結果を文字認識結果ファイル10に格納する
(図2の文字認識結果記憶ステップS6)。検索手段6
は、入力された検索要求(図3の要求入力ステップS1
1)を受けて上記文字認識結果ファイル10に対して検
索を行い、検索要求を満たす文書を同定する(図3の検
索ステップS12)。出力手段7は、検索手段6によっ
て同定された文字認識結果を文字認識結果ファイル10
から抽出、あるいは文字認識結果ファイル10から抽出
された文字認識結果に対応する文書画像をイメージファ
イル1から抽出し(図3の抽出ステップS13)、この
抽出された文字認識結果、及び/又は文書画像を出力す
る(図3の出力ステップS14)。
【0026】以下、図5,図13〜図20を用いて、図
1に示す構成の発明の動作を詳細に説明する。
【0027】図5は、イメージファイルに格納された文
書画像の一例を示す説明図である。図13は、文書レイ
アウト知識ファイル8の内容の一例を示す説明図であ
り、図において、110は開催日時の項目の座標情報を
示す。図14は、レイアウト解析手段2の出力内容の一
例を示す説明図であり、120は開始ブロック,121
は終了ブロック,122は各開始ブロックおよび終了ブ
ロックの座標情報,123は‘開始ブロック5’と‘開
始ブロック6’の領域に対応する座標情報を示す。
【0028】図15は、文書項目分類手段4の文書レイ
アウトに関する動作を説明する説明図であり、図におい
て、130は‘開始ブロック5’と‘開始ブロック6’
の領域と開催日時の項目との照合度を示す。
【0029】図16は、文書コンテンツ知識ファイル9
の内容の一例を示す説明図であり、図において、140
は開催場所の項目に対応するキーワード情報,141は
キーワード‘開催場所’,142はキーワード‘場
所’,143はキーワード‘会議室’,144はキーワ
ード‘ルーム’,145はキーワード‘ミーティン
グ’,146は禁止キーワード‘会議名称’,147は
禁止キーワード‘開催日時’を示す。
【0030】図17は、文字認識手段3の出力結果の一
例を示す説明図であり、150は開始ブロック2’と
‘開始ブロック3’の領域に対応する文字認識結果Aを
示す。
【0031】図18は、文書項目分類手段4の文書コン
テンツに関する動作を説明する説明図であり、図におい
て、160は‘開始ブロック2’と‘開始ブロック3’
の領域と開催場所の項目との照合度を示す。
【0032】図19は、文書項目分類手段4の文書レイ
アウトと文書コンテンツに関する照合結果の統合動作を
説明する説明図であり、図において、170は‘ブロッ
ク1’の領域と会議名称の項目との照合度,171は
‘開始ブロック2’と‘開始ブロック3’の領域と開催
場所の項目との照合度,172は‘開始ブロック4’と
‘開始ブロック5’の領域と開催日時の項目との照合
度,173は‘開始ブロック6’と‘開始ブロック7’
の領域と出席者の項目との照合度を示す。
【0033】図20は、文書項目分類手段4の文書項目
と文字列の対応動作を説明する説明図であり、図におい
て、180は会議名称,開催場所,開催日時,出席者と
ブロックとの対応関係,181は照合度,182は最大
の照合度を与えるブロックの組合せを示す。
【0034】まずイメージファイルから図5(b)に示
す文書画像を読み出し、レイアウト解析手段2によって
文書レイアウトを解析する。レイアウト解析は、文書レ
イアウト知識ファイル8に記載された内容を利用して、
文書画像内の文字列,文字の切り出しを行う。例えば、
図13に記載された文書レイアウト知識の幅,高さの比
から、‘会議名称’111,‘開催場所’112,‘開
催日時’113,‘出席者’114ともに横書きで記載
されていると判定し、文書が横書きで記載されているこ
とを前提に文字列切り出しを行い、その後文字切り出し
を実施する。
【0035】上記で得た文字列切り出し結果から、複数
の連続した文字列を組み合わせた矩形領域を形成し、そ
れぞれの領域に対する座標とサイズ情報を抽出し、図1
4に示すレイアウト情報を作成する。図14において、
開始ブロック120はブロックを形成する先頭の文字列
の順番を示し、終了ブロック121はブロックを形成す
る終端の文字列の順番を示す。領域座標情報122は、
開始ブロックから終了ブロックまでの矩形領域の座標・
サイズ情報を示す。
【0036】文字認識手段3では、レイアウト解析手段
2により得られた文字列切り出し,文字切り出し結果を
もとに文字画像を文字コードに変換し、図17に示す文
字認識結果を得る。
【0037】次に、文書項目分類手段4では、文書レイ
アウトと文書コンテンツ双方の情報を用いて文書の項目
を分類する。
【0038】文書レイアウト情報を用いた分類は、図1
4に示す文書レイアウト情報と図13に示す文書レイア
ウト知識とを照合することにより実現する。照合は、図
14に示した開始ブロックから終了ブロックまでの矩形
領域の座標情報と、図13に示した文書レイアウト知識
の各項目の座標情報とを用い、上記(1)式に従って照
合度を各項目に対して算出する。
【0039】例えば、図14における開始ブロックが
‘5’で終了ブロックが‘6’の領域に対する座標情報
123で形成される領域の面積は90(幅)×10(高
さ)=900、図13における開催日時に対する座標情
報110で形成される領域の面積は90(幅)×3(高
さ)=270、双方の領域が重畳する領域の面積は27
0なので、照合度は、100×270×2/(900+
270)=46となり、図14における開始ブロックが
‘5’で、終了ブロックが‘6’の領域に対する座標情
報123と開催日時との照合度として図15に示す‘4
6’130が得られる。上記の方法で、すべての領域お
よび文書項目に対して文書レイアウト情報による照合度
を算出する。
【0040】文書コンテンツを用いた分類は、図17に
示す文字認識結果Aと図16に示す文書コンテンツ知識
とを照合することにより実現する。例えば照合は、図1
7に示した文字認識結果Aの連続する文字で構成される
文字群と図16に示す文書コンテンツ知識とを照合し
て、キーワードとして登録された文字列が合致した場合
は下記(2)式による照合度pcを加算し、存在しては
ならないキーワードが合致した場合は下記(3)式によ
る負の照合度peを加算して、照合度pc、peから総
合的な照合度paを下記(4)式に従って算出する。
【0041】 pc = 20×(合致したキーワードの文字数) ・・・(2)
【0042】 pe = −50×(合致したキーワードの個数) ・・・(3)
【0043】Pa = pc + pe ・・・(4)
【0044】ここで具体的に、図19における開始ブロ
ックが‘2’で終了ブロックが‘3’の領域と開催場所
との照合度を求める場合について説明する。開始ブロッ
クが‘2’で終了ブロックが‘3’の領域に対応する図
17の認識結果150と図16の開催場所に対するキー
ワード情報140とを照合する。
【0045】まず、開催場所の先頭に位置するキーワー
ド‘開催場所’141及び‘場所’142と認識結果1
50との照合をとる。開催場所の先頭に位置するキーワ
ードは、領域の先頭から始まる文字列のみを対象にして
照合を行う。この場合、認識結果150の先頭の文字列
は、キーワード‘開催場所’141,‘場所’142の
いずれとも一致しないので、照合度の加算は行わない。
【0046】次に、開催場所の末尾に位置するキーワー
ド‘会議室’143及び‘ルーム’144と認識結果1
50との照合をとる。開催場所の末尾に位置するキーワ
ードは、領域の末尾で終了する文字列のみを対象にして
照合を行う。この場合、認識結果150の末尾の文字列
はキーワード‘会議室’143と一致するので、上記
(2)式に従って20×3(文字数)=60を照合度に
加算する。
【0047】位置が任意のキーワード‘ミーティング’
145と認識結果150との照合は、全認識結果を対象
にして照合を行う。この場合、認識結果150にキーワ
ード‘ミーティング’145は一度も現れないので、照
合度の加算は行わない。
【0048】禁止キーワード‘会議名称’146及び
‘開催日時’147との照合は、全認識結果を対象にし
て照合を行う。照合が成立した場合は、入ってはならな
いキーワードが存在したとして照合度を減算する。この
場合、認識結果150の先頭の文字列がキーワード‘会
議名称’143と一致するので、上記(3)式に従って
照合度を50だけ減算する。
【0049】算出した加算分と減算分を足しあわせ、開
始ブロックが‘2’で終了ブロックが‘3’の領域と開
催場所との最終的な照合度‘10’160を得る。
【0050】上記の方法で、すべての領域および文書項
目に対して文書コンテンツ情報による照合度を算出す
る。
【0051】次に文書レイアウト,文書コンテンツ双方
の情報に対する照合度を上記により求めた後、双方の照
合度を加算し、図19に示す連続する文字列領域と文書
項目との総合的な照合度を算出する。
【0052】連続する文字列領域と文書項目との総合的
な照合度を算出した後、図13に示した文書レイアウト
知識の項目の座標値から、読取対象文書が上から順に
‘会議名称’,‘開催場所’,‘開催日時’,‘出席
者’の順番で配列されていることを求める。これをもと
に、文書の各項目に対応する可能性を持つ連続文字列領
域の組合せを抽出する。図5(b)に示した文書の場
合、7行の文字列から4領域を抽出し、各領域に対して
必ず1行以上の文字列を割当て、上から‘会議名称’,
‘開催場所’,‘開催日時’,‘出席者’の順に配列す
る組合せを抽出する。その結果、図20に示す組合せが
抽出できる。
【0053】次に、それぞれの領域と文書項目の組合せ
を行った場合の、文書全体としてみた場合の照合度を求
める。図20に示す領域組合せ例180の場合、それぞ
れの項目に対する照合度を図19により求める。会議名
称は開始ブロック‘1’,終了ブロック‘1’の領域が
対応しており、図19から照合度は‘−50’170と
なる。開催場所は開始ブロック‘2’,終了ブロック
‘3’の領域が対応しており、図19から照合度は‘1
0’171となる。開催日時は開始ブロック‘4’,終
了ブロック‘5’の領域が対応しており、図19から照
合度は‘136’172となる。開催場所は開始ブロッ
ク‘6’,終了ブロック‘7’の領域が対応しており、
図19から照合度は‘38’173となる。これらの照
合度を加算して、領域組合せ例180に対する照合度
‘134’181を得る。
【0054】上記の方法により、文書の各項目に対応す
る可能性を持つ連続文字列領域の組合せのすべてに対し
て、照合度を算出する。照合度算出の後、照合度が最も
大きくなる組合せを項目分類結果とする。図20の場
合、会議名称に対して2行目の文字列,開催場所に対し
て3行目の文字列,開催日時に対して4行目の文字列,
出席者に対して5行目の文字列を対応付けた時、最大の
照合度を示す。その結果、正しい項目分類結果が得られ
る。
【0055】蓄積手段5では、上記の結果得られた文書
項目ごとに分類された文字認識結果を文字認識結果ファ
イル10に蓄積する。
【0056】実施の形態2 以下、図面に基づいてこの発明の実施の形態2について
説明する。図40は、請求項2の発明の文書ファイリン
グ装置の構成図である。イメージファイル1には表形式
の文書画像が保持され、イメージファイル1に格納され
た表形式の文書画像はレイアウト解析手段2に入力され
る。レイアウト解析手段2では、罫線抽出手段410に
より文書画像内に存在する罫線を抽出し、候補領域抽出
手段411により上下左右の罫線の組合せで構成される
項目領域の候補を抽出した後、表の内部に記載された文
字列と文字の切り出しを行う。レイアウト解析に際して
は、予め作成した読取対象文書のレイアウト知識を格納
した文書レイアウト知識ファイル8を参考にして文書レ
イアウトを解析する。次に文字認識手段3では表領域内
の文字画像を文字コードに変換する。文書項目分類手段
4では、レイアウト解析の結果得られた文書レイアウト
情報と文書レイアウト知識ファイル8とを比較すると共
に、文字認識手段3によって得られた文字コードと文書
の記述内容に関する知識を格納した文書コンテンツ知識
ファイル9とを比較して文書項目ごとに文字認識結果を
自動的に分類する。蓄積手段5,検索手段6,出力手段
7に関しては、上記実施の形態1と同様な動作を行う。
【0057】以下、図6,図34〜図39を用いて、図
40に示す構成の動作を詳細に説明する。
【0058】図6は、イメージファイルに格納された表
形式の文書画像の一例を示す説明図である。図39は、
罫線抽出手段410の出力結果及び項目に対応する領域
を説明する説明図であり、図において、370,37
1,372,373,374は罫線抽出において抽出さ
れた縦罫線,375,376,377,378,379
は罫線抽出において抽出された横罫線,3701は会議
名称に対応する領域,3702は開催場所に対応する領
域,3703は開催日時に対応する領域,3704は出
席者に対応する領域を示す。
【0059】図34は、文書レイアウト知識ファイル8
の内容を作成するための罫線情報の一例を示す説明図で
ある。図35は、文書レイアウト知識ファイル8の内容
の一例を示す説明図である。
【0060】図36は、罫線抽出手段410の出力の一
例を示す説明図であり、図において、340,341,
342,343は縦罫線,344,345,346,3
47,348,349は横罫線,3400,3401,
3402,3403,3404,3405,3406,
3407,3408は縦罫線と横罫線で囲まれた領域を
示す。
【0061】図37は、候補領域抽出手段411の出力
の一例を示す説明図である。図38は、文書項目分類手
段4の文書レイアウトに関する動作を説明する説明図で
ある。
【0062】表形式の文書レイアウト知識ファイル8
は、表の罫線情報を保持する。例えば、図6(a)に示
す文書画像で文書レイアウト知識ファイル8を作成する
場合、図6(a)の画像に対して罫線抽出処理を行い、
図39に示す罫線情報を得る。次に項目領域を設定する
手段(図示せず)により、会議名称,開催場所,開催日
時,出席者の各項目に対応する領域を指定する。会議名
称に対しては第1の領域3701,開催場所に対しては
第2の領域3702,開催日時に対しては第3の領域3
703,出席者に対しては第4の領域3704を指定し
た後、各項目領域の上下左右に隣接する罫線情報を抽出
して、図34に示した罫線情報を得る。図34で、‘タ
テ罫線1’は罫線370,‘タテ罫線5’は罫線37
4,‘ヨコ罫線1’は罫線375,‘ヨコ罫線3’は罫
線376,‘ヨコ罫線4’は罫線377,‘ヨコ罫線
5’は罫線378,‘ヨコ罫線7’は罫線379を示
す。
【0063】次に、図34内で同一罫線を領域間で共有
しているものを抽出し、図35に示した罫線共有関係を
作成した上で、文書レイアウト知識ファイル8とする。
【0064】一方、文書画像に対する項目分類は、まず
イメージファイルから図6(b)に示す文書画像を読み
出し、罫線抽出手段410によって文書内の罫線情報の
みを抽出する。文書画像に対する罫線抽出処理は、例え
ば特開平4−343190号公報に記載された方法によ
り実現できる。図36に、図6(b)の画像に対して罫
線抽出を行った結果を示す。
【0065】罫線抽出を行った後、候補領域抽出手段4
11において上下左右の罫線の組合せで構成される項目
領域の候補を抽出する。候補領域抽出の際には、文書レ
イアウト知識ファイル8に記載された内容を利用して、
候補領域の抽出を行う。例えば、文書レイアウト知識の
内容(図示せず)から各項目の領域がすべて矩形で指定
されている場合、領域候補は、縦横の罫線で構成される
矩形領域を抽出する。この場合、候補領域抽出手段41
1は、図36に示した罫線で構成される矩形領域を領域
候補として抽出する。その結果、候補領域抽出手段41
1の出力として、図37に示した領域と領域の上下左右
の罫線との情報を得る。
【0066】文字認識手段3には、図6(b)の文書画
像から図36で得られた罫線情報の内部に記述された文
字画像を抜き出して入力する。
【0067】文書項目分類手段4における、文書レイア
ウトに関する文書項目分類は、項目の上下左右の罫線の
共有関係が、文書レイアウト知識に合致するものを抽出
する。具体的には、図37に示した出力結果と、図35
に示した文書レイアウト知識ファイルとの照合を行う。
例えば、図35で会議名称,開催場所,開催日時,出席
者の各項目は、左側の縦罫線と右側の縦罫線とが共通し
ている。さらに、会議名称の下側の横罫線と開催場所の
上側の横罫線,開催場所の下側の横罫線と開催日時の上
側の横罫線,開催日時の下側の横罫線と出席者の上側の
横罫線がそれぞれ共通している。この条件に合致する組
合せを図37から抽出する。これから、図38に示す対
応付けを抽出する。
【0068】上記の文書レイアウトに関する項目分類候
補に対して、上記実施の形態1に示した文書コンテンツ
に関する項目分類を実施することにより、図38の‘連
番6’の結果が選択されるのは明らかであり、これによ
り正しい項目分類結果が得られる。
【0069】実施の形態3 以下、図面に基づいてこの発明の実施の形態3について
説明する。図41は、請求項3の発明の文書ファイリン
グ装置の構成図である。使用字種判定手段420が文書
項目分類手段4に付加されている以外は上記実施の形態
1と同一の構成であり同一動作を行うので、同一部分の
動作説明は省略する。使用字種判定手段420は、文字
認識手段3によって出力される文字認識結果に対して記
入文字種の判定を行い、文字認識結果と文書コンテンツ
知識ファイル9に格納された項目毎の記入文字種に関す
る情報を照合することにより、文書コンテンツを利用し
た項目分類を実現する。
【0070】以下、図7,図21,図23〜図29を用
いて、図41に示す構成の動作を詳細に説明する。
【0071】図7は、イメージファイルに格納された文
書画像の一例を示す説明図である。図21は、文書コン
テンツ知識ファイル9の内容の一例を示す説明図であ
る。図23は、図7(b)に対する文字認識結果の一例
を示す説明図である。図24は、文書項目分類手段4の
キーワードを用いた文書コンテンツに関する照合度の一
例を示す説明図である。図25は、文書項目分類手段4
の使用文字種を用いた文書コンテンツに関する照合度の
一例を示す説明図である。
【0072】図26は、文書項目分類手段4の文書レイ
アウトに関する照合度の一例を示す説明図である。図2
7は、文書項目分類手段4の文書レイアウトに関するペ
ナルティ算出の一例を示す説明図である。図28は、文
書項目分類手段4の文書レイアウトと文書コンテンツに
関する照合結果の統合動作を説明する説明図である。図
29は、文書項目分類手段4の文書項目と文字列の対応
動作を説明する説明図であり、図において、270は最
大の照合度Aを示す。
【0073】文書項目分類手段4においては、文書レイ
アウトに関して2種類の照合度,文書コンテンツに関し
て2種類の照合度を算出する。
【0074】文書レイアウトに関しては、まず上記実施
の形態1で説明した項目領域の重畳関係を用いた照合度
算出を行う。図7(a)の文書画像を用いて文書レイア
ウト知識ファイル8を作成し、図7(b)の文書画像に
対して照合を行う。照合は上記実施の形態1に示した方
法で行う。その結果、図26に示した照合度を得る。
【0075】さらに文書レイアウトに関する第2の照合
度は、文書構成の一般ルールとして文字列に対する字下
げ情報を用いる。第2の照合度ppijは、例えば下記
(5)式を用いて算出する。例えば、図7(b)の第2
行目と第3行目の文字列で構成される領域に対して、
(5)式を適用すると第3行目の文字列の末尾は右端ま
で伸びており、領域内最小の右側字下げ量=0,領域内
の第1行目すなわち図7(b)の第2行目の右側字下げ
量は40である。これを下記(5)式に代入すると、
ppij =−80となる。つまり、文書項目を羅列して
文書を記入する場合、同一項目の先頭行が他の行に比べ
て文字列の右側が凹んでいることはまれであり、これに
対して80点のペナルティを付与することに相当する。
【0076】 ppij = 20×(領域内最小の右側字下げ量 − 領域内第1行目の右側 字下げ量)・・・(5)
【0077】上記のペナルティを文字列の組合せについ
てすべて算出し、図27に示した照合度を作成する。
【0078】文書コンテンツに関しては、まず上記実施
の形態1で説明した項目に含まれるキーワードをもとに
した照合度を算出する。図7の文書画像の読取を行う場
合は、文書の記述内容に従い図21に示した文書コンテ
ンツ知識ファイル9を用いて、図23に示した認識結果
に対して照合度算出を行う。照合は上記実施の形態1に
示した方法で行う。その結果、図24に示した照合結果
を得る。
【0079】さらに文書コンテンツに関する第2の照合
度は、項目毎に使用される字種の情報を用いて照合度を
算出する。
【0080】文書項目毎に使用される文字種の情報は、
文書コンテンツ知識ファイル9に予め格納される。図7
の示した文書画像の場合、図21に示すようにタイト
ル,著者,著者所属の項目に対しては全字種,英字著者
の項目に対しては、英字の指定を行う。
【0081】一方、使用字種判定手段420では、文書
コンテンツ知識ファイル9に格納された字種情報を用い
て、図23に示した文字認識結果に対して記入文字種の
判定を行う。字種の限定が行なわれている項目に対し
て、下記(6)式を用いて使用文字種に関する照合度を
求める。例えば、図23の1行目の認識結果の英字著者
に対する照合度は、字種指定に合致する英字は1文字,
字種指定に合致しない文字は18文字であり、領域内の
全文字数は19文字である。よって、puij =100
×(1−18)/19 = −89となる。つまり、領
域内に含まれる文字種が字種指定と合致する場合は照合
度を加算し、領域内に含まれる文字種が字種指定と合致
しない場合は照合度を減算する。これにより、項目の分
類を行う。
【0082】 puij = 100×(領域内で字種指定に合致する文字の数 − 領域内で字種指定に合致しない文字の数)/(領域内の 全文字数)・・・(6)
【0083】上記の方法ですべての文字列の組合せにつ
いて照合度を算出し、図25に示した照合度を作成す
る。
【0084】文書項目分類手段4では、上記で求めた4
種類の照合度をすべて加算し、図28に示した総合的な
照合度を算出する。
【0085】さらに上記実施の形態1と同様の動作に従
い、文書の各項目に対応する可能性を持つ連続文字列領
域の組合せのすべてに対して、照合度を算出する。照合
度算出の後、照合度が最も大きくなる組合せを項目分類
結果とする。図29の場合、タイトルに対して1行目と
2行目の文字列,著者に対して3行目の文字列,英字著
者に対して4行目と5行目の文字列,著者所属に対して
6行目の文字列を対応付けた時、最大の照合度A270
を与える。その結果、正しい項目分類結果が得られる。
【0086】実施の形態4 以下、図面に基づいてこの発明の他の実施の形態につい
て説明する。図42は、この発明の実施の形態4の文書
ファイリング装置の構成図である。省略可能性指示手段
430が付加されている以外は上記実施の形態1と同一
の構成であり、同一部分の動作説明は省略する。省略可
能性指示手段430は予め設定した条件に従って、文書
項目が省略される可能性があるかに否かの指示を行う。
文書項目分類手段4は省略可能性指示手段430の指示
に従って、省略可能性のある項目については該当する項
目を省略した場合の組合せを追加して文書項目分類を行
う。
【0087】以下、図8,図30〜図33を用いて、図
42に示す構成の動作を詳細に説明する。
【0088】図8は、イメージファイルに格納された文
書画像の一例を示す説明図である。図30は、文書項目
分類手段4の文書レイアウトに関する照合度の一例を示
す説明図であり、図において、280は空領域Aを示
す。図31は、文書項目分類手段4の文書レイアウトに
関するペナルティ算出の一例を示す説明図であり、図に
おいて、290は空領域Bを示す。図32は、文書項目
分類手段4の文書コンテンツに関する照合度の一例を示
す説明図であり、図において、300は空領域Cを示
す。図33は、文書項目分類手段4の文書項目と文字列
の対応動作を説明する説明図であり、図において、31
0は空領域D,311は最大の照合度Bを示す。
【0089】文書項目分類手段4では図8(b)の文書
画像に対して、実施の形態3で示した文書レイアウト知
識ファイル9を用いて2種類の文書レイアウトに関する
照合度を算出する。項目領域の重畳関係を用いた照合度
を図30に、文書レイアウトの一般ルールによるペナル
ティを図31に示す。図30および図31の照合度を算
出する際に、文書項目分類手段4は、省略可能性指示手
段430によって予め指定された「英字著者の項目は省
略される可能性があるという情報」(図示せず)を受け
て、空領域A280および空領域B290を英字著者の
項目に対して対応付ける。対応付けの照合度は0を設定
する。
【0090】文書コンテンツに関しては、実施の形態3
で示したキーワードを用いた文書コンテンツに関する照
合度を算出する。照合度の算出においては実施の形態3
と同様の動作を行い、図21に示した文書コンテンツ知
識ファイル9と照合を行う。照合の結果、図32に示し
た照合度を得る。この時上記と同様に、空領域C300
を英字著者の項目に対して対応付ける。対応付けの照合
度は0を設定する。
【0091】図30〜図32に示した照合度を加算し、
総合的な照合度(図示せず)を求めた後、実施の形態3
と同様の動作に従い、文書の各項目に対応する可能性を
持つ連続文字列領域の組合せのすべてに対して、照合度
を算出する。この時、省略可能性のある英字著者の項目
に関しては、空領域D310の対応関係も考慮して組合
せを構成する。例えば、図33の項目対応関係312の
場合、タイトルに対して1行目、著者に対して2〜3行
目、著者所属に対して4行目が割り当てられ、英字著者
を省略した組み合わせとなる。
【0092】照合度算出の後、照合度が最も大きくなる
組合せを項目分類結果とする。図33の場合、タイトル
に対して1行目と2行目の文字列,著者に対して3行目
の文字列,英字著者に対して空領域D310,著者所属
に対して4行目の文字列を対応付けた時、最大の照合度
B311を与える。その結果、項目の省略された文書画
像に対しても正しい項目分類結果が得られる。
【0093】実施の形態5 以下、図面に基づいてこの発明の実施の形態5について
説明する。図43は、この発明の実施の形態5の文書フ
ァイリング装置の構成図である。文書項目分類手段4が
弛緩整合文書項目分類手段400で構成されている以外
は上記実施の形態1と同一の構成であり、同一部分の動
作説明は省略する。弛緩整合文書項目分類手段400
は、文書レイアウトと文書コンテンツの分布内容から初
期候補を抽出して対応付けの初期確率を設定し、文書項
目の相対的な位置関係を用いて対応付け確率を変更する
ことにより、項目分類を実現する。
【0094】以下、図22を用いて、図43に示す構成
の動作を詳細に説明する。図22は、弛緩整合文書項目
分類手段400の動作を説明する説明図であり、図にお
いて、201は弛緩整合法の初期値を示す。
【0095】上記実施の形態1の説明で用いた図5の文
書画像に対して、弛緩整合文書項目分類手段400を適
用した場合について説明する。文書レイアウトと文書コ
ンテンツに対する照合度を求め、図15と図18に示し
た照合度を求め、双方を加算して図19に示した総合的
な照合度を求めるまでは、上記実施の形態1と同一の動
作を行う。
【0096】次に、上記実施の形態1では文書の各項目
に対応する可能性を持つ連続文字列領域の組合せを抽出
して、すべての組合せに対して照合度を求め最終的な結
果を抽出していた。このような対応付けの問題に対して
は、「弛緩整合法による手書き教育漢字認識」電子通信
学会論文誌■82/9 Vol.J65-D No.9に示されるような弛
緩整合法を適用することにより、高速に対応付けを行う
ことができる。
【0097】弛緩整合法を文書項目の対応付けに適用す
る場合は、図22に示すように、まず各項目に対応する
候補ブロックの絞り込みを行う。具体的には図19に示
した照合度で50以上の数値を有するものを抽出する。
その結果、会議名称,開催場所に対しては2種類のブロ
ック組合せ,開催日時,出席者に対しては3種類のブロ
ック組合せが抽出される。
【0098】抽出した対応付けの確率は、各項目につい
て加算すると100になるように正規化を行う初期値2
01とする。この初期値に対して弛緩整合法のアルゴリ
ズムを適用して繰り返し動作を行うことにより、最適な
組合せを得る。図22の場合、‘繰り返し4’におい
て、会議名称は‘ブロック2’,開催場所は‘ブロック
3’,開催日時は‘ブロック4’,出席者は‘開始ブロ
ック5’に対応付けられ、正解が得られる。
【0099】上記実施の形態1乃至実施の形態5におい
て、文字認識結果として第1位の文字認識結果のみが得
られた場合の例を示したが、任意の個数の認識候補文字
を文字認識結果とすることも可能である。
【0100】
【発明の効果】以上説明したように請求項1及び請求項
6の発明は、文書レイアウトと文書コンテンツの双方の
知識を利用して、文書を構成する項目ごとに文字認識結
果を分類することで、レイアウト変動の大きい文書に対
して文書項目を自動的に分類することができる。
【0101】また、請求項2の発明は、文書を構成する
罫線を抽出した後、罫線で囲まれる領域を抽出し、罫線
の共有関係をもとに項目に対応する領域を抽出すること
で、論理構造が異なる表形式文書に対して正しく項目を
分類することができる。
【0102】また、請求項3の発明は、文書コンテンツ
に関する情報として文書項目を構成する字種情報を知識
として用い、文書レイアウトに関する知識と併用するこ
とで、レイアウト情報だけでは分割できない文書に対し
て正しく項目分類することができる。
【0103】また、請求項4の発明は、項目の対応関係
を求める際に省略の可能性のある項目に対しては空の項
目を対応付けるように構成することで、項目の省略があ
る文書に対しても正しく項目分類することができる。
【0104】また、請求項5の発明は、弛緩整合法で文
書項目の相対的位置関係とコンテンツの分布内容に従っ
て文書項目を分類することで、レイアウト変動の大きい
文書の項目を高速にかつ高い精度で自動分類することが
できる。
【図面の簡単な説明】
【図1】この発明の実施の形態1の文書ファイリング装
置の構成図。
【図2】図1に示す実施の形態1の文書ファイル作成の
フローチャート。
【図3】図1に示す実施の形態1の文書検索のフローチ
ャート。
【図4】文書画像の例を示す説明図。
【図5】文書画像の例を示す説明図。
【図6】文書画像の例を示す説明図。
【図7】文書画像の例を示す説明図。
【図8】文書画像の例を示す説明図。
【図9】文書レイアウトに関する知識情報を説明する説
明図。
【図10】文書レイアウト解析結果の例を示す説明図。
【図11】文書レイアウト解析結果の例を示す説明図。
【図12】項目分類結果の例を示す説明図。
【図13】文書レイアウトに関する知識情報を説明する
説明図。
【図14】文書レイアウト解析結果の例を示す説明図。
【図15】文書レイアウトに関する文書項目分類の動作
を説明する説明図。
【図16】文書コンテンツに関する知識情報を説明する
説明図。
【図17】文字認識結果の例を示す説明図。
【図18】文書コンテンツに関する文書項目分類の動作
を説明する説明図。
【図19】文書のレイアウトとコンテンツ双方の情報を
用いた文書項目分類の動作を説明する説明図。
【図20】文書項目と領域の対応動作を説明する説明
図。
【図21】文書コンテンツに関する知識情報を説明する
説明図。
【図22】弛緩整合法の動作を説明する説明図。
【図23】文字認識結果の例を示す説明図。
【図24】文書コンテンツに関する文書項目分類の動作
を説明する説明図。
【図25】文書コンテンツに関する文書項目分類の動作
を説明する説明図。
【図26】文書レイアウトに関する文書項目分類の動作
を説明する説明図。
【図27】文書レイアウトに関する文書項目分類の動作
を説明する説明図
【図28】文書のレイアウトとコンテンツ双方の情報を
用いた文書項目分類の動作を説明する説明図。
【図29】文書項目と領域の対応動作を説明する説明
図。
【図30】文書レイアウトに関する文書項目分類の動作
を説明する説明図。
【図31】文書レイアウトに関する文書項目分類の動作
を説明する説明図。
【図32】文書コンテンツに関する文書項目分類の動作
を説明する説明図。
【図33】文書項目と領域の対応動作を説明する説明
図。
【図34】文書レイアウトに関する知識情報を説明する
説明図。
【図35】文書レイアウトに関する知識情報を説明する
説明図。
【図36】文書画像の罫線抽出を説明する説明図。
【図37】文書レイアウト解析結果の例を示す説明図。
【図38】文書レイアウトに関する文書項目分類の動作
を説明する説明図。
【図39】文書レイアウトに関する知識情報を説明する
説明図。
【図40】この発明の実施の形態2の文書ファイリング
装置の構成図。
【図41】この発明の実施の形態3の文書ファイリング
装置の構成図。
【図42】この発明の実施の形態4の文書ファイリング
装置の構成図。
【図43】この発明の実施の形態5の文書ファイリング
装置の構成図。
【図44】従来の文書ファイリング装置の構成図。
【符号の説明】
1:イメージファイル、 2:レイアウト解析手段、
3:文字認識手段、4:文書項目分類手段、 5:蓄積
手段、 6:検索手段、 7:出力手段、8:文書レイ
アウト知識ファイル、 9:文書コンテンツ知識ファ
イル、10:文字認識結果ファイル、 30:項目分類
結果A、50:項目分類結果B、 60:項目分類結
果C、 61:タイトル、62:著者、 63:英
字著者、 64:著者所属、70:タイトルに対応し
た座標情報、 80:文字切り出し結果、100:論
文番号、 101:タイトル、 102:著者、1
03:第2ブロック、 104:第3ブロック、 10
5:第4ブロック、110:開始日時に対応した座標情
報、 111:会議名称、112:開催場所、 11
3:開催日時、 114:出席者、120:開始ブロ
ック、 121:終了ブロック、122:開始ブロッ
クおよび終了ブロックに対応した座標情報、123:
‘開始ブロック5’‘終了ブロック6’に対応した座標
情報、130:‘開始ブロック5’‘終了ブロック6’
と開催日時の照合度、140:開催場所の項目に対応し
たキーワード、141:キーワード‘開催場所’、 1
42:キーワード‘場所’、143:キーワード‘会議
室’、 144:キーワード‘ルーム’、145:キ
ーワード‘ミーティング’、146:禁止キーワード
‘会議名称’、147:禁止キーワード‘開催日時’、
150:文字認識結果A、160:‘開始ブロック
2’と‘開始ブロック3’の領域と開催場所の項目との
照合度、170:‘ブロック1’の領域と会議名称の項
目との照合度、171:‘開始ブロック2’と‘開始ブ
ロック3’の領域と開催場所の項目との照合度、17
2:‘開始ブロック4’と‘開始ブロック5’の領域と
開催日時の項目との照合度、173:‘開始ブロック
6’と‘開始ブロック7’の領域と出席者の項目との照
合度、180:会議名称,開催場所,開催日時,出席者
とブロックとの対応関係、181:照合度、 18
2:最大の照合度を与えるブロックの組合せ、201:
弛緩整合法の初期値、 270:最大の照合度A、
280:空領域A、 290:空領域B、 3
00:空領域C、310:空領域D、 311:最
大の照合度B、340:罫線抽出において抽出された縦
罫線A、341:罫線抽出において抽出された縦罫線
B、342:罫線抽出において抽出された縦罫線C34
3:罫線抽出において抽出された縦罫線D、344:罫
線抽出において抽出された横罫線A、345:罫線抽出
において抽出された横罫線B、346:罫線抽出におい
て抽出された横罫線C、347:罫線抽出において抽出
された横罫線D、348:罫線抽出において抽出された
横罫線E、349:罫線抽出において抽出された横罫線
F、370:罫線抽出において抽出された縦罫線E、3
71:罫線抽出において抽出された縦罫線F、372:
罫線抽出において抽出された縦罫線G、373:罫線抽
出において抽出された縦罫線H、374:罫線抽出にお
いて抽出された縦罫線I、375:罫線抽出において抽
出された横罫線F、376:罫線抽出において抽出され
た横罫線G、377:罫線抽出において抽出された横罫
線H、378:罫線抽出において抽出された横罫線I、
379:罫線抽出において抽出された横罫線J、39
0:画像処理手段、 391:文書認識手段、 41
0:罫線抽出手段、411:候補領域抽出手段、 4
20:使用字種判定手段、430:省略可能性指示手
段、 3400:縦罫線と横罫線に囲まれる領域A、3
401:縦罫線と横罫線に囲まれる領域B、3402:
縦罫線と横罫線に囲まれる領域C、3403:縦罫線と
横罫線に囲まれる領域D、3404:縦罫線と横罫線に
囲まれる領域E、3405:縦罫線と横罫線に囲まれる
領域F、3406:縦罫線と横罫線に囲まれる領域G、
3407:縦罫線と横罫線に囲まれる領域H、340
8:縦罫線と横罫線に囲まれる領域I、3701:会議
名称に対応する領域、3702:開催場所に対応する領
域、3703:開催日時に対応する領域、3704:出
席者に対応する領域。

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 文書の画像を蓄積するイメージファイル
    と、文書の種類ごとに文書構造のレイアウト規則を記憶
    する文書レイアウト知識ファイルと、文書の種類および
    文書項目ごとの記述内容を記憶する文書コンテンツ知識
    ファイルと、上記文書レイアウト知識ファイルに記述さ
    れた知識に従い上記イメージファイルに蓄積された文書
    画像のレイアウトを解析するレイアウト解析手段と、こ
    のレイアウト解析手段により文書画像から切り出された
    文字パターンを認識する文字認識手段と、上記レイアウ
    ト解析手段で得られる文書レイアウト情報と上記文書レ
    イアウト知識ファイルの内容および上記文字認識手段で
    得られる文字認識結果と上記文書コンテンツ知識ファイ
    ルの内容を照合することにより文書を構成する項目ごと
    に文字認識結果を分類する文書項目分類手段と、この文
    書項目分類手段によって得た文書項目ごとに分類された
    文字認識結果を格納する文字認識結果ファイルとを有す
    ることを特徴とする文書ファイリング装置。
  2. 【請求項2】 上記レイアウト解析手段は、文書を構成
    する罫線を抽出する罫線抽出手段と文書項目に隣接する
    罫線の共有関係を抽出する共有罫線抽出手段とで構成さ
    れたことを特徴とする請求項1記載の文書ファイリング
    装置。
  3. 【請求項3】 上記文書項目分類手段は、文字種の判定
    を行う使用字種判定手段が設けられ、上記文字認識手段
    で得られる文字認識結果と上記文書コンテンツ知識ファ
    イルに格納された文書項目を構成する字種情報とを照合
    するように構成されたことを特徴とする請求項1記載の
    文書ファイリング装置。
  4. 【請求項4】 上記文書項目分類手段は、予め設定した
    条件に従って、文書項目の省略可能性有無の指示を行う
    省略可能性指示手段が設けられ、項目の対応関係を求め
    る際に省略の可能性のある項目に対しては空の項目を対
    応付けるように構成されたことを特徴とする請求項1記
    載の文書ファイリング装置。
  5. 【請求項5】 上記文書項目分類手段は、文書項目の相
    対的な位置関係とコンテンツの分布内容に従い文書項目
    の分類を行う弛緩整合文書項目分類手段で構成されたこ
    とを特徴とする請求項1記載の文書ファイリング装置。
  6. 【請求項6】 文書の画像を読取りイメージファイルに
    蓄積する画像蓄積ステップと、文書の種類ごとに文書構
    造のレイアウト規則が記憶された文書レイアウト知識フ
    ァイルの知識に従い上記イメージファイルに蓄積された
    文書画像のレイアウトを解析するレイアウト解析ステッ
    プと、このレイアウト解析ステップにより文書画像から
    切り出された文字パターンを認識する文字認識ステップ
    と、上記レイアウト解析ステップで得られる文書レイア
    ウト情報と上記文書レイアウト知識ファイルの内容およ
    び上記文字認識ステップで得られる文字認識結果と文書
    の種類および文書項目ごとの記述内容が記憶された文書
    コンテンツ知識ファイルの内容を照合することにより文
    書を構成する項目ごとに文字認識結果を分類する文書項
    目分類ステップと、この文書項目分類ステップによって
    得られた文書項目ごとに分類された文字認識結果を文字
    認識結果ファイルに格納する文字認識結果記憶ステップ
    とを有することを特徴とする文書ファイリング方法。
JP3786997A 1997-02-21 1997-02-21 文書ファイリング装置 Expired - Fee Related JP3598711B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3786997A JP3598711B2 (ja) 1997-02-21 1997-02-21 文書ファイリング装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3786997A JP3598711B2 (ja) 1997-02-21 1997-02-21 文書ファイリング装置

Publications (2)

Publication Number Publication Date
JPH10240901A true JPH10240901A (ja) 1998-09-11
JP3598711B2 JP3598711B2 (ja) 2004-12-08

Family

ID=12509553

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3786997A Expired - Fee Related JP3598711B2 (ja) 1997-02-21 1997-02-21 文書ファイリング装置

Country Status (1)

Country Link
JP (1) JP3598711B2 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000137728A (ja) * 1998-11-02 2000-05-16 Fujitsu Ltd 文書解析装置及びプログラム記録媒体
JP2000181931A (ja) * 1998-12-18 2000-06-30 Sharp Corp 自動オーサリング装置および記録媒体
JP2003085187A (ja) * 2001-09-11 2003-03-20 Canon Inc 文書登録システム、方法、プログラム及び記憶媒体
JP2009140258A (ja) * 2007-12-06 2009-06-25 Fujitsu Ltd 論理構造モデル作成支援プログラム、論理構造モデル作成支援装置および論理構造モデル作成支援方法
JP2010102668A (ja) * 2008-10-27 2010-05-06 Hitachi Software Eng Co Ltd メタデータ抽出装置およびその方法
JP2010113407A (ja) * 2008-11-04 2010-05-20 Sharp Corp 情報クリッピング装置、情報クリッピング方法、および、情報クリッピングプログラム
US7958458B2 (en) 2003-01-28 2011-06-07 Fujitsu Limited Method for supporting data linkage between applications
JP2014013490A (ja) * 2012-07-04 2014-01-23 Nippon Telegr & Teleph Corp <Ntt> 画像領域分割装置、その方法及びプログラム
US8805074B2 (en) 2010-09-27 2014-08-12 Sharp Laboratories Of America, Inc. Methods and systems for automatic extraction and retrieval of auxiliary document content

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104751148B (zh) * 2015-04-16 2018-09-07 同方知网数字出版技术股份有限公司 一种版式文件中识别科学公式的方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000137728A (ja) * 1998-11-02 2000-05-16 Fujitsu Ltd 文書解析装置及びプログラム記録媒体
JP2000181931A (ja) * 1998-12-18 2000-06-30 Sharp Corp 自動オーサリング装置および記録媒体
JP2003085187A (ja) * 2001-09-11 2003-03-20 Canon Inc 文書登録システム、方法、プログラム及び記憶媒体
US7958458B2 (en) 2003-01-28 2011-06-07 Fujitsu Limited Method for supporting data linkage between applications
JP2009140258A (ja) * 2007-12-06 2009-06-25 Fujitsu Ltd 論理構造モデル作成支援プログラム、論理構造モデル作成支援装置および論理構造モデル作成支援方法
JP2010102668A (ja) * 2008-10-27 2010-05-06 Hitachi Software Eng Co Ltd メタデータ抽出装置およびその方法
JP2010113407A (ja) * 2008-11-04 2010-05-20 Sharp Corp 情報クリッピング装置、情報クリッピング方法、および、情報クリッピングプログラム
US8805074B2 (en) 2010-09-27 2014-08-12 Sharp Laboratories Of America, Inc. Methods and systems for automatic extraction and retrieval of auxiliary document content
JP2014013490A (ja) * 2012-07-04 2014-01-23 Nippon Telegr & Teleph Corp <Ntt> 画像領域分割装置、その方法及びプログラム

Also Published As

Publication number Publication date
JP3598711B2 (ja) 2004-12-08

Similar Documents

Publication Publication Date Title
US9633257B2 (en) Method and system of pre-analysis and automated classification of documents
JP4421134B2 (ja) 文書画像検索装置
US8391614B2 (en) Determining near duplicate “noisy” data objects
JP2734386B2 (ja) 文字列読み取り装置
US11361572B2 (en) Information processing apparatus and non-transitory computer readable medium
US8171391B2 (en) Method of describing the structure of graphical objects
US20060045340A1 (en) Character recognition apparatus and character recognition method
JP2012063883A (ja) 情報処理装置、情報処理方法、および情報処理プログラム
JP2007172077A (ja) 画像検索システム及び方法及びプログラム
JP3598711B2 (ja) 文書ファイリング装置
US11315351B2 (en) Information processing device, information processing method, and information processing program
US20140181124A1 (en) Method, apparatus, system and storage medium having computer executable instrutions for determination of a measure of similarity and processing of documents
WO2000036530A1 (fr) Methode de recherche et dispositif correspondant, support enregistre
JPH08221510A (ja) 帳票文書処理装置および帳票文書処理方法
JP2002342343A (ja) 文書管理システム
JP4046941B2 (ja) 文書書式識別装置および識別方法
JPH11328306A (ja) 文書画像の論理要素抽出方法、装置および記録媒体
Yamashita et al. A document recognition system and its applications
JP2003030654A (ja) パターン識別装置、パターン識別方法及びパターン識別用プログラム
US9015573B2 (en) Object recognition and describing structure of graphical objects
JP2004178044A (ja) 属性抽出方法及びその装置及び属性抽出プログラム
JP2006163830A (ja) 文字認識装置、文字認識方法、および文字認識プログラム
US20120011434A1 (en) Method for Object Recognition and Describing Structure of Graphical objects
JP3620299B2 (ja) 文書ファイリング装置及び文書ファイリング方法
JP4221960B2 (ja) 帳票識別装置及びその識別方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040427

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040624

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20040716

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040824

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040906

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080924

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080924

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090924

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090924

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100924

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110924

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees