JPH0327471A - 画像登録方式 - Google Patents

画像登録方式

Info

Publication number
JPH0327471A
JPH0327471A JP1160743A JP16074389A JPH0327471A JP H0327471 A JPH0327471 A JP H0327471A JP 1160743 A JP1160743 A JP 1160743A JP 16074389 A JP16074389 A JP 16074389A JP H0327471 A JPH0327471 A JP H0327471A
Authority
JP
Japan
Prior art keywords
newspaper
image
column
page
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1160743A
Other languages
English (en)
Inventor
Hirotoshi Ise
伊勢 広敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP1160743A priority Critical patent/JPH0327471A/ja
Publication of JPH0327471A publication Critical patent/JPH0327471A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、画像登録方式に係り、特に、新聞の紙面画像
のように、ページごとに印刷されている内容が決まった
画像を登録する場合に好適な画像登録方式に関する。
〔従来の技術〕
近年、大容量光ディスクを利用した文書画像ファイルシ
ステム(電子ファイル)が、新しい文書管理の手段とし
て、一般オフィスで広く使われるようになった。光ディ
スクは容量が大きく、画像データの記録が可能であるた
め、帳票,新聞等の文書画像データを蓄積しておくこと
ができる。これらの画像データを文書画像ファイルシス
テムを利用して効率的に格納していくためには、文書の
自動登録機能が重要である。この機能を実現する場合に
は、各種のam力くあるが、その中で、特に(5) 利用者に望まれていることとして、キー入力を不要にす
ることがある。このキー入力は,文書をファイルに登録
する場合に、文書の表題、執筆者等の文字に付随する事
項をインデクス情報として入力する作業である。
このインデクス情報は、文書を検索する場合に必須であ
り、これらのインデクス情報がないと登録した文書画像
を後で利用することができない。
したがって、自動登録を実現するためには、インデクス
情報を文書画像から抽出する必要がある。
新聞からインデクス情報を抽出する方法としては、例え
ば、添付の資料に示すような新聞の切り抜きファイルシ
ステムがある。
〔発明が解決しようとする課題〕
前述の文書画像からインデクス情報を抽出する従来の方
法は、画像全体を解析し、構或要索を分離し、キーワー
ドを含む領域を切り出し、キーワードを文字認識するも
のである。例えば、新聞を登録する場合ならば、見出し
領域を切り出し、見出しを文字認識し、インデクス情報
とする。
(6) この場合、画像全体を解析しているため、新聞1ページ
を入力した場合には、膨大な処理時間が必要である。ま
た、見出し文字など形状,大きさ等が非常に複雑な文字
を文字認識する必要があるため、認識率の劣化が問題と
なる。
本発明の目的は、認識が容易でかつ新聞を分類できる新
聞の特徴を抽出することにより、新聞登録時に必要なイ
ンデクスを生成するシステムを実現することである。
〔課題を解決するための手段〕
新聞紙面は、印刷領域の上部分に新聞名,発行年月日,
曜日,ページ等を示す文字列がある。本発明では、この
文字列にページの内容、例えば、国際欄,社会欄,経済
欄,家庭欄等を示す欄識別子がある場合には、この欄識
別子を文字認識する。
また、ない場合には、紙面が何ページかを判別し、予め
格納されているページ割り付け情報から、紙面が何欄か
を判別するか、あるいは、紙面を画像解析することによ
り、レイアウト情報を抽出し、このレイアウト情報とマ
ッチングする欄のレイア(7) ウトを判別する。
以上に示した手順により抽出した欄を識別する情報をイ
ンデクス情報に付加することにより、新聞を登録する場
合に有効なインデクス情報を生成することができる。
〔作用〕
新聞を光ディスク等に登録する場合、新聞名,発行年月
日,曜日等は、新聞を分類する上で、有効なデータであ
る。また、新聞の各ページの内容を分類する上で、ペー
ジ以外に、経済欄,国際欄,株式欄等の欄を識別し、イ
ンデクス情報の一つとして付加することは、紙面画像を
管理する場合に有効である。
〔実施例〕
以下、本発明の工実施例を図面を参照して、詳細に説明
する。
第1図は、本発明を実現する装置の構或例である。図中
の1はコードデータを入力するためのキーボードである
。2はC P U (CentoralProcess
ing Unit)であり、システム全体の制御を(8
) 行なう。3は、処理対象となる画像を入力するスキャナ
であり、4はスキャナ3を制御するスキャナコントロー
ラである。5はキーボード1から入力されたコードデー
タやスキャナ3から入力された画像を目視により確認す
るためのディスプレイ、6はディスプレイ5を制御する
ディスプレイコントローラである。7はスキャナ3から
入力された画像を格納するためワークメモリであり、8
は連結処理された画像を格納するファイルであり、9は
ファイル8に画像の入出力を制御するファイルコントロ
ーラである。10は処理対象および処理結果の画像を格
納する画像メモリである。
次に、本発明における処理の流れを第2図を用いて説明
する。第2図(a)は、この処理の概要を示す流れ図で
あり、第2図(b)は枠外文字認識、(c)はページ割
り付け、(d)は紙面レイアウト照合、(e)は光ディ
スクに画像登録する処理を示す流れ図である。
先ず初めに、ステップ100で、入力対象である新聞の
ページをスキャナ3により、画像入力す(9) る。ステップ102では、スキャナがら画像入力された
紙面にかすむ,歪み等がないかを目視により確認し、画
像の再入力が必要な場合には、ステップ104で、再び
、ステップ100以降の処理を繰り返す。
次に、ステップ106で、枠罫線を検出し、枠外領域に
ある黒画素を解析し、入力された新聞紙面が何欄である
かを識別できる欄識別子の有無を確認し、ある場合には
、ステップ119で、榴識別子を抽出し、文字認識する
。欄識別子がない場合には、ステップ110で、キーボ
ード1から入力対象である新聞の総ページ数を入力する
。ステップ112では、枠外に印刷されている新聞名,
発行年月目,ページ等の枠外文字認識を文字認識する。
この枠外文字認識の詳細な処理については,第2図(b
)のステップ120〜132に示す。
ステップ120では、横枠罫線を検出する。との横枠罫
線を検出する処理の一例を第4図に示す流れ図で説明す
る。ステップ300で、黒画素を検302では、黒画素
を検出したかどうかを判定し、黒画素を検出した場合に
は、ステップ304,306の処理により、横罫線の検
出を行う。ステップ304では、8連結の意味で連続し
ている黒画素を追跡し、ステップ306では、追跡した
黒画素が水平方向にある値以上連続場合に横罫線として
判定し、横罫線を検出した時点でリターンする。追跡し
た黒画素が横罫線と判定されなかった場合には、ステッ
プ308で、次の検索位置を算出する。ステップ310
では、入力した紙面1ページ全体を検索したかどうかを
チェックし、検索終了していない場合は、ステップ30
2〜308の処理を繰り返し、検索終了の場合には、ス
テップ312で、検索位置を変更し、ステップ302〜
308の処理を繰り返す。
以上に示した処理により、横枠罫線を検出した後、ステ
ップ122で傾き補正を行う。傾き検出の概要を第3図
に示す。図中の22及び23は、横罫線の検索位置であ
り、この検索位置は画像の大きさに対応して決まる。こ
こで、検索位置22(11) 及び23上における横罫線検出ラインをそれぞれQ1,
112とし、検出位置間の距離をLとすると、画像の傾
き角度θは、 θ=tan CCQ 2 − Q 1)/ L)で与え
られる。このni倣の傾き角度θだけ目転処理を行い、
画像の傾き補正をする。
ステップ124では、ステップ120で検出した横枠罫
線の位置までを枠外文字サーチ領域とし、このサーチ領
域内にある黒画素の連結領域を囲む矩形を抽出し,ステ
ップ126で、矩形の大きさ,形状により文字矩形と思
われる矩形を切り出す。
第5図に、新聞に印刷された枠外文字の一例を示す,図
に示すように、枠外文字は、紙面上部にある横枠罫線の
すぐ上に存在する1行分の文字列である。この図は、あ
る新聞の朝刊を例としているが,夕刊の場合には、ここ
にある文字列以外に『夕刊』を示す枠外文字が印刷され
ている。ステップ128では、ステップ126で切り出
した文字矩形により囲まれた枠外文字を文字認識する。
(12) 新聞名,発行年月日,曜日,ページ等の文字列に分類し
、ステップ132で、文字認識した文字列の正しさをチ
ェックするために単語照合を行う。
ここで利用する単語照合は、例えば,新聞名ならば、「
××新聞」という単語になっているか、また、発行年月
日ならば、数字およびr年』,r月』,r日」以外の文
字があるか、等をチェックするものである。
なお、ここでは、文字認識率を向上するため、新聞ごと
に文字認識用辞書を持っている。この辞書は,紙面に印
刷されている文字を修正して、作成されている。また、
入力された画像がどの新聞かを分類するため、新聞名を
文字認識するが、枠外文字は、書体,形状,大きさが多
種多様なので、新聞名以外に、印加されている文字の書
体,形状,大きさにより、新聞の種類を絞り込むことも
できる。
ステップ114では、入力された紙面に、国際,経済,
社会欄等のどの欄かを示す属性を設定する。
用いて説明する。ステップ140で、枠外文字を利用し
て新聞紙名を識別し、ステップ142で、識別した新聞
名に対応する新聞属性ファイルを読み出す。第6図に、
新聞属性ファイルの構成とこのファイルに格納されてい
るデータのデータ構造を示す。新聞属性ファイルは、新
聞ごとに分割され,また、新聞ごとに、通常日,休刊日
前日,特集号用のデータがあり、通常日用のデータの下
には,各曜日用のデータが用意されている。各曜日用の
データには、それぞれ朝刊,夕刊用のデータがあり、各
刊に応じて、ページと欄の内容とを対応付けるデータが
用意されている。ステップ144では、入力の対象であ
る新聞が特集号であるかどうかを判別し,特集号である
場合には、ステップ162で、特集号用のページ割付デ
ータを読み出す。特集号でない場合は、ステップ146
以降の処理を行う。ステップ148では、休刊日前目か
どうかを判定し、休刊日前日である場合には、ステップ
160で、休刊日前H用のページ割付データを読み出す
。休刊日前日でない場合には、ステ(14) ツプ148で、曜日の識別を行う。
ここでは、特集号であるかどうかの判別,休刊日前日で
あるかどうかの判別は利用者が行い、キーボード等から
判別に必要な情報を入力する。
ステップ150では、枠外文字を利用して、入力対象で
ある新聞が朝刊か、夕刊かを識別する。
ステップ152では、入力対象である新聞が、何ページ
で構成されているかをチェックし、ステップ154では
、総ページ数により、入力対象である新聞に対応したペ
ージ割付データが存在するかどうかをチェックし、存在
しない場合には、ステップ158で、入力された紙面の
レイアウトを解析し、何欄であるかを識別する6 次に、第2図(d)を用いて、紙面レイアウトの識別処
理について述べる。ステップ170で、入力された紙面
の黒画素を解析し、黒画素の8連結領域を抽出し,その
8連結領域に外接する矩形を求める。ステップ172で
は、ステップ170で求めた外接矩形の統計的な大きさ
により、分類する。この分類に使用する規則を第7図に
示す。
(15) ここでは、外枠矩形の大きさにより、罫線,本文・前文
,見出し,図・写真等に分類している。この規則は、外
接矩形の大きさに関する条件のみを示しているが,この
条件に加え、外接矩形の位置関係等を利用することによ
り、外接矩形の分類をより正確に行なうことができる。
ステップ174では、見出し,写真,図・表,広告等と
識別されたある程度大きい外接矩形に対して、外接矩形
領域内の黒面素を解析する。ここでは、単位血積当りの
黒画素数,黒ランの状態等を利用し、写真,図・表,広
告,囲み記事等を分離し、各外接矩形に対して、本文,
見出し,図・写真,罫線等の矩形属性を設定する。ここ
では、新聞紙面を2値画像として処理しているが、多値
(濃淡)画像として処理できる場合には、矩形内領域が
背景,2値,多値,真黒の何れの比率が大きいかにより
、写真,図・広告等を分離することができる。
ステップ176では、ステップ174で設定した矩形属
性に基づいて、入力紙面のレイアウトを解析し、レイア
ウト情報を取得する。ステップ(16) 178では、新聞属性ファイルに格納されている、各欄
に対応するレイアウト情報と、ステップ178で取得し
た入力紙面のレイアウトのマッチングを行う。第8図に
、ある新聞の各欄に対応するレイアウトの一例を示す。
図中の51は,第1面のレイアウトであり、紙面の右上
に新聞紙名を示す領域が存在し、下部には、広告領域が
存在する。また、広告領域の左上には、天気概況の囲み
記事および天気図を示す図領域がある。52は、内政・
総合,社説欄のレイアウトであり、左上に,社説の囲み
記事がある653は、社会欄のレイアウトであり、左上
に4コマ漫画を示す図領域が存在する。54は、株式欄
のレイアウトであり、7段に段組みされ、段ごとに縦罫
線が存在し、下部分に、広告欄がない。55は、テレビ
欄のレイアウトであり、7段に分割された表が左詰めで
掲載されている。以上に示したように、各欄のレイアウ
トにはそれぞれ特徴があり、レイアウト情報によって欄
を分類することができる。また、ここで利用した紙面属
性ファイルに格納されているレイアウト(17) 情報として、ある程度以上の大きさを持つ外接矩形の左
上座標と、その外接矩形の矩形属性とを持っている。
ステップ180では、紙面属性ファイルに格納されたレ
イアウト情報のなかに、入力紙面のレイアウトにマッチ
ングする欄のレイアウトがあるかないかを判定し、ある
場合には、入力紙面に対して、マッチングした欄の属性
を設定して、リターンする。ない場合には、ステップ1
82で、入力紙面に対して、特別記事欄の属性を設定し
て、リターンする。
ステップ116では、入力紙面を光ディスクに登録する
。この光ディスクへのへ紙面登録処理については、第2
図(e)に示す流れ図により詳細に説明する。
ステップ190では、入力した紙面の属性,発行年月日
,新聞名等から、光ディスクに紙面を登録するために必
要なインデクス情報を生成する。
ステップ192では、ステップ190で生成した゛イン
デクス情報をディスプレイに表ボし、インチ(l8) クス情報の内容を確認する。第9図に、ディスプレイに
表示したインデクス情報の一例を示す。図中の40は、
ディスプレイの表示領域を示し、41はスキャナから画
像入力した紙面である。
42は、発行年月目,新聞名,曜U,欄属性等のインデ
クス情報を表示している領域であり、43はインデクス
情報を確認する領域である。この図では、41に表示さ
れた紙面を日視しながら、この紙面に対応するインデク
スが42に表示されたもので十分であるかどうかを確認
しながら、処理を進めることができる。ステップ194
では、表示されたインデクス情報を修正する必要がある
かどうかを確認し、修正する場合には、ステップ196
で、インデクスの修正を行なう。また、紙面から抽出で
きないコメントをインデクスに付加するときにもこのス
テップで行なう。インデクス情報の確認が終了したら,
ステップ198で、インデクス情報を光ディスクに登録
し、ステップ200で,光ディスクに画像を登録して、
リターンする。
(19) ステップ118では、光ディスクに登録する紙面の画像
入力が終了したかどうか確認し、終了していない場合に
は、ステップ100以降の処理を繰り返し、そうでない
場合には、処理全体を終了する。
以上に示した処理手順によって、スキャナ等の画像入力
装置によって、入力された新聞紙面を光ディスクに自動
登録することができる。ここでは、新聞を例にして説明
をしてきたが,新聞と同様に、複数ページから構或され
る画像で,ページが決まると、そのページに印刷されて
いる画像の内容が決まる画像や、ページに印刷されてい
る画像の内容と、そのページのレイアウトに対応関係が
あり、レイアウトが決まると、その画像の内容が決まる
画像に対しても適用できる。
なお、目次等のように、ページとそのページの内容を対
応付ける情報を予め入力しておくことにより、前記と同
様な処理が可能となり、ページを示す情報を持つ入力画
像に対して,コメントを生成し、インデクス情報に付加
することができる。
(20) ただし、目次等を利用した場合には,ページとページの
内容とが必ずしも1対1に対応するとは限らず,複数ペ
ージが1つの内容に対応する場合もある。
〔発明の効果〕
新聞を光ディスク等に登録する場合、新聞名,発行年月
日,曜日等は、新聞を分類する上で、有効なデータであ
り、新聞の各ページの内容を分類する上で、ページ以外
に、経済欄,国際欄,株式欄等の欄を識別し、インデク
ス情報の一つとして付加することは、紙面画像を管理す
る場合に有効である。また、軟聞名,発行年月H等は、
切り出し位置,認識対象となる文字種等が限定されてい
るので、認識が容易である。したがって、インデクスの
生成を高速かつ正確に行なうことができる。
【図面の簡単な説明】
第1図は、本発明を実現するためのシステム構或の一実
施例、第2図(a)〜(e)は、本発明の一実施例を示
すフローチャート、第3図は、傾き検出を実現する方法
の一例を説明するための図、(21) 第4図は、横棒罫線を検出する方法の一例を示すフロー
チャート、第5図は、新聞名,発行年月H等を示す枠外
文字の一例を示す図、第6図は,新聞ページ属性ファイ
ルの構成の一例を示す図,第7図は、紙面構或要素を分
類する規則の一例を示す図、第8図は、新聞の各欄のレ
イアウトを示す一例を示す図、第9図は、表示画面の内
容を示す一例を示す図である。 (22) 猶 2 図 (b) 拓 2 図 (c) (7t;フフ=g工冫24θ 特開平3 − 27471(8) 月 欠 朝十1 タ寸)l 新聞ん 日 第 YY新間A→せフ1イル 7 (2) ノク: 升形高き 一549−

Claims (1)

  1. 【特許請求の範囲】 1、新聞等、欄の内容ごとにページ割り付けされた複数
    ページからなる画像を光ディスク等の大容量記憶媒体に
    登録する場合に、スキャナ等の画像入力装置から入力さ
    れた画像から欄の内容を表す情報を抽出し、インデクス
    情報として利用する画像登録方式。 2、新聞の上下および上部分に印刷された文字列位置を
    認識する手段と、前記文字列を文字認識する手段を備え
    、新聞名、発行年月日、曜日、ページ等に加え、ページ
    の欄を示す欄識別子を文字認識することにより、光ディ
    スク等の大容量記憶媒体に画像登録する場合に必要なイ
    ンデクス情報を生成する第1項記載の画像登録方式。 3、新聞の上部分に印刷された文字列のなかに、欄を示
    す欄識別子が検出されない場合に、ページを文字認識す
    る手段と、入力対象である新聞全体のページ数を知る手
    段と、ページと欄を対応付けるページ割り付け情報を格
    納する手段とを備え、入力した画像のページを文字認識
    し、文字認識したページにより、画像に対応する欄属性
    を与えることにより、インデクス情報を生成する第1項
    記載の画像登録方式。 4、画素を解析することにより、画像のレイアウト情報
    を抽出する手段と、新聞の上部分に印刷された文字列か
    ら、新聞名を文字認識する手段と、新聞ごとに分類され
    た、各欄のレイアウト情報を格納する手段とを備え、入
    力した画像の新聞名を認識する手段とを備え、入力した
    画像の新聞名を認識し、認識した新聞名に対応する前記
    レイアウト情報を格納する手段に格納されたレイアウト
    情報と、前記レイアウト情報を抽出する手段により、入
    力した画像から抽出したレイアウト情報とをマッチング
    することにより、画像に欄属性を与え、インデクス情報
    を生成する上記第1項記載の画像登録方式。 5、画像のレイアウトを生成する場合に、黒画素の連結
    領域に外接する矩形を抽出し、抽出した矩形の大きさ、
    および、矩形内の黒画素の密度とラン長により矩形の属
    性を分類することを特徴とする上記第4項記載の画像登
    録方式。 6、枠罫線を検出する手段を備え、入力された画像の傾
    きを補正する場合に、枠罫線の傾きを検出し、この枠罫
    線を基準にして補正を行い、また、新聞の上部分に印刷
    された文字列を検出する場合に、枠罫線を検出すること
    により、文字列を切り出す範囲を限定する上記第2項、
    第3項または第4項記載の画像登録方式。 7、新聞紙面において、新聞名、発行年月日、曜日、ペ
    ージなどの特定な文字列の印刷位置を判別する手段と、
    切り出した文字列を文字認識する手段とを備え、文字列
    の印刷位置により、照合すべき単語を限定する文字認識
    方法を利用した上記第2項、第3項または第4項記載の
    画像登録方式。 8、新聞紙面に印刷された文字を囲む外接矩形を抽出す
    る手段と、新聞紙面に印刷された文字を修正して辞書を
    作成する手段と、新聞ごとに文字認識用の辞書を持つ文
    字認識手段を備え、新聞に別刷した文字を文字認識して
    新聞を分類する場合、印刷されている文字の書体、形状
    、大きさを利用して、分類すべき新聞の候補を絞り込む
    ことを特徴とする上記第2項、第3項または第4項記載
    の画像登録方式。 9、本、雑誌等、目次を備えた複数ページで構成されて
    いる画像を登録する場合、目次から、ページと本、雑誌
    等の内容を対応付けるデータを生成する手段、あるいは
    、目次が印刷された画像から目次を示す文字列を切り出
    す手段と、切り出した文字列を文字認識する手段と、文
    字認識した文字列からページと本、雑誌等の内容を対応
    付けるデータを生成する手段とを備え、目次に対応する
    画像を入力し、ページと本、雑誌等の内容を対応付ける
    データを生成し、かつ、入力した画像からページを示す
    部分を切り出し、文字認識する手段とを備え、入力した
    画像のページを文字認識し、認識したページに対応する
    本、雑誌等の内容を画像登録時のインデクス情報として
    利用することを特徴とする上記第1項記載の画像登録方
    式。
JP1160743A 1989-06-26 1989-06-26 画像登録方式 Pending JPH0327471A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1160743A JPH0327471A (ja) 1989-06-26 1989-06-26 画像登録方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1160743A JPH0327471A (ja) 1989-06-26 1989-06-26 画像登録方式

Publications (1)

Publication Number Publication Date
JPH0327471A true JPH0327471A (ja) 1991-02-05

Family

ID=15721496

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1160743A Pending JPH0327471A (ja) 1989-06-26 1989-06-26 画像登録方式

Country Status (1)

Country Link
JP (1) JPH0327471A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05342326A (ja) * 1992-06-09 1993-12-24 Fuji Xerox Co Ltd 文書処理装置
JPH0644325A (ja) * 1991-10-24 1994-02-18 American Teleph & Telegr Co <Att> A−v知覚可能情報セグメントのアクセス方法
JPH06223231A (ja) * 1991-08-23 1994-08-12 Hitachi Ltd グラフ画像登録システム
JPH06333015A (ja) * 1993-05-21 1994-12-02 Ricoh Co Ltd 画像形成記憶装置
JP2020144719A (ja) * 2019-03-08 2020-09-10 国立大学法人秋田大学 紙面領域分類装置及びそのプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06223231A (ja) * 1991-08-23 1994-08-12 Hitachi Ltd グラフ画像登録システム
JPH0644325A (ja) * 1991-10-24 1994-02-18 American Teleph & Telegr Co <Att> A−v知覚可能情報セグメントのアクセス方法
JPH05342326A (ja) * 1992-06-09 1993-12-24 Fuji Xerox Co Ltd 文書処理装置
JPH06333015A (ja) * 1993-05-21 1994-12-02 Ricoh Co Ltd 画像形成記憶装置
JP2020144719A (ja) * 2019-03-08 2020-09-10 国立大学法人秋田大学 紙面領域分類装置及びそのプログラム

Similar Documents

Publication Publication Date Title
US5748805A (en) Method and apparatus for supplementing significant portions of a document selected without document image decoding with retrieved information
Kleber et al. Cvl-database: An off-line database for writer retrieval, writer identification and word spotting
US8452132B2 (en) Automatic file name generation in OCR systems
US5903904A (en) Iconic paper for alphabetic, japanese and graphic documents
US6400845B1 (en) System and method for data extraction from digital images
JP3088019B2 (ja) 媒体処理装置及び媒体処理方法
CA2077274C (en) Method and apparatus for summarizing a document without document image decoding
JP3282860B2 (ja) 文書上のテキストのデジタル画像を処理する装置
JP3425408B2 (ja) 文書読取装置
JPH04321183A (ja) ファイリング装置の文書登録方法
KR101769918B1 (ko) 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치
JPH0750483B2 (ja) 文書画像追加情報の蓄積方法
US20130014007A1 (en) Method for creating an enrichment file associated with a page of an electronic document
US11615244B2 (en) Data extraction and ordering based on document layout analysis
JPH11282955A (ja) 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JPS5947641A (ja) 名刺デ−タベ−ス作成装置
JPH0327471A (ja) 画像登録方式
JP3463008B2 (ja) 媒体処理方法及び媒体処理装置
JP3463009B2 (ja) 媒体処理方法及び媒体処理装置
Yamashita et al. A document recognition system and its applications
JP3142986B2 (ja) 文書情報検索装置
JP4517822B2 (ja) 画像処理装置及びプログラム
Lawrie et al. Building OCR/NER test collections
JP3091278B2 (ja) 文書認識方式
Mahmood et al. A performance comparison of segmentation techniques for the Urdu text