JPS60114967A - 画像フアイル装置 - Google Patents

画像フアイル装置

Info

Publication number
JPS60114967A
JPS60114967A JP58222025A JP22202583A JPS60114967A JP S60114967 A JPS60114967 A JP S60114967A JP 58222025 A JP58222025 A JP 58222025A JP 22202583 A JP22202583 A JP 22202583A JP S60114967 A JPS60114967 A JP S60114967A
Authority
JP
Japan
Prior art keywords
character
image
information
picture
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58222025A
Other languages
English (en)
Inventor
Osamu Kunisaki
国崎 修
Hirohide Endo
遠藤 裕英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP58222025A priority Critical patent/JPS60114967A/ja
Publication of JPS60114967A publication Critical patent/JPS60114967A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Controls And Circuits For Display Device (AREA)
  • Processing Or Creating Images (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本光明は文字、図面等の1IiII琢をファイル化する
画像ファイル装置に関し、特に検索に必要なキーワード
を自動的に画像情報に付加し得る画像ファイル装置に関
する。
〔発明の背景〕
文字、図面等の情報のファイル化にあたっては、検索の
ためにキーワードを設けることは不可欠でるる。従来の
画像ファイル装置におけるファイル作成では、光学的に
画像情報を入力する部分とは別に、人手によシキーワー
ドを入力する必要があった。
一般的に、キーワードは、画像情報中に文字情報として
冨まれていることが多い。したがって、キーワード入力
を目動化する方法として、原画像中のキーワードを文字
認識により自動的にコード化することが考えられる。こ
の方法を採用した促米例では、その帳票形態を第1図に
示すようにしている。すなわち、ファイル化すべき■像
情報領域11と認識してコード化すべきキーワード情報
領域12とが分離しておシ、画像情報憤域11には文章
13や図面14等が記載されている。そして、lI!I
Ij家情報領域11内の情報を画像情報として取込み、
キーワード情報領域12内の情報を認識して文字コード
に変換し、画像データにコード情報が付加されたファイ
ル形態として表示することによシ、キーワード入力を自
動化していた。
しかし、上記のような従来技術では、キーワード情報の
格納領域がファイル化すべき画像情報の格納領域とは別
に設けられており、キーワードを画像情報の中から予め
抜き出して指定領域に転記するか、または新規作成して
おく必要があった。
このため、ファイル化したい文書は、予めキーワード記
入頭載を設定したフォーマットを前提とする必要があり
、該フォーマット以外の任意形式で記載された文4をフ
ァイル化する場合には、原画1坂中のキーワードを文字
認識によシ自動的にコード化することが不可能となシ、
従前の如く、人手によシキーワードをキー人力する必要
がめった。
〔発明の目的〕
本発明の目的は、上記のような従来技術の欠点を屏消し
、帳票中にキーワード記入頭載を特別に設けなくても、
帳票に記載された文書中の任意の位置に存在するキーワ
ードを文字認識により自動的にコード化することのでき
る画像ファイル装置′ を提供することにある。
〔発明の概要〕
上記目的を達成するだめ、本発明による画像ファイル装
置は、文子を含む画像情報を取シ込む情報人力部と、前
記画像情報にl[!]I像処理を施す画像処理部と、画
像処理清面1ボ情報の文字部分のうち予め指定した特殊
形式で記入されている認識対象文字を検出し切出す文字
切出部と、切出された前記認識対象文字を装置の内部コ
ード情報にりこ換し認識する文字認識部と、前記内部コ
ード情報と画像処理済画像情報とを組合せて画像ファイ
ルを生成するファイル生成処理部とを具備せしめること
によシ、任意のフォーマットによる文書のlI!II琢
ファイルに対して自動的にキーワードを付加することに
特徴がある。
〔発明の実施例〕
以下、不発明の一実施例を図面に基づいて説明する。
第2図は本発明の一来施l+すを示すブロック図である
図中、帳票21はファイル化の対象としての文書であり
、この帳票21には、第3図に示す如く、文革13や図
面14等が記載され、第1図に示した従来のキーワード
自動入力方式に用いられた帳票とは異なり、特別のキー
ワード記入領域を持たない一叡的に使用されている普通
の帳票である。
帳票21に記載された文書中−には、ファイル化に必要
なキーワードが存在するものとする。もし、原文1°中
にキーワードが存在しないときは、適当な・局所にIM
 ff己しであるものとする。このとき、キーワードに
該当する又字列には、アンダーライン15を引いて他と
区別し、文子認識の対象とする。
なお、このように他と区別する補助手段として、四角で
囲む、色マーカで塗る、特殊記号で挾む等が考えられる
が、いずれも、後述の光電袈換部22、および画像処理
部23によシ他と区別することがでさる。また、予めイ
タリック体、ゴシック体で記入されている部分をキーワ
ードとして用いた場合も、画像処理部23で他と区別で
きる。
ここでは、赤色のアンダーライン15を引いて他と区別
する例で説明する。’Pk+”A 21上の文字、図面
等の情報は、光電変換部22で2fi画像1n報に変換
される。赤色アンダーライン15は、郵便荀号枠を検出
する場合と同様の方法で検出可能である。
画像処理部23は、赤色のアンダーライン15を除去し
た状態で取込まれた画像情報に対し、エツジ強調ノイズ
で除去、拡大縮少などの処理やディスプレイ装置、レー
ザプリンタ等の表示・印刷部28のために必要な補助曲
走4を行う。
画像処理部23で処理された画像情報は、認識対象文字
切出部24により、アンダーライン15部分の文字列が
1文字ずつ切出される。赤色のアンダーライン15が検
出されれば、その部分の文字切出しは、アンダーライン
検出信号と文字検出信号との論理積をとる等の手段を用
いることによシ抗出し可能となる。
文字認識部25は、切出された文字列を1字ずつ認識し
、内部コードに変換する。
以上のようにして得られたキーワードのコード列251
と画像処理情動1象情報252は、ファイル生成処理部
26に入力される。ファイル生成処理部26では、画像
処理済両縁情報252に検索用キーワードコード251
を所定のフォーマットで付加し、画像ファイルデータ2
7を作成する。
以上の処理を制御する部分は、マイクロコンピュータで
制御可能であるが、図示省略しである。
なお、ファイル生成処理部26は、原文書に追記したキ
ーワード、またはアンダーラインなどの検索用補助記号
が、取込んだ画像情報に含まれている場合、これを画像
情報から除去する手段をも有する。この手段によシ、画
像ファイルデータ27の画像16報から、キーワード指
定のため原文書に付加した情報を除去することができる
。また、ファイル生成処理部26は、キーワード部の文
字認識後、画像ファイルデータ27のキーワード部を態
形式にS$l史する手段ケ有する。したがって、クリえ
ばイタリック体で記載でれていたキーワード部分を他の
部分の一4体と同一にすることができ、画像ファイルデ
ータ27が表示・印刷された除、統一された書体で記載
されているので公的な文書として使用することができる
。これとはゲに、キーワード部分を他の部分の11体と
別の書体にした場合は、文書の要点を即座に把握するこ
とができるようになる。
また、キーワード部分以外の画像情報は、例えば手書き
による画像情報であったとしても、文字認識部25等に
よシ装置が認識し得る内部情報の形式に変換することな
く、表示・印刷等のための補助的処理を施すだけで単な
る画像情報として直ちにファイル生成処理を行うため、
経済性、簡便性、および利用可能分野の飛躍的拡大化を
図ることができる。
〔弗明の効果〕
以上説明したように、本発明によれば、帳票中にキーワ
ード記入領域を特別に設けなくても、帳票に記gでれた
文書中の任意の位置に存在するキーフードを文字認識に
よシ自動的にコード化することができ、任意の帳票に対
して自動的にキーワードを付加して画像ファイル化する
ことができる。
【図面の簡単な説明】
第1図は従来の帳票を示す図、第2図は本発明−の−笑
施例を示すブロック図、第3図は本発明に使用される帳
票とキーワードの指定方法の一例を説明するだめの図で
ある。

Claims (1)

  1. 【特許請求の範囲】 1、文字を含む画像情報を取シ込む情報入力部と、前記
    画像情報に画像処理を施す画像処理部と、画像処理済画
    像情報の文字部分のうち予め指定した特殊形式で記入さ
    れている認識対数文字を検出し切出す文手切田部と、切
    出された前1己認識対象文字を装置の内部コード情報に
    変換し屹識する文字認識部と、前記内部コード情報と画
    1政処理済画像情報とを組合せて画像ファイルを生成す
    るファイル生成処理部とを具備することを特徴とする画
    像ファイル装置。 2、前記画像ファイル生成処理部は、特殊形式でn記入
    された前記認識対象文字を態形式に変換し画像ファイル
    とする手段を有することを特徴とする特許6青求の範囲
    第1項記載の画像ファイル装置。
JP58222025A 1983-11-28 1983-11-28 画像フアイル装置 Pending JPS60114967A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58222025A JPS60114967A (ja) 1983-11-28 1983-11-28 画像フアイル装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58222025A JPS60114967A (ja) 1983-11-28 1983-11-28 画像フアイル装置

Publications (1)

Publication Number Publication Date
JPS60114967A true JPS60114967A (ja) 1985-06-21

Family

ID=16775914

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58222025A Pending JPS60114967A (ja) 1983-11-28 1983-11-28 画像フアイル装置

Country Status (1)

Country Link
JP (1) JPS60114967A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6244878A (ja) * 1985-08-23 1987-02-26 Hitachi Ltd 文書フアイリングシステム
JPS62280968A (ja) * 1986-05-30 1987-12-05 Hitachi Ltd 蓄積型画像情報編集システム
JPS6325782A (ja) * 1986-06-30 1988-02-03 コダック・リミテッド デジタルイメ−ジングフアイル処理方式
JPS63212985A (ja) * 1987-02-28 1988-09-05 株式会社東芝 画像記録装置
JPH05242142A (ja) * 1991-11-19 1993-09-21 Xerox Corp 文書画像の復号なしに文書を要約するための方法
JPH06342483A (ja) * 1994-04-11 1994-12-13 Hitachi Ltd 文書ファイリングシステム
US5628003A (en) * 1985-08-23 1997-05-06 Hitachi, Ltd. Document storage and retrieval system for storing and retrieving document image and full text data
JP2003228572A (ja) * 2002-12-12 2003-08-15 Ricoh Co Ltd 画像処理装置およびインデックス情報作成方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5433635A (en) * 1977-08-22 1979-03-12 Hitachi Ltd Information recorder
JPS55121572A (en) * 1979-03-13 1980-09-18 Toshiba Corp Document filing unit

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5433635A (en) * 1977-08-22 1979-03-12 Hitachi Ltd Information recorder
JPS55121572A (en) * 1979-03-13 1980-09-18 Toshiba Corp Document filing unit

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6244878A (ja) * 1985-08-23 1987-02-26 Hitachi Ltd 文書フアイリングシステム
US5628003A (en) * 1985-08-23 1997-05-06 Hitachi, Ltd. Document storage and retrieval system for storing and retrieving document image and full text data
JPS62280968A (ja) * 1986-05-30 1987-12-05 Hitachi Ltd 蓄積型画像情報編集システム
JPS6325782A (ja) * 1986-06-30 1988-02-03 コダック・リミテッド デジタルイメ−ジングフアイル処理方式
JPS63212985A (ja) * 1987-02-28 1988-09-05 株式会社東芝 画像記録装置
JPH05242142A (ja) * 1991-11-19 1993-09-21 Xerox Corp 文書画像の復号なしに文書を要約するための方法
JPH06342483A (ja) * 1994-04-11 1994-12-13 Hitachi Ltd 文書ファイリングシステム
JP2003228572A (ja) * 2002-12-12 2003-08-15 Ricoh Co Ltd 画像処理装置およびインデックス情報作成方法

Similar Documents

Publication Publication Date Title
JP3282860B2 (ja) 文書上のテキストのデジタル画像を処理する装置
JP3289968B2 (ja) 電子的文書処理のための装置および方法
JP3292388B2 (ja) 文書画像の復号なしに文書を要約するための方法と装置
EP0544433B1 (en) Method and apparatus for document image processing
EP0543598B1 (en) Method and apparatus for document image processing
JP3427692B2 (ja) 文字認識方法および文字認識装置
US20030004991A1 (en) Correlating handwritten annotations to a document
JP2011513849A (ja) スキャンの方法
CN108197119A (zh) 基于知识图谱的纸质档案数字化方法
JPS60114967A (ja) 画像フアイル装置
MX2010009615A (es) Metodo de exploracion.
Rashtehroudi et al. PESTD: a large-scale Persian-English scene text dataset
JP2008311828A (ja) 画像処理装置、画像処理方法、そのプログラムおよび記録媒体
JPH08180068A (ja) 電子ファイリング装置
CN113657373A (zh) 一种文书自动编目方法
JP4334068B2 (ja) イメージ文書のキーワード抽出方法及び装置
Alzuru et al. Quality-Aware Human-Machine Text Extraction for Biocollections using Ensembles of OCRs
JP2000259847A (ja) 情報検索方法、装置および記録媒体
JPH07200734A (ja) 光学的文字読取装置
JP2904849B2 (ja) 文字認識装置
JPS63201867A (ja) 文書画像自動要約方式
JPH06274551A (ja) 画像ファイリング装置
JP3243389B2 (ja) 文書識別方法
PATRAŞCU et al. CLRE–PARTIAL RESULTS IN THE DEVELOPMENT OF A ROMANIAN LEXICOGRAPHIC CORPUS
Bagarukayo Marvin Ssemambo Reg: 2016/HD05/344U Std No: 210025242 sallanmarvin@ gmail. com/mssemambo@ cis. mak. ac. ug