JPH06149889A - Electronic filing system - Google Patents

Electronic filing system

Info

Publication number
JPH06149889A
JPH06149889A JP4302632A JP30263292A JPH06149889A JP H06149889 A JPH06149889 A JP H06149889A JP 4302632 A JP4302632 A JP 4302632A JP 30263292 A JP30263292 A JP 30263292A JP H06149889 A JPH06149889 A JP H06149889A
Authority
JP
Japan
Prior art keywords
document
keyword
image
unit
reading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4302632A
Other languages
Japanese (ja)
Inventor
Ayako Itsubo
綾子 伊坪
Yasuhiko Murayama
靖彦 村山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP4302632A priority Critical patent/JPH06149889A/en
Publication of JPH06149889A publication Critical patent/JPH06149889A/en
Pending legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE:To provide an electronic filing system capable of automatically extracting a key word. CONSTITUTION:The image of a document 101 is read in by a reader 102. Thence, a key word registration/retriever 103 registers the routine format of a read in document as displaying data on a display 105, or designates the kind of the document when the routine format is already registered, and performs character recognition in the routine format, and automatically extracts the key word from a recognition result, and registers a document image and the key word on a memory device 104 as a pair.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、複数の画像情報とそれ
ぞれに対応するキーワードとを記憶媒体に記憶させ、必
要な画像情報をキーワードにより検索することが可能な
電子ファイリングシステムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an electronic filing system in which a plurality of image information and keywords corresponding to the respective image information are stored in a storage medium and necessary image information can be searched by the keyword.

【0002】[0002]

【従来の技術】電子ファイリングシステムにおいては、
複数の画像情報とそれぞれに対応するキーワードとを記
憶媒体に記憶させる場合に、画像情報については、その
画像情報の原稿を二次元走査装置にセットすれば、ほぼ
自動的にその画像情報が読み取られて記憶媒体に記憶さ
せることができるのに対し、キーワードについては、画
像情報の原稿を二次元走査装置にセットしたとき、ある
いは、複数の画像情報を記憶させ終わった後に、操作者
がキーボードのキーを操作してキーワードの入力を行わ
なければならない。したがって、画像情報が多くなるほ
ど、キーワード入力のキー操作による作業が煩雑とな
り、時間の掛かる作業となる欠点があった。
2. Description of the Related Art In an electronic filing system,
When a plurality of pieces of image information and keywords corresponding to the pieces of image information are stored in a storage medium, the image information can be read almost automatically if a document of the image information is set on a two-dimensional scanning device. While the keyword can be stored in a storage medium, the operator can use a key on the keyboard when setting a document of image information on the two-dimensional scanning device or after storing a plurality of image information. You must input the keyword by operating. Therefore, there is a drawback in that as the amount of image information increases, the operation of key operation for keyword input becomes more complicated and time-consuming.

【0003】そこで、電子ファイリングシステムにおけ
るキーワード入力の所要時間短縮化を図るために、バー
コード等により表したキーワード情報を画像情報ととも
に読み取り、自動的に抽出・記憶する方法(特開昭61
−65363)や、読み取る文書画像の原稿上で、キー
ワードとなる部分をマーカー等で指定し読み取ることに
より、キーワードを自動的に記憶する方法(特開平1−
269171)が示されている。
Therefore, in order to shorten the time required for inputting a keyword in an electronic filing system, a method of reading keyword information represented by a bar code or the like together with image information and automatically extracting / storing it (Japanese Patent Laid-Open No. 61-61).
-65363), or a method of automatically storing a keyword by designating a portion to be a keyword on a document of a document image to be read by using a marker or the like and reading the same (Japanese Patent Laid-Open No. 1-199903).
269171) is shown.

【0004】[0004]

【発明が解決しようとする課題】このような従来技術で
は、 (1)バーコード等によりキーワード情報を文書画像に
表す手間がいる。
In such a conventional technique, (1) it is troublesome to display the keyword information in the document image using a barcode or the like.

【0005】(2)マーカー等でキーワードを指定する
手間がいる。
(2) It is troublesome to specify a keyword with a marker or the like.

【0006】以上のような問題がある。There are problems as described above.

【0007】ところで、電子ファイリングシステムにフ
ァイルする文書は、キーワードとなる文字列が、例えば
論文、社内文書等のタイトルや概要のように、常に同じ
位置に記載されている定型フォーマットのものが多い。
By the way, many documents stored in the electronic filing system have a fixed format in which a character string serving as a keyword is always written in the same position, such as a title or an outline of a paper or an in-house document.

【0008】本発明はこのような事情のもとに成された
もので、その目的とするところは、読み取り装置で読み
取った文書画像の定型フォーマットとなる部分を指定
し、フォーマット内の文字認識を行うことにより、検索
に用いるキーワードを自動的に抽出・記憶し得るように
した電子ファイリングシステムを提供することにある。
The present invention has been made under such circumstances, and its purpose is to designate a portion of a document image read by a reading device as a standard format and perform character recognition in the format. An object of the present invention is to provide an electronic filing system capable of automatically extracting and storing a keyword used for a search by performing it.

【0009】[0009]

【課題を解決するための手段】本発明の電子ファイリン
グシステムは、文書画像の読み取りを行う読み取り手段
と、記憶装置に文書種類とキーとなる部分の位置情報を
登録する定型フォーマット登録手段と、前記読み取り手
段で読み取る文書画像が何れの文書種類にあたるかを指
定する文書種指定手段と、前記文書種類指定手段により
指定された文書種類に応じて、前記読み取り手段で読み
取った文書画像のキーとなる部分の文字認識を行う文字
認識手段と、前記文字認識手段で文字認識された結果か
らキーワードの抽出をする抽出手段と、前記キーワード
抽出手段で抽出したキーワードと前記読み取り手段で読
み取った文書画像とを対応させて、記憶装置に登録する
登録手段とを備えていることを特徴とする。
An electronic filing system according to the present invention comprises a reading means for reading a document image, a fixed format registration means for registering a document type and position information of a key portion in a storage device, and A document type designating unit that designates which document type the document image read by the reading unit corresponds to, and a portion that serves as a key of the document image read by the reading unit according to the document type designated by the document type designating unit. Character recognition means for recognizing characters, extraction means for extracting a keyword from the result of character recognition by the character recognition means, the keyword extracted by the keyword extraction means and the document image read by the reading means are associated with each other. And a registration unit for registering in the storage device.

【0010】[0010]

【実施例】以下本発明の一実施例を図面に基づいて説明
する。また、以下の「オペレータ」とは、電子ファイリ
ングシステムの利用者を示す。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described below with reference to the drawings. Further, the following “operator” refers to a user of the electronic filing system.

【0011】図1は本発明の電子ファイリングシステム
を実行するための制御システムの一実施例、及び処理制
御状態を示す図である。この実施例に係わる制御システ
ムは、文書101を読み取るための読み取り装置102
と、読み取り装置102によって読み取られた文書画像
からキーワードを自動抽出するキーワード登録部や、検
索を行う検索部を備えたキーワード登録・検索装置10
3と、キーワード登録・検索装置103で得られたデー
タを記憶する記憶装置104と、キーワード登録・検索
装置103によってキーワード登録・検索を行う時に、
処理手順や処理結果を表示する表示装置105とから成
る。
FIG. 1 is a diagram showing an embodiment of a control system for executing the electronic filing system of the present invention and a process control state. The control system according to this embodiment includes a reading device 102 for reading a document 101.
And a keyword registration / search device 10 including a keyword registration unit for automatically extracting keywords from a document image read by the reading device 102 and a search unit for performing a search.
3, a storage device 104 for storing data obtained by the keyword registration / search device 103, and a keyword registration / search by the keyword registration / search device 103,
The display device 105 displays a processing procedure and a processing result.

【0012】図2はキーワード登録・検索装置103の
構成図である。キーワード登録・検索装置103は読み
取り装置102に接続されて文書画像イメージの読み取
りを行うイメージ読み取り部201と、イメージ読み取
り部201で読み取られた文書のイメージデータが格納
されるイメージメモリ207と、イメージメモリ207
に格納されたデータに対する定型フォーマットデータが
登録済みでない場合に、オペレータに対し、イメージデ
ータ207に格納されたデータの文書種類と定型フォー
マットに関する情報を指定するよう要求し、オペレータ
が指定した文書種類とそれに対応する定型フォーマット
データを記憶装置104に登録する定型フォーマット登
録部202と、イメージメモリ207に格納されたデー
タの定型フォーマットが登録済みの場合に、オペレータ
に対し、イメージメモリ207に格納されたデータの文
書画像の種類を指定するよう要求し、指定された文書種
類に基づいて定型フォーマットデータを引き出す文書種
指定部203と、定型フォーマット登録部202または
文書種指定部203によって決定された定型フォーマッ
トデータに基づいて、イメージメモリ207に格納され
たデータの定型フォーマット内のキー部分の文字認識を
行う文字認識部204と、文字認識部204によって得
られた認識結果を格納する認識結果メモリ208と、認
識結果メモリ208に格納されたデータの中からキーワ
ードを抽出し、イメージメモリ207に格納されたデー
タとキーワードを対にして登録するキーワード登録部2
05と、キーワード登録部によって登録されたキーワー
ドを指定することによって必要な文書の検索を行う検索
部206と、キーワード登録・検索装置103で得られ
たデータ(文書画像のイメージデータ・定型フォーマッ
トデータ等)を記憶する記憶装置104や、キーワード
登録・検索装置103を構成する各部の制御を行う制御
部209とを有している。
FIG. 2 is a block diagram of the keyword registration / search device 103. The keyword registration / retrieval device 103 is connected to the reading device 102 to read a document image image, an image memory 207 in which the image data of the document read by the image reading unit 201 is stored, and an image memory. 207
If the standard format data for the data stored in is not registered, the operator is requested to specify the document type of the data stored in the image data 207 and the information on the standard format, and the document type specified by the operator When the standard format registration unit 202 for registering the standard format data corresponding to it in the storage device 104 and the standard format of the data stored in the image memory 207 have been registered, the operator stores the data stored in the image memory 207. Requesting to specify the type of the document image and extracting the standard format data based on the specified document type, and the standard format data determined by the standard format registration section 202 or the document type specification section 203. Based on A character recognition unit 204 that performs character recognition of a key portion in a fixed format of data stored in the image memory 207, a recognition result memory 208 that stores the recognition result obtained by the character recognition unit 204, and a recognition result memory 208. A keyword registration unit 2 for extracting a keyword from the data stored in and registering the keyword and the data stored in the image memory 207 as a pair.
05, a search unit 206 that searches for a required document by designating a keyword registered by the keyword registration unit, and data obtained by the keyword registration / search device 103 (image data of a document image, standard format data, etc.). ) Is stored, and a control unit 209 that controls each unit that configures the keyword registration / search device 103.

【0013】図3は本実施例の画像データ入力の際の処
理の概要を示す流れ図である。始めに301において、
これから読み取る文書画像の定型フォーマットデータが
登録済みであるか否かを、オペレータに指示するよう要
求する。301でフォーマット登録済みと指示された場
合、文書種指定処理302において、文書種指定部20
3はオペレータに対し、読み込む文書の種類が、何れの
文書にあたるかを指定するよう要求し、指定された文書
種類に基づいて定型フォーマットデータを引き出す。そ
して読み取り処理303において、イメージ読み取り部
201は文書画像の読み取りを行いイメージメモリ20
7に格納する。301でフォーマット登録済みでないと
指示された場合は、読み取り処理304において、イメ
ージ読み取り部201は文書画像の読み取りを行いイメ
ージメモリ207に格納し、定型フォーマット登録処理
305において、定型フォーマット登録部202は、イ
メージデータ207に格納されたデータの表示を表示装
置105に行い、オペレータに対し文書種類と定型フォ
ーマット内のキーとなる部分の位置を指定するよう要求
し、オペレータが指定した文書種類とそれに対応する定
型フォーマット内のキーとなる部分の位置情報を定型フ
ォーマットデータとして記憶装置104に登録する。
FIG. 3 is a flow chart showing an outline of the processing at the time of inputting image data in this embodiment. First at 301,
The operator is requested to instruct whether or not the standard format data of the document image to be read is registered. When it is instructed in 301 that the format has been registered, in the document type designation processing 302, the document type designation unit 20
3 requests the operator to specify which document the read document type corresponds to, and extracts the standard format data based on the specified document type. Then, in the reading process 303, the image reading unit 201 reads the document image and executes the image memory 20.
Store in 7. When it is instructed by 301 that the format has not been registered, the image reading unit 201 reads the document image and stores it in the image memory 207 in the reading process 304, and the fixed format registration unit 202 in the fixed format registration process 305. The data stored in the image data 207 is displayed on the display device 105, and the operator is requested to specify the document type and the position of a key portion in the standard format, and the document type specified by the operator and the corresponding document type. Position information of a key portion in the fixed format is registered in the storage device 104 as fixed format data.

【0014】次に文字認識処理306において、文字認
識部204は、イメージメモリ207に格納されたイメ
ージデータに対して、302もしくは305によって指
定もしくは登録された定型フォーマットデータを用い
て、定型フォーマットのキーとなる部分の文字認識を行
い、認識結果メモリ208に格納する。なお、文字認識
部204における文字の切り出し、文字認識は公知の方
法を用いて行う。次にキーワード抽出・登録処理307
において、キーワード抽出・登録部205は認識結果メ
モリ208に格納されたデータからキーワードの抽出を
行い、イメージメモリ207に格納されたデータに対応
させて記憶装置104に登録する。
Next, in the character recognition process 306, the character recognition unit 204 uses the fixed format data designated or registered by the 302 or 305 for the image data stored in the image memory 207 and uses the fixed format key. The character recognition is performed for the portion to be stored in the recognition result memory 208. Note that the character recognition unit 204 performs character cutting and character recognition by using known methods. Next, keyword extraction / registration processing 307
At, the keyword extraction / registration unit 205 extracts a keyword from the data stored in the recognition result memory 208, and registers it in the storage device 104 in association with the data stored in the image memory 207.

【0015】次に、図3におけるキーワード抽出・登録
処理307の実施方法について説明する。
Next, a method of executing the keyword extraction / registration process 307 in FIG. 3 will be described.

【0016】図4は図3のキーワード抽出・登録処理3
07の概要を説明する流れ図である。まず誤認識文字訂
正処理401において、認識結果メモリ208に格納さ
れた認識結果データに誤りがあればオペレータが訂正す
る。次にキーワード抽出処理403において、記憶装置
104に格納されているキーワード辞書を参照して、認
識結果メモリ208に格納された認識結果データからキ
ーワード抽出を行う。そして、キーワード確認処理40
3によって、オペレータがキーワード抽出処理402で
抽出されたキーワードを確認し、不要なキーワード、ま
たは誤ったキーワード、付け足すキーワードなどがあれ
ば修正する。最後にキーワード登録処理404によっ
て、キーワード確認処理403で確認されたキーワード
を登録する。なお、文字認識処理306とキーワード抽
出処理402の処理結果に誤りが無い場合、点線で囲ん
だ誤認識文字訂正処理401とキーワード確認処理40
3は、不要な処理となる。
FIG. 4 shows the keyword extraction / registration process 3 of FIG.
It is a flow chart explaining the outline of 07. First, in the erroneously recognized character correction processing 401, if the recognition result data stored in the recognition result memory 208 has an error, the operator corrects it. Next, in the keyword extraction processing 403, the keyword extraction is performed from the recognition result data stored in the recognition result memory 208 with reference to the keyword dictionary stored in the storage device 104. Then, the keyword confirmation processing 40
3, the operator confirms the keywords extracted in the keyword extraction processing 402, and corrects any unnecessary keywords, erroneous keywords, additional keywords, or the like. Finally, the keyword registration processing 404 registers the keyword confirmed in the keyword confirmation processing 403. If there is no error in the processing results of the character recognition processing 306 and the keyword extraction processing 402, the erroneously recognized character correction processing 401 and the keyword confirmation processing 40 surrounded by a dotted line.
Process 3 is an unnecessary process.

【0017】[0017]

【発明の効果】以上説明したように、本発明の電子ファ
イリングシステムによれば、キーワードとなる文字列
が、例えば論文、社内文書等のタイトルや概要のよう
に、常に同じ位置に記載されているような定型フォーマ
ットの文書を取り扱う場合、複数の画像情報とそれぞれ
に対応するキーワードとを記憶媒体に記憶させる時に、
操作者がキーボードにより1文字1文字キーワードの入
力を行うことなく、文書画像のイメージを読み取る際に
文書種類を指定することにより、事前に登録された定型
フォーマットデータを基にキーとなる部分の文字認識を
行い、自動的にキーワード抽出を行う。よって、イメー
ジ読み取り処理によりキーワードの抽出が一括して行わ
れ、ひいては、画像情報と対応するキーワードの登録の
ための操作を軽減し、高速にキーワード登録処理をする
ことができる。
As described above, according to the electronic filing system of the present invention, a character string serving as a keyword is always written at the same position like a title or an outline of a paper, an in-house document, or the like. When handling a document of a fixed format like this, when storing a plurality of image information and keywords corresponding to each of them in a storage medium,
The operator can specify the document type when reading the image of the document image without inputting the keyword for each character with the keyboard, and the characters of the key part based on the pre-registered standard format data. It recognizes and automatically extracts keywords. Therefore, the keywords are collectively extracted by the image reading process, and the operation for registering the keywords corresponding to the image information is reduced, and the keyword registration process can be performed at high speed.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の電子ファイリングシステムを実行する
ための制御システムの一実施例、及び処理制御状態を示
す図である。
FIG. 1 is a diagram showing an embodiment of a control system for executing an electronic filing system of the present invention and a process control state.

【図2】キーワード登録・検索装置103の構成図であ
る。
FIG. 2 is a configuration diagram of a keyword registration / search device 103.

【図3】本実施例の処理の概要を示す流れ図である。FIG. 3 is a flowchart showing an outline of processing of this embodiment.

【図4】図3のキーワード抽出・登録処理307の概要
を説明する流れ図である。
FIG. 4 is a flowchart illustrating an outline of keyword extraction / registration processing 307 of FIG.

【符号の説明】[Explanation of symbols]

101・・・文書 102・・・読み取り装置 103・・・キーワード登録・検索装置 104・・・記憶装置 105・・・表示装置 101 ... Document 102 ... Reading Device 103 ... Keyword Registration / Search Device 104 ... Storage Device 105 ... Display Device

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 文書画像の読み取りを行う読み取り手段
と、記憶装置に文書種類とキーとなる部分の位置情報を
登録する定型フォーマット登録手段と、前記読み取り手
段で読み取る文書画像が何れの文書種類にあたるかを指
定する文書種指定手段と、前記文書種類指定手段により
指定された文書種類に応じて、前記読み取り手段で読み
取った文書画像のキーとなる部分の文字認識を行う文字
認識手段と、前記文字認識手段で文字認識された結果か
らキーワードの抽出をする抽出手段と、前記キーワード
抽出手段で抽出したキーワードと前記読み取り手段で読
み取った文書画像とを対応させて、記憶装置に登録する
登録手段とを備えていることを特徴とする電子ファイリ
ングシステム。
1. A reading unit for reading a document image, a fixed format registration unit for registering a document type and position information of a key portion in a storage device, and a document image read by the reading unit correspond to any document type. A document type designating means for designating whether or not, a character recognition means for performing character recognition of a key portion of a document image read by the reading means in accordance with the document type designated by the document type designating means, and the character An extraction unit that extracts a keyword from the result of character recognition by the recognition unit, and a registration unit that registers the keyword extracted by the keyword extraction unit and the document image read by the reading unit in a storage device in association with each other. An electronic filing system characterized by being provided.
JP4302632A 1992-11-12 1992-11-12 Electronic filing system Pending JPH06149889A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4302632A JPH06149889A (en) 1992-11-12 1992-11-12 Electronic filing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4302632A JPH06149889A (en) 1992-11-12 1992-11-12 Electronic filing system

Publications (1)

Publication Number Publication Date
JPH06149889A true JPH06149889A (en) 1994-05-31

Family

ID=17911325

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4302632A Pending JPH06149889A (en) 1992-11-12 1992-11-12 Electronic filing system

Country Status (1)

Country Link
JP (1) JPH06149889A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09204433A (en) * 1996-01-24 1997-08-05 Fuji Xerox Co Ltd Keyword setting device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09204433A (en) * 1996-01-24 1997-08-05 Fuji Xerox Co Ltd Keyword setting device

Similar Documents

Publication Publication Date Title
JPH03161873A (en) Electronic filing device having data base constructing function
JP4332356B2 (en) Information retrieval apparatus and method, and control program
US20050097080A1 (en) System and method for automatically locating searched text in an image file
JP2005182460A (en) Information processor, annotation processing method, information processing program, and recording medium having information processing program stored therein
JP2000322417A (en) Device and method for filing image and storage medium
JPH08180068A (en) Electronic filing device
JPH06149889A (en) Electronic filing system
JPH06162107A (en) Electronic filing system
JPH08153110A (en) Device and method for filing document
JPH1013642A (en) Image information processor
JP3083171B2 (en) Character recognition apparatus and method
JPH1196148A (en) Document management device
JPH03132874A (en) Filing method for document
JPH0438561A (en) Document filing device
JPH10247237A (en) Document picture processor, document picture processing method and information recording medium
JPH09160907A (en) Document processor and method therefor
JPH0757040A (en) Filing device provided with ocr
JPS62134765A (en) Electronic retrieving method for dictionary of chinese character explained in japanese
JP2601139B2 (en) String search device
JPH05210635A (en) Input device
JP2000112955A (en) Picture display method, picture filing device and record medium
JPH0492973A (en) Image information registration/retrieval device
JPH08202859A (en) Electronic filing device and its method
JPH1097606A (en) Filing system connected with ocr device and filing method
JPH01194063A (en) Document file contents forming system