JPH08161350A - Method and device for electronic filing - Google Patents

Method and device for electronic filing

Info

Publication number
JPH08161350A
JPH08161350A JP6299630A JP29963094A JPH08161350A JP H08161350 A JPH08161350 A JP H08161350A JP 6299630 A JP6299630 A JP 6299630A JP 29963094 A JP29963094 A JP 29963094A JP H08161350 A JPH08161350 A JP H08161350A
Authority
JP
Japan
Prior art keywords
document
information
character
created
analyzing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP6299630A
Other languages
Japanese (ja)
Inventor
Mitsumasa Sugiyama
光正 杉山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP6299630A priority Critical patent/JPH08161350A/en
Priority to US08/560,496 priority patent/US5907835A/en
Publication of JPH08161350A publication Critical patent/JPH08161350A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE: To systematically process document information read by means of a scanner, etc., and document information prepared by general application. CONSTITUTION: When a scanner 9 inputs document information, a document structure analyzing means 10 area-divides document information to extract a character area and to generate document information file. A character recognition means 11 character-recognizes to the character area to generate a character code. The generated character code string is related with the name of the document information file to be registered in a data base 7 by a data base register means 13. A text analytic means 12 is started by a processing similar to printing in general application to extract the character code, which is related with the file name to be registered in the data base by the data base register means 13. When a character string is specified from an operator, a data base retrieving means 14 retrieves all the sentences of text information registered in the data base 7 and outputs the name of the document information file and the file name.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は電子ファイリングに関す
るものであり、特に、パーソナルコンピュータの文書作
成や表計算等の一般アプリケーションで作成された文書
とスキャナ等で入力された文書とを簡単な操作で登録、
検索することのできる電子ファイリング方法および装置
に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to electronic filing, and in particular, a document created by a general application such as document creation or spreadsheet of a personal computer and a document input by a scanner can be easily operated. Registration,
The present invention relates to a searchable electronic filing method and device.

【0002】[0002]

【従来の技術】従来、パーソナルコンピュータの文書作
成や表計算等の一般アプリケーションで作成された文書
を管理する文書管理システムと、スキャナ等で入力され
た文書を管理する電子ファイリングシステムとが独立し
て存在していた。
2. Description of the Related Art Conventionally, a document management system that manages documents created by general applications such as document creation and spreadsheet of a personal computer and an electronic filing system that manages documents input by a scanner or the like are independent. Existed.

【0003】[0003]

【発明が解決しようとする課題】従来、一般アプリケー
ションで作成した文書ファイルにユーザがコメントを付
加し、コメントをテキスト検索する文書管理システムは
あったが、ユーザはコメントを付加する必要がある上、
コメント部分だけをテキスト検索するので、多量のコメ
ントを付加せねばならず、簡便ではなかった。
Conventionally, there has been a document management system in which a user adds a comment to a document file created by a general application and a text search is performed for the comment. However, the user needs to add the comment.
Since only the comment part is searched by text, many comments must be added, which is not convenient.

【0004】また、スキャナ等から入力した文書画像を
文字認識してテキスト情報を作成し、テキスト情報を検
索できるシステムも提案されていたが、一般アプリケー
ションで作成された文書を登録するには、一度プリンタ
で紙にプリントし、スキャナで入力する必要があり、使
い勝手が悪い上、信頼性に欠けていた。
Further, there has been proposed a system for recognizing a document image input from a scanner or the like to create text information and retrieving the text information. However, in order to register a document created by a general application, once It had to be printed on paper with a printer and input with a scanner, which was inconvenient and lacked reliability.

【0005】すなわち、従来の技術では、文書管理シス
テムと電子ファイリングシステムの両システムで作成さ
れた文書を統一的に扱うことができなかった。さらに該
文書を簡単に登録、検索することもできなかった。
That is, in the conventional technique, it is not possible to handle documents created by both the document management system and the electronic filing system in a unified manner. Furthermore, the document could not be easily registered and searched.

【0006】本発明の目的は、一般アプリケーションで
作成された文書に対して煩わしい操作を必要とせず、か
つ精度の高いテキスト検索ができ、さらに、スキャナ等
で入力した画像文書に対しても同様の操作で検索できる
電子ファイリング方法および装置を提供することであ
る。
An object of the present invention is to perform a text search with high accuracy without requiring a troublesome operation for a document created by a general application, and also for an image document input by a scanner or the like. An object of the present invention is to provide an electronic filing method and device that can be searched by operation.

【0007】また、本発明の目的は、さらにテキスト検
索だけでなく、文書レイアウト情報を利用した検索がで
き、テキスト情報を含まない文書や文字認識の困難な文
書でも検索できる電子ファイリング方法および装置を提
供することである。
Further, an object of the present invention is to provide an electronic filing method and apparatus which can perform not only a text search but also a search using document layout information and can search a document which does not include text information or a document in which character recognition is difficult. Is to provide.

【0008】また、本発明の目的は、さらに一般アプリ
ケーションで作成された文書に対して自動的にアプリケ
ーションを起動し、文書の更新等が簡単に行える電子フ
ァイリング方法および装置を提供することである。
It is another object of the present invention to provide an electronic filing method and apparatus which can automatically start an application for a document created by a general application and easily update the document.

【0009】[0009]

【課題を解決するための手段および作用】本願発明は上
記課題を解決する為に、一般のアプリケーションソフト
で作成された文書情報に対して文字情報を解析する文字
情報解析手段と、文書情報を読み取る読み取り手段と、
該読み取った文書情報の文書構造を解析する解析手段
と、該解析手段により文字部であると解析された文書情
報については、文字情報を作成する作成手段と、該作成
された文字情報を含む文書情報と前記解析された文字情
報とを記憶する記憶手段と、前記記憶された文字情報を
検索する検索手段と、を有することを特徴とする電子フ
ァイリング装置を提供する。
In order to solve the above-mentioned problems, the present invention solves the above-mentioned problems by a character information analysis means for analyzing character information of document information created by general application software, and reading the document information. Reading means,
An analyzing unit that analyzes the document structure of the read document information, a creating unit that creates character information for the document information that is analyzed as a character portion by the analyzing unit, and a document that includes the created character information There is provided an electronic filing device comprising: a storage unit that stores information and the analyzed character information; and a search unit that searches the stored character information.

【0010】本願発明は上記課題を解決する為に、一般
のアプリケーションソフトで作成された文書情報に対し
て文字情報を解析する文字情報解析手段と、前記一般の
アプリケーションソフトで作成された文書情報の文書構
造を解析する文書構造解析手段と、文書情報を読み取る
読み取り手段と、該読み取った文書情報の文書構造を解
析する解析手段と、該解析手段により文字部であると解
析された文書情報については、文字情報を作成する作成
手段と、該作成された文字情報を含む文書情報と前記解
析された文字情報と文書構造とを記憶する記憶手段と、
前記記憶された文字情報または文書構造を検索する検索
手段と、を有することを特徴とする電子ファイリング装
置を提供する。
In order to solve the above problems, the present invention provides a character information analysis means for analyzing character information of document information created by general application software, and a document information created by the general application software. Regarding the document structure analyzing means for analyzing the document structure, the reading means for reading the document information, the analyzing means for analyzing the document structure of the read document information, and the document information analyzed by the analyzing means as a character part, Creating means for creating character information, storage means for storing the document information including the created character information, the analyzed character information and the document structure,
An electronic filing device comprising: a search unit that searches the stored character information or document structure.

【0011】本願発明は上記課題を解決する為に、一般
のアプリケーションソフトで作成された文書情報に対し
て文字情報を解析する文字情報解析手段と、前記一般の
アプリケーションソフトで作成された文書情報の文書構
造を解析する文書構造解析手段と、該文書情報を作成し
たアプリケーションを起動する起動手段と、文書情報を
読み取る読み取り手段と、該読み取った文書情報の文書
構造を解析する解析手段と、該文字部であると解析され
た文書情報については、文字情報を作成する作成手段
と、該作成された文字情報を含む文書情報と前記解析さ
れた文字情報と文書構造とを記憶する記憶手段と、前記
記憶された文字情報または文書構造を検索する検索手段
と、前記検索手段により一般のアプリケーションで作成
された文書情報が検索された場合に、該文書情報を作成
したアプリケーションを起動するよう制御する制御手段
と、を有することを特徴とする電子ファイリング装置を
提供する。
In order to solve the above problems, the present invention provides a character information analysis means for analyzing character information of document information created by general application software, and a document information created by the general application software. Document structure analyzing means for analyzing a document structure, starting means for starting an application that created the document information, reading means for reading the document information, analyzing means for analyzing the document structure of the read document information, and the character Regarding the document information analyzed as a part, a creating unit that creates character information, a storage unit that stores the document information including the created character information, the analyzed character information, and the document structure, A search unit for searching the stored character information or document structure and the document information created by a general application by the search unit are searched. If it is, to provide an electronic filing apparatus characterized by comprising control means for controlling to start the application that created the document information.

【0012】本願発明は上記課題を解決する為に、一般
のアプリケーションソフトで作成された文書情報に対し
て文字情報を解析する工程と、文書情報を読み取る読み
取る工程と、該読み取った文書情報の文書構造を解析す
る工程と、該文字部であると解析された文書情報につい
ては、文字情報を作成する工程と、該作成された文字情
報を含む文書情報と前記解析された文字情報とを記憶す
る工程と、前記記憶された文字情報を検索する工程と、
を有することを特徴とする電子ファイリング方法を提供
する。
In order to solve the above-mentioned problems, the present invention solves the above-mentioned problems by analyzing character information in document information created by general application software, reading the document information, and reading the document of the read document information. For the step of analyzing the structure and for the document information analyzed to be the character portion, the step of creating character information, the document information including the created character information, and the analyzed character information are stored. A step of retrieving the stored character information,
There is provided an electronic filing method comprising:

【0013】本願発明は上記課題を解決する為に、一般
のアプリケーションソフトで作成された文書情報に対し
て文字情報を解析する工程と、前記一般のアプリケーシ
ョンソフトで作成された文書情報の文書構造を解析する
工程と、文書情報を読み取る読み取る工程と、該読み取
った文書情報の文書構造を解析する工程と、該文字部で
あると解析された文書情報については、文字情報を作成
する工程と、該作成された文字情報を含む文書情報と前
記解析された文字情報と文書構造とを記憶する工程と、
前記記憶された文字情報または文書構造を検索する工程
と、を有することを特徴とする電子ファイリング方法を
提供する。
In order to solve the above problems, the present invention provides a process of analyzing character information of document information created by general application software and a document structure of document information created by the general application software. A step of analyzing, a step of reading the document information, a step of analyzing the document structure of the read document information; a step of creating character information for the document information analyzed as the character portion; Storing the document information including the created character information, the analyzed character information, and the document structure,
And a step of retrieving the stored character information or document structure.

【0014】本願発明は上記課題を解決する為に、一般
のアプリケーションソフトで作成された文書情報に対し
て文字情報を解析する工程と、前記一般のアプリケーシ
ョンソフトで作成された文書情報の文書構造を解析する
工程と、該文書情報を作成したアプリケーションを起動
する工程と、文書情報を読み取る読み取る工程と、該読
み取った文書情報の文書構造を解析する工程と、該文字
部であると解析された文書情報については、文字情報を
作成する工程と、該作成された文字情報を含む文書情報
と前記解析された文字情報と文書構造とを記憶する工程
と、前記記憶された文字情報または文書構造を検索する
工程と、前記一般のアプリケーションで作成された文書
情報が検索された場合に、該文書情報を作成したアプリ
ケーションを起動するよう制御する工程と、を有するこ
とを特徴とする電子ファイリング方法を提供する。
In order to solve the above problems, the present invention provides a process of analyzing character information for document information created by general application software and a document structure of document information created by the general application software. A step of analyzing, a step of activating an application that created the document information, a step of reading the document information, a step of analyzing the document structure of the read document information, and a document analyzed to be the character part Regarding information, a step of creating character information, a step of storing document information including the created character information, the analyzed character information and a document structure, and retrieval of the stored character information or document structure When the document information created by the general application is searched, the application that created the document information is started. To provide an electronic filing method characterized by comprising the steps of: so that control, the.

【0015】[0015]

【実施例】図1は本発明の電子ファイリング装置のブロ
ック図である。
1 is a block diagram of an electronic filing apparatus of the present invention.

【0016】1は電子ファイリング装置、2はCRT、
3はキーボード、4はCPU、5はプログラムロード
用、あるいはワークエリアとしてのRAM、6はROM
であり、後述する図3、図4、図5のフローチャートの
プログラムが格納されている。7は後述する図3、図
4、図5のフローチャートのプログラム、画像データ、
データベース情報等を保存するハードディスク(以下H
Dと称する)、8はスキャナから画像データを入力する
外部インタフェース、9はスキャナである。尚、各装置
およびメモリ等はバス25で接続されている。
1 is an electronic filing device, 2 is a CRT,
3 is a keyboard, 4 is a CPU, 5 is a RAM for loading a program or as a work area, and 6 is a ROM
The programs of the flowcharts of FIGS. 3, 4, and 5 described later are stored. 7 is a program, image data of the flowcharts of FIGS. 3, 4 and 5 described later,
Hard disk for storing database information (hereinafter referred to as H
D), 8 is an external interface for inputting image data from the scanner, and 9 is a scanner. Note that each device, the memory, and the like are connected by a bus 25.

【0017】次に、スキャナ9から読み込んだデータの
流れについて簡単に説明する。
Next, the flow of data read from the scanner 9 will be briefly described.

【0018】まず、9のスキャナから入力された画像デ
ータは8の外部インタフェースを通じて5のRAMに一
時保存され、HD7或はROM6から5のRAMにロー
ドされた文書構造解析プログラムと文字認識プログラム
に従って4のCPUは画像データを解析し、テキスト情
報を作成するとともに、画像データをHD7に保存す
る。その後、HD7からロードされたデータベース登録
プログラムに従って、CPUはテキスト情報と画像デー
タのファイル名とを関連づけてデータベース情報を作成
し、HD7に保存する。
First, the image data input from the scanner 9 is temporarily stored in the RAM 5 through the external interface 8 and is read according to the document structure analysis program and the character recognition program loaded from the HD 7 or the ROM 6 to the RAM 5 to be 4 The CPU analyzes the image data, creates text information, and stores the image data in the HD 7. Then, according to the database registration program loaded from the HD 7, the CPU associates the text information with the file name of the image data to create database information and saves it in the HD 7.

【0019】図2は本発明の実施例の構成を示す図であ
る。
FIG. 2 is a diagram showing the configuration of an embodiment of the present invention.

【0020】図1と同じものには同一の番号をつけてあ
る。1は電子ファイリング装置、10はスキャナで入力
された文書画像に対して文書レイアウト解析を行い、テ
キスト領域を抽出する文書構造解析手段、11はテキス
ト領域に対して文字認識し、文字コードを生成する文字
認識手段、12は一般アプリケーションの文書情報に対
してテキスト情報を解析するテキスト解析手段、13は
テキスト情報をデータベースに登録するデータベース登
録手段、14はデータベースに対してテキスト情報検索
を行うデータベース検索手段、7はデータベースであり
図1のHD7に対応する。9はスキャナである。
The same parts as those in FIG. 1 are designated by the same reference numerals. Reference numeral 1 is an electronic filing device, 10 is a document structure analysis means for performing a document layout analysis on a document image input by a scanner, and extracting a text area, and 11 is a character recognition for the text area to generate a character code. Character recognition means, 12 is text analysis means for analyzing text information with respect to document information of general applications, 13 is database registration means for registering text information in a database, and 14 is database search means for performing text information search on the database. , 7 are databases and correspond to HD7 in FIG. 9 is a scanner.

【0021】次に、図2を用いて処理の流れについて説
明する。
Next, the processing flow will be described with reference to FIG.

【0022】スキャナ9で文書を画像入力すると、文書
構造解析手段10で文書画像を領域分割してテキスト領
域が抽出されるとともに、文書画像ファイルを作成す
る。テキスト領域に対しては文字認識手段11で文字認
識され、テキスト情報、すなわち、文字コードが生成さ
れる。生成された文字コード列は文書画像ファイル名と
関連づけられデータベース登録手段13でデータベース
7に登録される。
When an image of a document is input by the scanner 9, the document structure analysis unit 10 divides the document image into regions to extract text regions and creates a document image file. Character recognition is performed on the text area by the character recognition means 11 to generate text information, that is, a character code. The generated character code string is associated with the document image file name and registered in the database 7 by the database registration means 13.

【0023】テキスト解析手段12は一般アプリケーシ
ョンにおいて印刷と同様の処理によって起動され、オペ
レーティングシステムによって発行される描画コード、
例えば、マイクロソフト社のオペレーティングシステム
であるウィンドウズではGDI(Graphics D
evice Interface)から文字コードを抽
出し、ファイル名と関連づけてデータベース登録手段1
3でデータベースに登録する。データベース検索手段1
4ではオペレータから文字列を指定されると、データベ
ース7に登録されているテキスト情報を全文検索し、指
定された文字列を含むテキスト情報に関連づけられた文
書画像ファイル名、あるいはファイル名を出力する。
The text analysis means 12 is activated by a process similar to printing in a general application, and a drawing code issued by the operating system,
For example, in Windows, which is an operating system of Microsoft Corporation, GDI (Graphics D
database interface 1 by extracting a character code from the device interface) and associating it with a file name.
Register with 3 in the database. Database search means 1
In 4, when a character string is specified by the operator, the text information registered in the database 7 is searched in full text, and the document image file name or file name associated with the text information including the specified character string is output. .

【0024】図3はスキャナ9で入力した文書画像がデ
ータベース7に登録される動作を示すフローチャートで
ある。
FIG. 3 is a flowchart showing the operation of registering the document image input by the scanner 9 in the database 7.

【0025】スキャナ9で入力した文書画像は、ステッ
プ201で文書構造を解析して領域分割し、テキスト領
域を抽出するとともに文書画像ファイルを作成する。ス
テップ201の処理については、図5を用いて後で詳細
に説明する。ステップ202では、ステップ201で抽
出したテキスト領域に対して文字認識処理を行い、テキ
スト情報を生成する。文字認識処理については、一般に
知られている文字認識技術を用いているので説明は省略
する。ステップ203では、ステップ202で生成され
たテキスト情報と文書画像ファイル名とを関連づけてデ
ータベース7に登録する。
In step 201, the document image input by the scanner 9 is subjected to analysis of the document structure to be divided into areas, a text area is extracted, and a document image file is created. The process of step 201 will be described later in detail with reference to FIG. In step 202, character recognition processing is performed on the text area extracted in step 201 to generate text information. As for the character recognition processing, a generally known character recognition technique is used, and therefore its explanation is omitted. In step 203, the text information generated in step 202 and the document image file name are associated and registered in the database 7.

【0026】図4は一般アプリケーションで作成された
文書情報がデータベースに登録される動作を示すフロー
チャートである。
FIG. 4 is a flowchart showing the operation of registering the document information created by the general application in the database.

【0027】ステップ301で描画コードからテキスト
情報を解析してテキスト情報を生成する。ステップ30
2では、ステップ301で生成されたテキスト情報とフ
ァイル名を関連づけてデータベースに登録する。
In step 301, the text information is analyzed from the drawing code to generate the text information. Step 30
In step 2, the text information generated in step 301 is associated with the file name and registered in the database.

【0028】図5は文書構造解析手段の動作を示すフロ
ーチャートである。
FIG. 5 is a flow chart showing the operation of the document structure analysis means.

【0029】ステップ501で1ページの文書画像を縦
横400ドットごとの小領域に分割する。ステップ50
2で各小領域において、x方向、y方向ごとに黒ドット
のヒストグラムを作成する。ステップ503でx方向、
y方向の黒ドットのヒストグラムに対してドットの多い
部分が周期的か否かを判別し、周期的である場合はステ
ップ504へ進み、その小領域はテキスト領域であると
判別し、ステップ507へ進む。周期的でない場合はス
テップ505へ進み、その小領域がある一定の大きさ以
下か否かを判別し、以下でない場合はステップ506へ
進み、その小領域を4分割し、それぞれを拡大した4つ
の小領域を作成し、ステップ502に進む。ステップ5
07では未処理の小領域があるか否かを判別し、すべて
の小領域の処理が終了すれば終了し、未処理の小領域が
残っている場合はステップ502に進む。この処理を行
うことにより文書画像データからテキスト領域を抽出す
ることができる。
In step 501, one page of a document image is divided into small areas of 400 dots vertically and horizontally. Step 50
In 2, in each small area, a histogram of black dots is created for each of the x direction and the y direction. In step 503, the x direction,
It is determined whether or not a portion having many dots in the y-direction black dot histogram is periodic. If it is periodic, the process proceeds to step 504, the small region is determined to be a text region, and the process proceeds to step 507. move on. If it is not periodic, the process proceeds to step 505, and it is determined whether or not the small region is less than or equal to a certain size. If it is not, the process proceeds to step 506, the small region is divided into four, and each of the enlarged four A small area is created and the process proceeds to step 502. Step 5
In 07, it is determined whether or not there is an unprocessed small area. When the processing of all the small areas is completed, the processing ends, and when there is an unprocessed small area, the process proceeds to step 502. By performing this process, the text area can be extracted from the document image data.

【0030】図6はステップ506で作成される小領域
の1つを示す図である。
FIG. 6 is a diagram showing one of the small areas created in step 506.

【0031】601は元の小領域、602はその小領域
を4分割し、拡大して作成した小領域の1つである。
Reference numeral 601 denotes an original small area, and 602 is one of the small areas created by dividing the small area into four and enlarging it.

【0032】本実施例では一般アプリケーションで作成
した文書情報に対して、オペレータは印刷と同様の処理
を行い、テキスト解析手段を起動するだけで文書情報を
登録できるので、煩わしい処理を行う必要がない。ま
た、テキスト情報検索では文書情報のテキストの全文検
索が行われるので、確実に指定した文字列を含む文書を
検索することができる。また、スキャナで入力した文書
画像に対しては、自動的にテキスト領域が抽出されて文
字認識され、テキスト情報検索では文字認識結果に対し
て全文検索されるので、煩わしい処理を行うことなく登
録、検索できる。さらに、一般アプリケーションで作成
した文書とスキャナで入力した文書とで同様の検索が行
えるので、オペレータは文書がどのようにして作成され
たかを意識する必要がなく、使いやすい。
In the present embodiment, the operator can perform the same processing as the printing on the document information created by the general application, and the document information can be registered only by activating the text analysis means, so that no complicated processing is required. . Further, in the text information search, the full text search of the text of the document information is performed, so that it is possible to reliably search for a document including a specified character string. In addition, since the text area is automatically extracted and the character recognition is performed for the document image input by the scanner, and the full text search is performed for the character recognition result in the text information search, registration without troublesome processing, You can search. Further, since a similar search can be performed between a document created by a general application and a document input by a scanner, the operator does not need to be aware of how the document was created and is easy to use.

【0033】(第2の実施例)上記実施例ではテキスト
情報をデータベースに登録していたが、さらに文書の段
組み情報や、イメージの有無、図形の有無等の文書レイ
アウト情報を解析する文書構造解析手段10を備え、文
書レイアウト情報をデータベース7に登録し、文書レイ
アウト情報で検索しても良い。
(Second Embodiment) Although the text information is registered in the database in the above embodiment, the document structure for analyzing the column information of the document and the document layout information such as the presence / absence of images and the presence / absence of figures. The analysis unit 10 may be provided, the document layout information may be registered in the database 7, and the document layout information may be searched.

【0034】例えば、イメージを含む文書のみを検索す
るということである。
For example, it means to retrieve only the document including the image.

【0035】図7は第2の実施例の構成図であり、10
の文書構造解析手段では、スキャナ9から入力した文書
画像に対してテキスト領域、イメージ領域、図形領域と
いうように領域分割し、文書レイアウト情報を解析して
文字認識手段11に送るとともに、文書画像ファイルを
作成する。文字認識手段11ではテキスト領域に対して
文字認識処理を行いテキスト情報を生成し、テキスト情
報と文書レイアウト情報と文書画像ファイル名とを関連
づけてデータベース7に登録する。15の文書構造解析
手段では描画コードから文書画像を作成し、文書画像に
対して文書レイアウト情報を解析して文書レイアウト情
報とファイル名を関連づけてデータベースに登録する。
FIG. 7 is a block diagram of the second embodiment.
In the document structure analyzing means, the document image input from the scanner 9 is divided into areas such as a text area, an image area, and a graphic area, and the document layout information is analyzed and sent to the character recognizing means 11. To create. The character recognition means 11 performs character recognition processing on the text area to generate text information, and registers the text information, the document layout information, and the document image file name in association with each other in the database 7. The document structure analysis means 15 creates a document image from the drawing code, analyzes the document layout information for the document image, associates the document layout information with the file name, and registers them in the database.

【0036】データベース検索手段14では、段組み情
報やイメージの有無といった文書レイアウト情報が指定
されると指定された文書レイアウト情報でデータベース
7を検索し、該当する文書画像ファイル名あるいはファ
イル名を出力する。
In the database search means 14, when the document layout information such as the column information or the presence / absence of an image is designated, the database 7 is searched by the designated document layout information and the corresponding document image file name or file name is output. .

【0037】また、15の文書構造解析手段では描画コ
ードから直接文書レイアウト情報を解析してもよい。本
実施例では文書レイアウト情報でも検索できるので、テ
キストを含まない文書や文字認識の困難な文書でも検索
することができる。
The document structure analysis means of 15 may analyze the document layout information directly from the drawing code. In this embodiment, since the document layout information can also be searched, a document containing no text or a document in which character recognition is difficult can be searched.

【0038】(第3の実施例)上記実施例では電子ファ
イリング装置1とスキャナ9が接続されていたが、電子
ファイリング装置1とスキャナ9が分離されており、可
搬型のメモリ装置でデータを移動できるシステムでもよ
い。
(Third Embodiment) Although the electronic filing apparatus 1 and the scanner 9 are connected in the above-described embodiment, the electronic filing apparatus 1 and the scanner 9 are separated from each other, and data is moved by a portable memory device. It can be a system that can.

【0039】図8は第3の実施例の構成図であり、16
はスキャナ9に接続された画像処理装置であり、スキャ
ナ9で入力した文書画像に対して文書構造解析処理と文
字認識処理を行い、データを光磁気ディスク制御手段1
7を介して18の光磁気ディスク装置の光磁気ディスク
に記憶させる。1の電子ファイリング装置には18の光
磁気ディスク装置が接続されており、19の光磁気ディ
スク制御手段を介して光磁気ディスク18からデータを
読み取り、文書画像のテキスト情報や文書レイアウト情
報を文書画像ファイル名と関連づけてデータベース7に
登録する。
FIG. 8 is a block diagram of the third embodiment.
Is an image processing apparatus connected to the scanner 9, and performs document structure analysis processing and character recognition processing on the document image input by the scanner 9, and outputs data to the magneto-optical disk control means 1
The data is stored in the magneto-optical disk of the magneto-optical disk device of 18 through 7. Eighteen magneto-optical disk devices are connected to the electronic filing apparatus 1, and data is read from the magneto-optical disk 18 via the magneto-optical disk control means 19 and text information and document layout information of the document image are displayed. It is registered in the database 7 in association with the file name.

【0040】本実施例では、スキャナ9と電子ファイリ
ング装置1が分離されているので、複数の電子ファイリ
ング装置でスキャナを共同利用することができる。
In this embodiment, since the scanner 9 and the electronic filing device 1 are separated, the scanner can be shared by a plurality of electronic filing devices.

【0041】(第4の実施例)前記実施例では電子ファ
イリング装置1とスキャナ9が直接接続されていたが、
電子ファイリング装置1とスキャナ9がネットワークで
接続されていてもよい。
(Fourth Embodiment) In the above embodiment, the electronic filing apparatus 1 and the scanner 9 were directly connected.
The electronic filing device 1 and the scanner 9 may be connected via a network.

【0042】図9は第4の実施例の構成図である。16
のスキャナ9に接続された画像処理装置と1の電子ファ
イリング装置はネットワークで接続され、それぞれ20
および21の通信制御手段で通信を行っている。
FIG. 9 is a block diagram of the fourth embodiment. 16
The image processing apparatus connected to the scanner 9 of 1 and the electronic filing apparatus of 1 are connected via a network,
The communication control means 21 and 21 communicate with each other.

【0043】本実施例ではスキャナ9および画像処理装
置が離れた場所にあっても、ネットワークで制御して利
用することができる。
In this embodiment, even if the scanner 9 and the image processing apparatus are located apart from each other, they can be controlled and used by the network.

【0044】(第5の実施例)前記実施例では電子ファ
イリング装置1の中にデータベース7を備えていたが、
データベース7がネットワークで接続されていてもよ
い。
(Fifth Embodiment) In the above embodiment, the database 7 is provided in the electronic filing apparatus 1.
The database 7 may be connected via a network.

【0045】図10は第5の実施例の構成図である。2
2はデータベース専用コンピュータである。データベー
ス専用コンピュータと1の電子ファイリング装置はネッ
トワークで接続されており、それぞれ20と21の通信
制御手段で通信している。本実施例ではネットワークで
接続することにより、データベース専用コンピュータを
多数の電子ファイリング装置で共用することができる。
FIG. 10 is a block diagram of the fifth embodiment. Two
Reference numeral 2 is a database-dedicated computer. The database-dedicated computer and the electronic filing apparatus 1 are connected by a network and communicate with each other through communication control means 20 and 21, respectively. In this embodiment, a database-dedicated computer can be shared by a large number of electronic filing devices by connecting via a network.

【0046】(第6の実施例)前記実施例ではデータベ
ース検索手段14は文書画像ファイル名あるいはファイ
ル名を出力しているが、アプリケーションを起動する手
段を備え、一般アプリケーションで作成された文書情報
が検索された場合には、その文書を作成したアプリケー
ションを起動してもよい。
(Sixth Embodiment) In the above embodiment, the database searching means 14 outputs the document image file name or the file name. However, the means for activating the application is provided, and the document information created by the general application is stored. If found, the application that created the document may be launched.

【0047】図11は実施例の構成図であり、24は文
書を作成したアプリケーションを起動するソフト起動手
段であり、23はスキャナ9で入力された文書画像を表
示するための画像表示手段である。
FIG. 11 is a block diagram of the embodiment, 24 is a software starting means for starting an application that created a document, and 23 is an image displaying means for displaying the document image input by the scanner 9. .

【0048】本実施例では、検索結果として一般アプリ
ケーションで作成した文書が出力された場合はアプリケ
ーションが自動的に起動され、そのまま編集を行うこと
ができ、また、スキャナで入力した文書画像の場合は画
像表示して確認することができる。
In this embodiment, when a document created by a general application is output as a search result, the application is automatically started and editing can be performed as it is. In the case of a document image input by a scanner, You can check it by displaying an image.

【0049】[0049]

【発明の効果】以上説明したように、本発明によれば、
一般アプリケーションで作成された文書情報に対してテ
キスト情報を解析するテキスト解析手段を備えるととも
に、スキャナ等で入力した文書画像に対してテキスト情
報を生成するテキスト生成手段を備え、テキスト情報を
関連づけて登録するので、一般アプリケーションで作成
された文書に対して煩わしい操作を必要とせず、かつ精
度の高いテキスト検索ができ、さらに、スキャナ等で入
力した文書画像に対しても同様の操作で検索することが
できる。
As described above, according to the present invention,
A text analysis unit for analyzing text information with respect to document information created by a general application is provided, and a text generation unit for generating text information with respect to a document image input by a scanner or the like is provided, and the text information is associated and registered. Therefore, it is possible to perform highly accurate text search without the need for complicated operations for documents created with general applications, and to perform similar operations on document images input with a scanner. it can.

【0050】また、本発明によれば、さらに一般アプリ
ケーションで作成された文書情報に対して文書レイアウ
ト情報を解析する文書レイアウト解析手段を備えるとと
もに、スキャナ等で入力した文書画像に対して文書レイ
アウト情報を解析する文書レイアウト解析手段を備え、
文書レイアウト情報を関連づけて登録するので、一般ア
プリケーションで作成された文書に対して文書レイアウ
ト情報で検索ができ、テキストを含まない文書でも検索
できる上、さらに、スキャナ等で入力した文書画像に対
して文字認識が困難であっても文書レイアウト情報で検
索することができる。
Further, according to the present invention, document layout analysis means for analyzing the document layout information for the document information created by the general application is further provided, and the document layout information for the document image input by the scanner or the like is provided. Equipped with a document layout analysis means for analyzing
Since the document layout information is associated and registered, documents created by general applications can be searched by the document layout information, documents that do not contain text can be searched, and document images input by a scanner etc. can be searched. Even if the character recognition is difficult, it is possible to search with the document layout information.

【0051】また、本発明によれば、さらに一般アプリ
ケーションで作成された文書情報に対して自動的にアプ
リケーションを起動することで、検索結果として得られ
た文書に対して更新等を簡単に行える。
Further, according to the present invention, an application is automatically started for the document information created by the general application, so that the document obtained as the search result can be easily updated.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の電子ファイリング装置のブロック図で
ある。
FIG. 1 is a block diagram of an electronic filing device of the present invention.

【図2】本発明の実施例の構成を示す図である。FIG. 2 is a diagram showing a configuration of an exemplary embodiment of the present invention.

【図3】スキャナで入力した画像がデータベースに登録
される動作を示すフローチャートである。
FIG. 3 is a flowchart showing an operation in which an image input by a scanner is registered in a database.

【図4】一般アプリケーションで作成した文書情報がデ
ータベースに登録される動作を示す図である。
FIG. 4 is a diagram showing an operation of registering document information created by a general application in a database.

【図5】文書構造解析手段の動作を示すフローチャート
である。
FIG. 5 is a flowchart showing the operation of the document structure analysis means.

【図6】文書構造解析手段の動作を説明する図である。FIG. 6 is a diagram illustrating an operation of a document structure analysis unit.

【図7】本発明の第2の実施例の構成を示す図である。FIG. 7 is a diagram showing a configuration of a second exemplary embodiment of the present invention.

【図8】本発明の第3の実施例の構成を示す図である。FIG. 8 is a diagram showing a configuration of a third exemplary embodiment of the present invention.

【図9】本発明の第4の実施例の構成を示す図である。FIG. 9 is a diagram showing a configuration of a fourth exemplary embodiment of the present invention.

【図10】本発明の第5の実施例の構成を示す図であ
る。
FIG. 10 is a diagram showing a configuration of a fifth exemplary embodiment of the present invention.

【図11】本発明の第6の実施例の構成を示す図であ
る。
FIG. 11 is a diagram showing a configuration of a sixth exemplary embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1 電子ファイリング装置 2 CRT 3 キーボード 4 CPU 5 RAM 6 ROM 7 HD(データベース) 8 外部インタフェイス 9 スキャナ 10 文書構造解析手段 11 文字認識手段 12 テキスト解析手段 13 データベース登録手段 14 データベース検索手段 15 文書構造解析手段 16 画像処理装置 17,19 光磁気ディスク制御手段 18 光磁気ディスク装置 20,21 通信制御手段 22 データベース専用コンピュータ 23 画像表示手段 24 ソフト起動手段 1 electronic filing device 2 CRT 3 keyboard 4 CPU 5 RAM 6 ROM 7 HD (database) 8 external interface 9 scanner 10 document structure analysis means 11 character recognition means 12 text analysis means 13 database registration means 14 database search means 15 document structure analysis Means 16 Image processing device 17, 19 Magneto-optical disk control means 18 Magneto-optical disk device 20, 21 Communication control means 22 Database dedicated computer 23 Image display means 24 Software starting means

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 一般のアプリケーションソフトで作成さ
れた文書情報に対して文字情報を解析する文字情報解析
手段と、 文書情報を読み取る読み取り手段と、 該読み取った文書情報の文書構造を解析する解析手段
と、 該解析手段により文字部であると解析された文書情報に
ついては、文字情報を作成する作成手段と、 該作成された文字情報を含む文書情報と前記解析された
文字情報とを記憶する記憶手段と、 前記記憶された文字情報を検索する検索手段と、 を有することを特徴とする電子ファイリング装置。
1. A character information analyzing unit for analyzing character information of document information created by general application software, a reading unit for reading the document information, and an analyzing unit for analyzing the document structure of the read document information. And for the document information analyzed as a character part by the analyzing means, a creating means for creating character information, a memory for storing the document information including the created character information, and the analyzed character information. An electronic filing apparatus comprising: a means and a search means for searching the stored character information.
【請求項2】 一般のアプリケーションソフトで作成さ
れた文書情報に対して文字情報を解析する文字情報解析
手段と、 前記一般のアプリケーションソフトで作成された文書情
報の文書構造を解析する文書構造解析手段と、 文書情報を読み取る読み取り手段と、 該読み取った文書情報の文書構造を解析する解析手段
と、 該解析手段により文字部であると解析された文書情報に
ついては、文字情報を作成する作成手段と、 該作成された文字情報を含む文書情報と前記解析された
文字情報と文書構造とを記憶する記憶手段と、 前記記憶された文字情報または文書構造を検索する検索
手段と、 を有することを特徴とする電子ファイリング装置。
2. A character information analysis unit for analyzing character information of document information created by general application software, and a document structure analysis unit for analyzing a document structure of document information created by the general application software. A reading means for reading the document information; an analyzing means for analyzing the document structure of the read document information; and a creating means for creating character information for the document information analyzed by the analyzing means as a character part. A storage unit for storing the document information including the created character information, the analyzed character information and the document structure, and a searching unit for searching the stored character information or the document structure. And electronic filing equipment.
【請求項3】 一般のアプリケーションソフトで作成さ
れた文書情報に対して文字情報を解析する文字情報解析
手段と、 前記一般のアプリケーションソフトで作成された文書情
報の文書構造を解析する文書構造解析手段と、 該文書情報を作成したアプリケーションを起動する起動
手段と、 文書情報を読み取る読み取り手段と、 該読み取った文書情報の文書構造を解析する解析手段
と、 該文字部であると解析された文書情報については、文字
情報を作成する作成手段と、 該作成された文字情報を含む文書情報と前記解析された
文字情報と文書構造とを記憶する記憶手段と、 前記記憶された文字情報または文書構造を検索する検索
手段と、 前記検索手段により一般のアプリケーションで作成され
た文書情報が検索された場合に、該文書情報を作成した
アプリケーションを起動するよう制御する制御手段と、 を有することを特徴とする電子ファイリング方法および
装置。
3. A character information analysis means for analyzing character information of document information created by general application software, and a document structure analysis means for analyzing a document structure of document information created by the general application software. A starting means for starting the application that created the document information, a reading means for reading the document information, an analyzing means for analyzing the document structure of the read document information, and the document information analyzed as the character part. With regard to, the creating means for creating the character information, the storage means for storing the document information including the created character information, the analyzed character information and the document structure, the stored character information or the document structure Search means for searching, and when the search means searches for document information created by a general application, retrieves the document information. Electronic filing method and apparatus characterized in that it comprises a control means for controlling to start an application form, a.
【請求項4】 一般のアプリケーションソフトで作成さ
れた文書情報に対して文字情報を解析する工程と、 文書情報を読み取る読み取る工程と、 該読み取った文書情報の文書構造を解析する工程と、 該文字部であると解析された文書情報については、文字
情報を作成する工程と、 該作成された文字情報を含む文書情報と前記解析された
文字情報とを記憶する工程と、 前記記憶された文字情報を検索する工程と、 を有することを特徴とする電子ファイリング方法。
4. A step of analyzing character information of document information created by general application software, a step of reading the document information, a step of analyzing a document structure of the read document information, and the character Regarding the document information analyzed as a copy, a step of creating character information, a step of storing the document information including the created character information and the analyzed character information, the stored character information And a step of searching for the electronic filing method.
【請求項5】 一般のアプリケーションソフトで作成さ
れた文書情報に対して文字情報を解析する工程と、 前記一般のアプリケーションソフトで作成された文書情
報の文書構造を解析する工程と、 文書情報を読み取る読み取る工程と、 該読み取った文書情報の文書構造を解析する工程と、 該文字部であると解析された文書情報については、文字
情報を作成する工程と、 該作成された文字情報を含む文書情報と前記解析された
文字情報と文書構造とを記憶する工程と、 前記記憶された文字情報または文書構造を検索する工程
と、 を有することを特徴とする電子ファイリング方法。
5. A step of analyzing character information for document information created by general application software, a step of analyzing a document structure of document information created by the general application software, and reading the document information. A step of reading, a step of analyzing the document structure of the read document information, a step of creating character information for the document information analyzed as the character portion, and a document information including the created character information And a step of storing the analyzed character information and the document structure, and a step of searching the stored character information or the document structure.
【請求項6】 一般のアプリケーションソフトで作成さ
れた文書情報に対して文字情報を解析する工程と、 前記一般のアプリケーションソフトで作成された文書情
報の文書構造を解析する工程と、 該文書情報を作成したアプリケーションを起動する工程
と、 文書情報を読み取る読み取る工程と、 該読み取った文書情報の文書構造を解析する工程と、 該文字部であると解析された文書情報については、文字
情報を作成する工程と、 該作成された文字情報を含む文書情報と前記解析された
文字情報と文書構造とを記憶する工程と、 前記記憶された文字情報または文書構造を検索する工程
と、 前記一般のアプリケーションで作成された文書情報が検
索された場合に、該文書情報を作成したアプリケーショ
ンを起動するよう制御する工程と、 を有することを特徴とする電子ファイリング方法。
6. A step of analyzing character information of document information created by general application software, a step of analyzing a document structure of document information created by the general application software, and a step of analyzing the document information. A step of activating the created application, a step of reading the document information, a step of analyzing the document structure of the read document information, and a step of creating character information for the document information analyzed as the character part A step of storing document information including the created character information, the analyzed character information, and a document structure; a step of retrieving the stored character information or document structure; And controlling the application that created the document information to be started when the created document information is retrieved. An electronic filing method comprising:
JP6299630A 1994-11-18 1994-12-02 Method and device for electronic filing Withdrawn JPH08161350A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP6299630A JPH08161350A (en) 1994-12-02 1994-12-02 Method and device for electronic filing
US08/560,496 US5907835A (en) 1994-11-18 1995-11-17 Electronic filing system using different application program for processing drawing commands for printing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6299630A JPH08161350A (en) 1994-12-02 1994-12-02 Method and device for electronic filing

Publications (1)

Publication Number Publication Date
JPH08161350A true JPH08161350A (en) 1996-06-21

Family

ID=17875093

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6299630A Withdrawn JPH08161350A (en) 1994-11-18 1994-12-02 Method and device for electronic filing

Country Status (1)

Country Link
JP (1) JPH08161350A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002207772A (en) * 2000-03-29 2002-07-26 Komatsu Wall System Development Co Ltd Document information managing program and document information managing system using this
US6625606B1 (en) 1998-12-15 2003-09-23 Kabushiki Kaisha Toshiba System and method for filing/searching data having a full-text function and media for recording the method
CN100361493C (en) * 2004-08-19 2008-01-09 富士施乐株式会社 Document processing device, document processing method, and storage medium recording program therefor
JP2016139869A (en) * 2015-01-26 2016-08-04 京セラドキュメントソリューションズ株式会社 Image processing device

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6625606B1 (en) 1998-12-15 2003-09-23 Kabushiki Kaisha Toshiba System and method for filing/searching data having a full-text function and media for recording the method
JP2002207772A (en) * 2000-03-29 2002-07-26 Komatsu Wall System Development Co Ltd Document information managing program and document information managing system using this
CN100361493C (en) * 2004-08-19 2008-01-09 富士施乐株式会社 Document processing device, document processing method, and storage medium recording program therefor
JP2016139869A (en) * 2015-01-26 2016-08-04 京セラドキュメントソリューションズ株式会社 Image processing device
US9641723B2 (en) 2015-01-26 2017-05-02 Kyocera Document Solutions, Inc. Image processing apparatus with improved slide printout based on layout data

Similar Documents

Publication Publication Date Title
JP3491962B2 (en) Document search method and system
JPH11110416A (en) Method and device for retrieving document from data base
WO1989002118A1 (en) Data processing apparatus and editing apparatus using the same
JPH07200786A (en) Filing device
JP2000322417A (en) Device and method for filing image and storage medium
JPH08161350A (en) Method and device for electronic filing
JP2001297080A (en) Read assisting device
JP2003132078A (en) Database construction device, method therefor, program thereof and recording medium
JPH10187728A (en) Process and method for html document processing
JP3164086B2 (en) Handwritten character font creation method and handwritten character information processing apparatus using the same
JP2993880B2 (en) Electronic file device
JP2993881B2 (en) Keyword generation method
JPH10198695A (en) Information processor
JPH05298368A (en) Method for inputting retrieving word in electronic filing system
JPH06266753A (en) Word processor
JPH0237471A (en) Information retrieving device
JPH11203279A (en) Kana-kanji conversion device and method and storage medium
JPH04195580A (en) Device for forming index term file
JPH08202736A (en) Graphic processor and its method
JPS63293674A (en) Retrieving/displaying method for sentence
JP2821002B2 (en) Character processing device and character processing method
JPH05151195A (en) Kanji input device
JPH06266765A (en) Sentence retrieving device
JPH08329050A (en) Document data converting device
JPH11161726A (en) Electronic slip system

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20020205