JP4947763B2 - Information retrieval method - Google Patents

Information retrieval method Download PDF

Info

Publication number
JP4947763B2
JP4947763B2 JP2006023381A JP2006023381A JP4947763B2 JP 4947763 B2 JP4947763 B2 JP 4947763B2 JP 2006023381 A JP2006023381 A JP 2006023381A JP 2006023381 A JP2006023381 A JP 2006023381A JP 4947763 B2 JP4947763 B2 JP 4947763B2
Authority
JP
Japan
Prior art keywords
keyword
file
electronic
search
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006023381A
Other languages
Japanese (ja)
Other versions
JP2007206868A (en
Inventor
岳雄 飯田
祐記 尾崎
Original Assignee
有限会社 アイ技研
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 有限会社 アイ技研 filed Critical 有限会社 アイ技研
Priority to JP2006023381A priority Critical patent/JP4947763B2/en
Publication of JP2007206868A publication Critical patent/JP2007206868A/en
Application granted granted Critical
Publication of JP4947763B2 publication Critical patent/JP4947763B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

この発明は、新規な情報検索方法に係り、特に、求める情報を確実に得ることができ、しかも入力コストを低減できる情報検索方法に関する。  The present invention relates to a novel information search method, and more particularly to an information search method that can reliably obtain desired information and can reduce input costs.

近年、戸籍、病院や診療所のカルテ、或いはレセプト等の紙の資料をスキャナーで取り込んで静止画像ファイルを作り、これをMO(光磁気ディスク)やハードディスク等に蓄積する所謂電子ファイルが実用されている。  In recent years, so-called electronic files have been put into practical use in which paper documents such as family registers, hospitals and clinics, or receipts are captured by a scanner to create a still image file and stored in an MO (magneto-optical disk) or hard disk. Yes.

また、情報をコード化した電子ファイル、例えばワープロの出力ファイルやインターネットで閲覧できるhtmlファイルである所謂ホームページ等のサイトファイルやEメール、或いは表計算ファイル等も、これを適切な記録装置に蓄積すれば立派な電子ファイルとなる。  Also, electronic files encoded with information, such as word processor output files, site files such as so-called homepages that are html files that can be browsed on the Internet, e-mails, spreadsheet files, etc. are stored in an appropriate recording device. It will be a fine electronic file.

なお、上記ワープロの出力ファイルやインターネットで閲覧できるhtmlファイル、或いは前記スキャナーで取り込んだ静止画像ファイル等を、紙のファイルと区別するために電子ファイルと総称して仮称することにする。この電子ファイルは、勿論、映画等の動画画像ファイルも含む。
Hitfile news(インターネット広告サイト) 特願平7−058170号 特願平7−090224号
Note that the output file of the word processor, the html file that can be browsed on the Internet, the still image file captured by the scanner, and the like are collectively referred to as an electronic file in order to be distinguished from a paper file. This electronic file includes, of course, a moving image file such as a movie.
Hitfile news (Internet advertising site) Japanese Patent Application No.7-058170 Japanese Patent Application No. 7-090224

上記した電子ファイルは、従来の紙のファイルと比較してその容積を格段に小さくすることができるため、特定の目的のための資料の保存には適しているが、これを一般の事務用のファイルとして利用するには未だ技術として完成していない、と言わざるを得ない。  The above-mentioned electronic file can be made much smaller than conventional paper files, so it is suitable for storing materials for specific purposes. In order to use it as a file, it must be said that it has not been completed as a technology.

その理由を説明する前に、現在の電子ファイルにおいて、どのようにして目的の電子ファイルを取り出すかについて簡単に説明する。  Before explaining the reason, a brief description will be given of how to extract a target electronic file from the current electronic file.

電子ファイルが1,000件以上になると、コンピュータが必要になる。ところで、コンピュータ(以下単にPCという)の能力は限られており、概念の把握、すなわち判断はできない。但し、数字や文字(以下単に符号という)の比較は可能である。  If the number of electronic files exceeds 1,000, a computer is required. By the way, the ability of a computer (hereinafter simply referred to as a PC) is limited, and it is impossible to grasp a concept, that is, to make a judgment. However, numbers and letters (hereinafter simply referred to as symbols) can be compared.

そこで、電子ファイルの一つ一つにキーワードを付し、このキーワードを手がかりに求める電子ファイルを捜し出す(検索する)手法が一般的である、  Therefore, it is common to attach a keyword to each electronic file and search for (search for) the electronic file for which this keyword is a clue.

更に、この検索方法において、キーワードを切出して電子ファイルに割り当てる方法と、キーワードを付けない、所謂フリーキーワードの検索方法がある。  Furthermore, in this search method, there are a method of cutting out a keyword and assigning it to an electronic file, and a so-called free keyword search method without adding a keyword.

後者は、例えばhtmlファイルや、文書の静止画像ファイルをOCR(光学的文字認識装置)を用いてテキストファイルにしたものに、例えばワープロの検索機能を利用して、特定のキーワード(文字群)が含まれているか如何かを検定し、入力、或いは設定したキーワードを有する電子ファイルを目的のものとして取り出す。  In the latter case, for example, an html file or a still image file of a document converted into a text file using an OCR (optical character recognition device) is used. It checks whether it is included, and takes out an electronic file having keywords that have been input or set.

この検索方法は、例えばインターネットを利用して目的のサイトを捜し出す場合の一般的な手法である。  This search method is a general method for searching for a target site using the Internet, for example.

この場合、しかしながら、特に静止画像ファイルをOCRでテキストファイルに変換したとき、変換効率が100パーセントではなく、数パーセントの変換ミスがあるので、必ず検索ミス、すなわち取りこぼしがある。  In this case, however, especially when a still image file is converted to a text file by OCR, the conversion efficiency is not 100%, but there is a conversion error of several percent, so there is always a search error, that is, missed out.

また、日本語に特有の問題として、キーワードが漢字と仮名を含む場合、或いは同義語がある場合には、自動的にキーワードが複数になる。  Further, as a problem peculiar to Japanese, when a keyword includes kanji and kana, or when there are synonyms, a plurality of keywords are automatically provided.

例えば、キーワード「金型」は、「金型」、「かな型」、「金がた」、「かながた」、「ダイス」及び「ポンチ」の少なくとも6種類のキーワードの一つ一つについて同じ検索操作をしないと必ず取りこぼしが生じる。  For example, the keyword “mold” is for each of at least six types of keywords “mold”, “kana mold”, “kinagata”, “kanagata”, “die” and “punch”. If you do not perform the same search operation, you will always miss it.

これがインターネットのサイトの検索の場合には、サイト数が莫大なので、一つのキーワードでも必ず複数のサイトを拾い出すことができるが、この場合にも、他のキーワードに対応するものを捨てることになる。  If this is an Internet site search, the number of sites is enormous, so even one keyword can always pick up multiple sites, but in this case too, the ones corresponding to other keywords will be discarded. .

すなわち、上記フリーキーワードによる検索方法は、どの電子ファイルにどんな文字が入っているか大体知っている場合には、キーワードを切出す作業が必要ないので、個人が作成し、蓄積した電子ファイルの検索に有効な場合がある。  In other words, the above-mentioned search method using free keywords does not require the work of extracting keywords when you know what characters are in which electronic files, so you can search for electronic files created and stored by individuals. May be valid.

しかし、どんな文字が入っているかは何時までも記憶できないので、例えば事業所や研究所の報告書等、複数の人が検索する場合には、フリーキーワードによる検索方法は使用できない、と言っても過言ではない。  However, since it is impossible to remember what characters are contained indefinitely, for example, when searching by multiple people, such as reports of business establishments and research institutes, the free keyword search method cannot be used. It's not too much to say.

一方、前記非特許文献1に記載されている情報検索方法は、電子ファイルの一つ一つに一つ以上のキーワードを割り当てて電子ファイルそのものに直接記録し、これを記憶装置にその侭放り込む方法である。  On the other hand, the information retrieval method described in Non-Patent Document 1 is a method of assigning one or more keywords to each electronic file and directly recording the electronic file itself, and throwing it into the storage device. It is.

この場合、ある概念に対応するキーワードを統一することにより、検索洩れを防ぐことはできる。  In this case, search omission can be prevented by unifying keywords corresponding to a certain concept.

しかしながら、上記非特許文献1に記載されている情報検索方法は、スキャナーによる静止画像ファイルの作成毎に、かつ同時にキーワードを入力する方法なので、紙のファイルを読んでその内容によりキーワードを切出す能力のある人にスキャニングという単純な作業を強いることになり、電子ファイルの製作に手間が掛かり、換言すれば入力コストが上昇する。  However, since the information search method described in Non-Patent Document 1 is a method of inputting a keyword every time a still image file is created by a scanner, the ability to read a paper file and cut out the keyword based on the content This will force a simple person to scan, and it will take time to produce electronic files. In other words, the input cost will increase.

加えて、この検索方法は、どんなキーワードをどのような形態で電子ファイルに割り当てたのか記録しない。  In addition, this search method does not record what keywords are assigned to the electronic file in what form.

どんなキーワードが入っているのか知るためには、例えば電子ファイルの一つ一つに連続した表題番号をキーワードとして入力しておき、この表題番号順に電子ファイルを取り出してそのキーワードを読むしかない。しかしながら、これは全電子ファイルを最初から全部読むのと同じで、キーワードの存在理由がなくなる。  In order to know what keywords are contained, for example, the title numbers that are consecutive in each electronic file are input as keywords, the electronic files are extracted in the order of the title numbers, and the keywords are read. However, this is the same as reading all electronic files from the beginning, and there is no reason for keywords to exist.

そこで、この発明は、上記した既存の情報検索方法の不都合を解消し、求める情報を確実に得ることができ、しかも入力コストを低減できる情報検索方法を提供することを目的としている。  SUMMARY OF THE INVENTION Accordingly, an object of the present invention is to provide an information search method that can eliminate the disadvantages of the above-described existing information search methods, reliably obtain the required information, and reduce the input cost.

上記の目的を達成するため、請求項1に記載の発明は、情報検索の実行以前に、電子ファイル毎に、その電子ファイルを他の電子ファイルと区別するための表題番号を割り当てると共に、少なくとも1個のキーワードを抽出して、これら表題番号及びキーワードからなるグループを所謂ワープロなどの電子的記録手段を用いて1個のレコードとし、同様にして複数の電子ファイルから抽出した複数のレコードを収録して原稿ファイルを作成し、この原稿ファイルを一の電子的記録媒体の第1フォルダに蓄積し、一方、上記一の電子的記録媒体とは異なる他の電子的記録媒体の第2フォルダに上記電子ファイル群の夫々に対応するサブフォルダを作成し、各サブフォルダに、対応する電子ファイルの表題番号を割り当てると共に、当該表題番号に対応する電子ファイルを蓄積し、他方、プログラムとコンピュータとの協働によるキーワードファイル作成手段により上記第1フォルダに蓄積された原稿ファイルから同じものが重複しないようにキーワードを抽出し、これらを一定の順序に並べ、キーワードファイルを作成してこれを第3フォルダに蓄積し、また、プログラムとコンピュータとの協働による検索ファイル作成手 段により一のキーワードと、これを有する一の電子ファイルの表題番号を複合して記録したものを上記一の電子ファイルの一のキーワードに対応するキーワードユニットとし、一のキーワードを共通に有するキーワードユニットを一定の順序で並べたものを一の検索ユニットとし、同様にして他のキーワードに対応する他の検索ユニットをキーワードファイルにおけると同じ順序で並べて検索ファイルを作成してこれを第4フォルダに蓄積し、更にまた、プログラムとコンピュータとの協働によるキーワード表示手段と、キーワードを修正、追加或いは削除するプログラムとコンピュータとの協働による変更手段を設け、情報検索の際、プログラムとコンピュータとの協働による情報検索手段にキーワードを設定し、設定されたキーワードから、プログラムとコンピュータとの協働による情報検索手段に、対応する検索ユニットを取り出させてこれをディスプレーに表示させ、表示された検索ユニットの表題番号から第2フォルダ内の電子ファイルを取りだすようにし、必要のあるときキーワード表示手段によりキーワードファイルをディスプレーに表示し、また、変更手段を用いて、第4フォルダ内のキーワードの修正、追加或いは削除を検索ユニット毎に行うようにしたことを特徴とする。In order to achieve the above object, the invention according to claim 1 assigns a title number for distinguishing the electronic file from other electronic files for each electronic file before performing the information search , and at least 1 Each keyword is extracted, and the group consisting of these title numbers and keywords is made into one record using electronic recording means such as a so-called word processor, and a plurality of records extracted from a plurality of electronic files are recorded in the same manner. An original file is created and stored in a first folder of one electronic recording medium, while the electronic file is stored in a second folder of another electronic recording medium different from the one electronic recording medium. Create a subfolder corresponding to each of the files, assign the title number of the corresponding electronic file to each subfolder, and the title number Accumulating the corresponding electronic file, while the same thing from the stored document files in the first folder extracts keywords so as not to overlap with the keyword file creating means by cooperation of a program and a computer, of these constant arranged in order to accumulate this by creating a keyword file in the third folder, also with one keyword by the search file creation hands stage by cooperation of a program and a computer, the title number of each electronic file with this Is a keyword unit corresponding to one keyword of the one electronic file, and a keyword unit having one keyword in common is arranged in a certain order as one search unit. Other search units corresponding to other keywords in the keyword file Kicking it to create a search file in the same order when stored in the fourth folder, furthermore, a keyword display unit by cooperation of a program and a computer, modifying the keywords, the program and a computer to add or delete A change means by cooperation is provided, and when searching for information, a keyword is set in the information search means by cooperation between the program and the computer, and the information search means by cooperation between the program and the computer is supported from the set keyword. This is displayed on the display by eject the search unit that, from the title number of the displayed search unit to retrieve the electronic file in the second folder, displaying the keyword file to display the keyword display unit when it is required In addition, by using the changing means, A feature is that a keyword is corrected, added, or deleted for each search unit.

上記のように構成された請求項1に記載の発明による情報検索方法は、電子ファイルが紙のドキュメントをスキャナーで取り込んだものである場合、先ず第1に、スキャニングとキーワードの抽出、入力を別個に行うので、能率が良く入力コストが安い。  In the information retrieval method according to the first aspect of the present invention configured as described above, when an electronic file is a paper document captured by a scanner, first, scanning and keyword extraction and input are separately performed. Therefore, it is efficient and input cost is low.

また、キーワードを電子ファイルから独立して取り出し、これを一括して管理するので、電子ファイルを順次開いてこれに記録されているキーワード或いはフリーキーワードを読んでいく従来の検索方法と較べて検索に要する時間が格段に短くなる。  In addition, since keywords are extracted independently from the electronic file and managed together, the search is performed in comparison with the conventional search method in which the electronic file is sequentially opened and the keywords or free keywords recorded in the electronic file are read. The time required is significantly shortened.

更にまた、キーワードを相互に重複しないように抽出し、これを例えばアイウエオ順に並べてキーワードファイルに記録してあるので、このキーワードファイルに登録してあるキーワードを設定すれば、必ず求める電子ファイルを捜し出すことができる。  Furthermore, keywords are extracted so that they do not overlap each other, and these are arranged in the keyword file, for example, in order of Iueo, so if you set the keywords registered in this keyword file, you will always search for the electronic file you want. Can do.

また、求めるキーワードが思い付かない場合でも、キーワードファイルを読んでいけば一致するキーワード、或いは類似のキーワードを知ることができ、したがって電子ファイルの検索が容易で、或いは求める電子ファイルがそもそも蓄積されているのか否かが容易に分かる。  Even if the keyword to be sought is not conceived, it is possible to know a matching keyword or a similar keyword by reading the keyword file. Therefore, it is easy to search for the electronic file, or the electronic file to be sought is stored in the first place. It is easy to see whether or not

加えて、キーワードの入力の誤り、或いは不適正なキーワードの設定をキーワードファイルを閲覧することによって容易に知ることができ、キーワード変更手段により、キーワードの修正、追加或いは削除が可能である、等種々の効果を奏する。  In addition, it is easy to know keyword input errors or inappropriate keyword settings by browsing the keyword file, and the keyword can be corrected, added or deleted by the keyword changing means. The effect of.

電子ファイルとキーワードとを別々のフォルダに蓄積するようにしたので、入力作業が合理化されて入力費用を低減することができ、また、一のキーワードを有する一の電子ファイルの表題番号を複合して記録したものを上記一の電子ファイルの一のキーワードに対応するキーワードユニットとし、一のキーワードを共通に有するキーワードユニットを一定の順序で並べたものを一の検索ユニットとし、同様にして他のキーワードに対応する他の検索ユニットをキーワードファイルにおけると同じ順序で並べて検索ファイルを作成し、検索時、設定されたキーワードに対応する検索ユニットをディスプレーに表示して求める電子ファイルを取り出すようにしたので検索が高速であり、更にまた、キーワード表示手段及びキーワード変更手段を設けたので、キーワードの修正、追加或いは削除が過納となり、電子ファイルの検索を確実に行えるようになった。  Since electronic files and keywords are stored in separate folders, the input work can be streamlined to reduce input costs, and the title numbers of one electronic file with one keyword can be combined. The recorded unit is set as a keyword unit corresponding to one keyword of the one electronic file, the keyword unit having one keyword in common is arranged in a certain order as one search unit, and other keywords are similarly used. The search unit is created by arranging other search units corresponding to the same order as in the keyword file, and when searching, the search unit corresponding to the set keyword is displayed on the display and the desired electronic file is retrieved. Is a high-speed, and further, keyword display means and keyword change means Since the digit, modification of the keyword, addition or deletion becomes Kaosame, I was able to perform to ensure the retrieval of electronic files.

以下、この発明の実施例を図面を参照して説明する。
なお、この実施例における電子ファイルは、紙のドキュメントをスキャナーで取り込んだ静止画像ファイルであるものとするが、本発明は前記したhtmlファイルやワープロの出力ファイル等他の形式の電子ファイルにも適用できる。
Embodiments of the present invention will be described below with reference to the drawings.
The electronic file in this embodiment is a still image file obtained by scanning a paper document with a scanner. However, the present invention is also applicable to other types of electronic files such as the html file and the word processor output file described above. it can.

また、以下に述べる実施例は、PCに本発明者等が開発した情報検索のための専用のソフトを組み込み、そのソフトを使用しての実施例である。  The embodiment described below is an embodiment in which dedicated software for information retrieval developed by the present inventors is incorporated in a PC and the software is used.

先ず、原稿ファイルをワープロ等で作成する。この原稿ファイルは、前記したように、また、図1に示すように、各電子ファイルにつき、表題番号、表題及び少なくとも1個のキーワードを抽出し、表題番号1と表題2の間を*で、表題2とキーワード群3、3との間を@で、各キーワード3を*でそれぞれ区切り、各電子ファイルのデータの入力終了毎に改行(リターン)して、1個のレコード4を次に続く他のレコード4と区別する。  First, a document file is created with a word processor or the like. As described above and as shown in FIG. 1, this manuscript file extracts a title number, a title, and at least one keyword for each electronic file, and between the title numbers 1 and 2 with *. The title 2 and the keyword groups 3 and 3 are separated by @ and each keyword 3 is separated by *, and a new line is returned at the end of data input of each electronic file, followed by one record 4 Differentiate from other records 4.

上記の操作を電子ファイル毎に繰り返し、原稿ファイルを作成する。この原稿ファイル中のレコード4の数には制限が無い。  The above operation is repeated for each electronic file to create a document file. There is no limit to the number of records 4 in the document file.

なお、これは本発明の必須の構成ではないが、この実施例では、前記専用ソフトの都合上、原稿ファイルを所謂MS−DOSテキストファイルに落とし、一の電子的記録媒体の第1フォルダに蓄積する。図示の実施例では、この第1フォルダとしてFD(フレキシブルディスク)を用いている。  Although this is not an essential configuration of the present invention, in this embodiment, for convenience of the dedicated software, the original file is dropped into a so-called MS-DOS text file and stored in the first folder of one electronic recording medium. To do. In the illustrated embodiment, an FD (flexible disk) is used as the first folder.

また、この原稿ファイルの入力は、作業効率を高めるため、例えば50件単位でバッチ処理するものとする。  In addition, the input of the document file is assumed to be batch-processed in units of 50, for example, in order to improve work efficiency.

そのため、上記第1フォルダ内に複数の原稿ファイルを順次格納することになるが、1個のレコードにつき一つの原稿ファイルを作成すれば、リアルタイム処理も可能である。  For this reason, a plurality of document files are sequentially stored in the first folder, but real-time processing is possible if one document file is created for each record.

一方、上記一の電子的記録媒体とは異なる他の電子的記録媒体の第2フォルダに、電子ファイル群の夫々に対応するサブフォルダを作成し、各サブフォルダに、対応する電子ファイルの表題番号(登録番号)を割り当てると共に、当該表題番号に対応する電子ファイルを蓄積する。  On the other hand, subfolders corresponding to each of the electronic file groups are created in the second folder of another electronic recording medium different from the one electronic recording medium, and the title number (registration) of the corresponding electronic file is created in each subfolder. Number) and an electronic file corresponding to the title number is stored.

なお、ここでフォルダ、サブフォルダは別の言い方をすればディレクトリ、サブディレクトリであり、また、他の電子的記録媒体としては、MO(光磁気ディスク)、HDD(ハードディスクドライブ)或いはCD、DVD等容量の大きいものが望ましい。  Here, the folder and the subfolder are directories and subdirectories in other words, and other electronic recording media include a capacity of MO (magneto-optical disk), HDD (hard disk drive), CD, DVD, etc. A larger one is desirable.

また、他の電子的記録媒体中の第2フォルダが一杯になってしまったら、別の他の電子的記録媒体中に第2フォルダを作成し、この第2フォルダに別の表題番号のサブフォルダを作成すればよい。つまり、この発明方法における電子ファイルの数に制限は無い。  When the second folder in another electronic recording medium is full, a second folder is created in another electronic recording medium, and a subfolder with a different title number is added to the second folder. Create it. That is, there is no limit to the number of electronic files in the inventive method.

更にまた、第2フォルダのサブフォルダに蓄積する電子ファイルは、完成された電子ファイルばかりでなく、未完の電子ファイルも蓄積することができる。  Furthermore, electronic files stored in subfolders of the second folder can store not only completed electronic files but also incomplete electronic files.

つまり、上記サブフォルダを例えば会社の総務課の社内報のファイルにに対応させた場合、社内報の発行毎に順次サブフォルダに蓄積することができる。勿論、一つのサブフォルダに1枚の新聞の切り抜きだけを蓄積することができる。  That is, when the subfolder is made to correspond to, for example, an in-house newsletter file of the general affairs section of the company, it can be stored in the subfolder sequentially every time the in-house newsletter is issued. Of course, only one newspaper clip can be stored in one subfolder.

このことは、この発明による情報検索方法が、事務処理のペーパーレス化を本来の意味で可能にすることを意味する。  This means that the information retrieval method according to the present invention enables paperless paperwork.

というのは、従来言われているペーパーレスは、Eメールや、例えば報告書としてのワープロの出力ファイル等を単に発生順に夫々のファイルに格納しているだけだからである。  This is because the conventional paperless method simply stores e-mails and, for example, output files of a word processor as a report in each file in the order of occurrence.

つまり、従来のペーパーレスと称されている事務処理方法には、ファイル(ハードウエアとしてファイル)の概念が無く、単に、従来のファイルを構成する紙シートを全部バラし、これを例えば発生順に積み上げておくに等しいからである。  In other words, the conventional paperless paper processing method does not have the concept of files (files as hardware), but simply separates all the paper sheets that make up a conventional file and stacks them in the order of occurrence, for example. Because it is equal.

この場合、電子ファイルを検索するには例えばPDFファイルからキーワードを捜し出す所謂フリーキーワード方法を採用することができるが、この場合の不都合については前記した通りである。  In this case, in order to search for an electronic file, for example, a so-called free keyword method of searching for a keyword from a PDF file can be employed, but the disadvantages in this case are as described above.

この発明は、ペーパーレス事務処理方法を可能にするため、ファイル(ハードウエアとしてファイル)という概念を採用した最初のものであると認識している。  The present invention recognizes that it is the first to adopt the concept of files (files as hardware) to enable a paperless paperwork method.

そして、第2フォルダ中に作成したサブファイル群の夫々をファイル(ハードウエアとしてファイル)に対応させ、数多くのサブファイルから目的のものを捜し出すため(検索するため)、以下に述べる検索方法を組合わせる。  Then, in order to search for a target object from a large number of subfiles by associating each of the subfile groups created in the second folder with files (files as hardware), a search method described below is set up. Match.

他方、上記第1フォルダに蓄積された原稿ファイル(図1参照)から図2に示すキーワードファイルを作成する。  On the other hand, the keyword file shown in FIG. 2 is created from the document files (see FIG. 1) stored in the first folder.

図3は前記表示手段によりCRT(カソード・レイ・チューブ)等のディスプレーに表示されたキーワードファイルの一部を印刷したもので、左端の欄にキーワードが、その右の欄に読みが表示されている。  FIG. 3 shows a part of a keyword file displayed on a display such as a CRT (cathode ray tube) by the display means. The keyword is displayed in the leftmost column and the reading is displayed in the right column. Yes.

このようにしてキーワードは概ねアイウエオ順に表示されるが、例えば戸籍の「戸」は「こ」とも「と」とも読むので、必ずしもアイウエオ順になるものではない。  In this way, the keywords are displayed in the order of Aueo. For example, “door” in the family register is read as “ko” and “to”, and thus is not necessarily in the Aueo order.

上記キーワードファイルを作成するには、原稿ファイルから同じものが重複しないようにキーワードを抽出し、これらを例えばアイウエオ順に並べて第3ファイルに蓄積する。  To create the keyword file, keywords are extracted from the original file so that the same file is not duplicated, and these keywords are arranged in the order of, for example, Iweo and stored in the third file.

例えば、原稿ファイルの最初の表題番号のキーワード(群)を無条件に第3ファイルに格納し、第2番めのキーワード(群)を第3ファイルに格納されたキーワード群の夫々と比較し、同じものがあれば捨て、どのキーワードとも異なるものであるときにはこれを第3ファイルに格納する。  For example, the first title keyword (group) of the manuscript file is unconditionally stored in the third file, the second keyword (group) is compared with each of the keyword groups stored in the third file, If there is the same thing, it is discarded, and if it is different from any keyword, it is stored in the third file.

これを繰り返すことによりキーワードファイルを作成する。なお、上記第3ファイルは、後の信号処理の都合上HDD上に作成すると良い。  A keyword file is created by repeating this. The third file is preferably created on the HDD for the convenience of later signal processing.

また、一のキーワードと、これを有する一の電子ファイルの表題番号を複合して記録したものを上記一の電子ファイルの一のキーワードに対応するキーワードユニットとし、一のキーワードを共通に有するキーワードユニットを一定の順序で並べたものを一の検索ユニットとし、同様にして他のキーワードに対応する他の検索ユニットをキーワードファイルにおけると同じ順序で並べて検索ファイルを作成する。  In addition, a keyword unit corresponding to one keyword of the one electronic file is a combination of one keyword and the title number of one electronic file having the keyword, and a keyword unit having one keyword in common Are arranged in a certain order as one search unit, and similarly, other search units corresponding to other keywords are arranged in the same order as in the keyword file to create a search file.

例えば、キーワードファイルにおけるキーワード群の夫々を洩れが無いように拾い出し、各キーワードが原稿ファイルの表題番号の何番にあるか(或いは無いか)を調べ、当該キーワードを有する電子ファイルの表題番号とキーワードとを複合して、図3に示すように、キーワードファイルにおけるキーワード順に第4フォルダ内に格納する。  For example, each keyword group in the keyword file is picked up so that there is no omission, the number of each title in the manuscript file is checked (or not), and the title number of the electronic file having the keyword is determined. The keywords are combined and stored in the fourth folder in the keyword file order in the keyword file as shown in FIG.

例えば図3において、「個人認証・419」が一のキーワードユニットであり、「個人認証・419〜508」の8行分のキーワードユニット群が検索ユニットである。  For example, in FIG. 3, “personal authentication • 419” is one keyword unit, and a keyword unit group for eight rows of “personal authentication • 419 to 508” is a search unit.

ここで、上記「一のキーワードと、これを有する一の電子ファイルの表題番号を複合」する、という概念は、単に関連させて記録する、という概念も含めるものとする。  Here, the concept of “combining one keyword and the title number of one electronic file having the keyword” also includes the concept of recording in association with each other.

また、この第4フォルダも後の信号処理の都合上HDD上に作成するのが望ましい。  In addition, it is desirable to create this fourth folder on the HDD for the convenience of later signal processing.

なお、本発明者等が開発した情報検索のための専用のソフトにおいては、上記キーワードファイル及び検索ファイルの作成を一の原稿ファイル毎に数十件単位で同時に行うことにしており、このとき、未だキーワードファイルに登録されていない新しいキーワードの読みを入力すると共に、原稿ファイルを順次接続してここでは説明しない文献ファイルを作成して、これをHDDに格納する。  In the software dedicated to information retrieval developed by the present inventors, the keyword file and search file are created simultaneously in units of several tens of cases for each manuscript file. A new keyword reading that has not yet been registered in the keyword file is input, and document files are sequentially connected to create a document file not described here, and this is stored in the HDD.

情報検索の際には、図4に示すキーワード入力欄7に例えばキーワード「現像液」を入力し、検索開始タブ8をクリックすると、キーワード「現像液(図2及び図3参照)」を有する表題番号526の電子ファイルが表題と共に検索結果欄9に表示され、その下の「ADF 001.TIF」と表示された頁番号をクリックすると右側にその画像が掲示される。  When searching for information, for example, when the keyword “developer” is entered in the keyword input field 7 shown in FIG. 4 and the search start tab 8 is clicked, the title having the keyword “developer (see FIGS. 2 and 3)” is entered. The electronic file with the number 526 is displayed in the search result column 9 together with the title, and when the page number displayed as “ADF 001.TIF” is clicked below, the image is posted on the right side.

なお、図4においては静止画像ファイルの内容が半分切れているように表示されているが、これはディスプレーの印刷ソフトの都合で、実際には新聞の切り抜きの全体が表示される。  In FIG. 4, the content of the still image file is displayed as if it is half cut. However, this is because of the printing software of the display, and the entire newspaper clipping is actually displayed.

また、この表示をディスプレー上で読んでもよいが、紙のプリントアウトをすることもできる。  This display may be read on the display, but paper can be printed out.

なお、前記本発明者等が開発した情報検索のための専用のソフトにおいては、キーワード入力欄に複数のキーワードを+で繋いで入力すればオア検索が可能であり、改行すればアンド検索ができるが、これらの機能は本願発明の要旨ではないので、更に詳細な説明は省略する。  In the software dedicated to information retrieval developed by the present inventors, it is possible to perform an OR search by inputting a plurality of keywords connected by + in the keyword input field, and to perform an AND search by entering a line feed. However, since these functions are not the gist of the present invention, further detailed description is omitted.

次に、本発明の特徴的な構成は、前記したように、キーワード表示手段と変更手段で、キーワード表示手段によってディスプレーに表示されたキーワードファイルの一部を図2に示す。  Next, as a characteristic configuration of the present invention, as described above, a part of the keyword file displayed on the display by the keyword display means by the keyword display means and the change means is shown in FIG.

このキーワードファイルは本発明者等が上記専用のソフトを実際に使用しての結果を示すが、この図2において、キーワード「古崎雅巳」とキーワード「古埼雅巳」とが併記されている。しかしながら、後者の「古埼雅巳」は原稿ファイル作成時における誤入力なのである。  This keyword file shows the result of the present inventors actually using the dedicated software. In FIG. 2, the keyword “Masaki Furusaki” and the keyword “Furusaki Masami” are written together. However, the latter “Masahiro Furusaki” is an erroneous input when creating a manuscript file.

したがって、図3に示すように、キーワード「古崎雅巳」の検索ユニット6に「古埼雅巳」をキーワードとする表題番号12000137の電子ファイルも含む積りで「古埼雅巳・12000137」のキーワードユニットを入力したのであるが、実際には、「古崎雅巳」なるキーワードで検索すると、表題番号12000137の電子ファイルは出てこないのである。  Therefore, as shown in FIG. 3, the keyword unit of “Furusaki Masami ・ 12000137” is input to the search unit 6 of the keyword “Furusaki Masami” including the electronic file of the title number 12000137 with “Furusaki Masami” as the keyword. However, in fact, when searching with the keyword “Furusaki Masami”, the electronic file with the title number 12000137 does not appear.

従来の検索ソフト、例えば前記電子ファイルの一つ一つに一つ以上のキーワードを割り当てて電子ファイルそのものに直接記録し、これを記憶装置にその侭放り込む検索ソフトでは、表題番号12000137に誤ったキーワードを入力したことを知ることが不可能で、換言すれば、表題番号12000137の電子ファイルは行方不明になってしまい、恐ろしいことに、行方不明になったことさえ気が付かない。  In conventional search software, for example, search software that assigns one or more keywords to each of the electronic files and records them directly in the electronic file itself, and throws it into the storage device, the wrong keyword appears in the title number 12000137. In other words, the electronic file with the title number 12000137 is missing, and terribly, it is not even noticed that it was missing.

一方、本願発明においては、図3に示す検索ファイルにおいて、例えば、ワープロソフトの機能を用いて通常はテキストファイルで記述されている「古埼雅巳・12000137」のキーワードユニット中の「埼」を「崎」に修正すれば、検索ファイルを作成する機能により、図6に示すように、「古崎雅巳・12000137」のキーワードユニット5は、本来あるべき正規の位置、すなわち、キーワードユニット「古崎雅巳・12000124」と「古崎雅巳・12000139」の間に挿入される。  In the invention of the present application, on the other hand, in the search file shown in FIG. 3, for example, “Sai” in the keyword unit of “Furusaki Masami / 12000137”, which is usually described in a text file using the function of word processing software, is “ If it is corrected to “Saki”, the keyword unit 5 of “Furusaki Masago ・ 12000137” is displayed in a proper position, that is, the keyword unit “Furusaki Masaaki · 12000124” as shown in FIG. ”And“ Masaki Furusaki / 12000139 ”.

同時に、図5に示すように、誤入力されたキーワード「古埼雅巳」が削除される。  At the same time, as shown in FIG. 5, the erroneously input keyword “Masaharu Kosaki” is deleted.

前記本発明者等が開発した専用のソフトによれば、図示しない一の窓に「古埼雅巳」を、これに対応する他の窓に「古崎雅巳」を入力し、変換タブをクリックすると、検索ユニット6及びキーワードファイルの修正が自動的に行われる。  According to the dedicated software developed by the inventors, when entering `` Masa Furusaki '' in one window (not shown) and `` Masa Furusaki '' in the other window corresponding to this, clicking the conversion tab, The search unit 6 and the keyword file are automatically corrected.

なお、検索ファイル中の一のキーワードユニットを消去すれば、キーワードの削除ができ、一のキーワードユニットをコピーし、コピーされたキーワードユニットのキーワードを他のキーワードに変換すれば、キーワードの追加ができる。  If you delete one keyword unit in the search file, you can delete the keyword. If you copy one keyword unit and convert the keyword in the copied keyword unit to another keyword, you can add keywords. .

なお、図示の実施例では電子ファイルとして紙の書類をスキャナーで読み取った静止画像ファイルであるとしたが、これは他の電子ファイル、例えばhtmlファイルやワープロの出力ファイルでも良いことは勿論で、また、静止画像ファイルと他の電子ファイルとを混在させて第2フォルダの一のサブフォルダに格納できる。  In the illustrated embodiment, the paper file is a still image file obtained by reading a paper document as an electronic file. However, this may be another electronic file such as an html file or an output file of a word processor. Still image files and other electronic files can be mixed and stored in one subfolder of the second folder.

このとき、目的のサブフォルダを開いて中の電子ファイルを表示する方法としては、例えば名前順、種類順、サイズ順或いは日付順の任意の順番で並べることができ、目的の電子ファイルをクリックすることによりその電子ファイルを表示でき、或いはプリントアウトすることができる。  At this time, as a method of opening the target subfolder and displaying the electronic file in it, for example, it can be arranged in any order of name order, type order, size order or date order, and click on the target electronic file The electronic file can be displayed or printed out.

原稿ファイルの一例を示すプリントアウトの抄本。  A printout excerpt showing an example of a manuscript file. キーワードファイルの一例を示すディスプレーのコピー。  A copy of the display showing an example keyword file. 検索ファイルの一例を示すディスプレーのコピー。  A copy of the display showing an example of a search file. 情報検索方法の一例を示すディスプレーのコピー。  A copy of the display showing an example of information retrieval. 図2と同様のディスプレーのコピーで、誤入力されたキーワードが削除された例を示す。  An example in which an erroneously input keyword is deleted in a copy of the display similar to FIG. 図3と同様のディスプレーのコピーで、誤入力されたキーワードの修正後を示す。  A copy of the display similar to that in FIG.

1 表題番号
2 表題
3 キーワード
4 レコード
5 キーワードユニット
6 検索ユニット
7 キーワード入力欄
8 検索開始タブ
9 検索結果欄
1 Title number 2 Title 3 Keyword 4 Record 5 Keyword unit 6 Search unit 7 Keyword input field 8 Search start tab 9 Search result field

Claims (1)

情報検索の実行以前に、電子ファイル毎に、その電子ファイルを他の電子ファイルと区別するための表題番号を割り当てると共に、少なくとも1個のキーワードを抽出して、これら表題番号及びキーワードからなるグループを所謂ワープロなどの電子的記録手段を用いて1個のレコードとし、同様にして複数の電子ファイルから抽出した複数のレコードを収録して原稿ファイルを作成し、この原稿ファイルを一の電子的記録媒体の第1フォルダに蓄積し、一方、上記一の電子的記録媒体とは異なる他の電子的記録媒体の第2フォルダに上記電子ファイル群の夫々に対応するサブフォルダを作成し、各サブフォルダに、対応する電子ファイルの表題番号を割り当てると共に、当該表題番号に対応する電子ファイルを蓄積し、他方、プログラムとコンピュータとの協働によるキーワードファイル作成手段により上記第1フォルダに蓄積された原稿ファイルから同じものが重複しないようにキーワードを抽出し、これらを一定の順序に並べ、キーワードファイルを作成してこれを第3フォルダに蓄積し、また、プログラムとコンピュータとの協働による検索ファイル作成手段により一のキーワードと、これを有する一の電子ファイルの表題番号を複合して記録したものを上記一の電子ファイルの一のキーワードに対応するキーワードユニットとし、一のキーワードを共通に有するキーワードユニットを一定の順序で並べたものを一の検索ユニットとし、同様にして他のキーワードに対応する他の検索ユニットをキーワードファイルにおけると同じ順序で並べて検索ファイルを作成してこれを第4フォルダに蓄積し、更にまた、プログラムとコンピュータとの協働によるキーワード表示手段と、キーワードを修正、追加或いは削除するプログラムとコンピュータとの協働による変更手段を設け、情報検索の際、プログラムとコンピュータとの協働による情報検索手段にキーワードを設定し、設定されたキーワードから、プログラムとコンピュータとの協働による情報検索手段に、対応する検索ユニットを取り出させてこれをディスプレーに表示させ、表示された検索ユニットの表題番号から第2フォルダ内の電子ファイルを取りだすようにし、必要のあるときキーワード表示手段によりキーワードファイルをディスプレーに表示し、また、変更手段を用いて、第4フォルダ内のキーワードの修正、追加或いは削除を検索ユニット毎に行うようにしたことを特徴とする情報検索方法。 Prior to the execution of information retrieval, each electronic file is assigned a title number for distinguishing the electronic file from other electronic files, and at least one keyword is extracted, and a group consisting of the title number and the keyword is assigned. An electronic recording means such as a so-called word processor is used to make one record, and similarly, a plurality of records extracted from a plurality of electronic files are recorded to create a document file, and this document file is stored in one electronic recording medium. On the other hand, a subfolder corresponding to each of the electronic file groups is created in a second folder of another electronic recording medium different from the one electronic recording medium, and each subfolder corresponds to each subfolder. It assigns a title number of the electronic file, stores the electronic file corresponding to the title number, on the other hand, programs and Those same from a document file stored in the first folder extracts keywords so as not to overlap with the keyword file creating unit in collaboration with the computer, arranging them in a certain order, you create a keyword file The one electronic file is a combination of one keyword and the title number of one electronic file having the keyword stored by the search file creation means in cooperation with the program and the computer. A keyword unit corresponding to one keyword, a keyword unit having one keyword in common in a certain order as one search unit, and the other search units corresponding to other keywords in the same way Create a search file in the same order as in the file Accumulated in the fourth folder, furthermore, provided a keyword display unit by cooperation of a program and the computer, correct the keyword, the change means by cooperation of a program and a computer to add or delete, when the information search program and cooperate with keywords in information retrieval means according to the computer, from the set keywords to cooperate by the information retrieval means of a program and a computer, to display this by eject the corresponding search unit on the display The electronic file in the second folder is taken out from the title number of the displayed search unit, the keyword file is displayed on the display by the keyword display means when necessary, and the change file is used to display the keyword file in the fourth folder. Keyword correction, addition, or deletion for each search unit An information retrieval method characterized by being performed.
JP2006023381A 2006-01-31 2006-01-31 Information retrieval method Expired - Fee Related JP4947763B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006023381A JP4947763B2 (en) 2006-01-31 2006-01-31 Information retrieval method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006023381A JP4947763B2 (en) 2006-01-31 2006-01-31 Information retrieval method

Publications (2)

Publication Number Publication Date
JP2007206868A JP2007206868A (en) 2007-08-16
JP4947763B2 true JP4947763B2 (en) 2012-06-06

Family

ID=38486304

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006023381A Expired - Fee Related JP4947763B2 (en) 2006-01-31 2006-01-31 Information retrieval method

Country Status (1)

Country Link
JP (1) JP4947763B2 (en)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0969108A (en) * 1995-03-23 1997-03-11 Takao Iida Production of information retrieving information recording sheet
JP3787384B2 (en) * 1996-03-27 2006-06-21 キヤノン株式会社 Document retrieval apparatus and method
JP2004110656A (en) * 2002-09-20 2004-04-08 Ai Giken:Kk Electronic filing method

Also Published As

Publication number Publication date
JP2007206868A (en) 2007-08-16

Similar Documents

Publication Publication Date Title
US5159180A (en) Litigation support system and method
US7081975B2 (en) Information input device
US8380012B2 (en) Document imaging and indexing system
US20100281353A1 (en) Automated Annotating Hyperlinker
US20020083079A1 (en) System and method of managing documents
CN102959578B (en) Forensic system and forensic method, and forensic program
US20050185225A1 (en) Methods and apparatus for imaging documents
US20050289447A1 (en) Systems and methods for generating and storing referential links in a database
JP2006120125A (en) Document image information management apparatus and document image information management program
CN104346415B (en) Method for naming image document
JP2006085733A (en) Filing/retrieval device and filing/retrieval method
US20060062492A1 (en) Document processing device, document processing method, and storage medium recording program therefor
JP2006059075A (en) Document processor and program
Miller All text considered: A perspective on mass digitizing and archival processing
CN1362681A (en) Information search processing device and method, recording medium recording information search programme
Sankar et al. Digitizing a million books: Challenges for document analysis
JP2014013534A (en) Document processor, image processor, image processing method and document processing program
JP2006244071A (en) Method of providing information, portal site system and program
US20070185832A1 (en) Managing tasks for multiple file types
KR100912288B1 (en) Search system using contents information in document file
JP4947763B2 (en) Information retrieval method
Pledge et al. Process and progress: working with born-digital material in the Wendy Cope Archive at the British Library
Bhat Development of Digital Libraries in India: a Survey of Digital Collection of National Digital Library of India
FR2886429A1 (en) SYSTEM FOR USER TO MANAGE A PLURALITY OF PAPER DOCUMENTS
US20030234967A1 (en) Interactive document capture and processing software

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090130

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110228

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110502

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111212

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

R155 Notification before disposition of declining of application

Free format text: JAPANESE INTERMEDIATE CODE: R155

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120305

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150316

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees