JP4480413B2 - Document search device, document search method, and document search program - Google Patents
Document search device, document search method, and document search program Download PDFInfo
- Publication number
- JP4480413B2 JP4480413B2 JP2004032878A JP2004032878A JP4480413B2 JP 4480413 B2 JP4480413 B2 JP 4480413B2 JP 2004032878 A JP2004032878 A JP 2004032878A JP 2004032878 A JP2004032878 A JP 2004032878A JP 4480413 B2 JP4480413 B2 JP 4480413B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- document
- extraction
- unit
- electronic document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 26
- 238000000605 extraction Methods 0.000 claims description 39
- 238000006243 chemical reaction Methods 0.000 claims description 31
- 239000000284 extract Substances 0.000 claims description 2
- 238000005259 measurement Methods 0.000 description 14
- 230000004931 aggregating effect Effects 0.000 description 5
- 230000002776 aggregation Effects 0.000 description 5
- 238000004220 aggregation Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
この発明は、検索条件に適合する電子文書の一覧を表示画面に表示する文書検索装置、文書検索方法、および文書検索プログラムに関する。 The present invention relates to a document search apparatus, a document search method, and a document search program for displaying a list of electronic documents that meet a search condition on a display screen.
複数の電子文書の中から、ユーザが指定した検索条件に適合するものを検索して、その文書名やファイル名などを検索結果として一覧表示する技術が従来から知られている。そしてこの検索条件としては、文書中に出現する文字列や数値のほか、それらの出現位置まで指定できるものがある。 2. Description of the Related Art Conventionally, a technique for searching a plurality of electronic documents that match a search condition specified by a user and displaying a list of the document names and file names as search results is known. In addition to the character strings and numerical values appearing in the document, there are search conditions that can be specified up to their appearance positions.
たとえば、検索対象文書の本文に複数のレコード(行)とフィールド(列)からなる表が含まれる場合に、あるフィールドの値としてある文字列や数値を含む文書だけを検索することができる。図6に示す「測定結果1.jtd」および図7に示す「測定結果2.jtd」の2つの文書を対象に、「電圧」フィールドに数値「5.0」を含む文書を検索した場合、いずれの文書も上記条件に適合する結果、検索結果一覧は図8に示すようなものとなる。 For example, when a table including a plurality of records (rows) and fields (columns) is included in the body of a search target document, only documents including a certain character string or numerical value as a value of a certain field can be searched. When two documents “measurement result 1.jtd” shown in FIG. 6 and “measurement result 2.jtd” shown in FIG. 7 are searched, a document including a numerical value “5.0” in the “voltage” field is searched. As a result of satisfying the above conditions for any document, the search result list is as shown in FIG.
しかしながら上記従来技術では、図示するように、検索結果一覧には検索条件に適合した文書の文書名やファイル名が列挙されるのみである。したがってたとえば、電圧が5.0Vの抵抗は具体的にはどれであるかを知りたい場合、ユーザは上記一覧中の各文書を逐一オープンして、「電圧」フィールドの値が「5.0」であるレコードを探し出さなければならない。 However, in the conventional technique, as shown in the figure, the search result list only lists document names and file names of documents that meet the search conditions. Thus, for example, if the user wants to know what the resistance is at a voltage of 5.0V, the user opens each document in the above list one by one and the value of the “voltage” field is “5.0”. You have to find the record that is.
すなわち上記のようなケースでは、ユーザの意図はある条件に適合する「文書」の検索というよりは、むしろ複数の文書を横断的に検索して、ある条件に適合する「レコード」を見つけ出すことにあるにもかかわらず、従来技術では当該レコードを含む文書を提示するところまでしかできない、という問題点があった。しかも検索結果一覧中の各文書を閲覧するには、別途ビューアを起動しなければならないことが多く、時間がかかる、煩雑であるなどの問題点もあった。 In other words, in the above case, the user's intention is not to search for “documents” that meet certain conditions, but rather to search multiple documents across to find “records” that meet certain conditions. In spite of this, the conventional technology has a problem that only a document including the record can be presented. In addition, in order to view each document in the search result list, it is often necessary to start a viewer separately, and there are problems such as time consuming and complicated.
この発明は、上述した従来技術による問題点を解消するため、本文中に表を含む電子文書を対象として検索を実行した場合に、その検索結果をユーザに分かりやすく提示することが可能な文書検索装置、文書検索方法、および文書検索プログラムを提供することを目的とする。 In order to solve the above-described problems caused by the prior art, the present invention can provide a user with an easy-to-understand presentation of a search result when a search is performed on an electronic document including a table in the text. An object is to provide an apparatus, a document search method, and a document search program.
上述した課題を解決し、目的を達成するため、この発明にかかる文書検索装置は、電子文書中に出現すべきデータを検索条件として指定する指定手段と、複数の電子文書の中から前記指定手段により指定された検索条件に適合する電子文書を検索する検索手段と、前記検索手段により検索された電子文書から前記データの出現するレコードを抽出する抽出手段と、前記抽出手段により抽出されたレコードの値からなる検索結果一覧を作成する作成手段と、を備えることを特徴とする。 In order to solve the above-described problems and achieve the object, a document search apparatus according to the present invention includes a specifying means for specifying data that should appear in an electronic document as a search condition, and the specifying means from among a plurality of electronic documents. Search means for searching for an electronic document that matches the search condition specified by the search means, an extraction means for extracting a record in which the data appears from the electronic document searched by the search means, and a record of the record extracted by the extraction means Creating means for creating a search result list composed of values.
この発明によれば、ユーザに提示される検索結果一覧では、適合文書中の適合箇所(具体的には、検索条件で指定されたデータが出現するレコードの内容)が一覧表の形に集約される。 According to the present invention, in the search result list presented to the user, the conforming portions in the conforming document (specifically, the contents of the record in which the data specified by the search condition appears) are collected in the form of a list. The
また、この発明にかかる文書検索装置は、上記の発明において、さらに、前記抽出手段により抽出されたレコードの特定のフィールドのみを抽出する第2の抽出手段を備え、前記作成手段は、前記抽出手段により抽出されたレコードの、前記第2の抽出手段により抽出されたフィールドの値からなる検索結果一覧を作成することを特徴とする。 Also, such a document retrieval apparatus in the present invention, in the above invention, further comprising a second extraction means for extracting only specific fields of the extracted record by the extraction means, said creation means, said extracting means A search result list including the field values extracted by the second extraction means of the records extracted by the above is created.
この発明によれば、ユーザに提示される検索結果一覧では、適合文書中の適合箇所(具体的には、検索条件で指定されたデータが出現するレコードの、特定のフィールドの内容)が一覧表の形に集約される。 According to the present invention, in the search result list presented to the user, the conforming portion in the conforming document (specifically, the contents of a specific field of the record in which the data specified by the search condition appears) is listed. It is summarized in the form of
また、この発明にかかる文書検索装置は、上記の発明において、さらに、前記電子文書を共通の形式に変換する変換手段を備え、前記検索手段は、前記変換手段による変換後の複数の電子文書の中から前記指定手段により指定された検索条件に適合する電子文書を検索することを特徴とする。 The document search apparatus according to the present invention further includes a conversion unit that converts the electronic document into a common format in the above-described invention, and the search unit stores a plurality of electronic documents converted by the conversion unit. An electronic document that meets the search conditions specified by the specifying means is searched for.
この発明によれば、様々な形式の電子文書が混在している場合にも、それらに対応する共通形式の電子文書を対象とした、高速かつ漏れのない文書検索が可能である。 According to the present invention, even when various types of electronic documents are mixed, it is possible to perform high-speed and leak-free document searching for common-type electronic documents corresponding to them.
また、この発明にかかる文書検索装置は、上記の発明において、前記作成手段が、前記検索手段により検索された電子文書に対応する、前記変換手段による変換前の電子文書へのリンクを前記検索結果一覧に埋め込むことを特徴とする。 In the document search apparatus according to the present invention, in the above invention, the creation unit displays a link to the electronic document before conversion by the conversion unit corresponding to the electronic document searched by the search unit. It is embedded in the list.
この発明によれば、共通形式の電子文書を対象とした検索であっても、検索結果一覧からは適合文書に対応する元の電子文書を高速かつ効率的に閲覧することが可能である。 According to the present invention, even when a search is performed on an electronic document of a common format, the original electronic document corresponding to the conforming document can be browsed quickly and efficiently from the search result list.
また、この発明にかかる文書検索方法は、電子文書中に出現すべきデータを検索条件として指定する指定工程と、複数の電子文書の中から前記指定工程で指定された検索条件に適合する電子文書を検索する検索工程と、前記検索工程で検索された電子文書から前記データの出現するレコードを抽出する抽出工程と、前記抽出工程で抽出されたレコードの値からなる検索結果一覧を作成する作成工程と、を含むことを特徴とする。 The document retrieval method according to the present invention includes a designation step for designating data that should appear in an electronic document as a retrieval condition, and an electronic document that conforms to the retrieval condition designated in the designation step among a plurality of electronic documents. A search step for searching for data, an extraction step for extracting a record in which the data appears from the electronic document searched for in the search step, and a creation step for creating a search result list comprising the values of the records extracted in the extraction step It is characterized by including these.
この発明によれば、ユーザに提示される検索結果一覧では、適合文書中の適合箇所(具体的には、検索条件で指定されたデータが出現するレコードの内容)が一覧表の形に集約される。 According to the present invention, in the search result list presented to the user, the conforming portions in the conforming document (specifically, the contents of the record in which the data specified by the search condition appears) are collected in the form of a list. The
また、この発明にかかる文書検索方法は、上記の発明において、さらに、前記抽出工程で抽出されたレコードの特定のフィールドのみを抽出する第2の抽出工程を含み、前記作成工程では、前記抽出工程で抽出されたレコードの、前記第2の抽出工程で抽出されたフィールドの値からなる検索結果一覧を作成することを特徴とする。 The document search method according to the present invention further includes a second extraction step of extracting only a specific field of the record extracted in the extraction step in the above-described invention, and the extraction step includes the extraction step. A search result list including the field values extracted in the second extraction step is created for the records extracted in (1).
この発明によれば、ユーザに提示される検索結果一覧では、適合文書中の適合箇所(具体的には、検索条件で指定されたデータが出現するレコードの、特定のフィールドの内容)が一覧表の形に集約される。 According to the present invention, in the search result list presented to the user, the conforming portion in the conforming document (specifically, the contents of a specific field of the record in which the data specified by the search condition appears) is listed. It is summarized in the form of
また、この発明にかかる文書検索方法は、上記の発明において、さらに、前記電子文書を共通の形式に変換する変換工程を含み、前記検索工程では、前記変換工程での変換後の複数の電子文書の中から前記指定工程で指定された検索条件に適合する電子文書を検索することを特徴とする。 The document search method according to the present invention further includes a conversion step of converting the electronic document into a common format in the above invention, and the search step includes a plurality of electronic documents after the conversion in the conversion step. An electronic document that matches the search condition specified in the specifying step is searched from the above.
この発明によれば、様々な形式の電子文書が混在している場合にも、それらに対応する共通形式の電子文書を対象とした、高速かつ漏れのない文書検索が可能である。 According to the present invention, even when various types of electronic documents are mixed, it is possible to perform high-speed and leak-free document searching for common-type electronic documents corresponding to them.
また、この発明にかかる文書検索方法は、上記の発明において、前記作成工程では、前記検索工程で検索された電子文書に対応する、前記変換工程による変換前の電子文書へのリンクを前記検索結果一覧に埋め込むことを特徴とする。 In the document search method according to the present invention, in the above invention, in the creation step, a link to the electronic document before conversion by the conversion step corresponding to the electronic document searched in the search step is displayed in the search result. It is embedded in the list.
この発明によれば、共通形式の電子文書を対象とした検索であっても、検索結果一覧からは適合文書に対応する元の電子文書を高速かつ効率的に閲覧することが可能である。 According to the present invention, even when a search is performed on an electronic document of a common format, the original electronic document corresponding to the conforming document can be browsed quickly and efficiently from the search result list.
また、この発明にかかる文書検索プログラムによれば、上記のいずれか一つに記載された方法をコンピュータに実行させることができる。 Further, according to the document search program according to the present invention, it is possible to cause a computer to execute any one of the methods described above .
本発明にかかる文書検索装置、文書検索方法、および文書検索プログラムによれば、本文中に表を含む電子文書を対象として検索を実行した場合に、その検索結果をユーザに分かりやすく提示することができるという効果を奏する。 According to the document search device, the document search method, and the document search program according to the present invention, when a search is performed on an electronic document including a table in the text, the search result can be presented to the user in an easy-to-understand manner. There is an effect that can be done.
以下に添付図面を参照して、この発明にかかる文書検索装置、文書検索方法、および文書検索プログラムの好適な実施の形態を詳細に説明する。 Exemplary embodiments of a document search apparatus, a document search method, and a document search program according to the present invention will be explained below in detail with reference to the accompanying drawings.
図1は、この発明の実施の形態にかかる文書検索装置のハードウエア構成の一例を示す説明図である。図中、101は装置全体を制御するCPUを、102は基本入出力プログラムなどを記憶したROMを、103はCPU101のワークエリアとして使用されるRAMを、それぞれ示している。
FIG. 1 is an explanatory diagram showing an example of a hardware configuration of a document search apparatus according to an embodiment of the present invention. In the figure, 101 indicates a CPU that controls the entire apparatus, 102 indicates a ROM that stores basic input / output programs, and 103 indicates a RAM that is used as a work area of the
また、104はCPU101の制御にしたがってHD(ハードディスク)105に対するデータのリード/ライトを制御するHDD(ハードディスクドライブ)を、105はHDD104の制御にしたがって書き込まれたデータを記憶するHDを、それぞれ示している。
また、106はCPU101の制御にしたがってFD(フレキシブルディスク)107に対するデータのリード/ライトを制御するFDD(フレキシブルディスクドライブ)を、107はFDD106の制御にしたがって書き込まれたデータを記憶する着脱自在のFDを、それぞれ示している。
また、108はCPU101の制御にしたがってCD−RW109に対するデータのリード/ライトを制御するCD−RWドライブを、109はCD−RWドライブ108の制御にしたがって書き込まれたデータを記憶する着脱自在のCD−RWを、それぞれ示している。
また、110はカーソル、メニュー、ウィンドウ、あるいは文字や画像などの各種データを表示するディスプレイを、111は文字、数値、各種指示などの入力のための複数のキーを備えたキーボードを、112は各種指示の選択や実行、処理対象の選択、マウスポインタの移動などをおこなうマウスを、それぞれ示している。
また、113は通信ケーブル114を介してLANやWANなどのネットワークに接続され、当該ネットワークとCPU101とのインターフェースとして機能するネットワークI/Fを、100は上記各部を接続するためのバスを、それぞれ示している。
次に、図2はこの発明の実施の形態にかかる文書検索装置の構成を機能的に示す説明図である。図中、200はオリジナル文書記憶部であり、後述する文書変換部201による変換前の文書(以下では「オリジナル文書」と呼ぶ)を複数保持する機能部である。これらオリジナル文書の中には、少なくともその本文の一部に表を含む文書(本文内の表の個数は問わない)が含まれているものとする。なお、これらの文書の形式は何であってもよく、様々な形式の文書が混在しているのであってもよい。
Next, FIG. 2 is an explanatory diagram functionally showing the configuration of the document search apparatus according to the embodiment of the present invention. In the figure,
201は文書変換部であり、オリジナル文書記憶部200内の各文書を、共通の形式、たとえばXML形式に変換する機能部である。文書変換部201は具体的には、上記各文書のそれぞれの形式に対応したXMLコンバータであり、文書変換部201から出力された変換後のXML文書は、検索対象文書記憶部202に保持される。なお、オリジナル文書記憶部200内の変換前のオリジナル文書と、検索対象文書記憶部202内の変換後のXML文書とは、一対一に対応が取れるようになっている(たとえば変換後の文書には、変換前の文書と同一のファイル名を付与する)。
A
203は入出力部であり、後述する文書検索部204による検索の基礎となる検索条件の入力などをユーザから受け付けるとともに、後述する検索結果集約部205により作成された検索結果一覧や、当該一覧からリンクされたオリジナル文書の本文などを画面表示する機能部である。
204は文書検索部であり、検索対象文書記憶部202に保持された、文書変換部201による変換後の各文書の中から、入出力部203で受け付けられた検索条件に適合する文書を検索する機能部である。この文書検索部204は、たとえば文書内の表のあるフィールドにある値を含む文書など、文字列や数値の出現位置まで限定して適合文書を絞り込むことができる。
A
205は検索結果集約部であり、文書検索部204で検索された適合文書を基礎として、図8に示した従来の検索結果一覧の代わりに、図3に示すような検索結果一覧を作成する機能部である。
図3の検索結果一覧は、適合文書中の表から、さらに検索条件に適合するレコードを抽出して、そのキー項目(一意な値を有するフィールド)の値を列挙したものである。たとえば「電圧」フィールドに数値「5.0」を含む文書として、図6の「測定結果1.jtd」および図7の「測定結果2.jtd」が得られた(正確には、これらのオリジナル文書に対応するXML文書が得られた)場合、検索結果集約部205はまずそのレコード抽出部205aにより、各文書中の表から「電圧」フィールドに数値「5.0」を含むレコード、この例では「測定結果1.jtd」の「抵抗B」のレコードと、「測定結果2.jtd」の「抵抗D」のレコードとを抽出する。
The search result list in FIG. 3 is a list in which records that match the search conditions are further extracted from the table in the matching document, and the values of the key items (fields having unique values) are listed. For example, “measurement result 1.jtd” in FIG. 6 and “measurement result 2.jtd” in FIG. 7 were obtained as documents including the numerical value “5.0” in the “voltage” field. In the case where an XML document corresponding to the document is obtained), the search
次に、検索結果集約部205はそのフィールド抽出部205bにより、上記で抽出されたレコードの指定されたフィールドを抽出する。図3の例では、このフィールドとしてキー項目(のみ)が指定されている結果、上記各レコードのキー項目の値である文字列「抵抗B」および「抵抗D」が抽出される。
Next, the search
そして、検索結果集約部205はさらにその結果一覧作成部205cにより、上記で抽出された「抵抗B」や「抵抗D」にその抽出元となった文書(正確には、抽出元となったXML文書に対応するオリジナル文書)の名称である「測定結果1.jtd」や「測定結果2.jtd」を対応づけるとともに、これらに当該各文書へのリンクを埋め込んで、図3のような一覧表を作成する。図中、リンクは下線により表現され、たとえば「測定結果1.jtd」をクリックすることで、ビューアを起動してオリジナル文書記憶部200内の「測定結果1.jtd」の本文を表示させることができる。
Then, the search
図4はこの発明の実施の形態にかかる文書検索装置における、文書検索処理の手順を示すフローチャートである。なお、図示する処理の開始に先立って、オリジナル文書記憶部200内の各文書は、文書変換部201によりXML形式に変換されて、検索対象文書記憶部202に保存されているものとする。
FIG. 4 is a flowchart showing the procedure of the document search process in the document search apparatus according to the embodiment of the present invention. Prior to the start of the illustrated process, each document in the original
ユーザからの文書の検索指示の入力を入出力部203が検知すると(ステップS401:Yes)、入出力部203からの指示を受けた文書検索部204は、上記検索指示とともに入力された検索条件に適合する文書を検索対象文書記憶部202から検索する(ステップS402)。
When the input /
次に、文書検索部204から適合文書を通知された検索結果集約部205は、そのレコード抽出部205aにより、上記各文書中の表から検索条件に適合するレコードを抽出する(ステップS403)。さらにフィールド抽出部205bにより、これらのレコードからあらかじめ指定されたフィールドのみを抽出し(ステップS404)、次に結果一覧作成部205cにより、各フィールドの値と抽出元文書へのリンクからなる検索結果一覧を作成する(ステップS405)。そして、この一覧が検索結果集約部205から入出力部203に引き渡され、図3のように画面表示される(ステップS406)。
Next, the search
以上説明した実施の形態によれば、文書中の表の、あるフィールドの値としてある文字列や数値を含む文書だけを検索した場合に、検索結果一覧には検索条件に適合するレコードまで(正確には、当該レコードの必要なフィールドの値まで)が詳細に表示される。言い換えれば、適合文書中の適合箇所が一覧表に集約された上で提示されるので、ユーザは従来のように、適合文書を逐一オープンして適合箇所を確認する必要がない。もっとも、適合箇所を逐一確認しなければならない場合にも、結果一覧中にオリジナル文書へのリンクが埋め込まれているので、目的の文書の本文を高速に閲覧することができる。 According to the embodiment described above, when only documents that include a certain character string or numerical value as a value of a certain field in a table in a document are searched, the search result list includes records that match the search condition (exactly Is displayed in detail up to the required field value of the record. In other words, since the conforming parts in the conforming document are presented in a list, the user does not need to open the conforming documents one by one and confirm the conforming part as in the conventional art. Of course, even when it is necessary to check the conforming portions one by one, since the link to the original document is embedded in the result list, the text of the target document can be viewed at high speed.
また、オリジナル文書を直接でなく、それらから変換されたXML文書を対象に検索を行うので、様々な形式の文書を横断的に、高速で漏れのない検索を実行することが可能である。 In addition, since the search is performed not on the original document directly but on the XML document converted from the original document, it is possible to perform a high-speed and leak-free search across various types of documents.
なお、上述した実施の形態では、検索条件に適合するレコード中のキー項目のみを一覧表示したが、表示するフィールドの個数はいくつであってもよい。たとえば図5は、フィールドを特に指定しない(適合するレコードの全体を表示させる)場合の表示例である。ただ、フィールドの個数があまりに多くなるとかえって検索結果が見づらくなるため、たとえばキー項目を最上位として各フィールドに優先順位を付与し、順位の高いものほど画面左に配置するなどの工夫をしてもよい。この優先順位は、検索条件の入力時や結果一覧の表示時などにユーザに指定させてもよいし、何らかのアルゴリズムで自動的・機械的に決定するようにしてもよい。 In the above-described embodiment, only the key items in the record that meet the search condition are displayed as a list, but any number of fields may be displayed. For example, FIG. 5 shows a display example when the field is not particularly specified (the entire matching record is displayed). However, if the number of fields becomes too large, it will be difficult to see the search results. For example, even if the priority is given to each field with the key item at the top, and the higher the order, the more it will be placed on the left side of the screen. Good. This priority may be specified by the user when inputting search conditions or displaying a result list, or may be determined automatically or mechanically by some algorithm.
なお、上述した実施の形態では、検索対象文書中の表の形式が完全に同一であるため問題はないが、たとえば図6の「測定結果1.jtd」には「電圧」「電流」のほか「メーカー」項目があり、図7の「測定結果2.jtd」には「電圧」「電流」のほか「測定日」項目があるというように、フィールドの一部に共通しないものがある場合は、適合文書のすべて、あるいは少なくともその多くに共通するフィールドの値のみを表示するようにしてもよい。すなわちこの例では、「メーカー」項目や「測定日」項目は無視して、抵抗の値と電流の値のみを結果一覧として表示する。 In the above-described embodiment, there is no problem because the table format in the search target document is completely the same. For example, “measurement result 1.jtd” in FIG. If there is a “Manufacturer” item, and “Measurement result 2.jtd” in FIG. 7 has a “Measurement date” item in addition to “Voltage” and “Current”, and some fields are not common. , Only the values of fields common to all or at least many of the relevant documents may be displayed. That is, in this example, the “manufacturer” item and the “measurement date” item are ignored, and only the resistance value and the current value are displayed as a result list.
以上説明したように、本発明にかかる文書検索装置、文書検索方法、および文書検索プログラムによれば、本文中に表を含む電子文書を対象として検索を実行した場合に、その検索結果をユーザに分かりやすく提示することが可能である。 As described above, according to the document search device, the document search method, and the document search program according to the present invention, when a search is performed on an electronic document including a table in the text, the search result is sent to the user. It can be presented in an easy-to-understand manner.
なお、本実施の形態で説明した文書検索法は、あらかじめ用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク105、フレキシブルディスク107、CD−ROM、CD−RW109、MO、DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネット等のネットワークを介して配布することが可能な伝送媒体であってもよい。
The document search method described in the present embodiment can be realized by executing a program prepared in advance on a computer such as a personal computer or a workstation. This program is recorded on a computer-readable recording medium such as the
以上のように、本発明にかかる文書検索装置、文書検索方法、および文書検索プログラムは、本文中に表を含む電子文書の検索に有用であり、特にユーザが、指定されたデータ(文字列や数値など)を指定されたフィールドに含む文書そのものより、当該データを当該フィールドに含むレコードの、他のフィールドの値を知りたい場合に適している。 As described above, the document search apparatus, the document search method, and the document search program according to the present invention are useful for searching an electronic document including a table in the text. This method is suitable when you want to know the values of other fields in the record that contains the data in the field rather than the document itself that contains the specified field.
100 バス
101 CPU
102 ROM
103 RAM
104 HDD
105 HD
106 FDD
107 FD
108 CD−RWドライブ
109 CD−RW
110 ディスプレイ
111 キーボード
112 マウス
113 ネットワークI/F
114 通信ケーブル
200 オリジナル文書記憶部
201 文書変換部
202 検索対象文書記憶部
203 入出力部
204 文書検索部
205 検索結果集約部
205a レコード抽出部
205b フィールド抽出部
205c 結果一覧作成部
100
102 ROM
103 RAM
104 HDD
105 HD
106 FDD
107 FD
108 CD-
110
114
Claims (9)
複数の電子文書の中から前記指定手段により指定された検索条件に適合する電子文書を検索する検索手段と、
前記検索手段により検索された電子文書から前記データの出現する前記表のレコードを抽出する第1の抽出手段と、
前記第1の抽出手段により抽出されたレコードの特定のフィールドのみを抽出する第2の抽出手段と、
前記第1の抽出手段により抽出されたレコードの、前記第2の抽出手段により抽出されたフィールドの値からなる検索結果一覧を、各当該レコードの各フィールド値が同一のフィールドとなるように、レコードとフィールドからなる表の形式で作成する作成手段と、
を備えることを特徴とする文書検索装置。 A designation means for designating, as a search condition, data that should appear in a table comprising a plurality of records and fields contained in an electronic document
Search means for searching for electronic documents that meet the search conditions specified by the specifying means from among a plurality of electronic documents;
First extraction means for extracting records of the table in which the data appears from the electronic document searched by the search means;
Second extraction means for extracting only a specific field of the record extracted by the first extraction means;
A search result list including the field values extracted by the second extraction means of the records extracted by the first extraction means is recorded so that each field value of each record is the same field. Creation means to create in the form of a table consisting of and fields ;
A document search apparatus comprising:
前記検索手段は、前記変換手段による変換後の複数の電子文書の中から前記指定手段により指定された検索条件に適合する電子文書を検索することを特徴とする前記請求項1に記載の文書検索装置。 And further comprising a conversion means for converting the electronic document into a common format,
2. The document search according to claim 1, wherein the retrieval unit retrieves an electronic document that satisfies a retrieval condition designated by the designation unit from a plurality of electronic documents converted by the conversion unit. apparatus.
前記指定手段が、電子文書中に含まれる複数のレコードとフィールドからなる表に出現すべきデータを検索条件として指定する指定工程と、
前記検索手段が、複数の電子文書の中から前記指定工程で指定された検索条件に適合する電子文書を検索する検索工程と、
前記第1の抽出手段が、前記検索工程で検索された電子文書から前記データの出現する前記第2の抽出手段が、表のレコードを抽出する第1の抽出工程と、
前記が、前記第1の抽出工程で抽出されたレコードの特定のフィールドのみを抽出する第2の抽出工程と、
前記作成手段が、前記第1の抽出工程により抽出されたレコードの、前記第2の抽出工程により抽出されたフィールドの値からなる検索結果一覧を、各当該レコードの各フィールド値が同一のフィールドとなるように、レコードとフィールドからなる表の形式で作成する作成工程と、
を含むことを特徴とする文書検索方法。 A document search method executed by a document search apparatus including a specifying unit, a search unit, a first extraction unit, a second extraction unit, and a creation unit,
A designating step in which the designating unit designates data that should appear in a table composed of a plurality of records and fields included in the electronic document as a search condition;
A search step in which the search means searches for an electronic document that meets a search condition specified in the specification step from a plurality of electronic documents;
It said first extracting means, said second extracting means for occurrences of the data from the electronic documents retrieved by the search step, a first extraction step of extracting a table of records,
A second extraction step for extracting only a specific field of the record extracted in the first extraction step;
The creation means creates a search result list consisting of field values extracted by the second extraction step of the record extracted by the first extraction step, and sets the field value of each record to the same field value. The creation process to create in the form of a table consisting of records and fields ,
A document retrieval method comprising:
前記変換手段が、前記電子文書を共通の形式に変換する変換工程を含み、
前記検索工程では、前記変換工程による変換後の複数の電子文書の中から前記指定工程で指定された検索条件に適合する電子文書を検索することを特徴とする前記請求項4に記載の文書検索方法。 Further, the document creation device includes a conversion unit,
The converting means includes a converting step of converting the electronic document into a common format;
5. The document search according to claim 4 , wherein, in the search step, an electronic document that meets a search condition specified in the specifying step is searched from a plurality of electronic documents converted by the conversion step. Method.
前記指定手段が、電子文書中に含まれる複数のレコードとフィールドからなる表に出現すべきデータを検索条件として指定する指定工程と、 A designating step in which the designating unit designates data that should appear in a table composed of a plurality of records and fields included in the electronic document as a search condition;
前記検索手段が、複数の電子文書の中から前記指定工程で指定された検索条件に適合する電子文書を検索する検索工程と、 A search step in which the search means searches for an electronic document that meets a search condition specified in the specification step from a plurality of electronic documents;
前記第1の抽出手段が、前記検索工程で検索された電子文書から前記データの出現する前記第2の抽出手段が、表のレコードを抽出する第1の抽出工程と、 A first extraction step in which the first extraction means extracts the records of the table by the second extraction means in which the data appears from the electronic document searched in the search step;
前記が、前記第1の抽出工程で抽出されたレコードの特定のフィールドのみを抽出する第2の抽出工程と、 A second extraction step for extracting only a specific field of the record extracted in the first extraction step;
前記作成手段が、前記第1の抽出工程により抽出されたレコードの、前記第2の抽出工程により抽出されたフィールドの値からなる検索結果一覧を、各当該レコードの各フィールド値が同一のフィールドとなるように、レコードとフィールドからなる表の形式で作成する作成工程と、 The creation means creates a search result list consisting of field values extracted by the second extraction step of the record extracted by the first extraction step, and sets the field value of each record to the same field value. The creation process to create in the form of a table consisting of records and fields,
を含むことを特徴とする文書検索プログラム。 A document search program comprising:
前記変換手段が、前記電子文書を共通の形式に変換する変換工程を含み、
前記検索工程では、前記変換工程による変換後の複数の電子文書の中から前記指定工程で指定された検索条件に適合する電子文書を検索することを特徴とする前記請求項7に記載の文書検索プログラム。 Further, the document creation device includes a conversion unit,
The converting means includes a converting step of converting the electronic document into a common format;
8. The document search according to claim 7, wherein, in the search step, an electronic document that meets a search condition specified in the specification step is searched from a plurality of electronic documents converted by the conversion step. program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004032878A JP4480413B2 (en) | 2004-02-10 | 2004-02-10 | Document search device, document search method, and document search program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004032878A JP4480413B2 (en) | 2004-02-10 | 2004-02-10 | Document search device, document search method, and document search program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005227812A JP2005227812A (en) | 2005-08-25 |
JP4480413B2 true JP4480413B2 (en) | 2010-06-16 |
Family
ID=35002510
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004032878A Expired - Lifetime JP4480413B2 (en) | 2004-02-10 | 2004-02-10 | Document search device, document search method, and document search program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4480413B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4536641B2 (en) | 2005-11-02 | 2010-09-01 | ルネサスエレクトロニクス株式会社 | Image blur correction apparatus, image blur correction method, and image blur correction program |
-
2004
- 2004-02-10 JP JP2004032878A patent/JP4480413B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2005227812A (en) | 2005-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2006046523A1 (en) | Document analysis system and document adaptation system | |
JP2009043258A (en) | Method and system for converting data group into structured format | |
US20130262968A1 (en) | Apparatus and method for efficiently reviewing patent documents | |
US7921127B2 (en) | File management apparatus, control method therefor, computer program, and computer-readable storage medium | |
US8612431B2 (en) | Multi-part record searches | |
JP4116601B2 (en) | Taxonomy display device, taxonomy display method, and taxonomy display program | |
JP2008310514A (en) | User operation history acquisition display device, user operation history acquisition display method, user operation history acquisition display program and recording medium recording that program | |
AU2017218166B2 (en) | Method of computerized presentation of a document set view for auditing information and managing sets of multiple documents and pages | |
JP5451696B2 (en) | Subtitle adding apparatus, content data, subtitle adding method and program | |
JP5615593B2 (en) | Electronic document management apparatus, display method, display program, and recording medium | |
JP2006277127A (en) | Method for comparing correction program | |
JP4480413B2 (en) | Document search device, document search method, and document search program | |
JP2005339580A (en) | Document data management device and program | |
JPWO2005098698A1 (en) | Document processing device | |
JPH09245052A (en) | Structured document processor | |
JP2009098829A (en) | Frame retrieval device for cartoon | |
JP4446715B2 (en) | Document search device, document search method, and document search program | |
JP5016333B2 (en) | Document creation support apparatus and document creation support program | |
JP4713098B2 (en) | Selection item display device, selection item display method, and selection item display program | |
JP2005276159A (en) | Device for creating circuit drawing display data, its program, and method for creating circuit drawing display data | |
JP4368550B2 (en) | Document search apparatus, document search method, and program causing computer to execute the method | |
JP2009110506A (en) | Information processing apparatus and information processing program | |
JP2008262324A (en) | Information processor, information processing method and program | |
JP2017068307A (en) | Information retrieval device, control method thereof, and information retrieval program | |
JP2002140345A (en) | Method for supporting generation of component manual |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070209 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091022 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091027 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100202 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100202 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100223 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100316 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130326 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |