JP4480413B2 - Document search device, document search method, and document search program - Google Patents

Document search device, document search method, and document search program Download PDF

Info

Publication number
JP4480413B2
JP4480413B2 JP2004032878A JP2004032878A JP4480413B2 JP 4480413 B2 JP4480413 B2 JP 4480413B2 JP 2004032878 A JP2004032878 A JP 2004032878A JP 2004032878 A JP2004032878 A JP 2004032878A JP 4480413 B2 JP4480413 B2 JP 4480413B2
Authority
JP
Japan
Prior art keywords
search
document
extraction
unit
electronic document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2004032878A
Other languages
Japanese (ja)
Other versions
JP2005227812A (en
Inventor
広樹 谷岡
仁 宇野
Original Assignee
株式会社ジャストシステム
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ジャストシステム filed Critical 株式会社ジャストシステム
Priority to JP2004032878A priority Critical patent/JP4480413B2/en
Publication of JP2005227812A publication Critical patent/JP2005227812A/en
Application granted granted Critical
Publication of JP4480413B2 publication Critical patent/JP4480413B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

この発明は、検索条件に適合する電子文書の一覧を表示画面に表示する文書検索装置、文書検索方法、および文書検索プログラムに関する。   The present invention relates to a document search apparatus, a document search method, and a document search program for displaying a list of electronic documents that meet a search condition on a display screen.

複数の電子文書の中から、ユーザが指定した検索条件に適合するものを検索して、その文書名やファイル名などを検索結果として一覧表示する技術が従来から知られている。そしてこの検索条件としては、文書中に出現する文字列や数値のほか、それらの出現位置まで指定できるものがある。   2. Description of the Related Art Conventionally, a technique for searching a plurality of electronic documents that match a search condition specified by a user and displaying a list of the document names and file names as search results is known. In addition to the character strings and numerical values appearing in the document, there are search conditions that can be specified up to their appearance positions.

たとえば、検索対象文書の本文に複数のレコード(行)とフィールド(列)からなる表が含まれる場合に、あるフィールドの値としてある文字列や数値を含む文書だけを検索することができる。図6に示す「測定結果1.jtd」および図7に示す「測定結果2.jtd」の2つの文書を対象に、「電圧」フィールドに数値「5.0」を含む文書を検索した場合、いずれの文書も上記条件に適合する結果、検索結果一覧は図8に示すようなものとなる。   For example, when a table including a plurality of records (rows) and fields (columns) is included in the body of a search target document, only documents including a certain character string or numerical value as a value of a certain field can be searched. When two documents “measurement result 1.jtd” shown in FIG. 6 and “measurement result 2.jtd” shown in FIG. 7 are searched, a document including a numerical value “5.0” in the “voltage” field is searched. As a result of satisfying the above conditions for any document, the search result list is as shown in FIG.

しかしながら上記従来技術では、図示するように、検索結果一覧には検索条件に適合した文書の文書名やファイル名が列挙されるのみである。したがってたとえば、電圧が5.0Vの抵抗は具体的にはどれであるかを知りたい場合、ユーザは上記一覧中の各文書を逐一オープンして、「電圧」フィールドの値が「5.0」であるレコードを探し出さなければならない。   However, in the conventional technique, as shown in the figure, the search result list only lists document names and file names of documents that meet the search conditions. Thus, for example, if the user wants to know what the resistance is at a voltage of 5.0V, the user opens each document in the above list one by one and the value of the “voltage” field is “5.0”. You have to find the record that is.

すなわち上記のようなケースでは、ユーザの意図はある条件に適合する「文書」の検索というよりは、むしろ複数の文書を横断的に検索して、ある条件に適合する「レコード」を見つけ出すことにあるにもかかわらず、従来技術では当該レコードを含む文書を提示するところまでしかできない、という問題点があった。しかも検索結果一覧中の各文書を閲覧するには、別途ビューアを起動しなければならないことが多く、時間がかかる、煩雑であるなどの問題点もあった。   In other words, in the above case, the user's intention is not to search for “documents” that meet certain conditions, but rather to search multiple documents across to find “records” that meet certain conditions. In spite of this, the conventional technology has a problem that only a document including the record can be presented. In addition, in order to view each document in the search result list, it is often necessary to start a viewer separately, and there are problems such as time consuming and complicated.

この発明は、上述した従来技術による問題点を解消するため、本文中に表を含む電子文書を対象として検索を実行した場合に、その検索結果をユーザに分かりやすく提示することが可能な文書検索装置、文書検索方法、および文書検索プログラムを提供することを目的とする。   In order to solve the above-described problems caused by the prior art, the present invention can provide a user with an easy-to-understand presentation of a search result when a search is performed on an electronic document including a table in the text. An object is to provide an apparatus, a document search method, and a document search program.

上述した課題を解決し、目的を達成するため、この発明にかかる文書検索装置は、電子文書中に出現すべきデータを検索条件として指定する指定手段と、複数の電子文書の中から前記指定手段により指定された検索条件に適合する電子文書を検索する検索手段と、前記検索手段により検索された電子文書から前記データの出現するレコードを抽出する抽出手段と、前記抽出手段により抽出されたレコードの値からなる検索結果一覧を作成する作成手段と、を備えることを特徴とする。 In order to solve the above-described problems and achieve the object, a document search apparatus according to the present invention includes a specifying means for specifying data that should appear in an electronic document as a search condition, and the specifying means from among a plurality of electronic documents. Search means for searching for an electronic document that matches the search condition specified by the search means, an extraction means for extracting a record in which the data appears from the electronic document searched by the search means, and a record of the record extracted by the extraction means Creating means for creating a search result list composed of values.

この発明によれば、ユーザに提示される検索結果一覧では、適合文書中の適合箇所(具体的には、検索条件で指定されたデータが出現するレコードの内容)が一覧表の形に集約される。 According to the present invention, in the search result list presented to the user, the conforming portions in the conforming document (specifically, the contents of the record in which the data specified by the search condition appears) are collected in the form of a list. The

また、この発明にかかる文書検索装置は、上記の発明において、さらに、前記抽出手段により抽出されたレコードの特定のフィールドのみを抽出する第2の抽出手段を備え、前記作成手段は、前記抽出手段により抽出されたレコードの、前記第2の抽出手段により抽出されたフィールドの値からなる検索結果一覧を作成することを特徴とする。 Also, such a document retrieval apparatus in the present invention, in the above invention, further comprising a second extraction means for extracting only specific fields of the extracted record by the extraction means, said creation means, said extracting means A search result list including the field values extracted by the second extraction means of the records extracted by the above is created.

この発明によれば、ユーザに提示される検索結果一覧では、適合文書中の適合箇所(具体的には、検索条件で指定されたデータが出現するレコードの、特定のフィールドの内容)が一覧表の形に集約される。 According to the present invention, in the search result list presented to the user, the conforming portion in the conforming document (specifically, the contents of a specific field of the record in which the data specified by the search condition appears) is listed. It is summarized in the form of

また、この発明にかかる文書検索装置は、上記の発明において、さらに、前記電子文書を共通の形式に変換する変換手段を備え、前記検索手段は、前記変換手段による変換後の複数の電子文書の中から前記指定手段により指定された検索条件に適合する電子文書を検索することを特徴とする。 The document search apparatus according to the present invention further includes a conversion unit that converts the electronic document into a common format in the above-described invention, and the search unit stores a plurality of electronic documents converted by the conversion unit. An electronic document that meets the search conditions specified by the specifying means is searched for.

この発明によれば、様々な形式の電子文書が混在している場合にも、それらに対応する共通形式の電子文書を対象とした、高速かつ漏れのない文書検索が可能である。 According to the present invention, even when various types of electronic documents are mixed, it is possible to perform high-speed and leak-free document searching for common-type electronic documents corresponding to them.

また、この発明にかかる文書検索装置は、上記の発明において、前記作成手段が、前記検索手段により検索された電子文書に対応する、前記変換手段による変換前の電子文書へのリンクを前記検索結果一覧に埋め込むことを特徴とする。 In the document search apparatus according to the present invention, in the above invention, the creation unit displays a link to the electronic document before conversion by the conversion unit corresponding to the electronic document searched by the search unit. It is embedded in the list.

この発明によれば、共通形式の電子文書を対象とした検索であっても、検索結果一覧からは適合文書に対応する元の電子文書を高速かつ効率的に閲覧することが可能である。 According to the present invention, even when a search is performed on an electronic document of a common format, the original electronic document corresponding to the conforming document can be browsed quickly and efficiently from the search result list.

また、この発明にかかる文書検索方法は、電子文書中に出現すべきデータを検索条件として指定する指定工程と、複数の電子文書の中から前記指定工程で指定された検索条件に適合する電子文書を検索する検索工程と、前記検索工程で検索された電子文書から前記データの出現するレコードを抽出する抽出工程と、前記抽出工程で抽出されたレコードの値からなる検索結果一覧を作成する作成工程と、を含むことを特徴とする。 The document retrieval method according to the present invention includes a designation step for designating data that should appear in an electronic document as a retrieval condition, and an electronic document that conforms to the retrieval condition designated in the designation step among a plurality of electronic documents. A search step for searching for data, an extraction step for extracting a record in which the data appears from the electronic document searched for in the search step, and a creation step for creating a search result list comprising the values of the records extracted in the extraction step It is characterized by including these.

この発明によれば、ユーザに提示される検索結果一覧では、適合文書中の適合箇所(具体的には、検索条件で指定されたデータが出現するレコードの内容)が一覧表の形に集約される。 According to the present invention, in the search result list presented to the user, the conforming portions in the conforming document (specifically, the contents of the record in which the data specified by the search condition appears) are collected in the form of a list. The

また、この発明にかかる文書検索方法は、上記の発明において、さらに、前記抽出工程で抽出されたレコードの特定のフィールドのみを抽出する第2の抽出工程を含み、前記作成工程では、前記抽出工程で抽出されたレコードの、前記第2の抽出工程で抽出されたフィールドの値からなる検索結果一覧を作成することを特徴とする。 The document search method according to the present invention further includes a second extraction step of extracting only a specific field of the record extracted in the extraction step in the above-described invention, and the extraction step includes the extraction step. A search result list including the field values extracted in the second extraction step is created for the records extracted in (1).

この発明によれば、ユーザに提示される検索結果一覧では、適合文書中の適合箇所(具体的には、検索条件で指定されたデータが出現するレコードの、特定のフィールドの内容)が一覧表の形に集約される。 According to the present invention, in the search result list presented to the user, the conforming portion in the conforming document (specifically, the contents of a specific field of the record in which the data specified by the search condition appears) is listed. It is summarized in the form of

また、この発明にかかる文書検索方法は、上記の発明において、さらに、前記電子文書を共通の形式に変換する変換工程を含み、前記検索工程では、前記変換工程での変換後の複数の電子文書の中から前記指定工程で指定された検索条件に適合する電子文書を検索することを特徴とする。 The document search method according to the present invention further includes a conversion step of converting the electronic document into a common format in the above invention, and the search step includes a plurality of electronic documents after the conversion in the conversion step. An electronic document that matches the search condition specified in the specifying step is searched from the above.

この発明によれば、様々な形式の電子文書が混在している場合にも、それらに対応する共通形式の電子文書を対象とした、高速かつ漏れのない文書検索が可能である。 According to the present invention, even when various types of electronic documents are mixed, it is possible to perform high-speed and leak-free document searching for common-type electronic documents corresponding to them.

また、この発明にかかる文書検索方法は、上記の発明において、前記作成工程では、前記検索工程で検索された電子文書に対応する、前記変換工程による変換前の電子文書へのリンクを前記検索結果一覧に埋め込むことを特徴とする。 In the document search method according to the present invention, in the above invention, in the creation step, a link to the electronic document before conversion by the conversion step corresponding to the electronic document searched in the search step is displayed in the search result. It is embedded in the list.

この発明によれば、共通形式の電子文書を対象とした検索であっても、検索結果一覧からは適合文書に対応する元の電子文書を高速かつ効率的に閲覧することが可能である。 According to the present invention, even when a search is performed on an electronic document of a common format, the original electronic document corresponding to the conforming document can be browsed quickly and efficiently from the search result list.

また、この発明にかかる文書検索プログラムによれば、上記のいずれか一つに記載された方法をコンピュータに実行させることができる。 Further, according to the document search program according to the present invention, it is possible to cause a computer to execute any one of the methods described above .

本発明にかかる文書検索装置、文書検索方法、および文書検索プログラムによれば、本文中に表を含む電子文書を対象として検索を実行した場合に、その検索結果をユーザに分かりやすく提示することができるという効果を奏する。   According to the document search device, the document search method, and the document search program according to the present invention, when a search is performed on an electronic document including a table in the text, the search result can be presented to the user in an easy-to-understand manner. There is an effect that can be done.

以下に添付図面を参照して、この発明にかかる文書検索装置、文書検索方法、および文書検索プログラムの好適な実施の形態を詳細に説明する。   Exemplary embodiments of a document search apparatus, a document search method, and a document search program according to the present invention will be explained below in detail with reference to the accompanying drawings.

図1は、この発明の実施の形態にかかる文書検索装置のハードウエア構成の一例を示す説明図である。図中、101は装置全体を制御するCPUを、102は基本入出力プログラムなどを記憶したROMを、103はCPU101のワークエリアとして使用されるRAMを、それぞれ示している。   FIG. 1 is an explanatory diagram showing an example of a hardware configuration of a document search apparatus according to an embodiment of the present invention. In the figure, 101 indicates a CPU that controls the entire apparatus, 102 indicates a ROM that stores basic input / output programs, and 103 indicates a RAM that is used as a work area of the CPU 101.

また、104はCPU101の制御にしたがってHD(ハードディスク)105に対するデータのリード/ライトを制御するHDD(ハードディスクドライブ)を、105はHDD104の制御にしたがって書き込まれたデータを記憶するHDを、それぞれ示している。   Reference numeral 104 denotes an HDD (hard disk drive) that controls reading / writing of data with respect to the HD (hard disk) 105 according to the control of the CPU 101, and 105 denotes an HD that stores data written according to the control of the HDD 104. Yes.

また、106はCPU101の制御にしたがってFD(フレキシブルディスク)107に対するデータのリード/ライトを制御するFDD(フレキシブルディスクドライブ)を、107はFDD106の制御にしたがって書き込まれたデータを記憶する着脱自在のFDを、それぞれ示している。   Reference numeral 106 denotes an FDD (flexible disk drive) that controls reading / writing of data with respect to the FD (flexible disk) 107 according to the control of the CPU 101, and 107 denotes a removable FD that stores data written according to the control of the FDD 106. Respectively.

また、108はCPU101の制御にしたがってCD−RW109に対するデータのリード/ライトを制御するCD−RWドライブを、109はCD−RWドライブ108の制御にしたがって書き込まれたデータを記憶する着脱自在のCD−RWを、それぞれ示している。   Reference numeral 108 denotes a CD-RW drive that controls reading / writing of data with respect to the CD-RW 109 according to the control of the CPU 101, and reference numeral 109 denotes a removable CD-ROM that stores data written according to the control of the CD-RW drive 108. RW is shown respectively.

また、110はカーソル、メニュー、ウィンドウ、あるいは文字や画像などの各種データを表示するディスプレイを、111は文字、数値、各種指示などの入力のための複数のキーを備えたキーボードを、112は各種指示の選択や実行、処理対象の選択、マウスポインタの移動などをおこなうマウスを、それぞれ示している。   Reference numeral 110 denotes a cursor, menu, window, or display for displaying various data such as characters and images, 111 denotes a keyboard having a plurality of keys for inputting characters, numerical values, various instructions, and the like, and 112 denotes various types. A mouse that performs selection and execution of an instruction, selection of a processing target, movement of a mouse pointer, and the like is shown.

また、113は通信ケーブル114を介してLANやWANなどのネットワークに接続され、当該ネットワークとCPU101とのインターフェースとして機能するネットワークI/Fを、100は上記各部を接続するためのバスを、それぞれ示している。   Reference numeral 113 denotes a network I / F that is connected to a network such as a LAN or a WAN via a communication cable 114, and functions as an interface between the network and the CPU 101. Reference numeral 100 denotes a bus for connecting the above-described units. ing.

次に、図2はこの発明の実施の形態にかかる文書検索装置の構成を機能的に示す説明図である。図中、200はオリジナル文書記憶部であり、後述する文書変換部201による変換前の文書(以下では「オリジナル文書」と呼ぶ)を複数保持する機能部である。これらオリジナル文書の中には、少なくともその本文の一部に表を含む文書(本文内の表の個数は問わない)が含まれているものとする。なお、これらの文書の形式は何であってもよく、様々な形式の文書が混在しているのであってもよい。   Next, FIG. 2 is an explanatory diagram functionally showing the configuration of the document search apparatus according to the embodiment of the present invention. In the figure, reference numeral 200 denotes an original document storage unit, which is a functional unit that holds a plurality of documents (hereinafter referred to as “original documents”) before conversion by a document conversion unit 201 described later. These original documents include a document including a table in at least a part of its body (the number of tables in the body does not matter). Note that these documents may have any format, and documents of various formats may be mixed.

201は文書変換部であり、オリジナル文書記憶部200内の各文書を、共通の形式、たとえばXML形式に変換する機能部である。文書変換部201は具体的には、上記各文書のそれぞれの形式に対応したXMLコンバータであり、文書変換部201から出力された変換後のXML文書は、検索対象文書記憶部202に保持される。なお、オリジナル文書記憶部200内の変換前のオリジナル文書と、検索対象文書記憶部202内の変換後のXML文書とは、一対一に対応が取れるようになっている(たとえば変換後の文書には、変換前の文書と同一のファイル名を付与する)。   A document conversion unit 201 is a functional unit that converts each document in the original document storage unit 200 into a common format, for example, an XML format. Specifically, the document conversion unit 201 is an XML converter corresponding to each format of each document, and the converted XML document output from the document conversion unit 201 is held in the search target document storage unit 202. . The original document before conversion in the original document storage unit 200 and the converted XML document in the search target document storage unit 202 can be in a one-to-one correspondence (for example, in the converted document). Gives the same file name as the document before conversion).

203は入出力部であり、後述する文書検索部204による検索の基礎となる検索条件の入力などをユーザから受け付けるとともに、後述する検索結果集約部205により作成された検索結果一覧や、当該一覧からリンクされたオリジナル文書の本文などを画面表示する機能部である。   Reference numeral 203 denotes an input / output unit that accepts input of search conditions as a basis of search by a document search unit 204 described later from the user, a search result list created by a search result aggregation unit 205 described later, This is a functional unit that displays the text of the linked original document on the screen.

204は文書検索部であり、検索対象文書記憶部202に保持された、文書変換部201による変換後の各文書の中から、入出力部203で受け付けられた検索条件に適合する文書を検索する機能部である。この文書検索部204は、たとえば文書内の表のあるフィールドにある値を含む文書など、文字列や数値の出現位置まで限定して適合文書を絞り込むことができる。   A document retrieval unit 204 retrieves a document that satisfies the search condition accepted by the input / output unit 203 from each document converted by the document conversion unit 201 held in the search target document storage unit 202. It is a functional part. The document search unit 204 can narrow down the matching documents by limiting to the appearance position of a character string or a numerical value, such as a document including a value in a certain field of a table in the document.

205は検索結果集約部であり、文書検索部204で検索された適合文書を基礎として、図8に示した従来の検索結果一覧の代わりに、図3に示すような検索結果一覧を作成する機能部である。   Reference numeral 205 denotes a search result aggregating unit that functions to create a search result list as shown in FIG. 3 instead of the conventional search result list shown in FIG. 8 on the basis of the conforming document searched by the document search unit 204. Part.

図3の検索結果一覧は、適合文書中の表から、さらに検索条件に適合するレコードを抽出して、そのキー項目(一意な値を有するフィールド)の値を列挙したものである。たとえば「電圧」フィールドに数値「5.0」を含む文書として、図6の「測定結果1.jtd」および図7の「測定結果2.jtd」が得られた(正確には、これらのオリジナル文書に対応するXML文書が得られた)場合、検索結果集約部205はまずそのレコード抽出部205aにより、各文書中の表から「電圧」フィールドに数値「5.0」を含むレコード、この例では「測定結果1.jtd」の「抵抗B」のレコードと、「測定結果2.jtd」の「抵抗D」のレコードとを抽出する。   The search result list in FIG. 3 is a list in which records that match the search conditions are further extracted from the table in the matching document, and the values of the key items (fields having unique values) are listed. For example, “measurement result 1.jtd” in FIG. 6 and “measurement result 2.jtd” in FIG. 7 were obtained as documents including the numerical value “5.0” in the “voltage” field. In the case where an XML document corresponding to the document is obtained), the search result aggregating unit 205 first uses the record extracting unit 205a to record from the table in each document a value including “5.0” in the “voltage” field. Then, a record of “resistance B” of “measurement result 1.jtd” and a record of “resistance D” of “measurement result 2.jtd” are extracted.

次に、検索結果集約部205はそのフィールド抽出部205bにより、上記で抽出されたレコードの指定されたフィールドを抽出する。図3の例では、このフィールドとしてキー項目(のみ)が指定されている結果、上記各レコードのキー項目の値である文字列「抵抗B」および「抵抗D」が抽出される。   Next, the search result aggregation unit 205 uses the field extraction unit 205b to extract the designated field of the record extracted above. In the example of FIG. 3, as a result of the key item (only) being specified as this field, the character strings “resistance B” and “resistance D”, which are the values of the key items of the above records, are extracted.

そして、検索結果集約部205はさらにその結果一覧作成部205cにより、上記で抽出された「抵抗B」や「抵抗D」にその抽出元となった文書(正確には、抽出元となったXML文書に対応するオリジナル文書)の名称である「測定結果1.jtd」や「測定結果2.jtd」を対応づけるとともに、これらに当該各文書へのリンクを埋め込んで、図3のような一覧表を作成する。図中、リンクは下線により表現され、たとえば「測定結果1.jtd」をクリックすることで、ビューアを起動してオリジナル文書記憶部200内の「測定結果1.jtd」の本文を表示させることができる。   Then, the search result aggregating unit 205 further uses the result list creating unit 205c to add the extracted document to “resistor B” and “resistor D” (exactly, the XML that is the source of extraction). A table such as FIG. 3 is created by associating “measurement result 1.jtd” and “measurement result 2.jtd”, which are names of original documents corresponding to the document, and embedding a link to each document. Create In the figure, the link is represented by an underline. For example, by clicking “measurement result 1.jtd”, the viewer is activated to display the text of “measurement result 1.jtd” in the original document storage unit 200. it can.

図4はこの発明の実施の形態にかかる文書検索装置における、文書検索処理の手順を示すフローチャートである。なお、図示する処理の開始に先立って、オリジナル文書記憶部200内の各文書は、文書変換部201によりXML形式に変換されて、検索対象文書記憶部202に保存されているものとする。   FIG. 4 is a flowchart showing the procedure of the document search process in the document search apparatus according to the embodiment of the present invention. Prior to the start of the illustrated process, each document in the original document storage unit 200 is converted to the XML format by the document conversion unit 201 and stored in the search target document storage unit 202.

ユーザからの文書の検索指示の入力を入出力部203が検知すると(ステップS401:Yes)、入出力部203からの指示を受けた文書検索部204は、上記検索指示とともに入力された検索条件に適合する文書を検索対象文書記憶部202から検索する(ステップS402)。   When the input / output unit 203 detects an input of a document search instruction from the user (step S401: Yes), the document search unit 204 that has received the instruction from the input / output unit 203 uses the search condition input together with the search instruction. A suitable document is searched from the search target document storage unit 202 (step S402).

次に、文書検索部204から適合文書を通知された検索結果集約部205は、そのレコード抽出部205aにより、上記各文書中の表から検索条件に適合するレコードを抽出する(ステップS403)。さらにフィールド抽出部205bにより、これらのレコードからあらかじめ指定されたフィールドのみを抽出し(ステップS404)、次に結果一覧作成部205cにより、各フィールドの値と抽出元文書へのリンクからなる検索結果一覧を作成する(ステップS405)。そして、この一覧が検索結果集約部205から入出力部203に引き渡され、図3のように画面表示される(ステップS406)。   Next, the search result aggregating unit 205 notified of the conforming document from the document retrieving unit 204 uses the record extracting unit 205a to extract a record that meets the retrieval condition from the table in each document (step S403). Further, the field extraction unit 205b extracts only the fields designated in advance from these records (step S404), and the result list creation unit 205c then retrieves the search result list including the values of each field and the link to the extraction source document. Is created (step S405). Then, this list is transferred from the search result aggregating unit 205 to the input / output unit 203 and displayed on the screen as shown in FIG. 3 (step S406).

以上説明した実施の形態によれば、文書中の表の、あるフィールドの値としてある文字列や数値を含む文書だけを検索した場合に、検索結果一覧には検索条件に適合するレコードまで(正確には、当該レコードの必要なフィールドの値まで)が詳細に表示される。言い換えれば、適合文書中の適合箇所が一覧表に集約された上で提示されるので、ユーザは従来のように、適合文書を逐一オープンして適合箇所を確認する必要がない。もっとも、適合箇所を逐一確認しなければならない場合にも、結果一覧中にオリジナル文書へのリンクが埋め込まれているので、目的の文書の本文を高速に閲覧することができる。   According to the embodiment described above, when only documents that include a certain character string or numerical value as a value of a certain field in a table in a document are searched, the search result list includes records that match the search condition (exactly Is displayed in detail up to the required field value of the record. In other words, since the conforming parts in the conforming document are presented in a list, the user does not need to open the conforming documents one by one and confirm the conforming part as in the conventional art. Of course, even when it is necessary to check the conforming portions one by one, since the link to the original document is embedded in the result list, the text of the target document can be viewed at high speed.

また、オリジナル文書を直接でなく、それらから変換されたXML文書を対象に検索を行うので、様々な形式の文書を横断的に、高速で漏れのない検索を実行することが可能である。   In addition, since the search is performed not on the original document directly but on the XML document converted from the original document, it is possible to perform a high-speed and leak-free search across various types of documents.

なお、上述した実施の形態では、検索条件に適合するレコード中のキー項目のみを一覧表示したが、表示するフィールドの個数はいくつであってもよい。たとえば図5は、フィールドを特に指定しない(適合するレコードの全体を表示させる)場合の表示例である。ただ、フィールドの個数があまりに多くなるとかえって検索結果が見づらくなるため、たとえばキー項目を最上位として各フィールドに優先順位を付与し、順位の高いものほど画面左に配置するなどの工夫をしてもよい。この優先順位は、検索条件の入力時や結果一覧の表示時などにユーザに指定させてもよいし、何らかのアルゴリズムで自動的・機械的に決定するようにしてもよい。   In the above-described embodiment, only the key items in the record that meet the search condition are displayed as a list, but any number of fields may be displayed. For example, FIG. 5 shows a display example when the field is not particularly specified (the entire matching record is displayed). However, if the number of fields becomes too large, it will be difficult to see the search results. For example, even if the priority is given to each field with the key item at the top, and the higher the order, the more it will be placed on the left side of the screen. Good. This priority may be specified by the user when inputting search conditions or displaying a result list, or may be determined automatically or mechanically by some algorithm.

なお、上述した実施の形態では、検索対象文書中の表の形式が完全に同一であるため問題はないが、たとえば図6の「測定結果1.jtd」には「電圧」「電流」のほか「メーカー」項目があり、図7の「測定結果2.jtd」には「電圧」「電流」のほか「測定日」項目があるというように、フィールドの一部に共通しないものがある場合は、適合文書のすべて、あるいは少なくともその多くに共通するフィールドの値のみを表示するようにしてもよい。すなわちこの例では、「メーカー」項目や「測定日」項目は無視して、抵抗の値と電流の値のみを結果一覧として表示する。   In the above-described embodiment, there is no problem because the table format in the search target document is completely the same. For example, “measurement result 1.jtd” in FIG. If there is a “Manufacturer” item, and “Measurement result 2.jtd” in FIG. 7 has a “Measurement date” item in addition to “Voltage” and “Current”, and some fields are not common. , Only the values of fields common to all or at least many of the relevant documents may be displayed. That is, in this example, the “manufacturer” item and the “measurement date” item are ignored, and only the resistance value and the current value are displayed as a result list.

以上説明したように、本発明にかかる文書検索装置、文書検索方法、および文書検索プログラムによれば、本文中に表を含む電子文書を対象として検索を実行した場合に、その検索結果をユーザに分かりやすく提示することが可能である。   As described above, according to the document search device, the document search method, and the document search program according to the present invention, when a search is performed on an electronic document including a table in the text, the search result is sent to the user. It can be presented in an easy-to-understand manner.

なお、本実施の形態で説明した文書検索法は、あらかじめ用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク105、フレキシブルディスク107、CD−ROM、CD−RW109、MO、DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネット等のネットワークを介して配布することが可能な伝送媒体であってもよい。   The document search method described in the present embodiment can be realized by executing a program prepared in advance on a computer such as a personal computer or a workstation. This program is recorded on a computer-readable recording medium such as the hard disk 105, the flexible disk 107, the CD-ROM, the CD-RW 109, the MO, and the DVD, and is executed by being read from the recording medium by the computer. The program may be a transmission medium that can be distributed via a network such as the Internet.

以上のように、本発明にかかる文書検索装置、文書検索方法、および文書検索プログラムは、本文中に表を含む電子文書の検索に有用であり、特にユーザが、指定されたデータ(文字列や数値など)を指定されたフィールドに含む文書そのものより、当該データを当該フィールドに含むレコードの、他のフィールドの値を知りたい場合に適している。   As described above, the document search apparatus, the document search method, and the document search program according to the present invention are useful for searching an electronic document including a table in the text. This method is suitable when you want to know the values of other fields in the record that contains the data in the field rather than the document itself that contains the specified field.

この発明の実施の形態にかかる文書検索装置のハードウエア構成の一例を示す説明図である。It is explanatory drawing which shows an example of the hardware constitutions of the document search apparatus concerning embodiment of this invention. この発明の実施の形態にかかる文書検索装置の構成を機能的に示す説明図である。It is explanatory drawing which shows functionally the structure of the document search device concerning embodiment of this invention. 検索結果集約部205により作成される検索結果一覧の一例を示す説明図である。It is explanatory drawing which shows an example of the search result list produced by the search result aggregation part. この発明の実施の形態にかかる文書検索装置における、文書検索処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of the document search process in the document search apparatus concerning embodiment of this invention. 検索結果集約部205により作成される検索結果一覧の他の一例を示す説明図である。It is explanatory drawing which shows another example of the search result list produced by the search result aggregation part. 検索対象文書の一例を示す説明図である。It is explanatory drawing which shows an example of a search object document. 検索対象文書の一例を示す説明図である。It is explanatory drawing which shows an example of a search object document. 従来技術において作成・表示される検索結果一覧の一例を示す説明図である。It is explanatory drawing which shows an example of the search result list produced and displayed in a prior art.

符号の説明Explanation of symbols

100 バス
101 CPU
102 ROM
103 RAM
104 HDD
105 HD
106 FDD
107 FD
108 CD−RWドライブ
109 CD−RW
110 ディスプレイ
111 キーボード
112 マウス
113 ネットワークI/F
114 通信ケーブル
200 オリジナル文書記憶部
201 文書変換部
202 検索対象文書記憶部
203 入出力部
204 文書検索部
205 検索結果集約部
205a レコード抽出部
205b フィールド抽出部
205c 結果一覧作成部
100 bus 101 CPU
102 ROM
103 RAM
104 HDD
105 HD
106 FDD
107 FD
108 CD-RW drive 109 CD-RW
110 Display 111 Keyboard 112 Mouse 113 Network I / F
114 communication cable 200 original document storage unit 201 document conversion unit 202 search target document storage unit 203 input / output unit 204 document search unit 205 search result aggregation unit 205a record extraction unit 205b field extraction unit 205c result list creation unit

Claims (9)

電子文書中に含まれる複数のレコードとフィールドからなる表に出現すべきデータを検索条件として指定する指定手段と、
複数の電子文書の中から前記指定手段により指定された検索条件に適合する電子文書を検索する検索手段と、
前記検索手段により検索された電子文書から前記データの出現する前記表のレコードを抽出する第1の抽出手段と、
前記第1の抽出手段により抽出されたレコードの特定のフィールドのみを抽出する第2の抽出手段と、
前記第1の抽出手段により抽出されたレコードの、前記第2の抽出手段により抽出されたフィールドの値からなる検索結果一覧を、各当該レコードの各フィールド値が同一のフィールドとなるように、レコードとフィールドからなる表の形式で作成する作成手段と、
を備えることを特徴とする文書検索装置。
A designation means for designating, as a search condition, data that should appear in a table comprising a plurality of records and fields contained in an electronic document
Search means for searching for electronic documents that meet the search conditions specified by the specifying means from among a plurality of electronic documents;
First extraction means for extracting records of the table in which the data appears from the electronic document searched by the search means;
Second extraction means for extracting only a specific field of the record extracted by the first extraction means;
A search result list including the field values extracted by the second extraction means of the records extracted by the first extraction means is recorded so that each field value of each record is the same field. Creation means to create in the form of a table consisting of and fields ;
A document search apparatus comprising:
さらに、前記電子文書を共通の形式に変換する変換手段を備え、
前記検索手段は、前記変換手段による変換後の複数の電子文書の中から前記指定手段により指定された検索条件に適合する電子文書を検索することを特徴とする前記請求項1に記載の文書検索装置。
And further comprising a conversion means for converting the electronic document into a common format,
2. The document search according to claim 1, wherein the retrieval unit retrieves an electronic document that satisfies a retrieval condition designated by the designation unit from a plurality of electronic documents converted by the conversion unit. apparatus.
前記作成手段は、前記検索手段により検索された電子文書に対応する、前記変換手段による変換前の電子文書へのリンクを前記検索結果一覧に埋め込むことを特徴とする前記請求項に記載の文書検索装置。 3. The document according to claim 2 , wherein the creating unit embeds a link to the electronic document before conversion by the conversion unit corresponding to the electronic document searched by the search unit in the search result list. Search device. 指定手段と、検索手段と、第1の抽出手段と、第2の抽出手段と、作成手段とを備えた文書検索装置が実行する文書検索方法であって、
前記指定手段が、電子文書中に含まれる複数のレコードとフィールドからなる表に出現すべきデータを検索条件として指定する指定工程と、
前記検索手段が、複数の電子文書の中から前記指定工程で指定された検索条件に適合する電子文書を検索する検索工程と、
前記第1の抽出手段が、前記検索工程で検索された電子文書から前記データの出現する前記第2の抽出手段が、表のレコードを抽出する第1の抽出工程と、
前記が、前記第1の抽出工程で抽出されたレコードの特定のフィールドのみを抽出する第2の抽出工程と、
前記作成手段が、前記第1の抽出工程により抽出されたレコードの、前記第2の抽出工程により抽出されたフィールドの値からなる検索結果一覧を、各当該レコードの各フィールド値が同一のフィールドとなるように、レコードとフィールドからなる表の形式で作成する作成工程と、
を含むことを特徴とする文書検索方法。
A document search method executed by a document search apparatus including a specifying unit, a search unit, a first extraction unit, a second extraction unit, and a creation unit,
A designating step in which the designating unit designates data that should appear in a table composed of a plurality of records and fields included in the electronic document as a search condition;
A search step in which the search means searches for an electronic document that meets a search condition specified in the specification step from a plurality of electronic documents;
It said first extracting means, said second extracting means for occurrences of the data from the electronic documents retrieved by the search step, a first extraction step of extracting a table of records,
A second extraction step for extracting only a specific field of the record extracted in the first extraction step;
The creation means creates a search result list consisting of field values extracted by the second extraction step of the record extracted by the first extraction step, and sets the field value of each record to the same field value. The creation process to create in the form of a table consisting of records and fields ,
A document retrieval method comprising:
さらに、前記文書作成装置が変換手段を備え、
前記変換手段が、前記電子文書を共通の形式に変換する変換工程を含み、
前記検索工程では、前記変換工程による変換後の複数の電子文書の中から前記指定工程で指定された検索条件に適合する電子文書を検索することを特徴とする前記請求項に記載の文書検索方法。
Further, the document creation device includes a conversion unit,
The converting means includes a converting step of converting the electronic document into a common format;
5. The document search according to claim 4 , wherein, in the search step, an electronic document that meets a search condition specified in the specifying step is searched from a plurality of electronic documents converted by the conversion step. Method.
前記作成工程では、前記検索工程で検索された電子文書に対応する、前記変換工程による変換前の電子文書へのリンクを前記検索結果一覧に埋め込むことを特徴とする前記請求項に記載の文書検索方法。 6. The document according to claim 5 , wherein in the creation step, a link to the electronic document before conversion by the conversion step corresponding to the electronic document searched in the search step is embedded in the search result list. retrieval method. 指定手段と、検索手段と、第1の抽出手段と、第2の抽出手段と、作成手段とを備えた文書検索装置に実行させる文書検索プログラムであって、A document search program to be executed by a document search apparatus comprising a specifying means, a search means, a first extraction means, a second extraction means, and a creation means,
前記指定手段が、電子文書中に含まれる複数のレコードとフィールドからなる表に出現すべきデータを検索条件として指定する指定工程と、  A designating step in which the designating unit designates data that should appear in a table composed of a plurality of records and fields included in the electronic document as a search condition;
前記検索手段が、複数の電子文書の中から前記指定工程で指定された検索条件に適合する電子文書を検索する検索工程と、  A search step in which the search means searches for an electronic document that meets a search condition specified in the specification step from a plurality of electronic documents;
前記第1の抽出手段が、前記検索工程で検索された電子文書から前記データの出現する前記第2の抽出手段が、表のレコードを抽出する第1の抽出工程と、  A first extraction step in which the first extraction means extracts the records of the table by the second extraction means in which the data appears from the electronic document searched in the search step;
前記が、前記第1の抽出工程で抽出されたレコードの特定のフィールドのみを抽出する第2の抽出工程と、  A second extraction step for extracting only a specific field of the record extracted in the first extraction step;
前記作成手段が、前記第1の抽出工程により抽出されたレコードの、前記第2の抽出工程により抽出されたフィールドの値からなる検索結果一覧を、各当該レコードの各フィールド値が同一のフィールドとなるように、レコードとフィールドからなる表の形式で作成する作成工程と、  The creation means creates a search result list consisting of field values extracted by the second extraction step of the record extracted by the first extraction step, and sets the field value of each record to the same field value. The creation process to create in the form of a table consisting of records and fields,
を含むことを特徴とする文書検索プログラム。  A document search program comprising:
さらに、前記文書作成装置が変換手段を備え、
前記変換手段が、前記電子文書を共通の形式に変換する変換工程を含み、
前記検索工程では、前記変換工程による変換後の複数の電子文書の中から前記指定工程で指定された検索条件に適合する電子文書を検索することを特徴とする前記請求項7に記載の文書検索プログラム。
Further, the document creation device includes a conversion unit,
The converting means includes a converting step of converting the electronic document into a common format;
8. The document search according to claim 7, wherein, in the search step, an electronic document that meets a search condition specified in the specification step is searched from a plurality of electronic documents converted by the conversion step. program.
前記作成工程では、前記検索工程で検索された電子文書に対応する、前記変換工程による変換前の電子文書へのリンクを前記検索結果一覧に埋め込むことを特徴とする前記請求項8に記載の文書検索プログラム。9. The document according to claim 8, wherein in the creation step, a link to the electronic document before conversion by the conversion step corresponding to the electronic document searched in the search step is embedded in the search result list. Search program.
JP2004032878A 2004-02-10 2004-02-10 Document search device, document search method, and document search program Expired - Lifetime JP4480413B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004032878A JP4480413B2 (en) 2004-02-10 2004-02-10 Document search device, document search method, and document search program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004032878A JP4480413B2 (en) 2004-02-10 2004-02-10 Document search device, document search method, and document search program

Publications (2)

Publication Number Publication Date
JP2005227812A JP2005227812A (en) 2005-08-25
JP4480413B2 true JP4480413B2 (en) 2010-06-16

Family

ID=35002510

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004032878A Expired - Lifetime JP4480413B2 (en) 2004-02-10 2004-02-10 Document search device, document search method, and document search program

Country Status (1)

Country Link
JP (1) JP4480413B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4536641B2 (en) 2005-11-02 2010-09-01 ルネサスエレクトロニクス株式会社 Image blur correction apparatus, image blur correction method, and image blur correction program

Also Published As

Publication number Publication date
JP2005227812A (en) 2005-08-25

Similar Documents

Publication Publication Date Title
WO2006046523A1 (en) Document analysis system and document adaptation system
JP2009043258A (en) Method and system for converting data group into structured format
US20130262968A1 (en) Apparatus and method for efficiently reviewing patent documents
US7921127B2 (en) File management apparatus, control method therefor, computer program, and computer-readable storage medium
US8612431B2 (en) Multi-part record searches
JP4116601B2 (en) Taxonomy display device, taxonomy display method, and taxonomy display program
JP2008310514A (en) User operation history acquisition display device, user operation history acquisition display method, user operation history acquisition display program and recording medium recording that program
AU2017218166B2 (en) Method of computerized presentation of a document set view for auditing information and managing sets of multiple documents and pages
JP5451696B2 (en) Subtitle adding apparatus, content data, subtitle adding method and program
JP5615593B2 (en) Electronic document management apparatus, display method, display program, and recording medium
JP2006277127A (en) Method for comparing correction program
JP4480413B2 (en) Document search device, document search method, and document search program
JP2005339580A (en) Document data management device and program
JPWO2005098698A1 (en) Document processing device
JPH09245052A (en) Structured document processor
JP2009098829A (en) Frame retrieval device for cartoon
JP4446715B2 (en) Document search device, document search method, and document search program
JP5016333B2 (en) Document creation support apparatus and document creation support program
JP4713098B2 (en) Selection item display device, selection item display method, and selection item display program
JP2005276159A (en) Device for creating circuit drawing display data, its program, and method for creating circuit drawing display data
JP4368550B2 (en) Document search apparatus, document search method, and program causing computer to execute the method
JP2009110506A (en) Information processing apparatus and information processing program
JP2008262324A (en) Information processor, information processing method and program
JP2017068307A (en) Information retrieval device, control method thereof, and information retrieval program
JP2002140345A (en) Method for supporting generation of component manual

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070209

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091022

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091027

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100202

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100223

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100316

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130326

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150