JP2011039976A - Document storage device and document storage program - Google Patents

Document storage device and document storage program Download PDF

Info

Publication number
JP2011039976A
JP2011039976A JP2009189180A JP2009189180A JP2011039976A JP 2011039976 A JP2011039976 A JP 2011039976A JP 2009189180 A JP2009189180 A JP 2009189180A JP 2009189180 A JP2009189180 A JP 2009189180A JP 2011039976 A JP2011039976 A JP 2011039976A
Authority
JP
Japan
Prior art keywords
document
importance
internal
database
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009189180A
Other languages
Japanese (ja)
Other versions
JP5281516B2 (en
Inventor
Yukio Uematsu
幸生 植松
Yoshihiko Kazuhara
良彦 数原
Ryoji Kataoka
良治 片岡
Takashi Inoue
孝史 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2009189180A priority Critical patent/JP5281516B2/en
Publication of JP2011039976A publication Critical patent/JP2011039976A/en
Application granted granted Critical
Publication of JP5281516B2 publication Critical patent/JP5281516B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To efficiently hold information of an input document by reducing columns for the degree of importance of the document in a database. <P>SOLUTION: In a document storage device 1, an index reference part 2 gives an internal identifier, based on the degree of importance of each document, for a document identifier of the document in an input document group, and stores identifiers of respective documents in a database 7 in accordance with an array based on values of the given internal identifier. The index reference part 2 includes: an internal ID giving means 4 for giving internal identifiers based on degrees of importance of respective documents, for identifiers of respective documents in the input document group; and a document storing means 5 for storing identifiers of respective documents in the database 7 in accordance with the array based on value of the given internal identifiers. Furthermore, the index reference part 2 includes an importance degree assigning means 3 for rearranging identifiers of respective documents of the input document group on the basis of degrees of importance of the respective documents. Also, the internal ID giving means 4 calculates the value of the degree of importance on the basis of the value of the internal identifier. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、文書に対する重要度を格納するデータベース分野に属し、特に文書検索に主に用いられる技術に関する。   The present invention belongs to the field of databases that store the importance of documents, and particularly relates to a technique mainly used for document retrieval.

文書に対する重要度とは、文書を取得する際にその文書のランキングに用いられる値のことで、通常は一文書に対して一つの値を設定することができる。ある文書に付与された重要度を保存する従来技術としてはISAM(Indexed Sequential Access Method)がある(非特許文献1)。ISAMでは,主キーとなる文書から内部識別子(以下、内部ID)を参照し,その内部IDの値をキーとして内部IDが対応する所望の値を取得する。   The importance level for a document is a value used for ranking the document when the document is acquired. Usually, one value can be set for one document. As a conventional technique for storing the importance assigned to a document, there is an ISAM (Indexed Sequential Access Method) (Non-patent Document 1). In ISAM, an internal identifier (hereinafter referred to as an internal ID) is referred to from a document serving as a primary key, and a desired value corresponding to the internal ID is obtained using the internal ID value as a key.

図6を参照しながら従来技術に係る文書格納装置10について説明する。図6に示された文書格納装置10はインデックス参照部11を備える。インデックス参照部11は少なくとも内部ID付与手段12と文書格納手段13とを有する。内部ID付与手段12は文書入力部14を介して入力された文書の識別子(以下、文書ID)に対して内部ID(例えば「1」)を付与する。文書格納手段13は少なくとも文書ID「文書A」に対応した入力文書の重要度をデータベース15における当該入力文書の重要度のカラムに格納させる機能を有する。   A document storage device 10 according to the prior art will be described with reference to FIG. The document storage device 10 shown in FIG. 6 includes an index reference unit 11. The index reference unit 11 includes at least an internal ID assigning unit 12 and a document storage unit 13. The internal ID assigning means 12 assigns an internal ID (for example, “1”) to the document identifier (hereinafter, document ID) input via the document input unit 14. The document storage unit 13 has a function of storing at least the importance level of the input document corresponding to the document ID “document A” in the importance level column of the input document in the database 15.

図7に例示されたデータベース15における先頭の主キーのカラムには「文書n」が格納されている。「文書n」は入力された文書に付与された識別子である。また、データベース15には「内部ID」のカラムが設けられている。「内部ID」は入力された文書群の各文書の文書IDに対して当該各文書の入力順に割り付けられた識別子である。例えば、文書ID「文書B」は内部ID「3」に割り付けられている。その内部IDによって、所望の値を取得できる。図中の例で説明すると、内部ID「3」を利用して3列目のデータにアクセスし、重要度の値「0.6」や更新日時「123491588」を取得できる。   “Document n” is stored in the first primary key column in the database 15 illustrated in FIG. “Document n” is an identifier assigned to the input document. The database 15 has a column of “internal ID”. “Internal ID” is an identifier assigned to the document ID of each document in the input document group in the order of input of each document. For example, the document ID “Document B” is assigned to the internal ID “3”. A desired value can be acquired by the internal ID. In the example in the figure, the data in the third column can be accessed using the internal ID “3”, and the importance value “0.6” and the update date “123491588” can be acquired.

図7及び図8を参照しながらデータベース15の作成手順について説明する。   A procedure for creating the database 15 will be described with reference to FIGS.

S001:インデックス参照部11に対して初期内部IDiの値として「1」が設定される。   S001: “1” is set as the value of the initial internal IDi for the index reference unit 11.

S002:インデックス参照部11は文書入力部14から入力された文書のIDと重要度の値の入力を受ける。具体的には、入力された文書に対する文書IDとして例えば「文書A」が、当該文書の重要度の値として「0.8」がインデックス参照部11に入力される。   S002: The index reference unit 11 receives the document ID and importance value input from the document input unit 14. Specifically, for example, “document A” is input to the index reference unit 11 as the document ID for the input document, and “0.8” is input as the importance value of the document.

S003:内部ID付与手段12は前記入力された文書のIDに対して初期内部IDを付与する。内部ID付与手段12は具体的に例えばデータベース15におけるID「文書A」に対応した初期内部IDのカラムに初期内部IDの値「1」を入力する。   S003: The internal ID assigning means 12 assigns an initial internal ID to the input document ID. Specifically, the internal ID assigning means 12 inputs the initial internal ID value “1” into the column of the initial internal ID corresponding to the ID “document A” in the database 15, for example.

S004:文書格納手段13は前記付与された初期内部IDを利用して重要度をデータベース15にストアする。文書格納手段13は具体的に例えば図7のデータベース15の末尾に追加されたカラムに重要度の値として「0.8」を格納する。   S004: The document storage unit 13 stores the importance in the database 15 using the assigned initial internal ID. Specifically, the document storage unit 13 stores “0.8” as the importance value in a column added to the end of the database 15 in FIG.

S005:インデックス参照部11は次の入力文書が存在するかどうかをチェックする。例えば図7に示したように文書ID「文書C」が存在すれば、S006に処理に移行する。   S005: The index reference unit 11 checks whether or not the next input document exists. For example, as shown in FIG. 7, if the document ID “document C” exists, the process proceeds to S006.

S006:インデックス参照部11は内部IDiに「1」を追加して、S002からの処理を繰り返す。例えば、この処理の過程におけるS005では、前記「1」が追加された内部IDを利用して重要度(例えば0.9)をデータベース15にストアする。S005で次の文書が無くなれば終了する。   S006: The index reference unit 11 adds “1” to the internal IDi and repeats the processing from S002. For example, in S005 in the course of this process, the importance (for example, 0.9) is stored in the database 15 using the internal ID to which “1” is added. If there is no next document in S005, the process ends.

酒井法雄、“データベース再入門:データベースの基本構造を理解しよう”、[online]、1997年12月、int21 Corporation、[2009年7月8日検索]、URL:http://www.int21.co.jp/pcdn/vb/noriolib/vbmag/9712/rdbms/Norio Sakai, “Introduction to Databases: Let's Understand the Basic Structure of Databases” [online], December 1997, int21 Corporation, [Search July 8, 2009], URL: http: // www. int21. co. jp / pcdn / vb / noriolib / vbmag / 9712 / rdbms /

前述した従来技術のようなリレーショナルデータベースの場合、ある文書に付与された重要度が1つの値に集約された場合、効率的に格納、参照ができないという課題がある。Webの文書などでは重要度を1つに集約することが可能であるため、ISAMのようなデータ構造の場合、空間効率やアクセス速度が遅いという問題点がある。   In the case of the relational database as in the conventional technique described above, there is a problem that when the importance assigned to a certain document is aggregated into one value, it cannot be efficiently stored and referenced. In the case of a Web document or the like, it is possible to consolidate the importance into one. Therefore, in the case of a data structure such as ISAM, there is a problem that space efficiency and access speed are slow.

前記課題を解決するための本発明は文書毎に付与される内部識別子に重要度の意味を持たせることで、データベースの別のカラムにアクセスすることなく高速な参照を可能にする。また、重要度を格納するためのカラムが低減し、データベースの空間効率が向上する。   The present invention for solving the above-mentioned problems enables high-speed reference without accessing another column of the database by giving the meaning of importance to the internal identifier assigned to each document. In addition, the number of columns for storing the importance is reduced, and the space efficiency of the database is improved.

本発明の文書格納装置の態様としては、入力された文書の識別子をデータベースに格納させる文書格納装置であって、入力された文書群の各文書の文書識別子に対して当該各文書の重要度に基づく内部識別子を付与し、この付与された内部識別子の値に基づく配列で前記各文書の識別子をデータベースに格納させるインデックス参照手段を備える。   An aspect of the document storage device of the present invention is a document storage device that stores an identifier of an input document in a database, and the importance of each document with respect to the document identifier of each document of the input document group. Index reference means for assigning an internal identifier based on the ID and storing the identifier of each document in a database in an array based on the value of the assigned internal identifier.

本発明は、上記文書格納装置を構成する手段としてコンピュータを機能させる文書格納プログラムの態様とすることができる。   The present invention can be in the form of a document storage program that causes a computer to function as means for configuring the document storage device.

以上の発明によればデータベースにおける文書の重要度のカラムが低減し効率的に入力文書の情報を保持できる。   According to the above invention, the document importance column in the database is reduced, and the input document information can be efficiently held.

発明の実施形態に係る文書格納装置の構成図。The block diagram of the document storage apparatus which concerns on embodiment of invention. 実施形態1に係る文書格納装置によって作成されたデータベースの一例。3 is an example of a database created by the document storage device according to the first embodiment. 実施形態1に係る文書格納装置によるデータベースの作成手順を説明したフローチャート。6 is a flowchart for explaining a database creation procedure by the document storage device according to the first embodiment. 実施形態2に係る文書格納装置によって作成されたデータベースの一例。An example of a database created by the document storage device according to the second embodiment. 実施形態2に係る文書格納装置によるデータベースの作成手順を説明したフローチャート。9 is a flowchart for explaining a database creation procedure by the document storage device according to the second embodiment. 従来技術に係る文書格納装置の構成図。The block diagram of the document storage apparatus which concerns on a prior art. 従来技術に係る文書格納装置によって作成されたデータベースの一例。An example of the database produced by the document storage apparatus which concerns on a prior art. 従来技術に係る文書格納装置によるデータベースの作成手順を説明したフローチャート。The flowchart explaining the creation procedure of the database by the document storage apparatus concerning a prior art.

本発明は、文書IDに対して内部IDを付与する際に内部IDに重要度の意味も付与することで、ISAMなどのインデックスを利用すること無く参照でき、かつデータをストアするストレージの削減を実現させる。   In the present invention, when an internal ID is assigned to a document ID, the meaning of importance is also given to the internal ID, so that it can be referred to without using an index such as ISAM, and storage for storing data can be reduced. make it happen.

本発明の実施形態1に係る文書格納装置1は図1に示したようにインデックス参照部2を備える。インデックス参照部2は文書入力部6からの文書の入力を受ける。また、インデックス参照部2はデータベース7に対してアクセス可能となっている。データベース7は少なくとも文書入力部6を介して入力された文書の文書ID(文書識別子)を主キーとして格納している。尚、前記入力された文書及びデータベース7は図示省略されたハードディスク装置、サーバ装置に例示される記憶手段に保存される。   The document storage device 1 according to the first embodiment of the present invention includes an index reference unit 2 as shown in FIG. The index reference unit 2 receives a document input from the document input unit 6. Further, the index reference unit 2 can access the database 7. The database 7 stores at least a document ID (document identifier) of a document input via the document input unit 6 as a main key. The input document and the database 7 are stored in a storage unit exemplified by a hard disk device and a server device (not shown).

インデックス参照部2は、文書入力部6によって入力された文書群の各文書の文書IDに対して当該各文書の重要度に基づく内部ID(内部識別子)を付与し、この付与された内部IDの値に基づく配列で前記各文書の文書IDをデータベース7に格納させる。   The index reference unit 2 assigns an internal ID (internal identifier) based on the importance of each document to the document ID of each document of the document group input by the document input unit 6, and the assigned internal ID The document ID of each document is stored in the database 7 in an array based on the values.

インデックス参照部2は具体的には図1に示されたように重要度割り付け手段3と内部ID付与手段4と文書格納手段5の機能を有する。重要度割り付け手段3は文書入力部6を介して入力された各文書の文書IDを当該各文書の重要度に基づき並び替える。内部ID付与手段4は前記各文書の文書IDに対して当該各文書の重要度に基づく内部IDを付与する。また、内部ID付与手段4は前記内部IDの値に基づき前記重要度の値を算出する機能を有する。文書格納手段5は前記付与された内部IDの値に基づく配列で前記各文書のIDをデータベース7に格納する。   Specifically, the index reference unit 2 has functions of an importance level assigning means 3, an internal ID assigning means 4, and a document storing means 5 as shown in FIG. The importance level assigning means 3 rearranges the document IDs of the documents input via the document input unit 6 based on the importance levels of the respective documents. The internal ID assigning unit 4 assigns an internal ID based on the importance of each document to the document ID of each document. The internal ID assigning means 4 has a function of calculating the importance value based on the internal ID value. The document storage means 5 stores the ID of each document in the database 7 in an array based on the assigned internal ID value.

図2を参照しながら本実施形態の文書格納装置1によって作成されたデータベース7の一例について説明する。   An example of the database 7 created by the document storage device 1 of this embodiment will be described with reference to FIG.

本発明に係る文書格納装置1と従来技術に係る文書格納装置10との違いは、入力された文書の重要度のカラムをデータベースに保持させずに、当該文書の重要度を内部IDに割り付けていることである。   The difference between the document storage device 1 according to the present invention and the document storage device 10 according to the prior art is that the importance level of the input document is assigned to the internal ID without holding the importance level column of the document in the database. It is that you are.

従来技術では内部IDを文書の入力順に付与していたが、本発明に係る文書格納装置1では、内部IDを予め文書の重要度順に割り付け、これに基づき文書IDを並べ替えることによって前記文書IDに対応した文書の情報を格納している。図2に示された事例では重要度が「1.0」と最も高い文書の文書IDが内部ID「1」に割り付けられている。   In the prior art, internal IDs are assigned in the order of document input. However, in the document storage device 1 according to the present invention, the internal IDs are assigned in advance in order of importance of the documents, and the document IDs are rearranged based on the internal IDs. The document information corresponding to is stored. In the example shown in FIG. 2, the document ID of the document having the highest importance “1.0” is assigned to the internal ID “1”.

図3を参照しながら本実施形態の文書格納装置1が図2のデータベース7を作成するための手順(S101〜S107)について説明する。   A procedure (S101 to S107) for creating the database 7 of FIG. 2 by the document storage device 1 of the present embodiment will be described with reference to FIG.

前述の従来技術に係る手順(S001〜S006)との唯一の違いはS102において、重要度割り付け手段3が入力された各文書の文書IDを各文書の重要度の順に並べ替えている点である。これにより、内部IDが重要度の高い文書順に付与され、重要度の値を格納するカラムを余分に確保することなく重要度の相対的な大きさを保存することができる。尚、本実施形態の方式は重要度そのものの値を得るものではない。   The only difference from the above-described prior art procedure (S001 to S006) is that in S102, the document ID of each document to which the importance level assigning means 3 is input is rearranged in the order of importance of each document. . As a result, the internal IDs are assigned in order of the documents having the highest importance, and the relative magnitude of the importance can be preserved without securing an extra column for storing the importance value. Note that the method of the present embodiment does not obtain the value of the importance level itself.

S101:インデックス参照部2において初期内部IDiとして「1」が設定される。   S101: The index reference unit 2 sets “1” as the initial internal IDi.

S102:重要度割り付け手段3は文書入力部5によって入力された各文書の文書IDを各文書の重要度順に並べ替える。   S102: The importance level assigning means 3 rearranges the document IDs of the documents input by the document input unit 5 in the order of importance of each document.

S103:インデックス参照部2は並びかえられた文書の文書IDと当該文書の重要度とをデータベース7に入力する。例えば、入力された文書の文書IDとして「文書D」がデータベース7の主キーのカラムに入力され、当該文書の重要度の値として「1.0」がデータベース7の前記カラムと同列のカラムに入力される。   S103: The index reference unit 2 inputs the document ID of the rearranged document and the importance of the document to the database 7. For example, “Document D” is input to the primary key column of the database 7 as the document ID of the input document, and “1.0” is input to the column in the same row as the column of the database 7 as the importance value of the document. Entered.

S104:内部ID付与手段4はデータベース7の文書IDに対して前記設定された初期内部IDiを付与する。例えば図2に示したようにデータベース7における文書ID「文書D」のアラムと同列のカラムに初期内部IDiとして「1」が付与される。   S104: The internal ID assigning means 4 assigns the set initial internal IDi to the document ID in the database 7. For example, as shown in FIG. 2, “1” is assigned as the initial internal IDi to a column in the same column as the alum of the document ID “document D” in the database 7.

S105:文書格納手段5は前記付与された初期内部IDiを利用して重要度「1.0」をデータベース7にストアする。また、そのときの更新日時がデータベース7のカラムに記録される。   S105: The document storage means 5 stores the importance “1.0” in the database 7 using the assigned initial internal IDi. Further, the update date and time at that time is recorded in the column of the database 7.

S106:インデックス参照部2は文書入力部6から供された次の文書が存在するかどうかをチェックする。次の文書が存在すれば、例えば図7に示されたように識別子を「文書C」とする文書が存在すれば、S106に処理に移行する。   S106: The index reference unit 2 checks whether or not the next document provided from the document input unit 6 exists. If the next document exists, for example, as shown in FIG. 7, if there is a document with the identifier “document C”, the process proceeds to S106.

S107:インデックス参照部2は内部IDiに「1」を追加して、S103からの処理を繰り返す。例えば、この処理の過程におけるS105では、前記「1」が追加された内部IDiを利用して重要度の値をデータベース7にストアする。例えば文書ID「文書B」に付与された内部IDiとして「2」が利用されて重要度の値として「0.9」がデータベース7にストアされる。S106で次の文書が無いと判断されると処理を終了する。   S107: The index reference unit 2 adds “1” to the internal IDi and repeats the processing from S103. For example, in S105 in the course of this process, the importance value is stored in the database 7 using the internal IDi to which “1” is added. For example, “2” is used as the internal IDi assigned to the document ID “document B”, and “0.9” is stored in the database 7 as the importance value. If it is determined in S106 that there is no next document, the process is terminated.

以上のように実施形態1の文書格納装置1によれば、内部IDを割り付ける際に重要度を考慮することで、内部IDから文書IDの相対的な大きさを得ることができる。また、重要度のカラムが削減されて、効率的に情報を保持することができる。以上のように文書データに対して付与された重要度を効率的に保持できる。   As described above, according to the document storage device 1 of the first embodiment, the relative size of the document ID can be obtained from the internal ID by considering the importance when allocating the internal ID. In addition, the importance column is reduced, and information can be held efficiently. As described above, the importance assigned to the document data can be efficiently held.

次いで本発明の実施形態2に係る文書格納装置1によるデータベースの作成手順について説明する。実施形態2で作成されたデータベース8の例を図4に示した。   Next, a database creation procedure by the document storage device 1 according to the second embodiment of the present invention will be described. An example of the database 8 created in the second embodiment is shown in FIG.

実施形態2と従来技術との違いは実施形態1と同様に重要度毎に内部IDが割り付けられている点である。この例では重要度1.0に対して内部IDとして1〜10が、重要度0.9に対して内部IDとして11〜20が割り付けられている。また、実施形態2では、内部IDをある所定の値で除算した結果を利用して重要度を取得できるようになっている。これにより、文書IDを格納するデータベースから当該文書IDに係る文書の重要度の絶対値を取得することが可能である。   The difference between the second embodiment and the prior art is that an internal ID is assigned for each importance as in the first embodiment. In this example, 1 to 10 are assigned as internal IDs for importance 1.0, and 11 to 20 are assigned as internal IDs for importance 0.9. In the second embodiment, the importance can be acquired by using the result obtained by dividing the internal ID by a predetermined value. Thereby, it is possible to acquire the absolute value of the importance of the document related to the document ID from the database storing the document ID.

図4及び図5を参照しながら実施形態2に係るデータベースを作成する手順(S201〜S209)について説明する。   A procedure (S201 to S209) for creating a database according to the second embodiment will be described with reference to FIGS.

S201:重要度割り付け手段3は文書入力部6を介してインデックス参照部2内に入力された文書群とその各文書の重要度から有効桁数Nを調べる。例えば重要度が0から0.1刻みで1までの場合は、有効桁数Nは10になる。   S201: The importance level assigning means 3 checks the number of significant digits N from the document group input into the index reference unit 2 via the document input unit 6 and the importance level of each document. For example, when the importance is from 0 to 1 in increments of 0.1, the number of significant digits N is 10.

S202:重要度割り付け手段3は前記入力された文書群において同じ重要度の最大頻度Mを算出する。例えば入力された文書集合中に0.1という重要度が最も多くの文書がある場合、その文書の個数Mを数える。このMは同じ重要度の最大頻度以上であれば任意の値を設定できる。   S202: The importance level assigning means 3 calculates the maximum frequency M of the same importance level in the input document group. For example, if there is a document having the highest importance of 0.1 in the input document set, the number M of the documents is counted. This M can be set to any value as long as it is greater than or equal to the maximum frequency of the same importance.

S203:重要度割り付け手段3は前記入力された文書群の各文書の識別子を各文書の重要度順に並べかえる。URLの順番に意味が無い場合は並べ替える必要はない。   S203: The importance level assigning means 3 sorts the identifiers of the documents in the input document group in the order of importance of the documents. If the URL order is meaningless, there is no need to rearrange.

S204:インデックス参照部2において各重要度の内部IDを保存するための初期配列の値が設定される。例えば、各初期配列の値は「1」と初期化される。   S204: The index reference unit 2 sets an initial array value for storing the internal ID of each importance level. For example, the value of each initial array is initialized to “1”.

S205:インデックス参照部2は入力された最初の文書の文書IDと当該文書の重要度の値を調べる。   S205: The index reference unit 2 checks the document ID of the input first document and the importance value of the document.

S206:内部ID付与手段4はS205で得られた重要度の値から下記の式(1)で示された演算式によって算出した内部IDの値をベータベース8のカラムにセットする。
内部ID=(1−重要度)×N×M+i[(1−重要度)×N] …(1)
S207:文書格納手段5はS206での式(1)によって得られた内部IDの値が格納されたベータベース8のカラムと同列のカラムに文書IDを格納する。
S206: The internal ID assigning means 4 sets the value of the internal ID calculated from the importance value obtained in S205 by the arithmetic expression shown in the following formula (1) in the beta base 8 column.
Internal ID = (1−importance) × N × M + i [(1−importance) × N] (1)
S207: The document storage unit 5 stores the document ID in the same column as the beta base 8 column in which the value of the internal ID obtained by the expression (1) in S206 is stored.

S208:インデックス参照部2は式(1)のi[(1−重要度)×N]の値に1を加える。   S208: The index reference unit 2 adds 1 to the value of i [(1-importance) × N] in the equation (1).

S209:インデックス参照部2は文書入力部6から供された他に文書が無いかを調べ、ある場合はS205からの処理を繰り返す。   S209: The index reference unit 2 checks whether there is any other document provided from the document input unit 6, and if there is, repeats the processing from S205.

次に、S201〜S209のステップで作成された図4に例示のデータベース8からの特定の文書の重要度の算出方法について説明する。   Next, a method for calculating the importance of a specific document from the database 8 illustrated in FIG. 4 created in steps S201 to S209 will be described.

文書の重要度の値は内部ID付与手段4によって算出される。図4のデータベース8においては、N=10、M=10に設定されている。例えば、文書IDが文書Eである文書の重要度を取得しようとすると、文書Eに係る内部IDの値は「12」なので、この値をM(=10)で割ると、12÷10=1余り2となる。この算出された値「1」は(1)式の右辺第一項「(1−重要度)×N」に相当する。一方、余りの値「2」は、(1)式の右辺第2項「i[(1−重要度)×N]」の値であって、初期配列の値「1」に対して「1」が加算された値に相当する。ゆえに、重要度の値は、式(1)の右辺第一項に基づくNを算出するための方程式「(1−重要度)×N=1」を解くと「重要度=1−1÷N=1−1÷10」の演算によって「0.9」と算出される。以上のように内部IDの値「12」から当該内部IDに係る文書の重要度の値として「0.9」が取得される。   The importance value of the document is calculated by the internal ID assigning means 4. In the database 8 of FIG. 4, N = 10 and M = 10 are set. For example, when the importance of a document whose document ID is document E is to be acquired, the value of the internal ID related to document E is “12”, and when this value is divided by M (= 10), 12 ÷ 10 = 1. The remainder is 2. This calculated value “1” corresponds to the first term “(1−importance) × N” on the right side of equation (1). On the other hand, the remainder value “2” is the value of the second term “i [(1−importance) × N]” on the right side of equation (1), and is “1” with respect to the value “1” of the initial array. "Corresponds to the added value. Therefore, the importance value is calculated by solving the equation “(1−importance) × N = 1” for calculating N based on the first term on the right side of the equation (1). = 0.9 is calculated by the calculation of “= 1−1 ÷ 10”. As described above, “0.9” is acquired as the importance value of the document related to the internal ID from the internal ID value “12”.

したがって、実施形態2に係る文書格納装置1によれば実施形態1に係る文書格納装置1の効果に加えて内部IDから文書IDの絶対値を得ることができる。   Therefore, according to the document storage device 1 according to the second embodiment, the absolute value of the document ID can be obtained from the internal ID in addition to the effects of the document storage device 1 according to the first embodiment.

以上説明した本発明の実施形態1,2に係る文書格納装置1に係る機能手段2〜8は、コンピュータのハードウェアリソース、例えばCPU、メモリ(RAM)、ハードディスク装置、通信デバイス等によって構成できる。すなわち、機能手段2〜8はCPUとプログラムとの協働によって実現できる。また、機能手段7,8はハードディスク装置やサーバ装置に例示される記録手段に格納すればよい。   The functional units 2 to 8 related to the document storage apparatus 1 according to the first and second embodiments of the present invention described above can be configured by computer hardware resources such as a CPU, a memory (RAM), a hard disk device, a communication device, and the like. That is, the function units 2 to 8 can be realized by cooperation between the CPU and the program. The functional means 7 and 8 may be stored in a recording means exemplified by a hard disk device or a server device.

さらに、本発明は、上述の実施形態に係る機能手段2〜6をコンピュータに実現させる文書格納プログラムまたはこれを記録したコンピュータ読み取り可能な記録媒体の態様としてコンピュータのCPU(MPU)が当該プログラムを読み出し実行することで実現できる。その場合、記録媒体から読み出されたプログラム自体が上述した実施の形態の機能を実現することになり、そのプログラムを記憶した記録媒体、例えばCD−ROM、DVD−ROM、CD−R、MO、HDD等は本発明を構成する。   Furthermore, the present invention provides a computer storage unit (MPU) that reads out the program as a document storage program that causes a computer to implement the functional units 2 to 6 according to the above-described embodiments or a computer-readable recording medium that records the program. It can be realized by executing. In that case, the program itself read from the recording medium realizes the functions of the above-described embodiment, and a recording medium storing the program, for example, a CD-ROM, DVD-ROM, CD-R, MO, An HDD or the like constitutes the present invention.

1…文書格納装置
2…インデックス参照部(インデックス参照手段)
3…重要度割り付け手段
4…内部ID付与手段(内部識別子付与手段)
5…文書格納手段
7,8…データベース
DESCRIPTION OF SYMBOLS 1 ... Document storage apparatus 2 ... Index reference part (index reference means)
3 ... Importance assigning means 4 ... Internal ID assigning means (internal identifier assigning means)
5 ... Document storage means 7, 8 ... Database

Claims (5)

入力された文書の識別子をデータベースに格納させる文書格納装置であって、
入力された文書群の各文書の文書識別子に対して当該各文書の重要度に基づく内部識別子を付与し、この付与された内部識別子の値に基づく配列で前記各文書の識別子をデータベースに格納させるインデックス参照手段を備えたこと
を特徴とする文書格納装置。
A document storage device for storing an input document identifier in a database,
An internal identifier based on the importance of each document is assigned to the document identifier of each document in the input document group, and the identifier of each document is stored in the database in an array based on the value of the assigned internal identifier. A document storage device comprising index reference means.
前記インデックス参照手段は、
入力された文書群の各文書の識別子に対して当該各文書の重要度に基づく内部識別子を付与する内部識別子付与手段と、
前記付与された内部識別子の値に基づく配列で前記各文書の識別子を前記データベースに格納させる文書格納手段と
を備えたこと
を特徴とする請求項1に記載の文書格納装置。
The index reference means includes
An internal identifier giving means for giving an internal identifier based on the importance of each document to the identifier of each document in the input document group;
The document storage device according to claim 1, further comprising: a document storage unit that stores the identifier of each document in the database in an array based on the value of the assigned internal identifier.
前記インデックス参照手段は、
入力された文書群の各文書の識別子を当該各文書の重要度に基づき並び替える重要度割り付け手段をさらに備えたこと
を特徴とする請求項2に記載の文書格納装置。
The index reference means includes
3. The document storage device according to claim 2, further comprising importance level assigning means for rearranging the identifiers of the documents of the input document group based on the importance levels of the respective documents.
前記内部識別子付与手段は前記内部識別子の値に基づき前記重要度の値を算出すること
を特徴とする請求項2または3に記載の文書格納装置。
4. The document storage device according to claim 2, wherein the internal identifier assigning unit calculates the importance value based on the internal identifier value.
請求項1から4のいずれか1項に記載の文書格納装置を構成する手段としてコンピュータを機能させるための文書格納プログラム。   A document storage program for causing a computer to function as means for constituting the document storage device according to claim 1.
JP2009189180A 2009-08-18 2009-08-18 Document storage device and document storage program Expired - Fee Related JP5281516B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009189180A JP5281516B2 (en) 2009-08-18 2009-08-18 Document storage device and document storage program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009189180A JP5281516B2 (en) 2009-08-18 2009-08-18 Document storage device and document storage program

Publications (2)

Publication Number Publication Date
JP2011039976A true JP2011039976A (en) 2011-02-24
JP5281516B2 JP5281516B2 (en) 2013-09-04

Family

ID=43767650

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009189180A Expired - Fee Related JP5281516B2 (en) 2009-08-18 2009-08-18 Document storage device and document storage program

Country Status (1)

Country Link
JP (1) JP5281516B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018136829A (en) * 2017-02-23 2018-08-30 日本電信電話株式会社 Presentation device and presentation method

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1145243A (en) * 1997-07-25 1999-02-16 Just Syst Corp Index preparing support device and computer readable recording medium for recording program for making computer function as the same device
JPH11265393A (en) * 1998-03-17 1999-09-28 Matsushita Electric Ind Co Ltd Information retrieving device
JP2006277061A (en) * 2005-03-28 2006-10-12 Toshiba Corp Knowledge retrieval system, method and program
JP2008283658A (en) * 2007-04-09 2008-11-20 Sharp Corp Image processing apparatus, image forming apparatus, image transmitting apparatus, image reading apparatus, image processing system, image processing method, image processing program and recording medium therefor

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1145243A (en) * 1997-07-25 1999-02-16 Just Syst Corp Index preparing support device and computer readable recording medium for recording program for making computer function as the same device
JPH11265393A (en) * 1998-03-17 1999-09-28 Matsushita Electric Ind Co Ltd Information retrieving device
JP2006277061A (en) * 2005-03-28 2006-10-12 Toshiba Corp Knowledge retrieval system, method and program
JP2008283658A (en) * 2007-04-09 2008-11-20 Sharp Corp Image processing apparatus, image forming apparatus, image transmitting apparatus, image reading apparatus, image processing system, image processing method, image processing program and recording medium therefor

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018136829A (en) * 2017-02-23 2018-08-30 日本電信電話株式会社 Presentation device and presentation method

Also Published As

Publication number Publication date
JP5281516B2 (en) 2013-09-04

Similar Documents

Publication Publication Date Title
US10083195B2 (en) System and method for composing a multidimensional index key in data blocks
US9002907B2 (en) Method and system for storing binary large objects (BLObs) in a distributed key-value storage system
JP4669067B2 (en) Dynamic fragment mapping
Almodaresi et al. An efficient, scalable, and exact representation of high-dimensional color information enabled using de Bruijn graph search
CN108334554B (en) Novel OLAP pre-calculation model and construction method
CN102402602A (en) B+ tree indexing method and device of real-time database
JP6940239B2 (en) Methods and systems for anonymizing data stock
CN107608773A (en) task concurrent processing method, device and computing device
CN106471501B (en) Data query method, data object storage method and data system
CN104572785B (en) A kind of distributed method and apparatus for creating index
JP2015069461A (en) Information processing device
CN108319608A (en) The method, apparatus and system of access log storage inquiry
JP2012168781A (en) Distributed data-store system, and record management method in distributed data-store system
JP5597623B2 (en) Database processing method
JP5281516B2 (en) Document storage device and document storage program
US9747363B1 (en) Efficient storage and retrieval of sparse arrays of identifier-value pairs
Gao et al. Supporting queries and analyses of large-scale social media data with customizable and scalable indexing techniques over NoSQL databases
CN111221814B (en) Method, device and equipment for constructing secondary index
JP5659880B2 (en) Processing apparatus, distributed processing system, and processing program
CN110427390B (en) Data query method and device, storage medium and electronic device
JP2007048318A (en) Relational database processing method and relational database processor
JP6000175B2 (en) Anonymization system, anonymization device, user device, anonymization method, and program
Hambrusch et al. Efficient query execution on broadcasted index tree structures
Soulé et al. RailwayDB: adaptive storage of interaction graphs
US20150324408A1 (en) Hybrid storage method and apparatus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110927

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130305

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130425

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130521

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130524

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5281516

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees