JP2008262324A - Information processor, information processing method and program - Google Patents
Information processor, information processing method and program Download PDFInfo
- Publication number
- JP2008262324A JP2008262324A JP2007103586A JP2007103586A JP2008262324A JP 2008262324 A JP2008262324 A JP 2008262324A JP 2007103586 A JP2007103586 A JP 2007103586A JP 2007103586 A JP2007103586 A JP 2007103586A JP 2008262324 A JP2008262324 A JP 2008262324A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- item
- information
- extraction
- extraction target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
本発明は、データベースに蓄積されたデータに対する集計検索を行うための技術に関する。 The present invention relates to a technique for performing a tabular search on data stored in a database.
企業が扱うデータは近年益々大量となり、そのデータを経営に活かすためには、データベースへの蓄積後のデータ分析が必須である。
データを多角的に瞬時に集計検索して、表やグラフなどに視覚化するシステムがOLAP(On−line Analytical Processing)であり、情報システム部門ではなく、分析結果を必要としている部門が直接システムを操作して分析を行うものである。
そのため、OLAPツールの利用者は、データベースの集計検索及び結果表示を行うための情報(ここでは、これをクエリ定義情報と呼ぶ)を作成する設計ユーザ(情報システム部門など)と、既に作成、保存されたクエリ定義情報を利用して集計検索結果を取得する検索ユーザに分かれる。
両ユーザとも作成、保存されたクエリ定義情報を利用する場合、一覧から目的のクエリ定義情報を探すことになるが、特に、Web環境で利用するOLAPツールの場合はクエリ定義情報がWebサーバ上に置かれることが多いため、ユーザが簡単にOSに付属の検索機能でさがすことはできない。
また、クエリ定義情報は、集計検索に必要な情報が格納されているため、通常の文書ファイルなどのように一般の検索機能を利用すると、余計なクエリ定義情報がピックアップされることもある。
そこで一般にOLAPツールでは、目的とするクエリ定義情報を一覧から見つけやすくするために、クエリ定義情報名にわかりやすい名前を付けられるように名前サイズ制限を緩くしたり、コメント付加機能を提供したりしている。
しかし、この方法は設計ユーザの技量、付加作業を必要とする。
In recent years, the amount of data handled by corporations has increased, and in order to utilize the data for management, data analysis after storage in a database is essential.
OLAP (On-line Analytical Processing) is a system that instantly aggregates and searches data and visualizes it in charts and graphs. The department that requires the analysis results, not the information system department, directly uses the system. It is operated and analyzed.
For this reason, users of OLAP tools have already created and stored design users (such as information system departments) who create information (herein referred to as query definition information) for performing aggregate search and result display of the database. It is divided into search users who acquire the total search results using the query definition information.
When both users use the query definition information created and stored, the target query definition information is searched from the list. Especially, in the case of the OLAP tool used in the Web environment, the query definition information is stored on the Web server. In many cases, the user cannot easily search with the search function attached to the OS.
In addition, since the query definition information stores information necessary for the aggregate search, extra query definition information may be picked up by using a general search function such as a normal document file.
Therefore, in general, in order to make it easy to find the target query definition information from the list, the OLAP tool relaxes the name size limit so that an easy-to-understand name can be given to the query definition information name, and provides a comment addition function. Yes.
However, this method requires the skill and additional work of the design user.
例えば、特許文献1に開示の技術では、システムにおいて検索機能を提供するために、クエリ定義情報本文に対応する帳票データと、予め設定した管理データ文章構造情報に基づいて、帳票データから抽出した検索用管理データを対応付けてデータベースで管理、検索する帳票データ文書管理技術が提案されている。
また、例えば、特許文献2に開示の技術では、ユーザ端末への電子帳票提供システムで、グループやユーザごとに帳票を表示させるために、帳票ID、グループID、ユーザID、資料年月日、表示属性などが格納されたインデックスファイルを用いて帳票を検索する方法が提案されている。
Further, for example, in the technology disclosed in
従来の、帳票と、帳票から抽出した検索用データを対応付けてデータベースで管理、検索する帳票データ文書管理技術は、検索用データを帳票とは別に二重持ちするため、管理が複雑となり、格納領域も増大するという課題があった。 The conventional form data document management technology that manages and searches in the database by associating the form with the search data extracted from the form has dual search data separately from the form, making the management complicated and storing There was a problem that the area also increased.
帳票の属性をインデックスファイルに格納し検索に利用する方法は、属性によって検索ユーザに見せる帳票一覧の表示を制御することはできるが、インデックスファイルには決まりきった項目しか格納されていないため、ユーザがフリーキーワードで帳票一覧を検索することはできないという課題があった。 The method of storing the form attributes in the index file and using it for the search can control the display of the form list to be shown to the search user by the attribute, but the index file stores only the fixed items, so the user However, there was a problem that the form list could not be searched with free keywords.
この発明は、上記のような課題を解決することを主な目的の一つとしており、クエリ定義情報と検索用データを二重持ちせずに二重持ちした場合と同等の性能でフリーキーワードでのクエリ定義情報の検索を可能とし、二重持ちしないことで管理を容易にすることを主な目的とする。 One of the main purposes of the present invention is to solve the above-mentioned problems, and it is possible to use a free keyword with the same performance as when double holding query definition information and search data instead of double holding. The main purpose is to make it possible to search the query definition information, and to facilitate the management by not having double.
本発明に係る情報処理装置は、
複数の項目を有する項目情報の項目ごとに、抽出対象の文字列が少なくとも一部に含まれる抽出対象項目、及び抽出対象の文字列が含まれない非抽出対象項目のいずれであるかを判定する項目判定部と、
前記抽出対象項目と判定された項目における抽出対象の文字列を前記項目情報から抽出し、抽出した文字列を示す文字列情報を生成するとともに、文字列抽出後の項目情報の文字列抽出箇所に、抽出された文字列を表象する文字列識別子を設定し、文字列に代えて文字列識別子が設定された抽出後項目情報を生成する文字列抽出部とを有することを特徴とする。
An information processing apparatus according to the present invention includes:
For each item of item information having a plurality of items, it is determined whether the item is an extraction target item including at least a part of the extraction target character string or a non-extraction target item not including the extraction target character string. An item determination unit;
The extraction target character string in the item determined to be the extraction target item is extracted from the item information, character string information indicating the extracted character string is generated, and the character string extraction portion of the item information after the character string extraction is generated. And a character string extracting unit that sets a character string identifier representing the extracted character string and generates post-extraction item information in which the character string identifier is set instead of the character string.
本発明によれば、項目情報に含まれる文字列を示す文字列情報を、項目情報とは別に持つが、抽出後項目情報には、文字列の代わりに文字列識別子が設定されているので、情報の二重持ちにならず、このため、情報の管理が容易となり、ハードウェア資源をより有効に活用できる。
また、文字列情報を項目情報から独立させて管理するので、文字列情報を用いたフリーキーワード検索により項目情報を効率的に検索することができる。
According to the present invention, the character string information indicating the character string included in the item information is provided separately from the item information, but since the extracted item information has a character string identifier instead of the character string, Information is not double-held, which makes it easy to manage information and makes more efficient use of hardware resources.
In addition, since the character string information is managed independently from the item information, the item information can be efficiently searched by a free keyword search using the character string information.
実施の形態1.
図1は、本実施の形態に係るOLAPツール装置1(情報処理装置)の構成例を示す図である。
図1において、OLAPツール装置1は、データベース4に接続されている。
OLAPツール装置1において、設計部11は、データベース4のデータの分析方法を設計する。つまり、設計部11は、クエリ定義情報を設計(生成)する。
情報分類部17は、クエリ定義情報の各項目をクエリ定義情報のキーワード検索に用いる文字列を含む項目とそれ以外の項目に分類する。
分割部12は、情報分類部17による分類に基づき、クエリ定義情報を文字列情報21と文字列以外のクエリ定義情報22に分割し、所定の記憶装置(不図示)に記憶させる。分割部12は、項目判定部及び文字列抽出部の例である。
なお、分割部12により分割された後の文字列情報21と文字列以外のクエリ定義情報22は分割後クエリ定義情報2の要素となる。
マージ部13は、文字列情報21と文字列以外のクエリ定義情報22からクエリ定義情報を組み立てる(クエリ定義情報を再現する)。
一覧出力部14は、マージ部13により組み立てられたクエリ定義情報の一覧を生成し、表示装置(不図示)に出力して、クエリ定義情報の一覧を表示させる。
キーワード検索部15は、ユーザからクエリ定義情報を検索するための検索キーワード3を取得し、当該検索キーワード3に合致するクエリ定義情報を検索する。
集計検索部16は、クエリ定義情報を用いてデータベースのデータを集計検索し結果表示する。
FIG. 1 is a diagram illustrating a configuration example of an OLAP tool apparatus 1 (information processing apparatus) according to the present embodiment.
In FIG. 1, the OLAP
In the OLAP
The
The dividing
Note that the
The
The
The
The
なお、図1はOLAPツール装置1がスタンドアロンのコンピュータに存在する形態であるが、設計部11がLAN(Local Area Network)等のネットワークで接続された別のコンピュータ上に存在してもよい。
また分割後クエリ定義情報2についても、OLAPツール装置1と同じコンピュータ上に格納してもよいし、別のコンピュータ、ストレージに格納されていてもよい。
Although FIG. 1 shows a form in which the OLAP
The post-partition
また、設計部11、情報分類部17及び分割部12は、クエリ定義情報を作成する設計ユーザ(情報システム部門など)が利用する機能であり、マージ部13、一覧出力部14、キーワード検索部15及び集計検索部16は、既に作成、保存されたクエリ定義情報を利用して集計検索結果を取得する検索ユーザが利用する機能である。
このため、例えば、図7に示すように、設計部11、情報分類部17及び分割部12を備えるOLAPツール装置(設計ユーザ用)100と、マージ部13、一覧出力部14、キーワード検索部15及び集計検索部16を備えるOLAPツール装置(検索ユーザ用)101という形に分けて、それぞれを別のコンピュータで構成し、各コンピュータをLAN等のネットワークで接続するようにしてもよい。
The
Therefore, for example, as shown in FIG. 7, an OLAP tool apparatus (for design user) 100 including a
本実施の形態では、OLAPツール装置1は、クエリ定義情報と検索用データを二重持ちせずに二重持ちした場合と同等の性能でフリーキーワードでのクエリ定義情報の検索を可能とする。
具体的には、設計部11がクエリ定義情報を生成し、分割部12がクエリ定義情報に含まれる文字列を取り出して文字列情報21とするとともに、文字列を取り出した箇所に、文字列を表象する文字列IDを文字列の代わりにセットし、文字列IDがセットされたクエリ定義情報を文字列以外のクエリ定義情報22とする。
また、キーワード検索部15は、ユーザからクエリ定義情報を検索するための検索キーワード3を取得し、当該検索キーワード3に合致する文字列が含まれる文字列情報21を検索することで、フリーキーワードでのクエリ定義情報の検索が可能となる。
また、クエリ定義情報の一覧表示を行う際や、クエリ定義情報を用いてデータベース4に対する集計検索を行う際には、マージ部13が、文字列以外のクエリ定義情報22の文字列IDを文字列情報21中の対応する文字列で置換し、文字列以外のクエリ定義情報22と文字列情報21とマージしてクエリ定義情報を再現する。
集計検索部16は、再現されたクエリ定義情報を用いて、データベース4の集計検索を行い、集計検索結果を表示する。
In the present embodiment, the OLAP
Specifically, the
In addition, the
Further, when displaying a list of query definition information or performing a total search on the database 4 using the query definition information, the merging
The
クエリ定義情報は、例えば、図2(a)及び(b)に示す情報である。
クエリ定義情報は、識別子の行と項目を羅列した行により構成され、項目を羅列した行は識別子により項目数や行数が異なり、内容も異なる。例えば識別子が次元軸や集計データを意味する場合、項目を羅列した行は、図2(b)のようになる。図2(b)の1行目は列次元の項目を展開した例であり、2行目は集計データを展開した例である。
つまり、図2(a)は、クエリ定義情報の全体像を示す図であり、図2(b)は、図2(a)の内訳を示す図である。
図2(b)の各項目には、データベースからデータの集計検索及び集計検索結果の表示を行うために必要なデータが示されている。
図2(b)の例では、項目タイプ、データの表示名、データ型、データの長さ、データベースでの名前等が示される。
このように、クエリ定義情報には、データベースに対する集計検索を実施するための管理情報、参照情報、検索文、集計情報等が含まれる。
また、集計検索部16は、クエリ定義情報に含まれる検索文からSQL文を作成することができ、データベース4の集計検索を実行することができる。
更に、集計検索部16の実行結果である集計データと、クエリ定義情報内の表示用の項目とを用いて、集計検索結果を表やグラフで表示することができる。
なお、クエリ定義情報は、項目情報の例である。
The query definition information is information shown in FIGS. 2A and 2B, for example.
The query definition information is composed of a row of identifiers and a row of items, and the number of rows and columns of items varies depending on the identifier and the number of items and the number of rows. For example, when the identifier means a dimension axis or aggregated data, the row in which the items are listed is as shown in FIG. The first line in FIG. 2B is an example in which column dimension items are expanded, and the second line is an example in which aggregated data is expanded.
That is, FIG. 2A is a diagram showing an overview of query definition information, and FIG. 2B is a diagram showing a breakdown of FIG. 2A.
Each item of FIG. 2B shows data necessary for performing a total search of data from the database and displaying a total search result.
In the example of FIG. 2B, the item type, data display name, data type, data length, database name, and the like are shown.
As described above, the query definition information includes management information, reference information, search text, total information, and the like for performing a total search on the database.
Further, the
Furthermore, the total search result can be displayed as a table or a graph using the total data that is the execution result of the
The query definition information is an example of item information.
また、図2(c)及び図2(d)は、分割部12による分割後のクエリ定義情報の例を示しており、図2(d)が文字列情報21の例を示し、図2(c)が文字列以外のクエリ定義情報22の例を示す。
つまり、クエリ定義情報は、分割部12により、図2(c)の文字列以外のクエリ定義情報22と、図2(d)の文字列情報21に分割されて保存される。
文字列情報21は、キーワード検索部15による検索キーワード3となり得る文字列が示される情報である。また、文字列以外のクエリ定義情報22は、クエリ定義情報から文字列情報21に示される文字列が抽出された後の情報である。
本実施の形態では、文字列以外のクエリ定義情報22では、図2(c)に示すように、文字列が抽出された文字列抽出箇所に、抽出された文字列を表象する文字列識別子(<str 0>等)が設定される。
なお、文字列以外のクエリ定義情報22は、抽出後項目情報の例である。
2 (c) and 2 (d) show examples of query definition information after division by the dividing
That is, the query definition information is divided and stored by the dividing
The
In the present embodiment, in the
The
次に、本実施の形態に係るOLAPツール装置1の動作を説明する。
Next, the operation of the
まずOLAPツール装置1の設計部11でクエリ定義情報を作成する流れを説明する。
OLAPツール装置1の設計部11をユーザが実行し、データベースのデータの分析方法を設計する。すなわち、図2(a)に示すようなクエリ定義情報を生成する。
設計された情報は情報分類部17により分類し一時的に記憶させる。
First, the flow of creating query definition information by the
The user executes the
The designed information is classified and temporarily stored by the
分類について、図3を用いて説明する。
図3は、設計部11でのクエリ定義情報の保持例を示す。
分割部12による分割前では、クエリ定義情報では、図3に示すように項目をフラグと共に記憶させる。なお、図3は、図2(a)のクエリ定義情報にフラグが設定されている例である。クエリ定義情報の各項目に対するフラグの設定、すなわち、各項目の分類は、情報分類部17が行う。
フラグ「0」が集計検索だけに必要な項目、フラグ「1」が結果表示に用いる表示項目、フラグ「2」が集計検索に必要だが検索キーワードになり得る文字列を含んだ項目である。
例えば、データベースの列のデータ型や長さは「0」、クエリ定義情報名、作成者名や管理者名、コメント、次元軸名、軸アイテム、集計データ名は「1」、SQL文は「2」に分類される。
この分類は、「0」がそのまま文字列以外のクエリ定義情報22として保存する項目、「1」が文字列情報21として保存する項目、「2」がデータ中から文字列情報21として保存する内容を切り出す項目であることを意味し、次のステップである分割処理で使われる。
設計部11は、複数種類のクエリ定義情報を設計するが、情報分類部17は、設計部11において設計されたクエリ定義情報の種類に対応させて、クエリ定義情報の各項目を分類する(フラグを設定する)。
情報分類部17は、クエリ定義情報の識別子に基づいて、クエリ定義情報の各項目を分類する(フラグを設定する)。
The classification will be described with reference to FIG.
FIG. 3 shows an example of holding query definition information in the
Before the division by the dividing
The flag “0” is an item necessary only for the total search, the flag “1” is a display item used for the result display, and the flag “2” is an item including a character string that is necessary for the total search but can be a search keyword.
For example, the data type and length of the database column is “0”, the query definition information name, the creator name or administrator name, the comment, the dimension axis name, the axis item, and the aggregate data name are “1”, and the SQL statement is “ 2 ”.
In this classification, “0” is an item stored as
The
The
なお、クエリ定義情報の項目のうち、フラグ「0」が設定されている項目は非抽出対象項目の例であり、フラグ「1」が設定されている項目は第一の抽出対象項目の例であり、フラグ「2」が設定されている項目は第二の抽出対象項目の例である。 Of the items in the query definition information, items for which the flag “0” is set are examples of non-extraction target items, and items for which the flag “1” is set are examples of first extraction target items. Yes, the item for which the flag “2” is set is an example of the second extraction target item.
設計部11による設計及び情報分類部17による項目の分類が終了すると、分割部12が呼ばれる。
分割部12の分割処理については、図2〜4を用いて説明する。
図4は、分割部12における分割処理(項目判定ステップ、文字列抽出ステップ)のフローチャートである。
When the design by the
The dividing process of the dividing
FIG. 4 is a flowchart of the dividing process (item determining step, character string extracting step) in the dividing
まず、分割部12は、情報分類部17で記憶されたクエリ定義情報を取り込む(S10)。
分割部12は、クエリ定義情報の最初の項目から順に各項目についてS11以降の処理を行う。
分割部12は、S11で各項目のフラグを判別する。
そして、S11において、フラグが「0」であれば何もせず次の項目の処理に移る(S18)。
S11で、フラグが「1」の場合は、分割部12は、項目に示される文字列が文字列情報21に存在するか確認する(S12)。これは、同じ文字列を重複して格納しないための処理である。
S12で、項目に示される文字列が文字列情報21に存在しなければ、当該項目の文字列を文字列情報21に格納する(S13)。
次に、文字列情報21内のインデックスを文字列IDとして文字列の抽出箇所にセットする(S14)。つまり、文字列抽出箇所に、抽出した文字列を表象する文字列ID(文字列識別子)を設定する。
例えば、図2(b)の二番目の項目「年」は、フラグが「1」であり、このため、文字列情報21に格納される(図2(d))。そして、文字列「年」が抽出された箇所に代わりに文字列ID<str 0>がセットされる(図2(c))。なお、分割部12は、文字列と文字列IDとを対応付けるテーブルを用意し、文字列IDをセットする度に、新たにセットした文字列IDとその文字列との対応付けを当該テーブルに記録するようにしてもよいし、文字列IDと文字列とを対応付けるポインタを設定してもよい。
そして、分割部12は、次の項目の処理に移る(S18)。
S12からS14までをまとめてS100と呼ぶこととする。
First, the dividing
The dividing
The dividing
In S11, if the flag is "0", nothing is done and the process proceeds to the next item (S18).
If the flag is “1” in S11, the dividing
If the character string indicated in the item does not exist in the
Next, an index in the
For example, the second item “year” in FIG. 2B has a flag “1”, and is therefore stored in the character string information 21 (FIG. 2D). A character string ID <
Then, the dividing
S12 to S14 are collectively referred to as S100.
S11で、フラグが「2」の場合は、分割部12は、項目中にデータベースの列名やOLAPツールでの表示名(次元軸名や集計データ名など)が含まれるかを確認する(S15)。なお、分割部12は、“ ”でくくられた文字列は、データベースの列名又はOLAPツールでの表示名であると判断する。
例えば、図2(b)において、「EXTRACT(YEAR FROM “hiduke”)」の「hiduke」を抽出すべき文字列として識別する。
含まれていなければ、分割部12は、次の項目の処理に移る(S18)。
含まれている場合は、S100を実行する(S16)。
つまり、上述のように、重複して同じ文字列が格納されていなければ、処理中の項目に含まれている文字列を文字列情報21に格納し、文字列抽出箇所に、抽出した文字列を表象する文字列IDを設定する。上述の「EXTRACT(YEAR FROM “hiduke”)」の例では、文字列「hiduke」が記述されていた箇所に、代わりに文字列ID<str 1>がセットされる。
次に、分割部12は、データの先頭を指すポインタを進め(S17)、項目中にデータベースの列名等が含まれなくなったら、次の項目の処理に移る(S18)。
処理中の項目が最後の項目であれば、文字列が抽出された後のクエリ定義情報全体を文字列以外のクエリ定義情報22として保存する(S19)。
このようにして、文字列情報21と文字列以外のクエリ定義情報22が作成される。
その後、分割部12は、生成した文字列情報21と文字列以外のクエリ定義情報22を対応づけて記憶装置(不図示)に記憶させる。
If the flag is “2” in S11, the dividing
For example, in FIG. 2B, “hiduke” of “EXTRACT (YEAR FROM“ hiduke ”)” is identified as a character string to be extracted.
If not included, the dividing
If it is included, S100 is executed (S16).
That is, as described above, if the same character string is not stored repeatedly, the character string included in the item being processed is stored in the
Next, the dividing
If the item being processed is the last item, the entire query definition information after the character string is extracted is stored as
Thus, the
Thereafter, the dividing
以上のように、分割部12は、複数の項目を有するクエリ定義情報(項目情報)の項目ごとに、抽出対象の文字列が少なくとも一部に含まれる項目(抽出対象項目)、及び抽出対象の文字列が含まれない項目(非抽出対象項目)のいずれであるかを判定し、抽出対象項目と判定された項目における抽出対象の文字列をクエリ定義情報から抽出し、抽出した文字列を示す文字列情報21を生成するとともに、文字列抽出後のクエリ定義情報の文字列抽出箇所に、抽出された文字列を表象する文字列識別子を設定し、文字列に代えて文字列識別子が設定された文字列以外のクエリ定義情報22(抽出後項目情報)を生成する。
そして、分割部12は、抽出対象項目として、抽出対象の文字列から構成される第一の抽出対象項目(フラグ「1」の項目)、及び抽出対象の文字列が一部に含まれる第二の抽出対象項目(フラグ「2」の項目)を備える。
分割部12は、集計検索にのみ用いられる項目を非抽出対象項目とし、集計検索の結果の表示に用いる文字列から構成される項目を第一の抽出対象項目とし、集計検索に用いる項目であってクエリ定義情報のキーワード検索に使用可能なクエリ定義情報検索文字列が含まれる項目を第二の抽出対象項目とする。
そして、分割部12は、クエリ定義情報の項目ごとに、第一の抽出対象項目、第二の抽出対象項目、及び非抽出対象項目のいずれであるかを判定し、第一の抽出対象項目と判定された項目を構成する文字列をクエリ定義情報から抽出し、第二の抽出対象項目と判定された項目における抽出対象の文字列をクエリ定義情報から抽出して、文字列情報21を生成する。
As described above, the dividing
Then, the dividing
The dividing
And the
次にOLAPツール装置1にユーザから各種操作選択をさせるためのクエリ定義情報一覧を表示する流れを説明する。まず、ユーザが一覧出力部14を実行する。
するとマージ部13が呼び出される。
マージ部13のマージ処理については、図5のフローチャートを用いて説明する。
マージ部13の呼び出し時には、どのクエリ定義情報の文字列情報21と文字列以外のクエリ定義情報22をマージするかを示す識別子が一覧出力部14からマージ部13に渡される。
マージ処理では、マージ部13は、この識別子に対応する文字列情報21及び文字列以外のクエリ定義情報22を記憶装置(不図示)から入力する(S30)。
次に、マージ部13は、入力内容に文字列IDが含まれるか確認し(S31)、含まれる間、クエリ定義情報の文字列情報21から文字列IDに対応する文字列を入力し、文字列IDを置き換える処理(S32)を繰り返す。
このようにして、必要部分の文字列情報21と文字列以外のクエリ定義情報22がマージされ、クエリ定義情報が再現される。
一覧出力部14ではマージ結果を基に、一覧を作成、表示させる。
なお、以上のマージ処理は、一覧出力においてクエリ定義情報の内容の詳細を表示する場合に必要となる処理であり、例えば、クエリ定義情報の名称を一覧表示するのみであれば、マージ処理を行わなくてもよい。
但し、データベース4に対する集計検索を行う際にはクエリ定義情報を再現する必要があるので、一覧出力時にマージ処理を行わない場合は、データベース4に対する集計検索の際に、後述するように、集計検索部16がマージ部13を呼び出し、マージ部13によるマージ処理を経てクエリ定義情報を再現する。
Next, a flow of displaying a query definition information list for allowing the
Then, the
The merge process of the
When the
In the merge process, the
Next, the merging
In this way, the
The
The above merge processing is necessary when displaying details of the contents of the query definition information in the list output. For example, if only the names of the query definition information are displayed in a list, the merge processing is performed. It does not have to be.
However, since it is necessary to reproduce the query definition information when performing the aggregate search on the database 4, if the merge process is not performed when the list is output, the aggregate search is performed at the time of the aggregate search on the database 4 as described later. The
また、クエリ定義情報の一覧出力時に、検索キーワード3を入力させるための検索欄を、例えばGUI(Graphical User Interface)画面上に設ける。
ユーザから入力された検索キーワード3で、キーワード検索部15は文字列情報21を検索する。
このキーワード検索処理を図6で説明する。
図6はキーワード検索部15におけるキーワード検索処理のフローチャートである。
まず、キーワード検索部15は、クエリ定義情報の文字列情報21を入力する(S50)。
ユーザにより入力された検索キーワード3に合致する文字列が含まれる文字列情報21をサーチし(S51)、あれば、文字列情報21のファイル名を一覧出力部14に渡すバッファにセットする(S52)。
クエリ定義情報一覧としてサーチする対象の他のクエリ定義情報の文字列情報21があれば(S53)、続けて入力し(S50)、無ければ処理を終了する。
一覧出力部14はバッファの内容を基に、キーワード検索部15で抽出されたクエリ定義情報の一覧を表示させる。
Also, a search field for inputting the
The
This keyword search process will be described with reference to FIG.
FIG. 6 is a flowchart of keyword search processing in the
First, the
The
If there is
The
最後にデータベースのデータを集計検索する流れを説明する。
ユーザにより一覧で集計検索を操作されると、集計検索部16が実行される。
このときもマージ部13が呼び出され、対象の文字列情報21と文字列以外のクエリ定義情報22がマージされ、クエリ定義情報が再現される。
そして、集計検索部16は、マージされたクエリ定義情報からSQL文を作成し、データベース4の集計検索を実行する。
実行結果である集計データと、クエリ定義情報から、集計検索結果を表やグラフで表示する。
Lastly, the flow of collecting and searching database data will be described.
When the user operates the total search on the list, the
Also at this time, the
Then, the
From the aggregated data that is the execution result and the query definition information, the aggregated search results are displayed in a table or graph.
以上のように、クエリ定義情報の検索に使用する文字列をクエリ定義情報とは別に持つが、クエリ定義情報の一部として機能させるようにしているので、情報を二重持ちしない。そのため、管理が容易となり、H/W資源をより有効に活用できる。
また、OLAPツール装置自体がクエリ定義情報の検索機能を持ち、ユーザがフリーキーワードで検索できるようにしているので、より効率的に分析対象のクエリ定義情報を見つけやすくなる。
As described above, a character string used for query definition information search is provided separately from the query definition information. However, since it is made to function as a part of the query definition information, information is not held double. Therefore, management becomes easy and H / W resources can be used more effectively.
In addition, the OLAP tool device itself has a query definition information search function, and allows the user to search with free keywords, making it easier to find the query definition information to be analyzed more efficiently.
このように、本実施の形態では、データベースに蓄積されたデータの集計検索及び結果表示を行うOLAPツールにおいて、OLAP処理情報を格納したファイルをクエリ定義情報と呼ぶこととした場合に、
クエリ定義情報を、集計検索だけに必要な部分、結果表示に必要な部分、及び集計検索に必要だが検索キーワードになり得る文字列を含んだ部分に分類し、
分類された情報を基に、キーワード検索に用いる文字列情報とそれ以外のクエリ定義情報に分割保存し、
分割された文字列情報とそれ以外のクエリ定義情報をマージして1つのクエリ定義情報として利用するクエリ定義情報格納方法について説明した。
As described above, in the present embodiment, in the OLAP tool that performs the total search and the result display of the data accumulated in the database, when the file storing the OLAP processing information is referred to as query definition information,
Classify the query definition information into a part that is necessary only for aggregate search, a part that is necessary for result display, and a part that contains a character string that can be used as a search keyword.
Based on the classified information, it is divided and saved into character string information used for keyword search and other query definition information,
The query definition information storage method has been described in which the divided character string information and other query definition information are merged and used as one query definition information.
また、本実施の形態では、データベースに蓄積されたデータの集計検索及び結果表示を行うOLAPツールにおいて、OLAP処理情報を格納したファイルをクエリ定義情報と呼ぶこととした場合に、
クエリ定義情報を、集計検索だけに必要な部分、結果表示に必要な部分、及び集計検索に必要だが検索キーワードになり得る文字列を含んだ部分に分類する情報分類手段と、
分類された情報を基に、キーワード検索に用いる文字列情報とそれ以外のクエリ定義情報に分割保存する分割手段と、
分割された文字列情報とそれ以外のクエリ定義情報を1つのクエリ定義情報に組み立てるマージ手段とを備えるクエリ定義情報格納装置について説明した。
In the present embodiment, in the OLAP tool that performs a total search of data accumulated in the database and the result display, when the file storing the OLAP processing information is referred to as query definition information,
An information classification means for classifying query definition information into a part necessary only for aggregate search, a part necessary for result display, and a part including a character string that is necessary for aggregate search but can be a search keyword;
Based on the classified information, dividing means for dividing and storing character string information used for keyword search and other query definition information,
A query definition information storage device that includes split character string information and merge means for assembling other query definition information into one query definition information has been described.
最後に実施の形態1に示したOLAPツール装置1、100、101のハードウェア構成例について説明する。
図8は、実施の形態1に示すOLAPツール装置1、100、101のハードウェア資源の一例を示す図である。なお、図8の構成は、あくまでもOLAPツール装置1、100、101のハードウェア構成の一例を示すものであり、OLAPツール装置1、100、101のハードウェア構成は図8に記載の構成に限らず、他の構成であってもよい。
Finally, a hardware configuration example of the
FIG. 8 is a diagram illustrating an example of hardware resources of the
図8において、OLAPツール装置1、100、101は、プログラムを実行するCPU911(Central Processing Unit、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、プロセッサともいう)を備えている。CPU911は、バス912を介して、例えば、ROM(Read Only Memory)913、RAM(Random Access Memory)914、通信ボード915、表示装置901、キーボード902、マウス903、磁気ディスク装置920と接続され、これらのハードウェアデバイスを制御する。更に、CPU911は、FDD904(Flexible Disk Drive)、コンパクトディスク装置905(CDD)、プリンタ装置906、スキャナ装置907と接続していてもよい。また、磁気ディスク装置920の代わりに、光ディスク装置、メモリカード読み書き装置などの記憶装置でもよい。
RAM914は、揮発性メモリの一例である。ROM913、FDD904、CDD905、磁気ディスク装置920の記憶媒体は、不揮発性メモリの一例である。これらは、記憶装置あるいは記憶部の一例である。
通信ボード915、キーボード902、スキャナ装置907、FDD904などは、入力部、入力装置の一例である。
また、通信ボード915、表示装置901、プリンタ装置906などは、出力部、出力装置の一例である。
In FIG. 8, the
The
The
Further, the
通信ボード915は、ネットワークに接続可能である。例えば、通信ボード915は、LAN(ローカルエリアネットワーク)、インターネット、WAN(ワイドエリアネットワーク)などに接続されていても構わない。
磁気ディスク装置920には、オペレーティングシステム921(OS)、ウィンドウシステム922、プログラム群923、ファイル群924が記憶されている。プログラム群923のプログラムは、CPU911、オペレーティングシステム921、ウィンドウシステム922により実行される。
The
The
上記プログラム群923には、実施の形態1の説明において「〜部」、「〜手段」として説明している機能を実行するプログラムが記憶されている。プログラムは、CPU911により読み出され実行される。
ファイル群924には、実施の形態1の説明において、「〜の判断」、「〜の計算」、「〜の比較」、「〜の設定」、「〜の更新」、「〜の検索」、「〜の集計」、「〜の抽出」等として説明している処理の結果を示す情報やデータや信号値や変数値やパラメータが、「〜ファイル」や「〜データベース」の各項目として記憶されている。「〜ファイル」や「〜データベース」は、ディスクやメモリなどの記録媒体に記憶される。ディスクやメモリになどの記憶媒体に記憶された情報やデータや信号値や変数値やパラメータは、読み書き回路を介してCPU911によりメインメモリやキャッシュメモリに読み出され、抽出・検索・参照・比較・演算・計算・処理・編集・出力・印刷・表示などのCPUの動作に用いられる。抽出・検索・参照・比較・演算・計算・処理・編集・出力・印刷・表示のCPUの動作の間、情報やデータや信号値や変数値やパラメータは、メインメモリ、レジスタ、キャッシュメモリ、バッファメモリ等に一時的に記憶される。
また、実施の形態1で説明しているフローチャートの矢印の部分は主としてデータや信号の入出力を示し、データや信号値は、RAM914のメモリ、FDD904のフレキシブルディスク、CDD905のコンパクトディスク、磁気ディスク装置920の磁気ディスク、その他光ディスク、ミニディスク、DVD等の記録媒体に記録される。また、データや信号は、バス912や信号線やケーブルその他の伝送媒体によりオンライン伝送される。
The
In the description of the first embodiment, the
In addition, the arrows in the flowchart described in the first embodiment mainly indicate input and output of data and signals. The data and signal values are the
また、実施の形態1の説明において「〜部」、「〜手段」として説明しているものは、「〜回路」、「〜装置」、「〜機器」、であってもよく、また、「〜ステップ」、「〜手順」、「〜処理」であってもよい。すなわち、「〜部」、「〜手段」として説明しているものは、ROM913に記憶されたファームウェアで実現されていても構わない。或いは、ソフトウェアのみ、或いは、素子・デバイス・基板・配線などのハードウェアのみ、或いは、ソフトウェアとハードウェアとの組み合わせ、さらには、ファームウェアとの組み合わせで実施されても構わない。ファームウェアとソフトウェアは、プログラムとして、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、DVD等の記録媒体に記憶される。プログラムはCPU911により読み出され、CPU911により実行される。すなわち、プログラムは、実施の形態1の「〜部」、「〜手段」としてコンピュータを機能させるものである。あるいは、実施の形態1の「〜部」、「〜手段」の手順や方法をコンピュータに実行させるものである。
In addition, what is described as “to part” and “to means” in the description of the first embodiment may be “to circuit”, “to device”, and “to device”. -Step "," -procedure "," -process "may be used. That is, what is described as “˜unit” and “˜means” may be realized by firmware stored in the
このように、実施の形態1に示すOLAPツール装置1、100、101は、処理装置たるCPU、記憶装置たるメモリ、磁気ディスク等、入力装置たるキーボード、マウス、通信ボード等、出力装置たる表示装置、通信ボード等を備えるコンピュータであり、上記したように「〜部」、「〜手段」として示された機能をこれら処理装置、記憶装置、入力装置、出力装置を用いて実現するものである。
As described above, the
1 OLAPツール装置、2 分割後クエリ定義情報、3 検索キーワード、4 データベース、11 設計部、12 分割部、13 マージ部、14 一覧出力部、15 キーワード検索部、16 集計検索部、17 情報分類部、21 文字列情報、22 文字列以外のクエリ定義情報、100 OLAPツール装置(設計ユーザ用)、101 OLAPツール装置(検索ユーザ用)。
DESCRIPTION OF
Claims (7)
前記抽出対象項目と判定された項目における抽出対象の文字列を前記項目情報から抽出し、抽出した文字列を示す文字列情報を生成するとともに、文字列抽出後の項目情報の文字列抽出箇所に、抽出された文字列を表象する文字列識別子を設定し、文字列に代えて文字列識別子が設定された抽出後項目情報を生成する文字列抽出部とを有することを特徴とする情報処理装置。 For each item of item information having a plurality of items, it is determined whether the item is an extraction target item including at least a part of the extraction target character string or a non-extraction target item not including the extraction target character string. An item determination unit;
The extraction target character string in the item determined to be the extraction target item is extracted from the item information, character string information indicating the extracted character string is generated, and the character string extraction portion of the item information after the character string extraction is generated. A character string extracting unit that sets a character string identifier that represents the extracted character string and generates post-extraction item information in which the character string identifier is set instead of the character string. .
前記抽出対象項目として、抽出対象の文字列から構成される第一の抽出対象項目、及び抽出対象の文字列が一部に含まれる第二の抽出対象項目を備え、
前記項目情報の項目ごとに、前記第一の抽出対象項目、前記第二の抽出対象項目、及び前記非抽出対象項目のいずれであるかを判定し、
前記文字列抽出部は、
前記第一の抽出対象項目と判定された項目を構成する文字列を前記項目情報から抽出し、前記第二の抽出対象項目と判定された項目における抽出対象の文字列を前記項目情報から抽出して、前記文字列情報を生成することを特徴とする請求項1に記載の情報処理装置。 The item determination unit
As the extraction target item, a first extraction target item composed of a character string to be extracted, and a second extraction target item partially including the extraction target character string,
For each item of the item information, determine which of the first extraction target item, the second extraction target item, and the non-extraction target item,
The character string extraction unit
A character string constituting an item determined to be the first extraction target item is extracted from the item information, and a character string to be extracted in the item determined to be the second extraction target item is extracted from the item information. The information processing apparatus according to claim 1, wherein the character string information is generated.
前記項目情報として、データベースに対する集計検索に用いられるクエリ定義情報を対象とし、
前記クエリ定義情報に含まれる項目のうち、集計検索にのみ用いられる項目を前記非抽出対象項目として判定し、集計検索の結果の表示に用いる文字列から構成される項目を前記第一の抽出対象項目として判定し、集計検索に用いる項目であってクエリ定義情報のキーワード検索に使用可能なクエリ定義情報検索文字列が含まれる項目を第二の抽出対象項目として判定し、
前記文字列抽出部は、
前記第一の抽出対象項目と判定された項目を構成する文字列を前記クエリ定義情報から抽出し、前記第二の抽出対象項目と判定された項目におけるクエリ定義情報検索文字列を前記クエリ定義情報から抽出して、前記文字列情報を生成することを特徴とする請求項2に記載の情報処理装置。 The item determination unit
As the item information, the query definition information used for the aggregate search for the database is targeted,
Among the items included in the query definition information, an item used only for the aggregation search is determined as the non-extraction target item, and an item including a character string used for displaying the result of the aggregation search is the first extraction target. It is determined as an item, and an item that is used for an aggregate search and includes a query definition information search character string that can be used for a keyword search of query definition information is determined as a second extraction target item.
The character string extraction unit
A character string constituting the item determined as the first extraction target item is extracted from the query definition information, and a query definition information search character string in the item determined as the second extraction target item is extracted from the query definition information. The information processing apparatus according to claim 2, wherein the character string information is generated by extracting the character string information.
前記文字列情報に示される文字列に対してキーワード検索を行って、特定のクエリ定義情報を検索するキーワード検索部を有することを特徴とする請求項3に記載の情報処理装置。 The information processing apparatus further includes:
The information processing apparatus according to claim 3, further comprising a keyword search unit that searches for specific query definition information by performing a keyword search on a character string indicated by the character string information.
前記抽出後項目情報に示される文字列識別子を前記文字列情報における対応する文字列で置換して、前記項目情報を再現するマージ部を有することを特徴とする請求項1に記載の情報処理装置。 The information processing apparatus further includes:
The information processing apparatus according to claim 1, further comprising a merge unit that reproduces the item information by replacing a character string identifier indicated in the item information after extraction with a corresponding character string in the character string information. .
コンピュータが、前記抽出対象項目と判定された項目における抽出対象の文字列を前記項目情報から抽出し、抽出した文字列を示す文字列情報を生成するとともに、文字列抽出後の項目情報の文字列抽出箇所に、抽出された文字列を表象する文字列識別子を設定し、文字列に代えて文字列識別子が設定された抽出後項目情報を生成する文字列抽出ステップとを有することを特徴とする情報処理方法。 For each item of item information having a plurality of items, whether the extraction target item includes at least a part of the extraction target character string or a non-extraction target item that does not include the extraction target character string An item determination step for determining
The computer extracts a character string to be extracted in the item determined to be the extraction target item from the item information, generates character string information indicating the extracted character string, and character string of the item information after the character string extraction A character string extraction step of setting a character string identifier representing the extracted character string at the extraction location, and generating post-extraction item information in which the character string identifier is set instead of the character string. Information processing method.
前記抽出対象項目と判定された項目における抽出対象の文字列を前記項目情報から抽出し、抽出した文字列を示す文字列情報を生成するとともに、文字列抽出後の項目情報の文字列抽出箇所に、抽出された文字列を表象する文字列識別子を設定し、文字列に代えて文字列識別子が設定された抽出後項目情報を生成する文字列抽出処理とをコンピュータに実行させることを特徴とするプログラム。 For each item of item information having a plurality of items, it is determined whether the item is an extraction target item including at least a part of the extraction target character string or a non-extraction target item not including the extraction target character string. Item judgment processing,
The extraction target character string in the item determined to be the extraction target item is extracted from the item information, character string information indicating the extracted character string is generated, and the character string extraction portion of the item information after the character string extraction is generated. A character string identifier representing the extracted character string is set, and the computer executes character string extraction processing for generating post-extraction item information in which the character string identifier is set instead of the character string. program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007103586A JP2008262324A (en) | 2007-04-11 | 2007-04-11 | Information processor, information processing method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007103586A JP2008262324A (en) | 2007-04-11 | 2007-04-11 | Information processor, information processing method and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008262324A true JP2008262324A (en) | 2008-10-30 |
Family
ID=39984765
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007103586A Pending JP2008262324A (en) | 2007-04-11 | 2007-04-11 | Information processor, information processing method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008262324A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6432893B1 (en) * | 2017-10-04 | 2018-12-05 | 株式会社シマント | Database processing apparatus, group map file production method and program |
CN113722480A (en) * | 2021-08-11 | 2021-11-30 | 安徽帕觅智能科技有限公司 | Japanese contact person mixed retrieval method |
-
2007
- 2007-04-11 JP JP2007103586A patent/JP2008262324A/en active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6432893B1 (en) * | 2017-10-04 | 2018-12-05 | 株式会社シマント | Database processing apparatus, group map file production method and program |
WO2019069941A1 (en) * | 2017-10-04 | 2019-04-11 | 株式会社シマント | Database processing device, group map file production method, and recording medium |
JP2019067304A (en) * | 2017-10-04 | 2019-04-25 | 株式会社シマント | Database processing apparatus, group map file production method and program |
CN113722480A (en) * | 2021-08-11 | 2021-11-30 | 安徽帕觅智能科技有限公司 | Japanese contact person mixed retrieval method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11651149B1 (en) | Event selection via graphical user interface control | |
US11531713B2 (en) | Suggested field extraction | |
US20210209080A1 (en) | Column-based contextual menu with form element to add commands to a search query | |
US10846316B2 (en) | Distinct field name assignment in automatic field extraction | |
US11698900B2 (en) | Leveraging search query history in a search interface | |
US11354308B2 (en) | Visually distinct display format for data portions from events | |
US10061824B2 (en) | Cell-based table manipulation of event data | |
US9922082B2 (en) | Enforcing dependency between pipelines | |
US9922383B2 (en) | Patent claims analysis system and method | |
US20160224643A1 (en) | Extracting From Extracted Event Fields | |
US7606797B2 (en) | Reverse value attribute extraction | |
US20110066619A1 (en) | Automatically finding contextually related items of a task | |
US20090183115A1 (en) | Document searching apparatus, document searching method, and computer-readable recording medium | |
JP2005115514A (en) | Database search system, its search method, and program | |
JP2011198111A (en) | Feature word extraction device and program | |
JP4832952B2 (en) | Database analysis system, database analysis method and program | |
JP2008310514A (en) | User operation history acquisition display device, user operation history acquisition display method, user operation history acquisition display program and recording medium recording that program | |
JP2009098811A (en) | Document sorting apparatus and program | |
JP2010250439A (en) | Retrieval system, data generation method, program and recording medium for recording program | |
JP2008262324A (en) | Information processor, information processing method and program | |
US11250084B2 (en) | Method and system for generating content from search results rendered by a search engine | |
JP3711710B2 (en) | Information search and collection system and storage medium storing information search and collection program | |
JP6753190B2 (en) | Document retrieval device and program | |
KR101020306B1 (en) | Method and apparatus for providing searching service | |
TWI399652B (en) | Systems and methods for comments aggregation and carryover in word pages |