JP6758252B2 - Histogram generation method, histogram generator and histogram generation program - Google Patents
Histogram generation method, histogram generator and histogram generation program Download PDFInfo
- Publication number
- JP6758252B2 JP6758252B2 JP2017110924A JP2017110924A JP6758252B2 JP 6758252 B2 JP6758252 B2 JP 6758252B2 JP 2017110924 A JP2017110924 A JP 2017110924A JP 2017110924 A JP2017110924 A JP 2017110924A JP 6758252 B2 JP6758252 B2 JP 6758252B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- histogram
- bucket
- value
- column
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、データベースに格納されているテーブルに含まれるデータの分布を示すヒストグラムを生成するヒストグラム生成方法、ヒストグラム生成装置及びヒストグラム生成プログラムに関する。 The present invention relates to a histogram generation method, a histogram generation device, and a histogram generation program that generate a histogram showing the distribution of data contained in a table stored in a database.
データベースシステムでは、データベースを操作する問合せ文の最適化等の実行計画の作成において、問合せ文の処理コストを利用することにより、問合せ文に対応する処理の実行時間を短縮することができる。従来、処理コストの推定に、データベースに格納されているテーブルに含まれるデータの分布を示すヒストグラムを利用する手法が知られている(例えば、特許文献1参照)。 In the database system, the execution time of the processing corresponding to the query statement can be shortened by using the processing cost of the query statement in creating the execution plan such as the optimization of the query statement that operates the database. Conventionally, a method of using a histogram showing the distribution of data contained in a table stored in a database is known for estimating a processing cost (see, for example, Patent Document 1).
ヒストグラムは、テーブルに含まれる複数のカラムのそれぞれに対応して、1以上のバケットを含んでいる。バケットは、データ区間における、データの数とデータが示す値の数とを示す情報を含む。データベースシステムは、ヒストグラムに対して、問合せ文における演算処理を適用することにより、演算処理後のヒストグラム(中間ヒストグラム)を作成し、クエリの中間結果のサイズを推定することができる。 The histogram contains one or more buckets, corresponding to each of the plurality of columns contained in the table. The bucket contains information that indicates the number of data and the number of values that the data represents in the data interval. The database system can create a histogram (intermediate histogram) after the arithmetic processing by applying the arithmetic processing in the query statement to the histogram, and estimate the size of the intermediate result of the query.
しかしながら、問合せ文においてカラムに対して型変換が発生した場合には、型変換後のデータと、ヒストグラムとが対応しなくなる。このため、ヒストグラムを用いた中間結果のサイズの推定結果が、実際の演算処理における中間結果のサイズと乖離してしまうという問題が発生する。そして、中間結果のサイズの推定結果が、実際の演算処理における中間結果のサイズと乖離した状態でクエリの処理を継続すると、データベースシステムにおいて利用可能なリソースがなくなり、処理が終了しなくなるおそれがある。 However, when type conversion occurs for a column in a query statement, the data after type conversion and the histogram do not correspond. Therefore, there arises a problem that the estimation result of the size of the intermediate result using the histogram deviates from the size of the intermediate result in the actual arithmetic processing. If the query processing is continued in a state where the estimation result of the size of the intermediate result deviates from the size of the intermediate result in the actual arithmetic processing, the resources available in the database system may be exhausted and the processing may not be completed. ..
そこで、本発明はこれらの点に鑑みてなされたものであり、型変換後のデータに対応するヒストグラムを生成することができるヒストグラム生成方法、ヒストグラム生成装置及びヒストグラム生成プログラムを提供することを目的とする。 Therefore, the present invention has been made in view of these points, and an object of the present invention is to provide a histogram generation method, a histogram generation device, and a histogram generation program capable of generating a histogram corresponding to the data after type conversion. To do.
本発明の第1の態様に係るヒストグラム生成方法は、コンピュータが実行する、データベースシステムにおいて実行される問合せ文において、異なる種類の型に型変換が行われるカラムを特定する特定ステップと、特定された前記カラムに対応する前記型変換が行われる前のデータの度数分布を示し、予め記憶部に記憶されているヒストグラムに基づいて、当該ヒストグラムよりも度数分布の粒度が荒いヒストグラムを、前記問合せ文の中間結果に含まれる、前記カラムに対応する前記型変換が行われた後のデータの中間結果ヒストグラムとして生成する生成ステップと、を含む。 The histogram generation method according to the first aspect of the present invention is specified as a specific step of specifying a column to be type-converted to a different type in a query statement executed by a computer and executed in a database system. The frequency distribution of the data before the type conversion corresponding to the column is shown, and based on the histogram stored in the storage unit in advance, a histogram having a coarser frequency distribution than the histogram is used in the query statement. It includes a generation step included in the intermediate results, which is generated as an intermediate result histogram of the data after the type conversion corresponding to the column is performed.
前記特定ステップにおいて、前記コンピュータは、前記問合せ文において、数値に対応する型から文字列に対応する型への型変換が行われるカラムを特定し、前記生成ステップにおいて、前記コンピュータは、特定された前記カラムに対応する前記型変換が行われる前のデータに、桁数が異なるデータが含まれている場合に、前記カラムに対応する全てのデータの型変換前の最大値と最小値とを含むデータ区間における、前記データの数と、前記データが示す値の数とを示す情報を含むバケットを生成し、生成されたバケットに基づいて前記中間結果ヒストグラムを生成してもよい。 In the specific step, the computer identifies the column in which the type conversion from the type corresponding to the numerical value to the type corresponding to the character string is performed in the query statement, and in the generation step, the computer is specified. When the data before the type conversion corresponding to the column includes data having a different number of digits, the maximum value and the minimum value before the type conversion of all the data corresponding to the column are included. You may generate a bucket containing information indicating the number of the data and the number of values indicated by the data in the data interval, and generate the intermediate result histogram based on the generated bucket.
前記特定ステップにおいて、前記コンピュータは、前記問合せ文において、数値に対応する型から文字列に対応する型への型変換が行われるカラムを特定し、前記生成ステップにおいて、前記コンピュータは、特定された前記カラムに対応する前記型変換が行われる前のデータに、正の値を示すデータと負の値を示すデータとが含まれている場合に、正の値を有する全てのデータに対応する第1バケットを生成するとともに、負の値を有する全てのデータに対応する第2バケットを生成してもよい。 In the specific step, the computer identifies the column in which the type conversion from the type corresponding to the numerical value to the type corresponding to the character string is performed in the query statement, and in the generation step, the computer is specified. When the data before the type conversion corresponding to the column includes data showing a positive value and data showing a negative value, the first data corresponding to all the data having a positive value. One bucket may be generated and a second bucket corresponding to all data having a negative value may be generated.
前記生成ステップにおいて、前記コンピュータは、前記第1バケット及び前記第2バケットのそれぞれに含まれるデータの最大値及び最小値を、それぞれのバケットに含まれるデータが取り得る値の最大値及び最小値に設定してもよい。 In the generation step, the computer sets the maximum and minimum values of the data contained in the first bucket and the second bucket to the maximum and minimum values of the data contained in the respective buckets. You may set it.
前記生成ステップにおいて、前記コンピュータは、前記第1バケットの最大値を前記中間結果ヒストグラムに含まれるデータにおける最大値に設定するとともに、前記第2バケットの最小値を前記中間結果ヒストグラムに含まれるデータの最小値に設定してもよい。 In the generation step, the computer sets the maximum value of the first bucket to the maximum value in the data included in the intermediate result histogram, and sets the minimum value of the second bucket to the maximum value of the data included in the intermediate result histogram. It may be set to the minimum value.
前記生成ステップにおいて、前記コンピュータは、前記ヒストグラムに含まれるデータの最大値が正の値である場合には、正の値を有するデータに対応する1以上のバケットである第1バケットにおける最大値を前記ヒストグラムに含まれるデータにおける最大値に設定するとともに、負の値を有するデータに対応する1以上のバケットである第2バケットにおける最小値を前記ヒストグラムに含まれるデータの最小値に設定してもよい。 In the generation step, when the maximum value of the data included in the histogram is a positive value, the computer sets the maximum value in the first bucket, which is one or more buckets corresponding to the data having a positive value. Even if the maximum value of the data included in the histogram is set and the minimum value of the second bucket, which is one or more buckets corresponding to the data having a negative value, is set to the minimum value of the data included in the histogram. Good.
前記生成ステップにおいて、前記コンピュータは、前記ヒストグラムに含まれるデータの最大値が負の値である場合には、当該データの最大値を前記ヒストグラムに含まれるデータにおける最小値に設定するとともに、当該データの最小値を前記ヒストグラムに含まれるデータの最大値に設定してもよい。 In the generation step, when the maximum value of the data included in the histogram is a negative value, the computer sets the maximum value of the data to the minimum value of the data included in the histogram and the data. The minimum value of may be set to the maximum value of the data included in the histogram.
前記生成ステップにおいて、前記コンピュータは、特定された前記カラムに対応するデータに、正の値を示すデータと負の値を示すデータとが含まれている場合に、前記カラムに対応するデータにおける型変換前の最大値と、型変換前の最小値との比率と、前記カラムに対応する全てのデータの数とに基づいて、正の値を有するデータに対応する1以上のバケットである第1バケット及び負の値を有するデータに対応する1以上のバケットである第2バケットのそれぞれに含まれるデータの数を推定し、推定したデータの数を示す情報を含む前記第1バケット及び前記第2バケットを生成してもよい。 In the generation step, when the data corresponding to the specified column includes data indicating a positive value and data indicating a negative value, the type in the data corresponding to the column. The first, which is one or more buckets corresponding to data having a positive value, based on the ratio of the maximum value before conversion to the minimum value before type conversion and the number of all data corresponding to the column. The number of data contained in each of the bucket and the second bucket, which is one or more buckets corresponding to the data having a negative value, is estimated, and the first bucket and the second bucket including information indicating the estimated number of data are included. You may generate a bucket.
前記生成ステップにおいて、前記コンピュータは、前記問合せ文に含まれる前記カラムに対応する絞り込み条件によって絞り込まれた後のデータの数を、生成された前記中間結果ヒストグラムに基づいて推定し、前記記憶部に記憶されているヒストグラムに含まれる複数のバケットのそれぞれに対応するデータの数を、推定したデータの数と、前記絞り込み条件によって絞り込まれる前のデータの数とに基づいて更新することにより、前記問合せ文が実行された後の前記カラムのヒストグラムをさらに生成してもよい。 In the generation step, the computer estimates the number of data after being narrowed down by the narrowing conditions corresponding to the columns included in the query statement based on the generated intermediate result histogram and stores it in the storage unit. The query is performed by updating the number of data corresponding to each of the plurality of buckets included in the stored histogram based on the estimated number of data and the number of data before being narrowed down by the narrowing condition. Further histograms of said columns may be generated after the statement has been executed.
本発明の第2の態様に係るヒストグラム生成装置は、データベースシステムにおいて実行される問合せ文において、異なる種類の型に型変換が行われるカラムを特定する特定部と、特定された前記カラムに対応する前記型変換が行われる前のデータの度数分布を示し、予め記憶部に記憶されているヒストグラムに基づいて、当該ヒストグラムよりも度数分布の粒度が荒いヒストグラムを、前記問合せ文の中間結果に含まれる、前記カラムに対応する前記型変換が行われた後のデータの中間結果ヒストグラムとして生成する生成部と、を備える。 The histogram generator according to the second aspect of the present invention corresponds to a specific part that specifies a column that undergoes type conversion to a different type in a query statement executed in a database system, and the specified column. The intermediate result of the query statement includes a histogram showing the frequency distribution of the data before the type conversion is performed, and based on the histogram stored in the storage unit in advance, the granularity of the frequency distribution is coarser than that of the histogram. A generation unit that generates an intermediate result histogram of the data after the type conversion corresponding to the column is provided.
本発明の第3の態様に係るヒストグラム生成プログラムは、コンピュータを、データベースシステムにおいて実行される問合せ文において、異なる種類の型に型変換が行われるカラムを特定する特定部、及び、特定された前記カラムに対応する前記型変換が行われる前のデータの度数分布を示し、予め記憶部に記憶されているヒストグラムに基づいて、当該ヒストグラムよりも度数分布の粒度が荒いヒストグラムを、前記問合せ文の中間結果に含まれる、前記カラムに対応する前記型変換が行われた後のデータの中間結果ヒストグラムとして生成する生成部、として機能させる。 The histogram generation program according to the third aspect of the present invention is a specific part that specifies a column in which a computer is subjected to type conversion to a different type in a query statement executed in a database system, and the specified unit. The frequency distribution of the data before the type conversion corresponding to the column is shown, and based on the histogram stored in the storage unit in advance, a histogram having a coarser frequency distribution than the histogram is obtained in the middle of the query statement. It functions as a generation unit that is included in the result and is generated as an intermediate result histogram of the data after the type conversion corresponding to the column is performed.
本発明によれば、型変換後のデータに対応するヒストグラムを生成することができるという効果を奏する。 According to the present invention, there is an effect that a histogram corresponding to the data after type conversion can be generated.
[データベースシステム1の概要]
図1は、本実施形態に係るデータベースシステム1の概要を示す図である。データベースシステム1は、ユーザ端末2から取得した問合せ文を実行するシステムである。ここで、問合せ文は、データベースを操作するための文字列であり、SQL(Structured Query Language)で記述された命令文である。以下の説明において問合せ文をクエリという。
[Overview of database system 1]
FIG. 1 is a diagram showing an outline of the database system 1 according to the present embodiment. The database system 1 is a system that executes a query statement acquired from the user terminal 2. Here, the query statement is a character string for operating the database, and is a statement written in SQL (Structured Query Language). In the following explanation, the query statement is called a query.
データベースシステム1は、互いに通信可能な1以上のコンピュータによって構成されており、ヒストグラム生成装置として機能する。データベースシステム1は、LANやインターネット等の通信ネットワークを介してユーザ端末2と通信可能に接続されている。 The database system 1 is composed of one or more computers that can communicate with each other, and functions as a histogram generator. The database system 1 is communicably connected to the user terminal 2 via a communication network such as a LAN or the Internet.
データベースシステム1は、ユーザ端末2から、クエリを取得する(図1の(1))。データベースシステム1は、取得したクエリを解析して型変換が行われるカラムを特定し(図1の(2))、特定したカラムの型変換前のヒストグラムに基づいて、型変換後のカラムに対応するバケットを生成する(図1の(3))。ここで、バケットは、カラムに対応するデータの度数分布を示すヒストグラムに含まれている情報である。バケットは、データ区間におけるデータの数を示す情報と、データが示す値の数を示す情報とを含んでいる。 The database system 1 acquires a query from the user terminal 2 ((1) in FIG. 1). The database system 1 analyzes the acquired query to identify the column to which type conversion is performed ((2) in FIG. 1), and corresponds to the column after type conversion based on the histogram before type conversion of the identified column. Generate a bucket to be used ((3) in FIG. 1). Here, the bucket is information contained in the histogram showing the frequency distribution of the data corresponding to the column. The bucket contains information that indicates the number of data in the data interval and information that indicates the number of values that the data indicates.
データベースシステム1は、生成したバケットに基づいて、クエリの中間結果に対応するヒストグラムである中間結果ヒストグラムを生成する(図1の(4))。ここで、データベースシステム1は、特定したカラムに対応し、型変換が行われる前のヒストグラムに基づいて、当該ヒストグラムよりも度数分布の粒度が荒いヒストグラムを、中間結果ヒストグラムとして生成する。このようにすることで、データベースシステム1は、型変換後のデータに対応するヒストグラムを生成することができる。 The database system 1 generates an intermediate result histogram, which is a histogram corresponding to the intermediate result of the query, based on the generated bucket ((4) in FIG. 1). Here, the database system 1 generates a histogram as an intermediate result histogram corresponding to the specified column and having a coarser frequency distribution than the histogram based on the histogram before the type conversion is performed. By doing so, the database system 1 can generate a histogram corresponding to the data after type conversion.
データベースシステム1は、中間結果ヒストグラムに基づいてクエリの処理コストを算出し(図1の(5))、処理コストに基づいてクエリを実行する(図1の(6))。中間結果ヒストグラムが、クエリに対応する処理に対応したものとなることから、データベースシステム1は、クエリの処理コストを精度良く計算することができる。
以下、データベースシステム1の構成について説明する。
The database system 1 calculates the processing cost of the query based on the intermediate result histogram ((5) in FIG. 1), and executes the query based on the processing cost ((6) in FIG. 1). Since the intermediate result histogram corresponds to the processing corresponding to the query, the database system 1 can calculate the processing cost of the query with high accuracy.
The configuration of the database system 1 will be described below.
[データベースシステム1の構成例]
図2は、本実施形態に係るデータベースシステム1の構成を示す図である。
データベースシステム1は、記憶部11と、制御部12とを備える。
[Configuration example of database system 1]
FIG. 2 is a diagram showing a configuration of a database system 1 according to the present embodiment.
The database system 1 includes a
記憶部11は、例えば、ROM(Read Only Memory)及びRAM(Random Access Memory)等である。記憶部11は、データベースシステム1を機能させるための各種プログラムを記憶する。記憶部11は、データベースシステム1の制御部12を、後述する取得部121、特定部122、生成部123、コスト算出部124、及び実行部125として機能させるデータベース管理プログラムを記憶する。ここで、データベース管理プログラムは、制御部12を、取得部121、特定部122、及び生成部123として機能させるヒストグラム生成プログラムと、制御部12を、コスト算出部124及び実行部125として機能させるクエリ実行プログラムとを含んでいてもよい。
The
また、記憶部11は、データベース111を記憶する。データベース111には、1以上のテーブルが格納されている。また、1以上のテーブルのそれぞれには、1以上のカラムが含まれている。1以上のカラムのそれぞれには、カラムに対応するデータの度数分布を示すヒストグラムが設けられている。
In addition, the
図3は、本実施形態に係るヒストグラムの一例を示す図である。図3に示す例は、所定のテーブルに含まれるカラム「A」に対応するヒストグラムである。図3に示すように、ヒストグラムには、カラムに対応するデータの最小値と最大値とを示す情報が含まれているとともに、1以上のバケットが含まれている。図3に示す例では、2つのバケット「A1」及び「A2」が含まれていることが確認できる。 FIG. 3 is a diagram showing an example of a histogram according to the present embodiment. The example shown in FIG. 3 is a histogram corresponding to the column “A” included in a predetermined table. As shown in FIG. 3, the histogram contains information indicating the minimum and maximum values of the data corresponding to the columns, and includes one or more buckets. In the example shown in FIG. 3, it can be confirmed that two buckets "A1" and "A2" are included.
バケットには、バウンドと、レコード数と、ドメイン数とが含まれている。バウンドは、データが取り得る範囲を示す情報である。レコード数は、データの個数である。ドメイン数は、値の種類の個数である。なお、図3に示す例では、バケットにデータを示しているが、このデータは、バウンド数、レコード数、及びドメイン数を説明するために示したものであり、実際には含まれていないものとする。 The bucket contains the bounds, the number of records, and the number of domains. Bound is information indicating the range that data can take. The number of records is the number of data. The number of domains is the number of value types. In the example shown in FIG. 3, data is shown in the bucket, but this data is shown to explain the number of bounds, the number of records, and the number of domains, and is not actually included. And.
制御部12は、例えばCPU(Central Processing Unit)である。制御部12は、記憶部11に記憶されている各種プログラムを実行することにより、データベースシステム1に係る機能を制御する。制御部12は、データベース管理プログラムを実行することにより、取得部121、特定部122、生成部123、コスト算出部124、及び実行部125として機能する。
The
取得部121は、データベース111に対応するクエリをユーザ端末2から取得する。
特定部122は、取得部121が取得したクエリを解析し、異なる種類の型に型変換が行われるカラムを特定する。具体的には、特定部122は、クエリを示す文字列において、型変換を示す演算であるキャスト演算に対応する文字列を特定することにより、異なる種類の型に型変換が行われるカラムを特定する。ここで、異なる種類の型とは、データの大小関係の並び順が異なる型をいう。特定部122は、例えば、数値に対応する型から文字列に対応する型への型変換が行われるカラムを特定する。
The
The
生成部123は、異なる種類の型に型変換が行われるカラムに対応して記憶部11に記憶されている、型変換が行われる前のヒストグラムに基づいて、当該ヒストグラムよりも度数分布の粒度が荒いヒストグラムを、クエリの中間結果に含まれる当該カラムの中間結果ヒストグラムとして生成する。
The
具体的には、まず、生成部123は、中間結果ヒストグラムとして、型変換が行われる前のヒストグラムと同じヒストグラムを生成する。続いて、生成部123は、カラムに対応するデータに桁数が異なるデータが含まれる場合に実行する桁違い対応処理と、カラムに対応するデータに負の値のデータが含まれる場合に実行する負値対応処理とを実行することにより、中間結果ヒストグラムに含まれるバケットを更新する。以下、桁違い対応処理及び負値対応処理の詳細について説明する。
Specifically, first, the
[桁違い対応処理]
生成部123は、特定されたカラムに対応するデータに、桁数が異なるデータが含まれているか否かを判定する。例えば、生成部123は、中間結果ヒストグラムとして生成されているヒストグラムに含まれる最大値及び最小値を示す情報に基づいて、特定されたカラムに対応するデータに、桁数が異なるデータが含まれているか否かを判定する。
[Processing for orders of magnitude]
The
生成部123は、桁数が異なるデータが含まれていると判定すると、桁違い対応処理を実行し、中間結果ヒストグラムとして生成されているヒストグラムのバケットを変更する。
When the
生成部123は、特定されたカラムに対応する全てのデータの型変換前の最大値と最小値とを含むデータ区間における、データの数と、データが示す値の数とを示す情報を含むバケットを生成する。そして、生成部123は、予め中間結果ヒストグラムとして生成されているヒストグラムに含まれているバケットを消去する。このようにすることで、生成部123は、ヒストグラムの粒度が荒くなるものの、型変換後のデータに対応するヒストグラムを生成することができる。
The
なお、生成部123は、特定されたカラムに対応するデータに、正の値を示すデータと負の値を示すデータとが含まれている場合には、正の値を有する全てのデータに対応する第1バケットを生成するとともに、負の値を有する全てのデータに対応する第2バケットを生成する。
When the data corresponding to the specified column includes data showing a positive value and data showing a negative value, the
例えば、生成部123は、中間結果ヒストグラムとして生成されているヒストグラムに含まれる最大値及び最小値を示す情報に基づいて、特定されたカラムに対応するデータに、正の値を示すデータと負の値を示すデータとが含まれているか否かを判定する。
For example, the
生成部123は、正の値を示すデータと負の値を示すデータとが含まれていると判定すると、第1バケットを生成するとともに、第2バケットを生成する。例えば、中間結果ヒストグラムとして生成されているヒストグラムに、複数のバケットが含まれている場合には、生成部123は、複数のバケットのうち、正の値を有するデータに対応するバケットを集約して第1バケットを生成する。また、生成部123は、複数のバケットのうち、負の値を有するデータに対応するバケットを集約して第2バケットを生成する。ここで、生成部123は、複数のバケットのうち、正のデータと負のデータとの双方を含むバケットが存在する場合には、当該バケットを、第1バケット及び第2バケットに分解するものとする。
When the
そして、生成部123は、第1バケット及び第2バケットそれぞれに含まれるデータのバウンド、レコード数、ドメイン数を更新する。例えば、生成部123は、第1バケット及び第2バケットそれぞれに含まれるデータの最大値及び最小値を、それぞれのバケットに含まれるデータが取り得る値の最大値及び最小値に設定し、これらのバケットのバウンドを設定する。例えば、数値型から文字列型に型変換される前の正のデータ(数値型のデータ)の最小値が4、最大値が500である場合、文字列型に型変換された後の第1バケットの最小値は10、最大値は99となる。また、数値型から文字列型に型変換される前の負のデータ(数値型のデータ)の最小値が−500、最大値が−4である場合、文字列型に型変換された後の第2バケットの最小値は−99、最大値は−10となる。
Then, the
また、生成部123は、正の値を有する全てのデータに対応する第1バケットの最大値を、中間結果ヒストグラムに含まれるデータにおける最大値に設定する。また、生成部123は、負の値を有する全てのデータに対応する第2バケットの最小値を、中間結果ヒストグラムに含まれるデータにおける最小値に設定する。例えば、型変換前の正のデータ(数値型のデータ)の最小値が4、最大値が500であり、型変換前の負のデータ(数値型のデータ)の最小値が−500、最大値が−4である場合、中間結果ヒストグラムに含まれるデータにおける最小値は−99、最大値は99となる。
Further, the
また、生成部123は、複数のバケットのうち、正の値を有するデータに対応するバケットを集約する場合に、正の値を有するデータに対応する全てのバケットのレコード数及びドメイン数の合計を算出することにより、第1バケットのレコード数及びドメイン数を設定する。また、生成部123は、複数のバケットのうち、負の値を有するデータに対応するバケットを集約する場合に、負の値を有するデータに対応する全てのバケットのレコード数及びドメイン数の合計を算出することにより、第2バケットのレコード数及びドメイン数を設定する。
Further, when the
なお、生成部123は、正の値を示すデータと負の値を示すデータとが含まれていた場合に、型変換前のデータの最大値と、型変換前の最小値との比率と、更新前のバケットの全てのドメイン数(データの数)とに基づいて、第1バケット及び第2バケットのそれぞれのドメイン数を推定し、推定したドメイン数を示す情報を含む第1バケット及び第2バケットを生成してもよい。
In addition, when the data showing a positive value and the data showing a negative value are included, the
例えば、更新前のバケットに、100個のデータが含まれており、当該バケットの最大値が9、最小値が−3であったとする。この場合、最大値と最小値との比率は、3対1である。したがって、更新前のバケットから生成された第1バケット及び第2バケットのそれぞれのドメイン数を、当該比率に基づいて推定すると、第1バケットのドメイン数は75個であり、第2バケットのドメイン数は25個である。このようにすることで、生成部123は、第1バケット及び第2バケットのドメイン数を簡易的に推定することができる。
For example, suppose that the bucket before update contains 100 pieces of data, and the maximum value of the bucket is 9 and the minimum value is -3. In this case, the ratio of the maximum value to the minimum value is 3: 1. Therefore, when the number of domains of the first bucket and the second bucket generated from the bucket before the update is estimated based on the ratio, the number of domains in the first bucket is 75, and the number of domains in the second bucket is 75. Is 25 pieces. By doing so, the
[負値対応処理]
生成部123は、特定されたカラムに対応するデータに、負の値を示すデータを含むか否かを判定する。生成部123は、負の値を示すデータを含むと判定すると、負値対応処理を実行し、中間結果ヒストグラムとして生成されているヒストグラムのバケットを変更する。
[Negative value handling processing]
The
まず、生成部123は、正の値を示すデータと負の値を示すデータとを含むバケットが存在していると判定すると、当該バケットを、正の値を有する第1バケットと、負の値を有する第2バケットとに分解する。
First, when the
続いて、生成部123は、既に生成されている中間結果ヒストグラムに含まれるデータの最大値が正の値であるか否かを判定する。生成部123は、中間結果ヒストグラムに含まれるデータの最大値が正の値である場合には、正の値を有するデータに対応する1以上の第1バケットにおける最大値を中間結果ヒストグラムに含まれるデータにおける最大値に更新する。また、生成部123は、中間結果ヒストグラムに含まれるデータの最小値が負の値である場合には、負の値を有するデータに対応する1以上の第2バケットにおける最大値を中間結果ヒストグラムに含まれるデータの最小値に更新する。
Subsequently, the
また、生成部123は、中間結果ヒストグラムに含まれるデータの最大値が負の値である場合には、当該データの最大値をヒストグラムに含まれるデータにおける最小値に設定するとともに、当該データの最小値をヒストグラムに含まれるデータの最大値に設定する。
Further, when the maximum value of the data included in the intermediate result histogram is a negative value, the
また、生成部123は、第2バケットにおける最小値と最大値とを入れ替える。例えば、生成部123は、桁違い対応処理を実行したことによって、第2バケットの最小値が−99、最大値が−10となっている場合に、これらの最小値と最大値とを入れ替えて、第2バケットの最小値を−10、最大値を−99とする。
Further, the
また、生成部123は、中間結果ヒストグラムが、桁違い対応処理によって更新されておらず、型変換前のヒストグラムと同じ状態であり、第2バケットが複数存在する場合に、複数の第2バケットの並び順を逆順にする。
Further, in the
[絞り込み条件が適用された後のドメイン数の推定]
生成部123は、クエリに含まれる、型変換が行われるカラムに対応する絞り込み条件によって絞り込まれた後のドメイン数(データの数)を、生成した中間結果ヒストグラムに基づいて推定する。
[Estimation of the number of domains after the filtering conditions are applied]
The
クエリにおいて型変換が行われたカラムは、クエリ実行中の絞り込み処理が終了した後に再び型変換が行われる前の型のデータとして保持される。したがって、絞り込み処理が終了した後の当該データのヒストグラムは、型変換が行われる前の型のデータに対応するヒストグラム、すなわち、予め記憶部11に記憶されているヒストグラムに対応している必要がある。
The column for which type conversion has been performed in the query is retained as data of the type before the type conversion is performed again after the filtering process during query execution is completed. Therefore, the histogram of the data after the filtering process is completed needs to correspond to the histogram corresponding to the data of the type before the type conversion is performed, that is, the histogram stored in the
そこで、生成部123は、記憶部11に記憶されている、当該カラムに対応する型変換前のヒストグラムに含まれる複数のバケットのそれぞれに対応するデータの数を、中間結果ヒストグラムに基づいて推定したデータの数と、絞り込み条件によって絞り込まれる前のデータの数とに基づいて更新することにより、絞り込み処理が終了した後の当該カラムのヒストグラムをさらに生成する。
Therefore, the
コスト算出部124は、生成部123が生成した中間結果ヒストグラムに基づいてクエリの処理コストを算出する。例えば、コスト算出部124は、生成部123が生成した中間結果ヒストグラムに基づいてクエリが実行された場合における中間データのサイズを推定する。
The
実行部125は、コスト算出部124が算出した処理コストに基づいてクエリを実行する。具体的には、まず、実行部125は、クエリに対応する全ての演算処理のヒストグラムの作成及びコスト推定が完了すると、推定した処理コストに基づいてクエリ最適化を含む実行計画の最適化を行う。そして、実行部125は、最適化された実行計画に基づいてクエリを実行する。
The
[データベースシステム1における処理の流れ]
続いて、データベースシステム1における処理の流れについて説明する。図4は、本実施形態に係るデータベースシステム1における処理の流れを示すフローチャートである。
[Process flow in database system 1]
Subsequently, the processing flow in the database system 1 will be described. FIG. 4 is a flowchart showing a processing flow in the database system 1 according to the present embodiment.
まず、データベース111に対応するクエリをユーザ端末2から取得する(S10)。
続いて、特定部122は、取得されたクエリに基づいて、型変換が行われるカラムを特定する(S20)。
First, the query corresponding to the
Subsequently, the
続いて、生成部123は、中間結果ヒストグラムとして、型変換が行われる前のヒストグラムと同じヒストグラムを生成する(S30)。
続いて、生成部123は、特定したカラムのデータが桁違いのデータを含んでいるか否かを判定する(S40)。生成部123は、桁違いのデータを含んでいると判定すると、S50に処理を移し、桁違い対応処理を実行する。桁違い対応処理の詳細については後述する。生成部123は、桁違いのデータを含んでいないと判定すると、S60に処理を移す。
Subsequently, the
Subsequently, the
続いて、生成部123は、特定したカラムのデータが負の値のデータを含んでいるか否かを判定する(S60)。生成部123は、負の値のデータを含んでいると判定すると、S70に処理を移し、負値対応処理を実行する。負値対応処理の詳細については後述する。生成部123は、負の値のデータを含んでいないと判定すると、S80に処理を移す。
Subsequently, the
続いて、生成部123は、カラムの型を修正する(S80)。続いて、生成部123は、特定部122が特定した全てのカラムの型を修正したか否かを判定する(S90)。生成部123は、全てのカラムの型を修正したと判定すると、S100に処理を移し、全てのカラムの型を修正していないと判定すると、S30に処理を移す。
Subsequently, the
続いて、コスト算出部124、生成部123が生成した中間結果ヒストグラムに基づいてクエリの処理コストを算出する(S100)。
続いて、生成部123は、型戻し処理を実行する(S110)。型戻し処理の詳細については後述する。
続いて、実行部125は、コスト算出部124が算出した処理コストに基づいてクエリを実行する(S120)。
Subsequently, the processing cost of the query is calculated based on the intermediate result histogram generated by the
Subsequently, the
Subsequently, the
[桁違い対応処理における処理の流れ]
続いて、桁違い対応処理における処理の流れについて説明する。図5は、本実施形態に係る桁違い対応処理における処理の流れを示すフローチャートである。
[Process flow in digit difference processing]
Next, the processing flow in the digit difference processing will be described. FIG. 5 is a flowchart showing a processing flow in the digit difference handling processing according to the present embodiment.
まず、生成部123は、特定部122が特定したカラムに対応するヒストグラムにおいて、正の値及び負の値に対応するバケット、すなわち、正の値のデータ及び負の値のデータを含むバケットがあるか否かを判定する(S51)。
First, the
生成部123は、正の値及び負の値に対応するバケットがあると判定すると、S52に処理を移し、当該バケットを正の値のデータに対応する第1バケット、及び負の値のデータに対応する第2バケットに分解する。生成部123は、正の値及び負の値に対応するバケットがないと判定すると、S53に処理を移す。
When the
続いて、生成部123は、正の値のデータを第1バケットに集約し(S53)、負の値のデータを第2バケットに集約する(S54)。
続いて、生成部123は、カラムの最大値及び最小値を更新する(S55)。具体的には、生成部123は、第1バケットの最大値を、カラムの最大値に設定し、第2バケットの最大値を、カラムの最小値に設定する。
Subsequently, the
Subsequently, the
[負値対応処理における処理の流れ]
続いて、負値対応処理における処理の流れについて説明する。図6は、本実施形態に係る負値対応処理における処理の流れを示すフローチャートである。
[Processing flow in negative value handling processing]
Next, the processing flow in the negative value correspondence processing will be described. FIG. 6 is a flowchart showing a processing flow in the negative value correspondence processing according to the present embodiment.
まず、生成部123は、特定部122が特定したカラムに対応するヒストグラムにおいて、正の値及び負の値に対応するバケット、すなわち、正の値のデータ及び負の値のデータを含むバケットがあるか否かを判定する(S71)。
First, the
生成部123は、正の値及び負の値に対応するバケットがあると判定すると、S72に処理を移し、当該バケットを正の値のデータに対応する第1バケット、及び負の値のデータに対応する第2バケットに分解する。生成部123は、正の値及び負の値に対応するバケットがないと判定すると、S73に処理を移す。
When the
続いて、生成部123は、特定部122が特定したカラムに対応するデータに、正の値のデータが存在するか否かを判定する(S73)。生成部123は、正の値のデータが存在すると判定すると、S74に処理を移し、型変換前の負の値のデータの最大値を、カラムのデータの最小値に設定する。生成部123は、正の値のデータが存在しないと判定すると、S75に処理を移し、カラムに対応するデータの最大値と、最小値とを入れ替える。
Subsequently, the
続いて、生成部123は、負の値のデータに対応する第2バケットの最大値と最小値とを入れ替える(S76)。
続いて、生成部123は、第2バケットが複数存在する場合に、複数の第2バケットの順序を逆順化する(S77)。
Subsequently, the
Subsequently, the
[型戻し処理における処理の流れ]
続いて、型戻し処理における処理の流れについて説明する。図7は、本実施形態に係る型戻し処理における処理の流れを示すフローチャートである。
[Process flow in type return processing]
Next, the flow of processing in the mold return processing will be described. FIG. 7 is a flowchart showing a processing flow in the mold return processing according to the present embodiment.
まず、生成部123は、クエリに含まれる条件式に型変換処理が含まれるか否かを判定する(S111)。生成部123は、条件式に型変換処理が含まれていない場合には、S112に処理を移し、条件式に対応する処理を、型変換前のヒストグラムに適用することにより、ヒストグラムを更新する。
First, the
生成部123は、条件式に型変換処理が含まれている場合には、型変換対象のカラムに対して型変換を実行する(S113)。
続いて、生成部123は、型変換後のカラムに対して条件式が示す演算を実行する(S114)。
When the conditional expression includes the type conversion process, the
Subsequently, the
続いて、生成部123は、演算の実行前後のデータ数に基づいて、カラムに対応するデータの選択率を算出し(S115)、当該選択率に基づいて、型変換前のヒストグラムを更新する(S116)。
Subsequently, the
続いて、生成部123は、未処理の条件式が存在するか否かを判定する(S117)。生成部123は、未処理の条件式が存在する場合には、S111に処理を移し、未処理の条件式が存在しない場合には、本フローチャートの処理を終了する。
Subsequently, the
[本実施形態における効果]
以上のとおり、本実施形態に係るデータベースシステム1は、取得したクエリにおいて、異なる種類の型に型変換が行われるカラムに対応する型変換が行われる前のデータの度数分布を示し、予め記憶部11に記憶されているヒストグラムに基づいて、当該ヒストグラムよりも度数分布の粒度が荒いヒストグラムを、クエリの中間結果に含まれるカラムの中間結果ヒストグラムとして生成する。これにより、データベースシステム1は、粒度が粗いものの、型変換に対応してヒストグラムやバケットの最大値及び最小値を変換することによって、型変換後のデータに対応する中間結果ヒストグラムを生成し、当該中間結果ヒストグラムに基づいてクエリの処理コストを精度良く算出することができる。
[Effect in this embodiment]
As described above, the database system 1 according to the present embodiment shows the frequency distribution of the data before the type conversion is performed corresponding to the column in which the type conversion is performed to different types in the acquired query, and the storage unit is stored in advance. Based on the histogram stored in 11, a histogram having a coarser frequency distribution than the histogram is generated as an intermediate result histogram of the columns included in the intermediate result of the query. As a result, the database system 1 generates an intermediate result histogram corresponding to the data after the type conversion by converting the maximum value and the minimum value of the histogram and the bucket in response to the type conversion, although the grain size is coarse. The query processing cost can be calculated accurately based on the intermediate result histogram.
また、データベースシステム1は、中間結果ヒストグラムに基づいてクエリの処理コストを算出した後に型戻し処理を実行し、絞り込み条件が適用された後のカラムのヒストグラムをさらに生成する。このようにすることで、データベースシステム1は、絞り込み処理が行われた後に発生する処理に対応する処理コストの推定精度を向上させることができる。 Further, the database system 1 executes the type return processing after calculating the processing cost of the query based on the intermediate result histogram, and further generates the histogram of the column after the narrowing condition is applied. By doing so, the database system 1 can improve the estimation accuracy of the processing cost corresponding to the processing that occurs after the narrowing-down processing is performed.
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更又は改良を加えることが可能であることが当業者に明らかである。例えば、上述の複数の実施形態を組み合わせてもよい。また、特に、装置の分散・統合の具体的な実施形態は以上に図示するものに限られず、その全部又は一部について、種々の付加等に応じて、又は、機能負荷に応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。 Although the present invention has been described above using the embodiments, the technical scope of the present invention is not limited to the scope described in the above embodiments. It will be apparent to those skilled in the art that various changes or improvements can be made to the above embodiments. For example, the above-mentioned plurality of embodiments may be combined. Further, in particular, the specific embodiment of the distribution / integration of the apparatus is not limited to the one shown above, and all or a part thereof may be arbitrarily added according to various additions or functional loads. It can be functionally or physically distributed / integrated in units.
1・・・データベースシステム、11・・・記憶部、12・・・制御部、121・・・取得部、122・・・特定部、123・・・生成部、124・・・コスト算出部、125・・・実行部、2・・・ユーザ端末 1 ... database system, 11 ... storage unit, 12 ... control unit, 121 ... acquisition unit, 122 ... specific unit, 123 ... generation unit, 124 ... cost calculation unit, 125 ... Execution unit, 2 ... User terminal
Claims (11)
データベースシステムにおいて実行される問合せ文において、異なる種類の型に型変換が行われるカラムを特定する特定ステップと、
特定された前記カラムに対応する前記型変換が行われる前のデータの度数分布を示し、予め記憶部に記憶されているヒストグラムに基づいて、当該ヒストグラムよりも度数分布の粒度が荒いヒストグラムを、前記問合せ文の中間結果に含まれる、前記カラムに対応する前記型変換が行われた後のデータの中間結果ヒストグラムとして生成する生成ステップと、
を含むヒストグラム生成方法。 Computer runs,
In a query statement executed in a database system, a specific step to identify a column that undergoes type conversion to a different type, and
The frequency distribution of the data before the type conversion corresponding to the specified column is shown, and a histogram having a coarser frequency distribution than the histogram is obtained based on the histogram stored in the storage unit in advance. A generation step that is included in the intermediate result of the query statement and is generated as an intermediate result histogram of the data after the type conversion corresponding to the column is performed.
Histogram generation method including.
前記生成ステップにおいて、前記コンピュータは、特定された前記カラムに対応する前記型変換が行われる前のデータに、桁数が異なるデータが含まれている場合に、前記カラムに対応する全てのデータの型変換前の最大値と最小値とを含むデータ区間における、前記データの数と、前記データが示す値の数とを示す情報を含むバケットを生成し、生成されたバケットに基づいて前記中間結果ヒストグラムを生成する、
請求項1に記載のヒストグラム生成方法。 In the specific step, the computer identifies, in the query statement, the column in which the type conversion from the type corresponding to the numerical value to the type corresponding to the character string is performed.
In the generation step, when the data before the type conversion corresponding to the specified column includes data having a different number of digits, the computer of all the data corresponding to the column. Generate a bucket containing information indicating the number of the data and the number of values indicated by the data in the data interval including the maximum value and the minimum value before the type conversion, and the intermediate result based on the generated bucket. Generate a histogram,
The histogram generation method according to claim 1.
前記生成ステップにおいて、前記コンピュータは、特定された前記カラムに対応する前記型変換が行われる前のデータに、正の値を示すデータと負の値を示すデータとが含まれている場合に、正の値を有する全てのデータに対応する第1バケットを生成するとともに、負の値を有する全てのデータに対応する第2バケットを生成する、
請求項1又は2に記載のヒストグラム生成方法。 In the specific step, the computer identifies, in the query statement, the column in which the type conversion from the type corresponding to the numerical value to the type corresponding to the character string is performed.
In the generation step, when the computer includes data showing a positive value and data showing a negative value in the data before the type conversion corresponding to the specified column is performed. A first bucket corresponding to all data having a positive value is generated, and a second bucket corresponding to all data having a negative value is generated.
The histogram generation method according to claim 1 or 2.
請求項3に記載のヒストグラム生成方法。 In the generation step, the computer sets the maximum and minimum values of the data contained in the first bucket and the second bucket to the maximum and minimum values of the data contained in the respective buckets. Set,
The histogram generation method according to claim 3.
請求項4に記載のヒストグラム生成方法。 In the generation step, the computer sets the maximum value of the first bucket to the maximum value in the data included in the intermediate result histogram, and sets the minimum value of the second bucket to the maximum value of the data included in the intermediate result histogram. Set to the minimum value,
The histogram generation method according to claim 4.
請求項1から5のいずれか1項に記載のヒストグラム生成方法。 In the generation step, when the maximum value of the data included in the histogram is a positive value, the computer sets the maximum value in the first bucket, which is one or more buckets corresponding to the data having a positive value. The maximum value in the data included in the histogram is set, and the minimum value in the second bucket, which is one or more buckets corresponding to the data having a negative value, is set as the minimum value in the data included in the histogram.
The histogram generation method according to any one of claims 1 to 5.
請求項1から6のいずれか1項に記載のヒストグラム生成方法。 In the generation step, when the maximum value of the data included in the histogram is a negative value, the computer sets the maximum value of the data to the minimum value of the data included in the histogram and the data. Set the minimum value of to the maximum value of the data contained in the histogram,
The histogram generation method according to any one of claims 1 to 6.
請求項3から7のいずれか1項に記載のヒストグラム生成方法。 In the generation step, when the data corresponding to the specified column includes data indicating a positive value and data indicating a negative value, the type in the data corresponding to the column. The first, which is one or more buckets corresponding to data having a positive value, based on the ratio of the maximum value before conversion to the minimum value before type conversion and the number of all data corresponding to the column. The number of data contained in each of the bucket and the second bucket, which is one or more buckets corresponding to the data having a negative value, is estimated, and the first bucket and the second bucket including information indicating the estimated number of data are included. Generate a bucket,
The histogram generation method according to any one of claims 3 to 7.
請求項1から8のいずれか1項に記載のヒストグラム生成方法。 In the generation step, the computer estimates the number of data after being narrowed down by the narrowing conditions corresponding to the columns included in the query statement based on the generated intermediate result histogram and stores it in the storage unit. The query is performed by updating the number of data corresponding to each of the plurality of buckets included in the stored histogram based on the estimated number of data and the number of data before being narrowed down by the narrowing condition. Further generate a histogram of the column after the statement is executed,
The histogram generation method according to any one of claims 1 to 8.
特定された前記カラムに対応する前記型変換が行われる前のデータの度数分布を示し、予め記憶部に記憶されているヒストグラムに基づいて、当該ヒストグラムよりも度数分布の粒度が荒いヒストグラムを、前記問合せ文の中間結果に含まれる、前記カラムに対応する前記型変換が行われた後のデータの中間結果ヒストグラムとして生成する生成部と、
を備えるヒストグラム生成装置。 In the query statement executed in the database system, a specific part that identifies the column that undergoes type conversion to a different type, and
The frequency distribution of the data before the type conversion corresponding to the specified column is shown, and a histogram having a coarser frequency distribution than the histogram is obtained based on the histogram stored in the storage unit in advance. A generator included in the intermediate result of the query statement and generated as an intermediate result histogram of the data after the type conversion corresponding to the column is performed.
Histogram generator with.
データベースシステムにおいて実行される問合せ文において、異なる種類の型に型変換が行われるカラムを特定する特定部、及び、
特定された前記カラムに対応する前記型変換が行われる前のデータの度数分布を示し、予め記憶部に記憶されているヒストグラムに基づいて、当該ヒストグラムよりも度数分布の粒度が荒いヒストグラムを、前記問合せ文の中間結果に含まれる、前記カラムに対応する前記型変換が行われた後のデータの中間結果ヒストグラムとして生成する生成部、
として機能させるヒストグラム生成プログラム。 Computer,
In the query statement executed in the database system, the specific part that identifies the column that undergoes type conversion to a different type, and
The frequency distribution of the data before the type conversion corresponding to the specified column is shown, and a histogram having a coarser frequency distribution than the histogram is obtained based on the histogram stored in the storage unit in advance. A generator that is included in the intermediate result of the query statement and is generated as an intermediate result histogram of the data after the type conversion corresponding to the column is performed.
Histogram generation program that functions as.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017110924A JP6758252B2 (en) | 2017-06-05 | 2017-06-05 | Histogram generation method, histogram generator and histogram generation program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017110924A JP6758252B2 (en) | 2017-06-05 | 2017-06-05 | Histogram generation method, histogram generator and histogram generation program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018206074A JP2018206074A (en) | 2018-12-27 |
JP6758252B2 true JP6758252B2 (en) | 2020-09-23 |
Family
ID=64957169
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017110924A Active JP6758252B2 (en) | 2017-06-05 | 2017-06-05 | Histogram generation method, histogram generator and histogram generation program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6758252B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101986129B1 (en) * | 2019-04-17 | 2019-06-05 | 영남대학교 산학협력단 | Method and apparatus for data arrangement and computind device for executing the thereof |
CN111427920B (en) * | 2020-03-16 | 2023-08-11 | 深圳市腾讯计算机系统有限公司 | Data acquisition method, device, system, computer equipment and storage medium |
CN113946617A (en) * | 2021-10-29 | 2022-01-18 | 北京锐安科技有限公司 | Data processing method and device, electronic equipment and storage medium |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6416194B2 (en) * | 2013-03-15 | 2018-10-31 | アマゾン・テクノロジーズ・インコーポレーテッド | Scalable analytic platform for semi-structured data |
US20180095937A1 (en) * | 2015-04-17 | 2018-04-05 | Hitachi, Ltd. | Automatic Data Processing System, Automatic Data Processing Method, and Automatic Data Analysis System |
-
2017
- 2017-06-05 JP JP2017110924A patent/JP6758252B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018206074A (en) | 2018-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108628661B (en) | Automatic establishment method of cloud manufacturing service and cloud manufacturing system | |
JP6688407B2 (en) | Data lineage filtering | |
US10453165B1 (en) | Computer vision machine learning model execution service | |
JP6758252B2 (en) | Histogram generation method, histogram generator and histogram generation program | |
JP6469878B2 (en) | Data lineage filtering | |
JP6070936B2 (en) | Information processing apparatus, information processing method, and program | |
CN106886535A (en) | A kind of data pick-up method and apparatus for being adapted to multiple data sources | |
CN116341441B (en) | Method for optimizing digital logic circuit and related equipment | |
WO2017090475A1 (en) | Information processing system, function creation method, and function creation program | |
CN110275889B (en) | Feature processing method and device suitable for machine learning | |
CN111966346B (en) | Taint analysis method and device of application system | |
CN111443901B (en) | Java reflection-based service expansion method and device | |
JP6331756B2 (en) | Test case generation program, test case generation method, and test case generation apparatus | |
CN109408711B (en) | Data filtering method and device, electronic equipment and storage medium | |
CN110633959A (en) | Method, device, equipment and medium for creating approval task based on graph structure | |
CN114691658A (en) | Data backtracking method and device, electronic equipment and storage medium | |
CN115563924A (en) | Integrated circuit layout process information transplanting method, device, medium and terminal | |
CN113190576B (en) | Data processing method, apparatus, computer device and readable storage medium | |
KR102039419B1 (en) | Incremental data mining system and method for process-aware enterprise social networks | |
JP6173644B1 (en) | Information processing apparatus, information processing method, and information processing program | |
CN110674179A (en) | Query interface generation method, device and medium | |
JP2006106866A (en) | Apparatus for assisting in changing conversion rule and program for assisting in changing conversion rule | |
CN114048197B (en) | Tree structure data processing method, electronic equipment and computer readable storage device | |
CN110991177A (en) | Material weight removing method and device | |
CN114168275B (en) | Task scheduling method, system, terminal device and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190605 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200625 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200825 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200901 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6758252 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |