JP6646699B2 - Search device and search method - Google Patents
Search device and search method Download PDFInfo
- Publication number
- JP6646699B2 JP6646699B2 JP2018043561A JP2018043561A JP6646699B2 JP 6646699 B2 JP6646699 B2 JP 6646699B2 JP 2018043561 A JP2018043561 A JP 2018043561A JP 2018043561 A JP2018043561 A JP 2018043561A JP 6646699 B2 JP6646699 B2 JP 6646699B2
- Authority
- JP
- Japan
- Prior art keywords
- processing
- data
- data processing
- definition
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、概して、検索、例えば、分析支援の1つとしての検索に関する。 The present invention relates generally to searching, for example, searching as one of the analysis aids.
データ分析では、分析対象のデータを準備するデータ準備作業に大半の時間を費やす傾向にある。データ準備作業に費やす時間の削減を図る方法として、今回の分析と類似する過去の分析を探し、当該過去の分析で使用されたデータを、今回の分析の対象とする方法が考えられる。特許文献1に開示の分析支援サーバは、分析目的と、目的カテゴリと、分析手法と、対象データ(項目キーと当該項目キーを用いて取得するデータ項目)といった複数の分析要素をキーに、類似する分析を検索し、当該類似する分析の分析目的、目的カテゴリ、分析手法及び対象データを表示する。
Data analysis tends to spend most of its time preparing data to be analyzed. As a method of reducing the time spent on the data preparation work, a method of searching for a past analysis similar to the current analysis and using the data used in the past analysis as a target of the current analysis can be considered. The analysis support server disclosed in
ユーザ(例えば分析者)は、行いたい分析の中身を理解していないと、特許文献1に開示のような様々な分析要素の各々について正しいキーを入力することは難しく、故に、類似する分析を検索することが難しい。例えば、様々な分析要素として、分析の目的や手法等を理解している必要がある。
Unless the user (e.g., an analyst) understands the contents of the analysis to be performed, it is difficult to input a correct key for each of various analysis elements as disclosed in
分析は、通常、データ加工処理を含んでおり、データ加工処理の特徴である加工処理特徴が、分析の特徴を表している、言い換えれば、分析を区別する。そこで、本発明に係る検索装置は、それぞれが分析について登録済の1以上のデータ加工処理定義にそれぞれ対応した1以上の加工処理特徴から、指定特徴(指定されたデータ加工処理定義の加工処理特徴、又は、指定された加工処理特徴)に類似する加工処理特徴を検索する。そして、検索装置は、類似する加工処理特徴を有するデータ加工処理定義に関する情報が関連付いた検索結果を表示する。なお、「類似する加工処理特徴」とは、指定特徴との関連性に関して所定の条件を満たす加工処理特徴でよく、例えば、指定特徴との一致度が所定度合以上の加工処理特徴でよい。 The analysis usually includes a data processing process, and a processing feature that is a feature of the data processing process represents a feature of the analysis, in other words, distinguishes the analysis. Therefore, the search device according to the present invention uses, from one or more processing features each corresponding to one or more data processing definitions registered for analysis, a designated feature (the processing feature of the specified data processing definition). Or a processing feature similar to the specified processing feature). Then, the search device displays a search result associated with information on a data processing definition having a similar processing characteristic. The “similar processing feature” may be a processing feature that satisfies a predetermined condition regarding relevance to the designated feature, and may be, for example, a processing feature whose degree of matching with the designated feature is equal to or greater than a predetermined degree.
ユーザは、様々な分析要素の各々について正しいキーを入力できるほど十分に分析の中身を理解していなくても、行いたい分析に関するデータ加工処理定義(又は、当該データ加工処理定義の加工処理特徴)さえ指定できれば、行いたい分析に類似する分析に関する情報の提示を受けることができる。 Even if the user does not sufficiently understand the contents of the analysis to be able to input the correct key for each of the various analysis elements, the data processing definition (or the processing characteristics of the data processing definition) regarding the analysis to be performed. As long as it can be specified, information on an analysis similar to the analysis to be performed can be presented.
以下の説明では、「インターフェース部」は、1以上のインターフェースデバイスでよい。当該1以上のインターフェースデバイスは、下記のうちのいずれでもよい。
・I/O(Input/Output)デバイスと遠隔の表示用計算機とのうちの少なくとも1つに対するI/Oインターフェースデバイス。表示用計算機に対するI/Oインターフェースデバイスは、通信インターフェースデバイスでよい。少なくとも1つのI/Oデバイスは、ユーザインターフェースデバイス、例えば、キーボード及びポインティングデバイスのような入力デバイスと、表示デバイスのような出力デバイスとのうちのいずれでもよい。
・1以上の通信インターフェースデバイス。1以上の通信インターフェースデバイスは、1以上の同種の通信インターフェースデバイス(例えば1以上のNIC(Network Interface Card))であってもよいし2以上の異種の通信インターフェースデバイス(例えばNICとHBA(Host Bus Adapter))であってもよい。
In the following description, the “interface unit” may be one or more interface devices. The one or more interface devices may be any of the following.
An I / O interface device for at least one of an I / O (Input / Output) device and a remote display computer. The I / O interface device for the display computer may be a communication interface device. The at least one I / O device may be any of a user interface device, for example, an input device such as a keyboard and a pointing device, and an output device such as a display device.
-One or more communication interface devices. The one or more communication interface devices may be one or more communication interface devices of the same type (for example, one or more NICs (Network Interface Cards)) or two or more different communication interface devices (for example, an NIC and an HBA (Host Bus). Adapter)).
また、以下の説明では、「メモリ部」は、1以上のメモリであり、典型的には主記憶デバイスでよい。メモリ部における少なくとも1つのメモリは、揮発性メモリであってもよいし不揮発性メモリであってもよい。 In the following description, the “memory unit” is one or more memories, and may typically be a main storage device. At least one memory in the memory unit may be a volatile memory or a nonvolatile memory.
また、以下の説明では、「PDEV部」は、1以上のPDEVであり、典型的には補助記憶デバイスでよい。「PDEV」は、物理的な記憶デバイス(Physical storage DEVice)を意味し、典型的には、不揮発性の記憶デバイス、例えばHDD(Hard Disk Drive)又はSSD(Solid State Drive)である。 In the following description, the “PDEV unit” is one or more PDEVs, and may typically be an auxiliary storage device. “PDEV” means a physical storage device (Physical storage DEVice), and is typically a non-volatile storage device, for example, a hard disk drive (HDD) or a solid state drive (SSD).
また、以下の説明では、「記憶部」は、メモリ部とPDEV部の少なくとも一部とのうちの少なくとも1つ(典型的には少なくともメモリ部)である。 In the following description, the “storage unit” is at least one of the memory unit and at least a part of the PDEV unit (typically, at least the memory unit).
また、以下の説明では、「プロセッサ部」は、1以上のプロセッサである。少なくとも1つのプロセッサは、典型的には、CPU(Central Processing Unit)のようなマイクロプロセッサであるが、GPU(Graphics Processing Unit)のような他種のプロセッサでもよい。少なくとも1つのプロセッサとしてのプロセッサは、シングルコアでもよいしマルチコアでもよい。少なくとも1つのプロセッサは、処理の一部又は全部を行うハードウェア回路(例えばFPGA(Field-Programmable Gate Array)又はASIC(Application Specific Integrated Circuit))といった広義のプロセッサでもよい。 In the following description, the “processor unit” is one or more processors. The at least one processor is typically a microprocessor such as a CPU (Central Processing Unit), but may be another type of processor such as a GPU (Graphics Processing Unit). The processor as at least one processor may be single-core or multi-core. The at least one processor may be a broadly-defined processor such as a hardware circuit (for example, an FPGA (Field-Programmable Gate Array) or an ASIC (Application Specific Integrated Circuit)) that performs part or all of the processing.
また、以下の説明では、「xxxテーブル」といった表現にて、入力に対して出力が得られる情報を説明することがあるが、当該情報は、どのような構造のデータでもよいし、入力に対する出力を発生するニューラルネットワークのような学習モデルでもよい。従って、「xxxテーブル」を「xxx情報」と言うことができる。また、以下の説明において、各テーブルの構成は一例であり、1つのテーブルは、2以上のテーブルに分割されてもよいし、2以上のテーブルの全部又は一部が1つのテーブルであってもよい。 Also, in the following description, information that can be output for an input may be described in an expression such as “xxx table”. However, the information may be data having any structure, May be a learning model such as a neural network that generates. Therefore, the “xxx table” can be referred to as “xxx information”. Further, in the following description, the configuration of each table is an example, and one table may be divided into two or more tables, or even if all or some of the two or more tables are one table. Good.
また、以下の説明では、「kkk部」(インターフェース部、記憶部及びプロセッサ部を除く)の表現にて機能を説明することがあるが、機能は、1以上のコンピュータプログラムがプロセッサ部によって実行されることで実現されてもよいし、1以上のハードウェア回路(例えばFPGA又はASIC)によって実現されてもよい。プログラムがプロセッサ部によって実行されることで機能が実現される場合、定められた処理が、適宜に記憶部及び/又はインターフェース部等を用いながら行われるため、機能はプロセッサ部の少なくとも一部とされてもよい。機能を主語として説明された処理は、プロセッサ部あるいはそのプロセッサ部を有する装置が行う処理としてもよい。プログラムは、プログラムソースからインストールされてもよい。プログラムソースは、例えば、プログラム配布計算機又は計算機が読み取り可能な記録媒体(例えば非一時的な記録媒体)であってもよい。各機能の説明は一例であり、複数の機能が1つの機能にまとめられたり、1つの機能が複数の機能に分割されたりしてもよい。 In the following description, a function may be described in terms of a “kkk unit” (excluding an interface unit, a storage unit, and a processor unit), but the function is executed by one or more computer programs executed by the processor unit. And may be realized by one or more hardware circuits (for example, an FPGA or an ASIC). When a function is realized by the program being executed by the processor unit, the function is defined as at least a part of the processor unit because the predetermined processing is performed appropriately using the storage unit and / or the interface unit. You may. The processing described with the function as the subject may be performed by a processor unit or a device having the processor unit. The program may be installed from a program source. The program source may be, for example, a program distribution computer or a computer-readable recording medium (for example, a non-transitory recording medium). The description of each function is an example, and a plurality of functions may be combined into one function, or one function may be divided into a plurality of functions.
また、以下の説明では、「検索装置」は、1以上の計算機で構成されてよい。具体的には、例えば、計算機が表示デバイスを有していて計算機が自分の表示デバイスに情報を表示する場合、当該計算機が検索装置でよい。また、例えば、第1計算機(例えばサーバ)が表示用情報を遠隔の第2計算機(表示用計算機(例えばクライアント))に送信し表示用計算機がその情報を表示する場合(第1計算機が第2計算機に情報を表示する場合)、第1計算機と第2計算機とのうちの少なくとも第1計算機が検索装置でよい。つまり、「情報を表示する」ことは、計算機が有する表示デバイスに情報を表示することであってもよいし、計算機が表示用計算機に表示用情報を送信することであってもよい(後者の場合は表示用計算機によって表示用情報が表示される)。また、検索装置としての機能を発揮するためのソフトウェア(コンピュータプログラム)が計算機で実行されることでソフトウェアディファインドの検索装置が実現されてもよい。 In the following description, the “search device” may be configured by one or more computers. Specifically, for example, when the computer has a display device and the computer displays information on its own display device, the computer may be a search device. Further, for example, when the first computer (for example, a server) transmits display information to a remote second computer (for example, a display computer (for example, a client)) and the display computer displays the information (the first computer is the second computer). When displaying information on a computer), at least the first computer of the first computer and the second computer may be a search device. That is, "displaying information" may be displaying information on a display device of the computer, or the computer may transmit display information to the display computer (the latter). In such a case, the display information is displayed by the display computer). Further, a software-defined search device may be realized by executing software (computer program) for exhibiting a function as a search device on a computer.
以下、図面を参照して、本発明の幾つかの実施例を説明する。 Hereinafter, some embodiments of the present invention will be described with reference to the drawings.
図15は、本実施例の概要を示す。 FIG. 15 shows an outline of the present embodiment.
検索装置101が、ユーザが使用する入出力コンソール160(表示用計算機の一例)から検索要求を受け、当該検索要求に応答して検索を行い、検索の結果としての情報を入出力コンソール160に表示するようになっている。
The search device 101 receives a search request from the input / output console 160 (an example of a display computer) used by the user, performs a search in response to the search request, and displays information as a search result on the input /
具体的には、例えば、検索装置101は、加工処理検索部111と、検索結果表示部112とを有する。加工処理検索部111は、データ加工処理定義(又はその加工処理特徴)が指定された検索要求を入出力コンソール160から受けて、それぞれが分析について登録済の1以上のデータ加工処理定義121にそれぞれ対応した1以上の加工処理特徴122から、指定されたデータ加工処理定義の加工処理特徴(又は指定された加工処理特徴)に類似する加工処理特徴122を検索する。検索結果表示部112は、類似する加工処理特徴122を有するデータ加工処理定義121に関する情報が関連付いた検索結果1500を表示する。ユーザは、様々な分析要素の各々について正しいキーを入力できるほど十分に分析の中身を理解していなくても、行いたい分析に関するデータ加工処理定義(又は、当該データ加工処理定義の加工処理特徴)さえ指定できれば、行いたい分析に類似する分析に関する情報の提示を受けることができる。すなわち、ユーザは、分析の検索の際に、分析の目的や手法をカテゴライズしなくて済む。また、データ加工処理定義121は、分析の目的や手法をベースに作成されるとは限らない。故に、分析の目的や手法といった観点をキーに検索する方法ではヒットしない分析が見つかる可能性もある。以上のことから、例えば、データ準備作業に費やす時間の削減と、行いたい分析に類似する分析に関する情報が得られる確率の向上とのうちの少なくとも1つが期待できる。なお、加工処理特徴は、分析を区別する特徴のため、本実施例では、いずれのデータ加工処理も、データクレンジングのように多くの分析に共通のデータ加工処理(つまり汎用的なデータ加工処理)ではないものとする。また、データ加工処理定義121は、データ加工処理を示す定義(例えば定義ファイル)である。以下、冗長な表現を避けるために、類似する加工処理特徴122を有する(類似する加工処理特徴122が関連付けられている)データ加工処理定義121を「類似するデータ加工処理定義121」と言い、類似するデータ加工処理定義121に関連付けられているデータ傾向123を、「類似するデータ傾向123」と言うことがある(「データ傾向」については後述する)。
Specifically, for example, the search device 101 includes a
検索装置101は、管理情報130を保持する。管理情報130は、登録済の1以上のデータ加工処理定義121を含む。具体的には、例えば、管理情報130は、1以上のエントリユニット120で構成される。エントリユニット120は、複数のデータセットのグループであり、データ加工処理定義121と、当該データ加工処理定義121に関連付けられた加工処理特徴122及びデータ傾向123のうちの少なくとも1つとで構成される。具体的には、例えば、エントリユニット120において、データ加工処理定義121に、当該データ加工処理定義121が示すデータ加工処理で使用されるデータのデータ傾向123が関連付けられている。「データ傾向」は、データ加工処理において使用されるデータの統計量(例えば、「JIS Z 8101-1:2015 統計
−用語と記号− 第1部:確率及び一般統計用語(日本規格協会)の「1一般統計用語」」に記載されるような統計量など)であり、具体例として、データにおけるデータセット(例えば値)の数、欠損値量、及び、分布などを挙げることができる。また、エントリユニット120において、データ加工処理定義121に、当該データ加工処理定義121の特徴を示す加工処理特徴122が関連付けられている。加工処理特徴122がデータ加工処理定義121に関連付けられていれば、検索の際に、当該データ加工処理定義121について加工処理特徴122を算出する必要が無く、故に、高速な検索が期待できる。また、データ傾向123がデータ加工処理定義121に関連付けられていれば、類似する加工処理特徴122(典型的には、過去の類似する分析のデータ加工処理の特徴)に関し、当該加工処理特徴122を有する分析(データ加工処理)で使用したデータの傾向もわかるので、過去の類似する分析として適切な分析をユーザが見つけ易くなり、結果として、分析の品質及び効率の少なくとも1つの向上が期待できる。なお、「データセット」とは、アプリケーションプログラムのようなプログラムから見た1つの論理的な電子データの塊であり、例えば、レコード、ファイル、キーバリューペア及びタプルのうちのいずれでもよい。本実施例では、例えば、データ加工処理定義121は、ファイルである。また、加工処理特徴が抽出されないデータ加工処理定義121を含んだエントリユニット120には、加工処理特徴122は含まれない。
The search device 101 holds
検索結果1500には、類似するデータ傾向を示す情報が関連付けられる。入出力コンソール160において、検索結果画面(検索結果1500を表示する画面)には、一致度の上位n件(nは自然数)の加工処理特徴122の各々について、当該加工処理特徴122を有するデータ加工処理定義121のファイル名(例えば“001.etl”)と、当該データ加工処理定義121に関連付けられているデータ傾向123とが表示される。ユーザは、検索結果を見て、類似するデータ傾向が、行いたい分析に則したデータ傾向であるかを評価することができる。表示されるデータ傾向から、ユーザは、類似するデータ加工処理定義121が、行いたい分析に類似する分析のデータ加工処理定義121であるか否かを判断したり、分析に必要なデータセットがデータに含まれているか否か(例えば、性別で分けた分析をしたいため男性に関するデータセットと女性に関するデータセットの両方があるか否か)を判断したりすることができる。
Information indicating a similar data tendency is associated with the search result 1500. In the input /
以下、本実施例を詳細に説明する。 Hereinafter, this embodiment will be described in detail.
図1は、検索装置101の構成を示す。 FIG. 1 shows a configuration of the search device 101.
検索装置101は、インターフェース部151、メモリ部152、PDEV部153、及び、それらに接続されたプロセッサ部154を有する。 The search device 101 includes an interface unit 151, a memory unit 152, a PDEV unit 153, and a processor unit 154 connected thereto.
インターフェース部151に、通信ネットワーク(例えばインターネット)170経由で、入出力コンソール160が接続される。入出力コンソール160は、表示用計算機の一例であり、例えば、デスクトップ型、ノート型或いはタブレット型のパーソナルコンピュータである。入出力コンソール160は、入力デバイス161(例えば、キーボード及びポインティングデバイス)と表示デバイス162(例えば、液晶ディスプレイ)とを有する。
An input /
PDEV部153は、管理情報130を格納する。管理情報130は、特徴管理テーブル181及び傾向管理テーブル182を含む。管理情報130の少なくとも一部が、検索装置101の外部の記憶装置に格納されてもよい。
The PDEV unit 153 stores the
メモリ部152は、1以上のコンピュータプログラムを格納する。当該1以上のコンピュータプログラムの少なくとも1つがプロセッサ部154により実行されることにより、特徴抽出部191、データ登録部192、加工処理検索部111及び検索結果表示部112といった機能が実現される。特徴抽出部191は、指定されたデータ加工処理定義の加工処理特徴を当該指定されたデータ加工処理定義から自動抽出する。これにより、ユーザは、検索キーとなる加工処理定義を指定しなくとも、データ加工処理定義を指定すれば、検索キーとなる加工処理特徴が取得されることになる。データ登録部192は、データ加工処理定義121、加工処理特徴122及びデータ傾向123を管理情報130に登録する。加工処理検索部111及び検索結果表示部112については、上述の通りである。
The memory unit 152 stores one or more computer programs. When at least one of the one or more computer programs is executed by the processor unit 154, functions such as a
図2は、データ登録処理の流れを示す。 FIG. 2 shows the flow of the data registration process.
データ登録部192が、入出力コンソール160から、データ加工処理定義121と、当該データ加工処理定義121が示すデータ加工処理で利用されたデータのデータ傾向123との入力を受ける(S201)。
The
データ登録部192が、特徴抽出部191を呼び出し、特徴抽出部191が、特徴抽出処理を行う(S202)。
The
データ登録部192が、データ加工処理定義121とデータ傾向123を紐付ける(関連付ける)データ加工処理IDを付与し、データ加工処理定義121に、データ加工処理IDとデータ傾向123を(S202の結果が抽出成功であれば、当該加工処理特徴122も)関連付ける(S203)。S203で、データ加工処理定義121、データ加工処理ID、及びデータ傾向123が(S202の結果が抽出成功であれば、当該加工処理特徴122も)登録される。
The
データ登録部192は、処理結果を表示する(S204)。ここで言う「処理結果」は、例えば、加工処理特徴122の抽出の有無と、登録の成否と、登録されたデータセット群(1以上のデータセット)に関する情報とを含む。
The
図3は、データ登録画面の一例を示す。 FIG. 3 shows an example of the data registration screen.
データ登録画面300は、GUI(Graphical User Interface)のようなユーザインターフェース画面である。データ登録画面300は、例えばデータ登録部192により表示されてよい。データ登録画面300は、UI(User Interface)301、302及び303を有する。
The
UI301は、登録対象のデータ加工処理定義の入力用のUIである。UI301を用いて、データ加工処理定義が指定(例えば、データ加工処理定義のファイル名を含むファイルパスが入力)される。
The
UI302は、登録対象のデータ加工処理定義が示すデータ加工処理において使用されるデータのデータ傾向の入力用のUIである。UI302によれば、データ傾向は、データにおけるデータ項目と、各データ項目についての標本数、標本欠損数及び標本平均である。
The
UI303は、データ登録処理の開始の指示用のUIである。UI303(例えばボタン)が操作されると、UI301を用いて指定されたデータ加工処理定義とUI302を用いて入力されたデータ傾向との登録のためのデータ登録処理(図2)が開始される。
The
図4は、分析の一例を模式的に示す。 FIG. 4 schematically shows an example of the analysis.
分析は、データ加工処理を含む。データ加工処理実行エンジン(C、Java(登録商標)、Python等の実行エンジン、DBMS(DataBase Management System)、又は、ETL(Extract/Transform/Load)ツール)400が、当該分析に対応したデータ加工処理定義121を読み込み、当該定義121が示すデータ加工処理を実行する。データ加工処理実行エンジン400は、検索装置101とは別の装置で実行されてもよいし、検索装置101で実行されてもよい。データ加工処理は、データセットの結合処理と、データセットの集約処理とのうちの少なくとも1つを含む。
The analysis includes data processing. The data processing execution engine (execution engine such as C, Java (registered trademark), Python, etc., DBMS (DataBase Management System), or ETL (Extract / Transform / Load) tool) 400 performs data processing corresponding to the analysis. The
図示の具体例は、次の通りである。入力データは、テーブルA〜Cを含み、出力データは、テーブルDを含む。データ加工処理は、テーブルA〜C内のあるカラム(データ項目)をキーとして結合する結合処理と、結合処理により得られたテーブル内のあるカラムを集約キー及び集約対象としてある手法により集約する集約処理とを含む。集約処理の結果として、テーブルDが出力される。 The specific example shown is as follows. The input data includes tables A to C, and the output data includes table D. The data processing process includes a joining process of joining a certain column (data item) in the tables A to C as a key, and an aggregation of joining a certain column in the table obtained by the joining process with an aggregation key and a certain method as an aggregation target. Processing. Table D is output as a result of the aggregation processing.
入力データと出力データの両方又は片方のデータにおける少なくとも1つのデータセットは、テーブルのような構造化データに代えて、非構造化データ(例えば、XML(eXtensible Markup Language)ファイル、又は、JSON(JavaScript Object Notation)ファイル)でもよいし(JavaScriptは登録商標)、非構造化データ(例えば、センサデータ、画像データ又は音声データ)でもよい。入力データと出力データの両方又は片方のデータに関し、データセット数は問わない。結合処理や集約処理の前後に、異常データの除外や数値計算などの他の処理が入っていてもよい。 At least one data set in both or one of the input data and the output data is replaced with unstructured data (for example, an XML (eXtensible Markup Language) file or JSON (JavaScript) instead of structured data such as a table. Object Notation file) (JavaScript is a registered trademark) or unstructured data (for example, sensor data, image data, or audio data). Regarding both or one of the input data and the output data, the number of data sets does not matter. Before and after the combining process and the aggregation process, other processes such as exclusion of abnormal data and numerical calculation may be included.
図5は、データ加工処理定義121の一例の構成を示す。
FIG. 5 shows an example of the configuration of the
データ加工処理定義121は、データ加工処理(例えば図4参照)の内容をテキストで定義したファイルである。図示の例によれば、データ加工処理定義121は、XMLファイルであるが、XMLファイルに代えて、例えば、C、Java(登録商標)、Python言語などのプログラミング言語やSQL文、XML形式、JSON形式などの形式で記述されたデータセットでもよい。
The
データ加工処理定義121は、各処理を表す識別子と、該当処理を行うために必要な設定、各処理の順序などの記述を含む。処理を表す識別子として、例えば、<component_type>“A”は、入力Aを意味し、<component_type>“Groupby”は、集約処理を意味し、<component_type>“Join”は、結合処理を意味する。なお、集約処理に関して、処理を行うために必要な集約キー、集約対象、集約方法は、それぞれ<key>、<target>及び<method>として定義されている。
The
図6は、特徴管理テーブル181の構成を示す。 FIG. 6 shows the configuration of the feature management table 181.
特徴管理テーブル181は、データ加工処理毎にレコードを有する。各レコードが、データ加工処理ID601、定義名602、集約キー603、集約対象604及び集約方法605といった情報を格納する。集約キー603、集約対象604及び集約方法605の組合せが、加工処理特徴122の一例に相当する。以下、1つのデータ加工処理を例に取る(図6において「対象加工処理」)。
The feature management table 181 has a record for each data processing. Each record stores information such as a
データ加工処理ID601は、対象加工処理に対してデータ登録処理において付与されたIDを示す。定義名602は、対象加工処理に対応したデータ加工処理定義121のファイル名を示す。集約キー603は、対象加工処理(集約処理)において使用されるキーとしてのデータ項目(項目名(カラム名))を示す。集約対象604は、対象加工処理(集約処理)において集約される値が属するデータ項目を示す。集約方法605は、集約方法を示す。
The
図示の例によれば、例えば次の通りである。例えば、1番目のレコードは、売上明細テーブルから商品毎の売上金額の合計を分析(算出)することを意味する。つまり、データ加工処理実行エンジン400は、データ項目[商品]をキーに、データ項目[商品]に属する全ての売上金額の合計を算出する。2番目のレコードは、同じ売上明細テーブルから性別毎の売上金額の平均を分析することを意味する。このように、分析種別ごとに分類できるケースがあるため、集約処理の集約キー、集約対象及び集約方法の組合せを加工処理特徴122の一例とすることができる。
According to the illustrated example, for example, it is as follows. For example, the first record means to analyze (calculate) the total of the sales amount for each product from the sales statement table. That is, the data processing execution engine 400 calculates the sum of all sales amounts belonging to the data item [product] using the data item [product] as a key. The second record means that the average of the sales amount for each gender is analyzed from the same sales statement table. As described above, since there is a case where classification can be performed for each analysis type, a combination of an aggregation key, an aggregation target, and an aggregation method of an aggregation process can be an example of the
図7は、傾向管理テーブル182の構成を示す。 FIG. 7 shows the configuration of the trend management table 182.
傾向管理テーブル182は、データ加工処理毎にレコードを有する。各レコードが、データ加工処理ID701、データ項目702、標本数703、標本欠損数704及び標本平均705といった情報を格納する。データ項目702、標本数703、標本欠損数704及び標本平均705の組合せが、データ傾向123の一例に相当する。以下、1つのデータ加工処理を例に取る(図7において「対象加工処理」)。
The trend management table 182 has a record for each data processing process. Each record stores information such as a data
データ加工処理ID701は、対象加工処理に対してデータ登録処理において付与されたIDを示す。データ項目702、標本数703、標本欠損数704及び標本平均705の組合せが、対象加工処理に属するデータ項目毎に存在する。データ項目702は、データ項目を示す。標本数703、標本欠損数704及び標本平均705は、当該データ項目についての標本数、標本欠損数及び標本平均を示す。
The
図6及び図7によれば、図15に示したエントリユニット120は、同一のデータ加工処理IDに紐づけられた複数のデータセットである。エントリユニット120における構成要素は下記の通りである。
・データ加工処理定義121は、定義名602から特定されるデータ加工処理定義である。
・加工処理特徴122は、集約キー603、集約対象604及び集約方法605の組合せである。
・データ傾向123は、データ加工処理IDに紐づいたデータ項目毎のデータ項目702、標本数703、標本欠損数704及び標本平均705の組合せである。
6 and 7, the
The
The
The
図8は、特徴抽出処理(図2のS202、又は、図9のS902)の流れを示す。 FIG. 8 shows the flow of the feature extraction process (S202 in FIG. 2 or S902 in FIG. 9).
特徴抽出部191が、指定されたデータ加工処理定義を取得する(S801)。ここで、「指定されたデータ加工処理定義」とは、図2のデータ登録処理のために指定されたデータ加工処理定義でもよいし、後述の図9の検索処理のために指定されたデータ加工処理定義でもよい。
The
特徴抽出部191が、S801で取得されたデータ加工処理定義に加工処理特徴が存在するか否か、具体的には、<component_type>が“Groupby”である<component>があるか否かを判断する(S802)。
The
S802の判断結果が偽の場合(S802:No)、特徴抽出部191が、抽出失敗を結果として返す(S803)。
If the determination result in S802 is false (S802: No), the
S802の判断結果が真の場合(S802:Yes)、特徴抽出部191が、データ加工処理定義から加工処理特徴を抽出、具体的には、<component_type>が“Groupby”である<component>内の<key>、<target>及び<method>でそれぞれ指定された値を取得し、取得した値を、それぞれ、集約キー603、集約対象604及び集約方法605とする(S804)。そして、特徴抽出部191が、抽出した加工処理特徴(集約キー603、集約対象604及び集約方法605)と抽出成功とを結果として返す(S805)。
If the result of the determination in S802 is true (S802: Yes), the
図9は、検索処理の流れを示す。 FIG. 9 shows the flow of the search process.
加工処理検索部111が、データ加工処理定義が指定された検索要求を受け付ける(S901)。
The
加工処理検索部111が、特徴抽出部191を呼び出し、特徴抽出部191が、特徴抽出処理を行う(S902)。S902の結果が抽出失敗の場合、検索結果表示部112が、特徴を抽出できず検索ができなかったことを検索結果として表示する(S905)。
The
S902の結果が抽出成功の場合、加工処理検索部111が、特徴検索を行う(S903)。すなわち、加工処理検索部111が、抽出された加工処理特徴をキーに、特徴管理テーブル181から、当該加工処理特徴に類似する(例えば、当該加工処理特徴との一致度が所定度合以上である)加工処理特徴を検索する特徴検索を行う。加工処理検索部111が、類似するデータ加工処理定義とそれに紐付くデータ傾向とが関連付いた検索結果を作成する(S904)。当該検索結果は、類似するデータ加工処理定義のデータ加工処理IDも関連付けられる。検索結果表示部112が、S904で作成された検索結果を表示する(S905)。
If the result of S902 is a successful extraction, the
図10は、特徴検索(図9のS903)の流れを示す。 FIG. 10 shows the flow of the feature search (S903 in FIG. 9).
加工処理検索部111が、S902の特徴抽出処理において抽出された加工処理特徴を取得する(S1001)。S1001で取得された加工処理特徴を、図10の説明において「キー特徴」と呼ぶ。
The
加工処理検索部111が、特徴管理テーブル181のレコード毎にS1002及びS1003を行う。以下、1つのレコードを例に取る(図10の説明において「対象レコード」)。
The
加工処理検索部111が、対象レコードが示す加工処理特徴がキー特徴に類似する(例えば、対象レコードが示す加工処理特徴のキー特徴との一致度が所定度合以上か)か否かを判断する。具体的には、例えば、加工処理検索部111が、対象レコードが示す加工処理特徴を構成する複数の要素(集約キー603、集約対象604及び集約方法605)と、キー特徴を構成する複数の要素のうち、m個(mは自然数、例えばm=2)以上の要素が互いに一致するか否かを判断する(S1002)。
The
S1002の判断結果が偽の場合(S1002:No)、対象レコードが示す加工処理特徴は、キー特徴に類似しない加工処理特徴である。 If the determination result in S1002 is false (S1002: No), the processing feature indicated by the target record is a processing feature that is not similar to the key feature.
S1002の判断結果が真の場合(S1002:Yes)、対象レコードが示す加工処理特徴は、キー特徴に類似する加工処理特徴である。加工処理検索部111が、当該加工処理特徴に関連付いているデータ加工処理IDを出力する(S1003)。当該データ加工処理IDが、検索結果に関連付けられることになる。
If the determination result in S1002 is true (S1002: Yes), the processing feature indicated by the target record is a processing feature similar to the key feature. The
図11Aは、検索画面の一例を示す。 FIG. 11A shows an example of the search screen.
検索画面1100は、GUIのようなユーザインターフェース画面である。検索画面1100は、第1プレーン1131と第2プレーン1132とを有する。第1プレーン1131を含んだ画面と、第2プレーン1132を含んだ画面とに分離していてもよい。
The
第1プレーン1131の表示は、例えば加工処理検索部111により制御される。第1プレーン1131は、検索キーとするデータ加工処理定義の指定と検索実行の指示とを受け付けるプレーンである。具体的には、例えば、第1プレーン1131は、UI1101及び1102を有する。UI1101は、今回の分析に対応したデータ加工処理定義の入力用のUIである。UI1102は、検索処理の開始の指示用のUIである。UI1102(例えばボタン)が操作されると、UI1101を用いて指定されたデータ加工処理定義をキーとして指定された検索要求が検索装置101へ発行され、当該検索要求に応答して検索処理(図9)が開始される。
The display of the
第2プレーン1132の表示は、例えば検索結果表示部112により制御される。第2プレーン1132は、検索結果が表示されるプレーンである。具体的には、例えば、第2プレーン1132には、検索結果に関連付けられた1以上の検索結果モジュール1105の各々について、UI1106〜1107が表示される。1つの検索結果モジュール1105は、S1103で取得されたデータ加工処理IDに対応する。UI1106は、データ加工処理IDに紐づけられているデータ加工処理定義121の定義名を表示するUIである。UI1107は、データ加工処理IDに紐づけられているデータ傾向(データ項目702、標本数703、標本欠損数704及び標本平均705の組合せ)を表示するUIである。UI1108は、UI1106に表示された定義名に対応するデータ加工処理定義121の詳細を表示することの指示用のUIである。UI1108(例えばボタン)が操作されると、データ加工処理定義121の詳細を表示する定義詳細画面(図11B)が、例えば検索結果表示部112により表示される。
The display of the
検索結果に関連付けられた1以上の検索結果モジュール1105の各々には、当該検索結果モジュール1105に対応する類似した分析についてのデータ傾向が含まれている。このため、ユーザにとって、検索結果において提示されているデータ加工処理が、行いたい分析に類似するか否かを判断し易い。
Each of the one or more
図11Bは、定義詳細画面の一例を示す。 FIG. 11B shows an example of the definition detail screen.
定義詳細画面1110は、データ加工処理定義121の詳細として、データ加工処理定義121が示すデータ加工処理を模式的に示す。また、定義詳細画面1110は、データ加工処理について、当該データ加工処理の加工処理特徴の詳細を表示する。詳細は、例えば、加工処理特徴を構成する複数の要素の各々について、当該要素の要素名(例えば“集約キー)”と、当該要素の値(例えば“[商品]”)とを含む。
The definition details
検索結果に加えて、類似するデータ加工処理の詳細が表示されることで、ユーザにとって、検索結果において提示されているデータ加工処理が、行いたい分析に類似するか否かを一層判断し易い。 By displaying the details of the similar data processing in addition to the search result, it is easier for the user to determine whether the data processing presented in the search result is similar to the analysis to be performed.
実施例2を説明する。その際、実施例1との相違点を主に説明し、実施例1との共通点については説明を省略又は簡略する。 Example 2 will be described. At this time, differences from the first embodiment will be mainly described, and description of common points with the first embodiment will be omitted or simplified.
図12は、実施例2に係る特徴管理テーブルの構成を示す。 FIG. 12 illustrates a configuration of a feature management table according to the second embodiment.
実施例2に係る特徴管理テーブル1281が有する各レコードは、上述した集約キー603、集約対象604及び集約方法605に代えて、結合テーブルの組合せ1203といった情報を格納する。すなわち、本実施例では、データ加工処理として、集約処理に代えて又は加えて、結合処理が採用される。
Each record of the feature management table 1281 according to the second embodiment stores information such as a
結合テーブルの組合せ1203の具体例は、次の通りである。売上明細テーブルから商品毎の売上金額の合計を分析する場合、データ加工処理は、POSデータと商品マスタの結合である(1番目のレコード参照)。また、売上明細テーブルから店舗毎の売上金額の合計を分析する場合、データ加工処理は、POSデータと店舗マスタの結合である(2番目のレコード参照)。このように、分析種別ごとに分類できるケースがあるため、結合テーブルの組合せが、加工処理特徴の一例として採用される。
A specific example of the
図13は、実施例2に係る特徴抽出処理の流れを示す。 FIG. 13 illustrates a flow of a feature extraction process according to the second embodiment.
特徴抽出部191が、S801と同様、指定されたデータ加工処理定義を取得する(S1301)。
The
特徴抽出部191が、S1301で取得されたデータ加工処理定義に加工処理特徴が存在するか否か、具体的には、<component_type>が“Join”である<component>があるか否かを判断する(S1302)。S1302の判断結果が偽の場合(S1302:No)、特徴抽出部191が、S803と同様、抽出失敗を結果として返す(S1303)。
The
S1302の判断結果が真の場合(S1302:Yes)、特徴抽出部191が、<component_type>が“Join”である<component>内の<target_right>, <target_left>で指定された値をすべて取得する(S1304)。特徴抽出部191が、取得した値の中で重複する値がある場合は、ユニークになるように重複値を除外し、結合テーブル組み合わせとして加工処理特徴を抽出する(S1305)。そして、特徴抽出部191が、抽出した加工処理特徴(結合テーブルの組合せ1203)と抽出成功とを結果として返す(S1306)。
If the determination result in S1302 is true (S1302: Yes), the
図14は、実施例2に係る特徴検索の流れを示す。 FIG. 14 illustrates a flow of a feature search according to the second embodiment.
加工処理検索部111が、図13の特徴抽出処理において抽出された加工処理特徴を取得する(S1401)。S1401で取得された加工処理特徴を、図14の説明において「キー特徴」と呼ぶ。
The
加工処理検索部111が、特徴管理テーブル181のレコード毎にS1402及びS1403を行う。以下、1つのレコードを例に取る(図14の説明において「対象レコード」)。
The
加工処理検索部111が、対象レコードが示す加工処理特徴がキー特徴に類似するか否かを判断する。具体的には、例えば、加工処理検索部111が、キー特徴と対象レコードが示す結合テーブルの組合せ1203とが一致するか否かを判断する(S1402)。
The
S1402の判断結果が真の場合(S1402:Yes)、加工処理検索部111が、当該加工処理特徴に関連付いているデータ加工処理IDを出力する(S1403)。
If the determination result in S1402 is true (S1402: Yes), the
以上、幾つかの実施例を説明したが、これらは本発明の説明のための例示であって、本発明の範囲をこれらの実施例にのみ限定する趣旨ではない。本発明は、他の種々の形態でも実施することが可能である。 Although several embodiments have been described above, these are examples for explaining the present invention, and are not intended to limit the scope of the present invention only to these embodiments. The present invention can be implemented in other various forms.
101…検索装置
101: Search device
Claims (6)
前記データ加工処理定義は、データ加工処理の内容を定義したデータセットであり、当該データ加工処理に対する入力データの定義と、当該入力データを用いて当該データ加工処理が行われた結果である出力データの定義とを含み、
データ登録処理のために指定されたデータ加工処理定義と、当該データ加工処理定義が示すデータ加工処理で利用された入力データのデータ傾向との入力を受け、当該データ加工処理定義と、当該データ加工処理定義に関連付けられたデータ傾向とを登録し、当該データ加工処理定義から加工処理特徴が抽出された場合には、当該データ加工処理定義に関連付けられた当該抽出された加工処理特徴を登録するデータ登録部と、
検索処理のために指定されたデータ加工処理定義の入力を受け付け、当該データ加工処理定義から加工処理特徴が抽出された場合に、それぞれが分析について登録済の1以上のデータ加工処理定義にそれぞれ対応した1以上の加工処理特徴から、当該抽出された加工処理特徴に類似する加工処理特徴を検索する加工処理検索部と、
前記類似する加工処理特徴を有するデータ加工処理定義と当該データ加工処理定義に関連付いているデータ傾向とを表す情報を含んだ検索結果を表示する検索結果表示部と
を有する検索装置。 If there is a specified data processing definition, it is determined whether the processing characteristic exists in the data processing definition. If the result of the determination is true, the processing characteristic is determined from the data processing definition. A feature extraction unit for extracting
The data processing definition is a data set that defines the contents of the data processing, and defines input data for the data processing and output data that is a result of the data processing performed using the input data. Including the definition of
Receiving input of the data processing definition specified for the data registration processing and the data tendency of the input data used in the data processing indicated by the data processing definition, the data processing definition and the data processing Register the data trend associated with the processing definition and, if the processing characteristic is extracted from the data processing definition, register the extracted processing characteristic associated with the data processing definition Registration department,
When the input of the data processing definition specified for the search processing is received and the processing characteristics are extracted from the data processing definition, each corresponds to one or more data processing definitions registered for analysis. A processing search unit that searches a processing characteristic similar to the extracted processing characteristic from the one or more processing characteristics thus obtained;
A search device comprising: a search result display unit that displays a search result including information indicating a data processing definition having the similar processing characteristics and a data tendency associated with the data processing definition .
(a)前記指定されたデータ加工処理定義の加工処理特徴、又は、前記指定された加工処理特徴、
(b)前記登録済の1以上のデータ加工処理定義にそれぞれ対応した1以上の加工処理特徴のうちの少なくとも1つ、
請求項1に記載の検索装置。 Each of the following (a) and (b) includes a combination of an aggregation key, an aggregation target, and an aggregation method of an aggregation process included in the data processing process.
(A) a processing feature of the specified data processing definition, or the specified processing feature,
(B) at least one of one or more processing features respectively corresponding to the one or more registered data processing definitions;
The search device according to claim 1.
(a)前記指定されたデータ加工処理定義の加工処理特徴、又は、前記指定された加工処理特徴、
(b)前記登録済の1以上のデータ加工処理定義にそれぞれ対応した1以上の加工処理特徴のうちの少なくとも1つ、
請求項1に記載の検索装置。 Each of the following (a) and (b) includes a combination of data items combined in the combining process included in the data processing process.
(A) a processing feature of the specified data processing definition, or the specified processing feature,
(B) at least one of one or more processing features respectively corresponding to the one or more registered data processing definitions;
The search device according to claim 1.
請求項1に記載の検索装置。 The data tendency associated with the at least one data processing definition is a statistic of data used in the data processing indicated by the data processing definition.
The search device according to claim 1 .
(A)前記検索装置が、データ登録処理のために指定されたデータ加工処理定義と、当該データ加工処理定義が示すデータ加工処理で利用された入力データのデータ傾向との入力を受け付けた場合、
(a1)前記検索装置が、当該データ加工処理定義に加工処理特徴が存在するか否かを判断し、当該判断の結果が真の場合に、当該データ加工処理定義から当該加工処理特徴を抽出し、
前記データ加工処理定義は、データ加工処理の内容を定義したデータセットであり、当該データ加工処理に対する入力データの定義と、当該入力データを用いて当該データ加工処理が行われた結果である出力データの定義とを含み、
(a2)前記検索装置が、当該データ加工処理定義と、当該データ加工処理定義に関連付けられたデータ傾向とを登録し、当該データ加工処理定義から加工処理特徴が抽出された場合には、当該データ加工処理定義に関連付けられた当該抽出された加工処理特徴を前記記憶部に登録し、
(B)前記検索装置が、検索処理のために指定されたデータ加工処理定義の入力を受け付けた場合、
(b1)前記検索装置が、当該データ加工処理定義に加工処理特徴が存在するか否かを判断し、当該判断の結果が真の場合に、当該データ加工処理定義から当該加工処理特徴を抽出し、
(b2)前記検索装置が、当該データ加工処理定義から加工処理特徴が抽出された場合に、それぞれが分析について登録済の1以上のデータ加工処理定義にそれぞれ対応した1以上の加工処理特徴から、当該抽出された加工処理特徴に類似する加工処理特徴を検索し、
(b3)前記検索装置が、前記類似する加工処理特徴を有するデータ加工処理定義と当該データ加工処理定義に関連付いているデータ傾向とを表す情報を含んだ検索結果を、前記インターフェース部に接続されている表示デバイスに表示する、
検索方法。 In a search device including an interface unit, a storage unit, and a processor unit, the processor unit executes one or more computer programs stored in the storage unit,
(A) When the search device receives an input of a data processing definition specified for data registration processing and a data tendency of input data used in the data processing indicated by the data processing definition,
(A1) The search device determines whether or not a processing feature exists in the data processing definition, and if the result of the determination is true, extracts the processing feature from the data processing definition. ,
The data processing definition is a data set that defines the contents of the data processing, and defines input data for the data processing and output data that is a result of the data processing performed using the input data. Including the definition of
(A2) The search device registers the data processing definition and the data tendency associated with the data processing definition, and when a processing characteristic is extracted from the data processing definition, Registering the extracted processing characteristic associated with the processing definition in the storage unit,
(B) when the search device receives an input of a data processing definition specified for the search process,
(B1) The search device determines whether a processing feature exists in the data processing definition, and if the result of the determination is true, extracts the processing feature from the data processing definition. ,
(B2) when the search device extracts a processing feature from the data processing definition, from the one or more processing features respectively corresponding to the one or more data processing definitions registered for analysis, Search for processing features similar to the extracted processing features,
(B3) the search device is connected to the interface unit with a search result including information indicating a data processing definition having the similar processing characteristic and a data tendency associated with the data processing definition. Display on the display device
retrieval method.
(a1)当該データ加工処理定義に加工処理特徴が存在するか否かを判断し、当該判断の結果が真の場合に、当該データ加工処理定義から当該加工処理特徴を抽出し、
前記データ加工処理定義は、データ加工処理の内容を定義したデータセットであり、当該データ加工処理に対する入力データの定義と、当該入力データを用いて当該データ加工処理が行われた結果である出力データの定義とを含み、
(a2)当該データ加工処理定義と、当該データ加工処理定義に関連付けられたデータ傾向とを登録し、当該データ加工処理定義から加工処理特徴が抽出された場合には、当該データ加工処理定義に関連付けられた当該抽出された加工処理特徴を登録し、
(B)検索処理のために指定されたデータ加工処理定義の入力を受け付けた場合、
(b1)当該データ加工処理定義に加工処理特徴が存在するか否かを判断し、当該判断の結果が真の場合に、当該データ加工処理定義から当該加工処理特徴を抽出し、
(b2)当該データ加工処理定義から加工処理特徴が抽出された場合に、それぞれが分析について登録済の1以上のデータ加工処理定義にそれぞれ対応した1以上の加工処理特徴から、当該抽出された加工処理特徴に類似する加工処理特徴を検索し、
(b3)前記類似する加工処理特徴を有するデータ加工処理定義と当該データ加工処理定義に関連付いているデータ傾向とを表す情報を含んだ検索結果を表示する、
ことを計算機に実行させるコンピュータプログラム。 (A) When the input of the data processing definition specified for the data registration processing and the data tendency of the input data used in the data processing indicated by the data processing definition is received,
(A1) determining whether or not a processing feature exists in the data processing definition; if the result of the determination is true, extracting the processing feature from the data processing definition;
The data processing definition is a data set that defines the contents of the data processing, and defines input data for the data processing and output data that is a result of the data processing performed using the input data. Including the definition of
(A2) The data processing definition and the data trend associated with the data processing definition are registered, and when a processing characteristic is extracted from the data processing definition, the data processing definition is associated with the data processing definition. Register the extracted processing features that have been
(B) When the input of the data processing process definition specified for the search process is received,
(B1) determining whether a processing feature exists in the data processing definition, and if the result of the determination is true, extracting the processing feature from the data processing definition;
(B2) the if the data processing processed feature from the definition is extracted from one or more processing features, each respectively corresponding to one or more data processing definition registered for analysis, processing that is the extracted Search for a processing feature similar to the processing feature,
(B3) displaying said containing information representative of the data tends to have with relation to data processing definition and the data processing definition with processing characteristics similar to search results,
A computer program that causes a computer to do this.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018043561A JP6646699B2 (en) | 2018-03-09 | 2018-03-09 | Search device and search method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018043561A JP6646699B2 (en) | 2018-03-09 | 2018-03-09 | Search device and search method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019159608A JP2019159608A (en) | 2019-09-19 |
JP6646699B2 true JP6646699B2 (en) | 2020-02-14 |
Family
ID=67993496
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018043561A Active JP6646699B2 (en) | 2018-03-09 | 2018-03-09 | Search device and search method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6646699B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021133164A1 (en) * | 2019-12-24 | 2021-07-01 | Mimos Berhad | Unstructured data in enterprise data warehouse |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9563670B2 (en) * | 2013-03-14 | 2017-02-07 | Leidos, Inc. | Data analytics system |
US9996389B2 (en) * | 2014-03-11 | 2018-06-12 | International Business Machines Corporation | Dynamic optimization of workload execution based on statistical data collection and updated job profiling |
US9372690B2 (en) * | 2014-09-03 | 2016-06-21 | International Business Machines Corporation | Analysis of data integration job |
US20160350201A1 (en) * | 2015-05-27 | 2016-12-01 | International Business Machines Corporation | Etl data flow design assistance through progressive context matching |
JP6708919B2 (en) * | 2015-08-03 | 2020-06-10 | 富士通株式会社 | Information processing program, information processing apparatus, and record data processing method |
WO2018011895A1 (en) * | 2016-07-12 | 2018-01-18 | 株式会社日立製作所 | Data processing flow management system and method |
-
2018
- 2018-03-09 JP JP2018043561A patent/JP6646699B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019159608A (en) | 2019-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11200248B2 (en) | Techniques for facilitating the joining of datasets | |
US20200242111A1 (en) | Techniques for relationship discovery between datasets | |
US10915233B2 (en) | Automated entity correlation and classification across heterogeneous datasets | |
CN106796595B (en) | Declarative language and visualization system for recommended data transformation and repair | |
US8234248B2 (en) | Tracking changes to a business object | |
US20190251471A1 (en) | Machine learning device | |
US11204707B2 (en) | Scalable binning for big data deduplication | |
US11681710B2 (en) | Entity extraction rules harvesting and performance | |
JP7015319B2 (en) | Data analysis support device, data analysis support method and data analysis support program | |
US20180329873A1 (en) | Automated data extraction system based on historical or related data | |
JP5398663B2 (en) | Data processing apparatus, data processing method, and program | |
US10216792B2 (en) | Automated join detection | |
US8271493B2 (en) | Extensible mechanism for grouping search results | |
US20220004885A1 (en) | Computer system and contribution calculation method | |
JP6646699B2 (en) | Search device and search method | |
JP6432266B2 (en) | Grouping method, grouping device, and grouping program | |
CN113760891A (en) | Data table generation method, device, equipment and storage medium | |
CN111984797A (en) | Customer identity recognition device and method | |
JP7015320B2 (en) | Data analysis support device, data analysis support method and data analysis support program | |
US20190265954A1 (en) | Apparatus and method for assisting discovery of design pattern in model development environment using flow diagram | |
JP6340990B2 (en) | Message display method, message display device, and message display program | |
WO2018000533A1 (en) | Method and apparatus for providing search recommendation information | |
WO2024079833A1 (en) | Information processing device, output method, and output program | |
CN115860010A (en) | Topic mining method and related device | |
JP2014194608A (en) | Retrieval system, retrieval method and retrieval program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180727 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190513 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190625 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190726 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191217 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200110 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6646699 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |