JP2021061063A - 推薦されるデータ変換および修復のための宣言型言語およびビジュアライゼーションシステム - Google Patents
推薦されるデータ変換および修復のための宣言型言語およびビジュアライゼーションシステム Download PDFInfo
- Publication number
- JP2021061063A JP2021061063A JP2021004135A JP2021004135A JP2021061063A JP 2021061063 A JP2021061063 A JP 2021061063A JP 2021004135 A JP2021004135 A JP 2021004135A JP 2021004135 A JP2021004135 A JP 2021004135A JP 2021061063 A JP2021061063 A JP 2021061063A
- Authority
- JP
- Japan
- Prior art keywords
- data
- column
- conversion
- service
- conversion instruction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/211—Schema design and management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2379—Updates performed during online database operations; commit processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
- G06F3/04842—Selection of displayed objects or displayed text elements
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
本願は、2014年9月26日に出願され「DECLARATIVE LANGUAGE AND VISUALIZATION
SYSTEM FOR RECOMMENDED DATA TRANSFORMATIONS AND REPAIRS」と題された米国仮出願第62/056,471号に基づく利益および優先権を主張する2015年9月24日に出願され「DECLARATIVE LANGUAGE AND VISUALIZATION SYSTEM FOR RECOMMENDED DATA TRANSFORMATIONS AND REPAIRS」と題された米国非仮特許出願第14/864,496号に基づく利益および優先権を主張する。
1)2014年9月26日に出願され「METHOD FOR SEMANTIC ENTITY EXTRACTION BASED ON GRAPH MATCHING WITH AN EXTERNAL KNOWLEDGEBASE AND SIMILARITY RANKING OF DATASET METADATA FOR SEMANTIC INDEXING, SEARCH, AND RETRIEVAL」と題された米国仮出願第62/056,468号
2)2014年9月26日に出願され「DYNAMIC VISUAL PROFILING AND VISUALIZATION
OF HIGH VOLUME DATASETS AND REAL-TIME SMART SAMPLING AND STATISTICAL PROFILING OF EXTREMELY LARGE DATASETS」と題された米国仮出願第62/056,474号
3)2014年9月26日に出願され「AUTOMATED ENTITY CORRELATION AND CLASSIFICATION ACROSS HETEROGENEOUS DATASETS」と題された米国仮出願第62/056,475
号
4)2014年9月26日に出願され「DECLARATIVE EXTERNAL DATA SOURCE IMPORTATION, EXPORTATION, AND METADATA REFLECTION UTILIZING HTTP AND HDFS PROTOCOLS」と題された米国仮出願第62/056,476号
5)2015年5月18日に出願され「CATEGORY LABELING」と題された米国仮出願第
62/163,296号
6)2015年8月11日に出願され「SIMILARITY METRIC ANALYSIS AND KNOWLEDGE SCORING SYSTEM」と題された米国仮出願第62/203,806号
上記特許出願の内容全体を、すべての目的のために本明細書に引用により援用する。
本開示は、概してデータの準備および分析に関する。より具体的には、推薦されるデータ変換および修復のための対話型ビジュアライゼーションを生成するための技術が開示される。
データセットを抽出、修復、および強化することにより、後のインデックス作成およびクラスタ化のための、より精密なエンティティのレゾリューションおよび相関を得る。データ強化サービスは、異種のデータセットの大規模なデータの準備、修復、および強化を実行するための視覚推薦エンジンおよび言語を含み得る。これにより、ユーザは、推薦された強化(たとえば変換および修復)がどのようにユーザのデータに影響しどのように調整を必要に応じて実行するかを、選択し確認することができる。データ強化サービスは、ユーザインターフェイスを通してユーザからのフィードバックを受けることができ、かつ、ユーザからのフィードバックに基づいて推薦をフィルタリングすることができる。
プロファイルは、上記データの少なくとも1つの列において識別された複数のパターンと、上記データの少なくとも1つの列に対応付けられた少なくとも1つのデータビジュアライゼーションとを示す。
以下の記載において、説明のために、具体的な詳細事項を述べることによって本発明の実施形態が十分に理解されるようにする。しかしながら、これらの具体的な詳細事項がなくてもさまざまな実施形態を実施し得ることが明らかであろう。図面および説明は限定を意図したものではない。
1つ以上のバッチで処理することができる。いくつかの実施形態において、データを受信しながら処理するストリーミングパイプラインを提供することができる。
ウンロードとして、提供することができる。
てもよい。
散コンピューティングフレームワークを実装するための一組のライブラリを提供するApache Sparkを用いて実装できる。Apache Sparkは、マップ、低減、フィルタ、ソート、またはサンプルクラスタ処理ジョブ要求を、YARNのような有効なリソースマネージャに送ることができる。いくつかの実施形態において、クラスタ210は、たとえばCloudera(登録商標)が提供する分散ファイルシステム製品を用いて実装できる。たとえばCloudera(登録商標)が提供するDFSは、HDFSおよびYARNを含み得る。
る。データ強化サービス302は、いくつかのサブシステムおよび/またはモジュールで構成されたモジュールであってもよく、その中に含まれるいくつかは図示されていない可能性もある。データ強化サービス302のサブシステムおよび/またはモジュールの数は、図示されているものの数より多くても少なくてもよく、2つ以上のサブシステムおよび/またはモジュールを組合わせてもよく、または、異なる構成または配置のサブシステムおよび/またはモジュールであってもよい。いくつかの実施形態において、データ強化サービス302は、ユーザインターフェイス306と、採集エンジン328と、推薦エンジン308と、知識サービス310と、プロファイルエンジン326と、変換エンジン322と、準備エンジン312と、公開エンジン324とを含み得る。データ強化サービス302を実装する要素は、上記のようなセマンティック処理パイプラインを実装するように機能し得る。
ュータ、デスクトップ、ラップトップ、携帯電話、タブレット等のモバイルまたはハンドヘルドデバイス、および、その他の種類のデバイスを含むが、これらに限定されない。通信ネットワークは、クライアントデバイス304とデータ強化サービス302との間の通信を容易にする。通信ネットワークの種類はさまざまな種類であり得る。この通信ネットワークは1つ以上の通信ネットワークを含み得る。通信ネットワーク106の例は、インターネット、ワイドエリアネットワーク(WAN)、ローカルエリアネットワーク(LAN)、イーサネット(登録商標)ネットワーク、パブリックまたはプライベートネットワーク、有線ネットワーク、無線ネットワーク等と、その組合わせを含むが、これらに限定されない。IEEE 802.XXプロトコルスーツ、TCP/IP、IPX、SAN、AppleTalk、Bluetooth、およびその他のプロトコル等の、有線プロトコルも無線プロトコルも含む異なる通信プロトコルを用いて通信を容易にしてもよい。一般的に、通信ネットワークはクライアントとデータ強化サービス302との通信を容易にするいかなる種類の通信ネットワークまたはインフラストラクチャも含み得る。
ッシュ表、連結リスト、またはそれ以外の種類のデータ構造を含む、データ構造に基づき得る。上記のように、データソースは、パブリッククラウドストレージサービス311、プライベートクラウドストレージサービス313、さまざまな他のクラウドサービス315、URLまたはウェブベースのデータソース317、または、その他任意のアクセス可能なデータソースを含み得る。クライアント304からのデータ強化要求は、データソースおよび/または特定のデータ(データソース309またはクライアントデータストア307を通して入手可能な、表、列、ファイル、またはその他任意の構造化または非構造化データ)を特定することができる。そうすると、データ強化要求サービス302は、特定されたデータソースにアクセスして上記データ強化要求において特定された特定のデータを取得してもよい。データソースは、アドレス(たとえばURL)によって、ストレージプロバイダ名によって、またはその他の識別子によって特定できる。いくつかの実施形態において、データソースへのアクセスを、アクセス管理サービスによって制御してもよい。クライアント304は、ユーザに対し、身分証明(たとえばユーザ名とパスワード)入力要求および/またはデータ強化サービス302に対してデータソースにアクセスする権限を与えるための要求を示してもよい。
のような命令またはコードを用いて実装されるルーチンおよび/または技術によって実行してもよい。正規化されたフォーマットにより、データソースから取得したデータが正規化されたものを見ることができる。いくつかの実施形態において、準備エンジン312は、多数の異なるファイルタイプを読み出すことができる。準備エンジン312は、データを正規化して文字で区切られた形式(character separated form)(たとえばタブで区切られた値(tab separated values)、カンマで区切られた値(comma separated values)等)、または、階層データ用のJavaScript(登録商標)オブジェクト表記法(JavaScript
Object Notation)(JSON)文書にすることができる。いくつかの実施形態において、さまざまなファイルフォーマットを認識し正規化することができる。たとえば、Microsoft Excel(登録商標)フォーマット(たとえばXLSまたはXLSX)、Microsoft Word(登録商標)フォーマット(たとえばDOCまたはDOX)、ポータブルドキュメント
フォーマット(PDF)、JSONのような階層フォーマット、および拡張マークアップ言語(XML)等の、標準ファイルフォーマットをサポートすることができる。いくつかの実施形態において、さまざまなバイナリ符号化ファイルフォーマットおよびシリアル化されたオブジェクトデータを読み出して復号することもできる。いくつかの実施形態において、データは、Unicodeフォーマット(UTF−8)符号化においてパイプラインに与
えることができる。準備エンジン312は、コンテキスト抽出と、データ強化サービス302が予測するファイルタイプへの変換を実行することができるとともに、データソースから文書レベルメタデータを抽出することができる。
トから1つ以上のデータ列を有する表形式のフォーマットに修正または変換することによって正規化されることもある。
報に基づいてデータの少なくとも1つの列をリネームするための命令を含み得る。データの少なくとも1つの列をデフォルト名にリネームするための他の変換命令を受けることもある。デフォルト名は、予め定められた名称を含み得る。デフォルト名は、データの列の名称を判断できないまたはこの列の名称が定義されていない場合の、規定のいかなる名称であってもよい。変換命令は、エンティティ情報に基づいて少なくとも1つの列を再フォーマットするための変換命令、および、エンティティ情報に基づいてデータの少なくとも1つの列を難読化するための命令を含み得る。いくつかの実施形態において、変換命令は、エンティティ情報に基づいて知識サービスから取得したデータの1つ以上の列を追加するための強化命令を含み得る。
いずれかのフォーマット、またはその組合わせ等のフォーマットで格納されてもよい。
む通信(たとえばツイート)の追跡を希望する場合、変換アクションに、与えられたホワイトリストを含む上記2つのワードを追加すればよい。これは、ユーザのためにデータを強化し得る方法の一例に過ぎない。
は1つ以上の処理ユニットによって実行可能であり、そうすることによって受信データを変換できる。このように、推薦エンジン308は、ユーザインターフェイス306と知識サービス310との間を媒介する機能を果たすことができる。
トに提供してもよい。たとえば、メタデータを推薦エンジン308に提供することにより、推薦エンジン308が、識別されたパターンに基づいてデータの強化のための推薦を決定できるようにしてもよい。推薦エンジン308は、パターンを用いて知識サービス310に問合せを行なうことにより、パターンに関する追加情報を取得することができる。知識サービス310は、1つ以上の知識ソース340を含み得る、または、1つ以上の知識ソース340にアクセスできる。知識ソースは、ウェブサイト、ウェブサービス、キュレートされた知識ストア、およびその他のソースが公開する、公的に入手可能な情報を含み得る。
は複合用語またはnグラム、ならびに、この固有語彙によってマッチングされる参照知識カテゴリ、日付/時間パターンの発見およびフォーマッティング、参照データ一致、ならびに、原因となる列見出しラベルを、含み得る。
ィティに対応するエンティティ情報を用いて、データを強化する、たとえばデータを正規化する、データを修復する、および/またはデータを増補(augment)することができる
。
を用いて呼び出されたオペレーションによって実施されてもよい。変換スクリプトは、APIを用いて定義された変換オペレーションに基づいて構成されてもよい。オペレーションは推薦に基づいて実行されてもよい。
してデータソースでデータを修復することができる。修復は、自動的に列をリネームすること、列内のストリングまたはパターンを置換すること、テキストのケースを修正すること、データを再フォーマットすること等を含み得る。たとえば、変換エンジン322は、変換スクリプトを生成することにより、日付の列を、推薦エンジン308からの、列内の日付のフォーマットの修正または変換の推薦に基づいて、変換することができる。推薦を複数の推薦の中から選択して、プロファイルエンジン326によって処理されたデータソースからのデータを強化または修正してもよい。推薦エンジン308は、プロファイルエンジン326から提供されたメタデータまたはプロファイルに基づいて推薦を決定してもよい。メタデータは異なるフォーマットについて識別された日付の列を示し得る(たとえばMM/DD/YYYY、DD−MM−YY等)。変換エンジン322によって生成された変換スクリプトは、たとえば、推薦エンジン308からの提案に基づいて列を分割および/または結合することができる。変換エンジン322はまた、プロファイルエンジン326から受けたデータソースプロファイルに基づいて列を削除してもよい(たとえば空の列、またはユーザが望まない情報を含む列を削除する)。
するオペレーションを記述する構文を用いて定義し得る。よって、構文はオペレータ−ツリーの変換/簡約化を記述し得る。変換スクリプトは、グラフィカルユーザインターフェイスを介した対話を通してユーザが選択した推薦に基づいてまたはユーザによって要求されて生成されてもよい。推薦される変換の例は、図4A、図4B、図4C、および図4Dを参照しながら説明する。グラフィカルユーザインターフェイスを通してユーザが指定した変換オペレーションに基づいて、変換エンジン322はこのオペレーションに従って変換オペレーションを実行する。変換オペレーションをユーザに対して推薦することによりデータセットを強化してもよい。
サービス310は、2つ以上のデータセット間の意味類似性を判断するための方法を実装することができる。これは、知識サービス310を通して入手できる参照データに対してユーザのデータをマッチングする場合も使用できる。知識サービス310は、本開示に記載されている類似性メトリック分析を実行し得る。知識サービス310によって実施される技術は、本明細書に援用されている文献に記載されている技術を含む、本開示に記載されている技術を含む。
の知識ソース340からのワードとマッチングすることができる。
数またはその他の類似性メトリック)を実装することができる。次に、増補データセットと一致する(たとえば類似性メトリックが最大である)カテゴリの名称をラベルとして入力データセットに適用することができる。
に使用してもよい。上記技術に対していかなる類似性メトリックも使用し得ることを当業者は理解するであろう。代替の類似性メトリックのいくつかの例は、Dice-Sorensen係数
、Tversky係数、Tanimotoメトリック、およびコサイン類似度メトリックを含むが、これ
らに限定される訳ではない。
きる。よって、この値は、用語と用語の一致度を示すが、入力データセットと知識ソース内の各種用語との間の一致度は示さない場合がある。
用語を、その用語と候補カテゴリとの間の類似性のパーセンテージを示す値のような、完全値整数(whole-value integer)分の1とみなしてもよい。たとえば、タイヤメーカー
と名字との間の類似度メトリックを計算した結果、類似度メトリックは0.3かもしれない。一方、タイヤメーカーと企業名との間の類似度メトリックを計算した結果、類似度メトリックは0.5かもしれない。類似度メトリックを表わす非完全整数値を細かく比較することにより、一致度が高いカテゴリ名をより正確にすることができる。一致度が高いカテゴリ名を、値1に最も近い類似度メトリックに基づいて最も適切なカテゴリ名として選択してもよい。上記の例において、類似度メトリックに基づくと、企業名は正しいカテゴリである可能性が高い。よって、知識サービス310は、「名字」ではなく「企業」を、タイヤメーカーを含む、ユーザから提供されたデータ列に対応付ければよい。
バイスのユーザインターフェイスに、グラフィカルなビジュアライゼーションを表示できるようにする。いくつかの実施形態において、グラフィカルなビジュアライゼーションはプロファイリング結果を提供し得る。
ている等)。しかしながら、推薦される変換404はユーザのデータに自動的に適用されていない。
であることを示す。いくつかの実施形態において、確率が高いことにより、変換エンジンが自動的にcol_0008のラベルを「city」にするようにできる。
ク)と、列ごとのビジュアライゼーション584とを含み得るプロファイルメトリックパネル580を示す。列ごとのビジュアライゼーション584は、ユーザによって選択されるおよび/または使用されることにより、(たとえばクリック、ドラッグ、スワイプ等によって)データをナビゲートすることができる。上記の例は、小さなデータセットへの簡単な変換を示す。同様のまたはより複雑な処理を、何十億もの記録を含む大きなデータセットに自動的に適用することもできる。
取得してもよい。
ービスまたはソフトウェアアプリケーションを実行するように適合させてもよい。特定の実施形態において、サーバ712はその他のサービスまたはソフトアプリケーションも提供し得る。これは非仮想および仮想環境を含み得る。いくつかの実施形態において、これらのサービスは、ウェブベースもしくはクラウドサービスとして、または、サービスとしてのソフトウェア(SaaS)モデルの下で、クライアントコンピューティングデバイス702,704,706,および/または708のユーザに提供し得る。クライアントコンピューティングデバイス702、704および706,および/または708を操作するユーザは、1つ以上のクライアントアプリケーションを利用してサーバ712と対話することにより、これらのコンポーネントによって提供されるサービスを利用し得る。
ルオペレーティングシステムを実行する、ポータブルハンドヘルドデバイス(たとえばiPhone(登録商標)、携帯電話、iPad(登録商標)、コンピューティングタブレット、携帯情報端末(PDA))またはウェアラブルデバイス(たとえばGoogle Glass(登録商標)ヘッドマウントディスプレイ)を含み得る。これらのデバイスは、さまざまなインターネット関連アプリケーション、電子メール、ショートメッセージサービス(SMS)アプリケーションをサポートし得るものであり、その他さまざまな通信プロトコルを使用し得る。クライアントコンピューティングデバイスはまた、一例として、さまざまなバージョンのMicrosoft Windows(登録商標)、Apple Macintosh(登録商標)、および/またはLinux(登録商標)オペレーティングシステムを実行するパーソナルコンピュータおよび/ま
たはラップトップコンピュータ含む汎用パーソナルコンピュータを含み得る。クライアントコンピューティングデバイスは、限定されないがたとえばGoogle Chrome OS等のさまざまなGNU/Linux(登録商標)オペレーティングシステムを含む市場で入手可能な多様なUNIX(登録商標)またはUNIX(登録商標)系オペレーティングシステムのうちのいずれかを
実行するワークステーションコンピュータであってもよい。クライアントコンピューティングデバイスはまた、ネットワーク710を通して通信可能な、シンクライアントコンピュータ、インターネット接続可能なゲームシステム(たとえばKinect(登録商標)ジェスチャー入力デバイスを有するまたは有しないMicrosoft Xboxゲームコンソール)、および/またはパーソナルメッセージングデバイス等の電子デバイスを含み得る。
transfer protocol)サーバ、CGI(common gateway interface)サーバ、JAVA(登録商標)サーバ、データベースサーバ等を含む、さまざまな付加的なサーバアプリケーションおよび/またはミッドティアアプリケーションのうちのいずれかを実行し得る。典型的なデータベースサーバは、Oracle、Microsoft、Sybase、IBM(International Business Machines)等から市販されているものを含むが、これらに限定されない。
商標)フィード、Facebook(登録商標)更新、またはリアルタイム更新を含み得る。これらはセンサデータアプリケーション、株式相場ディスプレイデバイス、ネットワーク性能測定ツール(たとえばネットワーク監視およびトラフィック管理アプリケーション)、クリックストリーム分析ツール、自動車トラフィック監視等に関連するリアルタイムイベントを含み得る。また、サーバ712は、クライアントコンピューティングデバイス702,704,706,および708の1つ以上のディスプレイデバイスを介してデータフィードおよび/またはリアルタイムイベントを表示するための1つ以上のアプリケーションを含み得る。
ラクチャシステム802との間のデータの通信およびやり取りを容易にし得る。各ネットワークは、ネットワーク810について先に述べたものを含むさまざまな市場で入手可能なプロトコルのいずれかを使用してデータ通信をサポートすることができる、当業者によく知られた任意のタイプのネットワークであってもよい。
が、このようなデータに対して機能することにより、それを示すまたはデータに対する外部からの力をもしくはそれが表わしているものをシミュレートすることができる。これらのデータセットは、データベース内でそうでなければ構造化モデルに従って組織されたデータのような構造化データ、および/または非構造化データ(たとえば電子メール、画像、データBLOB((binary large object)バイナリラージオブジェクト)、ウェブペ
ージ、複雑なイベント処理)を含み得る。より多くの(またはより少ない)計算リソースを比較的素早く目標物に向ける実施形態の能力を高めることにより、企業、政府機関、リサーチ組織、私人、同じ目的を有する個人もしくは組織、またはその他のエンティティからの要求に基づいて大きなデータセットに対するタスクを実行するにあたり、クラウドインフラストラクチャシステムをより有効にすることができる。
合およびビジネス上のフレキシビリティのためのソリューションを提供するサービスを含む。
ウドサービスを含み得る。一実施形態において、データベースクラウドサービスは、組織がデータベースリソースをプールし、かつデータベースクラウドの形態でのサービスとして顧客にデータベースを提示することを可能にする共有サービスデプロイメントモデルをサポートし得る。ミドルウェアクラウドサービスは、顧客がさまざまなビジネスアプリケーションを展開しデプロイするためのプラットフォームを提供してもよく、Java(登録商標)クラウドサービスは、クラウドインフラストラクチャシステムにおいて顧客がJava(登録商標)アプリケーションをデプロイするためのプラットフォームを提供してもよい。
特定数の時間クラウドインフラストラクチャシステムのリソースを利用できるようにし、次いで異なるタイムゾーンに位置する別の組のユーザに対して同じリソースを再度割当てることによって、リソースの利用を最大化してもよい。
よって出されたオーダーのためのサービスおよびリソースのプロビジョニングを調整するように構成されている。いくつかのインスタンスにおいて、オーダーオーケストレーションモジュール822は、プロビジョニングのためにオーダープロビジョニングモジュール824のサービスを用いてもよい。特定の実施形態において、オーダーオーケストレーションモジュール822は、各オーダーに関連付けられたビジネスプロセスの管理を可能にし、オーダーがプロビジョニングに進むべきか否かを判断するためにビジネスロジックを適用する。
周辺サブシステムと通信する処理部904を含むさまざまなサブシステムを含む。これらの周辺サブシステムは、処理加速部906と、I/Oサブシステム908と、記憶サブシステム918と、通信サブシステム924とを含み得る。記憶サブシステム918は、有形のコンピュータ読取可能記憶媒体922とシステムメモリ910とを含み得る。
ス、Micro Channel Architecture(MCA)バス、Enhanced ISA(EISA)バス、Video Electronics Standards Association(VESA)ローカルバス、およびPeripheral Component Interconnect(PCI)バスを含み得る。
バイスを制御しこれと対話することを可能にするMicrosoft Kinect(登録商標)モーションセンサ、Microsoft Xbox(登録商標)360ゲームコントローラ、ジェスチャーおよび音声コマンドを用いた入力を受けるためのインターフェイスを提供するデバイス等の、動き検知および/またはジェスチャー認識デバイスを含み得る。ユーザインターフェイス入力デバイスはまた、Google Glass(登録商標)まばたき検出器等のアイジェスチャー認識デバイスを含み得る。これは、ユーザの目の活動(たとえば撮影中および/またはメニュー選択中の「まばたき」)を検出し、入力デバイス(たとえばGoogle Glass(登録商標))に対する入力としてのアイジェスチャーを変換する。加えて、ユーザインターフェイス入力デバイスは、ユーザが音声コマンドによって音声認識システム(たとえばSiri(登録商標)ナビゲーター)と対話することを可能にする音声認識検知装置を含み得る。
う。RAMは典型的に、処理サブシステム904が現在処理し実行しているデータおよび/またはプログラムモジュールを含む。いくつかの実装例において、システムメモリ910は、スタティックランダムアクセスメモリ(SRAM)またはダイナミックランダムアクセスメモリ(DRAM)等の複数の異なる種類のメモリを含み得る。
ペレーティングシステム、市場で入手可能な多様なUNIX(登録商標)またはUNIX(登録商標)系オペレーティングシステム(限定されないが多様なGNU/Linux(登録商標)オペレ
ーティングシステム、Google Chrome(登録商標)OS等を含む)、および/またはiOS、Windows(登録商標)Phone、Android(登録商標) OS、BlackBerry(登録商標) 10 OS、Palm(登録商標) OSオペレーティングシステム等のモバイルオペレーティングシステムを
含み得る。
ドライブを含み得る。コンピュータ可読記憶媒体922は、限定されないが、Zip(登録商標)ドライブ、フラッシュメモリカード、ユニバーサルシリアルバス(USB)フラッシュドライブ、セキュアデジタル(SD)カード、DVDディスク、デジタルビデオテープ等を含み得る。コンピュータ読取可能記憶媒体922はまた、フラッシュメモリベースのSSD、企業フラッシュドライブ、ソリッドステートROM等といった不揮発性メモリベースのソリッドステートドライブ(SSD)、ソリッドステートRAM、ダイナミックRAM、スタティックRAM、DRAMベースのSSD、磁気抵抗RAM(MRAM)SSD等の揮発性メモリベースのSSD、ならびにDRAMおよびフラッシュメモリベースのSSDの組合わせを用いるハイブリッドSSDを含み得る。コンピュータ可読媒体922は、コンピュータ可読命令、データ構造、プログラムモジュール、およびコンピュータシステム900のためのその他のデータのための記憶部を提供し得る。
。各仮想マシンは一般的にその他の仮想マシンから独立して実行される。
または、同一のプロセス対がその時々で異なる技術を用いてもよい。
Claims (20)
- 方法であって、
コンピュータシステムによって、1つ以上のデータソースからのデータにおけるパターンを識別するステップと、
知識サービスからのエンティティ情報に対して前記パターンをマッチングするステップと、
前記エンティティ情報に基づいて前記データのための1つ以上の変換スクリプトを生成するステップと、
前記1つ以上の変換スクリプトに対応する1つ以上の推薦を生成するステップと、
前記1つ以上の推薦をユーザインターフェイスに表示させるステップと、
前記1つ以上の推薦に基づく変換命令を受けるステップと、
前記変換命令に基づいて前記データを変換するステップと、
前記変換命令に基づいて前記変換されたデータを1つ以上のデータターゲットに対して公開するステップとを含む、方法。 - 前記1つ以上のデータソースのうちの少なくとも1つのデータソースからデータの少なくとも1つの列の選択を受けるステップと、
前記データの少なくとも1つの列のデータプロファイルを表示させるステップとをさらに含み、前記データプロファイルは、前記データの少なくとも1つの列において識別された複数のパターンと、前記データの少なくとも1つの列に対応付けられた少なくとも1つのデータビジュアライゼーションとを示す、請求項1または2に記載の方法。 - 前記変換命令は、前記エンティティ情報に基づいてデータの少なくとも1つの列をリネームすることを指示する変換命令を含む、請求項1に記載の方法。
- 前記データの少なくとも1つの列をデフォルト名にリネームすることを指示する他の変換命令を受けるステップをさらに含む、請求項3に記載の方法。
- 前記変換命令は、前記エンティティ情報に基づいてデータの少なくとも1つの列を再フォーマットすることを指示する変換命令を含む、請求項1から4のいずれか一項に記載の方法。
- 前記変換命令は、前記エンティティ情報に基づいてデータの少なくとも1つの列を難読化することを指示する他の変換命令を含む、請求項5に記載の方法。
- 前記変換命令は、前記エンティティ情報に基づいて前記知識サービスから取得したデータの1つ以上の列を追加することを指示する強化命令を含む、請求項1から6のいずれか一項に記載の方法。
- システムであって、
複数のデータソースと、
複数のデータターゲットと、
クラウドコンピューティングインフラストラクチャシステムとを備え、前記クラウドコンピューティングインフラストラクチャシステムは、
少なくとも1つの通信ネットワークを通して前記複数のデータソースに通信可能に結合されかつ前記複数のデータターゲットに通信可能に結合された1つ以上のプロセッサと、
前記1つ以上のプロセッサに結合されたメモリとを含み、前記メモリは、データ強化サービスを提供することを指示する命令を格納し、前記命令は、前記1つ以上のプロセッ
サによって実行されたときに、前記1つ以上のプロセッサに、
データ強化要求をクライアントデバイスから受けることと、
前記データ強化要求において指定されている少なくとも1つのデータソースからのデータにおけるパターンを識別することと、
知識サービスからのエンティティ情報に対して前記パターンをマッチングすることと、
前記エンティティ情報に基づいて前記データのための1つ以上の変換スクリプトを生成することと、
前記1つ以上の変換スクリプトに対応する1つ以上の推薦を生成することと、
前記1つ以上の推薦を前記クライアントデバイス上のユーザインターフェイスに表示させることと、
前記1つ以上の推薦に基づく変換命令を受けることと、
前記変換命令に基づいて前記データを変換することと、
前記変換命令に基づいて前記変換されたデータを1つ以上のデータターゲットに対して公開することとを実行させる、システム。 - 前記命令はさらに、前記1つ以上のプロセッサによって実行されたときに、前記1つ以上のプロセッサに、
前記複数のデータソースのうちの少なくとも1つのデータソースからデータの少なくとも1つの列の選択を受けることと、
前記データの少なくとも1つの列のデータプロファイルを前記ユーザインターフェイスに表示させることとを実行させ、前記データプロファイルは、前記データの少なくとも1つの列において識別された複数のパターンと、前記データの少なくとも1つの列に対応付けられた少なくとも1つのデータビジュアライゼーションとを示す、請求項8に記載のシステム。 - 前記変換命令は、前記エンティティ情報に基づいてデータの少なくとも1つの列をリネームすることを指示する変換命令を含む、請求項8に記載のシステム。
- 前記命令はさらに、前記1つ以上のプロセッサによって実行されたときに、前記1つ以上のプロセッサに、前記データの少なくとも1つの列をデフォルト名にリネームすることを指示する他の変換命令を受けることを実行させる、請求項10に記載のシステム。
- 前記変換命令は、前記エンティティ情報に基づいてデータの少なくとも1つの列を再フォーマットすることを指示する変換命令を含む、請求項8に記載のシステム。
- 前記変換命令は、前記エンティティ情報に基づいてデータの少なくとも1つの列を難読化することを指示する他の変換命令を含む、請求項12に記載のシステム。
- 前記変換命令は、前記エンティティ情報に基づいて前記知識サービスから取得したデータの1つ以上の列を追加することを指示する強化命令を含む、請求項8に記載のシステム。
- 非一時的なコンピュータ可読記憶媒体であって、前記非一時的なコンピュータ可読記憶媒体に格納された命令を含み、前記命令は、プロセッサによって実行されたときに、前記プロセッサに、以下のオペレーションを実行させ、前記オペレーションは、
コンピュータシステムによって、1つ以上のデータソースからのデータにおけるパターンを識別することと、
知識サービスからのエンティティ情報に対して前記パターンをマッチングすることと、
前記エンティティ情報に基づいて前記データのための1つ以上の変換スクリプトを生成
することと、
前記1つ以上の変換スクリプトに対応する1つ以上の推薦を生成することと、
前記1つ以上の推薦をユーザインターフェイスに表示させることと、
前記1つ以上の推薦に基づく変換命令を受けることと、
前記変換命令に基づいて前記データを変換することと、
前記変換命令に基づいて前記変換されたデータを1つ以上のデータターゲットに対して公開することとを含む、非一時的なコンピュータ可読記憶媒体。 - 前記オペレーションは、
前記1つ以上のデータソースのうちの少なくとも1つのデータソースからデータの少なくとも1つの列の選択を受けることと、
前記データの少なくとも1つの列のデータプロファイルを表示させることとをさらに含み、前記データプロファイルは、前記データの少なくとも1つの列において識別された複数のパターンと、前記データの少なくとも1つの列に対応付けられた少なくとも1つのデータビジュアライゼーションとを示す、請求項15に記載の非一時的なコンピュータ可読記憶媒体。 - 前記変換命令は、前記エンティティ情報に基づいてデータの少なくとも1つの列をリネームすることを指示する変換命令を含む、請求項15に記載の非一時的なコンピュータ可読記憶媒体。
- 前記オペレーションは、前記データの少なくとも1つの列をデフォルト名にリネームすることを指示する他の変換命令を受けることをさらに含む、請求項17に記載の非一時的なコンピュータ可読記憶媒体。
- 前記変換命令は、
前記エンティティ情報に基づいてデータの少なくとも1つの列を再フォーマットすることを指示する変換命令と、
前記エンティティ情報に基づいてデータの少なくとも1つの列を難読化することを指示する他の変換命令とを含む、請求項15に記載の非一時的なコンピュータ可読記憶媒体。 - 前記変換命令は、前記エンティティ情報に基づいて前記知識サービスから取得したデータの1つ以上の列を追加することを指示する強化命令を含む、請求項15に記載の非一時的なコンピュータ可読記憶媒体。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462056471P | 2014-09-26 | 2014-09-26 | |
US62/056,471 | 2014-09-26 | ||
US14/864,496 | 2015-09-24 | ||
US14/864,496 US10891272B2 (en) | 2014-09-26 | 2015-09-24 | Declarative language and visualization system for recommended data transformations and repairs |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017516322A Division JP2017534108A (ja) | 2014-09-26 | 2015-09-25 | 推薦されるデータ変換および修復のための宣言型言語およびビジュアライゼーションシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021061063A true JP2021061063A (ja) | 2021-04-15 |
JP7148654B2 JP7148654B2 (ja) | 2022-10-05 |
Family
ID=54330030
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017516322A Pending JP2017534108A (ja) | 2014-09-26 | 2015-09-25 | 推薦されるデータ変換および修復のための宣言型言語およびビジュアライゼーションシステム |
JP2021004135A Active JP7148654B2 (ja) | 2014-09-26 | 2021-01-14 | 推薦されるデータ変換および修復のための宣言型言語およびビジュアライゼーションシステム |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017516322A Pending JP2017534108A (ja) | 2014-09-26 | 2015-09-25 | 推薦されるデータ変換および修復のための宣言型言語およびビジュアライゼーションシステム |
Country Status (5)
Country | Link |
---|---|
US (1) | US10891272B2 (ja) |
EP (1) | EP3198484A1 (ja) |
JP (2) | JP2017534108A (ja) |
CN (1) | CN106796595B (ja) |
WO (1) | WO2016049460A1 (ja) |
Families Citing this family (96)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9396283B2 (en) | 2010-10-22 | 2016-07-19 | Daniel Paul Miranker | System for accessing a relational database using semantic queries |
US10073858B2 (en) | 2013-05-16 | 2018-09-11 | Oracle International Corporation | Systems and methods for tuning a storage system |
US9475096B2 (en) * | 2013-06-06 | 2016-10-25 | Wheel Recovery Systems, LLC | Core wheel processing system and method |
US10210246B2 (en) | 2014-09-26 | 2019-02-19 | Oracle International Corporation | Techniques for similarity analysis and data enrichment using knowledge sources |
US10891272B2 (en) | 2014-09-26 | 2021-01-12 | Oracle International Corporation | Declarative language and visualization system for recommended data transformations and repairs |
US10976907B2 (en) | 2014-09-26 | 2021-04-13 | Oracle International Corporation | Declarative external data source importation, exportation, and metadata reflection utilizing http and HDFS protocols |
USD847170S1 (en) | 2015-04-16 | 2019-04-30 | Vericle Corporation | Display screen with graphical user interface for practice workflow management |
US9514205B1 (en) | 2015-09-04 | 2016-12-06 | Palantir Technologies Inc. | Systems and methods for importing data from electronic data files |
US20170083013A1 (en) * | 2015-09-23 | 2017-03-23 | International Business Machines Corporation | Conversion of a procedural process model to a hybrid process model |
US11243919B2 (en) * | 2015-10-16 | 2022-02-08 | International Business Machines Corporation | Preparing high-quality data repositories sets utilizing heuristic data analysis |
US10445728B2 (en) * | 2015-12-29 | 2019-10-15 | Ariba, Inc. | Computer implemented systems and methods for secure data transactions across disparate computing networks |
US10380200B2 (en) | 2016-05-31 | 2019-08-13 | At&T Intellectual Property I, L.P. | Method and apparatus for enriching metadata via a network |
US11042548B2 (en) | 2016-06-19 | 2021-06-22 | Data World, Inc. | Aggregation of ancillary data associated with source data in a system of networked collaborative datasets |
US11042560B2 (en) | 2016-06-19 | 2021-06-22 | data. world, Inc. | Extended computerized query language syntax for analyzing multiple tabular data arrangements in data-driven collaborative projects |
US11036716B2 (en) | 2016-06-19 | 2021-06-15 | Data World, Inc. | Layered data generation and data remediation to facilitate formation of interrelated data in a system of networked collaborative datasets |
US11068847B2 (en) | 2016-06-19 | 2021-07-20 | Data.World, Inc. | Computerized tools to facilitate data project development via data access layering logic in a networked computing platform including collaborative datasets |
US10346429B2 (en) | 2016-06-19 | 2019-07-09 | Data.World, Inc. | Management of collaborative datasets via distributed computer networks |
US11023104B2 (en) | 2016-06-19 | 2021-06-01 | data.world,Inc. | Interactive interfaces as computerized tools to present summarization data of dataset attributes for collaborative datasets |
US10515085B2 (en) | 2016-06-19 | 2019-12-24 | Data.World, Inc. | Consolidator platform to implement collaborative datasets via distributed computer networks |
US11947554B2 (en) | 2016-06-19 | 2024-04-02 | Data.World, Inc. | Loading collaborative datasets into data stores for queries via distributed computer networks |
US10824637B2 (en) | 2017-03-09 | 2020-11-03 | Data.World, Inc. | Matching subsets of tabular data arrangements to subsets of graphical data arrangements at ingestion into data driven collaborative datasets |
US10699027B2 (en) | 2016-06-19 | 2020-06-30 | Data.World, Inc. | Loading collaborative datasets into data stores for queries via distributed computer networks |
US11755602B2 (en) | 2016-06-19 | 2023-09-12 | Data.World, Inc. | Correlating parallelized data from disparate data sources to aggregate graph data portions to predictively identify entity data |
US11941140B2 (en) | 2016-06-19 | 2024-03-26 | Data.World, Inc. | Platform management of integrated access of public and privately-accessible datasets utilizing federated query generation and query schema rewriting optimization |
US11036697B2 (en) | 2016-06-19 | 2021-06-15 | Data.World, Inc. | Transmuting data associations among data arrangements to facilitate data operations in a system of networked collaborative datasets |
US10438013B2 (en) | 2016-06-19 | 2019-10-08 | Data.World, Inc. | Platform management of integrated access of public and privately-accessible datasets utilizing federated query generation and query schema rewriting optimization |
US11334625B2 (en) | 2016-06-19 | 2022-05-17 | Data.World, Inc. | Loading collaborative datasets into data stores for queries via distributed computer networks |
US10853376B2 (en) | 2016-06-19 | 2020-12-01 | Data.World, Inc. | Collaborative dataset consolidation via distributed computer networks |
US11016931B2 (en) | 2016-06-19 | 2021-05-25 | Data.World, Inc. | Data ingestion to generate layered dataset interrelations to form a system of networked collaborative datasets |
US10691710B2 (en) | 2016-06-19 | 2020-06-23 | Data.World, Inc. | Interactive interfaces as computerized tools to present summarization data of dataset attributes for collaborative datasets |
US11042556B2 (en) | 2016-06-19 | 2021-06-22 | Data.World, Inc. | Localized link formation to perform implicitly federated queries using extended computerized query language syntax |
US11086896B2 (en) | 2016-06-19 | 2021-08-10 | Data.World, Inc. | Dynamic composite data dictionary to facilitate data operations via computerized tools configured to access collaborative datasets in a networked computing platform |
US10747774B2 (en) | 2016-06-19 | 2020-08-18 | Data.World, Inc. | Interactive interfaces to present data arrangement overviews and summarized dataset attributes for collaborative datasets |
US11042537B2 (en) | 2016-06-19 | 2021-06-22 | Data.World, Inc. | Link-formative auxiliary queries applied at data ingestion to facilitate data operations in a system of networked collaborative datasets |
US10984008B2 (en) | 2016-06-19 | 2021-04-20 | Data.World, Inc. | Collaborative dataset consolidation via distributed computer networks |
US10452975B2 (en) | 2016-06-19 | 2019-10-22 | Data.World, Inc. | Platform management of integrated access of public and privately-accessible datasets utilizing federated query generation and query schema rewriting optimization |
US11068475B2 (en) | 2016-06-19 | 2021-07-20 | Data.World, Inc. | Computerized tools to develop and manage data-driven projects collaboratively via a networked computing platform and collaborative datasets |
US11675808B2 (en) | 2016-06-19 | 2023-06-13 | Data.World, Inc. | Dataset analysis and dataset attribute inferencing to form collaborative datasets |
US10324925B2 (en) | 2016-06-19 | 2019-06-18 | Data.World, Inc. | Query generation for collaborative datasets |
US10645548B2 (en) | 2016-06-19 | 2020-05-05 | Data.World, Inc. | Computerized tool implementation of layered data files to discover, form, or analyze dataset interrelations of networked collaborative datasets |
US10353911B2 (en) | 2016-06-19 | 2019-07-16 | Data.World, Inc. | Computerized tools to discover, form, and analyze dataset interrelations among a system of networked collaborative datasets |
US10452677B2 (en) | 2016-06-19 | 2019-10-22 | Data.World, Inc. | Dataset analysis and dataset attribute inferencing to form collaborative datasets |
US11468049B2 (en) | 2016-06-19 | 2022-10-11 | Data.World, Inc. | Data ingestion to generate layered dataset interrelations to form a system of networked collaborative datasets |
US10067992B2 (en) * | 2016-07-13 | 2018-09-04 | International Business Machines Corporation | Flexible interactive data visualization enabled by dynamic attributes |
EP3282374A1 (en) | 2016-08-17 | 2018-02-14 | Palantir Technologies Inc. | User interface data sample transformer |
WO2018039264A1 (en) * | 2016-08-22 | 2018-03-01 | Oracle International Corporation | System and method for metadata-driven external interface generation of application programming interfaces |
US20180069925A1 (en) * | 2016-09-08 | 2018-03-08 | BigStream Solutions, Inc. | Systems and methods for automatic transferring of big data computations from centralized systems to at least one of messaging systems and data collection systems |
US10445062B2 (en) | 2016-09-15 | 2019-10-15 | Oracle International Corporation | Techniques for dataset similarity discovery |
US10650000B2 (en) | 2016-09-15 | 2020-05-12 | Oracle International Corporation | Techniques for relationship discovery between datasets |
US10565222B2 (en) | 2016-09-15 | 2020-02-18 | Oracle International Corporation | Techniques for facilitating the joining of datasets |
US10621195B2 (en) * | 2016-09-20 | 2020-04-14 | Microsoft Technology Licensing, Llc | Facilitating data transformations |
US10127268B2 (en) * | 2016-10-07 | 2018-11-13 | Microsoft Technology Licensing, Llc | Repairing data through domain knowledge |
US10776380B2 (en) * | 2016-10-21 | 2020-09-15 | Microsoft Technology Licensing, Llc | Efficient transformation program generation |
US11170020B2 (en) | 2016-11-04 | 2021-11-09 | Microsoft Technology Licensing, Llc | Collecting and annotating transformation tools for use in generating transformation programs |
CN107038073B (zh) | 2016-12-23 | 2021-05-11 | 创新先进技术有限公司 | 资源处理方法及装置 |
US10754872B2 (en) | 2016-12-28 | 2020-08-25 | Palantir Technologies Inc. | Automatically executing tasks and configuring access control lists in a data transformation system |
US11068453B2 (en) | 2017-03-09 | 2021-07-20 | data.world, Inc | Determining a degree of similarity of a subset of tabular data arrangements to subsets of graph data arrangements at ingestion into a data-driven collaborative dataset platform |
US12008050B2 (en) | 2017-03-09 | 2024-06-11 | Data.World, Inc. | Computerized tools configured to determine subsets of graph data arrangements for linking relevant data to enrich datasets associated with a data-driven collaborative dataset platform |
US11238109B2 (en) | 2017-03-09 | 2022-02-01 | Data.World, Inc. | Computerized tools configured to determine subsets of graph data arrangements for linking relevant data to enrich datasets associated with a data-driven collaborative dataset platform |
US10268688B2 (en) * | 2017-05-03 | 2019-04-23 | International Business Machines Corporation | Corpus-scoped annotation and analysis |
US10810472B2 (en) | 2017-05-26 | 2020-10-20 | Oracle International Corporation | Techniques for sentiment analysis of data using a convolutional neural network and a co-occurrence network |
US10942947B2 (en) * | 2017-07-17 | 2021-03-09 | Palantir Technologies Inc. | Systems and methods for determining relationships between datasets |
US10754820B2 (en) | 2017-08-14 | 2020-08-25 | Palantir Technologies Inc. | Customizable pipeline for integrating data |
CN107609141B (zh) * | 2017-09-20 | 2020-07-31 | 国网上海市电力公司 | 一种对大规模可再生能源数据进行快速概率建模方法 |
US20190095481A1 (en) * | 2017-09-22 | 2019-03-28 | Microsoft Technology Licensing, Llc | Generating a query |
US10885056B2 (en) | 2017-09-29 | 2021-01-05 | Oracle International Corporation | Data standardization techniques |
US10936599B2 (en) | 2017-09-29 | 2021-03-02 | Oracle International Corporation | Adaptive recommendations |
US10601672B2 (en) * | 2017-10-24 | 2020-03-24 | Cisco Technology, Inc. | Inter-tenant workload performance correlation and recommendation |
US10528343B2 (en) * | 2018-02-06 | 2020-01-07 | Smartshift Technologies, Inc. | Systems and methods for code analysis heat map interfaces |
US11243960B2 (en) | 2018-03-20 | 2022-02-08 | Data.World, Inc. | Content addressable caching and federation in linked data projects in a data-driven collaborative dataset platform using disparate database architectures |
US10922308B2 (en) | 2018-03-20 | 2021-02-16 | Data.World, Inc. | Predictive determination of constraint data for application with linked data in graph-based datasets associated with a data-driven collaborative dataset platform |
WO2019217367A2 (en) * | 2018-05-07 | 2019-11-14 | Linkup Blockchain Technology Inc. | A blockchain based digital asset management platform |
USD920353S1 (en) | 2018-05-22 | 2021-05-25 | Data.World, Inc. | Display screen or portion thereof with graphical user interface |
US11947529B2 (en) | 2018-05-22 | 2024-04-02 | Data.World, Inc. | Generating and analyzing a data model to identify relevant data catalog data derived from graph-based data arrangements to perform an action |
USD940732S1 (en) | 2018-05-22 | 2022-01-11 | Data.World, Inc. | Display screen or portion thereof with a graphical user interface |
US11537990B2 (en) | 2018-05-22 | 2022-12-27 | Data.World, Inc. | Computerized tools to collaboratively generate queries to access in-situ predictive data models in a networked computing platform |
USD940169S1 (en) | 2018-05-22 | 2022-01-04 | Data.World, Inc. | Display screen or portion thereof with a graphical user interface |
US11327991B2 (en) | 2018-05-22 | 2022-05-10 | Data.World, Inc. | Auxiliary query commands to deploy predictive data models for queries in a networked computing platform |
US11263263B2 (en) | 2018-05-30 | 2022-03-01 | Palantir Technologies Inc. | Data propagation and mapping system |
CN108763503A (zh) * | 2018-05-30 | 2018-11-06 | 郑州云海信息技术有限公司 | 一种基于企业私有云的知识库管理系统及方法 |
US11442988B2 (en) | 2018-06-07 | 2022-09-13 | Data.World, Inc. | Method and system for editing and maintaining a graph schema |
US11120366B2 (en) | 2018-07-24 | 2021-09-14 | International Business Machines Corporation | Data forecasting based on machine learning analysis of data access statistics |
USD860239S1 (en) | 2018-10-31 | 2019-09-17 | Vericle Corporation | Display screen with graphical user interface for medical billing workflow management |
US10970272B2 (en) * | 2019-01-31 | 2021-04-06 | Sap Se | Data cloud—platform for data enrichment |
US11604797B2 (en) | 2019-11-14 | 2023-03-14 | Microstrategy Incorporated | Inferring joins for data sets |
USD994699S1 (en) | 2019-12-17 | 2023-08-08 | Nammu21, Inc. | Display screen with a graphical user interface |
USD994698S1 (en) | 2019-12-17 | 2023-08-08 | Nammu21, Inc. | Display screen with a graphical user interface |
KR102466717B1 (ko) * | 2020-07-24 | 2022-11-15 | 주식회사 한글과컴퓨터 | 문서의 포맷을 변환하는 포맷 변환 엔진이 탑재되어 있는 문서 변환 서버들에 대해, 문서의 포맷 변환을 위한 작업 할당을 수행하는 문서 변환 작업 할당 스케줄링 장치 및 그 동작 방법 |
CN112163151A (zh) * | 2020-09-25 | 2021-01-01 | 京东方科技集团股份有限公司 | 一种模拟推荐方法、计算机设备及存储介质 |
US20220164471A1 (en) * | 2020-11-23 | 2022-05-26 | International Business Machines Corporation | Augmented privacy datasets using semantic based data linking |
CN112732845A (zh) * | 2021-01-26 | 2021-04-30 | 长威信息科技发展股份有限公司 | 一种基于端到端的大型知识图谱构建和存储方法和系统 |
US11675838B2 (en) | 2021-05-11 | 2023-06-13 | International Business Machines Corporation | Automatically completing a pipeline graph in an internet of things network |
KR102366017B1 (ko) * | 2021-07-07 | 2022-02-23 | 쿠팡 주식회사 | 설치 서비스를 위한 정보 제공 방법 및 장치 |
CN113835755B (zh) * | 2021-09-24 | 2023-08-22 | 天津津航计算技术研究所 | 一种无操作系统环境下串口控制台实现方法 |
US11947600B2 (en) | 2021-11-30 | 2024-04-02 | Data.World, Inc. | Content addressable caching and federation in linked data projects in a data-driven collaborative dataset platform using disparate database architectures |
EP4242867A1 (en) * | 2022-03-08 | 2023-09-13 | Chemovator GmbH | Customer data model transformation process |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6356726A (ja) * | 1986-08-28 | 1988-03-11 | Hitachi Ltd | 知識ベースからデータベースへの変換装置 |
US20080281820A1 (en) * | 2007-05-08 | 2008-11-13 | Sap Ag | Schema Matching for Data Migration |
JP2012529114A (ja) * | 2009-06-01 | 2012-11-15 | アビニシオ テクノロジー エルエルシー | 難読化された値の生成 |
JP2013069016A (ja) * | 2011-09-21 | 2013-04-18 | Nec Corp | 情報漏洩防止装置及び制限情報生成装置 |
WO2013146884A1 (ja) * | 2012-03-27 | 2013-10-03 | 日本電気株式会社 | データクレンジングシステム、方法およびプログラム |
JP2014063295A (ja) * | 2012-09-20 | 2014-04-10 | Cybernet Systems Co Ltd | 文脈解析装置、情報分類装置及び情報分類システム |
Family Cites Families (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07200300A (ja) | 1993-11-29 | 1995-08-04 | Toshiba Corp | パターン認識型推論方法及び装置 |
US6807558B1 (en) | 1995-06-12 | 2004-10-19 | Pointcast, Inc. | Utilization of information “push” technology |
US5740549A (en) | 1995-06-12 | 1998-04-14 | Pointcast, Inc. | Information and advertising distribution system and method |
US6047283A (en) | 1998-02-26 | 2000-04-04 | Sap Aktiengesellschaft | Fast string searching and indexing using a search tree having a plurality of linked nodes |
JP2000222196A (ja) | 1999-01-29 | 2000-08-11 | Toshiba Tec Corp | プログラム自動生成方法及びこの方法を使用したデータ処理方法並びにプログラム自動生成装置及びデータ処理装置並びにプログラム自動生成プログラムを記録した記録媒体 |
JP3708007B2 (ja) | 1999-11-22 | 2005-10-19 | 株式会社東芝 | 情報交換装置 |
US6556983B1 (en) | 2000-01-12 | 2003-04-29 | Microsoft Corporation | Methods and apparatus for finding semantic information, such as usage logs, similar to a query using a pattern lattice data space |
EP1202206A3 (en) * | 2000-10-24 | 2004-01-21 | International Business Machines Corporation | Method and system in an electronic spreadsheet for persistently self-replicating multiple ranges of cells through a copy-paste operation |
US8402068B2 (en) | 2000-12-07 | 2013-03-19 | Half.Com, Inc. | System and method for collecting, associating, normalizing and presenting product and vendor information on a distributed network |
WO2002063493A1 (en) | 2001-02-08 | 2002-08-15 | 2028, Inc. | Methods and systems for automated semantic knowledge leveraging graph theoretic analysis and the inherent structure of communication |
US6754651B2 (en) | 2001-04-17 | 2004-06-22 | International Business Machines Corporation | Mining of generalized disjunctive association rules |
WO2002095533A2 (en) | 2001-05-18 | 2002-11-28 | Biowulf Technologies, Llc | Model selection for cluster data analysis |
JP2003058523A (ja) | 2001-08-21 | 2003-02-28 | Nippon Telegr & Teleph Corp <Ntt> | 構造化文書の変換ルール作成方法および装置と変換ルール作成プログラムおよび該プログラムを記録した記録媒体 |
US8155951B2 (en) | 2003-06-12 | 2012-04-10 | Patrick William Jamieson | Process for constructing a semantic knowledge base using a document corpus |
US8239380B2 (en) | 2003-06-20 | 2012-08-07 | Microsoft Corporation | Systems and methods to tune a general-purpose search engine for a search entry point |
US7558799B2 (en) | 2004-06-01 | 2009-07-07 | Microsoft Corporation | Method, system, and apparatus for discovering and connecting to data sources |
US7895220B2 (en) | 2005-08-30 | 2011-02-22 | Schlumberger Technology Corporation | Middleware method and apparatus and program storage device adapted for linking data sources to software applications |
US20070112827A1 (en) * | 2005-11-10 | 2007-05-17 | International Business Machines Corporation | Abstract rule sets |
US7533096B2 (en) | 2006-07-12 | 2009-05-12 | International Business Machines Corporation | Computer-based method for finding similar objects using a taxonomy |
EP2181402A1 (fr) | 2007-02-23 | 2010-05-05 | Enrico Maim | Procedes d'extraction, de combinaison, de synthese et de visualisation de donnees multidimensionnelles provenant de differentes sources |
US8090747B2 (en) | 2007-05-21 | 2012-01-03 | New York University | Method, system, computer-accessible medium and software arrangement for organization and analysis of multiple sets of data |
US7970766B1 (en) | 2007-07-23 | 2011-06-28 | Google Inc. | Entity type assignment |
US8175941B2 (en) * | 2007-11-19 | 2012-05-08 | Codestreet, Llc | Method and system for developing and applying market data scenarios |
US20110197237A1 (en) | 2008-10-10 | 2011-08-11 | Turner Steven E | Controlled Delivery of Content Data Streams to Remote Users |
US8156435B2 (en) | 2008-11-25 | 2012-04-10 | At&T Intellectual Property I, L.P. | Systems and methods to select media content |
US8156159B2 (en) | 2009-02-11 | 2012-04-10 | Verizon Patent And Licensing, Inc. | Data masking and unmasking of sensitive data |
US8166104B2 (en) | 2009-03-19 | 2012-04-24 | Microsoft Corporation | Client-centered usage classification |
US9213687B2 (en) | 2009-03-23 | 2015-12-15 | Lawrence Au | Compassion, variety and cohesion for methods of text analytics, writing, search, user interfaces |
US20100274821A1 (en) | 2009-04-22 | 2010-10-28 | Microsoft Corporation | Schema Matching Using Clicklogs |
JP2010267019A (ja) * | 2009-05-13 | 2010-11-25 | Internatl Business Mach Corp <Ibm> | 文書作成を支援する方法、並びにそのコンピュータ・システム及びコンピュータ・プログラム |
US8234285B1 (en) | 2009-07-10 | 2012-07-31 | Google Inc. | Context-dependent similarity measurements |
US8204904B2 (en) | 2009-09-30 | 2012-06-19 | Yahoo! Inc. | Network graph evolution rule generation |
CA2786445C (en) | 2010-01-13 | 2018-02-13 | Ab Initio Technology Llc | Matching metadata sources using rules for characterizing matches |
US8825649B2 (en) | 2010-07-21 | 2014-09-02 | Microsoft Corporation | Smart defaults for data visualizations |
US9076152B2 (en) | 2010-10-20 | 2015-07-07 | Microsoft Technology Licensing, Llc | Semantic analysis of information |
US8745061B2 (en) | 2010-11-09 | 2014-06-03 | Tibco Software Inc. | Suffix array candidate selection and index data structure |
CN102104510B (zh) * | 2011-03-01 | 2014-01-29 | 北京中创信测科技股份有限公司 | 一种数据视图处理方法和系统 |
US8874616B1 (en) | 2011-07-11 | 2014-10-28 | 21Ct, Inc. | Method and apparatus for fusion of multi-modal interaction data |
US10482535B1 (en) * | 2011-07-27 | 2019-11-19 | Aon Benfield Global, Inc. | Impact data manager for generating dynamic intelligence cubes |
US8577938B2 (en) | 2011-08-23 | 2013-11-05 | Accenture Global Services Limited | Data mapping acceleration |
US8799207B1 (en) | 2011-10-08 | 2014-08-05 | Bay Dynamics | Unified data source management |
US8538934B2 (en) | 2011-10-28 | 2013-09-17 | Microsoft Corporation | Contextual gravitation of datasets and data services |
GB2520878A (en) | 2012-08-17 | 2015-06-03 | Opera Solutions Llc | System and method for matching data using probabilistic modeling techniques |
US9070090B2 (en) | 2012-08-28 | 2015-06-30 | Oracle International Corporation | Scalable string matching as a component for unsupervised learning in semantic meta-model development |
US10366335B2 (en) | 2012-08-31 | 2019-07-30 | DataRobot, Inc. | Systems and methods for symbolic analysis |
US20140222181A1 (en) * | 2012-10-12 | 2014-08-07 | Invensys Systems, Inc. | Automatically updating graphical symbols in a control loop strategy diagram |
CN102982138B (zh) * | 2012-11-19 | 2017-02-15 | 北京思特奇信息技术股份有限公司 | 一种客户身份动态展现方法及装置 |
US9223870B2 (en) * | 2012-11-30 | 2015-12-29 | Microsoft Technology Licensing, Llc | Decoration of search results by third-party content providers |
US20130232452A1 (en) | 2013-02-01 | 2013-09-05 | Concurix Corporation | Force Directed Graph with Time Series Data |
US8909656B2 (en) | 2013-03-15 | 2014-12-09 | Palantir Technologies Inc. | Filter chains with associated multipath views for exploring large data sets |
US9710534B2 (en) | 2013-05-07 | 2017-07-18 | International Business Machines Corporation | Methods and systems for discovery of linkage points between data sources |
WO2015037684A1 (ja) | 2013-09-11 | 2015-03-19 | フリービット株式会社 | アプリケーション状態変化通知プログラム及びその方法 |
US9367809B2 (en) | 2013-10-11 | 2016-06-14 | Accenture Global Services Limited | Contextual graph matching based anomaly detection |
CN103593199B (zh) | 2013-11-29 | 2016-08-24 | 迈普通信技术股份有限公司 | 数据转换的方法和系统 |
US10210246B2 (en) | 2014-09-26 | 2019-02-19 | Oracle International Corporation | Techniques for similarity analysis and data enrichment using knowledge sources |
US10976907B2 (en) | 2014-09-26 | 2021-04-13 | Oracle International Corporation | Declarative external data source importation, exportation, and metadata reflection utilizing http and HDFS protocols |
US10891272B2 (en) | 2014-09-26 | 2021-01-12 | Oracle International Corporation | Declarative language and visualization system for recommended data transformations and repairs |
US9928284B2 (en) | 2014-12-31 | 2018-03-27 | Zephyr Health, Inc. | File recognition system and method |
-
2015
- 2015-09-24 US US14/864,496 patent/US10891272B2/en active Active
- 2015-09-25 CN CN201580046371.6A patent/CN106796595B/zh active Active
- 2015-09-25 JP JP2017516322A patent/JP2017534108A/ja active Pending
- 2015-09-25 WO PCT/US2015/052228 patent/WO2016049460A1/en active Application Filing
- 2015-09-25 EP EP15781486.4A patent/EP3198484A1/en not_active Ceased
-
2021
- 2021-01-14 JP JP2021004135A patent/JP7148654B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6356726A (ja) * | 1986-08-28 | 1988-03-11 | Hitachi Ltd | 知識ベースからデータベースへの変換装置 |
US20080281820A1 (en) * | 2007-05-08 | 2008-11-13 | Sap Ag | Schema Matching for Data Migration |
JP2012529114A (ja) * | 2009-06-01 | 2012-11-15 | アビニシオ テクノロジー エルエルシー | 難読化された値の生成 |
JP2013069016A (ja) * | 2011-09-21 | 2013-04-18 | Nec Corp | 情報漏洩防止装置及び制限情報生成装置 |
WO2013146884A1 (ja) * | 2012-03-27 | 2013-10-03 | 日本電気株式会社 | データクレンジングシステム、方法およびプログラム |
JP2014063295A (ja) * | 2012-09-20 | 2014-04-10 | Cybernet Systems Co Ltd | 文脈解析装置、情報分類装置及び情報分類システム |
Also Published As
Publication number | Publication date |
---|---|
US20160092474A1 (en) | 2016-03-31 |
CN106796595B (zh) | 2021-06-08 |
JP7148654B2 (ja) | 2022-10-05 |
EP3198484A1 (en) | 2017-08-02 |
WO2016049460A1 (en) | 2016-03-31 |
US10891272B2 (en) | 2021-01-12 |
JP2017534108A (ja) | 2017-11-16 |
CN106796595A (zh) | 2017-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7148654B2 (ja) | 推薦されるデータ変換および修復のための宣言型言語およびビジュアライゼーションシステム | |
US11693549B2 (en) | Declarative external data source importation, exportation, and metadata reflection utilizing HTTP and HDFS protocols | |
US11500880B2 (en) | Adaptive recommendations | |
US11379506B2 (en) | Techniques for similarity analysis and data enrichment using knowledge sources | |
US11704321B2 (en) | Techniques for relationship discovery between datasets | |
US11200248B2 (en) | Techniques for facilitating the joining of datasets | |
US11163527B2 (en) | Techniques for dataset similarity discovery | |
US11417131B2 (en) | Techniques for sentiment analysis of data using a convolutional neural network and a co-occurrence network | |
CN105993011B (zh) | 跨多个输入数据流的样式匹配的方法、系统和设备 | |
US11120086B2 (en) | Toponym disambiguation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210201 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210201 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210910 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210914 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211102 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220315 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220526 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220830 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220922 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7148654 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |