JP2022120014A - データ取り込みおよび該データへのユーザアクセス促進システムおよび方法 - Google Patents

データ取り込みおよび該データへのユーザアクセス促進システムおよび方法 Download PDF

Info

Publication number
JP2022120014A
JP2022120014A JP2022092289A JP2022092289A JP2022120014A JP 2022120014 A JP2022120014 A JP 2022120014A JP 2022092289 A JP2022092289 A JP 2022092289A JP 2022092289 A JP2022092289 A JP 2022092289A JP 2022120014 A JP2022120014 A JP 2022120014A
Authority
JP
Japan
Prior art keywords
data
database
input data
user
storage format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022092289A
Other languages
English (en)
Other versions
JP7345598B2 (ja
Inventor
グオ,サイト
Guo Site
イー.,ザ・サード ジョンソン,ロベルト
E Johnson Robert Iii
ヒルトン,ブレイン,ロバート
Robert Hilton Blaine
ネヴィル,デーヴィッド,アラン
Alan Nevill David
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEULAH WORKS LLC
Original Assignee
BEULAH WORKS LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEULAH WORKS LLC filed Critical BEULAH WORKS LLC
Publication of JP2022120014A publication Critical patent/JP2022120014A/ja
Priority to JP2023143605A priority Critical patent/JP2023162404A/ja
Application granted granted Critical
Publication of JP7345598B2 publication Critical patent/JP7345598B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/282Hierarchical databases, e.g. IMS, LDAP data stores or Lotus Notes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/217Database tuning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2428Query predicate definition using graphical user interfaces, including menus and forms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/256Integrating or interfacing systems involving database management systems in federated or virtual databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Input From Keyboards Or The Like (AREA)
  • Stored Programmes (AREA)

Abstract

【課題】企業の情報管理の一部あるいは補助としてのナレッジを取り込む及び発見するシステムを提供する。【解決手段】システム300は、すべての入力データがオブジェクト310およびオブジェクト310間の関係として保存され、入力データが1つ以上のストレージフォーマットに基づいて保存されるナリッジリポジトリを備える。少なくとも2つの階層型ユーザインターフェースは、入力データ、該入力データに関するオブジェクト情報、入力データに関する関係情報を入力するためのメカニズムを提供することによって、エンドユーザアプリケーションの開発を可能にする。コントローラー302は、少なくとも2つの階層型ユーザインターフェースから入力データ、オブジェクト情報及び関係情報を受領し、該オブジェクト情報及び関係情報に基づいて入力データをナリッジリポジトリに保存する。【選択図】図3

Description

本発明は、主に企業の情報管理、特に、企業の情報管理の一部あるいは補助としてのナ
リッジ(知識)取込および発見システムに関する。
法人やその他の組織を含む、さまざまなタイプの事業主体(ここでは集合的に「企業」
という)は、通常、関連する顧客に商品および/あるいは役務を提供するといった特定の
目標を達成するために、設立され、組織され、および運営されている。さまざまな規模の
企業のいずれにおいても、これらの目標を達成するために、無数のプロセスを導入し、そ
のようなプロセスを実行する際に、関連する相当な量のデータを入手することが必要とさ
れる。企業が徐々に規模を拡大し、および/または、より困難かつ複雑な目標を達成しよ
うと試みるに従って、たいていの場合、それに伴うプロセスを真に理解し、そのプロセス
を適切に管理し、そのプロセスを実行するために必要なリソースを管理することが非常に
困難となる。すなわち、消費者インサイトなどを探る際に必要となる調査データが相当な
量となる一方で、そのようなデータの量の膨大さ、複雑さ、および流動性により、潜在的
なリソースを活用することが困難となっている。
この問題を部分的に解消する、さまざまな技術が存在している。たとえば、データを効
率的に保存しアクセスできるようにするために、過去40年間において数多くのデータベ
ース技術が開発されてきているが、いずれにも一長一短がある。さらに、このような技術
が存在する場合でも、決定者がデータにアクセスできるようにするためには、特に訓練さ
れた技術者、たとえば、ソフトウェア開発および/またはデータベース管理のエキスパー
トのサポートが必要となる。しかしながら、これにより実質的に費用が発生する一方、デ
ータ利用者のニーズが満たされない可能性が十分にある。さらに、保存された調査データ
から調査レポートを届ける技術が知られているが、消費者インサイトを探り、かつ、デー
タが示すプロセスについて理解することは、いまだ困難な課題である。
したがって、企業データを取り込み、かつ、企業データへのアクセスを容易にして、企
業データ管理についての経験が不十分な場合であっても、消費者インサイトを明らかにす
るという、従前は不可能ではないとしても、非常にコストがかかって困難であったことを
可能とするシステムを提供することは有益である。
関連文献の相互参照
本願は、本明細書に参照として組み込まれる、2013年3月15日に出願された米国
特許仮出願第61/787,177号(発明の名称:「企業レベルのアプリケーション開
発システム」)に基づく優先権の利益を主張する。
本発明は、従来技術によるソリューションの不都合な点を解消する、ナレッジ取込およ
び発見システムに関する。具体的には、該システムは、入力されたすべてのデータがオブ
ジェクトとして保管されるナリッジリポジトリと、オブジェクト間のリレーションシップ
とからなる。追加的に、前記入力データは、1つ以上の保管フォーマットに従って保管さ
れる。該システム内では、少なくとも2つの階層型ユーザインターフェースが、前記入力
されたデータを得るための入力メカニズム、前記入力データに関するオブジェクト情報、
および前記入力データに関する関係情報を提供することにより、エンドユーザのアプリケ
ーション開発を可能にする。追加的に、コントローラは、前記ナリッジリポジトリおよび
前記少なくとも2つの階層型ユーザインターフェースと作動可能に接続され、前記少なく
とも2つの階層型ユーザインターフェースから前記入力データ、前記オブジェクト情報、
および前記関係情報を受領し、前記オブジェクト情報および前記関係情報に基づいて、前
記入力データをオブジェクトとしてナリッジリポジトリに保管する。
図1は、本発明のさまざまな態様を実行するために用いられる典型的な処理装置を示すブロック図である。 図2は、本発明を実行するために用いられる、さまざまなネットワーク化されたハードウェアコンポーネントを示すブロック図である。 図3は、本発明のさまざまな実施態様に基づいたファンクショナルコンポーネントを示すブロック図である。 図4は、RDFデータおよびリレーショナルデータに基づくデータ変換処理の典型的な実行例を示すブロック図である。
本発明は、添付の請求の範囲において具体的に定義される。本発明の特徴は、添付の図
面とともに、下記の詳細な説明によって明らかとされる。1つ以上の実施態様が例示とし
てのみ記載される。添付の図面において、同一の参照符号は同一の要素を示す。
図1は、本発明を実行するために使用される典型的な処理装置100を示す。処理装置
100は、たとえば、下記に詳述するシステム200の1つ以上のコンポーネントを作動
させるために使用される。たとえば、処理装置100は、ワークステーションコンピュー
タあるいはサーバコンピュータを備える。あるいは、処理装置100は、ストレージコン
ポーネント104に連結されたプロセッサ102を備える。ストレージコンポーネント1
04は、順番に、保存された実行可能命令116およびデータ118を備える。
一実施形態では、プロセッサ102は、1つ以上のマイクロプロセッサ、マイクロコン
トローラ、デジタル信号プロセッサ、コプロセッサなど、あるいは、これらの組み合わせ
を備え、保存された実行可能命令116の実行を可能とし、かつ、保存されたデータ11
8を操作する。同様に、ストレージコンポーネント104は、ランダムアクセスメモリ(
RAM)、読取専用メモリ(ROM)、その他の非一時的な機械読取可能装置などの、1
つ以上の揮発性あるいは不揮発性メモリを備える。さらに、ストレージコンポーネント1
04は、ハードドライブ、光学ディスクドライブ、フロッピーディスクドライブなどのさ
まざまな形態を採ることができる。
図1に示したタイプのプロセッサおよびストレージの配置は、当業者には周知である。
一実施態様において、本明細書に開示されたプロセッシング技術は、1つ以上の処理装置
100のストレージコンポーネント104内において、実行可能命令とデータとの組み合
わせとして実行される。
図示のように、処理装置100は、1つ以上のユーザ入力装置106、ディスプレイ1
08、周辺インターフェース110、その他の出力装置112、およびプロセッサ102
と通信するネットワークインターフェース114を備える。プロセッサ102は、図示の
ように、これらの装置/ディスプレイ/インターフェース106~114と個別かつ直接
に接続可能であるが、処理装置100のコンポーネント同士を意図されたように通信させ
るメカニズムとして、1つ以上のバスサブシステム(図示せず)を用いることも、当業者
には周知である。
ユーザ入力装置106は、プロセッサ102にユーザが入力するためのメカニズムを備
える。たとえば、ユーザ入力装置106は、装置100のユーザがプロセッサ102にデ
ータを入力するためのキーボード、マウス、タッチスクリーン、マイクロフォン、適切な
音声認識アプリケーション、その他の手段を備えることができる。ディスプレイ108は
、CRTディスプレイ、フラットパネルディスプレイ、その他の公知のディスプレイを備
える。一実施態様においては、ディスプレイ108は、プロセッサ102によって実行さ
れる、適切に保存された命令116と関連して、下記のグラフィカルユーザインターフェ
ースを実行するために用いることができる。グラフィカルユーザインターフェースをこの
ように実行することは、当業者には周知である。
周辺インターフェース110は、本発明に関連して用いられる、磁気ディスクあるいは
光学ディスク装置などのメディア装置を含む周辺機器、他の処理装置、あるいは他の入力
ソースと通信するために必要とされる、ハードウェア、ファームウェア、および/または
ソフトウェアを有する。同様に、その他の出力装置112は、同様なメディアドライブメ
カニズム、他の処理装置、あるいは、スピーカー、LED、プリンタ、ファクシミリ装置
、触覚出力装置など、装置100のユーザに情報を提供するための出力先を任意に備える
また、ネットワークインターフェース114は、プロセッサ102が、ワイヤネットワ
ークあるいはワイヤレスネットワーク、ローカルネットワークあるいはワイドエリアネッ
トワーク、プライベートネットワークあるいはパブリックネットワークを経由して、他の
装置と通信することを可能にする公知のハードウェア、ファームウェア、および/または
ソフトウェアを備える。たとえば、そのようなネットワークには、ワールドワイドウェブ
、インターネット、あるいは企業内ネットワークなどの公知のネットワークが含まれる。
装置100は、本発明を実行するための技術の一例であって、機能的に同等である他の
技術も採用可能である。たとえば、既知ではあるが、1つ以上のプロセッサによって履行
された実行可能命令により実行される機能の一部または全部を、ファームウェア、および
/または、特定用途向け集積回路(ASIC)、プログラム可能な論理アレイ、ステート
マシンなどのハードウェア装置を用いて実行することもできる。さらに、装置100を、
図示の実施態様と比較して、より多くのコンポーネントにより、あるいは、より少ないコ
ンポーネントにより構成することもできる。このように、本発明の多くの変形例も使用可
能である。さらに、図1には、単一の処理装置100が示されているが、本発明を実施す
るにあたって、このような処理装置の組み合わせを、公知のネットワーク技術と組み合わ
せて作動させるように構成することも可能である。処理装置およびネットワークは常に変
化し続けるため、図1に図示した処理装置100は、当業者に公知である多数の処理装置
についての具体的な一例として示されているにすぎない。
図2は、本発明を実施するために用いられる、複数のハードウェアコンポーネントを含
むシステム200を図示する。図示のように、システム200は、1つ以上のサーバコン
ピュータからなるコントローラ202を備える。コントローラ202は、他のさまざまな
コンポーネントと、直接的にあるいは1つ以上のネットワーク204を介して、通信する
ことができる。ネットワーク204は、ローカルネットワークあるいはワイドエリアネッ
トワーク、プライベートネットワークあるいはパブリックネットワーク、ワイヤネットワ
ークあるいはワイヤレスネットワークからの所望の組み合わせを選択して、構成すること
ができる。上述のように、このようなネットワークには、公知のワールドワイドウェブ、
インターネット、あるいは企業内ネットワークが含まれる。
ワークステーション206は、デスクトップコンピュータ、ラップトップコンピュータ
、あるいはモバイルコンピュータなどの処理装置を備え、ネットワーク204を介して、
コントローラ202と通信可能である。一実施態様においては、ワークステーション20
6は、公知のように、グラフィカルユーザインターフェースを提供可能なウェブブラウザ
アプリケーションあるいは他のアプリケーションを実行する。このようなアプリケーショ
ンを用いて、ワークステーション206は、下記に詳述するように、さまざまな階層型ユ
ーザインターフェース208のうちの1つをさらに実行可能である。さらに、ワークステ
ーション206は、このような階層型ユーザインターフェース208に基づいて開発され
た1つ以上のエンドユーザアプリケーションを受け入れて、実行することも可能である。
図示のように、1つ以上の階層型ユーザインターフェースサーバ208は、コントロー
ラ202と通信するとともに、ネットワーク204を介して、ワークステーション206
と通信することが可能である。公知であるが、1つ以上の階層型ユーザインターフェース
サーバ208は、アプリケーションおよびウェブサーバの組み合わせにより構成すること
ができる。この場合、ウェブサーバは、ユーザからの要求により、ウェブサーバと接続し
ているアプリケーションサーバにより提供されたアプリケーションリソースを用いたアク
ションを実行する。具体的には、ウェブサーバリレーは、このような要求をアプリケーシ
ョンサーバに送り、アプリケーションサーバは、特定のアクションを実行し、このアクシ
ョンの結果をウェブサーバに戻し、さらに、ウェブサーバは、その結果をユーザワークス
テーション206に送る。このようなウェブサーバは、ハードウェアコンポーネントによ
り構成されるが、本明細書中に記載されたいずれのサーバと同様に、コンピュータシステ
ム上で作動するソフトウェアモジュールによっても構成可能である。
いずれにせよ、このような技術によれば、階層型ユーザインターフェースサーバ208
は、下記に詳述する、少なくとも1つのメジャーデベロッパインターフェースおよび/ま
たはマイナーデベロッパインターフェースを提供する。たとえば、階層型ユーザインター
フェースサーバ208は、ワークステーション206上に表示されたウェブページなどを
実現することにより、1つ以上の階層型ユーザインターフェースを提供する。これらの階
層型インターフェースは、一実施形態において、最終的にアプリケーションメタファイル
を開発するために使用される。ここで、アプリケーションメタファイルは、実行可能なソ
ースコードを生成するのに十分な、公知かつ下記に詳述するユーザインターフェースマー
クアップあるいはファンクショナルマークアップなどの情報からなる。エンドユーザアプ
リケーションサーバ212は、ウェブサーバおよびアプリケーションサーバを備え、上述
したように、要求するユーザに対して、コード生成サーバ210によって生成されたエン
ドユーザアプリケーションを提供する機能を備える。
図2にさらに図示するように、コントローラ202は、一括してデータベースコンプレ
ックス219を構成する複数のデータベースサーバ214~218と通信する。ここで、
データベースは、本明細書中に記載されているデータベースストレージフォーマットを含
む、公知のデータベースストレージフォーマットを実行する適切なストレージ装置を備え
る。たとえば、1つ以上の第1データベースサーバ214は、第1ストレージフォーマッ
トあるいはスキーマを実行し、1つ以上の第2データベースサーバ216は、第2ストレ
ージフォーマットあるいはスキーマを実行し、さらに第N番目までのデータベースサーバ
を設けることができ、1つ以上の第N番目のデータベースサーバ218は、第N番目のス
トレージフォーマットあるいはスキーマを実行するよう設けられる。たとえば、一実施形
態では、第1データベースサーバ214は、いわゆるトリプルストアデータベースを実装
し、第2データベースサーバ216は、リレーショナルデータベースを実装し、第N番目
のデータベースサーバ218は、カラム型データベース、グラフデータベース、キーバリ
ュー型データベース、ドキュメントデータベース、およびファイルストレージデータベー
スなどのさらに他のデータベースストレージフォーマットを実行する。さらに他のデータ
ベースストレージフォーマットの使用が可能であることは、当業者には自明であり、した
がって、本発明はデータベースストレージフォーマットの種類によっては限定されること
はない。
このような構成により、それぞれのデータベースストレージフォーマットを利用するこ
とが可能となるが、下記に詳述するように、コントローラ202は、エンドユーザがそれ
ぞれのデータベースストレージフォーマットの複雑さを習得することを不要とする、抽象
化レイヤーとして機能する。一実施形態では、下記に記載するように、コントローラ20
2は、全体のパフォーマンスを向上させるために、必要に応じて、1つのストレージフォ
ーマットから他のストレージフォーマットへのデータの変換を開始する。別の実施形態で
は、マルチデータベースストレージフォーマットを備えることにより、ユーザが、データ
の変換の条件を具体的に定義することが可能となる。たとえば、いわゆるCAP(一貫性
、可用性、分断耐性)定理によれば、分散データベースを用いても、3つの属性である、
一貫性(すべてのノードは最新かつ同一の情報を有する)、可用性(可用時間/要求受け
入れ)、分断耐性(分断状態を扱う)からたった2つの属性のみを有することができる。
この帰結に基づき、ユーザは、これら属性のそれぞれあるいは組み合わせを最適化するた
めに、さまざまなデータベース間におけるデータ変換のための要求を指定することができ
る。
さらに図示されているように、コントローラ202は、ネットワーク204を介して、
1つ以上の自然言語処理(NLP)サーバ220および1つ以上のデータマイニングサー
バ222と通信する。下記にさらに詳述するように、NLPサーバ220は、データベー
スコンプレックス219内におけるデータへのアクセス時だけでなく、エンドユーザアプ
リケーションの開発時においても、自然言語クエリの使用を促進させる。NLPサーバ2
20とともに働くデータマイニングサーバ222は、原因解明、分類、クラスタリング、
結合規則発見、および/または、データベースコンプレックス219に保存されたデータ
に基づいた回帰分析などのさまざまなデータマイニングタスクを実行する。
図3は、システム300と、システム300に設けられたさまざまな機能を図示してい
る。図3に示されたそれぞれのコンポーネントは、上述したように、図示した機能を実行
する1つ以上の処理装置を用いて実行される。システム300内では、コントローラ30
2は、図示の例においては、リレーショナルデータベース304、カラム型データベース
306、およびトリプルストアデータベース308を含む複数のデータベース304~3
08と通信する。公知であるが、それぞれのデータベース304~308は、通常、やり
とりを促進するためのそれぞれのデータベース管理システム(DBMS)を備える。図示
のように、コントローラ302は、対応するDBMSによって実行されるアプリケーショ
ン・プログラミング・インターフェース(API)304a~308aを通じて、これら
のデータベース304~308と通信する。このようなAPIは、メーカー独自のドライ
バあるいは独自のREST(レプリゼンテーショナル・ステート・トランスファー)イン
ターフェースによって実施される。
一実施態様においては、システム200および300によって扱われるすべてのデータ
は、オブジェクトとして扱われる。したがって、それぞれのデータには、オブジェクトを
一意的に識別するオブジェクトID、オブジェクトの現在の状況を示す状態インジケータ
、オブジェクトの訂正の順序に関する訂正の現在の状態を示すリビジョン番号、および、
ある特定の訂正がいつ行われたかを示すタイムスタンプが付される。オブジェクトは、シ
ステム内において決して物理的に削除されることはない。ユーザによってオブジェクトが
修正あるいは「削除」された場合には、システムはオブジェクトの訂正を行い、この訂正
をオブジェクトの現在の状況に反映させる。従前の訂正は履歴として保存される。オブジ
ェクトの例として、いくつかのネームバリューペアに基づいて記述された、周知のジェイ
ソン(JSON)フォーマットを使用した、グラフィカルユーザインターフェースで見ら
れるタイプの送信ボタンを表1に示す。
Figure 2022120014000002
本例では、オブジェクトは「ウィジェット」タイプであり、より具体的には、「送信(s
ubmit)」のタイトルが付されたウィジェットの「ボタン(button)」タイプである。このオ
ブジェクトは、現在「アクティブ(active)」であり、訂正12回目のものである。このオ
ブジェクトは、さらに、「シングルクリック(single click)」の場合にどのような「アク
ション(action)」を採るかという行動定義を含む。公知であるが、JSONは、人間にと
って理解可能であるだけでなく、機械による解析も可能である。当業者には自明であるが
、多種多様なオブジェクトタイプおよびサブタイプが、いかなるデータをも実質的にオブ
ジェクトとして取り扱うために、使用可能である。たとえば、システム200および30
0に備えられた自然言語クエリは、一続きの「ワード」オブジェクトとしてみなされ、ク
エリ自体は、そのような「ワード」オブジェクトの集合体からなるオブジェクトとして扱
われる。別の例においては、ソフトウェアソースコードのセグメントは、いくつかの「ス
テートメント」、「オペレータ」、「変数」、「変数名」などのオブジェクトからなる第
1オブジェクトとして扱われる。
システム内のすべてのデータをオブジェクトとして扱うことの利点は、本明細書中にお
いては、オブジェクト間の関係についてステートメントが作成される「トリプル」データ
表現コンセプトに対応していることである。たとえば、いわゆるリソースデータフレーム
ワーク(RDF)スペシフィケーション(仕様)は、ウェブリソースなどの「リソース」に関するステートメントを作成するために、主語-述語-目的語の表現(トリプル)を確立する。なお、本明細書においては、コンセプトは、オブジェクトに容易に適用可能であるものを意味する。簡単な例として、上述の例を元にした、トリプルに従って記述可能であるウェブホームで使用されるボタンウィジェットの例を表2に示す。
Figure 2022120014000003
この例では、主語「ボタン(button)」は、目的語「フォーム(form)」に、関係を表す述
語「is_in」によって、関係づけられる。公知であるが、RDFにおいては、接頭辞x、
y、zは、本例では「button」、「form」、「is_in」からなる、一意的なネーミングエ
ンティティの情報を提供するユニフォーム・リソース・アイデンティファイア(URI)
の一般的な簡略表記である。好ましい実施形態においては、このトリプルフォームは、コ
ンテクストに追加的な(接頭辞cを有する)フィールドを提供する、いわゆる「nqua
d」フォーマットに拡張される。したがって、表2の例では、このコンテクストフィール
ドは、オブジェクトデータ同士をリンクするユニバーサル・ユニーク・アイデンティファ
イア(UUID)値を有するように使用される。すなわち、本実施形態においては、コン
テクスト・クワド・フィールドは、さまざまなデータ同士を単一のオブジェクトにおいて
つなぎ、実際には、多数のトリプル/クワド値を含み得る。下記に詳述するように、RD
Fのような規格は、情報を体系づけることによって知識表現を提供するために用いられる
構造的なフレームワークを記述した情報などのオントロジー情報を伝達するステートメン
トも提供する。なお、オントロジー情報は、1つのストレージフォーマットから他のスト
レージフォーマットへのデータの変換をアシストするために使用される。
一実施態様においては、コントローラ302を介して、すべてのデータが、データベー
ス304~308に追加され、データベース304~308において変更され、データベ
ース304~308から読み取られあるいは削除される。上述したように、これにより、
すべてのデータベース固有プロトコルを終了させて、コントローラ302のユーザには、
単一のインターフェースのみ示される。具体的には、前記単一のインターフェースは、い
かなるデータベースストレージフォーマットにも依存しない1つのフォーマットで表され
る共有操作をサポートする。たとえば、コントローラ302は、JSONベースのシーク
ェル(SQL)のようなAPIを使用するデータを管理するためにエンドユーザに統一さ
れたAPIを提供する。SQLのようなAPIは、システム300の外部および内部ユー
ザとの通信を促進する。これにより、特に、厳格な関係データベース要求を、比較的自由
かつ柔軟なNoSQLデータベース要求に橋渡しができるので、従来からの開発者が、高
度な学習をすることなく、NoSQLデータベースあるいはマルチデータベースの利点を
享受することを可能にしている。完全を期するために、場合によっては、エンドユーザに
、SQLのような統一されたAPIに加えて、それぞれのデータベース304~308の
DBMSへのアクセスを提供することが望ましい。ただし、基礎となるAPIデータベー
スへのそのようなアクセスは、APIに特有の知識を有しないエンドユーザにとっては好
ましくない。いずれにせよ、この実施形態においては、SQLのような統一されたAPI
手段は、すべてのデータベース管理システムにより一般的には提供される、生成、読み取
り、更新、および削除といったクラッド(CRUD)操作を含む。このような生成、読み
取り、更新、削除の操作についてのJSONの例を、表3~表6にそれぞれ示す。
Figure 2022120014000004
Figure 2022120014000005
Figure 2022120014000006
Figure 2022120014000007
表3~表6が、SQLのような統一されたAPIの例であるということは、当業者には
自明であり、かつ、同様のSQLのような統一されたAPIは、XML(エクステンシブ
ル・マークアップ・ランゲージ)のような他のフォーマットにおいて実行可能であること
も自明である。そのような操作要求に基づき、コントローラ302は、上記の例において
は、JSON要求を必要なデータベース固有のクエリフォーマットに変換する。たとえば
、上述の操作を元に、ユーザは、表4に示すように、読み取り要求をコントローラ302
へ送る。トリプルストアデータベース308に対するクエリを実行する際に、コントロー
ラ302は、表7に示したタイプのスパークル(SPARQL)クエリを生成する。
Figure 2022120014000008
本例においては、マッピングルールは、“collection”: “X” => FROM X; “select
”: “X” => SELECT?x; “relation”: {...} =>WHERE {?x ?y ?z WHERE {?y...}}など
である。このタイプのさらなるマッピングは、当業者であれば容易に導き出すことが可能
である。
データ(上述のように、あるオブジェクトに関するデータ)が追加されると、まず、コ
ントローラ302は、上述のトリプルの形式にデータを追加する。すなわち、データは、
トリプルストアデータベース308において生成され、このようなデータに対するクエリ
は、少なくとも最初にトリプルストアデータベース308に適用される。一実施態様にお
いては、トリプルストアデータベース308は、トリプルに第4の要素が追加された、い
わゆるnquadフォーマットにされる。この場合、第4の要素は、上述のように、オブ
ジェクトアイデンティファイアである。
ユーザがデータに問い合わせると、クエリパーサ、あるいはコントローラ302におい
て実行される監視(monitory)は、クエリを監視し、データパターンを生ずる。このよう
なクエリパーサは、たとえば、ゾーホー社(Zoho CorporationPvt. Ltd.)のアプリケー
ションズマネージャ(http://www.manageengine.com/products/applications_manager/dat
abase-query-monitoring.htmlにおいて入手可能)にあるように、公知である。たとえば
、すべてのクエリは、どのオブジェクトがアクセスされているか、データが書き込まれて
いるのか読み取られているのか、当該データのサイズ、クエリの頻度(ロギングデータか
らの推定)、あるいはどの特定のタイプのレポート/SELECTステートメントが実行
されているかなどの、特定のキー・パフォーマンス・インジケータに関して監視される。
結果として、前記クエリパーサは、既存のクエリパターンを、あらかじめ定義済みのデー
タ媒体変換トリガ規則にマッチさせることが可能である。その例を下記に挙げる。これら
の規則は、データパターンが与えられた規則の条件を満たすと、1つのストレージフォー
マットから他のストレージフォーマットへのデータ変換の必要性が、部分的あるいは全体
的に、検出される。すなわち、あらかじめ定義された変換規則により、コントローラ30
2は、ある特定のデータを変換できるかについて決定し、変換できるのであれば、コント
ローラ302は、オリジナルのデータ(たとえば、第1データストレージフォーマットに
保存されたデータ)を順に処理する変換プロセスを開始し、目的とするフォーマット、た
とえば第2データストレージフォーマットで、新たなデータを作成する。同時に、オリジ
ナルのデータはそのまま残されるため、ユーザは、前記変換処理の間でも、データに対し
て問合せを行うことは可能である。データが変換されると、前記クエリパーサは変換プロ
セスを通知され、前記クエリパーサは、この部分のデータに対する将来のクエリを解析す
る方法を変更することが可能となる。たとえば、一実施態様においては、前記クエリパー
サは、前記SQLのような統一されたAPIオペレーションを、特定の基礎的なデータベ
ースのAPIに置き換えて、将来のクエリが適切に扱われ、正しい回答が戻るようにする
与えられた部分のデータにとって最適なデータベースストレージフォーマットが不明で
ある状況が生じる場合がある。そのような場合には、利用可能なそれぞれのデータベース
ストレージフォーマットにオブジェクトを変換させ、模擬ロードテストを行うことが望ま
しい。このようなロードテストは、収集したログデータに基づいて、現実世界のユーザの
アクションをまねることが可能である。そのようなロードテストを行う際には、さまざま
なアクティビティのパフォーマンスが監視され、望ましい基準に対してどのデータベース
ストレージフォーマットが最も良好なパフォーマンスを示したかにということに基づいて
、最適なデータベースストレージフォーマットが選択される。たとえば、もしその結果が
顕著なパフォーマンスの向上を示した場合には、追加的な規則が作成され、データクエリ
により関連するタイプのデータが関連付けられるようになる。代替的な実施形態において
は、そのような新たな規則を推断するために、公知の機械学習技術が用いられる。たとえ
ば、機械学習アルゴリズムは、既知の規則を用いて統計上のモデルを整えることができ、
さらに、未知の規則を新たに推断することが可能である。このようにして、未知のデータ
に対するパフォーマンステスト(時間のかかるプロセスである)を省くことができ、代わ
りに、未知のデータは即座に推断された規則に基づいて直接変換される。その後は、必要
に応じて、かつ、利用可能なリソースの存在を前提として、より正確な模擬ロードテスト
によって、推断された規則をさらに確証することが可能である。
上述したように、コントローラ302がいつデータ媒体交換を開始するかを決定するた
めに、規則が利用される。一実施態様においては、そのような規則を確立するためにさま
ざまな要因が、どの要因が一般的にデータ要因あるいはデータ特徴、および使用要因ある
いは使用特徴として分類されるかといった観点から、検討される。データ特徴は、最適な
データベースストレージフォーマットの決定に影響する基礎的なデータの特定の属性に関
し、データサイズ、要求されるデータの鮮度、あるいは要求されるデータの保持時間などを含む。使用特徴は、データがどのように使用されたかということの属性に関し、データ書き込み頻度、データ更新頻度、データ読み取り頻度、データ読み取り要求タイプ、およびユーザの同時実行性などを含む。
データ特徴に関しては、データは、比較的短く、数バイトという簡単なテキストであっ
たり、メガバイトのグラフィックであったり、あるいは、ギガバイトという動画であった
りする。公知であるが、それぞれのグラフィックのサイズにより、保存のためにどのタイ
プのデータベースが最適であるかが決定される。その他の関連するデータ特徴は、データ
に要求される「新鮮さ」である。たとえば、公知であるが、データベース304~308
のそれぞれは、何らかの形でデータのキャッシュを実行する。レポートデータの一時的な
キャッシュは、大幅なデータの改善を可能にするが、これは、データがアクセスされるご
とに、レポート中のデータが変化しない場合に限り実行可能なオプションである。さらな
るその他の関連するデータ特徴は、要求されるデータの保存である。データは、通常、所
定期間ごとにのみ直接的に使用される。たとえば、秒刻みの生産ラインデータは、通常、
その後の数週間あるいは数ヶ月間にわたって直接的に有用になることはない。このように
、どのデータを、高価であるが高速のデータベースストレージメカニズムから、より遅い
が低コストのストレージメカニズムに整理するかについて最適に選択をすることが望まれ
る。
使用特徴としては、データ読み取り、書き込み、および/または更新の頻度が採用され
る。たとえば、データには、年次報告書の作成に伴うデータのように、年に一度しか書き
込まれないタイプのデータもあれば、生産ラインなどにおいて1秒間に複数回書き込まれ
るタイプのデータもある。また、一度書き込まれると二度と変更されないデータもあれば
、頻繁に変更されるデータもある。もし低頻度のデータが複数のエリアで複製されると、
これらのデータをつないで一続きにするために、その更新にかかる時間が次第に長くなる
。さらに、多数のシステムにおいて、データ読み取りとデータ書き込みとの間にトレード
オフが生ずる。すなわち、1つの操作が他の操作よりもリソースを消費する。さらに、公
知であるが、データ読み取りが高い頻度で行われる場合であっても、与えられたレポート
が同一のインデックス基準を用いているかによって大きな差が生じる。たとえば、競争的
なトーナメントの高得点のリストを見る場合には、毎秒読み取りが行われる。しかしなが
ら、トーナメントの高得点から特定の区分の高得点への変化は決して変わらないか、非常
にまれである。レポートのシナリオについては、ユーザの同時実行性が最適なストレージフォーマットの決定について多大な影響を与える。たとえば、1人のユーザが、レポートを実行した後、レポートをキャッシュすると、メモリに常駐することになり、多大なパフォーマンスの向上は見込まれない。しかしながら、もし100人が同一のレポートを毎秒要求したとすると、基本となるデータのキャッシュは多大なパフォーマンスの向上をもたらすことになる。
これらの特徴に基づいて、さまざまな規則が開発される。データに基づいたパフォーマ
ンスは、データベース間での変換あるいは同一のデータベース内におけるデータ管理によ
って向上することが可能である。たとえば、もしデータの書き込み(更新)が頻繁に行わ
れれば、いわゆるビッグデータワイド・カラムデータベースを使用するのが好ましい。こ
の場合、カラムベースのデータに対するクエリは監視される。もし、非インデックスカラ
ムに繰り返しクエリが実行されると、第2のインデックスが作成される必要が生じる。あ
るいは、もし、一定の時間が経過後、クエリが特定のインデックスを使用しないのであれ
ば、そのインデックスは削除されうる。
別の例においては、基礎的なデータモデルがキーバリューペアのセットに基づいている
場合には、ドキュメントストレージエンジンが使用されるべきである。たとえば、アレイ
の中のアレイに見えるデータ構造を検索するために規則が作成される。関連して、写真や
動画など特定のバイナリデータは、ファイルベースのデータシステムに保存されることが
最適である。キーバリューストアを使用したシナリオと同様に、コントローラ302は、
別のインターフェースに保存された関係データにもリンクされたネイティブバイナリーデ
ータインターフェースを見えるようにすることもできる。たとえば、動画についてオブジ
ェクトタイプがある。上述したオブジェクト例にあるように、そのような動画のそれぞれ
は、ファイルベースのデータベースに保存されたバイナリーオブジェクトファイルにリン
クした独自のキー識別子を有するが、他のメタデータは関係データベースに保存される。
データがいわゆるACID(不可分性、一貫性、独立性、永続性)プロパティを厳格に
要求する場合には、制約付き関係データベースが最も適する。しかし、このシナリオの場
合においても、ベストフィットを決定するために特定のトレードオフを分析するべきであ
る。たとえば、高い同時性および膨大な量のトランザクションにより、銀行のATMから
のデータは、ACIDの代わりに、ワイドカラムデータベースを用いてより良好に実行さ
れるBASE(基本的な可用性、ソフトステート、結果整合性)モデルに基づいている。
基礎となるデータモデルが、ネットワーク、グラフ、オブジェクト間の接続などを記述
するデータについては、グラフデータベースへの保存が最適である。この場合、非常に時
間のかかる関係データベースにおける多元接続操作を含む、外部キー関係などの多くの関
係を意味するクエリパターンを検索するために規則が確立される。
さらに別の例においては、たとえば、得られたレポートクエリに高い反復性がある場合
には、基礎となるデータベースストレージフォーマットに関わらず、キャッシュを使用す
ることが有益である。公知であるが、キャッシュの規則は、キャッシュにおけるデータが
どのくらいの頻度で変更されているかを判断し、キャッシュ無効は時間ベースで行われる
か、および/または、ソースデータに変化が生じた際に無効とする能力を有する。この場
合、キャッシュされたデータは、それ自身の別のオブジェクトとして保存される。たとえ
ば、キャッシュオブジェクトのソースデータは、ワイドカラムデータベースストレージフ
ォーマットに存在するが、実際にキャッシュされたデータは、変換後、キャッシュメモリ
内のキーバリューストレージフォーマットに保存される。
上述したように、すべてのデータは、トリプルストアデータベース308に最初に保存
され、コントローラ302は、トリプルストアフォーマットから別のフォーマットへの変
換がいつ必要になるか、あるいはその逆も変換がいつ必要になるかを判断する。一実施態
様においては、実際に第1データベースストレージフォーマットから第2データベースス
トレージフォーマットへデータを変換するプロセスは、少なくとも最初はトリプルストア
データフォーマットに、すべてのデータが保存されるためのトリプルストアデータベース
308の機能性に含まれる。したがって、別のデータベースストレージフォーマットから
トリプルストアデータベースストレージフォーマットへの変換だけでなく、トリプルスト
アデータベースストレージフォーマットから別のデータベースストレージフォーマットへ
の変換も必要とされる。必然的に、与えられた変換に利用される特定の技術は、第1(ソ
ース)データベースストレージフォーマットおよび第2(ターゲット)データベーススト
レージフォーマットの性質に依存する。
一般的には、トリプルストアデータベースストレージフォーマットへの変換は、ソース
データベースストレージフォーマットにおける最も基本的かつ根本的なデータ構造を識別
すること、およびこれらのデータ構造をトリプルにマッピングすることに基づいて行われ
る。たとえば、キーバリューストレージフォーマットをトリプルストアストレージフォー
マットに変換する場合は、RDFなどに基づいた変換プロセスは、それぞれのキーバリュ
ーを通じて繰り返し行われ、対応するトリプルを作成する。ワイドカラムストレージフォ
ーマットからトリプルストアストレージフォーマットへ変換する場合は、変換プロセスは
それぞれのキースペース、カラムファミリー、カラムおよびロー形成トリプルを通じて繰
り返し行われる。ドキュメントストレージフォーマットからトリプルストアストレージフ
ォーマットへ変換する場合は、変換プロセスはそれぞれのコレクション、ドキュメントお
よびキーバリュー形成トリプルと通じて繰り返し行われる。グラフデータベースストレー
ジフォーマットから変換する場合は、変換プロセスは、ノード間における次の接続と形成
トリプルによって、データ内のすべてのノードを通じて繰り返し行われる。関係データベ
ースストレージフォーマットから変換する場合は、変換プロセスは、初めはそれぞれのテ
ーブルを通じて繰り返し行われ、たとえば、述部が「is a table of」に固定されたトリ
プルを確立する。また、外部のキー関係その他のインデックスあるいはプロパティは、い
ずれもそれぞれのテーブルにおいて識別され、トリプルなどのフォームに含めまれる。(
たとえば、”x:table1.column1 y:is_foreign_key_toz:table2.column2”)。それぞれの
テーブル内においては、変換プロセスはそれぞれのカラムを通じても繰り返し行われる。
それぞれのカラムは、最初に、カラム名であり、かつ、与えられたセル内に含まれた実際
のデータバリューである、トリプルサブジェクトを伴った「is a column of」の固定され
たトリプルの述部に基づいて、トリプルフォーマットにおいて定義される。同様にして、
変換プロセスは、それぞれセルを伴い、それぞれトリプルになる、それぞれのローを通じ
て繰り返し行われる。
同様に、トリプルストアデータベースストレージフォーマットから別のデータベースス
トレージフォーマットへの変換は、基本的にトリプルに基づく。ここで、上述したように
、トリプルストアデータベースストレージフォーマットは、nquadフォームであるた
め、オブジェクト識別を備える第4の要素を含み、このオブジェクト識別は、トリプルデ
ータのコンテクストの変換を確立するために利用される。したがって、トリプルストアス
トレージフォーマットからキーバリューストレージフォーマットへ変換する場合は、それ
ぞれのトリプルはキーバリューに変換される。トリプルストアストレージフォーマットか
らワイドカラムストレージフォーマットへ変換する場合には、変換プロセスは、まず、ト
リプルデータにおけるすべての明確な述部を識別し、それぞれについてカラムファミリー
を作成する。その後、変換プロセスは、それぞれのトリプルを通じて繰り返し行われ、そ
れぞれについてローを形成する。コントローラ302におけるクエリパーサなどによりも
たらされる従前のクエリ情報に基づいて、変換されているデータへのインデックススキー
ムが、データ従前の使用に基づいて得られる。そのようなインデックススキームを得る技
術は、たとえば「Oracle Database Performance Tuning Guide (11g Release1(11.1):Aut
omatic SQL Tuning(http://docs.oracle.com/cd/B28359_01/server.111/b28274/sql_tun
e.htm#PFGRF028にて入手可能)」で教示されたように、公知である。その後、第2のイン
デックスは、必要に応じて、得られたインデックススキームに基づいて作成される。トリ
プルストアストレージフォーマットからドキュメントストレージフォーマットへ変換する
場合は、トリプルデータにおいて変換されているすべてのトリプルは、まず、ドキュメン
トに対応する述部(たとえば、「is_contained_in」)を特定するために分析される。そ
の後、変換プロセスはそれぞれのトリプルを通じて繰り返し行われ、それぞれのトリプル
に基づいてキーバリューエントリーを作成する。キーバリューエントリーはその後、対応
するドキュメントにリンクされる。トリプルストアストレージフォーマットをグラフスト
レージフォーマットへ変換する場合は、変換プロセスはトリプルを通じて繰り返し行うこ
とができ、頂点と辺を構築する。
上述したコントローラにより開始される変換のほかにも、相当量のデータが、既存のR
DFデータベースに保存されている。これら既存のデータベースを利用するためには、そ
のような既存のRDFデータを関係データに変換する能力が、トリプルストアデータベー
ス308に与えられる。説明のために、トリプルデータはRDFフォーマットに基づくこ
とを前提とするが、他のトリプルフォーマットも使用することは可能である。特に、外部
RDFデータの変換は、2つのデフォルトカラム(1から始まる連続整数を備える、テー
ブルの主キーとして機能する、識別カラムと、一般的にはRDF用語のよるリソース名を
示すストリングを含むリソース名カラム)を有するテーブルの作成から開始される。この
基本的なテーブルから、トリプルデータ内のほぼすべてのプロパティ(述部)が特定され
、テーブル内においてカラムに変換される。いくつかのプロパティ(ここではメタプロパ
ティと称す)は、意味データ自体ではなくデータの基本的なオントロジー構造に関する情
報を提供するため、すべてのRDFプロパティがこのように利用されるわけではない。オ
ントロジー情報は、変換されるトリプルデータの関係データベース表現をさらに発展させ
るために利用される。テーブルを拡大するためにRDFプロパティを利用することについ
ては、簡単な例によってさらに説明する。
表8は、複数のRDFステートメントを示す。
Figure 2022120014000009
追加的なテーブルカラムを特定するためのプロパティの使用に関して上述した変換原理
に従って、表8におけるRDFステートメントは、表9に示す関係表示に変換することが
できる。
Figure 2022120014000010
本例が示すように、RDFの関係データへの変換は、データ構造あるいはメタデータの
変換であり、データ自体の変換ではない。変換プロセスをさらに発展させるために、RD
Fメタプロパティにおいて発見されたメタプロパティを利用することは有益である。
RDFと関係ストレージフォーマットとは、どちらもクラス(型)およびインスタンス
(実体)の観点に依存するという点で、データと類似した観点を有している。一方では、
RDFにおいては、クラスおよびインスタンスは明確に定義され、rdf:class、rdf:type
、rdfs:domain、rdfs:rangeなど、指定のメタプロパティにサポートされている。その一
方で、関係フォーマットにおいては、クラス/インスタンスの観点は、明確に定義されて
いないものの、「テーブルおよびタプル」と呼ばれる他のフォームにおいて効果的に実行
される。テーブルは、クラスとみなされる一方、カラムは、クラスプロパティおよびタプ
ル(ロー/レコード)としてインスタンスとしてみなされる。したがって、一実施態様に
おいては、RDF形式のデータを関係形式のデータに変換するためのアプローチは、RD
Fクラスを関係テーブルに、RDFインスタンスを関係タプルに変換することにより行わ
れる。このため、RDFにおけるそれぞれのリソースのクラスを決定することは必須とな
る。このタスクは、RDFにおける利用可能なメタプロパティの利用により容易化される
したがって、外部RDFデータが提示されると、変換プロセス(変換プロセスの例は、
図4に関連して下記に詳述する)は、分類を示すメタプロパティの発生を特定するために
、まずはリソースをスキャンすることにより、その中のリソースの分類を試みる。これら
公知のメタプロパティについては、下記に個別に記載する。
第1のRDFメタプロパティは、rdf:typeである。正式には以下のように定義される。
「rdf:typeは、リソースはクラスのインスタンスであると述べるために使用される
rdf:Propertyのインスタンスである。
フォームはトリプルである:
R rdf:type Cは、Cがrdfs:Classのインスタンスであり、RはCのインスタンスである
ことを述べている。」
したがって、変換プロセスが与えられたリソースについてこのメタプロパティを発見す
ると、そのリソースのクラスを明確に把握する。
第2のRDFメタプロパティは、rdfs:domainである。正式には以下のように定義され
る。
「rdfs:domainは、与えられたプロパティを有するすべてのリソースは、1つ以上のクラ
スのインスタンスであることを述べるために使用されるrdf:Propertyのインスタンスであ
る。
フォームはトリプルである:
P rdfs:domain Cは、Pはクラスrdf:Propertyのインスタンスであり、Cはクラスrdfs:
Classのインスタンスであり、述部がPであるトリプルのサブジェクトによって表示され
たリソースはクラスCのインスタンスであることを述べている。
プロパティPが1つ以上のrdfs:domainプロパティを有する場合には、述部がOである
トリプルのサブジェクトによって表示されたリソースは、rdfs:domainプロパティによっ
て述べられたすべてのクラスのインスタンスである。」
換言すれば、このメタデータは、rdfs:domainトリプルのサブジェクトが、オブジェク
トのプロパティであることを示すとともに、その述部としてプロパティを有するその他の
トリプルのサブジェクトは必然的にそのクラスに属するということを示す。表10に示す
RDFステートメントを検討する。
Figure 2022120014000011
これらのステートメントより、「著者(author)」は、クラス「本(book)」のプロパ
ティであることがわかる。「author」プロパティが「ロードオブザリング(lord of the
rings)」のサブジェクトの述部として使用されている場合は、「lord of the rings」が
「book」のクラスに属することが推断できる。公知であるが、このような推断は、RDF
S(RDFスキーマ)推測エンジンを用いて特定することができる。
第3のRDFメタプロパティは、rdfs:rangeである。rdfs:rangeは、結果として生じる
推断がトリプルステートメントにおいて、サブジェクトではなく、オブジェクトに適用さ
れる点を除き、実質的にはrdfs:domainに類似する。表11に示したRDFステートメン
トを検討する。
Figure 2022120014000012
これらのステートメントより、「食べる(eat)」はクラス「食べ物(food)」のプロ
パティであることがわかる。プロパティ「eat」がオブジェクト「野菜(vegetables)」
の述部として使用されている場合は、「vegetables」がクラス「food」に属することが推
断される。公知であるが、このような推断は、RDFS推測エンジンを用いて特定するこ
とができる。
第4のRDFメタプロパティは、rdfs:subClassOfである。<A> <rdfs:subClassOf><B>
というフォームのステートメントがあるとすると、「A」はクラスであり、「A」はクラ
ス「B」のすべてのプロパティを共有するということがわかる。
さらに、クラスのプロパティに関する既存の知識も利用される。すなわち、頻繁に生じ
うることであるが、与えられたリソースがそのクラスを示すオントロジー情報を一切有し
ていない場合には、変換プロセスは、利用可能なプロパティを特定し、既存のクラス/テ
ーブルとこれらのプロパティを比較し、可能であればこれらを一致させるよう試みる。
上述したメタプロパティに依存した変換プロセスを、図4にさらに示す。特に、図4は
、トリプルストアデータベース308および関係データベース304のコンポーネントを
示し、特にデータ変換に関わるコンポーネントを詳細に示す。図示のように、RDFデー
タは、RDF DBMS402によって維持され、同様に、関係データは、DBMS40
4によって維持される。一実施態様においては、外部RDFデータストア406からのR
DFデータは、公知のRDFローダー408を介して、RDF DBMS404にインポ
ートされる。外部RDFデータから関係データへの変換を完遂するために、トリプルスト
アデータベース308は、変換ブリッジ412および推測エンジン414を含む。集合的
には、変換ブリッジ412および推測エンジン414は、RDFデータ410を関係デー
タ416に実際に変換するRDFSコンバータを構成する。すなわち、下記に詳述するが
、変換ブリッジ412は、メタプロパティを特定するためにRDFデータ410を点検し
、必要に応じて推測エンジン414の補助を受けながら、リレーショナル(関係)データ
ベースストレージフォーマットに基づいて構成された関係データ416を拡大するために
使用されるプロパティを決定する。
特に、変換ブリッジ412は、RDFデータ40内のトリプルを処理して、それぞれの
トリプルのサブジェクトおよびオブジェクトの両方に関するメタプロパティを検索する。
したがって、メタプロパティ「rdf:type」が発見されたそれぞれのステートメントについ
ては、変換ブリッジ412は、まずオブジェクトを抽出し、リソースのクラスを特定する
。その後、変換ブリッジ412は、抽出されたクラス名と同一のテーブル名を有するテー
ブルを特定するため、すべてのテーブルを検索する。そのようなテーブルが発見されると
、変換ブリッジ412は、既存のテーブルのプロパティ(カラムの定義など)と新規リソ
ースのプロパティとを比較する。これらが一致しなければ、変換ブリッジ412は、テー
ブルカラムの定義に新規リソースのプロパティを追加する。つまり、新規リソースのプロ
パティを含むためにテーブルカラムの定義を拡大する。そのようなテーブルが発見されな
かった場合には、変換ブリッジ412は、クラスの属性を判定するために、RDFデータ
におけるリソースのクラスに関する「rdfs:domain」および「rdfs:range」メタプロパテ
ィを検索する。さらに、変換ブリッジ412は、クラスのオブジェクトのプロパティを検
索する。これらの追加的な作業を行ったにもかかわらず、そのようなプロパティあるいは
属性が発見されない場合には、新規リソース名からテーブル名を採用し、「_UNKNOWN_CLA
SS」のストリングをテーブル名に続けた新規テーブルを作成する。
メタプロパティ「rdfs:subClassOf」が発見された場合には、変換ブリッジ412は、
このリソースがクラスであり、このリソースはテーブルとして表されるべきと認識する。
この現在のクラスとその親クラスの両方について、変換ブリッジ412は、いずれかのク
ラスがそれに関するプロパティをまだ有するかを判断するために検索する。「rdf:type」
を伴うリソースおよびオブジェクトとしてのいずれかのクラスが発見されると、リソース
に関連するすべてのプロパティが他のクラスのプロパティとして抽出される。メタプロパ
ティ「rdfs:domain」あるいはプロパティとしての「rdfs:range」、およびオブジェクト
としていずれかの1クラスとともにプロパティが発見されると、そのプロパティは、推測
エンジン414を用いて、対応するクラスのプロパティとして抽出される。「rdfs:subCl
assOf」プロパティとともに現在のクラスあるいは親クラスのいずれか1つが発見された
場合には、これらサブ/親クラスに基づいてこれらのステップが反復される。さらに、現
在のクラスについては、変換ブリッジ412は、現在のクラスの名前として同一のテーブ
ル名を有するテーブルを特定するためにすべてのテーブルを検索する。そのようなテーブ
ルが発見されると、変換ブリッジ412は、カラム定義のような既存のテーブルのプロパ
ティと新規リソースのプロパティとを比較する。これらが一致しない場合には、変換ブリ
ッジ412は、テーブルのカラム提起に新規リソースのプロパティを追加するが、そのよ
うなテーブルが発見されない場合には、現在のクラス名に基づいて新規テーブルが作成さ
れ、現在のクラスのために以前集められたプロパティはカラム定義として利用される。よ
り多くの「rdfs:subClassOf」ステートメントが発見された場合には、新規の現在のクラ
スおよび親クラスに基づいて、以前のステップが反復される。
RDFデータ410を処理するに際して、変換ブリッジ412は、与えられたリソース
がオントロジー情報(上述したメタプロパティにより提供されたもの)を有していないこ
とを判定する。この場合、変換ブリッジ412は、リソースの既知のプロパティの比較に
基づいてリソースの分類を試みようとする。特に、変換ブリッジ412には、信頼レベル
c(0≦c≦1)が提供される。たとえば、信頼レベルは、ワークステーション206の
ユーザや、アドミニストレータなどにより提供される。信頼レベルのソースにかかわらず
、変換ブリッジ412は、現在のユーザがすでにアクセスした、すべての利用可能なテー
ブルを検索し、それぞれのテーブルについて、カラムの数をカウントし、そのカラム計数
値とプロパティの未分類リソースの数であるプロパティ計数値とを比較する。カラム計数
値およびプロパティ計数値の大きい方をn、小さい方をmとすると、これら2つの共通プ
ロパティの数pがカウントされる。p≧m*cである場合、テーブルのカラムおよびリソ
ースのプロパティの類似性が十分に高いことを示すので、変換ブリッジ412は、そのテ
ーブル名をリストに一時的に記録する。このようにしてすべてのテーブルが処理された後
、前記リストが検索され、このリストが空の場合、すなわち、十分に類似するテーブルが
特定されなかったことを示した場合には、未分類リソースを、既知の情報によって分類す
ることは不可能である。この場合、変換ブリッジ412は、この未分類リソースを新規ク
ラスとして扱い、この未分類リソース名のあとに「_UNKNOWN_CLASS」のストリングを付し
た新規テーブルを作成し、このリソースを新規テーブルに挿入する。一方で、リストが空
でなかった場合には、pの最大値を有するテーブルが特定される。すると、変換ブリッジ
412は、特定されたテーブルはリソースのクラスであると推測して、上述したようにプ
ロパティを比較し、必要に応じてテーブルカラム定義を拡大する。その後、前記リソース
はテーブルに挿入される。この方法では、RDFデータ410がオントロジー情報(メタ
プロパティ)を有さず、すべてのリソースが完全に異なるプロパティを共有している場合
に、最悪のケースのシナリオが生じる。最悪のケースのシナリオにおいては、変換ブリッ
ジ412は、それぞれのテーブルに1つのレコードが付された潜在的に多数のテーブルを
生成することになる。このような問題を回避するため、信頼レベルを0に設定することで
、すべての未分類リソースが同一のクラスとして扱われ、同一のテーブルに挿入されるが
、これも望ましい結果ではない。したがって、信頼レベルは、作成されたテーブル数と分
類の正確さとのバランスを図る。
RDFデータ410から関係データ416への変換が完了すると、RDFデータ416
は、関係DBMS404に追加される。RDFローダー408と同様に、関係DBMS4
04は、公知であるが、関係データをRDFデータ420に直接エクスポートすることが
できるRDFエクスポーター418と通信する。
図4は、RDF DBMS402および関係DBMS404とともに使用される追加的
なコンポーネントを示す。たとえば、公知であるが、それぞれのユーザが有する特定の権
利(ユーザの権限)、有効なユーザ(User)の識別、および特定のユーザロール(Roles
)の識別を図示したように管理するために、アドミニストレーションコンポーネント42
2が設けられる。さらに図示したように、ユーザがRDFと関係データにアクセスするた
めのさまざまな方法を提供するために、多数のクエリインターフェースが設けられる。た
とえば、公知のSPARQLエンドポイント424は、いわゆるSPARQL RDFク
エリプロトコル426をサポートする。このようにして、ユーザは、SPARQLクエリ
428を使用して、RDF DBMS404に直接アクセスする。代替的に、上述の統一
API430は、RDF DBMS402にアクセスするためのSPARQLクエリ42
8およびSQLのようなクエリ432をサポートするだけでなく、関係DBMS402に
アクセスするためのSQLクエリ433の使用もサポートする。
図3について再度言及すると、上述したタイプのオブジェクト310は、コントローラ
302によって採用されるオブジェクト中心のアプローチを強調するために、コントロー
ラ302内の中央に示されている。さらに、コントローラ302は、オブジェクトの使用
に起因する多数の機能を提供する。表1に示したように、オブジェクトは、オブジェクト
の性質によって、異なる状態を反映するために複数の値を採りうる1つ以上の状態インジ
ケータを含む。状態管理コンポーネント312は、システム300内におけるすべてのオ
ブジェクトに関するそのような状態情報を追跡する。たとえば、下記に詳述するが、個別
のオブジェクトは、互いに幅広い関係を有することが可能であり、そのような関係は状態
インジケータに反映される。たとえば、特定のデータを代表するオブジェクトは、そのオ
ブジェクトが他のデータオブジェクトを駆動するか(たとえば、「単位価格」のデータオ
ブジェクトが「購入累計金額」のデータオブジェクトを駆動するか)、あるいは他のデー
タオブジェクトによって駆動されるか(「購入累計金額」のデータオブジェクトは「単位
価格」のデータオブジェクトによって駆動されるか)というインジケータを含む。あるい
は、ウィジェットは、本明細書中で使用されているように、互いにさまざまな関係を有す
る他のオブジェクト(あるいはウィジェット)の集合体となり得るオブジェクトを参照す
る。これらの構成オブジェクト(および/または他のウィジェット)間の関係は、「cont
ains(有する)」、「has child(子供がある)」、「has parent(親がいる)」などの
複数の状態値に反映される。さらに、状態データは、オブジェクトの一時的な使用状態、
たとえば「can be used(使用可能)」、「is used(使用中)」、あるいは「has been u
sed(使用済み)」などの状態値に反映される。さらに、状態インジケータは、バイナリ
ーの性質、すなわち、「hidden(見えない)」に対する「visible(見える)」の状態値
、あるいは「enabled(できる)」に対する「disabled(できない)」の状態値の場合の
ような性質を有する。上述した例に示されるとおり、無数の使用状態インジケータおよび
値が採用され得る。
履歴管理コンポーネント314は、それぞれのオブジェクトへの修正に関する情報を維
持し、どの修正が最新かをトラッキングする。上述した状態インジケータと同様に、修正
状態は、「current(現在の)」、「archived(記録された)」、「deleted(削除された
)」、あるいは「historic(過去の)」を含み、これらのすべては、データベース304
~308内におけるそれぞれのオブジェクトのために履歴管理コンポーネント314によ
り追跡される。
切断コンポーネント316は、所定のオブジェクトがコントローラ302との接続が失
われた場合に生じうるコンフリクト状態を管理するために設けられる。下記に詳述するよ
うに、コントローラ302に追跡されたオブジェクト、特に、ソフトウェアウィジェット
あるいは他の離散機能コンポーネントに関するオブジェクトは、エンドユーザアプリケー
ションを構成するために使用される。このため、アプリケーションが特定のオブジェクト
に基づいて構築されることから、アプリケーションの作者は、切断時においても利用可能
な一定のオブジェクトを示すよう問い合わせを受けるが、この情報は切断コンポーネント
316により追跡される。その後、アプリケーションは、エンドユーザアプリケーション
サーバを介して、エンドユーザに利用可能となる。エンドユーザが、このエンドユーザア
プリケーションサーバ上のアプリケーションにアクセスすると、このエンドユーザアプリ
ケーションサーバは、切断時の機能のためにどれくらいのローカルストレージを割り当て
ることが可能か判断するために、クライアント処理装置、たとえば、デスクトップコンピ
ュータ、ラップトップコンピュータ、モバイルワイヤレスデバイスなどとかけあう。ロー
カルストレージの所望量は、切断時にも利用可能なように必要とされる特定のオブジェク
トにある程度依存する。クライアント処理装置とのかけあいプロセスは、同一のアプリケ
ーションを使用する複数の他のエンドユーザ処理装置のために繰り返されるため、それぞ
れのクライアント処理装置は、指定されたオブジェクトのための同一のローカルストレー
ジを含む。
エンドユーザのクライアント処理装置との間で切断が生じると、コントローラ302は
、公知の技術を用いてこの状態を検出し、他のエンドユーザクライアント装置には、切断
コンポーネント316によってこの事実が通知される。追加的に、切断されたエンドユー
ザクライアント装置は、指定されたオブジェクトの操作を維持するために、ローカルスト
レージを使用するモードに切り替わる。たとえば、指定されたオブジェクトが購入注文を
追跡するウィジェットである場合、たとえば「会社Aから会社Bに、1000部分の発注
書(P.O.)を送る」というウィジェットの使用が、データの作成、読み取り、更新、
削除が引き続き可能とするという意味でローカルストレージのみにおいて維持される。一
方で、他のエンドユーザクライアント装置は、同一の指定されたオブジェクトを切断され
たクライアント装置とコンフリクトしかねない方法で使用すること(たとえば、会社Aか
ら会社Bに、2000部分の発注書を送る)を含め、通常通り作動し続けることができる
。このような場合には、切断コンポーネント316は、他のエンドユーザクライアントに
よる指定されたコンポーネントの使用を追跡する。切断されたクライアント装置がコント
ローラ302との接続を再開すると、ローカルストレージに保存されたデータは、コント
ローラ302にアップロードされ、切断コンポーネント316はコンフリクトの発生を検
出する。要するに、切断コンポーネント316は、切断中に切断されたエンドユーザクラ
イアントによって使用された、すべての指定されたコンポーネントに関するすべてのデー
タを「隔離」する。
コンフリクトを検出すると、切断コンポーネント316は、さまざまな方法でコンフリ
クトを解消することが可能である。一実施態様においては、切断コンポーネント316は
さまざまなエンドユーザクライアント装置の階層に関する規則を有する。たとえば、どの
エンドユーザクライアントが他のエンドユーザクライアントに優先すべきかを判断するた
めに、企業内あるいは同様に階層的に組織された組織内において、特定のエンドユーザク
ライアントは、肩書き、地位、その他の優先性を示すインジケータに関連づけられること
により、より高い優先度を有するエンドユーザクライアントによって提供されるデータに
基づいて、コンフリクトが自動的に解消される。そのような自動的な解決が不可能な場合
には、コントローラ302は、コンフリクトを起こしているデータを、コンフリクトを解
消するための要求とともに、コンフリクトを起こしているエンドユーザクライアント装置
に送ることが可能である。その後、コンフリクトを起こしているクライアントがコンフリ
クトを解消できると仮定して、どのようにコンフリクトを解消することが可能か(つまり
、どのデータを保存するか)を示しながら、データは切断コンポーネント316に戻され
る。
状態管理コンポーネント312により維持された状態情報に基づいて、それぞれのオブ
ジェクトについてソーシャルネットワークが構築される。すなわち、それぞれのオブジェ
クトについて維持された関係情報を用いると、オブジェクトおよびオブジェクト同士の関
係のネットワーク表示を作成することが可能となる。たとえば、「従業員のファーストネ
ーム」オブジェクトと「従業員のラストネーム」オブジェクトは、それぞれ、「従業員の
名前」に関連する「belongs to(所属する)」状態を反映し、他のオブジェクトなどへ独
自の接続を有する。そのようなネットワークは、公知のネットワーク発見技術を用いたネ
ットワークコンポーネント318により得られる。たとえば、下記の自動データマイニン
グコンポーネント332を実行するために使用される、データマイニングサーバ222に
よって、公知のデータマイニング技術、たとえば、根本原因解析、分類、クラスタリング
、結合規則発見、および/または回帰分析を利用することができる。
さらに、図示のように、根本原因解析コンポーネント320(オブジェクトソーシャル
ネットワークを生産するためのネットワークコンポーネント318により用いられる根本
原因解析とは異なるもの)が設けられる。ニューラルネットワーク解析や回帰分析などの
公知の技術を用いて、オブジェクトソーシャルネットワーク内において、ネットワークコ
ンポーネント318によって提供された根本原因は、特定のオブジェクトに関連して特定
される。より正確には、ソーシャルネットワークは、根本原因を常に直接特定することは
不可能であるが、時には潜在的な因果関係である相関関係が特定される。つまり、比較的
簡素で明瞭なソーシャルネットワークについては、根本原因は確実性を伴って特定される
。しかしながら、複雑かつ/または不明瞭なソーシャルネットワークについては、人間に
よる追加的な解析を条件に特定することが可能である。たとえば、「従業員の能率」オブ
ジェクトに関する複数のオブジェクトには、「従業員の年齢」、「従業員のスキルレベル
」、「曜日」、「工場の気温」などが含まれる。ニューラルネットワーク解析の場合には
、これらのオブジェクトの基礎となるデータは、「従業員の能率」オブジェクトの値を予
測するにあたり最も重要となる要素を効果的に明らかにするネットワーク機能を明らかに
するために、公知の技術を用いて解析される。そのような根本原因の識別は、これまでに
存在しなかったオブジェクト間の関係を作るために利用されるか、あるいは従前に定義さ
れた関係を更新あるいは削除するために利用される。
上述したように、システム200および300に保存されたデータとともに使用される
アプリケーションは、複数の階層型ユーザインターフェースを使用して開発される。図示
の例においては、階層型ユーザインターフェースは、第1メジャーデベロッパインターフ
ェース322、第2メジャーデベロッパインターフェース324、およびマイナーデベロ
ッパインターフェース326を備える。すべてのデベロッパインターフェース322~3
26はオプションであり、これらのいかなる組み合わせも利用可能である。一般的には、
それぞれのデベロッパインターフェース322~326は、2つの使用パターンあるいは
ロールを有する。具体的には、異なるユーザにより異なる目的のために個別に用いられる
独立プラットフォームと、一元的なシステムとして機能するために他のプラットフォーム
と協働するプラットフォームである。一実施態様においては、第1メジャーデベロッパイ
ンターフェース322、第2メジャーデベロッパインターフェース324、およびマイナ
ーデベロッパインターフェース326は、ソフトウェア開発において、連続したより高次
の抽象化レイヤーとして機能する。抽象化のレベルが高次元になるほど、多くのプログラ
ミングの詳細が漸次的に隠されていくことになるため、アプリケーションの開発用として
は使用しやすくなる。
したがって、一実施態様においては、第1メジャーデベロッパインターフェース322
は、Apache Eclipseのような公知の統合開発環境(IDE)である。第1
メジャーデベロッパインターフェース322を用いると、比較的熟練したプログラマーで
あれば、いかなるタイプのソフトウェアでも開発することができる。第2メジャーデベロ
ッパインターフェース324は、GUIアプリケーションビルダー(完全に機能的なGU
Iアプリケーションを中程度の抽象化レベルで構築するために用いることができ、第1メ
ジャーデベロッパインターフェース322を実行するために用いられる同一のアプリケー
ションを含む)を用いて実行することができる。マイナーデベロッパインターフェース3
26は、公知であるが、ソフトウェア開発スキルをほとんど有しない個人に、高次のファ
ンクショナルビルディングブロックに基づいてアプリケーションソンを構築することを可
能にする、ゾーホークリエータ(Zoho Creator)などの複数のグラフィカルウェブアプリ
ケーションビルダーを備える。したがって、第1メジャーデベロッパインターフェース3
22による低次の抽象化は、特定のプログラミング言語特徴を扱うユーザにのみ利用可能
であるが、第2メジャーデベロッパインターフェース324で用いられる機能は、プログ
ラミング言語に依存しておらず、さらに、マイナーデベロッパインターフェース326に
おいては、プログラミングに特有な用語あるいは特徴はまったく必要とされない。
操作中において、公知であるが、第1メジャーデベロッパインターフェース322は、
第1メジャーデベロッパインターフェース322のユーザにソフトウェアコードの生成お
よび修正を許可する複数のモードを提供する。たとえば、いくつかのIDEは、定義され
、選択可能なタスクを備える。与えられたタスクを選択するにあたり、コードテンプレー
トも選択されるため、IDEは、選択されたテンプレートに基づいて自動的にコードを生
成する。あるいは、ユーザは、一連のドロップダウンメニューから操作を定義することが
できる。このドロップダウンメニューは、利用可能な操作を示すために常に更新され続け
る。ユーザがさまざまな操作を選択すると、コードが自動的に生成される。さらに別の実
施形態においては、中間コマンドを提供するためにユーザにより提供された自然言語テキ
ストを解析するため、自然言語処理エンジンが使用される。この中間コマンドは、その後
、自動的に生成されるコードを提供するために解析される。いずれの実施形態においても
、自動的に生成されたコードは、最終的な所望のコードを提供するために、ユーザによっ
て希望通りに修正される。
第2メジャーデベロッパインターフェース324は、さまざまなユーザインターフェー
スコントロールがツールボックス内に備えられている、公知の「ドラッグアンドドロップ
」式のグラフィカルユーザインターフェースを提供する。利用可能なさまざまなユーザイ
ンターフェースコントロールは、選択されたコントロールのインスタンスを作成するため
に、デザインエリアにドラッグされる。このインスタンスは、その後選択され、一定のビ
ヘイビアを示すよう構成される。同様にして、所望のイベント定義、フローコントロール
あるいはアクションはいずれも、選択されたコントロールインスタンスに追加される。こ
のようなコントロールを結合させることにより、ウィジェットあるいはより完全なアプリ
ケーションが作成されて、ユーザインターフェースの所望の機能性が実装される。これが
完全に構成されると、結果として得られたウィジェットあるいはアプリケーションが発行
される。
なお、第1および第2メジャーデベロッパインターフェース322、324により作成
されたコードおよび/あるいはウィジェットは、すべてコントローラ302によりオブジ
ェクトとして保存される。
第2メジャーデベロッパインターフェース324と同様に、マイナーデベロッパインタ
ーフェース326も「ドラッグアンドドロップ」式のGUIに基づいている。しかしなが
ら、マイナーデベロッパインターフェース326用に設けられたツールボックスは、デザ
インエリアにおいて選択され結合される、発行済みのウィジェットあるいはアプリケーシ
ョンを含む。完全なアプリケーションが定義されると、公知の技術を利用した第2メジャ
ーデベロッパインターフェース324は、たとえばユーザインターフェースマークアップ
言語(Qtメタ言語(QML)など)および/またはファンクショナルマークアップ言語
(ビヘイビアマークアップ言語(BML)など)を用いて、個別のウィジェットの操作お
よびこれらそれぞれの互いの関係を示すアプリケーションメタファイルを生成する。結果
として得られたアプリケーションメタファイルは、その後、ソースおよび実行可能なコー
ドを生成するコードジェネレータ328に送られる。このようなコードジェネレータの例
としては、エクリプスファウンデーション(Eclipse Foundation)から発売されているA
cceleoオープンソースコードジェネレータがある。結果として得られたソースコー
ドおよび実行可能なコードな、コントローラ302によりオブジェクトとして保存され、
実行可能なコード330は、適切なアプリケーションサーバなどを介して、エンドユーザ
に利用可能となる。
上述したように、インターフェース322~326は、協働的に用いることができる。
たとえば、第1メジャーデベロッパインターフェース322は、互換性のある特定のプロ
グラミング言語を用いて、開発中のコンストラクトに集中するために用いることも可能で
ある。つまり、第2メジャーデベロッパツール324による使用のためのプログラミング
言語エンティティおよびロジックラッパを構築することが可能である。たとえば、第1メ
ジャーデベロッパインターフェース322を用いると、開発者は、Java GUIコン
ポーネント(たとえば、テキスト入力ボックス)を特定のオブジェクトにラップすること
ができ、コントローラ302を通して、そのオブジェクトを第2メジャーデベロッパイン
ターフェース324において利用可能とすることによって、第2メジャーデベロッパイン
ターフェース324は、このオブジェクトを今後の使用のためにツールボックスに追加す
ることが可能となる。このようにして、第1メジャーデベロッパインターフェース322
は、第2メジャーデベロッパインターフェース324にとっては「プラグイン」であると
みなすことができ、このような機能によって第2メジャーデベロッパインターフェースの
機能が拡張される。
一方、第2メジャーデベロッパインターフェース324は、第2メジャーデベロッパイ
ンターフェース324が開発することができるアプリケーションのタイプに集中すること
、すなわち、マイナーデベロッパインターフェース326が使用するためのGUIコンポ
ーネントおよびロジックラッパを構築することに関して、協働的に使用することが可能で
ある。たとえば、第2メジャーデベロッパインターフェース324を用いて、開発者は、
「サブミット(Submit)」ボタンをラップして、このボタンへのシングルクリックにより
、すべてのデータを現在のスクリーン上に集めたり、データベース304~306に送っ
たり、このオブジェクトをマイナーデベロッパインターフェース326に付与したり、マ
イナーデベロッパインターフェース326がこのオブジェクトを後に使用できるようにす
るため、マイナーデベロッパインターフェース326にそのツールボックスへのオブジェ
クトの追加を許可したりすることを可能とするロジックを持たせることができる。この場
合、第2メジャーデベロッパインターフェース324は、マイナーデベロッパインターフ
ェース326にとっては「プラグイン」であるとみなすことができ、このような機能によ
ってマイナーデベロッパインターフェースの機能が拡張される。
図3に示すように、システム300は、保存されたデータをユーザが扱う能力を高める
さまざまな機能を備える。一実施形態では、自動データマイニングコンポーネント332
は、データベース304~306に保存されたデータについて適用される、公知のさまざ
まなデータマイニングアルゴリズムを、コントローラ302を介して、実行する。具体的
には、自動データマイニングコンポーネント332は、与えられたデータマイニングタス
クのための処理前データを最良にし、かつ、このデータマイニングタスクのために最良の
データマイニングアルゴリズムを選択する。
公知ではあるが、データマイニングでは、解析されるデータに前処理が行われた場合に
、最良の結果がもたらされる。しかしながら、そのような前処理は、解析されるデータの
性質に強く依存する。自動データマイニングコンポーネント332は、最良のデータ前処
理を自動的に選択するためにトレーニングをすることができる。このため、サンプルのデ
ータセットがまず集められ、その統計上の特徴が抽出される。そのような統計上の特徴は
、たとえば、平均値、中央値、値域、および標準偏差などの数学的特徴を含む。さらに、
属性数やそれぞれの属性のタイプ(たとえば、名目上あるいは数値上)、データセットの
サイズなどの単なる事実も含む。このようにしてデータセットが特徴づけられると、N個
の公知のデータ処理前アルゴリズムが、データセットに対して実行され、それぞれの処理
前アルゴリズムについて結果として生じた処理前データを個別に保存する。その後、M個
の公知のデータマイニングアルゴリズムは、それぞれの処理前データセットにおいて実行
されることにより、N×M個のデータマイニング結果セットを生じる。それぞれのデータ
マイニング結果セットは、その後、関係する処理前およびデータマイニングアルゴリズム
の組み合わせの精度および正確性を評価するため、公知の技術を用いて評価される。可能
な場合は、それぞれのデータ処理前アルゴリズムのパラメータは、処理前アルゴリズムお
よびパラメータの最良の組み合わせ、およびデータマイニングアルゴリズムを特定するた
めに変動する。特定されると、処理前アルゴリズム/パラメータ/データマイニングアル
ゴリズムの最良の組み合わせがクラス属性として指定され、前記データセットの統計学的
特徴が入力属性として指定される。これらのクラス/入力属性は、その後、処理前選択学
習モデルを増加させるために用いられ、実質的に合致する統計学的特徴を有するその後の
データセットも同様の方法で前処理される。
さらに、与えられたデータマイニングタスクに対しては、特定のデータマイニングアル
ゴリズムが他のデータマイニングアルゴリズムより優れている場合がある。最良の処理前
アルゴリズムを選択するためのトレーニングについて上述したのと同様に、自動データマ
イニングコンポーネント332も、実行されるべき特定のデータマイニングタスクに基づ
いて自動的に最良のデータマイニング技術を選択するために、トレーニングをすることが
できる。このため、サンプルのデータセットが再度集められ、その統計学的特徴が抽出さ
れる。このように特徴づけられると、N個の公知のデータ処理前アルゴリズムが、前記デ
ータセットに対して実行されるため、それぞれのデータマイニングアルゴリズムについて
、結果として得られたデータセットが個別に保存される。データマイニング結果セットの
それぞれは、その後、それぞれのデータマイニングアルゴリズムの精度および正確性を評
価するため、公知の技術を用いて評価される。可能な場合は、それぞれのデータマイニン
グアルゴリズムのパラメータも、データマイニングアルゴリズムおよびパラメータの最良
の組み合わせを特定するために変動させる。特定されると、データマイニングアルゴリズ
ムおよびパラメータの最良の組み合わせがクラス属性として指定され、データセットの統
計学的特徴が入力属性として指定される。これらのクラス/入力属性は、その後、データ
マイニング選択学習モデルの増加に用いられ、与えられたデータマイニングタスクを受け
るために使用され、かつ、実質的に合致する統計学的特徴を有するその後のデータセット
も同様の方法で前処理される。
一実施態様においては、最良の処理前および/またはデータマイニングアルゴリズムの
利点は、さらなる処理によって得られる。この処理においては、前処理されるデータセッ
トあるいは与えられたデータマイニングタスクを受けるデータセットは、上述したように
、再度統計学的に特徴づけられる。結果として生じる統計学的特徴に基づき、最良の処理
前あるいはデータマイニングアルゴリズムkは、上述したように、前記データセットおよ
び入力属性の統計学的特徴間の類似性に基づいて選択される。同時に、前記入力データベ
ースは、公知であるが、データの削減を受けて、すべての利用可能な処理前あるいはデー
タマイニングアルゴリズムが、削減された入力データセットに対して適用され、最良の処
理前あるいはデータマイニングアルゴリズムnが選択される。さらに同時平行して、最良
の処理前あるいはデータマイニングアルゴリズムmを特定するために機械学習モデルが使
用される。その後、最良の処理前あるいはデータマイニングアルゴリズムhを選択するた
めに、異なる処理前あるいはデータマイニングアルゴリズムk、mおよびnの結果が比較
される。これら処理前あるいはデータマイニングアルゴリズムhは、その後、前記入力デ
ータセットに対して実行され、結果が平均化される。結果として生じた平均出力は、その
後、可能性のある最良の処理前あるいはデータマイニングアルゴリズムの組み合わせを示
す。
別のデータマイニングの実施形態においては、自然言語処理エンジン336とともに任
意に作動する質問駆動型データマイニングコンポーネント334が設けられている。質問
駆動型データマイニングコンポーネント334は、データマイニングの経験がほとんどな
いかまったくないユーザに、データマイニングタスクを行えるメカニズムを提供する。エ
ンドユーザが、コントローラ302にデータマイニング要求を与えると、コントローラ3
02は、その要求を質問駆動型データマイニングコンポーネント334に直接送るか、要
求が自然言語テキストで表されている場合には、必要なデータセットの解析のために質問
駆動型データマイニングコンポーネント334が使用可能な命令に変換するためのNLP
エンジン336を通じて、質問駆動型データマイニングコンポーネント334に送られる
より具体的には、質問駆動型データマイニングコンポーネント334は、たとえば、そ
の特定の目的のためのユーザインターフェースを介して、自然言語で表されたユーザの質
問を受領する。これらの複雑な質問、たとえば、「なぜ」や「どのように」といった形式
で表現された質問が受領されると、質問駆動型データマイニングコンポーネント334は
、後述するように、NLPエンジンコンポーネント336による処理を行う。NLPエン
ジンコンポーネント336が質問の複雑な形式を扱えない場合には、NLPエンジンコン
ポーネント336は、その質問を解析し、自動データマイニングコンポーネント332に
よって実行されるデータマイニングタスクの形に解析する。NLPエンジンコンポーネン
ト336は、質問駆動型データマイニングコンポーネント334に、データマイニング操
作の必要性を伝え、これにより、質問駆動型データマイニングコンポーネント334は、
前記データマイニングタスクを開始するために必要なパラメータ(たとえば、本明細書の
付属資料に基づいて表現された要求の形式)を生成する。これらのパラメータは、自動デ
ータマイニングコンポーネント332におけるとの同様に、データマイニングタスクを開
始するために、質問駆動型データマイニングコンポーネント334に戻された結果ととも
に使用される。ユーザに結果を提供するために、質問駆動型データマイニングコンポーネ
ント334は、その後、前記結果を、NLPエンジンコンポーネント336に送る。
一実施態様においては、上述したように、利用可能なデータマイニング操作を提供する
ために、自動データマイニングコンポーネント332は、特定のタイプのデータマイニン
グ操作の実行を要求するHTTP(ハイパーテキストトランスファープロトコル)POS
T要求のフォーマットにて外部要求を受領するよう、APIメソッドを提示する。要求に
対して、APIは、要求された操作を他のHTTP POSTのフォーマットで完了する
ための時間の見積を回答することができる。公知であり、また、上述したように、根本原
因解析、分類、クラスタリング、結合規則、発見、回帰分析などのさまざまな異なるタイ
プのデータマイニングタスクが提供される。
要約すると、APIによる処理は、以下のように表される。
1.APIメソッドは、HTTP POST要求を受領する。
2.APIメソッドは、要求データを抽出し、データを分析する。
3.APIメソッドは、要求データを確認する。要求が受け入れ可能である場合には、
ステップ5へと処理を進める。
4.要求が受け入れ不能である場合には、APIメソッドは、エラー情報を含むHTT
P POST応答を返し、処理は終了する。
5.要求が受け入れ可能である場合には、APIメソッドは、必要となる時間の見積を
計算する時間概算モジュールに対し、選択されたデータに基づいて要求を実行するよう命
令する。
6.APIメソッドは、時間の見積を含んだHTTP POST応答を返す。
7.要求における情報に基づき、APIメソッドは、関係するオブジェクトをコントロ
ーラを介して特定し、それによって要求されたデータを特定し、自動的にデータ処理ステ
ップを適用し、上述したように最良のアルゴリズムを選択し、データマイニング処理を実
行する。
8.処理が完了すると、APIメソッドは、要求者に対して結果を返す。
本発明の好ましい実施形態においては、HTTPに基づいたインターフェースを介して
送られたメッセージは、JSONスタンダードフォーマットを使用する。APIメソッド
に関するさらなる詳細は、本明細書の付属資料に記載されている。
このように、自動データマイニングコンポーネント332によって提示されたAPIは
、POST応答で返されたエラーメッセージとともに、要求されたヘッダおよび本明細書
の付属資料に記載されたJSONスキーマに対するそれぞれのPOST要求を確認する。
一実施態様においては、自動データマイニングコンポーネント332は、csvやarf
fファイルフォーマットなどの予め定義されたフォーマットにて、データセットアップロ
ードを受け入れ、アップロードされたそれぞれのデータセットに独自の識別が付されるべ
きである。さらに、自動データマイニングコンポーネント332は、公知であるが、エン
ドユーザが既存のデータベースから受け入れ可能なフォーマットにデータをエクスポート
することを補助するために、1つ以上のデータセットエクスポーターヘルパーツールを提
供することができる。
自動データマイニングコンポーネント332に関して上述したように、質問駆動型デー
タマイニングコンポーネント334は、自動的に最良の処理前および/またはデータマイ
ニングアルゴリズムを選択することも可能である。要求されたデータマイニングタスクに
ついて時間の見積を提供するために、質問駆動型データマイニングコンポーネント334
は、自動データマイニングコンポーネント332により提示されたAPIを介して時間の
見積を入手することができる。そのような見積は、サイズ、選択されたデータ準備方法、
選択されたトレーニングスキームなどを含む前記入力データの特徴に基づいて計算され、
コンピューティングリソースは、このタスクに割り当てられる。これは、最初に、十分な
サイズを有し、一般的なデータマイニングタスク特徴を最も良く反映するデータ特徴にお
いて十分に多様である、学習ベースデータセットに対して、機械学習アルゴリズムを用い
て行われる。このデータセットについて学習を終えたあと、質問駆動型データマイニング
コンポーネント334は、時間の見積に使用することができるモデルを開発する。この時
間見積学習モデルへの改良は、初期トレーニングおよび開発に続き、すべてのユーザ入力
の収集を通じてもたらされ、定期的に前記機械学習アルゴリズムを再度実行することによ
って、この時間見積学習モデルの精度は絶えず向上する。
上述したように、質問駆動型データマイニングコンポーネント334は、自然言語で表
された要求を受け入れ、この要求はNLPエンジン336によってさらに処理される。下
記に詳述するように、NLPエンジン336は、自然言語インターフェーストューデータ
ベース(NLIDB)および自然言語アプリケーションジェネレーション(NLAG)の
2つの主要な機能を提供する。
NLIDB機能は、人間に理解可能な自然言語でエンドユーザがクエリを依頼すること
を可能にする。たとえば、そのようなクエリは、「何(what)」、「誰(who)」、「ど
のように(how)」などの表現を含むことが多い。たとえば、「われわれの商品が最も売
れている州はどこか?」や、「昨年1万ドル以上を稼いだ人は誰か?」などである。NL
Pエンジン336におけるNLIDBモジュールは、前記自然言語による質問を分析し、
SQLなどのより技術的なクエリ言語に翻訳するか、好ましくは、上述したようにSQL
のような統一されたAPIに翻訳し、次に、基本的なデータエンジンのネイティブクエリ
APIに翻訳されることが好ましい。
NLIDBモジュールは、自然言語の質問を分析するために、逆のアプローチをとる。
つまり、統計学的パーサを用いたユーザの質問の分析は行われない。このような技術は、
しばしば不正確な結果を導くからである。むしろ、NLIDBモジュールシステムは、い
くつかの処理後、すべてのサポートされた質問および対応する回答を含む、あらかじめ定
義された質問/回答テーブル(O&Aテーブル)において利用可能な質問に対して、ユー
ザの入力を簡単にマッピングする。実行される際には、このQ&Aテーブルに含まれる回
答は、関連する質問に回答するデータを入手するために使用されるクエリである。前記Q
&Aテーブルは、利用可能なスキーマおよびデータベースに保存されたデータに基づいて
生成される。自然言語の文法規則を適用することによって、NLIDBモジュールは、同
一の質問の異なるフォームを含む明確な回答を有する、すべてのあり得る質問を生成する
。このストラテジは、分析の精度およびリアルタイムのパフォーマンスを得るために、こ
の巨大なリストを保存するために必要とされる、比較的安価なストレージキャパシティを
犠牲にする。この分析はストリングマッチングと同程度に単純であるため、そのパフォー
マンスは非常に速く、かつリアルタイムの反応を達成する。
サポートされた質問のいずれにもユーザの入力が合致しなかった場合には、回答の探索
に最善を尽くすために、公知の統計学的分析(SP)プロセスが用いられる。このSPプ
ロセスは、まず質問からストップワードを削除し、キーワードのみを残す。SPプロセス
は、その後、前記データベースにおいてテキストサーチを行い、関係するデータオブジェ
クトを戻すが、このプロセスでは正しい回答が発見されることは保証されない。質問に対
する正しいあるいは関係する回答を得るように最善を尽くすが、まったく関係ない回答や
、フォーマットされておらず理解が困難なデータを戻す場合がある。SPプロセスが行わ
れた後、ユーザには、潜在的な回答のリストと、アクティブ学習のために、回答にグレー
ドをつける要求が与えられる。返された結果の中にユーザが正しい回答を発見した場合に
は、その回答に対しては、「いいね(サムアップ)」のような単純なスタイルで高いグレ
ードを付与することが、ユーザに要求される。ユーザがどの回答にも満足しない場合には
、「悪いね(サムダウン)」のような単純なスタイルで低いグレードを付与することが、
ユーザに要求される。ユーザが回答にグレードをつけなかった場合には、そのグレードは
ニュートラルであるとみなされる。すべてのユーザ入力はそれぞれ記録される。サポート
された質問に合致せずにSPによって処理された質問はついては、対応する記録を保存す
るよう設計されたレポジトリがある。エキスパートチームはこれらの記録を分析すること
ができ、最も一般的に誤って処理された入力については、サポートされた質問にその質問
を追加し、前記Q&Aテーブルを更新する。
上述したように、1つ以上のデータベースに保存されたデータに基づいたすべての回答
可能な質問は、基礎となるデータベーススキーマのナリッジ(知識)を通じて特定される
。次に、スキーマのフィールドがエンドユーザにより定義される。スキーマフィールドは
、通常は意味のある単語で定義されるが、数字、コードあるいは意味を有しない文字など
の非自然言語の単語やシンボルが使用されないという保証はない。非自然言語のシンボル
が用いられたスキーマフィールドについては、まず、NLIDBモジュールが、データタ
イプからこのスキーマフィールドの意味論的意味を定義するよう試みる。データタイプが
利用可能でなかったり、必要性を満たさなかったりした場合には、NLIDBモジュール
は、前記スキーマフィールドの意味論的意味を定義するようユーザに要求する。このこと
は、上述したように、たとえば、マイナーデベロッパインターフェース326を介して行
われる。
解釈可能なスキーマフィールド名については、NLIDBモジュールは、オントロジー
上の定義、すなわち、基礎となるオントロジーにおいて用いられる構造の記述において、
その単語を調べる。意味が特定されると、NLIDBモジュールは、ユーザのクエリにお
ける単語に代替するものとして、別名のリストの拡張を開始する。この拡張は、複数の異
なる方法で行うことが可能である。1つの方法によれば、高レベルのオントロジー上の定
義が別名として用いられる。たとえば、「従業員」は「人」と同じ意味である。他の方法
によれば、公知の類義語を特定するためにシソーラスが用いられる。逆に、他の方法によ
れば、反意語の辞書を用いることにより、与えられた単語について反意語を特定すること
が可能である。動詞は、欠如概念およびその反意語の組み合わせとして使用することがで
きる(たとえば、「故障した」と「機能していない」は同一の意味をなす)ため、この方
法は特に動詞に対して有用である。これらの方法を組み合わせて使用することにより、N
LIDBモジュールは、前記スキーマにおける特定の単語について別名のリストを作成す
ることが可能となる。さらに、上述した技術を用いて、別名を特定することに利用するこ
とができる単語の数を拡大するために、略語の意味を解明することが望ましい。たとえば
、「P.O.」はさまざまな意味を有するが、購買課のアプリケーションにおいては、「
発注書」を意味するから、このコンテクストを含む略語の定義のリストにおいて、そのよ
うに定義される。このようなコンテクストが十分でない場合には、利用可能なオプション
のリストをユーザに提示することにより、意味を明確化させることも可能である。
スキーマの単語およびこれら単語の別名が発見された後、NLIDBモジュールは、ス
キーマの単語およびこれら単語の関係に基づいて、可能性のある質問を組み立てる。この
ため、NLIDBモジュールは、オントロジー情報および自然言語シンタックスの両方を
使用する。ある単語のオントロジー情報は、質問語に直接マッピングされる。たとえば、
「DOB」など、あるスキーマの単語が「時間」のタイプである場合は、「いつ・・・?
」という質問が生成される。スキーマフィールド同士の関係は、質問を生成する上でもう
一つの重要な基礎となる。たとえば、従業員のデータオブジェクトが「名前」フィールド
と「DOB」フィールドを含む場合には、「ジョン・ドウの生年月日は?」あるいは「ジ
ョン・ドウはいつ生まれたか?」という質問が生成される。さらに、フィールド名を質問
の単語に置き換えることに加え、NLIDBモジュールは、フィールド名を「提示せよ」
や「~を知る必要がある」、「与えよ」などの命令の単語への置き換えも行う。このマッ
ピングは、質問の単語から始まらない質問を生成する。
質問が生成されると、それに伴って質問に対応するクエリが生成される。たとえば、「
ジョン・ドウの生年月日は?」の質問は、対応するSQLクエリである「SELECT DOB FRO
M Employee WHERE Name = ‘JohnDoe’」を有する。このクエリは質問として機能し、自
然言語の質問とともに前記Q&Aテーブルに保存される。
使用に際しては、NLPエンジン336は、たとえば、テキストボックスを通じてエン
ドユーザが質問を入力することができるようにする。どの質問が利用可能であるかを提示
するために、オートコンプリーションが用いられる。以前入力された、前記Q&Aテーブ
ルにおいて利用可能な質問のいずれにも合致しない単語とともにユーザが単語を入力した
場合、このオートコンプリーションは、サポートされていない可能性のある質問が入力さ
れたことをユーザに警告するため、空のリストを提示する。ユーザは、スペルチェックサ
ービスを用いた単語により、単語を入力する。誤記を含む単語が特定された場合には、た
とえば、色を付けるなどして強調される。ユーザは、提示された単語の1つを用いてこれ
を訂正することも、そのまま放置しておくことも可能である。たとえば、英文法などの正
式な自然言語構文法に従わない質問をユーザが入力した場合には、ユーザが入力を止める
と、ユーザには、入力された質問に類似するが、構文的には正しい質問の提案リストが提
示される。
ユーザの入力した質問が利用可能な質問に合致しない場合には、NLIDBモジュール
は、その質問を前記Q&Aテーブルにおいて検索し、データベースクエリのフォームで保
存された回答を発見し、データベースに対してクエリを実行し、エンドユーザに結果を返
す。ユーザの入力した質問が利用可能な質問に合致しない場合には、上述したように、統
計学的処理が行われる。
NLAGファンクションについては、スキーマフィールドはアプリケーションモジュー
ルキーワードに置き換えられ、質問はファンクション説明ステートメントに置き換えられ
る点を除いて、NLIDBファンクションに関して上述した方法論と同じ方法論が用いら
れる。つまり、NLAGファンクションは、たとえばマイナーデベロッパインターフェー
スのユーザなどのユーザが自然言語の説明に基づいてアプリケーションを生成することを
手助けする。アプリケーションは、それぞれのモジュールがサブ機能を果たす機能モジュ
ールあるいはコンポーネントにより組み立てられる。このアプリケーションの記述は、こ
のアプリケーションに期待される機能あるいはアプリケーションが何を達成するかについ
て説明すべきである。例としては、「従業員を管理するプログラムが必要」や、より具体
的なものとしては、「従業員の情報を追加、編集、更新、削除することができ、発注書を
受け入れ、組み立てラインの状態を見ることができるアプリケーションが欲しい」などを
含む。これらの記述は、高いレベルあるいは階層型の機能要求のいずれかを現す。
オントロジーの辞書を使用することにより、NLPエンジン336内のNLAGモジュ
ールは、異なるレベルの要求を認識する。この機能をサポートするために、たとえば、上
述したように、ウィジェットなどのアプリケーションモジュールの作者は、動詞-名詞パ
ターンのフォーマットにてモジュールの機能の説明を提供しなければならない。たとえば
、従業員管理モジュールは、「従業員管理」の説明を有することができ、組み立てライン
ダッシュボードモジュールは、「組み立てラインの状態を提示せよ」との記述を含むこと
ができる。これらの動詞-名詞ペアは、その後、オントロジーの辞書にて検索され、別名
の拡張、質問(この場合には、ステートメントである)の生成、およびクエリ(この場合
には、モジュールアセンブリである)の生成を含め、NLIDBファンクションについて
上述した処理と同一の処理がなされる。前記質問(ステートメント)構文解析の段階は、
オートコンプリーションによりユーザ入力を制限することと、合致しなかった入力の統計
学的処理に関しても同様である。ユーザ入力の解析が無事に行われ、モジュールのリスト
が返されると、たとえば、マイナーデベロッパインターフェース326などのアプリケー
ション開発ツールは、上述したように、ユーザがモジュールを統一されたアプリケーショ
ンに組み立てることを可能にする。
最後に、レポートエンジンコンポーネント340が設けられる。一実施態様においては
、レポートエンジンコンポーネント340は、マイナーデベロッパインターフェース32
6のサブコンポーネントである。特に、レポートエンジンコンポーネント340は、シス
テム内におけるすべての(選択された)データを含むグランドテーブルをまず生成するこ
とにより、ユーザがレポートを構築することを可能にするGUIレポートビルダーである
。ユーザは、このグランドテーブルからカラムを削除し、合計(sum)や平均(average)
などの集計関数をカラムに追加し、あるいは新規テーブルに結果として生じる既存のカラ
ムについての計算に基づいた新規カラムを追加することができる。この処理は、最終的な
所望のテーブルが得られるまで繰り返される。このテーブルがセットアップされると、ユ
ーザは、すべてのテーブルを1つのスクリーンで見ることができ、レポートエンジンコン
ポーネント340は、テーブルカラム間の関係をビジュアル化する。さらに、ユーザは、
レポート更新頻度を設定することができるため、レポートエンジンコンポーネント340
は、構成データ要素が更新される度に更新を行う必要はない。
好ましい実施形態を図示して説明したが、当業者であれば、本発明の内容からから離れ
ることなく、さまざまな変更を施すことが可能である。したがって、上述した本発明の改
良および変更、さらいはその均等物は、本発明の技術的範囲に含まれ、添付の請求の範囲
に含まれると理解される。
[付属資料]
1.データアップロード用API
URL
https://www.beulahworks.com/dm/v1/data_upload

POSTRequest Required Fields
POST/dm/v1/data_uploadHTTP/1.1

Content-Type:text/csv
Content-Length:3876502
Charset:utf-8
Accept-Charset:utf-8
Host:www.beulahworks.com:1234 (configurable)
Filename:“abc.arff”
{DataFile}

コンテンツタイプのフィールドは、CSVおよびARFFを含む、MIMEタイプのすべ
てのサポートされたデータファイルフォーマットを有するべきである。
CSV:text/csv
ARFF:application/vnd.arff (Custom MIMEtype;can be set in web server)

データのサイズは無制限であり、ウェブサーバの構成ファイルにおいて設定することが可
能である。

POSTResponse Required Fields
HTTP/1.1200 OK
Content-Type:application/json;charset=utf-8

{ResponseJSON}

ResponseJSON Schema
{
"type":"object",
"$schema":"http://json-schema.org/draft-03/schema",
"required": true,
"properties": {
"statusCode": {
"type":"string",
"required": true
},
"statusDescription": {
"type": "string",
"required": true
},
"status": {
"type": "string",
"required": true,
"enum": [
"success",
"failure"
]
},
"transactionId": {
"type": "string",
"required": true
},
"transactionTime": {
"type": "string",
"required": true
},
"datasetId": {
"type": "string",
"required": true
}
}
}

ResponseJSON Example
{
"status":"success",
"statusCode":"0",
"statusDescription":"Success",
"transactionTime":"2013-12-10T03:08:23:63Z",
"transactionId":"241b9632-ebfb-4be2-9d6d-64910f995182",
"datasetId":"FBADDC8E-4007-4901-9CBF-328318E83DC5",
}
「datasetId 」は、以下のAPIメソッドにおいて使用される。
2.トレーニングAPI
A.分類トレーニング
URL
https://www.beulahworks.com/dm/v1/classification_train

POSTRequest Required Fields
Sameas https://www.beulahworks.com/dm/v1/classification_train.

RequestJSON Schema
{
"type":"object",
"$schema":"http://json-schema.org/draft-03/schema",
"id":"http://jsonschema.net",
"required":false,
"properties":{
"algorithm":{
"type":"array",
"id":"http://jsonschema.net/algorithm",
"required":false,
"items":
{
"type":"object",
"id":"http://jsonschema.net/algorithm/0",
"required":false,
"properties":{
"name":{
"type":"string",
"id":"http://jsonschema.net/algorithm/
0/name",
"required":false
},
"options":{
"type":"object",
"id":"http://jsonschema.net/algorithm/
0/options",
"required":false,
"properties":{
"prune":{
"type":"boolean",
"id":"http://jsonschema.ne
t/algorithm/0/options/prune",
"required":false
}
}
}
}
}


},
"classAttributeName": {
"type":"string",
"id":"http://jsonschema.net/classAttributeName",
"required":false
},
"datasetId": {
"type":"string",
"id":"http://jsonschema.net/datasetId",
"required":true
},
"modelName": {
"type":"string",
"id":"http://jsonschema.net/modelName",
"required":true
},
"preprocessor":{
"type":"array",
"id":"http://jsonschema.net/preprocessor",
"required":false,
"items":
{
"type":"object",
"id":"http://jsonschema.net/preprocessor/0",
"required":false,
"properties":{
"name":{
"type":"string",
"id":"http://jsonschema.net/preprocess
or/0/name",
"required":false
},
"options":{
"type":"object",
"id":"http://jsonschema.net/preprocess
or/0/options",
"required":false,
"properties":{
"removeAttriIndex": {
"type":"number",
"id":"http://jsonschema.ne
t/preprocessor/0/options/removeAttriIndex",
"required":false
}
}
},
"type":{
"type":"string",
"id":"http://jsonschema.net/preprocess
or/0/type",
"required":false
}
}
}


}
}
}

RequestJSON Example
{
"datasetId":"FBADDC8E-4007-4901-9CBF-328318E83DC5",
"preprocessor": [
{
"name": "Remove",
"type": "filter",
"options": {
"removeAttriIndex": 2
}
}
],
"algorithm": [
{
"name": "J48",
"options": {
"prune": false
}
}
],
"classAttributeName":"Gender",
"modelName":"GenderPredictor"
}
「classAttributeName」は、データセットがARFFファイルとしてアップロードされた
場合には必要とされず、「algorithm」と「preprocessor」は、自動データマイニングに
は必要とされず、「algorithm」と「preprocessor」はアレイのタイプである(つまり、
APIは、マルチプリプロセッサおよびアルゴリズムをサポートする)。マルチプリプロ
セッサが特定された場合には、これらのすべてがデータセットに適用される。マルチアル
ゴリズムが特定された場合には、そのアルゴリズムは別々にデータセットに適用され、平
均化された結果が報告される。

POSTResponse Required Fields
HTTP/1.1200 OK
Content-Type: application/json;charset=utf-8

{Response JSON}

Response JSON Schema
{
"type":"object",
"$schema":"http://json-schema.org/draft-03/schema",
"required": true,
"properties": {
"statusCode": {
"type": "string",
"required": true
},
"statusDescription": {
"type": "string",
"required": true
},
"status": {
"type": "string",
"required": true,
"enum": [
"success",
"failure"
]
},
"transactionId": {
"type": "string",
"required": true
},
"transactionTime": {
"type": "string",
"required": true
},
"jobId": {
"type": "string",
"required":true
}
}
}


ResponseJSON Example
{
"status":"success",
"statusCode":"0",
"statusDescription":"Success",
"transactionTime":"2013-12-10T03:08:23:63Z",
"transactionId":"241b9632-ebfb-4be2-9d6d-64910f995182",
"jobId":"FBADDC8E-4007-4901-9CBF-328318E83DC5"
}
「statusCode 」と「statusDescription 」が予め定義された標準サクセス/エラーメッ
セージのセットである場合、「transaction Time」は、APIメソッドが応答を発行する
時間であるUTC時間であり、「transactionID」は、ロギングおよびパーティション分
割の目的に使用されるUUIDであり、「jobId」は、特定のジョブの時間見積を確認す
るために他のAPIメソッドによって使用される。
B.クラスタリングトレーニング
URL
https://www.beulahworks.com/dm/v1/clustering_train

POSTRequest Required Fields
Sameas https://www.beulahworks.com/dm/v1/classification_train.

RequestJSON Schema
{
"type":"object",
"$schema":"http://json-schema.org/draft-03/schema",
"id":"http://jsonschema.net",
"required":false,
"properties":{
"algorithm":{
"type":"array",
"id":"http://jsonschema.net/algorithm",
"required":false,
"items":
{
"type":"object",
"id":"http://jsonschema.net/algorithm/0",
"required":false,
"properties":{
"name":{
"type":"string",
"id":"http://jsonschema.net/algorithm/
0/name",
"required":false
},
"options":{
"type":"object",
"id":"http://jsonschema.net/algorithm/
0/options",
"required":false,
"properties":{
"numClusters": {
"type":"number",
"id":"http://jsonschema.ne
t/algorithm/0/options/numClusters",
"required":false
}
}
}
}
}


},
"datasetId": {
"type":"string",
"id":"http://jsonschema.net/datasetId",
"required":true
},
"preprocessor":{
"type":"array",
"id":"http://jsonschema.net/preprocessor",
"required":false,
"items":
{
"type":"object",
"id":"http://jsonschema.net/preprocessor/0",
"required":false,
"properties":{
"name":{
"type":"string",
"id":"http://jsonschema.net/preprocess
or/0/name",
"required":false
},
"options":{
"type":"object",
"id":"http://jsonschema.net/preprocess
or/0/options",
"required":false,
"properties":{
"removeAttriIndex": {
"type":"number",
"id":"http://jsonschema.ne
t/preprocessor/0/options/removeAttriIndex",
"required":false
}
}
},
"type":{
"type":"string",
"id":"http://jsonschema.net/preprocess
or/0/type",
"required":false
}
}
}


}
}
}

RequestJSON Example
{
"datasetId":"FBADDC8E-4007-4901-9CBF-328318E83DC5",
"preprocessor": [
{
"name": "Remove",
"type": "filter",
"options": {
"removeAttriIndex": 2
}
}
],
"algorithm":[
{
"name": "K-Means",
"options": {
"numClusters": 5
}
}
]
}

ResponsePOST Required Fields
Sameas https://www.beulahworks.com/dm/v1/classification_train.

ResponseJSON Schema
Sameas https://www.beulahworks.com/dm/v1/classification_train.

ResponseJSON Example
Sameas https://www.beulahworks.com/dm/v1/classification_train.
C.結合規則発見トレーニング
URL
https://www.beulahworks.com/dm/v1/association_rule_train

POSTRequest Required Fields
Sameas https://www.beulahworks.com/dm/v1/classification_train.

RequestJSON Schema
{
"type":"object",
"$schema":"http://json-schema.org/draft-03/schema",
"id":"http://jsonschema.net",
"required":false,
"properties":{
"algorithm":{
"type":"array",
"id":"http://jsonschema.net/algorithm",
"required":false,
"items":
{
"type":"object",
"id":"http://jsonschema.net/algorithm/0",
"required":false,
"properties":{
"name":{
"type":"string",
"id":"http://jsonschema.net/algorithm/
0/name",
"required":false
},
"options":{
"type":"object",
"id":"http://jsonschema.net/algorithm/
0/options",
"required":false,
"properties":{
"numRules": {
"type":"number",
"id":"http://jsonschema.ne
t/algorithm/0/options/numRules",
"required":false
}
}
}
}
}


},
"datasetId": {
"type":"string",
"id":"http://jsonschema.net/datasetId",
"required":true
},
"preprocessor":{
"type":"array",
"id":"http://jsonschema.net/preprocessor",
"required":false,
"items":
{
"type":"object",
"id":"http://jsonschema.net/preprocessor/0",
"required":false,
"properties":{
"name":{
"type":"string",
"id":"http://jsonschema.net/preprocess
or/0/name",
"required":false
},
"options":{
"type":"object",
"id":"http://jsonschema.net/preprocess
or/0/options",
"required":false,
"properties":{
"removeAttriIndex": {
"type":"number",
"id":"http://jsonschema.ne
t/preprocessor/0/options/removeAttriIndex",
"required":false
}
}
},
"type":{
"type":"string",
"id":"http://jsonschema.net/preprocess
or/0/type",
"required":false
}
}
}


}
}
}

RequestJSON Example
{
"datasetId":"FBADDC8E-4007-4901-9CBF-328318E83DC5",
"preprocessor": [
{
"name": "Remove",
"type": "filter",
"options": {
"removeAttriIndex": 2
}
}
],
"algorithm": [
{
"name": "Apriori",
"options": {
"numRules": 10
}
}
]
}

ResponsePOST Required Fields
Sameas https://www.beulahworks.com/dm/v1/classification_train.

ResponseJSON Schema
Sameas https://www.beulahworks.com/dm/v1/classification_train.

ResponseJSON Example
Sameas https://www.beulahworks.com/dm/v1/classification_train.
E.回帰(予測)トレーニング
URL
https://www.beulahworks.com/dm/v1/regression_train

POSTRequest Required Fields
Sameas https://www.beulahworks.com/dm/v1/classification_train..

RequestJSON Schema
Sameas https://www.beulahworks.com/dm/v1/classification_train.

RequestJSON Example
Sameas https://www.beulahworks.com/dm/v1/classification_train.

ResponsePOST Required Fields
Sameas https://www.beulahworks.com/dm/v1/classification_train.

ResponseJSON Schema
Sameas https://www.beulahworks.com/dm/v1/classification_train.

ResponseJSON Example
Sameas https://www.beulahworks.com/dm/v1/classification_train.
F.予測時間
URL
https://www.beulahworks.com/dm/v1/estimate_time

POSTRequest Required Fields
Sameas https://www.beulahworks.com/dm/v1/classification_train.

RequestJSON Schema
{
"type":"object",
"$schema":"http://json-schema.org/draft-03/schema",
"required":true,
"properties":{
"jobId": {
"type":"string",
"required":true
}
}
}

RequestJSON Example
{
"jobId":"FBADDC8E-4007-4901-9CBF-328318E83DC5"
}

ResponsePOST Required Fields
Sameas https://www.beulahworks.com/dm/v1/classification_train.

ResponseJSON Schema
{
"type":"object",
"$schema":"http://json-schema.org/draft-03/schema",
"id":"http://jsonschema.net",
"required": true,
"properties": {
"estimatedFinishDate": {
"type": "string",
"id": "http://jsonschema.net/estimatedFinishDate",
"required":true
},
"estimatedTime": {
"type":"string",
"id": "http://jsonschema.net/estimatedTime",
"required": true
},
"jobId": {
"type": "string",
"id": "http://jsonschema.net/jobId",
"required": true
},
"statusCode": {
"type": "string",
"id": "http://jsonschema.net/statusCode",
"required": true
},
"statusDescription": {
"type": "string",
"id": "http://jsonschema.net/statusDescription",
"required": true
},
"status": {
"type": "string",
"id": "http://jsonschema.net/status",
"required": true,
"enum": [
"success",
"failure"
]
},
"transactionID": {
"type": "string",
"id": "http://jsonschema.net/transactionID",
"required": true
},
"transactionTime": {
"type": "string",
"id": "http://jsonschema.net/transactionTime",
"required": true
}
}
}

ResponseJSON Example
{
"status":"success",
"statusCode":"0",
"statusDescription":"Success",
"jobId":"FBADDC8E-4007-4901-9CBF-328318E83DC5",
"estimatedTime":"1 hour 30 minutes",
"estimatedFinishDate":"2013-12-10T04:38:23:63Z",
"transactionTime": "2013-12-10T03: 08: 23:63Z",
"transactionID":"241b9632-ebfb-4be2-9d6d-64910f995182"
}

https://www.beulahworks.com/dm/v1/classification_train.sにおける同一のフィールド
の他にも、エラーが発生しなかった場合には、「jobId」は、見積もられたジョブのコン
ファメーションであり、「estimatedTime」は、選択されたジョブにかかる時間の見積を
示し、「estimatedFinishDate」は、選択されたジョブが完了するデータおよび時間の見
積を示す。
G.コールバックPOST
URL
https://www.beulahworks.com/dm/v1/callback

POSTRequest Required Fields
POSTcallback_url(configurable) HTTP/1.1

Content-Type: application/json
Charset: utf-8
Accept-Charset:utf-8
Host:callback_host (configurable)
{RequestJSON}

RequestJSON Schema
{
"type":"object",
"$schema":"http://json-schema.org/draft-03/schema",
"required": true,
"properties": {
"dataPreparationInfo": {
"type": "object",
"required": false,
"properties": {
"mode": {
"type": "string",
"required": true
},
"schemes": {
"type": "object",
"required": true,
"properties": {
"nullDataHandling": {
"type": "string",
"required": true
},
"outlierRemoval": {
"type": "string",
"required": true
}
}
}
}
},
"jobId": {
"type": "string",
"required": true
},
"modelName": {
"type": "string",
"required": true
},
"statusCode": {
"type": "string",
"required": true
},
"statusDescription": {
"type": "string",
"required":true
},
"status": {
"type": "string",
"required": true,
"enum": [
"success",
"failure"
]
},
"trainingInfo": {
"type": "object",
"required": true,
"properties": {
"attributeNum": {
"type":"string",
"required": true
},
"attributes": {
"type": "array",
"required": true,
"items": {
"type": "string",
"required": false
}
},
"correctlyClassifiedInstancePercentage":{
"type": "string",
"required": true
},
"correctlyClassifiedInstancesNum": {
"type": "number",
"required": true
},
"folds": {
"type": "number",
"required": false
},
"incorrectlyClassifiedInstanceNum":{
"type": "number",
"required": true
},
"incorrectlyClassifiedInstancePercentage":{
"type": "string",
"required":true
},
"instanceNum": {
"type": "string",
"required": true
},
"scheme": {
"type": "string",
"required":true
},
"testMode": {
"type": "string",
"required": true
}
}
}
}
}

RequestJSON Example
{
"jobId":"FBADDC8E-4007-4901-9CBF-328318E83DC5",
"status":"success",
"statusCode":"0",
"statusDescription":"Success.",
"modelName":"activeCustomer_classification",
"dataPreparationInfo":{
"mode": "automatic",
"schemes": {
"outlierRemoval": "Gaussiandistribution",
"nullDataHandling": "Arithmatic mean"
}
},
"trainingInfo":{
"scheme": "weka.classifiers.rules.ZeroR",
"instanceNum":"300",
"attributeNum": "3",
"attributes": [
"764e2634",
"852d7435",
"279h0236"
],
"testMode": "crossvalidation",
"folds": 10,
"correctlyClassifiedInstancesNum":250,
"correctlyClassifiedInstancePercentage":"83.3333%",
"incorrectlyClassifiedInstanceNum":50,
"incorrectlyClassifiedInstancePercentage":"16.6667%"
}
}

ResponsePOST Required Fields
Sameas https://www.beulahworks.com/dm/v1/classification_train.

ResponseJSON Schema
{
"type":"object",
"$schema":"http://json-schema.org/draft-03/schema",
"required": true,
"properties": {
"statusCode": {
"type": "string",
"required": true
},
"statusDescription": {
"type": "string",
"required":true
},
"status": {
"type": "string",
"required": true,
"enum": [
"success",
"failure"
]
},
"transactionID": {
"type": "string",
"required": true
},
"transactionTime": {
"type":"string",
"required": true
},
"jobId": {
"type": "string",
"required": false
}
}
}

ResponseJSON Example
{
"status":"success",
"statusCode":"0",
"statusDescription":"Success",
"transactionTime":"2013-12-10T03:08:23:63Z",
"transactionID":"241b9632-ebfb-4be2-9d6d-64910f995182",
"jobId":"FBADDC8E-4007-4901-9CBF-328318E83DC5"
}
3.使用API
使用APIは、以下の点を除き、トレーニングAPIと同一である。
1.URLが異なる。「train」は「use」に置き換えられ、たとえば、「https://www.be
ulahworks.com/dm/v1/classification_train」は、「https://www.beulahworks.com/dm/v
1/classification_use」となる。他の使用APIについても同様である。
2.「モデル」フィールドは任意である。「モデル」が提供されない場合には、システム
は、タスクを実行するためにグランド機械学習モデルを使用する。

Claims (18)

  1. 少なくとも1つの処理装置により実行され、すべての入力データがオブジェクトおよびオブジェクト間の関係として保存されるナリッジリポジトリであって、それぞれのオブジェクトは、1つ以上のプロパティの少なくとも1つのコンテナに相当しており、および、前記入力データを1つ以上のストレージフォーマットに基づいて保存することが可能である、ナリッジリポジトリと、
    前記少なくとも1つの処理装置により実行され、前記入力データ、前記プロパティの1つ以上を定義するオブジェクト情報、および、前記関係の1つ以上を定義する関係情報を取得するための入力メカニズムを提供する、ユーザインターフェースと、
    前記少なくとも1つの処理装置により実行され、前記ナリッジリポジトリおよび前記ユーザインターフェースに接続されたコントローラであって、前記ユーザインターフェースから前記入力データ、前記オブジェクト情報、および前記関係情報を受領し、前記オブジェクト情報および前記関係情報に基づく少なくとも1つのオブジェクトとして、前記入力データを前記ナリッジリポジトリに保存させるように構成されている、コントローラと、
    を備える、システム。
  2. 前記ナリッジリポジトリは、第1ストレージフォーマットを有する第1データベースに前記入力データのすべてを保存し、前記入力データの少なくとも一部を選択的に第1ストレージフォーマットから少なくとも1つの第2ストレージフォーマットへ変換させ、該少なくとも1つの第2ストレージフォーマットを実行する少なくとも1つの第2データベースに保存させるように構成されている、請求項1に記載のシステム。
  3. 第2データベースは、関係データベース、カラム型データベース、グラフデータベース、キーバリューデータベース、ドキュメントデータベース、およびファイルストレージデータベースのうち1つ以上を備える、請求項2に記載のシステム。
  4. 前記コントローラは、前記ナリッジリポジトリに対して、前記入力データの少なくとも1つのデータの特徴に基づき、前記入力データの一部を第1ストレージフォーマットから第2ストレージフォーマットに変換するよう指示するように構成されている、請求項2に記載のシステム。
  5. 前記入力データの少なくとも1つのデータの特徴は、データサイズおよびデータスキーマのうち1つ以上を備える、請求項4に記載のシステム。
  6. 前記入力データの少なくとも1つのデータの特徴は、要求されるデータの鮮度および要求されるデータの保持時間の1つ以上を備える、請求項4に記載のシステム。
  7. 前記コントローラは、前記入力データの少なくとも1つの使用特徴に基づき、前記入力データの一部分を第1ストレージフォーマットから第2ストレージフォーマットへ変換させるよう前記ナリッジリポジトリに指示するように構成されている、請求項2に記載のシステム。
  8. 前記入力データの少なくとも1つの使用特徴は、データ書き込み頻度、データ更新頻度、データ読み取り頻度、データ読み取り要求タイプ、およびユーザの同時実行性のうち1つ以上を備える、請求項7に記載のシステム。
  9. 前記ユーザインターフェースは、階層型ユーザインターフェースのセットのうちの、1つの階層型ユーザインターフェースである、請求項1に記載のシステム。
  10. 前記階層型ユーザインターフェースのセットは、少なくとも1つのメジャーデベロッパインターフェースおよび該メジャーデベロッパインターフェースより抽象化レベルがより高次であるマイナーデベロッパインターフェースを備える、請求項9に記載のシステム。
  11. 前記少なくとも1つのメジャーデベロッパインターフェースは、ソフトウェアコンポーネントの開発をサポートする統合開発環境を備える第1メジャーデベロッパインターフェースを含む、請求項10に記載のシステム。
  12. 前記少なくとも1つのメジャーデベロッパインターフェースは、グラフィカルユーザインターフェース(GUI)アプリケーションおよびソフトウェアウィジェットの1つ以上の開発をサポートする、GUIベースのプラットフォームを備える第2メジャーデベロッパインターフェースを含む、請求項10に記載のシステム。
  13. 前記マイナーデベロッパインターフェースは、前記ソフトウェアウィジェットに基づいてアプリケーションメタファイルを構成するグラフィカルユーザインターフェースを備える、請求項12に記載のシステム。
  14. 前記コントローラおよび前記マイナーデベロッパインターフェースに接続されたコードジェネレータをさらに備え、該コードジェネレータは、前記アプリケーションメタファイルに基づいて実行可能なアプリケーションを生成するように構成されている、請求項13に記載のシステム。
  15. 前記コントローラは、
    人間に読み取り可能なユーザデータクエリに基づいて、機械に読み取り可能なユーザデータクエリを生成し、および、
    人間に読み取り可能なアプリケーション仕様に基づいてアプリケーションメタデータを生成する、
    ように構成されている、
    請求項1に記載のシステム。
  16. 前記コントローラは、機械に読み取り可能なユーザデータクエリに基づいて、前記ナリッジリポジトリから保存データを回収するように構成されている、データマイニングコンポーネントをさらに備える、請求項1に記載のシステム。
  17. 少なくとも1つの処理装置により実行されるコントローラを備えるシステムであって、
    前記コントローラは、
    階層型ユーザインターフェースから受領した入力データを、ナリッジリポジトリの少なくとも1つの第1データベースに、第1ストレージフォーマットで、それぞれが1つ以上のプロパティの少なくとも1つのコンテナに相当するオブジェクトおよびオブジェクト間の関係として保存し、
    第1データベースに保存された前記入力データの少なくとも一部を、第1ストレージフォーマットとは異なる少なくとも1つの第2ストレージフォーマットに変換し、該入力データを、前記ナリッジリポジトリの第2データベースに保存し、および、
    前記階層型ユーザインターフェースから、前記入力データ、前記プロパティの1つ以上を定義するオブジェクト情報、および、前記関係の1つ以上を定義する関係情報へのアクセスを可能にするためのクエリを受領する、
    ように構成されていることを特徴とする、
    システム。
  18. 前記コントローラが、前記オブジェクト間の前記関係を分析し、前記オブジェクトおよび前記オブジェクト間の前記関係のネットワーク表示を作成するように構成されている、請求項17に記載のシステム。
JP2022092289A 2013-03-15 2022-06-07 データ取り込みおよび該データへのユーザアクセス促進システムおよび方法 Active JP7345598B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023143605A JP2023162404A (ja) 2013-03-15 2023-09-05 データ取り込みおよび該データへのユーザアクセス促進システムおよび方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361787177P 2013-03-15 2013-03-15
US61/787,177 2013-03-15
JP2020216265A JP7086166B2 (ja) 2013-03-15 2020-12-25 データ取り込みおよび該データへのユーザアクセス促進システムおよび方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2020216265A Division JP7086166B2 (ja) 2013-03-15 2020-12-25 データ取り込みおよび該データへのユーザアクセス促進システムおよび方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023143605A Division JP2023162404A (ja) 2013-03-15 2023-09-05 データ取り込みおよび該データへのユーザアクセス促進システムおよび方法

Publications (2)

Publication Number Publication Date
JP2022120014A true JP2022120014A (ja) 2022-08-17
JP7345598B2 JP7345598B2 (ja) 2023-09-15

Family

ID=51532922

Family Applications (5)

Application Number Title Priority Date Filing Date
JP2016502646A Active JP6420311B2 (ja) 2013-03-15 2014-03-14 データ取り込みおよび該データへのユーザアクセス促進システムおよび方法
JP2018191407A Active JP6817988B2 (ja) 2013-03-15 2018-10-10 データ取り込みおよび該データへのユーザアクセス促進システムおよび方法
JP2020216265A Active JP7086166B2 (ja) 2013-03-15 2020-12-25 データ取り込みおよび該データへのユーザアクセス促進システムおよび方法
JP2022092289A Active JP7345598B2 (ja) 2013-03-15 2022-06-07 データ取り込みおよび該データへのユーザアクセス促進システムおよび方法
JP2023143605A Pending JP2023162404A (ja) 2013-03-15 2023-09-05 データ取り込みおよび該データへのユーザアクセス促進システムおよび方法

Family Applications Before (3)

Application Number Title Priority Date Filing Date
JP2016502646A Active JP6420311B2 (ja) 2013-03-15 2014-03-14 データ取り込みおよび該データへのユーザアクセス促進システムおよび方法
JP2018191407A Active JP6817988B2 (ja) 2013-03-15 2018-10-10 データ取り込みおよび該データへのユーザアクセス促進システムおよび方法
JP2020216265A Active JP7086166B2 (ja) 2013-03-15 2020-12-25 データ取り込みおよび該データへのユーザアクセス促進システムおよび方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023143605A Pending JP2023162404A (ja) 2013-03-15 2023-09-05 データ取り込みおよび該データへのユーザアクセス促進システムおよび方法

Country Status (10)

Country Link
US (5) US9430549B2 (ja)
EP (2) EP2973048A4 (ja)
JP (5) JP6420311B2 (ja)
KR (1) KR101782704B1 (ja)
CN (2) CN105378721B (ja)
AU (4) AU2014228252B9 (ja)
BR (1) BR112015023053A2 (ja)
CA (1) CA2906635C (ja)
MX (3) MX2021010973A (ja)
WO (1) WO2014143755A1 (ja)

Families Citing this family (68)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9372938B2 (en) * 2012-06-21 2016-06-21 Cray Inc. Augmenting queries when searching a semantic database
US10215434B2 (en) 2012-11-07 2019-02-26 Think Automatic, LLC Adaptive trigger sequencing for site control automation
US20150120224A1 (en) 2013-10-29 2015-04-30 C3 Energy, Inc. Systems and methods for processing data relating to energy usage
US10380253B2 (en) * 2014-03-04 2019-08-13 International Business Machines Corporation Natural language processing with dynamic pipelines
US9679125B2 (en) * 2014-04-29 2017-06-13 PEGRight, Inc. Characterizing user behavior via intelligent identity analytics
CN105095237B (zh) * 2014-04-30 2018-07-17 国际商业机器公司 用于生成非关系数据库的模式的方法和设备
US20160034852A1 (en) * 2014-07-31 2016-02-04 Linkedin Corporation Next job skills as represented in profile data
US10095736B2 (en) * 2014-11-03 2018-10-09 International Business Machines Corporation Using synthetic events to identify complex relation lookups
US10229156B2 (en) 2014-11-03 2019-03-12 International Business Machines Corporation Using priority scores for iterative precision reduction in structured lookups for questions
US11080295B2 (en) * 2014-11-11 2021-08-03 Adobe Inc. Collecting, organizing, and searching knowledge about a dataset
US9679041B2 (en) * 2014-12-22 2017-06-13 Franz, Inc. Semantic indexing engine
WO2016118979A2 (en) 2015-01-23 2016-07-28 C3, Inc. Systems, methods, and devices for an enterprise internet-of-things application development platform
US10366079B1 (en) * 2015-01-26 2019-07-30 Microstrategy Incorporated Enterprise connectivity
US20160224645A1 (en) * 2015-02-03 2016-08-04 Siemens Aktiengesellschaft System and method for ontology-based data integration
US10423985B1 (en) * 2015-02-09 2019-09-24 Twitter, Inc. Method and system for identifying users across mobile and desktop devices
AU2016218970B2 (en) * 2015-02-13 2018-06-28 Thomson Reuters Enterprise Centre Gmbh Systems and methods for natural language question answering and analysis
US10430410B2 (en) * 2015-03-12 2019-10-01 International Business Machines Corporation Explain tool for optimizing SPARQL queries
US9921945B2 (en) 2015-04-06 2018-03-20 Adp, Llc Automatic verification of JSON data
US10078651B2 (en) * 2015-04-27 2018-09-18 Rovi Guides, Inc. Systems and methods for updating a knowledge graph through user input
US10824636B2 (en) * 2015-05-27 2020-11-03 Kaseya International Limited Mechanisms for querying disparate data storage systems
US20170005868A1 (en) * 2015-07-02 2017-01-05 Pearson Education, Inc. Automated network generation
US10552858B1 (en) 2015-07-10 2020-02-04 Twitter, Inc. Reconciliation of disjoint user identifer spaces
US10643181B2 (en) * 2015-08-18 2020-05-05 Satish Ayyaswami System and method for a big data analytics enterprise framework
US10102282B2 (en) * 2015-11-18 2018-10-16 University-Industry Cooperation Foundation Of Kyung Hee University Apparatus for mediation bridge ontology based on ontology alignment pattern
US10437883B2 (en) * 2015-11-24 2019-10-08 Cisco Technology, Inc. Efficient graph database traversal
US10496632B2 (en) 2015-12-09 2019-12-03 Vinyl Development LLC Query processor
US9436760B1 (en) 2016-02-05 2016-09-06 Quid, Inc. Measuring accuracy of semantic graphs with exogenous datasets
US20170262498A1 (en) * 2016-03-09 2017-09-14 Vinyl Development LLC Source independent query language
CN105959263B (zh) * 2016-04-22 2019-07-16 江苏中科西北星信息科技有限公司 基于json的机构养老数据交互方法及系统
US10713272B1 (en) 2016-06-30 2020-07-14 Amazon Technologies, Inc. Dynamic generation of data catalogs for accessing data
US10289309B2 (en) 2016-09-12 2019-05-14 Toshiba Memory Corporation Automatic detection of multiple streams
US10437564B1 (en) * 2016-09-16 2019-10-08 Software Tree, LLC Object mapping and conversion system
US11010302B2 (en) * 2016-10-05 2021-05-18 Intel Corporation General purpose input/output data capture and neural cache system for autonomous machines
JP6734538B2 (ja) * 2016-10-06 2020-08-05 富士通株式会社 評価プログラム、評価方法、および評価装置
US10339130B2 (en) * 2016-10-06 2019-07-02 Microsoft Technology Licensing, Llc Diverse addressing of graph database entities by database applications
KR101971170B1 (ko) * 2016-10-14 2019-04-22 배재대학교 산학협력단 웹 서버 기반의 분산형 기기간 협업 시스템 및 방법
US10534790B2 (en) * 2016-10-20 2020-01-14 International Business Machines Corporation Dynamic and predictive global temporary tables
KR101862779B1 (ko) * 2016-11-01 2018-05-30 광운대학교 산학협력단 컬럼 수준 비정규화를 이용한 데이터 마이그레이션 장치 및 방법
US10649965B2 (en) * 2016-11-14 2020-05-12 International Business Machines Corporation Data migration in a networked computer environment
US10621210B2 (en) * 2016-11-27 2020-04-14 Amazon Technologies, Inc. Recognizing unknown data objects
US10387423B2 (en) * 2017-01-31 2019-08-20 Splunk Inc. Interactive development environment for iterative query visualization and exploration
US10542089B2 (en) 2017-03-10 2020-01-21 Toshiba Memory Corporation Large scale implementation of a plurality of open channel solid state drives
US10073640B1 (en) 2017-03-10 2018-09-11 Toshiba Memory Corporation Large scale implementation of a plurality of open channel solid state drives
US10970177B2 (en) * 2017-08-18 2021-04-06 Brian J. Bulkowski Methods and systems of managing consistency and availability tradeoffs in a real-time operational DBMS
US10482005B1 (en) 2017-09-26 2019-11-19 EMC IP Holding Company LLC Method and apparatus for developer code risk assessment
MX2020003447A (es) 2017-10-17 2020-07-29 Ericsson Telefon Ab L M Registro de servicios en una red de comunicaciones.
CN107918542B (zh) * 2017-11-23 2022-02-08 北京恒华伟业科技股份有限公司 一种字符串生成方法及装置
US11308128B2 (en) 2017-12-11 2022-04-19 International Business Machines Corporation Refining classification results based on glossary relationships
JP6887941B2 (ja) * 2017-12-12 2021-06-16 株式会社日立製作所 データ分析システム、及びデータ分析方法
CN108170847B (zh) * 2018-01-18 2021-08-31 国网福建省电力有限公司 一种基于Neo4j图数据库的大数据存储方法
US11182411B2 (en) * 2018-09-28 2021-11-23 Palo Alto Research Center Incorporated Combined data driven and knowledge driven analytics
US11132361B2 (en) 2018-11-20 2021-09-28 International Business Machines Corporation System for responding to complex user input queries using a natural language interface to database
US12008343B2 (en) 2018-11-21 2024-06-11 Kony, Inc. System and method for a registration system within an intelligent digital experience development platform
CN109918678B (zh) * 2019-03-22 2023-02-24 创新先进技术有限公司 一种字段含义识别方法和装置
US12008456B2 (en) * 2019-06-28 2024-06-11 Intel Corporation Methods, apparatus, systems and articles of manufacture for providing query selection systems
US11526391B2 (en) * 2019-09-09 2022-12-13 Kyndryl, Inc. Real-time cognitive root cause analysis (CRCA) computing
JP7411489B2 (ja) * 2020-04-08 2024-01-11 株式会社日立製作所 生産知識管理システム、生産知識管理方法及び生産知識管理プログラム
US11269751B2 (en) * 2020-06-11 2022-03-08 International Business Machines Corporation Hierarchical evaluation of multivariate anomaly level
CN111917872B (zh) * 2020-07-31 2023-01-31 阮兆明 一种结构化消息流的数据服务架构方法
US11874946B2 (en) * 2020-08-05 2024-01-16 International Business Machines Corporation Database map restructuring for data security
US11463446B2 (en) 2020-09-28 2022-10-04 Dropbox, Inc. Team member transfer tool
US11321285B2 (en) 2020-10-01 2022-05-03 Bank Of America Corporation Automatic database script generation for copying data between relational databases
EP4006752A1 (en) 2020-11-27 2022-06-01 Prisma Analytics GmbH Method and system arrangement for processing big data
EP4006753A1 (en) 2020-11-27 2022-06-01 Prisma Analytics GmbH Creating bias-free and self-predictive parameters
US11928699B2 (en) 2021-03-31 2024-03-12 International Business Machines Corporation Auto-discovery of reasoning knowledge graphs in supply chains
EP4141692A1 (en) * 2021-08-30 2023-03-01 Mitsubishi Electric R&D Centre Europe B.V. Database checking conversion
US20230359615A1 (en) * 2022-05-09 2023-11-09 Data.World, Inc. Auxiliary query commands to deploy predictive data models for queries in a networked computing platform
CN115860436B (zh) * 2023-02-21 2023-05-26 齐鲁工业大学(山东省科学院) 一种基于知识图谱的城市热线派单方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08241327A (ja) * 1995-03-06 1996-09-17 Nippon Telegr & Teleph Corp <Ntt> データベースシステムの性能チューニング装置及びデータベースシステムの性能チューニング方法
JPH1078968A (ja) * 1996-09-02 1998-03-24 Nippon Telegr & Teleph Corp <Ntt> 統計データベースシステム
JPH1115711A (ja) * 1997-06-26 1999-01-22 Hitachi Ltd データ管理装置
US20030158842A1 (en) * 2002-02-21 2003-08-21 Eliezer Levy Adaptive acceleration of retrieval queries
WO2012017529A1 (ja) * 2010-08-04 2012-02-09 株式会社日立製作所 データベース管理方法、データベース管理装置及びデータベース管理プログラム

Family Cites Families (66)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5978811A (en) * 1992-07-29 1999-11-02 Texas Instruments Incorporated Information repository system and method for modeling data
US6567814B1 (en) * 1998-08-26 2003-05-20 Thinkanalytics Ltd Method and apparatus for knowledge discovery in databases
AU6915400A (en) 1999-08-16 2001-03-19 Z-Force Corporation System of reusable software parts and methods of use
US6339776B2 (en) * 1999-10-04 2002-01-15 International Business Machines Corporation Dynamic semi-structured repository for mining software and software-related information
GB0006443D0 (en) 2000-03-18 2000-05-10 Pilkington Plc Fire resistant glazings
WO2001081829A1 (en) * 2000-04-27 2001-11-01 Brio Technology, Inc. Method and apparatus for processing jobs on an enterprise-wide computer system
GB0017023D0 (en) * 2000-07-12 2000-08-30 Ibm Knowledge sharing between heterogeneous devices
US7197561B1 (en) 2001-03-28 2007-03-27 Shoregroup, Inc. Method and apparatus for maintaining the status of objects in computer networks using virtual state machines
CA2358681C (en) 2001-10-12 2008-01-15 Ibm Canada Limited-Ibm Canada Limitee Resource adapter and integrated development environment
GB0127551D0 (en) 2001-11-16 2002-01-09 Abb Ab Analysing events
US20030184581A1 (en) 2002-04-02 2003-10-02 Bawa Satvinder Singh Application level integration in support of a distributed network management and service provisioning solution
US8015143B2 (en) * 2002-05-22 2011-09-06 Estes Timothy W Knowledge discovery agent system and method
EP1547009A1 (en) * 2002-09-20 2005-06-29 Board Of Regents The University Of Texas System Computer program products, systems and methods for information discovery and relational analyses
US7802234B2 (en) 2003-01-02 2010-09-21 Oracle International Corporation Integration of context-sensitive runtime metrics into integrated development environments
US7275216B2 (en) 2003-03-24 2007-09-25 Microsoft Corporation System and method for designing electronic forms and hierarchical schemas
EP1465069B1 (en) 2003-04-01 2017-01-25 Sap Se Method and computer system for activation of source files
US7430732B2 (en) 2003-10-23 2008-09-30 Microsoft Corporation Design of application programming interfaces (APIs)
US7676785B2 (en) 2004-02-13 2010-03-09 Microsoft Corporation Hosted application as a designer in an integrated development environment
WO2005114389A1 (en) 2004-05-21 2005-12-01 Sap Aktiengesellschaft Portal runtime framework
US7900201B1 (en) 2004-12-21 2011-03-01 Zenprise, Inc. Automated remedying of problems in software application deployments
JP2006236299A (ja) * 2005-02-26 2006-09-07 Aie Research Inc 統合的知識ベースシステム
US8812964B2 (en) 2005-03-31 2014-08-19 International Business Machines Corporation Managing evelopment of an enterprise application
EP1889233A2 (en) * 2005-05-16 2008-02-20 Nervana, Inc. The information nervous system
WO2007002412A2 (en) * 2005-06-22 2007-01-04 Affiniti, Inc. Systems and methods for retrieving data
US8666928B2 (en) * 2005-08-01 2014-03-04 Evi Technologies Limited Knowledge repository
US7873422B2 (en) 2005-09-02 2011-01-18 Sap Ag Event-based coordination of process-oriented composite applications
US20070088706A1 (en) * 2005-10-17 2007-04-19 Goff Thomas C Methods and devices for simultaneously accessing multiple databases
US7721258B2 (en) 2005-11-03 2010-05-18 Microsoft Corporation Integrated development environment with managed platform registry
US7689580B2 (en) * 2006-03-27 2010-03-30 Oracle International Corporation Search based application development framework
JP2008152739A (ja) * 2006-12-13 2008-07-03 Tokyo Institute Of Technology 文献情報からの研究分野間知識管理装置、方法、プログラム及び記録媒体
US7660831B2 (en) * 2007-01-07 2010-02-09 Apple Inc. Synchronization methods and systems
US8295542B2 (en) * 2007-01-12 2012-10-23 International Business Machines Corporation Adjusting a consumer experience based on a 3D captured image stream of a consumer response
US20080244418A1 (en) 2007-03-30 2008-10-02 Microsoft Corporation Distributed multi-party software construction for a collaborative work environment
US8566386B2 (en) * 2007-10-02 2013-10-22 Microsoft Corporation Logging of rich entertainment platform service history for use as a community building tool
US8996349B2 (en) 2007-10-11 2015-03-31 Microsoft Technology Licensing, Llc Synchronizing an abstract model and source code
US8201138B2 (en) 2008-01-18 2012-06-12 International Business Machines Corporation Solution providing navigation-independent access to elements of a software integrated development environment (IDE) using uniform resource locators(URLs)
US9218166B2 (en) 2008-02-20 2015-12-22 Embarcadero Technologies, Inc. Development system with improved methodology for creation and reuse of software assets
KR101475552B1 (ko) * 2008-04-01 2015-01-02 야후! 인크. 사용자에게 컨텐츠를 제공하기 위한 방법 및 서버
US20090276752A1 (en) 2008-04-30 2009-11-05 International Business Machines Corporation Method for communicating collaborative software development information
US8312440B2 (en) 2008-08-19 2012-11-13 International Business Machines Corporation Method, computer program product, and hardware product for providing program individuality analysis for source code programs
US8434068B2 (en) 2008-10-23 2013-04-30 XMOS Ltd. Development system
US8341593B2 (en) 2008-10-23 2012-12-25 Sap Ag Integrated development framework for composite applications
US20100293524A1 (en) 2009-05-12 2010-11-18 International Business Machines, Corporation Development environment for managing database aware software projects
US8417739B2 (en) * 2009-05-29 2013-04-09 Red Hat, Inc. Systems and methods for object-based modeling using hierarchical model objects
US8819625B2 (en) 2009-09-03 2014-08-26 International Business Machines Corporation Sharable development environment bookmarks for functional/data flow
US8655830B2 (en) 2009-10-06 2014-02-18 Johnson Controls Technology Company Systems and methods for reporting a cause of an event or equipment state using causal relationship models in a building management system
CA2720842A1 (en) 2009-11-10 2011-05-10 Hamid Hatami-Hanza System and method for value significance evaluation of ontological subjects of network and the applications thereof
US8244754B2 (en) * 2010-02-01 2012-08-14 International Business Machines Corporation System and method for object searching in virtual worlds
US8527940B2 (en) 2010-02-25 2013-09-03 Red Hat, Inc. Integrated development environment with automatic working sets
US8341099B2 (en) 2010-03-12 2012-12-25 Microsoft Corporation Semantics update and adaptive interfaces in connection with information as a service
US20110252163A1 (en) 2010-04-09 2011-10-13 Microsoft Corporation Integrated Development Environment for Rapid Device Development
US20120036457A1 (en) 2010-08-09 2012-02-09 REAL Software, Inc. Integrated development environment for rapid application development
US20120079451A1 (en) 2010-09-29 2012-03-29 Sap Ag Unified process to design, develop, and configure user interfaces
US9619211B2 (en) 2010-12-30 2017-04-11 International Business Machines Corporation Code suggestion in a software development tool
US8712975B2 (en) 2011-03-08 2014-04-29 Rackspace Us, Inc. Modification of an object replica
US8567814B2 (en) * 2011-05-19 2013-10-29 Faurecia Interior Systems, Inc. Patterned weakening of airbag coverings
US8572552B2 (en) 2011-06-05 2013-10-29 Fourth Medium Consulting Inc. System and method for providing expert advice on software development practices
US8667012B2 (en) * 2011-06-09 2014-03-04 Salesforce.Com, Inc. Methods and systems for using distributed memory and set operations to process social networks
US8332357B1 (en) * 2011-06-10 2012-12-11 Microsoft Corporation Identification of moved or renamed files in file synchronization
US10067747B2 (en) 2011-08-12 2018-09-04 Emmoco, Inc. Embedded device application development
US20130097135A1 (en) 2011-10-17 2013-04-18 Pie Digital, Inc. Method and system for generating domain specific in-memory database management system
KR20130112197A (ko) * 2012-04-03 2013-10-14 삼성전자주식회사 객체의 상태 변화를 수행하기 위한 방법 및 그 전자 장치
CN102855290A (zh) * 2012-08-09 2013-01-02 江苏飞象科技有限公司 一种移动互联网知识管理方法
CN102819600B (zh) * 2012-08-15 2016-08-31 国家电网公司 面向电力生产管理系统关系数据库的关键词搜索方法
CN102880645B (zh) * 2012-08-24 2015-12-16 上海云叟网络科技有限公司 语义化的智能搜索方法
CN102955697B (zh) * 2012-11-08 2016-01-20 沈阳建筑大学 基于面向方面的构件库构建方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08241327A (ja) * 1995-03-06 1996-09-17 Nippon Telegr & Teleph Corp <Ntt> データベースシステムの性能チューニング装置及びデータベースシステムの性能チューニング方法
JPH1078968A (ja) * 1996-09-02 1998-03-24 Nippon Telegr & Teleph Corp <Ntt> 統計データベースシステム
JPH1115711A (ja) * 1997-06-26 1999-01-22 Hitachi Ltd データ管理装置
US20030158842A1 (en) * 2002-02-21 2003-08-21 Eliezer Levy Adaptive acceleration of retrieval queries
WO2012017529A1 (ja) * 2010-08-04 2012-02-09 株式会社日立製作所 データベース管理方法、データベース管理装置及びデータベース管理プログラム

Also Published As

Publication number Publication date
JP2023162404A (ja) 2023-11-08
JP6817988B2 (ja) 2021-01-20
AU2021225210A1 (en) 2021-09-30
JP2016521398A (ja) 2016-07-21
EP2973048A1 (en) 2016-01-20
US20210117445A1 (en) 2021-04-22
US20140279837A1 (en) 2014-09-18
US11921751B2 (en) 2024-03-05
AU2020201503B2 (en) 2021-06-17
EP2973048A4 (en) 2016-11-16
MX2015013209A (es) 2016-04-15
US20160224647A1 (en) 2016-08-04
CA2906635C (en) 2019-08-06
AU2020201503A1 (en) 2020-03-19
US9792347B2 (en) 2017-10-17
JP7345598B2 (ja) 2023-09-15
US20240168973A1 (en) 2024-05-23
BR112015023053A2 (pt) 2017-07-18
AU2017272146A1 (en) 2017-12-21
EP3690668A1 (en) 2020-08-05
MX2021010973A (es) 2023-01-03
JP2021064392A (ja) 2021-04-22
CA2906635A1 (en) 2014-09-18
KR101782704B1 (ko) 2017-09-27
JP2019032875A (ja) 2019-02-28
AU2021225210B2 (en) 2023-02-16
CN108363798A (zh) 2018-08-03
US9430549B2 (en) 2016-08-30
AU2014228252B9 (en) 2017-06-29
AU2014228252A1 (en) 2015-10-08
US10891310B2 (en) 2021-01-12
MX2023000287A (es) 2023-02-09
KR20150145231A (ko) 2015-12-29
CN105378721A (zh) 2016-03-02
WO2014143755A1 (en) 2014-09-18
CN105378721B (zh) 2019-02-19
US20170351745A1 (en) 2017-12-07
AU2014228252B2 (en) 2017-06-15
JP6420311B2 (ja) 2018-11-07
JP7086166B2 (ja) 2022-06-17

Similar Documents

Publication Publication Date Title
JP7345598B2 (ja) データ取り込みおよび該データへのユーザアクセス促進システムおよび方法
US10599719B2 (en) System and method for providing prediction-model-based generation of a graph data model
US10380144B2 (en) Business intelligence (BI) query and answering using full text search and keyword semantics
US10423881B2 (en) Systems and methods for semantic inference and reasoning
US10223417B1 (en) System and method for reducing query-related resource usage in a data retrieval process
US11093498B2 (en) System and method for reducing resource usage in a data retrieval process
EP3168791A1 (en) Method and system for data validation in knowledge extraction apparatus
AU2019284618B2 (en) Multi-source-type interoperability and/or information retrieval optimization

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220704

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220704

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230714

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230808

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230905

R150 Certificate of patent or registration of utility model

Ref document number: 7345598

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150