JP2023539284A - 企業支出の最適化及びマッピングモデルアーキテクチャ - Google Patents

企業支出の最適化及びマッピングモデルアーキテクチャ Download PDF

Info

Publication number
JP2023539284A
JP2023539284A JP2023513643A JP2023513643A JP2023539284A JP 2023539284 A JP2023539284 A JP 2023539284A JP 2023513643 A JP2023513643 A JP 2023513643A JP 2023513643 A JP2023513643 A JP 2023513643A JP 2023539284 A JP2023539284 A JP 2023539284A
Authority
JP
Japan
Prior art keywords
data
disparate
insights
disparate data
mapping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023513643A
Other languages
English (en)
Inventor
クマール ウニクリシュナン、センティル
ツィルンシュタイン、ジャン
クマール ラヴィ、ヴィジャイ
ムー、ウェイチアン
マナケ、アンクール、エス.
サバレティナム、ムトゥ
クリシュナ、レディ チャラブッディ、チャイタニヤ
キャリー、マイケル、ポール
メイヤー、ロバート
ウォール、マーク
ヒテシュクマール ゲティア、プリヤ
クマール、マノイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honeywell International Inc
Original Assignee
Honeywell International Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honeywell International Inc filed Critical Honeywell International Inc
Publication of JP2023539284A publication Critical patent/JP2023539284A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • G06Q10/06375Prediction of business process outcome or impact based on a proposed change
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/087Inventory or stock management, e.g. order filling, procurement or balancing against orders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0283Price estimation or determination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Tourism & Hospitality (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Finance (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Accounting & Taxation (AREA)
  • Databases & Information Systems (AREA)
  • Fuzzy Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本明細書で説明する様々な実施形態は、企業パフォーマンス管理に関係する最適化を提供することに関する。この点に関して、1つ以上のデータソースに関連付けられた異種データのフォーマットされたバージョンに関する1つ以上のインサイトを取得する要求が受信される。要求は、1つ以上のインサイトの目標を記述するインサイト記述子を含む。要求に応答して、1つ以上のインサイトを提供するように、異種データのフォーマットされたバージョンの態様が関連付けられる。関連付けられた態様は、目標、及び異種データのフォーマットされたバージョンの態様間の関係によって決定される。更に、1つ以上のインサイトに基づいて1つ以上のアクションが実行される。【選択図】図3

Description

(関連出願の相互参照)
本出願は、2020年8月31日に出願された「UNCLASSIFIED SPEND OPTIMIZATION」と題する米国仮出願第63/072,560号、及び2021年2月12日に出願された「ENTERPRISE SPEND OPTIMIZATION AND MAPPING MODEL ARCHITECTURE」と題する米国仮出願第63/149,004号の利益を主張するものであり、これらの仮出願の内容は、参照によりその全体が本明細書に組み込まれる。
(発明の分野)
本開示は、概して、機械学習に関し、より詳細には、企業パフォーマンス管理に関する最適化に関する。
本開示の実施形態によれば、方法が提供される。本方法は、1つ以上のプロセッサとメモリとを有するデバイスにおいて、1つ以上のデータソースに関連付けられた異種データのフォーマットされたバージョンに関する1つ以上のインサイトを取得するための要求を受信することを可能にする。要求は、1つ以上のインサイトについての目標を記述するインサイト記述子を含む。本方法はまた、デバイスにおいて、要求に応答して、1つ以上のインサイトを提供するように、異種データのフォーマットされたバージョンの態様を相関させることを可能にし、関連付けられた態様は、目標、及び異種データのフォーマットされたバージョンの態様間の関係によって決定される。本方法はまた、デバイスにおいて、要求に応答して、1つ以上のインサイトに基づいて1つ以上のアクションを実行することを可能にする。
本開示の別の実施形態によれば、システムが提供される。本システムは、1つ以上のプロセッサと、メモリと、メモリに記憶された1つ以上のプログラムとを備える。1つ以上のプログラムは、1つ以上のデータソースに関連付けられた異種データのフォーマットされたバージョンに関する1つ以上のインサイトを取得する要求を受信するように構成された命令を含む。要求は、1つ以上のインサイトについての目標を記述するインサイト記述子を含む。1つ以上のプログラムはまた、命令を含み、命令は、要求に応答して、1つ以上のインサイトを提供するように、異種データのフォーマットされたバージョンの態様を相関させるように構成されており、関連付けられた態様は、目標、及び異種データのフォーマットされたバージョンの態様間の関係によって決定される。1つ以上のプログラムはまた、要求に応答して、1つ以上のインサイトに基づいて1つ以上のアクションを実行するように構成された命令を含む。
本開示の更に別の態様によれば、非一時的コンピュータ可読記憶媒体が提供される。非一時的コンピュータ可読記憶媒体は、デバイスの1つ以上のプロセッサによって実行される1つ以上のプログラムを含む。1つ以上のプログラムは、命令を含み、命令は、1つ以上のプロセッサによって実行されたときに、デバイスに、1つ以上のデータソースに関連付けられた異種データのフォーマットされたバージョンに関する1つ以上のインサイトを取得する要求を受信させる。要求は、1つ以上のインサイトについての目標を記述するインサイト記述子を含む。1つ以上のプログラムはまた、命令を含み、命令は、1つ以上のプロセッサによって実行されたときに、デバイスに、要求に応答して、1つ以上のインサイトを提供するように、異種データのフォーマットされたバージョンの態様を相関させ、関連付けられた態様は、目標、及び異種データのフォーマットされたバージョンの態様間の関係によって決定される。1つ以上のプログラムはまた、命令を含み、命令は、1つ以上のプロセッサによって実行されたときに、デバイスに、要求に応答して、1つ以上のインサイトに基づいて1つ以上のアクションを実行させる。
従来、データ分析及び/又はデータのデジタルトランスフォーメーションに関係する大部分の時間(例えば、時間の60%~80%)は、分析のためにデータをクリーニング及び/又は準備することを伴う。更に、従来、例えば、データに関係するインサイトを提供するためのデータのモデリングには限られた時間が費やされている。したがって、データ分析及び/又はデータのデジタルトランスフォーメーションに関係するコンピューティングリソースは、従来、非効率的な方法で用いられている。
図示の実施形態の説明は、添付の図面と併せて読むことができる。図の簡略化及び明確化のために、図面に示される要素は必ずしも縮尺どおりに描かれていないことが理解されよう。例えば、要素のうちのいくつかの寸法は、他の要素に対して誇張されている。本開示の教示を組み込む実施形態は、本明細書に提示される図に関連して示され、説明される。
本明細書で説明する1つ以上の実施形態による、例示的なネットワーク化コンピューティングシステム環境を図示する。 本明細書で説明する1つ以上の実施形態による、ネットワーク化されたコンピューティングシステムのIoTプラットフォームのフレームワークの概略ブロック図を図示する。 本明細書で説明する1つ以上の実施形態による、例示的な環境を提供するシステムを図示する。 本明細書で説明する1つ以上の実施形態による、例示的な環境を提供する別のシステムを図示する。 本明細書で説明する1つ以上の実施形態による、例示的なコンピューティングデバイスを図示する。 本明細書で説明する1つ以上の実施形態による、企業パフォーマンス管理に関係する最適化を容易にするためのシステムを図示する。 本明細書で説明する1つ以上の実施形態による、機械学習モデルを図示する。 本明細書で説明する1つ以上の実施形態による、例示的なマッピングモデルアーキテクチャに関連付けられたシステムを図示する。 本明細書で説明する1つ以上の実施形態による、別の例示的マッピングモデルアーキテクチャに関連付けられたシステムを図示する。 本明細書で説明する1つ以上の実施形態による、例示的なトランスフォーマベースの分類モデルに関連するシステムを図示する。 本明細書で説明する1つ以上の実施形態による、例示的なニューラルネットワークアーキテクチャに関連付けられたシステムを図示する。 本明細書で説明する1つ以上の実施形態による、企業パフォーマンス管理に関係する最適化を行うためのフロー図を図示する。 本明細書で説明する1つ以上の実施形態による、企業パフォーマンス管理に関係する最適化を行うためのフロー図を図示する。 本明細書で説明する1つ以上の実施形態に従って説明する技法を実行するように構成され得るコンピュータの機能ブロック図を示す。 本明細書で説明する1つ以上の実施形態による、例示的なユーザインターフェースを図示する。 本明細書で説明する1つ以上の実施形態による、別の例示的なユーザインターフェースを図示する。 本明細書で説明する1つ以上の実施形態による、更に別の例示的なユーザインターフェースを図示する。
ここで、実施形態を詳細に参照し、その例を添付の図面に示す。以下の詳細な説明には、様々な説明する実施形態の完全な理解を可能にするために、多数の具体的な詳細が記載されている。しかしながら、様々な説明する実施形態は、これらの具体的な詳細なしで実施され得ることが当業者には理解されるであろう。他の例では、実施形態の態様を不必要に不明瞭にしないように、周知の方法、手順、構成要素、回路、及びネットワークは詳細に説明されていない。「又は」という用語は、別様に示唆されない限り、代替的及び連言的な意味の両方で本明細書にて使用される。「図示の」、「例」、及び「例示的な」という用語は、品質レベルの指示のない例として使用される。同様の数字は、全体を通して同様の要素を指す。
「実施形態では」、「一実施形態では」、「一実施形態によれば」という語句及び同様の語句は、その語句に続く特定の特徴、構造又は特性が、本開示の少なくとも1つの実施形態に含まれてもよいこと、及び本開示の2つ以上の実施形態に含まれてもよい(重要なことに、そのような語句は必ずしも同じ実施形態に言及するとは限らない)ことを一般に意味する。
本明細書で使用される「例示的な」という語は、「実施例、事例、又は例示として働く」ことを意味する。「例示的な」として本明細書に記載される任意の実装形態は、必ずしも他の実装形態よりも好ましい又は有利であると解釈されなくてよい。
本明細書が、ある構成要素又は特徴を「含むことができる(can)」、「含む場合がある(may)」、「含み得る(could)」、「含むべきである(should)、「含むであろう(would)」、「好ましくは(preferably)含む」、「場合により(possibly)含む」、「典型的には(typically)含む」、「任意選択的に(optionally)含む」、「例えば(for example)含む」、「多くの場合(often)含む」、若しくは「含むかもしれない(might)」(又は他のそのような言語)、あるいはある特性を有することを提示する場合、その特定の構成要素又は特徴は、含まれることを必要としないか又はその特性を有することを必要としない。このような構成要素又は特徴は、いくつかの実施形態に任意選択的に含まれてもよく、又は除外されてもよい。
概して、本開示は、企業パフォーマンス管理のための「モノのインターネット」又は「IoT」プラットフォームを提供し、このプラットフォームは、リアルタイムモデル、準リアルタイムモデル、及び視覚分析を使用して、企業又は組織の持続的なピークパフォーマンスのための合理的で実行可能な推奨を配信する。IoTプラットフォームは、移植可能な拡張可能プラットフォームであり、任意のクラウド又はデータセンタ環境において展開されて企業全体の上から下へのビューを提供し、プロセス、資産、人材、及び安全性のステータスを表示する。更に、本開示のIoTプラットフォームは、以下の説明で詳述するように、プロセスデータに対してデジタルツインを実行し、出力を実行可能なインサイトに変換するエンドツーエンド能力をサポートする。
従来、データ分析及び/又はデータのデジタルトランスフォーメーションに関係する時間の大部分(例えば、この時間の50%を超える時間、この時間の60%~80%の時間など)は、分析のためにデータをクリーニング及び/又は準備することを伴う。更に、従来、例えば、データに関係するインサイトを提供するためのデータのモデリングには限られた時間が費やされている。したがって、データ分析及び/又はデータのデジタルトランスフォーメーションに関係するコンピューティングリソースは、従来、非効率的な方法で用いられている。
一例として、企業は、資産及び/又はサービスに関係する様々なプロセスを通じて支出(例えば、リソース使用量、資産使用量など)を最適化する調達組織を有することが多い。しかしながら、企業の支出情報の規模(例えば、資産の数、部品の数、サプライヤの数など)及び/又は複雑さ(例えば、異なる地理的領域、異なる契約、異なるベンダなど)のために、調達組織が支出を決定することは一般に困難である。例えば、調達専門業者は、一般に、例えば、資産及び/又はサービスの契約において、60日の支払期間について交渉すべきかそれとも90日の支払期間について交渉すべきかなど、支出に関する決定を下すために利用可能な全てのコンテキストを有しているわけではない。更に、調達専門業者が、企業の価値を最大化するために労力を注ぐ対象としてどこを優先すべきかを決定することは一般に困難である。例えば、調達専門業者が、資産及び/若しくはサービスの契約を再交渉すべきか、又はその代わりに資産及び/若しくはサービスを統合すべきかを決定することは一般に困難である。この点に関して、従来のデータ分析技法は、一般に、コンピューティングリソースの非効率的な使用、ストレージ要件数の増加、及び/又はエラー関連データ数の増加をもたらす。更に、従来のデータ処理は一般に、データ処理の複雑さに応じてスケーリングすることができない。従来のデータ分析及び/又は従来のデータのデジタルトランスフォーメーションに関して他の技術的問題も存在し得ることも理解されたい。
したがって、これら及び/又は他の問題に対処するために、企業パフォーマンス管理に関係する最適化の例を提供する。本明細書で説明する様々な実施形態は、企業のための未分類データ最適化に関する。例えば、本明細書で説明する様々な実施形態は、未分類支出最適化に関する。未分類支出最適化は、例えば、資産についての未分類支出最適化、産業プラントについての未分類支出最適化、倉庫についての未分類支出最適化、建物についての未分類支出最適化、企業についての未分類支出最適化、及び/又は支出目標に関係する別のタイプの未分類支出最適化を含む。本明細書で説明する様々な実施形態は、追加的又は代替的に、未分類資産最適化に関する。本明細書で説明する様々な実施形態は、追加的又は代替的に、サプライチェーン分析のための最適化に関する。例えば、本明細書で説明する様々な実施形態は、追加的又は代替的に、出荷条件に関する最適化に関する。本明細書で説明する様々な実施形態は、追加的又は代替的に、企業パフォーマンス管理に関係する他のタイプの最適化に関する。企業パフォーマンス管理は、例えば、資産のパフォーマンス管理、産業プラントのパフォーマンス管理、倉庫のパフォーマンス管理、建物のパフォーマンス管理、企業のパフォーマンス管理、及び/又は別のタイプの最適化目標のパフォーマンス管理を含む。本明細書で説明する様々な実施形態は、追加的又は代替的に、1つ以上のデータソースに関連付けられた異種データをフォーマットすることに関連するマッピングモデルアーキテクチャを提供する。更に、本明細書で説明する様々な実施形態では、異種データのフォーマット構造に関連する1つ以上の特徴が推論されて、異種データのフォーマットされたバージョンについての1つ以上のマッピング推奨が提供される。1つ以上の実施形態では、1つ以上のマッピング推奨は、第1のデータソースと第2のデータソースとの間のデータの転送を容易にする。1つ以上の実施形態では、1つ以上のマッピング推奨は、異種データに関連付けられた1つ以上の機械学習プロセスを容易にする。1つ以上の実施形態では、1つ以上のマッピング推奨は、異種データに関連付けられた1つ以上のインサイトを提供することを容易にする。1つ以上の実施形態では、1つ以上のマッピング推奨は、異種データに基づく1つ以上のアクションの実行を容易にする。
様々な実施形態では、企業パフォーマンス管理に関係する最適化は、スケーラブルなデータ流動性を有する企業ドメイン全体にわたるインサイト(例えば、実行可能なインサイト)を提供する。例えば、様々な実施形態では、データ駆動機会が、インテリジェントデータ処理を使用して、従来のデータ処理システムと比較して短縮された時間(例えば、数秒、数分、数時間、数日、又は数週間)でデータに関する値を生成することによって識別される。様々な実施形態では、人口知能を用いてデータ統合を自動化して、データに関する価値の創出のためのデータ分析及び/又はデジタルトランスフォーメーションのために用いられ得る知識のネットワークを提供することによって、企業全体にわたってデータ流動性層が設けられる。様々な実施形態では、マルチドメイン人工知能オファリングは、1つ以上のネットワーク又はクラウドコンピューティング環境を介して提供及び/又は実現される。
様々な実施形態では、1つ以上のデータソース(例えば、リレーショナルデータソース、データ交換データソース、カンマ区切り値データソース、及び/又は別のタイプのデータソース)からのデータが取り込まれ、データのためのデータ準備及び/又はデータブレンディングが容易にされる。様々な実施形態では、1つ以上のインテリジェント機械学習システム(例えば、1つ以上のインテリジェント機械学習ボット)は、異なるソースからのデータを共通のデータフォーマットにマッピングする。様々な実施形態では、マッピングファイルを用いて、ソースから収集されたデータから各データフィールドをマッピングして、非正規化データベースを作成する。様々な実施形態では、データに関するデータ重複排除、合理化、オートフィル、及び/又は異常検知が、追加的又は代替的に実行され、データ流動性を大規模に促進する。様々な実施形態では、企業セマンティクス(例えば、産業セマンティクス)がデータに対してオーバーレイされ、企業システム全体にわたって現実世界の意味が提供され、かつ/又は企業規模のアプリケーションが提供される。様々な実施形態では、人工知能推奨エンジンが、支出分類、製品分類、製品再分類、支払期間最適化、リスク緩和、代替サプライヤ識別、及び/又は企業最適化を行うための他のインサイトに関するペルソナベースの推奨を提供する。
様々な実施形態では、1つ以上のデータソースからのデータが取り込まれ、クリーニングされ集約されて、集約データが提供される。更に、様々な実施形態では、集約データから1つ以上のインサイトが決定され、コスト節減及び/又は効率インサイトが提供される。1つ以上の実施形態では、1つ以上のデータソースからデータが取り出され、そのデータが、単一のデータレイクに統一される。データレイクは、例えば、生データとしてかつ/又はデータの元のフォーマットでデータを記憶するストレージリポジトリである。1つ以上の実施形態では、データレイクが、1つ以上の所定の間隔で更新され、データレイク内のデータを最新に保つ。1つ以上の実施形態によれば、データレイク内のデータは、データレイク内の異なるフィールドを同じ主題(例えば、ベンダ名、支払期間など)を記述するものとして認識することによって、及び/又は全ての利用可能な条件(例えば、対応する主題)を同じフォーマットで構成することによって、統一される。1つ以上の実施形態では、1つ以上の動作が実行されてフィールド情報が不完全であるデータソースが完成される(例えば、欠けているフィールドが、情報が完全である別のデータソース内の同じフィールドであることを認識すること、その情報を使用して欠けている情報を供給することなどによって)。
1つ以上の実施形態では、データレイク内のデータは、オントロジー構造で整理される。1つ以上の実施形態では、オントロジー構造は、データレイク内の異種データ間の複雑な関係に関連付けられた複雑な構造を理解するのを可能にする(例えば、「特定の地理的位置において供給される製品が商品Xに依存する特定の地理的位置における全てのベンダを示す」、「出荷がY日遅れて行われた全ての購入注文を示す」、「ある程度の非効率性がZ日の間隔中に存在する産業プラントにおける全ての産業資産を示す」、「保守遅延がある程度の非効率性をもたらした産業プラントにおける全ての作業注文要求を示す」など)。1つ以上の実施形態では、データレイクの整理された構造に基づいて、データソースが周期的に比較されて、コスト節減及び/又は効率のための1つ以上の機会が識別され提供される。例えば、データレイクの整理された構造に基づいて、同じサプライヤに対する支払い条件が、2つの異なる購入注文において異なり、同じにすべきであると決定することができる。別の例では、データレイクの整理された構造に基づいて、商品の価格が第2のサプライヤからの方が安価であると決定することができる。更に別の例では、商品のコストがオープンマーケットでより安価であり、したがって、商品についての現在の契約を破るか、又は現在の契約を再交渉することがより効率的であると決定することができる。更に別の例では、複数のデータソースからデータを取り込んで異なる部品番号を維持し、かつ/又は企業全体にわたって均一な可視性を提供することによって、部品マスタデータ(例えば、部品の単一ソース)が作成される。更に別の例では、複数の企業システムからのデータに関係する統一調達データベースが提供され、異なる企業システム全体にわたるメトリクスインサイトが容易にされる。
1つ以上の実施形態では、組織についての未分類データが収集され、クレンジングされ、かつ/又は集約されて、1つ以上の人工知能(artificial intelligence、AI)モデルによって生成された1つ以上のアクションの配信が容易にされる。様々な実施形態によれば、1つ以上のAIモデルを用いて、調達組織によって実行されるアクションが優先順位付けされ、例えば調達組織の価値が最大化される。様々な実施形態によれば、未分類データ(例えば、複数のソースシステムからの未分類データ)のデータマッピングが実行されて、未分類データが、1つ以上のAIモデルによって使用される内部表現に変換される。様々な実施形態によれば、1つ以上のAIモデルは、未分類データに対する1つ以上の推論及び/又は分類を決定するようにトレーニングされる。
1つ以上の実施形態では、ディープラーニング(例えば、1つ以上のAIモデルに関連付けられたディープラーニング)が実行されて、複数のデータソースから取得された未分類購入記録データについての部品商品ファミリが決定される。1つ以上の実施形態によれば、購入記録データは、例えば、購入注文データ、ベンダデータ(例えば、顧客ベンダデータ)、インボイスデータ、及び/又は他のデータを含む。実施形態では、未分類購入記録データは、複数の外部データソースから取得される。追加的又は代替的に、別の実施形態では、未分類購入記録データはクラウドデータベースから取得される。更に、1つ以上の実施形態では、部品商品ファミリについての総支出が集約されて、分類された購入記録データが提供される。1つ以上の実施形態では、分類された購入記録データに基づいて1つ以上のアクションが実行される。
1つ以上の実施形態では、データベース、データモデル及び/又はシステム間のデータ移行のためにフィールドマッピングが用いられる。1つ以上の実施形態では、フィールドマッピングは、エンティティ関係を使用してデータベース、データモデル及び/又はシステム間のデータ移行を容易にする。1つ以上の実施形態では、フィールドマッピングは、データベース、データモデル、及び/又はシステム間のデータ移行を行うための時間を短縮し、かつ/又はコンピューティングリソースの量を削減するように自動化される。1つ以上の実施形態では、フィールドマッピングは、ハイブリッドソリューションであり、教師なし機械学習及びデータインサイト(例えば、データの知識)を使用してデータベース、データモデル、及び/又はシステム間のマッピングをインテリジェントに学習する。1つ以上の実施形態では、フィールドマッピングは、グラウンドトゥルースモデル、フィールド名に基づくマッピングモデル、フィールド記述に基づくマッピングモデル、並びに/又はデータベース、データモデル及び/若しくはシステム間のマッピング結果を生成するために順次実行されるデータ特徴についてのモデルを使用する。1つ以上の実施形態では、第1のシステム(例えば、ターゲットシステム)のためのマッピングテンプレート、第2のシステム(例えば、レガシーシステム)のデータスキーマ、並びに/又は第1のシステム及び第2のシステムからのデータを用いて、第1のシステムと第2のシステムとの間の1つ以上の最上位一致データフィールドを推奨する。1つ以上の実施形態では、第1のデータベースについてのマッピングテンプレート、第2のデータベースのデータスキーマ、並びに/又は第1のデータベース及び第2のデータベースからのデータを用いて、第1のデータベースと第2のデータベースとの間の1つ以上の最上位一致データフィールドを推奨する。1つ以上の実施形態では、第1のデータモデルのためのマッピングテンプレート、第2のデータモデルのデータスキーマ、並びに/又は第1のデータモデル及び第2のデータモデルからのデータを用いて、第1のデータモデルと第2のデータモデルとの間の1つ以上の最上位一致データフィールドを推奨する。
1つ以上の実施形態では、回帰型ニューラルネットワークを用いて、データを多次元単語埋め込みにマッピングする。1つ以上の実施形態では、回帰型ニューラルネットワークのゲート付き回帰型ユニットのネットワークを用いて総支出を集約する。1つ以上の実施形態によれば、部品商品ファミリが部品記述データに基づいてサプライヤ商品分類にマッピングされる。追加的又は代替的に、1つ以上の実施形態では、部品商品ファミリは、購入注文記述データに基づいてサプライヤ商品分類にマッピングされる。追加的又は代替的に、1つ以上の実施形態では、部品商品ファミリは、位置データに基づいてサプライヤ商品分類にマッピングされる。追加的又は代替的に、1つ以上の実施形態では、部品商品ファミリは、支出タイプデータに基づいてサプライヤ商品分類にマッピングされる。追加的又は代替的に、1つ以上の実施形態では、部品商品ファミリは、階層データフォーマット技法に基づいてサプライヤ商品分類にマッピングされる。
1つ以上の実施形態では、列名ベースのモデル及び/又は列値ベースのモデルを用いて、多次元単語埋め込みへのデータのマッピングを容易にする。実施形態では、列名ベースのモデルは、1つ以上の定義されたターゲット列名のベクトル表現を学習する。列名ベースのモデルはまた、ソース列名と1つ以上の定義されたターゲット列名との間の類似性を計算する。1つ以上の定義されたターゲット列名は、例えば、フルネーム文字列又は名前省略形として構成される。1つ以上の実施形態では、列名ベースのモデルへの入力は、1つ以上のソース列名及び/又は1つ以上の定義されたターゲット列名を含む。様々な実施形態によれば、1つ以上のソース列名は、異種データソースから自動的に識別される。列名ベースのモデルの特徴生成は、例えば、ソース列及び/又はターゲット列の列名についてのテキスト埋め込みを生成することを含む。更に、列名ベースのモデルのための特徴生成技法は、用語頻度-逆文書頻度(Term Frequency-Inverse Document Frequency、TF-IDF)+文字ベースのNグラム、平滑逆頻度(smooth inverse frequency、SIF)、学習された単語埋め込み及び/若しくはテキスト分類のライブラリ、ユニバーサルセンテンスエンコーダ、トランスフォーマ(bidirectional encoder representations from transformer、BERT)埋め込みからの双方向性エンコーダ表現、並びに/又は1つ若しくは複数の他の特徴生成技法を含む。
様々な実施形態によれば、列名ベースのモデルのトレーニングは、データセットカテゴリを予測することに関連付けられたレベル1と、予測されたデータセットカテゴリを特徴として使用して対応する列名を予測することに関連付けられたレベル2とを含む階層分類モデルの使用を含む。様々な実施形態によれば、列名ベースのモデルのトレーニングは、追加的又は代替的に、ソース列に対する最も確率の高いマッピングを予測するように構成された1つ以上の決定木アルゴリズムに関連付けられたマルチクラス分類モデルの使用を含む。様々な実施形態によれば、列名ベースのモデルは、既知のターゲットデータ上でトレーニングされる。更に、より多くのデータが利用可能になるにつれて、例えば、列名ベースのモデルのパフォーマンスを強化するためのデータ特性に関する追加の変形例を含めるように、追加のデータが用いられる。
様々な実施形態によれば、列名ベースのモデルに関係する推論は、入力データセットにおける列名についての特徴を生成することによってデータを準備することを含む。列名ベースモデルのトレーニングされたバージョンを用いて、異種データソースから取得された新しいデータに関して推論を実行する。マッピングされていない列の場合、1つ以上の実施形態では、コサイン類似度を用いて、例えば教師なし学習を使用して、ソース列及びターゲット列の対の間の類似度スコアを計算する。
列値ベースのモデルは、正しいマッピングを生成するための列値に基づくマッピング手法を提供する。実施形態では、列値ベースのモデルは、トランスフォーマモデルを使用してテキスト分類器をトレーニングする。1つ以上の実施形態では、RoBERT(ベース)モデルなどの事前トレーニングされたモデルが、ニューラルネットワークの最後の層の上の密な層を使用することによって微調整される。1つ以上の実施形態では、列値ベースモデルのニューラルネットワークを、ターゲット列名及び値を有する定義されたデータセットに対してトレーニングする。実施形態によれば、列値ベースモデルのニューラルネットワークは、トランスフォーマエンコーダ層のセット(例えば、12個のトランスフォーマエンコーダ層)、隠れサイズ表現のセット(例えば、768隠れサイズ表現)、及び/又はアテンションヘッドのセット(例えば、12アテンションヘッド)を含む。列値ベースのモデルへの入力は、元のソース列名、ソース列値、及び/又はターゲット列名に関連付けられた1つ以上の列値を含む。例えば、実施形態では、列値ベースのモデルへの入力は、全てのソース列の列値のリストを含む。更に、列値ベースモデルの出力は、予測されたターゲット列マッピングを含む。1つ以上の値において、未加工テキスト値はトークン化を受け、及び/又は入力は、トランスフォーマモデルに提供される前にフォーマットされる(例えば、トークン、セグメント、位置、埋め込み、パディング、切り捨て、及び/又はアテンションマスクを取得する)。1つ以上の実施形態では、RoBERTa分類モデルが、テキスト分類器に関連付けられた分類のためのモデルの上に実装された単一の線形層とともに用いられる。1つ以上の実施形態では、入力データが列値ベースモデルに提供されると、事前トレーニングされたRoBERTaモデル及び/又は1つ以上の追加のトレーニングされていない分類層が、ターゲットデータセットに基づいてトレーニングされる。1つ以上の実施形態では、列値ベースのモデルについてのニューラルネットワークアーキテクチャは、入力列値を文字レベル埋め込みに提供することと、文字レベル埋め込みからのデータをトランスフォーマに提供することと、トランスフォーマからのデータを分類器に提供することとを含む。
1つ以上の実施形態では、反復履歴からの異なるメトリックに基づいてスコアリングモデルを用いて、アクションを推奨する。1つ以上の実施形態では、ユーザ対話式グラフィカルユーザインターフェースが生成される。例えば、1つ以上の実施形態では、グラフィカルユーザインターフェースは、分類された購入記録データの視覚的表現をレンダリングする。1つ以上の実施形態では、ユーザデバイスについての1つ以上の通知は、分類された購入記録データに基づいて生成される。1つ以上の実施形態では、回帰型ニューラルネットワークの少なくとも一部は、分類された購入記録データに基づいて再トレーニングされる。
したがって、本明細書で開示される1つ以上の技法を使用することによって、企業パフォーマンスが最適化される。例えば、1つ以上の実施形態では、本明細書に開示される1つ以上の技法を使用することによって、1つ以上の資産及び/又はサービスに関係する支出(例えば、未分類支出)が最適化される。別の例では、1つ以上の実施形態では、本明細書に開示される1つ以上の技法を用いることによって、1つ以上の資産及び/又はサービスに関係する支払期間最適化が行われる。別の例では、1つ以上の実施形態では、本明細書に開示される1つ以上の技法を用いることによって、1つ以上の資産及び/又はサービスの代替サプライヤが決定される。別の例では、1つ以上の実施形態では、本明細書に開示される1つ以上の技法を使用することによって、1つ以上の資産及び/又はサービスに関係する出荷条件が最適化される。別の例では、1つ以上の実施形態では、本明細書に開示される1つ以上の技術を用いることによって、1つ以上の資産及び/又はサービスに関係する別の目標インサイトが決定される。更に、本明細書で開示される1つ以上の技法を使用することによって、1つ以上のデータソースに関連付けられた異種データをフォーマットするためのフィールドマッピングが改善される。更に、本明細書で開示される1つ以上の技法を使用することによって、AIモデルに提供されるトレーニングデータの品質が改善される。更に、本明細書に開示される1つ以上の技法を使用することによって、グラフィカルユーザインターフェースに関連付けられた改善された視覚インジケータを介して、未分類データについての改善されたインサイトをユーザに提供することができる。例えば、本明細書に開示される1つ以上の技法を使用することによって、従来の技法の能力と比較して、付加的なインサイト及び/又は改善されたインサイトをデータセット全体にわたって実現することができる。加えて、データ分析に関連付けられた処理システムのパフォーマンスは、本明細書に開示される1つ以上の技法を使用することによって改善される。例えば、コンピューティングリソースの数、ストレージ要件の数、及び/又はデータ分析に関連付けられたエラーの数が、本明細書に開示される1つ以上の技術を使用することによって低減される。
図1は、本開示による例示的なネットワーク化コンピューティングシステム環境100を示す。図1に示されるように、ネットワーク化コンピューティングシステム環境100は、クラウド層105、ネットワーク層110、及びエッジ層115を含む複数の層で構成されている。以下で更に詳述するように、エッジ115のコンポーネントは、ネットワーク110を介してクラウド105のコンポーネントと通信している。
様々な実施形態では、ネットワーク110は、任意の好適なネットワーク又はネットワークの組み合わせであり、クラウド105のコンポーネントとの間のデータの通信、及びネットワーク化コンピューティングシステム環境100内の様々な他のコンポーネント(例えば、エッジ115のコンポーネント)間のデータの通信に好適である任意の適切なプロトコルをサポートする。様々な実施形態によれば、ネットワーク110は、パブリックネットワーク(例えば、インターネット)、プライベートネットワーク(例えば、組織内のネットワーク)、又はパブリック及び/又はプライベートネットワークの組み合わせを含む。様々な実施形態によれば、ネットワーク110は、図1に示される様々なコンポーネント間の通信を行うように構成される。様々な実施形態によれば、ネットワーク110は、ネットワークレイアウト内のデバイス及び/又はコンポーネントを接続して、デバイス及び/又はコンポーネント間の通信を可能にする1つ以上のネットワークを含む。例えば、1つ以上の実施形態では、ネットワーク110は、インターネット、無線ネットワーク、有線ネットワーク(例えば、イーサネット)、ローカルエリアネットワーク(local area network、LAN)、ワイドエリアネットワーク(Wide Area Network、WAN)、Bluetooth、近距離無線通信(Near Field Communication、NFC)、又はネットワークレイアウトの1つ以上のコンポーネント間の通信を提供する任意の他のタイプのネットワークとして実装される。いくつかの実施形態では、ネットワーク110は、セルラーネットワーク、衛星、ライセンス無線、又はセルラー、衛星、ライセンス無線、及び/若しくはアンライセンス無線ネットワークの組み合わせを使用して実装される。
クラウド105のコンポーネントは、いわゆる「モノのインターネット」又は「IoT」プラットフォーム125を形成する1つ以上のコンピュータシステム120を含む。「IoTプラットフォーム」は、任意のタイプのインターネット接続デバイスを接続するプラットフォームを記述する任意選択の用語であり、IoTプラットフォーム125内で使用可能なコンピューティングシステムのタイプを限定するものとして解釈されるべきではないことを諒解されたい。特に、様々な実施形態では、コンピュータシステム120は、ネットワーク化コンピューティングシステム環境100のアプリケーション又はソフトウェアモジュールを記憶し実行するためのメモリを備える、任意のタイプ又は数量の1つ以上のプロセッサ及び1つ以上のデータ記憶デバイスを含む。一実施形態では、プロセッサ及びデータ記憶デバイスは、企業レベルサーバなどのサーバクラスハードウェアで具現化される。例えば、実施形態では、プロセッサ及びデータ記憶デバイスは、任意のタイプのアプリケーションサーバ、通信サーバ、ウェブサーバ、スーパーコンピューティングサーバ、データベースサーバ、ファイルサーバ、メールサーバ、プロキシサーバ、及び/仮想サーバ、又はこれらの組み合わせを備える。更に、1つ以上のプロセッサは、メモリにアクセスし、プロセッサ可読命令を実行するように構成され、プロセッサ可読命令は、プロセッサによって実行されたときに、ネットワーク化コンピューティングシステム環境100の複数の機能を実行するようにプロセッサを構成する。
コンピュータシステム120は、IoTプラットフォーム125の1つ以上のソフトウェアコンポーネントを更に含む。例えば、1つ以上の実施形態では、コンピュータシステム120のソフトウェアコンポーネントは、ネットワーク110を通じてユーザデバイス及び/又は他のコンピューティングデバイスと通信するための1つ以上のソフトウェアモジュールを含む。例えば、1つ以上の実施形態では、ソフトウェアコンポーネントは、1つ以上のモジュール141、モデル142、エンジン143、データベース144、サービス145、及び/又はアプリケーション146を含み、これらは、以下の図2に関して詳述されるように、コンピュータシステム120内に/によって記憶され得る(例えば、メモリ上に記憶される)。様々な実施形態によれば、1つ以上のプロセッサは、本開示で説明する様々な方法を実行するときに、1つ以上のモジュール141、モデル142、エンジン143、データベース144、サービス145、及び/又はアプリケーション146を利用するように構成される。
したがって、1つ以上の実施形態では、コンピュータシステム120は、計算及び/又はデータ記憶のためのスケーラブルなリソースを用いてクラウドコンピューティングプラットフォーム(例えば、IoTプラットフォーム125)を実行し、クラウドコンピューティングプラットフォーム上で1つ以上のアプリケーションを実行して、本開示で説明する様々なコンピュータ実装方法を実行してもよい。いくつかの実施形態では、モジュール141、モデル142、エンジン143、データベース144、サービス145、及び/又はアプリケーション146のうちのいくつかは、より少ないモジュール、モデル、エンジン、データベース、サービス、及び/又はアプリケーションを形成するように組み合わせられる。いくつかの実施形態では、モジュール141、モデル142、エンジン143、データベース144、サービス145、及び/又はアプリケーション146のうちのいくつかは、別個のより多数のモジュール、モデル、エンジン、データベース、サービス、及び/又はアプリケーションに分離される。いくつかの実施形態では、モジュール141、モデル142、エンジン143、データベース144、サービス145、及び/又はアプリケーション146のうちのいくつかが削除され、他のものが追加される。
コンピュータシステム120は、ネットワーク化コンピューティングシステム環境100の他のコンポーネント(例えば、エッジ115のコンポーネント)からネットワーク110を介してデータを受信するように構成される。コンピュータシステム120は、受信したデータを利用して結果を生成するように更に構成される。様々な実施形態によれば、結果を示す情報は、ネットワーク110上でユーザコンピューティングデバイスを介してユーザに送信される。いくつかの実施形態では、コンピュータシステム120は、受信されたデータ及び/又は結果を示す情報をユーザに提供することを含む1つ以上のサービスを提供するサーバシステムである。様々な実施形態によれば、コンピュータシステム120は、1つ以上のIoTサービスを実施する任意のタイプの会社、組織、又は機関を含むエンティティの一部である。いくつかの例では、エンティティはIoTプラットフォームプロバイダである。
エッジ115のコンポーネントは、各々が1つ以上のエッジデバイス161a~161n及び1つ以上のエッジゲートウェイ162a~162nを含む1つ以上の企業160a~160nを含む。例えば、第1の企業160aは、第1のエッジデバイス161a及び第1のエッジゲートウェイ162aを含み、第2の企業160bは、第2のエッジデバイス161b及び第2のエッジゲートウェイ162bを含み、第nの企業160nは、第nのエッジデバイス161n及び第nのエッジゲートウェイ162nを含む。本明細書で使用される場合、企業160a~160nは、例えば、会社、部門、建物、製造工場、倉庫、不動産施設、研究所、航空機、宇宙船、自動車、船、ボート、軍用車両、石油及びガス施設、又は任意の数のローカルデバイスを含む任意の他のタイプのエンティティ、施設、及び/又は車両など、任意のタイプのエンティティ、施設、又は車両を表す。
様々な実施形態によれば、エッジデバイス161a~161nは、企業160a~160n内で使用され得る様々な異なるタイプのデバイスのいずれかを表す。エッジデバイス161a~161nは、ネットワーク110にアクセスするように構成されるか、又はエッジゲートウェイ162a~162nを介してなど、ネットワーク110を通じて他のデバイスによってアクセスされる任意のタイプのデバイスである。様々な実施形態によれば、エッジデバイス161a~161nは、任意のタイプのネットワーク接続(例えば、インターネット接続)デバイスを含む「IoTデバイス」である。例えば、1つ以上の実施形態では、エッジデバイス161a~161nは、センサ、アクチュエータ、プロセッサ、コンピュータ、バルブ、ポンプ、ダクト、車両コンポーネント、カメラ、ディスプレイ、ドア、窓、セキュリティコンポーネント、HVACコンポーネント、工場施設、並びに/又は情報を収集、送信、及び/若しくは受信するためにネットワーク110に接続された任意の他のデバイスを含む。各エッジデバイス161a~161nは、それぞれのエッジデバイス161a~161nを選択的に制御するため、及び/又はネットワーク110を介してエッジデバイス161a~161nとクラウド105との間で情報を送信/受信するための1つ以上のコントローラを含むか、又は他の方法でそれらと通信する。図2を参照すると、1つ以上の実施形態では、エッジ115は、各企業161a~161nの運用技術(operational technology、OT)システム163a~163n及び情報技術(information technology、IT)アプリケーション164a~164nを含む。OTシステム163a~163nは、産業機器(例えば、エッジデバイス161a~161n)、資産、プロセス、及び/又はイベントの直接監視及び/又は制御を通じて、変化を検出及び/又は生じさせるためのハードウェア及びソフトウェアを含む。ITアプリケーション164a~164nは、組織全体及び組織間でのデータの生成、管理、記憶、及び配信のためのネットワーク、記憶、及びコンピューティングリソースを含む。
エッジゲートウェイ162a~162nは、ネットワーク110を介したエッジデバイス161a~161nとクラウド105との間の通信を容易にするためのデバイスを含む。例えば、エッジゲートウェイ162a~162nは、エッジデバイス161a~161nと通信し、ネットワーク110を介してクラウド105と通信するための1つ以上の通信インターフェースを含む。様々な実施形態によれば、エッジゲートウェイ162a~162nの通信インターフェースは、1つ以上のセルラー無線、Bluetooth、WiFi、近距離通信無線、イーサネット、又は情報を送信及び受信するための他の適切な通信デバイスを含む。様々な実施形態によれば、ネットワーク110を介してエッジデバイス161a~161n、ゲートウェイ162a~162n、及びクラウド105の間に複数の形態の通信を提供するために、複数の通信インターフェースが各ゲートウェイ162a~162nに含まれる。例えば、1つ以上の実施形態では、エッジデバイス161a~161n及び/又はネットワーク110との通信は、無線通信(例えば、WiFi、無線通信など)及び/若しくは有線データ接続(例えば、ユニバーサルシリアルバス、オンボード診断システムなど)又はローカルエリアネットワーク(LAN)、インターネットなどのワイドエリアネットワーク(WAN)、電気通信ネットワーク、データネットワーク、若しくは任意の他のタイプのネットワークなどの他の通信モードを通じて達成される。
様々な実施形態によれば、エッジゲートウェイ162a~162nは、プログラム命令を記憶し実行してデータ処理を容易にするためのプロセッサ及びメモリも含む。例えば、1つ以上の実施形態では、エッジゲートウェイ162a~162nは、エッジデバイス161a~161nからデータを受信し、データをクラウド105に送信する前にデータを処理するように構成される。したがって、1つ以上の実施形態では、エッジゲートウェイ162a~162nは、データ処理サービス及び/又は本開示の他のサービス若しくは方法を提供するための1つ以上のソフトウェアモジュール又はコンポーネントを含む。図2を参照すると、各エッジゲートウェイ162a~162nは、エッジサービス165a~165n及びエッジコネクタ166a~166nを含む。様々な実施形態によれば、エッジサービス165a~165nは、エッジデバイス161a~161nからのデータを処理するためのハードウェアコンポーネント及びソフトウェアコンポーネントを含む。様々な実施形態によれば、エッジコネクタ166a~166nは、上記で詳述したように、ネットワーク110を介したエッジゲートウェイ162a~162nとクラウド105との間の通信を容易にするためのハードウェア及びソフトウェアコンポーネントを含む。場合によっては、エッジデバイス161a~n、エッジコネクタ166a~n、及びエッジゲートウェイ162a~nのうちのいずれかが、それらの機能を組み合わせられ、省略され、又はデバイスの任意の組み合わせに分離される。言い換えれば、エッジデバイス並びにそのコネクタ及びゲートウェイは、必ずしも別個のデバイスである必要はない。
図2は、本開示による、IoTプラットフォーム125のフレームワーク200の概略ブロック図を示す。本開示のIoTプラットフォーム125は、リアルタイムの正確なモデル及び視覚分析を使用して、企業160a~160nの持続的なピークパフォーマンスのための合理的で実行可能な推奨を配信する、企業パフォーマンス管理のためのプラットフォームである。IoTプラットフォーム125は、移植可能な拡張可能プラットフォームであり、任意のクラウド又はデータセンタ環境において展開されて企業全体の上から下へのビューを提供し、プロセス、資産、人材、及び安全性のステータスを表示する。更に、IoTプラットフォーム125は、エンドツーエンド能力をサポートし、以下で更に詳述されるフレームワーク200を使用して、プロセスデータに対してデジタルツインを実行し、出力を実行可能なインサイトに変換する。
図2に示されるように、IoTプラットフォーム125のフレームワーク200は、例えば、IoT層205、企業統合層210、データパイプライン層215、データインサイト層220、アプリケーションサービス層225、及びアプリケーション層230を含む、いくつかの層を備える。IoTプラットフォーム125はまた、コアサービス層235と、1つ以上の知識グラフ251を備える拡張可能オブジェクトモデル(extensible object model、EOM)250とを含む。層205~235は、各層205~235をともに形成する様々なソフトウェアコンポーネントを更に含む。例えば、1つ以上の実施形態では、各層205~235は、モジュール141、モデル142、エンジン143、データベース144、サービス145、アプリケーション146、又はそれらの組み合わせのうちの1つ以上を含む。いくつかの実施形態では、層205~235は、より少ない層を形成するように組み合わされる。いくつかの実施形態では、層205~235のいくつかは、別個のより多数の層に分離される。いくつかの実施形態では、層205~235のうちのいくつかが削除され、他の層が追加されてもよい。
IoTプラットフォーム125は、モデル駆動型アーキテクチャである。したがって、拡張可能オブジェクトモデル250は、各層205~230と通信し、拡張可能オブジェクトモデル(又は「資産モデル」)、並びに企業160a~160nの機器(例えば、エッジデバイス161a~161n)及びプロセスがモデリングされる知識グラフ251を使用して、企業160a~160nのサイトデータをコンテキスト化する。EOM250の知識グラフ251は、中央位置にモデルを記憶するように構成される。知識グラフ251は、スマートシステムを可能にする現実世界の接続を記述するノード及びリンクの集合を定義する。本明細書で使用される知識グラフ251は、(i)現実世界のエンティティ(例えば、エッジデバイス161a~161n)、及びグラフィカルインターフェースに整理されたエンティティの相互関係を記述し、(ii)エンティティの可能なクラス及び関係をスキーマにおいて定義し、(iii)任意のエンティティを互いに関連付けることを可能にし、(iv)様々なトピックドメインを対象とする。言い換えれば、知識グラフ251は、エンティティ(例えば、エッジデバイス161a~161n)の大規模ネットワーク、エンティティのセマンティックタイプ、エンティティのプロパティ、及びエンティティ間の関係を定義する。したがって、知識グラフ251は、特定のドメイン又は企業若しくは組織に関連する「モノ」のネットワークを記述する。知識グラフ251は、抽象的な概念及び関係に限定されず、例えば、文書及びデータセットなどのオブジェクトのインスタンスも含むことができる。いくつかの実施形態では、知識グラフ251は、リソース記述フレームワーク(resource description framework、RDF)グラフを含む。本明細書で使用される場合、「RDFグラフ」は、情報のセマンティクス又は意味を形式的に記述するグラフデータモデルである。RDFグラフはまた、メタデータ(例えば、データを記述するデータ)を表す。様々な実施形態によれば、知識グラフ251は、セマンティックオブジェクトモデルも含む。セマンティックオブジェクトモデルは、知識グラフ251のセマンティクスを定義する知識グラフ251のサブセットである。例えば、セマンティックオブジェクトモデルは、知識グラフ251のスキーマを定義する。
本明細書で使用される場合、EOM250は、アプリケーションプログラミングインターフェース(application programming interface、API)の集合であり、シードされたセマンティックオブジェクトモデルが拡張されることを可能にする。例えば、本開示のEOM250は、顧客の知識グラフ251が、顧客のセマンティックオブジェクトモデルにおいて表現された制約に従って構築されることを可能にする。したがって、知識グラフ251は、企業160a~160nのエッジデバイス161a~161nのモデルを作成するために顧客(例えば、企業又は組織)によって生成され、知識グラフ251は、モデル(例えば、ノード及びリンク)を視覚化するためにEOM250に入力される。
モデルは、企業(例えば、エッジデバイス161a~161n)の資産(例えば、ノード)を記述し、資産と他のコンポーネント(例えば、リンク)との関係を記述する。モデルはまた、スキーマを記述し(例えば、データが何であるかを記述し)、したがって、モデルは自己検証型である。例えば、1つ以上の実施形態では、モデルは、任意の所与の資産(例えば、エッジデバイス161a~161n)に取り付けられたセンサのタイプ、及び各センサによって感知されているデータのタイプを記述する。様々な実施形態によれば、重要業績評価指標(key performance indicator、KPI)フレームワークを使用して、拡張可能オブジェクトモデル250内の資産のプロパティをKPIフレームワークの入力にバインドする。したがって、IoTプラットフォーム125は、エッジ115とクラウド105との間の双方向モデル同期及びセキュアデータ交換と、メタデータ駆動型データ処理(例えば、規則、計算、及び集約)と、モデル駆動型視覚化及びアプリケーションとを含む、拡張可能なモデル駆動型エンドツーエンドスタックである。本明細書で使用される場合、「拡張可能」は、新しいプロパティ/列/フィールド、新しいクラス/テーブル、及び新しい関係を含むようにデータモデルを拡張する能力を指す。したがって、IoTプラットフォーム125は、エッジデバイス161a~161n及びそれらのデバイス161a~161nを処理するアプリケーション146に関して拡張可能である。例えば、新しいエッジデバイス161a~161nが企業160a~160nシステムに追加されるとき、新しいデバイス161a~161nは、対応するアプリケーション146が新しいデバイス161a~161nからのデータを理解して使用するように、IoTプラットフォーム125に自動的に出現する。
場合によっては、資産テンプレートを使用して、共通の構造を用いてモデル内のエッジデバイス161a~161nのインスタンスの構成を容易にする。資産テンプレートは、特定のタイプのデバイスに対する所与の企業160a~160nのエッジデバイス161a~161nについての典型的なプロパティを定義する。例えば、ポンプの資産テンプレートは、入口及び出口圧力、速度、流量などを有するポンプをモデリングすることを含む。テンプレートはまた、デバイス161a~161nの基本タイプの変形例に適応するためのエッジデバイス161a~161nの階層又は派生タイプを含み得る。例えば、往復ポンプは、基本ポンプタイプを特化したものであり、テンプレートに追加のプロパティを含む。モデル内のエッジデバイス161a~161nのインスタンスは、テンプレートを使用してデバイス161a~161nの予期される属性を定義して、企業160a~160nの実際の物理的デバイスに適合するように構成される。各属性は、静的値(例えば、容量が1000BPHである)として構成されるか、又は値を提供する時系列タグへの参照を用いて構成される。知識グラフ250は、タグ及び属性記述の命名規則、構文解析、及びマッチングに基づき、かつ/又は時系列データの挙動を予想される挙動と比較することによって、タグを属性に自動的にマッピングすることができる。
モデリングフェーズは、エッジ115とクラウド105との間でモデルを同期させるためのオンボーディングプロセスを含む。例えば、1つ以上の実施形態では、オンボーディングプロセスは、単純オンボーディングプロセス、複雑オンボーディングプロセス、及び/又は標準化ロールアウトプロセスを含む。単純なオンボーディングプロセスは、知識グラフ250がエッジ115から生のモデルデータを受け取り、コンテキスト発見アルゴリズムを実行してモデルを生成することを含む。コンテキスト発見アルゴリズムは、エッジデバイス161a~161nのエッジ命名規則のコンテキストを読み取り、命名規則が何を参照するかを決定する。例えば、1つ以上の実施形態では、知識グラフ250は、モデリングフェーズ中に「TMP」を受信し、「TMP」が「温度」に関係すると決定する。次いで、生成されたモデルがパブリッシュされる。複雑なオンボーディングプロセスは、知識グラフ250が生モデルデータを受信すること、地点履歴データを受信すること、及び実地調査データを受信することを含む。様々な実施形態によれば、知識グラフ250は、次いで、これらの入力を使用してコンテキスト発見アルゴリズムを実行する。様々な実施形態によれば、生成されたモデルは編集され、次いでモデルがパブリッシュされる。標準化されたロールアウトプロセスは、クラウド105において標準モデルを手動で定義し、モデルをエッジ115にプッシュすることを含む。
IoT層205は、エッジデバイス161a~161nのデバイス管理、データ取り込み、及び/又はコマンド/制御のための1つ以上のコンポーネントを含む。IoT層205のコンポーネントは、データが様々なソースからIoTプラットフォーム125に取り込まれるか、又は他の方法で、IoTプラットフォーム125で受信されることを可能にする。例えば、1つ以上の実施形態では、データは、プロセスヒストリアン又は実験室情報管理システムを介してエッジデバイス161a~161nから取り込まれる。IoT層205は、ネットワーク110を介してエッジゲートウェイ162a~162n上に設置されたエッジコネクタ165a~165nと通信しており、エッジコネクタ165a~165nは、データをIoTプラットフォーム205に安全に送信する。いくつかの実施形態では、許可されたデータのみがIoTプラットフォーム125に送信され、IoTプラットフォーム125は、許可されたエッジゲートウェイ162a~162n及び/又はエッジデバイス161a~161nからのデータのみを受け入れる。様々な実施形態によれば、データは、直接ストリーミング及び/又はバッチ配信を介して、エッジゲートウェイ162a~162nからIoTプラットフォーム125に送信される。更に、任意のネットワーク又はシステム停止後、通信が再確立されるとデータ転送が再開し、停止中に失われた任意のデータは、ソースシステムから、又はIoTプラットフォーム125のキャッシュからバックフィルされる。様々な実施形態によれば、IoT層205はまた、様々なプロトコルを介して時系列、アラーム及びイベント、並びに取引データにアクセスするためのコンポーネントを含む。
企業統合層210は、イベント/メッセージング、ファイルアップロード、及び/又はREST/ODataのための1つ以上のコンポーネントを含む。企業統合層210のコンポーネントは、IoTプラットフォーム125が、企業によってそのエッジデバイスに関連して操作される任意のアプリケーションなどのサードパーティクラウドアプリケーション211と通信することを可能にする。例えば、企業統合層210は、ゲストデータベース、顧客データベース、金融データベース、患者データベースなどのような企業データベースと接続する。企業統合層210は、IoTプラットフォーム125にアクセスするための標準アプリケーションプログラミングインターフェース(API)をサードパーティに提供する。企業統合層210はまた、IoTプラットフォーム125が、企業160a~160nのOTシステム163a~163n及びITアプリケーション164a~164nと通信することを可能にする。したがって、企業統合層210は、IoTプラットフォーム125が、エッジデバイス161a~161nから直接データを受信する代わりに又は受信することと組み合わせて、サードパーティアプリケーション211からデータを受信することを可能にする。
データパイプライン層215は、データストリームについてのデータクレンジング/エンリッチング、データ変換、データ計算/集約、及び/又はAPIのための1つ以上のコンポーネントを含む。したがって、1つ以上の実施形態では、データパイプライン層215は、受信されたデータに対する初期分析の前処理を行い、かつ/又は初期分析を実行する。データパイプライン層215は、所望の情報が確実に更なる処理の基礎として使用されるように、例えば、データ補正、マスバランス調整、データ調整、コンポーネントバランシング、及びシミュレーションを含む高度なデータクレンジングルーチンを実行する。データパイプライン層215はまた、高度で高速な計算を行う。例えば、クレンジングされたデータは、企業固有のデジタルツインを通じて実行される。様々な実施形態によれば、企業固有のデジタルツインは、現在の動作を決定するためのプロセスモデルと、任意の早期検出をトリガし、適切な解決を決定するための故障モデルとを含む信頼性アドバイザを含む。様々な実施形態によれば、デジタルツインはまた、リアルタイム経済データをリアルタイムプロセスデータと統合し、プロセスのための正しいフィードを選択し、最適なプロセス条件及び製品収量を決定する最適化アドバイザを含む。
様々な実施形態によれば、データパイプライン層215は、モデル及びテンプレートを使用して計算及び分析を定義する。追加的又は代替的に、様々な実施形態によれば、データパイプライン層215は、モデル及びテンプレートを使用して、計算及び分析が資産(例えば、エッジデバイス161a~161n)にどのように関係するかを定義する。例えば、実施形態では、ポンプテンプレートは、ポンプが構成されるたびに、標準効率計算がポンプについて自動的に実行されるように、ポンプ効率計算を定義する。計算モデルは、様々なタイプの計算、計算を実行すべきエンジンのタイプ、入力及び出力パラメータ、前処理要件及び前提条件、スケジュールなどを定義する。様々な実施形態によれば、実際の計算又は解析論理は、テンプレート内で定義されるか、又は参照され得る。したがって、様々な実施形態によれば、計算モデルを用いて、様々な異なるプロセスモデルの実行を記述し制御する。様々な実施形態によれば、計算テンプレートが資産テンプレートにリンクされ、それによって、資産(例えば、エッジデバイス161a~161n)インスタンスが作成されるときに、入力及び出力パラメータが資産(例えば、エッジデバイス161a~161n)の適切な属性にリンクされた任意の関連する計算インスタンスも作成される。
様々な実施形態によれば、IoTプラットフォーム125は、例えば、第1原理モデル、経験的モデル、エンジニアリングモデル、ユーザ定義モデル、機械学習モデル、組み込み関数、及び/又は任意の他のタイプの分析モデルを含む、様々な異なる分析モデルをサポートする。ここでは、例として故障モデル及び予知保全モデルについて説明するが、任意のタイプのモデルが適用され得る。
故障モデルを使用して、企業160a~160nの現在のパフォーマンスと予測されるパフォーマンスを比較して、問題又は機会、及び問題又は機会の潜在的な原因又は推進力を識別する。IoTプラットフォーム125は、異常条件及びそれらの潜在的な結果を識別するための豊富な階層的症状-故障モデルを含む。例えば、1つ以上の実施形態では、IoTプラットフォーム125は、高レベル条件から掘り下げて、寄与因子を理解し、並びにより低レベルの条件が有し得る潜在的な影響を決定する。プロセス、機器、制御、及び/又は動作などの異なる態様を見る所与の企業160a~160nについての複数の故障モデルが存在し得る。様々な実施形態によれば、各故障モデルは、それらのドメインにおける問題及び機会を識別し、異なる観点から同じコア問題を見ることもできる。様々な実施形態によれば、全体的な故障モデルは、各故障モデルからの異なる視点を状況の全体的な評価に合成し、真の根本原因を指摘するために、最上位に階層化される。
様々な実施形態によれば、故障又は機会が識別されると、IoTプラットフォーム125は、取るべき最適な是正措置に関する推奨を提供する。最初に、推奨は、プロセス及び機器の専門家によってシステムに事前にプログラムされた専門知識に基づく。推奨サービスモジュールは、ソースに関係なく一貫した方法でこの情報を提示し、推奨フォローアップを追跡し、完了し、文書化するためのワークフローをサポートする。様々な実施形態によれば、推奨フォローアップを用いて、既存の推奨が立証された(若しくは立証されなかった)とき、又は新しい因果関係がユーザ及び/若しくは分析によって学習されたときに、経時的にシステムの全体的知識を改善する。
様々な実施形態によれば、モデルを使用して、何が起こるかをそれが起こる前に正確に予測し、設置されたベースの状態を解釈する。したがって、IoTプラットフォーム125は、異常が発生したときにオペレータが保全措置を迅速に開始することを可能にする。様々な実施形態によれば、IoTプラットフォーム125のデジタルツインアーキテクチャは、様々なモデリング技法を使用する。様々な実施形態によれば、モデリング技法は、例えば、厳密モデル、故障検出及び診断(fault detection and diagnostic、FDD)、記述モデル、予知保全、処方的保守、プロセス最適化、及び/又は任意の他のモデリング技法を含む。
様々な実施形態によれば、厳密モデルは、プロセス設計シミュレーションから変換される。このようにして、プロセス設計はフィード条件及び生産要件と統合される。プロセス変更及び技術改善は、生産ニーズのコンテキストにおいて、より効果的な保全スケジュール及びリソースの配備を可能にするビジネス機会を提供する。故障検出及び診断は、一般化された規則セットを含み、このような規則セットは、産業経験及びドメイン知識に基づいて指定され、機器モデルと一緒に働くように容易に組み込んで使用することができる。様々な実施形態によれば、記述モデルは問題を識別し、予測モデルは可能な損害レベル及び保全オプションを決定する。様々な実施形態によれば、記述モデルは、エッジデバイス161a~161nの動作ウィンドウを定義するためのモデルを含む。
予知保全は、例えば、主成分分析(principal component analysis、PCA)及び部分最小二乗法(partial least square、PLS)などの厳密モデル及び統計モデルに基づいて開発された予測分析モデルを含む。様々な実施形態によれば、機械学習方法は、故障予測のためのトレーニングモデルに適用される。様々な実施形態によれば、予知保全は、FDDベースのアルゴリズムを活用して個々の制御及び機器パフォーマンスを継続的に監視する。次いで、予測モデリングが、経時的に劣化する選択された状態インジケータに適用される。処方的保全は、最適な保全オプションを決定することと、時間ベースの保全スケジュールではなく実際の条件に基づいていつ実行すべきかを決定することとを含む。様々な実施形態によれば、処方的分析は、会社の資本、運用、及び/又は他の要件に基づいて正しいソリューションを選択する。プロセス最適化は、設定点及びスケジュールを調整することによって最適条件を決定することである。最適化された設定点及びスケジュールは、基礎となるコントローラに直接通信することができ、これにより、分析から制御へのループを自動的に閉じることが可能になる。
データインサイト層220は、時系列データベース(TDSB)、リレーショナル/ドキュメントデータベース、データレイク、ブロブ、ファイル、画像、及びビデオ用の1つ以上のコンポーネント、及び/又はデータクエリについてのAPIを含む。様々な実施形態によれば、生データがIoTプラットフォーム125において受信されたとき、生データは、対話型クエリをサポートするために時系列タグ又はイベントとしてウォームストレージ(例えば、TSDB)に記憶され、かつアーカイブ目的のためにコールドストレージに記憶される。様々な実施形態によれば、データは、オフライン分析的展開のためにデータレイクに送信される。様々な実施形態によれば、データパイプライン層215は、上で詳述したように、データインサイト層220のデータベースに記憶されたデータにアクセスして、分析を実行する。
アプリケーションサービス層225は、ルールエンジン、ワークフロー/通知、KPIフレームワーク、インサイト(例えば、実行可能なインサイト)、決定、推奨、機械学習、及び/又はアプリケーションサービスについてのAPI用の1つ以上のコンポーネントを含む。アプリケーションサービス層225は、アプリケーション146a~dの構築を可能にする。アプリケーション層230は、IoTプラットフォーム125の1つ以上のアプリケーション146a~dを含む。例えば、様々な実施形態によれば、アプリケーション146a~dは、建物アプリケーション146a、プラントアプリケーション146b、航空アプリケーション146c、及び他の企業アプリケーション146dを含む。様々な実施形態によれば、アプリケーション146は、ポートフォリオ管理、資産管理、自律制御、及び/又は任意の他のカスタムアプリケーションのための汎用アプリケーション146を含む。様々な実施形態によれば、ポートフォリオ管理は、KPIフレームワーク及びフレキシブルユーザインターフェース(user interface、UI)ビルダを含む。様々な実施形態によれば、資産管理は、資産パフォーマンス及び資産健全性を含む。様々な実施形態によれば、自律制御は、エネルギーの最適化及び/又は予知保全を含む。上記で詳述したように、様々な実施形態によれば、汎用アプリケーション146は、各アプリケーション146が異なるタイプの企業160a~160n(例えば、建物アプリケーション146a、プラントアプリケーション146b、エアロアプリケーション146c、及び他の企業アプリケーション146d)のために構成可能であるように拡張可能である。
アプリケーション層230はまた、企業160a~160nのパフォーマンスの視覚化を可能にする。例えば、ダッシュボードは、より深い調査をサポートするためのドリルダウンによる高レベルの概要を提供する。推奨要約は、現在の又は潜在的な問題及び機会に対処するための優先順位付けされたアクションをユーザに与える。データ分析ツールは、アドホックデータ探索をサポートしてトラブルシューティング及びプロセス改善を容易にするためにする。
コアサービス層235は、IoTプラットフォーム125の1つ以上のサービスを含む。様々な実施形態によれば、コアサービス235は、データ視覚化、データ分析ツール、セキュリティ、スケーリング、及びモニタリングを含む。様々な実施形態によれば、コアサービス235はまた、テナントプロビジョニング、シングルログイン/共通ポータル、セルフサービス管理、UIライブラリ/UIタイル、アイデンティティ/アクセス/エンタイトルメント、ロギング/モニタリング、使用量計測、APIゲートウェイ/devポータル、及びIoTプラットフォーム125ストリームのためのサービスを含む。
図3は、本開示の1つ以上の実施形態の1つ以上の記載された特徴による例示的な環境を提供するシステム300を示す。実施形態によれば、システム300は、データ分析技術及び/又はデジタルトランスフォーメーション技術の実用的な適用を容易にして、企業パフォーマンス管理に関係する最適化を行うためのデータ最適化コンピュータシステム302を含む。1つ以上の実施形態では、データ最適化コンピュータシステム302は、機械学習技術の実用的な適用を容易にして企業パフォーマンス管理に関係する最適化を行う。1つ以上の実施形態では、データ最適化コンピュータシステム302は、1つ以上の情報技術データソースから取り込まれ、クリーニングされ、かつ/又は集約されたデータを分析して、企業システムのコスト節約インサイト及び/又は効率インサイトを提供する。
実施形態では、データ最適化コンピュータシステム302は、1つ以上のコンピューティングデバイスと1つ以上のデータソースとの間のデータ分析プラットフォームを容易にするサーバシステム(例えば、サーバデバイス)である。1つ以上の実施形態では、データ最適化コンピュータシステム302は、1つ以上のプロセッサ及びメモリを有するデバイスである。1つ以上の実施形態では、データ最適化コンピュータシステム302は、コンピュータシステム120からのコンピュータシステムである。例えば、1つ以上の実施形態では、データ最適化コンピュータシステム302は、クラウド105を介して実装される。また、データ最適化コンピュータシステム302は、例えば、企業技術、データ分析技術、デジタルトランスフォーメーション技術、クラウドコンピューティング技術、クラウドデータベース技術、サーバ技術、ネットワーク技術、無線通信技術、自然言語処理技術、機械学習技術、人口知能技術、デジタル処理技術、電子デバイス技術、コンピュータ技術、産業技術、産業用モノのインターネット(Internet of Things、IoT)技術、サプライチェーン分析技術、航空機技術、建築技術、サイバーセキュリティ技術、ナビゲーション技術、資産可視化技術、石油・ガス技術、石油化学技術、製油所技術、プロセスプラント技術、調達技術、及び/又は1つ以上の他の技術などの1つ以上の技術にも関係する。
更に、データ最適化コンピュータシステム302は、企業技術、データ分析技術、デジタルトランスフォーメーション技術、クラウドコンピューティング技術、クラウドデータベース技術、サーバ技術、ネットワーク技術、無線通信技術、自然言語処理技術、機械学習技術、人口知能技術、デジタル処理技術、電子デバイス技術、コンピュータ技術、産業技術、産業用モノのインターネット(IoT)技術、サプライチェーン分析技術、航空機技術、建築技術、サイバーセキュリティ技術、ナビゲーション技術、資産可視化技術、石油・ガス技術、石油化学技術、製油所技術、プロセスプラント技術、調達技術、及び/又は1つ以上の他の技術などの1つ以上の技術を改善する。一実装形態では、データ最適化コンピュータシステム302は、コンピューティングデバイスのパフォーマンスを改善する。例えば、1つ以上の実施形態では、データ最適化コンピュータシステム302は、コンピューティングデバイス(例えば、サーバ)の処理効率を改善すること、コンピューティングデバイス(例えば、サーバ)の電力消費を低減させること、コンピューティングデバイス(例えば、サーバ)によって提供されるデータの品質を改善すること、などの改善を行う。
データ最適化コンピュータシステム302は、データマッピングコンポーネント304、人工知能コンポーネント306、及び/又はアクションコンポーネント308を含む。更に、特定の実施形態では、データ最適化コンピュータシステム302は、プロセッサ310及び/又はメモリ312を含む。特定の実施形態では、データ最適化コンピュータシステム302(及び/又は本明細書に開示される他のシステム、装置、及び/又はプロセス)の1つ以上の態様は、コンピュータ可読記憶媒体(例えば、メモリ312)内に具現化される実行可能命令を構成する。例えば、実施形態では、メモリ312は、コンピュータ実行可能コンポーネント及び/又は実行可能命令(例えば、プログラム命令)を記憶する。更に、プロセッサ310は、コンピュータ実行可能コンポーネント及び/又は実行可能命令(例えば、プログラム命令)の実行を容易にする。例示的な実施形態では、プロセッサ310は、メモリ312に記憶された命令、又は他の方法でプロセッサ310にアクセス可能な命令を実行するように構成される。
プロセッサ310は、本開示の1つ以上の実施形態による動作を実行することが可能なハードウェアエンティティ(例えば、回路において物理的に具現化される)である。代替的に、プロセッサ310がソフトウェア命令のエグゼキュータとして具現化される実施形態では、ソフトウェア命令は、実行されているソフトウェア命令に応答して、本明細書で説明する1つ以上のアルゴリズム及び/又は動作を実行するようにプロセッサ310を構成する。実施形態では、プロセッサ310は、データ最適化コンピュータシステム302の内部のシングルコアプロセッサ、マルチコアプロセッサ、複数のプロセッサ、リモートプロセッサ(例えば、サーバ上に実装されたプロセッサ)、及び/又は仮想マシンである。特定の実施形態では、プロセッサ310は、バスを介してメモリ312、データマッピングコンポーネント304、人工知能コンポーネント306及び/又はアクションコンポーネント308と通信して、例えば、プロセッサ310、メモリ312、データマッピングコンポーネント304、人工知能コンポーネント306及び/又はアクションコンポーネント308の間のデータの送信を容易にする。プロセッサ310は、複数の異なる方法で具現化されてもよく、特定の実施形態では、独立して動作するように構成された1つ以上の処理装置を含むことができる。追加的又は代替的に、1つ以上の実施形態では、プロセッサ310は、命令の独立した実行、データのパイプライニング、及び/又は命令のマルチスレッド実行を可能にするためにバスを介してタンデム型に構成された1つ以上のプロセッサを含む。
メモリ312は、非一時的であり、例えば、1つ以上の揮発性メモリ及び/又は1つ以上の不揮発性メモリを含む。言い換えれば、1つ以上の実施形態では、メモリ312は、電子記憶デバイス(例えば、コンピュータ可読記憶媒体)である。メモリ312は、情報、データ、コンテンツ、1つ以上のアプリケーション、1つ以上の命令などを記憶して、データ最適化コンピュータシステム302が、本明細書に開示された1つ以上の実施形態に従って様々な機能を実行することを可能にするように構成される。本開示において本明細書で使用される場合、「コンポーネント」、「システム」などの用語は、コンピュータ関連エンティティである。例えば、本明細書で開示される「コンポーネント」、「システム」などは、ハードウェア、ソフトウェア、又はハードウェアとソフトウェアの組み合わせのいずれかである。例として、コンポーネントは、限定はしないが、プロセッサ上で実行するプロセス、プロセッサ、回路、実行可能なコンポーネント、命令のスレッド、プログラム、及び/又はコンピュータエンティティであってもよい。
実施形態では、データ最適化コンピュータシステム302(例えば、データ最適化コンピュータシステム302のデータマッピングコンポーネント304)は、異種データ314を受信する。1つ以上の実施形態では、データ最適化コンピュータシステム302(例えば、データ最適化コンピュータシステム302のデータマッピングコンポーネント304)は、1つ以上のデータソース316から異種データ314を受信する。特定の実施形態では、1つ以上のデータソース316からの少なくとも1つのデータソースは、異種データ314の1つ以上の部分の暗号化を容易にする暗号化機能を組み込む。特定の実施形態では、1つ以上のデータソース316は、1つ以上のITデータソースである。加えて、1つ以上の実施形態では、データ最適化コンピュータシステム302(例えば、データ最適化コンピュータシステム302のデータマッピングコンポーネント304)は、ネットワーク110を介して異種データ314を受信する。1つ以上の実施形態では、ネットワーク110は、Wi-Fiネットワーク、近距離無線通信(NFC)ネットワーク、ワールドワイドインターオペラビリティフォーマイクロウェーブアクセス(Worldwide Interoperability for Microwave Access、WiMAX)ネットワーク、パーソナルエリアネットワーク(personal area network、PAN)、短距離無線ネットワーク(例えば、Bluetooth(登録商標)ネットワーク)、赤外線無線(例えば、IrDA)ネットワーク、超広帯域(ultra-wideband、UWB)ネットワーク、誘導無線伝送ネットワーク、及び/又は別のタイプのネットワークである。1つ以上の実施形態では、1つ以上のデータソース316は、例えば、1つ以上の企業160a~160nなどのエッジ115のコンポーネントに関連付けられる。1つ以上の実施形態では、1つ以上のデータソース316は、類似しているが統一されていないデータソースである。例えば、実施形態では、1つ以上のデータソース316は、企業システムの異なる補助部(例えば、調達システム及び金融システム、販売システム及び調達システムなど)における調達データソースである。
異種データ314は、例えば、未分類データ、未分類データ要素、未分類データエンティティ、及び/又は他の未分類情報を含む。特定の実施形態では、異種データ314は加えて、分類されたデータ(例えば、以前に分類されたデータ)を含む。更に、1つ以上の実施形態では、異種データ314は、1つ以上のデータフィールド(例えば、1つ以上の記入可能フィールド)を含む。1つ以上の実施形態では、異種データ314に関連付けられたデータフィールドは、データ要素を含んでもよく、データ要素を用いてフォーマットされてもよく、及び/又はデータ要素を用いてタグ付けされてもよい。代替的に、1つ以上の実施形態では、異種データ314に関連付けられたデータフィールドは、データ要素なしでフォーマットされた不完全なデータフィールドであってもよい。1つ以上の実施形態では、異種データ314は、取引データ(例えば、未分類取引データ)、購入記録データ(例えば、未分類購入記録データ)、インボイスデータ(例えば、未分類インボイスデータ)、購入注文データ(例えば、未分類購入注文データ)、サプライヤデータ(例えば、未分類サプライヤデータ)、契約データ(例えば、未分類契約データ)、プロセスデータ(例えば、未分類プロセスデータ)、産業データ(未分類産業データ)、資産データ(例えば、未分類資産データ)、出荷データ(例えば、未分類出荷データ)、センサデータ(例えば、未分類センサデータ)、位置データ(例えば、未分類位置データ)、ユーザデータ(例えば、未分類購入記録データ)、及び/又は他のデータ(例えば、他の未分類データ)を含む。一例では、異種データ314の少なくとも一部は、1つ以上の動的に修正可能な電子購入合意に関連付けられたデータを含む。別の例では、異種データ314に関連付けられたインボイスデータの少なくとも一部は、購入注文番号、インボイス番号、サプライヤ識別子、支払期間、インボイス金額、サプライヤ階層レベル識別子、及び/又は他のインボイス情報を含む。別の例では、異種データ314に関連付けられた購入データの少なくとも一部は、購入注文番号、サプライヤ識別子、購入注文行項目、購入注文残高、購入注文条件、部品番号、製品商品ファミリ、部品記述、及び/又は他の購入注文情報を含む。
1つ以上の実施形態では、データマッピングコンポーネント304は、1つ以上のデータソース316からの異種データ314を集約する。例えば、1つ以上の実施形態では、データマッピングコンポーネント304は、異種データ314をデータレイク318に集約することができる。1つ以上の実施形態では、データレイク318は、異種データ314に含まれる非構造化データ及び/又は構造化データを記憶する集中リポジトリ(例えば、単一のデータレイク)である。1つ以上の実施形態では、データマッピングコンポーネント304は、1つ以上の所定の間隔でデータレイク318のデータを繰り返し更新する。例えば、1つ以上の実施形態では、データマッピングコンポーネント304は、1つ以上のデータソース316に関連付けられた新しいデータ及び/又は修正されたデータを記憶する。1つ以上の実施形態では、データマッピングコンポーネント304は、1つ以上のデータソース316を繰り返しスキャンして、データレイク318に記憶するための新しいデータを決定する。
1つ以上の実施形態では、データマッピングコンポーネント304は、異種データ314の1つ以上の部分をフォーマットする。例えば、1つ以上の実施形態では、データマッピングコンポーネント304は、異種データ314のフォーマットされたバージョンを提供する。実施形態では、異種データ314のフォーマットされたバージョンは、1つ以上の定義されたフォーマットを用いてフォーマットされる。定義されたフォーマットは、例えば、データフィールドの構造である。一実施形態では、定義されたフォーマットは事前に決定される。例えば、1つ以上の実施形態では、優勢なタイプの構造(例えば、優勢なタイプのフォーマット、優勢なタイプの調達形式など)を、将来の使用のためのテンプレートとして用いることができる。別の実施形態では、定義されたフォーマットは、(例えば、異種データ314の大部分が受信されたことに応答して)異種データ314の分析に基づいて決定される。様々な実施形態では、異種データ314のフォーマットされたバージョンは、データレイク318に記憶される。
1つ以上の実施形態では、データマッピングコンポーネント304は、対応する主題を記述する異種データ314内の1つ以上の異なるデータフィールドを識別する。例えば、1つ以上の実施形態では、データマッピングコンポーネント304は、対応するベンダ名を記述する異種データ314内の1つ以上の異なるデータフィールドを識別する。別の例では、マッピングコンポーネント304は、対応する支払い条件を記述する異種データ314内の1つ以上の異なるデータフィールドを識別する。1つ以上の実施形態では、データマッピングコンポーネント304は、識別された1つ以上の異なるデータフィールドに対応する異種データ314の1つ以上の不完全なデータフィールドを決定する。1つ以上の決定された不完全なデータフィールドが識別された1つ以上の異なるデータフィールドに対応するという決定に従って、1つ以上の実施形態では、データマッピングコンポーネント304は、識別されたデータフィールドからのデータを異種データ314の不完全なデータフィールドに追加する。1つ以上の実施形態では、データマッピングコンポーネント304は、1つ以上のタグ及び/又はメタデータを異種データ314に割り当てる。1つ以上の実施形態では、データマッピングコンポーネント304は、1つ以上の自然言語処理技法を使用して、異種データ314からデータを抽出する。1つ以上の実施形態では、データマッピングコンポーネント304は、異種データ314に関連付けられた1つ以上のデータ要素、1つ以上の単語、及び/又は1つ以上の句を決定する。1つ以上の実施形態では、データマッピングコンポーネント304は、異種データ314に関連付けられた異なるデータ要素、単語、及び/又は句に関連付けられた特定の意図に基づいて、データフィールドのデータを予測する。例えば、実施形態では、データマッピングコンポーネント304は、異種データ314に記憶された他の取引データに関連付けられた異なるデータ要素、単語、及び/又は句に関連付けられた特定の意図に基づいて、取引データに関連付けられた第1のデータフィールドについてのデータを予測する。別の実施形態に関係する別の例では、データマッピングコンポーネント304は、異種データ314に記憶された他の産業データに関連付けられた異なるデータ要素、単語、及び/又は句に関連付けられた特定の意図に基づいて、産業データに関連付けられた第1のデータフィールドについてのデータを予測する。1つ以上の実施形態では、データマッピングコンポーネント304は、階層データフォーマットに基づいて異種データ314に関連付けられたデータタイプを識別及び/又はグループ化する。1つ以上の実施形態では、データマッピングコンポーネント304は、バッチ処理、データ列の連結、データタイプの識別、データのマージ、データの読み取り、及び/又はデータの書き込みを使用して異種データ314に関連付けられたデータマッピングを容易にする。1つ以上の実施形態では、データマッピングコンポーネント304は、1つ以上の定義された文字(例えば、特殊文字)を削除するための特徴処理、1つ以上の文字列をトークン化するための特徴処理、1つ以上の定義された単語(例えば、1つ以上のストップワード)を削除するための特徴処理、1つ以上の単一文字トークンを削除するための特徴処理、及び/又は異種データ314に関する他の特徴処理を行う。1つ以上の実施形態では、データマッピングコンポーネント304は、データの対応する特徴に基づいて異種データ314からのデータをグループ化する。1つ以上の実施形態では、データマッピングコンポーネント304は、データの対応する識別子(例えば、一致する部品商品ファミリ)に基づいて、異種データ314からのデータをグループ化する。1つ以上の実施形態では、データマッピングコンポーネント304は、1つ以上の局所性鋭敏型ハッシュ技法を使用して、異種データ314内の異なるデータ間の類似性スコア及び/又は計算された距離に基づいて異種データ314からのデータをグループ化する。
1つ以上の実施形態では、データマッピングコンポーネント304は、オントロジーツリー構造に基づいて異種データ314のフォーマットされたバージョンを整理する。例えば、1つ以上の実施形態では、データマッピングコンポーネント304は、階層データフォーマット技術を使用して、オントロジーツリー構造において異種データ314のフォーマットされたバージョンを整理する。実施形態では、オントロジーツリー構造は、異種データ314内の異なるデータ間のノード及び接続の階層に基づいて、異種データ314内での異なるデータ間の関係を捉える。実施形態では、オントロジーツリー構造のノードはデータ要素に対応し、オントロジーツリー構造の接続は、オントロジーツリー構造のノード(例えば、データ要素)間の関係を表す。1つ以上の実施形態では、データマッピングコンポーネント304は、オントロジーツリー構造をトラバースして、異種データ314の態様の関連付けをトラバースする。1つ以上の実施形態では、データマッピングコンポーネント304は、オントロジーツリー構造に基づいて、1つ以上のデータソース316の異なるデータソース及び/又は1つ以上のデータソース316の異なるデータソースからのデータを比較する。
1つ以上の実施形態では、データマッピングコンポーネント304は、異種データ314のフォーマット構造に関連付けられた1つ以上の特徴を生成する。例えば、1つ以上の実施形態では、データマッピングコンポーネント304は、フォーマット構造についての1つ以上の定義されたフォーマットに関連付けられた1つ以上の特徴を生成する。フォーマット構造は、例えば、異種データ314についてのターゲットフォーマット構造である。1つ以上の実施形態では、フォーマット構造は、データレイク318の1つ以上の部分についてのフォーマット構造である。実施形態では、1つ以上の特徴は、フォーマット構造についての1つ以上のデータフィールド特徴を含む。例えば、実施形態では、1つ以上の特徴は、フォーマット構造についての1つ以上の列名特徴を含む。追加的又は代替的に、実施形態では、1つ以上の特徴は、フォーマット構造についての1つ以上の列値特徴を含む。しかしながら、1つ以上の特徴は、追加的又は代替的に、フォーマット構造に関連付けられた1つ以上の他のタイプの特徴を含むことができることを諒解されたい。特定の実施形態では、データマッピングコンポーネント304によって生成された1つ以上の特徴は、フォーマット構造に関連付けられた列名についての1つ以上のテキスト埋め込みを含む。例えば、特定の実施形態では、データマッピングコンポーネント304によって生成された1つ以上の特徴は、異種データ314の1つ以上の部分についてのソース列名及び/又はターゲット列名に関連付けられた列名についての1つ以上のテキスト埋め込みを含む。追加的又は代替的に、特定の実施形態では、データマッピングコンポーネント304によって生成される1つ以上の特徴は、フォーマット構造に関連付けられた列値についての1つ以上のテキスト埋め込みを含む。特定の実施形態では、データマッピングコンポーネント304は、列名及び/又は列値に関連付けられた1つ以上のテキスト埋め込みの1つ以上のベクトル表現を学習する。
データマッピングコンポーネント304は、1つ以上の特徴生成技法に基づいて、異種データ314のフォーマット構造に関連付けられた1つ以上の特徴を生成する。実施形態では、データマッピングコンポーネント304は、自然言語処理に関連付けられたTF-IDF及び/又はNグラム特徴に基づいてトレーニングされた分類器に基づいて、異種データ314についてのフォーマット構造に関連付けられた1つ以上の特徴を生成し、異種データ314のそれぞれの部分は、行列によって表される数値フォーマットに変換される。別の実施形態では、データマッピングコンポーネント304は、文章埋め込みが異種データ314の1つ以上の部分の単語ベクトル平均化を使用して計算を行うSIFに基づいて、異種データ314のフォーマット構造に関連付けられた1つ以上の特徴を生成する。別の実施形態では、データマッピングコンポーネント304は、異種データ314の1つ以上の部分を次元ベクトルに符号化するユニバーサルセンテンスエンコーダに基づいて、異種データ314についてのフォーマット構造に関連付けられた1つ以上の特徴を生成して、異種データ314の1つ以上の部分に関連付けられたテキスト分類及び/又は他の自然言語処理を容易にする。別の実施形態では、データマッピングコンポーネント304は、分類タスクに関連付けられたトークンを使用して異種データ314の1つ以上の部分に関連付けられたテキスト分類及び/又は他の自然言語処理を容易にするBERT埋め込み技法に基づいて異種データ314についてのフォーマット構造に関連付けられた1つ以上の特徴を生成する。追加的又は代替的に、データマッピングコンポーネント304は、自然言語処理に関連付けられた学習済み単語埋め込み及び/又はテキスト分類のライブラリに基づいて、異種データ314のフォーマット構造に関連付けられた1つ以上の特徴を生成する。特定の実施形態では、データマッピングコンポーネント304は、1つ以上のテンプレートに関連付けられた語彙グラウンドトゥルースデータに基づいて1つ以上の特徴を生成する。例えば、1つ以上の実施形態では、データマッピングコンポーネント304は、履歴異種データに関連付けられた1つ以上のテンプレートに基づいて、フォーマット構造についての語彙グラウンドトゥルースデータを生成する。更に、履歴異種データに関連付けられた語彙グラウンドトゥルースデータに基づいて、データマッピングコンポーネント304は、1つ以上の特徴を生成する。
1つ以上の実施形態では、データマッピングコンポーネント304は、1つ以上の特徴に基づいて、異種データ314のそれぞれの部分をマッピングして、フォーマットされたバージョンの異種データ314を提供する。実施形態では、データマッピングコンポーネント304は、フォーマット構造の列名に関連付けられた1つ以上のテキスト埋め込みに基づいて、異種データ314のそれぞれの部分をマッピングする。更に、1つ以上の実施形態では、データマッピングコンポーネント304は、フォーマット構造の列名に関連付けられた決定木分類に基づいて異種データ314のそれぞれの部分をマッピングする。特定の実施形態では、データマッピングコンポーネント304は、1つ以上のソース列名と1つ以上の定義されたターゲット列名との間の1つ以上の類似性スコアを計算して、異種データ314のそれぞれの部分のマッピングを容易にして、異種データ314のフォーマットされたバージョンを提供する。特定の実施形態では、データマッピングコンポーネント304は、ニューラルネットワークに関連付けられたトランスフォーマエンコーダ層のセットに基づいて異種データ314のそれぞれの部分をマッピングする。追加的又は代替的に、特定の実施形態では、データマッピングコンポーネント304は、ニューラルネットワークに関連付けられたテキスト分類子に基づいて異種データ314のそれぞれの部分をマッピングする。
特定の実施形態では、データマッピングコンポーネント304は、1つ以上の列値を使用してソース列名をターゲット列名にマッピングする。例えば、特定の実施形態では、データマッピングコンポーネント304は、ソース列の列値のリストを使用して、異種データの1つ以上の部分についてのターゲット列マッピングを予測する。一例では、データマッピングコンポーネント304は、「280460-HSPL-3493664-280460」のソース列値を使用して、ソース列名「kunnr」をターゲット列名「sold_to_customer_number」にマッピングする。別の例では、データマッピングコンポーネント304は、「MMS-AUTOMATIC DETECTION」のソース列値を使用して、ソース列名「prctr」をターゲット列名「profit_center_name」にマッピングする。別の例では、データマッピングコンポーネント304は、「ZMPN00000000019156」のソース列値を使用して、ソース列名「matx」をターゲット列名「material_number」にマッピングする。別の例では、データマッピングコンポーネント304は、「30303」のソース列値を使用して、ソース列名「kunplz」をターゲット列名「sold_to_zip_code」にマッピングする。
実施形態では、人工知能コンポーネント306は、異種データ314のフォーマットされたバージョンに関してディープラーニングプロセスを実行する。例えば、1つ以上の実施形態では、人工知能コンポーネント306は、異種データ314のフォーマットされたバージョンに関してディープラーニングプロセスを実行して、異種データ314に関連付けられた1つ以上の分類、1つ以上の推論、及び/又は1つ以上のインサイトを決定する。特定の実施形態では、人工知能コンポーネント306によって実行されるディープラーニングプロセスは、回帰分析を使用して、異種データ314に関連する1つ以上のインサイトを決定する。特定の実施形態では、人工知能コンポーネント306によって実行されるディープラーニングプロセスは、クラスタリング技術を使用して、異種データ314に関連付けられた1つ以上のインサイトを決定する。1つ以上の実施形態では、人工知能コンポーネント306は、ディープラーニングプロセスを実行して、異種データ314に関連付けられた1つ以上のカテゴリ及び/又は1つ以上のパターンを決定する。1つ以上の実施形態では、人工知能コンポーネント306は、回帰型ニューラルネットワークを使用して、異種データ314をオントロジーツリー構造の多次元単語埋め込みにマッピングする。実施形態では、単語埋め込みは、オントロジーツリー構造のノードに対応する。1つ以上の実施形態では、人工知能コンポーネント306は、回帰型ニューラルネットワークのゲート付き回帰型ユニットのネットワークを使用して、異種データ314に関連付けられた1つ以上の分類、1つ以上の推論、及び/又は1つ以上のインサイトを提供する。
1つ以上の実施形態では、データ最適化コンピュータシステム302(例えば、データ最適化コンピュータシステム302のアクションコンポーネント308)は、要求320を受信する。実施形態では、要求320は、異種データ314に関する1つ以上のインサイトを取得する要求である。1つ以上の実施形態では、要求320は、1つ以上のインサイトの目標を記述するインサイト記述子を含む。1つ以上の実施形態では、目標は、異種データ114に関連付けられた所望のデータ分析結果及び/又はターゲットである。実施形態では、インサイト記述子は、1つ以上のインサイトの目標を記述する単語又は句である。別の実施形態では、インサイト記述子は、1つ以上のインサイトの目標を記述する識別子である。更に別の実施形態では、インサイト記述子は、1つ以上のインサイトの目標を記述する主題である。しかしながら、特定の実施形態では、インサイト記述子は、1つ以上のインサイトの目標を記述する別のタイプの記述子であることを諒解されたい。1つ以上の実施形態では、目標は、未分類支出目標、支払期間最適化目標、代替サプライヤ推奨目標、及び/又は別のインサイト目標である。様々な実施形態では、要求320は、コンピューティングデバイスの電子インターフェースによって生成される。例示的な実施形態では、要求320は、異種データ314に関連付けられた1つ以上の資産及び/又はサービスについての未分類支出に関する1つ以上のインサイトを取得する要求を含む。加えて、1つ以上の実施形態では、人工知能コンポーネント306は、ディープラーニングプロセスを実行して、1つ以上の資産及び/又はサービスに関係する未分類の支出についての1つ以上のインサイトを提供する。別の例示的な実施形態では、要求320は、異種データ314に関連付けられた1つ以上の資産及び/又はサービスについての支払期間最適化に関する1つ以上のインサイトを取得する要求を含む。更に、1つ以上の実施形態では、人工知能コンポーネント306は、ディープラーニングプロセスを実行して、1つ以上の資産及び/又はサービスに関係する支払期間最適化のための1つ以上のインサイトを提供する。別の例示的な実施形態では、要求320は、異種データ314に関連付けられた1つ以上の資産及び/又はサービスに関する代替サプライヤに関する1つ以上のインサイトを取得する要求を含む。更に、1つ以上の実施形態では、人工知能コンポーネント306は、ディープラーニングプロセスを実行して、1つ以上の資産及び/又はサービスに関係する代替サプライヤに1つ以上のインサイトを提供する。
1つ以上の実施形態では、要求320に応答して、アクションコンポーネント308は、1つ以上のインサイトを提供するように、異種データ314のフォーマットされたバージョンの態様を関連付ける。一態様では、アクションコンポーネント308は、目標、及び/又は異種データ314のフォーマットされたバージョンの態様間の関係に基づいて、異種データ314のフォーマットされたバージョンの関連付けられた態様を決定する。加えて、1つ以上の実施形態では、アクションコンポーネント308は、1つ以上のインサイトに基づいて1つ以上のアクションを実行する。例えば、1つ以上の実施形態では、アクションコンポーネント308は、1つ以上のアクションに関連付けられたアクションデータ322を生成する。1つ以上の実施形態では、アクションコンポーネント308は、ディープラーニングプロセスの反復履歴及び/又は以前のアクションからの異なるメトリックに基づくスコアリングモデルを追加的に使用して、1つ以上のアクションを決定する。例えば、1つ以上の実施形態では、スコアリングモデルは、異なるメトリック、異なる条件、及び/又は異なる規則についての重みを使用する。1つ以上の実施形態では、アクションコンポーネント308は、位置データ(例えば、地理的領域例外)を追加的に使用して、地理的位置に関連付けられた1つ以上の規則に基づいて推奨を修正し、かつ/又は偽陽性推奨を削除する。1つ以上の実施形態では、アクションコンポーネント308は契約データを追加的に使用して、1つ以上の契約条件に基づいて推奨を修正し、かつ/又は偽陽性推奨を削除する。1つ以上の実施形態では、アクションコンポーネント308は、1つ以上の資産及び/又はサービスに関係するコストメトリック(例えば、単位コスト)を追加的に使用して、1つ以上の資産及び/又はサービスについて推奨を修正し、かつ/又は偽陽性推奨を削除する。1つ以上の実施形態では、アクションコンポーネント308は、1つ以上の資産及び/又はサービスに関するリスクメトリクス(例えば、サプライヤリスクメトリクス)を追加的に使用して、1つ以上の資産及び/又はサービスについて推奨を修正し、かつ/又は偽陽性推奨を削除する。非限定的な例では、アクションコンポーネント308は、異種データ314の異なる部分における部品番号間の一致に基づいて、資産及び/又はサービスの代替サプライヤが利用可能であると決定する。別の非限定的な例では、アクションコンポーネント308は、異種データ314の異なる部分における部品記述間の一致に基づいて、資産及び/又はサービスの代替サプライヤが利用可能であると決定する。
実施形態では、1つ以上のアクションからのあるアクションは、1つ以上のインサイトの視覚表現をレンダリングするユーザ対話型電子インターフェースを生成することを含む。別の実施形態では、1つ以上のアクションからのあるアクションは、コンピューティングデバイスに、1つ以上のインサイトに関連付けられた1つ以上の通知を送信することを含む。別の実施形態では、1つ以上のアクションからのあるアクションは、1つ以上のインサイトに基づいて回帰型ニューラルネットワークの1つ以上の部分を再トレーニングすることを含む。別の実施形態では、1つ以上のアクションからのあるアクションは、1つ以上のインサイトに関連付けられた1つ以上の特徴を決定すること、及び/又は1つ以上のインサイトに関連付けられた1つ以上の特徴に基づいて、異種データ314に関連付けられた資産についての条件を予測することを含む。別の実施形態では、1つ以上のアクションからのあるアクションは、1つ以上のインサイトに基づいて、異種データ314に関連付けられた資産についての出荷条件を予測することを含む。別の実施形態では、1つ以上のアクションからのあるアクションは、1つ以上のインサイトに基づいて、異種データ314に関連付けられた部品商品ファミリの総支出を決定することを含む。別の実施形態では、1つ以上のアクションからのあるアクションは、1つ以上のインサイトに基づいて、異種データ314に関連付けられた資産又はサービスに関係する契約についての1つ以上の条件を決定することを含む。別の実施形態では、1つ以上のアクションからのあるアクションは、1つ以上のインサイトに基づいて、異種データ314に関連付けられた資産又はサービスに関係する売買契約についての1つ以上の条件を決定することを含む。別の実施形態では、1つ以上のアクションからのあるアクションは、1つ以上のインサイトに基づいて、異種データ314に関連付けられた資産又はサービスに関係する支払期間を最適化することを含む。別の実施形態では、1つ以上のアクションからのあるアクションは、1つ以上のインサイトに基づいて、異種データ314に関連付けられた資産又はサービスに関係する支出の分布を決定することを含む。別の実施形態では、1つ以上のアクションからのあるアクションは、1つ以上のインサイトに基づいて、異種データ314に関連付けられた資産又はサービスの代替サプライヤを決定することを含む。別の実施形態では、1つ以上のアクションからのあるアクションは、1つ以上のインサイトに基づいて、異種データ314に関連付けられた資産又はサービスに関係するサプライヤ推奨を決定することを含む。別の実施形態では、1つ以上のアクションからのあるアクションは、1つ以上のインサイトに基づいて、異種データ314に関連付けられた所与のシナリオが成功する可能性を決定することを含む。別の実施形態では、1つ以上のアクションからのあるアクションは、異種データ314に関連付けられた資産についての最適なプロセス条件を提供することを含む。例えば、別の実施形態では、1つ以上のアクションからのあるアクションは、異種データ314に関連付けられた資産についての設定点及び/又はスケジュールを調整することを含む。別の実施形態では、1つ以上のアクションからのあるアクションは、異種データ314に関連付けられた資産に対して取るべき1つ以上の是正アクションを含む。別の実施形態では、1つ以上のアクションからのあるアクションは、異種データ314に関連付けられた資産についての最適な保全オプションを提供することを含む。別の実施形態では、1つ以上のアクションからのあるアクションは、アプリケーションサービス層225、アプリケーション層230、及び/又はコアサービス層235に関連付けられたアクションを含む。特定の実施形態では、データマッピングコンポーネント304は、1つ以上のインサイトに関連付けられた品質スコアに基づいて1つ以上の特徴を更新する。追加的又は代替的に、特定の実施形態では、データマッピングコンポーネント304は、1つ以上のインサイトに関連付けられたユーザフィードバックデータに基づいて1つ以上の特徴を更新する。
図4は、本開示の1つ以上の実施形態の1つ以上の記載された特徴による例示的な環境を提供するシステム300’を示す。実施形態では、システム300’は、図3に示すシステム300の代替実施形態に対応する。実施形態によれば、システム300’は、データ最適化コンピュータシステム302、1つ以上のデータソース316、データレイク318、及び/又はコンピューティングデバイス402を含む。1つ以上の実施形態では、データ最適化コンピュータシステム302は、ネットワーク110を介して1つ以上のデータソース316及び/又はコンピューティングデバイス402と通信する。コンピューティングデバイス402は、モバイルコンピューティングデバイス、スマートフォン、タブレットコンピュータ、モバイルコンピュータ、デスクトップコンピュータ、ラップトップコンピュータ、ワークステーションコンピュータ、ウェアラブルデバイス、仮想現実デバイス、拡張現実デバイス、又はデータ最適化コンピュータシステム302から遠隔に位置する別のタイプのコンピューティングデバイスである。
1つ以上の実施形態では、アクションコンポーネント308は、アクションデータ322をコンピューティングデバイス402に通信する。例えば、1つ以上の実施形態では、アクションデータ322は、1つ以上のインサイトの視覚表現をレンダリングするコンピューティングデバイス402の視覚ディスプレイ(例えば、ユーザ対話型電子インターフェース)についての1つ以上の視覚要素を含む。特定の実施形態では、コンピューティングデバイス402の視覚ディスプレイは、アクションデータ322に関連付けられた1つ以上のグラフィカル要素(例えば、1つ以上のインサイト)を表示する。特定の実施形態では、コンピューティングデバイス402の視覚ディスプレイは、グラフィカルユーザインターフェースを提供して、異種データ314に関連付けられた1つ以上の資産に関連付けられたデータ使用、異種データ314に関連付けられた1つ以上の資産に関連付けられたコスト、異種データ314に関連付けられた1つ以上の資産に関連付けられた資産計画、異種データ314に関連付けられた1つ以上の資産に関連付けられた資産サービス、異種データ314に関連付けられた1つ以上の資産に関連付けられた資産運用、及び/又は異種データ314に関連付けられた1つ以上の資産の1つ以上の他の態様を管理することを容易にする。特定の実施形態では、コンピューティングデバイス402の視覚ディスプレイは、グラフィカルユーザインターフェースを提供して、異種データ314に関連付けられた1つ以上の資産についての出荷条件を予測することを容易にする。特定の実施形態では、コンピューティングデバイス402の視覚ディスプレイは、異種データ314に関連付けられた1つ以上の資産の総支出を予測することを容易にする。別の例では、1つ以上の実施形態では、アクションデータ322は、1つ以上のインサイトに関連付けられた1つ以上の通知を含む。1つ以上の実施形態では、アクションデータ322は、コンピューティングデバイス402に関連付けられたユーザが、1つ以上のインサイトに関して決定を下すこと、及び/又は1つ以上のアクションを実行することを可能にする。
図5は、本開示の1つ以上の実施形態によるシステム500を示す。システム500は、コンピューティングデバイス402を含む。1つ以上の実施形態では、コンピューティングデバイス402は、モバイルコンピューティング、拡張現実、クラウドベースコンピューティング、IoT技術及び/又は1つ以上の他の技術を使用して、ビデオ、オーディオ、リアルタイムデータ、グラフィカルデータ、1つ以上の通信、1つ以上のメッセージ、1つ以上の通知、1つ以上の文書、1つ以上の作業手順、産業資産タグ詳細、及び/又は1つ以上のインサイトに関連付けられた他のメディアデータを提供する。コンピューティングデバイス402は、異種データ314に関連付けられた1つ以上のインサイトを取得することを容易にするための機械的コンポーネント、電気的コンポーネント、ハードウェアコンポーネント、及び/又はソフトウェアコンポーネントを含む。図5に示される実施形態では、コンピューティングデバイス402は、視覚ディスプレイ504、1つ以上のスピーカ506、1つ以上のカメラ508、1つ以上のマイクロフォン510、全地球測位システム(global positioning system、GPS)デバイス512、ジャイロスコープ514、1つ以上の無線通信デバイス516、及び/又は電源518を含む。
実施形態では、視覚ディスプレイ504は、アクションデータ322の1つ以上の部分の提示及び/又は対話を容易にするディスプレイである。1つ以上の実施形態では、コンピューティングデバイス402は、データ分析プラットフォームに関連付けられた電子インターフェース(例えば、グラフィカルユーザインターフェース)を表示する。1つ以上の実施形態では、視覚ディスプレイ504は、ピクセルのセットを介して1つ以上の対話型メディア要素をレンダリングする視覚ディスプレイである。1つ以上のスピーカ506は、オーディオを発する1つ以上の一体型スピーカを含む。1つ以上のカメラ508は、写真キャプチャ及び/又はリアルタイムビデオのためにオートフォーカス及び/又は画像安定化を使用する1つ以上のカメラを含む。1つ以上のマイクロフォン510は、アクティブノイズキャンセル機能を使用してオーディオデータをキャプチャする1つ以上のデジタルマイクロフォンを含む。GPSデバイス512は、コンピューティングデバイス402に地理的位置を提供する。ジャイロスコープ514は、コンピューティングデバイス402の向きを定める。1つ以上の無線通信デバイス516は、1つ以上の無線ネットワーキング技術及び/又は1つ以上の短波長無線技術を介して無線通信を行うための1つ以上のハードウェアコンポーネントを含む。電源518は、電源及び/又は充電式バッテリであり、例えば、視覚ディスプレイ504、1つ以上のスピーカ506、1つ以上のカメラ508、1つ以上のマイクロフォン510、GPSデバイス512、ジャイロスコープ514、及び/又は1つ以上の無線通信デバイス516に電力を供給する。特定の実施形態では、1つ以上のインサイトに関連付けられたデータは、視覚ディスプレイ504及び/又は1つ以上のスピーカ506を介して提示される。
図6は、本開示の1つ以上の実施形態の1つ以上の記載された特徴によるシステム600を示す。実施形態では、システム600は、未分類購入記録データ602を含む。例えば、実施形態では、未分類購入記録データ602は、1つ以上のデータソース316から取得された異種データ314の少なくとも一部に対応する。特定の実施形態では、未分類購入記録データ602は、他の未分類記録データ、未分類資産データ、未分類産業データなどのような他の未分類データに対応することを理解されたい。一例では、未分類購入記録データ602は、サプライヤ情報に関連付けられたデータフィールド604、部品(例えば、資産)情報に関連付けられたデータフィールド606、部品ファミリコード(part family code、PFC)に関連付けられたデータフィールド608、及び/又は支出に関連付けられたデータフィールド610を含む。しかしながら、特定の実施形態では、未分類購入記録データ602(例えば、未分類購入記録データのデータフィールド)は、未分類支出、支払期間最適化、代替サプライヤ推奨、及び/又は他のインサイト目標に関係する他の情報に関連付けられることを理解されたい。例えば、特定の実施形態では、データフィールド604は、追加的又は代替的に、購入注文番号、インボイス番号、サプライヤ識別子、支払期間、インボイス金額、サプライヤ階層レベル識別子、購入注文行項目、購入注文残高、購入注文期間、部品番号、製品商品ファミリ、部品記述、及び/又は他の情報に関連する1つ以上のデータフィールドを含む。実施形態では、データマッピングコンポーネント304は、未分類購入記録データ602を集約して、集約総支出データを生成する。例えば、実施形態では、データマッピングコンポーネント304は、サプライヤ情報に関連付けられたデータフィールド604、部品(例えば、資産)情報に関連付けられたデータフィールド606、PFCに関連付けられたデータフィールド608、及び/又は支出に関連付けられたデータフィールド610を、各サプライヤ及び各PFCの総支出に集約する。1つ以上の実施形態では、アクションコンポーネント308は、最も高い支出を有するPFCを決定する。例えば、図6に示すように、最上位の支出サプライヤS1のPFCはC01である。1つ以上の実施形態では、データマッピングコンポーネント304及び/又は人工知能コンポーネント306は、PFCをサプライヤ商品オフィスにマッピングするデータマッピングテーブル614を使用して、集約総支出データ612についての分類データ616を決定する。例えば、1つ以上の実施形態では、データマッピングテーブル614は、データフィールド(例えば、PFC)と特定の分類との間のマッピングを行って集約総支出データ612についての分類データ616を決定するように構成される。1つ以上の実施形態では、集約総支出データ612は、データのベクトル又はデータ行列としてフォーマットされ、データマッピングテーブル614は、集約総支出データ612の次元を異なるデータ次元に提供変更するように構成される。
図7は、本開示の1つ以上の実施形態の1つ以上の記載された特徴による機械学習モデル700を示す。実施形態では、機械学習モデル700は、回帰型ニューラルネットワークである。別の実施形態では、機械学習モデル700は畳み込みニューラルネットワークである。別の実施形態では、機械学習モデル700はディープラーニングネットワークである。しかしながら、特定の実施形態では、機械学習モデル700は別のタイプの人工ニューラルネットワークであることを諒解されたい。1つ以上の実施形態では、入力シーケンス702が機械学習モデル700への入力として提供される。様々な実施形態では、入力シーケンス702は、異種データ314に関連付けられたデータ要素のセットを含む。1つ以上の実施形態では、データマッピングコンポーネント304は、機械学習モデル700(例えば、回帰型ニューラルネットワーク)を使用して、入力シーケンス702を多次元単語埋め込み704にマッピングする。例えば、1つ以上の実施形態では、入力シーケンス702のそれぞれの部分は、それぞれの多次元単語埋め込み704に変換される。1つ以上の実施形態では、入力シーケンス702に関連付けられたそれぞれの単語は、多次元単語埋め込み704に関連付けられたそれぞれのベクトルにマッピングされる。実施形態では、多次元単語埋め込み704のうちのある多次元単語埋め込みは、例えば自然言語処理などの1つ以上のディープラーニングプロセスを容易にするためのデータのベクトル又はデータの行列である。1つ以上の実施形態では、人工知能コンポーネント306は、多次元単語埋め込み704をゲート付き回帰型ユニット706のネットワークに提供する。実施形態では、ゲート付き回帰型ユニット706のネットワークからのゲート付き回帰型ユニット(gated-recurrent unit、GRU)は、ゲート付き回帰型ユニットの出力として通過するデータを決定する更新ゲート及び/又はリセットゲートを有するゲート機構である。例えば、実施形態では、更新ゲートは、ゲート付き回帰型ユニット706のネットワークに沿って転送されるデータの量(例えば、どれだけの前のデータが、ゲート付き回帰型ユニット706のネットワークの前の状態からゲート付き回帰型ユニット706のネットワークの次の状態に提供されるか)を決定し、リセットゲートは、ゲート付き回帰型ユニット706のネットワークに沿って転送されるのを保留されるデータの量(例えば、どれだけの前のデータがゲート付き回帰型ユニット706のネットワークの次の状態から保留されるか)を決定する。1つ以上の実施形態では、ゲート付き回帰型ユニット706のネットワークからの出力データは、ゲート付き回帰型ユニット706のネットワークのそれぞれのゲート付き回帰型ユニットからのデータを組み合わせる連結プロセスを受ける。特定の実施形態では、ゲート付き回帰型ユニット706のネットワークの連結出力708は、ゲート付き回帰型ユニット706のネットワークの連結出力の次元数を変更する第1の密結合層710(例えば、密結合層32)及び/又は密結合層712(例えば、密結合層16)によって処理される。更に、ゲート付き回帰型ユニットのネットワーク706、密結合層710、及び/又は密結合層716の連結出力に基づいて、機械学習モデル700は予測714を提供する。1つ以上の実施形態では、予測714は、入力シーケンス702に関する(例えば、異種データ314に関連付けられたデータ要素のセットに関する)1つ以上のインサイトに関係する。例えば、1つ以上の実施形態では、予測714は、入力シーケンス702に関する(例えば、異種データ314に関連付けられたデータ要素のセットに関する)1つ以上の分類を含む。実施形態では、入力シーケンス702は、データのそれぞれのベクトルに関連付けられたそれぞれの多次元単語埋め込み704に変換される、異種データ314からの1つ以上の単語を含む。ゲート付き回帰型ユニット706のネットワークからのそれぞれのGRUは、それぞれの多次元単語埋め込み704を処理して、ゲート付き回帰型ユニット706のネットワークからのそれぞれのGRUからの出力を組み合わせた連結出力708を提供する。特定の実施形態では、連結出力708の次元が、第1の密結合層710及び/又は密結合層712を介して変更され、異種データ314からの1つ以上の単語に対する予測された分類(例えば、予測714)が提供される。
図8は、本開示の1つ以上の実施形態によるシステム800を示す。システム800は、例えば、マッピングモデルアーキテクチャを提供する。更に、システム800は、データマッピングコンポーネント304に関係する1つ以上の実施形態を示す。1つ以上の実施形態では、異種データ314は、列名モデル処理802及び/又は列値モデル処理804によって処理される。列名モデル処理802を用いて、異種データ314の1つ以上の部分のフォーマット構造に関連付けられた1つ以上の列名特徴、分類、及び/又はマッピング推奨を提供する。実施形態では、列名モデル処理802は、特徴生成806を含む。特徴生成806は、異種データ314についての1つ以上の列名特徴を生成する。例えば、特徴生成806は、列名に基づく特徴生成を行って、分類モデル808についての入力データ(例えば、1つ以上の列名特徴)を提供する。特定の実施形態では、特徴生成806は、TF-IDF技法、SIF技法、ユニバーサルセンテンスエンコーダ技法、BERT埋め込み技法、及び/又は別の特徴生成技法に基づいて、異種データ314の1つ以上の列名特徴を生成する。特定の実施形態では、特徴生成806は、自然言語処理に関連付けられた学習された単語埋め込み及び/又はテキスト分類のライブラリに基づいて、異種データ314についての1つ以上の列名特徴を生成する。分類モデル808は、例えば、トレーニングされた分類モデルであり、異種データ314及び/又は異種データ314の1つ以上の列名特徴に関連付けられた1つ以上の推論を提供する。実施形態では、分類モデル808はツリーベースの分類モデルである。例えば、1つ以上の実施形態では、分類モデル808は、階層的分類モデルであり、データセットカテゴリを予測することに関連付けられた第1のレベルと、予測されたデータセットカテゴリを特徴として使用して対応する列名を予測することに関連付けられた第2のレベルとを少なくとも含む。更に、実施形態では、分類モデル808は、1つ以上のマッピング推奨810の少なくとも一部を生成する。特定の実施形態では、列名モデル処理802は、分類モデル808をトレーニングするトレーニング812を含む。1つ以上の実施形態では、トレーニング812は、トレーニングデータ814に基づいて生成された1つ以上の列名特徴を使用して分類モデル808をトレーニングする。トレーニングデータ814は、例えば、履歴列名特徴に関連付けられた1つ以上のテンプレートに基づいて生成されるフォーマット構造についての語彙グラウンドトゥルースデータを含む。特定の実施形態では、トレーニングデータ814は、列名特徴に関連付けられた所定のターゲットデータを含む。
列値モデル処理804を用いて、追加的又は代替的に、異種データ314の1つ以上の部分のフォーマット構造に関連付けられた1つ以上の列値特徴、分類、及び/又はマッピング推奨を提供する。実施形態では、列値モデル処理804は、特徴生成816を含む。特徴生成816は、異種データ314についての1つ以上の列値特徴を生成する。例えば、特徴生成816は、列値に基づく特徴生成を行って、分類モデル818についての入力データ(例えば、1つ以上の列値特徴)を提供する。分類モデル818は、例えば、トレーニングされた分類モデルであり、異種データ314及び/又は異種データ314についての1つ以上の列値特徴に関連付けられた1つ以上の推論を提供する。実施形態では、分類モデル818は、トランスフォーマベースの分類モデルである。例えば、1つ以上の実施形態では、分類モデル818は、ニューラルネットワークであり、トランスフォーマエンコーダ層のセット、隠れ層のセット、注意層のセット、及び/又は密結合層を含む。更に、実施形態では、分類モデル818は、1つ以上のマッピング推奨810の少なくとも一部を生成する。例えば、実施形態では、分類モデル818は、異種データ314に関連付けられた列値のセットに基づいて、予測されたターゲット列マッピングを提供する。特定の実施形態では、列値モデル処理804は、分類モデル818をトレーニングするトレーニング820を含む。1つ以上の実施形態では、トレーニング820は、トレーニングデータ822に基づいて生成された1つ以上の列値特徴を使用して分類モデル818をトレーニングする。トレーニングデータ822は、例えば、履歴列値特徴に関連付けられた1つ以上のテンプレートに基づいて生成されるフォーマット構造の語彙グラウンドトゥルースデータを含む。特定の実施形態では、1つ以上のマッピング推奨810は、それぞれの信頼スコアに基づいてランク付けされ、上位N個のマッピング推奨を提供する。特定の実施形態では、1つ以上のマッピング推奨810は、マッピング推奨の確率分布に関連付けられる。特定の実施形態では、1つ以上のマッピング推奨810は、データ最適化コンピュータシステム302によって、及び/又はコンピューティングデバイス402に関連付けられたユーザフィードバックを介して、受け入れられる。特定の実施形態では、分類モデル808及び/又は分類モデル818は、1つ以上のマッピング推奨810に基づいて再トレーニングされる。例えば、特定の実施形態では、分類モデル808/又は分類モデル818は、データ最適化コンピュータシステム302によって受け入れられている1つ以上のマッピング推奨810に基づいて再トレーニングされる。追加的又は代替的に、特定の実施形態では、分類モデル808及び/又は分類モデル818は、コンピューティングデバイス402に関連付けられたユーザフィードバックに基づいて再トレーニングされる。
図9は、本開示の1つ以上の実施形態によるシステム900を示す。システム900は、例えば、マッピングモデルアーキテクチャを提供する。1つ以上の実施形態では、システム900は、分類モデル808に関係する列名モデルアーキテクチャを提供する。更に、システム900は、データマッピングコンポーネント304に関係する1つ以上の実施形態を示す。システム900は、グラウンドトゥルースモデル902、教師ありモデル904、テキスト類似性教師ありモード906、及び/又は特徴類似性教師なしモデル908を含む。1つ以上の実施形態では、ソーステンプレート910及び/又はターゲットテンプレート912が、グラウンドトゥルースモデル902への入力として提供される。ソーステンプレート910は、例えば、1つ以上のデータソース316に関連付けられた異種データ314の1つ以上の部分についてのソースフォーマット構造のテンプレートである。ターゲットテンプレート912は、例えば、異種データ314の1つ以上の部分をデータレイク318に記憶するためのターゲットフォーマット構造についてのテンプレートである。例えば、1つ以上の実施形態では、ソーステンプレート910はソース列名のセットに関連付けられ、ターゲットテンプレート912はターゲット列名のセットに関連付けられる。特定の実施形態では、ソースデータ914及び/又はターゲットデータ916は、追加的又は代替的に、グラウンドトゥルースモデル902への入力として提供される。例えば、実施形態では、ソースデータ914は、ソーステンプレート910に記憶されたソースデータであり、ターゲットデータ916は、ターゲットテンプレート912に記憶された履歴ターゲットデータである。1つ以上の実施形態では、異種データ314の1つ以上の部分は、ソースデータ914に対応する。
1つ以上の実施形態では、グラウンドトゥルースモデル902は、ソーステンプレート910、ターゲットテンプレート912、ソースデータ914、及び/又はターゲットデータ916を使用して、フォーマット構造に関係するデータフィールドマッピングについての語彙(例えば、語彙グラウンドトゥルースデータ)及び/又は特徴(例えば、特徴グラウンドトゥルースデータ)を生成する。1つ以上の実施形態では、教師ありモデル904を用いて、特定の信頼閾値を満たさない1つ以上のデータフィールドマッピングについてのマッピングを予測する。例えば、1つ以上の実施形態では、教師ありモデル904は、ターゲットフォーマット構造についてのターゲットデータフィールドのソースフォーマット構造についてのソースデータフィールドへのマッピングを予測する。特定の実施形態では、教師ありモデル904は、ターゲットデータ916の少なくとも一部に基づいて再トレーニングされる。特定の実施形態では、ターゲットデータ916の少なくとも一部は、コンピューティングデバイス402を介して提供される。
1つ以上の実施形態では、テキスト類似性教師ありモデル906を用いて、特定の信頼閾値を満たさない1つ以上のデータフィールドマッピングについてのマッピングを予測する。例えば、特定の実施形態では、テキスト類似性教師ありモデル906を用いて、教師ありモデルによる処理に続いて、特定の信頼閾値を満たさない1つ以上のデータフィールドマッピングについてのマッピングを予測する。1つ以上の実施形態では、テキスト類似性教師ありモデル906は、ターゲットフォーマット構造及びソースフォーマット構造のデータフィールド名及び/又はデータフィールド記述間のテキスト類似性を決定する。例示的な実施形態では、ターゲットデータフィールド名は「BRGEW」であり、データフィールド記述は「重量」である。したがって、一例では、テキスト類似性教師ありモデル906は、データフィールド記述「重量」が「材料の単位重量」に対応すると決定する。別の例では、テキスト類似性教師ありモデル906は、データフィールド記述「重量」が「材料の重量」に対応すると決定する。別の例では、テキスト類似性教師ありモデル904は、データフィールド記述「重量」が特定のターゲットフォーマット構造についての「重量」データフィールド記述に対応すると決定する。
1つ以上の実施形態では、特徴類似性教師ありモデル908を用いて、特定の信頼閾値を満たさない1つ以上のデータフィールドマッピングについてのマッピングを予測する。例えば、特定の実施形態では、特徴類似性教師ありモデル908を用いて、教師ありモデル及び/又はテキスト類似性教師ありモデルによる処理に続いて、特定の信頼閾値を満たさない1つ以上のデータフィールドマッピングについてのマッピングを予測する。1つ以上の実施形態では、特徴類似性教師ありモデル908は、ソースデータ914に関係するデータ特性を分析及び/又は識別するように構成される。追加的又は代替的に、1つ以上の実施形態では、特徴類似性教師ありモデル908は、ソースデータ914とターゲットデータ916との間の特徴行列類似性を決定する。1つ以上の実施形態では、特徴類似性教師ありモデル908は、マッピング推奨918を提供する。マッピング推奨918は、例えば、1つ以上のマッピング推奨810の少なくとも一部である。実施形態では、マッピング推奨918は、ソースデータ914についての1つ以上のマッピング推奨(例えば、異種データ314の1つ以上の部分についてのマッピング推奨)を含む。別の実施形態では、マッピング推奨918は、ソースデータ914(例えば、異種データ314の1つ以上の部分)についてのフォーマット構造の予測列名データフィールドを含む。特定の実施形態では、マッピング推奨918は、ソースデータ914のフォーマットされたバージョン(例えば、異種データ314の1つ以上の部分)を提供する。特定の実施形態では、マッピング推奨918は、ソースデータ914の1つ以上の部分を、それぞれの規定の列名ラベルとして分類する。
1つ以上の実施形態では、グラウンドトゥルースモデル902は、履歴データから生成されたコンテキスト語彙をマッピングする。特定の実施形態では、履歴データは、「顧客マスタ」、「ベンダマスタ」、「材料マスタ」、「材料表」、「経路指定」、「購入情報記録」、及び/又は他のデータオブジェクトなどのデータオブジェクトに関連付けられる。1つ以上の実施形態では、グラウンドトゥルースモデル902を強化するために、有効トークン及び/又は無効トークンが、履歴マッピング情報を使用して、及び/又はトレーニングされたモデル結果を分析することによって定義される。1つ以上の実施形態では、有効トークンを使用して、フィールドについての可能な類似のマッピングを推奨する。1つ以上の実施形態では、無効トークンを使用して、同じデータ特性又は類似のデータ特性を示すモデル推奨を排除する。1つ以上の実施形態では、排除されたモデル推奨はまた、関係がないとみなされる。教師ありモデル904は、フィールド名に基づいてマッピングを実行するように構成される。1つ以上の実施形態では、教師ありモデル904は、1つ以上の自然言語処理技法を使用して、フィールド名に関連付けられた1つ以上のパターンを学習する。テキスト類似性教師ありモデル906は、フィールド記述に基づいてマッピングを実行するように構成される。1つ以上の実施形態では、テキスト類似性教師ありモデル906は、システム、データベース、及び/又はデータモデルのフィールド記述間の類似性チェックを実行する。例えば、1つ以上の実施形態では、テキスト類似性教師ありモデル906を用いて、システム、データベース、及び/又はデータモデルのフィールド記述間のマッピング類似性を識別する。特定の実施形態では、テキスト類似性教師ありモデル906は、2つ以上のテキスト類似性モデルを実行して、システム、データベース、及び/又はデータモデルについてのフィールド記述間のマッピング類似性を識別する。特定の実施形態では、2つ以上のテキスト類似度モデルに関連付けられた最適な推奨が選択される。
特徴類似性教師なしモデル908は、データ特徴に基づいてマッピングを実行するように構成される。1つ以上の実施形態では、特徴類似性教師なしモデル908は、データを分析して、システム、データベース、及び/又はデータモデル間のマッピングを学習する。1つ以上の実施形態では、特徴類似性教師なしモデル908は、1つ以上の類似性アルゴリズムを使用して、データに関連付けられた特徴を比較する。1つ以上の実施形態では、特徴類似性教師なしモデル908は、数値特徴、文字特徴、日付特徴、及び/又は別のデータタイプなどのデータタイプに基づいて特徴を分離する。数値特徴の例としては、平均値、中央値、標準偏差、歪度、及び/又は別の数値特徴が挙げられるが、これらに限定されない。文字特徴の例は、空白、数字、文字、括弧、特殊文字、及び/又は他の特徴に基づく統計を含む。1つ以上の実施形態では、特徴類似性教師なしモデル908は、データ内の1つ以上の特定のパターンを検索し、かつ/又はデータフィールドのうちの1つ以上についてのキーワードを識別することによって、カスタム特徴を決定する。1つ以上の実施形態では、特徴類似性教師なしモデル908は、データフィールドを一意のカテゴリにクラスタ化して、データについての探索空間のサイズを縮小する。したがって、1つ以上の実施形態では、特徴比較プロセスを実行するための時間及び/又はコンピューティングリソースの量が低減される。
実施形態では、ソーステンプレート910は、列及び/又は列名の第1のセットに関連付けられた第1の次元によって構成された第1のテンプレートフォーマットを含む第1のテンプレートである。更に、ターゲットテンプレート912は、第2のテンプレートであり、列及び/又は列名の第2のセットに関連付けられた第2の次元によって構成された第2のテンプレートフォーマットを含む。1つ以上の実施形態では、ソースデータ914は、ソーステンプレート910に記憶された資産データ(例えば、エッジデバイス161a~nに関連付けられた資産データ)を含み、ターゲットデータ916は、ターゲットテンプレート912に記憶された履歴資産データである。1つ以上の実施形態では、グラウンドトゥルースモデル902は、ソースデータ914に関連付けられた資産データ及びターゲットデータ916に関連付けられた履歴資産データについての語彙(例えば、語彙グラウンドトゥルースデータ)及び/又は特徴(例えば、特徴グラウンドトゥルースデータ)を生成する。ソースデータ914に関連付けられた資産データ及び/又はターゲットデータ916に関連付けられた履歴資産データについての語彙及び/又は特徴は、例えば、資産名、資産状態、リアルタイム資産値、ターゲット値、フィールドステータス値、重要度インジケータ、1つ以上の資産ルール、1つ以上の資産要件、テキスト埋め込みなどを含む。加えて、1つ以上の実施形態では、教師ありモデル904は、ターゲットテンプレート912についてのターゲットデータフィールドのソーステンプレート910についてのソースデータフィールドへのマッピングを予測する。1つ以上の実施形態では、テキスト類似性教師ありモデル906は、ターゲットフォーマット構造910及びソースフォーマット構造912のデータフィールド名及び/又はデータフィールド記述の間のテキスト類似性を決定する。例えば、実施形態では、テキスト類似性教師ありモデル906は、ソースフォーマット構造912内のデータフィールド記述「フィールドステータス」がターゲットフォーマット構造910内の「資産状態」に対応すると決定する。1つ以上の実施形態では、特徴類似性教師ありモデル908は、ソースデータ914に関連付けられた資産データ及び/又はターゲットデータ916に関連付けられた履歴資産データに関連するデータ特性を分析しかつ/又は識別するように構成される。1つ以上の実施形態では、マッピング推奨918は、資産データに関連付けられたソースデータ914についてのターゲットテンプレート912におけるフォーマット構造の予測列名データフィールドを提供する。
図10は、本開示の1つ以上の実施形態によるシステム1000を示す。実施形態では、システム1000は、トランスフォーマベースの分類モデルに対応する。1つ以上の実施形態では、システム1000は、分類モデル818に関係する列値モデルアーキテクチャを提供する。更に、システム1000は、データマッピングコンポーネント304に関係する1つ以上の実施形態を示す。1つ以上の実施形態では、入力データ1002は、システム1000のトランスフォーマ層1004a~nのセットに提供される。入力データ1002は、異種データ314の1つ以上の部分に対応する。1つ以上の実施形態では、入力データ1002は、例えば、異種データ314に関連付けられた1つ以上の列値を含む。1つ以上の実施形態では、トランスフォーマ層1004a~nのセットは、入力データ1002間の1つ以上の関係及び/又は1つ以上の特徴を学習する。トランスフォーマ層1004a~nのセットからのトランスフォーマ層はそれぞれ、入力データ1002間の1つ以上の関係及び/又は1つ以上の特徴を学習することを容易にするためのそれぞれの重み及び/又はそれぞれのバイアスを備える。例えば、1つ以上の実施形態では、トランスフォーマ層1004a~nのセットは、入力データ1002に含まれる文字間の1つ以上の関係及び/又は1つ以上の特徴を学習する。実施形態では、トランスフォーマ層1004aは、入力データ1002に関連付けられた第1の学習された関係及び/又は特徴に関連付けられたデータ1008を提供する。更に、トランスフォーマ層1004bは、データ1008に関連付けられた1つ以上の関係及び/又は1つ以上の特徴を学習して、第2の学習された関係及び/又は特徴に関連付けられたデータ1010を提供する。この実施形態では、トランスフォーマ層1004nはまた、1つ以上の関係及び/又は1つ以上の特徴を学習して、n個の学習された関係及び/又は特徴に関連付けられたトランスフォーマ層出力1012を提供し、ここでnは整数である。トランスフォーマ層出力1012は、分類器1006への入力として提供され、分類器1006は、トランスフォーマ層出力1012を使用してマッピング推奨1014を提供する。マッピング推奨1014は、例えば、1つ以上のマッピング推奨810の少なくとも一部である。実施形態では、マッピング推奨1014は、入力データ1002についての1つ以上のマッピング推奨(例えば、異種データ314の1つ以上の部分に対するマッピング推奨)を含む。別の実施形態では、マッピング推奨1014は、入力データ1002(例えば、異種データ314の1つ以上の部分)についてのフォーマット構造の予測列名データフィールドを含む。特定の実施形態では、マッピング推奨1014は、入力データ1002のフォーマットされたバージョン(例えば、異種データ314の1つ以上の部分)を提供する。特定の実施形態では、マッピング推奨1014は、入力データ1002の1つ以上の部分を、それぞれの規定の列名ラベルとして分類する。
図11は、本開示の1つ以上の実施形態によるシステム1100を示す。実施形態では、システム1100は、分類モデル818に関係するニューラルネットワークアーキテクチャに対応する。更に、システム1000は、データマッピングコンポーネント304に関係する1つ以上の実施形態を示す。1つ以上の実施形態では、入力列値1102は、文字レベル埋め込み1104を受ける。入力列値1102は、例えば、異種データ314の少なくとも一部に対応する。加えて、1つ以上の実施形態では、文字レベル埋め込み1104の出力は、トランスフォーマ1106に提供され、トランスフォーマ1106は、トランスフォーマ層出力を分類器1108に提供する。特定の実施形態では、トランスフォーマ1106はトランスフォーマ層1004a~nのセットに対応し、分類器は分類器1006に対応する。分類器1108は、マッピング推奨1110を提供する。マッピング推奨1110は、例えば、1つ以上のマッピング推奨810の少なくとも一部である。実施形態では、マッピング推奨1110は、入力列値1102についての1つ以上のマッピング推奨を含む。別の実施形態では、マッピング推奨1110は、入力列値1102についてのフォーマット構造の予測列名データフィールドを含む。特定の実施形態では、マッピング推奨1110は、入力列値1102のフォーマットされたバージョンを提供する。特定の実施形態では、マッピング推奨1110は、規定の列名ラベルを用いて入力列値1102を分類する。
図12は、本明細書で説明する1つ以上の実施形態による、企業パフォーマンス管理に関係する最適化を行うための方法1200を示す。方法1200は、例えば、データ最適化コンピュータシステム302に関連付けられる。例えば、1つ以上の実施形態では、方法1200は、1つ以上のプロセッサ及びメモリを有するデバイス(例えば、データ最適化コンピュータシステム302)において実行される。1つ以上の実施形態では、方法1200は、1つ以上のデータソースに関連付けられた異種データのフォーマットされたバージョンに関する1つ以上のインサイトを取得する要求を(例えば、データマッピングコンポーネント304によって)受信するブロック1202で開始し、要求は、1つ以上のインサイトの目標を記述するインサイト記述子を含む(ブロック1202)。1つ以上のインサイト取得を取得する要求は、限定はしないが、コンピューティングデバイスとの対話を容易にすること、コンピューティングデバイスの機能を拡張すること、及び/又はコンピューティングデバイスに提供されるデータの精度を改善することなど、1つ以上の技術改善をもたらす。
ブロック1204において、要求が処理されるかどうかが決定される。いいえの場合、ブロック1204が繰り返されて、要求が処理されるかどうかが決定される。はいの場合、方法1200はブロック1206に進む。要求に応答して、ブロック1206は、1つ以上のインサイトを提供するように、異種データのフォーマットされたバージョンの態様を(例えば、人工知能コンポーネント306によって)関連付け、関連付けられた態様は、目標、及び異種データのフォーマットされたバージョンの態様間の関係によって決定される。異種データのフォーマットされたバージョンの態様を関連付けることは、限定はしないが、コンピューティングデバイスの機能の拡張、及び/又はコンピューティングデバイスに提供されるデータの精度の改善など、1つ以上の技術改善をもたらす。1つ以上の実施形態では、異種データのフォーマットされたバージョンの態様を関連付けることは、1つ以上のインサイトを提供するように、異種データのフォーマットされたバージョンの態様を相関させることを含む。1つ以上の実施形態では、異種データのフォーマットされたバージョンの態様を相関させることは、機械学習モデル、グラウンドトゥルースモデル、教師ありモデル、テキスト類似性教師ありモデル、特徴類似性教師なしモデル、列名モデル処理、列値モデル処理、分類器、及び/又は別のタイプの機械学習技法に関連付けられた機械学習を使用することを含む。
方法1200はまた、1つ以上のインサイトに基づいて1つ以上のアクションを(例えば、アクションコンポーネント308によって)実行するブロック1208を含む。1つ以上のアクションを実行することは、限定はしないが、コンピューティングデバイスに様々な体験を提供すること、及び/又はコンピューティングデバイスを介して視覚的インジケータを提供することなど、1つ以上の技術改善をもたらす。1つ以上の実施形態では、1つ以上のアクションは、1つ以上のインサイトの視覚表現をレンダリングするユーザ対話型電子インターフェースを生成することを含む。1つ以上の実施形態では、1つ以上のアクションは、コンピューティングデバイスに、1つ以上のインサイトに関連付けられた1つ以上の通知を送信することを含む。1つ以上の実施形態では、1つ以上のアクションは、1つ以上のインサイトに基づいて、異種データに関連付けられた資産についての出荷条件を予測することを含む。1つ以上の実施形態では、1つ以上のアクションは、1つ以上のインサイトに基づいて、異種データに関連付けられた未分類購入記録データの部品商品ファミリを決定することを含む。1つ以上の実施形態では、1つ以上のアクションは、1つ以上のインサイトに基づいて、部品商品ファミリについての総支出を決定することを含む。
1つ以上の実施形態では、方法1200は、1つ以上のデータソースから異種データを集約することを更に含む。1つ以上のデータソースから異種データを集約することは、限定はしないが、コンピューティングデバイスの機能の拡張、及び/又はコンピューティングデバイスに提供されるデータの精度の改善など、1つ以上の技術改善をもたらす。1つ以上の実施形態では、異種データを集約することは、単一のデータレイクに異種データを記憶すること、及び/又は1つ以上の所定の間隔で単一のデータレイクのデータを更新することを含む。
1つ以上の実施形態では、方法1200は、異種データの1つ以上の部分をフォーマットすることを更に含み、フォーマットすることは、定義されたフォーマットに関連付けられた異種データのフォーマットされたバージョンを提供する。異種データの1つ以上の部分をフォーマットすることはまた、限定はしないが、コンピューティングデバイスの機能の拡張、及び/又はコンピューティングデバイスに提供されるデータの精度の改善など、1つ以上の技術改善をもたらす。1つ以上の実施形態では、方法1200は、異種データのフォーマットされたバージョンについての1つ以上のマッピング推奨を決定することを更に含む。1つ以上の実施形態では、異種データの1つ以上の部分をフォーマットすることは、1つ以上のデータソースから異種データにおける1つ以上の異なるデータフィールドを識別することを含み、異なるデータフィールドは、対応する主題を記述する。加えて、1つ以上の実施形態では、異種データの1つ以上の部分をフォーマットすることは、1つ以上のデータソースから1つ以上の不完全なデータフィールドを決定することを含み、1つ以上の不完全なデータフィールドは、識別された1つ以上の異なるデータフィールドに対応する。1つ以上の実施形態では、異種データの1つ以上の部分をフォーマットすることは、1つ以上のデータソースからの1つ以上の決定された不完全なデータフィールドが、識別された1つ以上の異なるデータフィールドに対応するという決定に従って、識別されたデータフィールドからのデータを不完全なデータフィールドに追加することを更に含む。1つ以上の実施形態では、異種データの1つ以上の部分をフォーマットすることは、異種データ内での異なるデータ間の関係を捉えるオントロジーツリー構造に基づいて異種データのフォーマットされたバージョンを整理することを含む。1つ以上の実施形態では、方法1200は、オントロジーツリー構造に基づいて異なるデータソースを比較することを更に含む。1つ以上の実施形態では、異種データのフォーマットされたバージョンの態様を関連付けることは、オントロジーツリー構造をトラバースすることを含み、トラバースすることは、異種データの態様を関連付ける。オントロジーツリー構造は、限定はしないが、コンピューティングデバイスの機能の拡張、コンピューティングデバイスに提供されるデータの精度の改善、及び/又はコンピューティングデバイスの効率の改善など、1つ以上の技術改善をもたらす。
1つ以上の実施形態では、方法1200は、異種データに関連付けられた1つ以上のインサイトを提供するように、フォーマットされたバージョンの異種データに関するディープラーニングプロセスを実行することを更に含む。1つ以上の実施形態では、ディープラーニングプロセスを実行することは、1つ以上のインサイトを提供するように、異種データのフォーマットされたバージョンに関する1つ以上の分類を決定することを含む。1つ以上の実施形態では、ディープラーニングプロセスを実行することは、回帰型ニューラルネットワークを使用して、異種データを多次元単語埋め込みにマッピングすることを含む。1つ以上の実施形態では、ディープラーニングプロセスを実行することは、回帰型ニューラルネットワークのゲート付き回帰型ユニットのネットワークを使用して、1つ以上のインサイトを提供することを含む。ディープラーニングプロセスを実行することは、限定はしないが、コンピューティングデバイスの機能の拡張、及び/又はコンピューティングデバイスに提供されるデータの精度の改善など、1つ以上の技術改善をもたらす。1つ以上の実施形態では、方法1200は、1つ以上のインサイトに基づいて回帰型ニューラルネットワークの1つ以上の部分を再トレーニングすることを更に含む。回帰型ニューラルネットワークの1つ以上の部分を再トレーニングすることは、限定はしないが、回帰型ニューラルネットワークの精度を改善することなど、1つ以上の技術改善をもたらす。1つ以上の実施形態では、方法1200は、ディープラーニングプロセスの反復履歴からの異なるメトリックに基づくスコアリングモデルを使用して、1つ以上のアクションを決定することを更に含む。スコアリングモデルを使用することは、限定はしないが、コンピューティングデバイスの機能の拡張、及び/又はコンピューティングデバイスに提供されるデータの精度の改善など、1つ以上の技術改善をもたらす。
図13は、本明細書で説明する1つ以上の実施形態による、企業パフォーマンス管理に関連する最適化を行うための方法1300を示す。方法1300は、例えば、データ最適化コンピュータシステム302に関連付けられる。例えば、1つ以上の実施形態では、方法1300は、1つ以上のプロセッサ及びメモリを有するデバイス(例えば、データ最適化コンピュータシステム302)において実行される。1つ以上の実施形態では、方法1300は、1つ以上のデータソースに関連付けられた異種データのためのフォーマット構造に関連付けられた1つ以上の特徴を(例えば、データマッピングコンポーネント304によって)生成するブロック1302から始まる。1つ以上の実施形態では、1つ以上の特徴を生成することは、フォーマット構造についての列名に関連付けられた1つ以上のテキスト埋め込みを生成することを含む。1つ以上の特徴を生成することは、限定はしないが、コンピューティングデバイスの機能の拡張、及び/又はコンピューティングデバイスに提供されるデータの精度の改善など、1つ以上の技術改善をもたらす。
ブロック1304において、1つ以上の特徴に基づいて、異種データのそれぞれの部分が(例えば、データマッピングコンポーネント304によって)マッピングされて、異種データのフォーマットされたバージョンが提供される。1つ以上の実施形態では、マッピングは、フォーマット構造についての列名に関連付けられた1つ以上のテキスト埋め込みに基づいて異種データのそれぞれの部分をマッピングすることを含む。1つ以上の実施形態では、マッピングは、追加的又は代替的に、フォーマット構造についての列名に関連付けられた決定木分類に基づいて異種データのそれぞれの部分をマッピングすることを含む。1つ以上の実施形態では、マッピングは、追加的又は代替的に、列名に関連付けられた1つ以上のテキスト埋め込みの1つ以上のベクトル表現を学習することを含む。1つ以上の実施形態では、マッピングは、追加的又は代替的に、1つ以上のソース列名と1つ以上の定義されたターゲット列名との間の1つ以上の類似性スコアを計算することを含む。1つ以上の実施形態では、マッピングは、追加的又は代替的に、フォーマット構造の列値に関連付けられた1つ以上のテキスト埋め込みを生成することを含む。1つ以上の実施形態では、マッピングは、追加的又は代替的に、ニューラルネットワークに関連付けられたトランスフォーマエンコーダ層のセットに基づいて、異種データのそれぞれの部分をマッピングすることを含む。1つ以上の実施形態では、マッピングすることは、追加的又は代替的に、ニューラルネットワークに関連付けられたテキスト分類器に基づいて異種データのそれぞれの部分をマッピングすることを含む。異種データのそれぞれの部分のマッピングは、限定はしないが、コンピューティングデバイスの機能の拡張、及び/又はコンピューティングデバイスに提供されるデータの精度の改善など、1つ以上の技術改善をもたらす。
1306において、異種データのフォーマットされたバージョンに関する1つ以上のインサイトを取得する要求が(例えば、データマッピングコンポーネント304によって)受信され、要求は、1つ以上のインサイトの目標を記述するインサイト記述子を含む(ブロック1302)。1つ以上のインサイト取得を取得する要求は、限定はしないが、コンピューティングデバイスとの対話を容易にすること、コンピューティングデバイスの機能を拡張すること、及び/又はコンピューティングデバイスに提供されるデータの精度を改善することなど、1つ以上の技術改善をもたらす。
ブロック1308において、要求が処理されるかどうかが決定される。いいえの場合、ブロック1308が繰り返されて、要求が処理されるかどうかが決定される。はいの場合、方法1300はブロック1310に進む。要求に応答して、ブロック1310は、1つ以上のインサイトを提供するように、異種データのフォーマットされたバージョンの態様を(例えば、人工知能コンポーネント306によって)関連付け、関連付けられた態様は、目標、及び異種データのフォーマットされたバージョンの態様間の関係によって決定される。異種データのフォーマットされたバージョンの態様の関連付けは、限定はしないが、コンピューティングデバイスの機能の拡張、及び/又はコンピューティングデバイスに提供されるデータの精度の改善など、1つ以上の技術改善をもたらす。1つ以上の実施形態では、異種データのフォーマットされたバージョンの態様を関連付けることは、1つ以上のインサイトを提供するように、異種データのフォーマットされたバージョンの態様を相関させることを含む。1つ以上の実施形態では、異種データのフォーマットされたバージョンの態様を相関させることは、機械学習モデル、グラウンドトゥルースモデル、教師ありモデル、テキスト類似性教師ありモデル、特徴類似性教師なしモデル、列名モデル処理、列値モデル処理、分類器、及び/又は別のタイプの機械学習技法に関連付けられた機械学習を使用することを含む。
方法1300はまた、1つ以上のインサイトに基づいて1つ以上のアクションを(例えば、アクションコンポーネント308によって)実行するブロック1312を含む。1つ以上のアクションを実行することは、限定はしないが、コンピューティングデバイスに様々な体験を提供すること、及び/又はコンピューティングデバイスを介して視覚的インジケータを提供することなど、1つ以上の技術改善をもたらす。1つ以上の実施形態では、1つ以上のアクションは、1つ以上のインサイトの視覚表現をレンダリングするユーザ対話型電子インターフェースを生成することを含む。1つ以上の実施形態では、1つ以上のアクションは、コンピューティングデバイスに、1つ以上のインサイトに関連付けられた1つ以上の通知を送信することを含む。1つ以上の実施形態では、1つ以上のアクションは、1つ以上のインサイトに基づいて、異種データに関連付けられた資産についての出荷条件を予測することを含む。1つ以上の実施形態では、1つ以上のアクションは、1つ以上のインサイトに基づいて、異種データに関連付けられた未分類購入記録データの部品商品ファミリを決定することを含む。1つ以上の実施形態では、1つ以上のアクションは、1つ以上のインサイトに基づいて、部品商品ファミリについての総支出を決定することを含む。
1つ以上の実施形態では、方法1300は、1つ以上のインサイトに基づいて、異種データのフォーマットされたバージョンについての1つ以上のマッピング推奨を提供することを更に含む。追加的又は代替的に、1つ以上の実施形態では、方法1300は、1つ以上のマッピング推奨に基づいて1つ以上の特徴を更新することを更に含む。1つ以上のマッピング推奨を提供すること、及び/又は1つ以上の特徴を更新することは、限定はしないが、コンピューティングデバイスの機能の拡張、及び/又はコンピューティングデバイスに提供されるデータの精度の改善など、1つ以上の技術改善をもたらす。
1つ以上の実施形態では、方法1300は、履歴異種データに関連付けられた1つ以上のテンプレートに基づいて、フォーマット構造の語彙グラウンドトゥルースデータを生成することを更に含む。更に、1つ以上の実施形態では、1つ以上の特徴を生成することは、1つ以上のテンプレートに関連付けられた語彙グラウンドトゥルースデータに基づいて1つ以上の特徴を生成することを含む。語彙グラウンドトゥルースデータを生成することは、限定はしないが、コンピューティングデバイスの機能の拡張、及び/又はコンピューティングデバイスに提供されるデータの精度の改善など、1つ以上の技術改善をもたらす。
1つ以上の実施形態では、方法1300は、1つ以上のインサイトに関連付けられた品質スコアに基づいて1つ以上の特徴を更新することを更に含む。追加的又は代替的に、1つ以上の実施形態では、方法1300は、1つ以上のインサイトに関連付けられたユーザフィードバックデータに基づいて1つ以上の特徴を更新することを更に含む。1つ以上の特徴を更新することは、限定はしないが、コンピューティングデバイスの機能の拡張、及び/又はコンピューティングデバイスに提供されるデータの精度の改善など、1つ以上の技術改善をもたらす。
1つ以上の実施形態では、方法1300は、1つ以上のデータソースから異種データを集約することを更に含む。1つ以上のデータソースから異種データを集約することは、限定はしないが、コンピューティングデバイスの機能の拡張、及び/又はコンピューティングデバイスに提供されるデータの精度の改善など、1つ以上の技術改善をもたらす。1つ以上の実施形態では、異種データを集約することは、単一のデータレイクに異種データを記憶すること、及び/又は1つ以上の所定の間隔で単一のデータレイクのデータを更新することを含む。
1つ以上の実施形態では、方法1300は、異種データの1つ以上の部分をフォーマットすることを更に含み、フォーマットすることは、定義されたフォーマットに関連付けられた異種データのフォーマットされたバージョンを提供する。異種データの1つ以上の部分をフォーマットすることはまた、限定はしないが、コンピューティングデバイスの機能の拡張、及び/又はコンピューティングデバイスに提供されるデータの精度の改善など、1つ以上の技術改善をもたらす。1つ以上の実施形態では、方法1300は、異種データのフォーマットされたバージョンについての1つ以上のマッピング推奨を決定することを更に含む。1つ以上の実施形態では、異種データの1つ以上の部分をフォーマットすることは、1つ以上のデータソースから異種データにおける1つ以上の異なるデータフィールドを識別することを含み、異なるデータフィールドは、対応する主題を記述する。加えて、1つ以上の実施形態では、異種データの1つ以上の部分をフォーマットすることは、1つ以上のデータソースから1つ以上の不完全なデータフィールドを決定することを含み、1つ以上の不完全なデータフィールドは、識別された1つ以上の異なるデータフィールドに対応する。1つ以上の実施形態では、異種データの1つ以上の部分をフォーマットすることは、1つ以上のデータソースからの1つ以上の決定された不完全なデータフィールドが、識別された1つ以上の異なるデータフィールドに対応するという決定に従って、識別されたデータフィールドからのデータを不完全なデータフィールドに追加することを更に含む。1つ以上の実施形態では、異種データの1つ以上の部分をフォーマットすることは、異種データ内での異なるデータ間の関係を捉えるオントロジーツリー構造に基づいて異種データのフォーマットされたバージョンを整理することを含む。1つ以上の実施形態では、方法1300は、オントロジーツリー構造に基づいて異なるデータソースを比較することを更に含む。1つ以上の実施形態では、異種データのフォーマットされたバージョンの態様を関連付けることは、オントロジーツリー構造をトラバースすることを含み、トラバースすることは、異種データの態様を関連付ける。オントロジーツリー構造は、限定はしないが、コンピューティングデバイスの機能の拡張、コンピューティングデバイスに提供されるデータの精度の改善、及び/又はコンピューティングデバイスの効率の改善など、1つ以上の技術改善をもたらす。
1つ以上の実施形態では、方法1300は、異種データに関連付けられた1つ以上のインサイトを提供するように、異種データのフォーマットされたバージョンに関するディープラーニングプロセスを実行することを更に含む。1つ以上の実施形態では、ディープラーニングプロセスを実行することは、1つ以上のインサイトを提供するように、異種データのフォーマットされたバージョンに関する1つ以上の分類を決定することを含む。1つ以上の実施形態では、ディープラーニングプロセスを実行することは、回帰型ニューラルネットワークを使用して、異種データを多次元単語埋め込みにマッピングすることを含む。1つ以上の実施形態では、ディープラーニングプロセスを実行することは、回帰型ニューラルネットワークのゲート付き回帰型ユニットのネットワークを使用して、1つ以上のインサイトを提供することを含む。ディープラーニングプロセスを実行することは、限定はしないが、コンピューティングデバイスの機能の拡張、及び/又はコンピューティングデバイスに提供されるデータの精度の改善など、1つ以上の技術改善をもたらす。1つ以上の実施形態では、方法1300は、1つ以上のインサイトに基づいて回帰型ニューラルネットワークの1つ以上の部分を再トレーニングすることを更に含む。回帰型ニューラルネットワークの1つ以上の部分を再トレーニングすることは、限定はしないが、回帰型ニューラルネットワークの精度を改善することなど、1つ以上の技術改善をもたらす。1つ以上の実施形態では、方法1300は、ディープラーニングプロセスの反復履歴からの異なるメトリックに基づくスコアリングモデルを使用して、1つ以上のアクションを決定するステップを更に含む。スコアリングモデルを使用することは、限定はしないが、コンピューティングデバイスの機能の拡張、及び/又はコンピューティングデバイスに提供されるデータの精度の改善など、1つ以上の技術改善をもたらす。
いくつかの例示的な実施形態では、本明細書の動作のうちのいくつかは、以下で説明するように修正するか、又は更に増強することができる。更に、特定の実施形態では、追加の任意選択的な動作を含めることができる。本明細書で説明する修正、任意選択の追加、又は増強の各々は、単独で、又は本明細書で説明する特徴のうちの任意の他のものと組み合わせて、本明細書の動作とともに含まれ得ることを諒解されたい。
図14は、本明細書で提示する技法を実行し得る例示的なシステム1400を示す。図14は、本開示の例示的な実施形態による、本明細書で説明する技法を実行するように構成され得るコンピュータの簡略化された機能ブロック図である。具体的には、コンピュータ(又はコンピュータが単一の物理的コンピュータインフラストラクチャではない可能性があるため「プラットフォーム」)は、パケットデータ通信のためのデータ通信インターフェース1460を含んでもよい。プラットフォームはまた、プログラム命令を実行するための1つ以上のプロセッサの形態の中央処理装置(central processing unit、「CPU」)1420を含んでもよい。プラットフォームは、内部通信バス1410を含んでもよく、プラットフォームはまた、ROM1430及びRAM1440など、プラットフォームによって処理及び/又は通信される様々なデータファイルのためのプログラムストレージ及び/又はデータストレージを含んでもよいが、システム1400は、ネットワーク通信を介して、プログラミング及びデータを受信してもよい。システム1400はまた、キーボード、マウス、タッチスクリーン、モニタ、ディスプレイなどの入出力デバイスと接続するための入出力ポート1450を含んでもよい。もちろん、様々なシステム機能は、処理負荷を分散させるように、いくつかの類似のプラットフォーム上で、分散方式で実装されてもよい。代替的に、システムは、1つのコンピュータハードウェアプラットフォームの適切なプログラミングによって実装されてもよい。
図15は、本開示の1つ以上の実施形態による、例示的ユーザインターフェース1500を示す。1つ以上の実施形態では、ユーザインターフェース1500は、コンピューティングデバイス(例えば、コンピューティングデバイス402)のディスプレイを介してレンダリングされる対話型ダッシュボードである。ユーザインターフェース1500は、1つ以上のデータソース316に記憶された異種データ314に関するデータ最適化及び/又はデータマッピングを容易にする。1つ以上の実施形態では、フィールドマッピング1502を行って、1つ以上のデータソース316に記憶された異種データ314に関するデータ流動性を提供する。一例では、1つ以上のデータソース316に記憶された異種データ314は、5つのデータソースからのデータ及び/又は1568個の自動入力された列に関連付けられたデータを含む。更に、一例では、フィールドマッピング1502は、489列のデータのフィールドマッピングに関連付けられる。1つ以上の実施形態では、ユーザインターフェース1500は、本明細書に開示される1つ以上の実施形態に従って、データ最適化コンピュータシステム302に関連付けられたフィールドマッピングを開始する(例えば、要求320の生成を開始する)対話型ユーザインターフェース要素1504を含む。
図16は、本開示の1つ以上の実施形態による、例示的ユーザインターフェース1600を示す。1つ以上の実施形態では、ユーザインターフェース1600は、コンピューティングデバイス(例えば、コンピューティングデバイス402)のディスプレイを介してレンダリングされる対話型ダッシュボードである。ユーザインターフェース1600は、1つ以上のデータソース316に記憶された異種データ314に関するフィールドマッピングを容易にする。1つ以上の実施形態では、1つ以上のデータソース316は、第1のソースタイプ(例えば、ソースタイプA)に関連付けられた第1のデータソース(例えば、ソース名A)と、第2のソースタイプ(例えば、ソースタイプB)に関連付けられた第2のデータソース(例えば、ソース名B)と、第3のソースタイプ(例えば、ソースタイプC)に関連付けられた第3のデータソース(例えば、ソース名C)と、第3のソースタイプ(例えば、ソースタイプC)に関連付けられた第4のデータソース(例えば、ソース名D)と、第4のソースタイプ(例えば、ソースタイプD)に関連付けられた第5のデータソース(例えば、ソース名E)とを含む。1つ以上の実施形態では、ユーザインターフェース1600に関連付けられたフィールドマッピングは、本明細書で開示される1つ以上の実施形態によるデータ最適化コンピュータシステム302を介して実現される。1つ以上の実施形態では、ユーザインターフェース1600に関連付けられたフィールドマッピングは、従来のデータ処理システムと比較して、短縮された時間(例えば、秒、分、時間、日、又は週)で実行される。
図17は、本開示の1つ以上の実施形態による、例示的ユーザインターフェース1700を示す。1つ以上の実施形態では、ユーザインターフェース1700は、コンピューティングデバイス(例えば、コンピューティングデバイス402)のディスプレイを介してレンダリングされる対話型ダッシュボードである。ユーザインターフェース1700は、1つ以上のデータソース316に記憶された異種データ314に関するフィールドマッピングを容易にする。1つ以上の実施形態では、ユーザインターフェース1700に関連付けられたフィールドマッピングは、本明細書で開示される1つ以上の実施形態によるデータ最適化コンピュータシステム302を介して実現される。1つ以上の実施形態では、ユーザインターフェース1700に関連付けられたフィールドマッピングは、1つ以上のデータソース316に記憶された異種データ314のソース列及び/又はターゲット列に関して実行される。1つ以上の実施形態では、ユーザインターフェース1700は、特定のソース列に対する推奨1702(例えば、record_typeソース列に対する推奨など)を提供する。1つ以上の実施形態では、ユーザインターフェース1700に関連付けられたフィールドマッピングは、データセットカテゴリ、論理名、物理名、及び/又はターゲット列についての他の情報に関連付けられたターゲット辞書に基づいて実行される。
前述の方法の説明及びプロセスフロー図は、単に例示的な例として提供されており、様々な実施形態のステップが提示された順序で実行されなければならないことを要求又は暗示するものではない。当業者によって理解されるように、前述の実施形態におけるステップの順序は、任意の順序で行うことができる。「その後(thereafter)」、「次いで(then)」、「次に(next)」などの語は、ステップの順序を限定するものではない。これらの単語は、単に、方法の説明を通して読者を導くために使用される。更に、例えば、冠詞「a」、「an」、又は「the」を使用する単数形での請求項要素へのいかなる言及も、要素を単数形に限定するものとして解釈されるべきではない。
「1つ以上」は、1つの要素によって実行される機能、2つ以上の要素によって、例えば分散方式で実行される機能、1つの要素によって実行されるいくつかの機能、いくつかの要素によって実行されるいくつかの機能、又は上記の任意の組み合わせを含むことを理解されたい。
更に、第1の、第2のなどの用語は、場合によっては、様々な要素を説明するために本明細書で使用されるが、これらの要素は、これらの用語によって限定されるべきではないということも理解されよう。これらの用語は、ある要素を別の要素から区別するためにのみ使用される。例えば、説明される様々な実施形態の範囲から逸脱することなく、第1の接点を第2の接点と呼ぶことができ、同様に、第2の接点を第1の接点と呼ぶことができる。第1の接点及び第2の接点は両方とも接点であるが、それらは同じ接点ではない。
本明細書で説明される様々な実施形態の説明において使用される用語は、特定の実施形態を説明することのみを目的としており、限定することを意図していない。説明される様々な実施形態の説明及び添付の特許請求の範囲において使用される場合、単数形「a」、「an」、及び「the」は、文脈が明らかにそうでないことを示さない限り、複数形も含むことが意図される。本明細書で使用される「及び/又は」という用語は、関連する列挙された項目のうちの1つ以上のありとあらゆる可能な組み合わせを指し、それらを包含するということも理解されよう。「含む(includes)」、「含んでいる(including)」、「備える(comprises)」、及び/又は「備えている(comprising)」という用語は、本明細書で使用される場合、述べられた特徴、整数、ステップ、動作、要素、及び/又は構成要素の存在を指定するが、1つ以上の他の特徴、整数、ステップ、動作、要素、構成要素、及び/又はそれらのグループの存在又は追加を排除しないということが更に理解されよう。
本明細書で使用される場合、「(もし)する場合には」という用語は、文脈に応じて、「時」又は「時に」又は「決定に応答して」又は「検出に応答して」を意味するように、任意選択的に解釈される。同様に、「決定される場合」又は「[述べられた条件又は事象]が検出される場合」という句は、文脈に応じて、「決定時」又は「決定に応答して」又は「[述べられた条件又は事象]の検出時」又は「[述べられた条件又は事象]の検出に応答して」を意味するように任意選択的に解釈される。
本明細書で開示されるシステム、装置、デバイス、及び方法は、例を用いて、また図面を参照して詳細に説明される。本明細書で考察される例は、あくまでも例に過ぎず、本明細書で説明される装置、デバイス、システム、及び方法の説明を助けるために提供される。図面に示されるか、又は以下で考察する特徴又は構成要素のいずれも、必須であると具体的に指定されない限り、これらの装置、デバイス、システム、又は方法のいずれかの任意の特定の実装形態に必須であると解釈されるべきではない。読みやすさ及び明確さのために、いくつかの構成要素、モジュール、又は方法は、特定の図に関連してのみ説明され得る。本開示では、特定の技法、構成などを識別するものは、提示される特定の例に関連するか、又はそのような技法、構成などの単なる一般的な説明であるかのいずれかである。具体的な詳細又は例を識別するものは、そのように具体的に指定されない限り、必須又は限定として解釈されることを意図せず、そのように解釈されるべきではない。構成要素の組み合わせ又は下位の組み合わせを具体的に説明しないことは、任意の組み合わせ又は下位の組み合わせが不可能であることを示すものとして理解されるべきではない。開示及び説明される例、配置、構成、構成要素、要素、装置、デバイス、システム、方法などに対する修正が行われることができ、特定の用途のために所望され得るということが理解されるであろう。また、説明される任意の方法に関して、方法がフロー図と併せて説明されるかどうかにかかわらず、文脈によって別段に指定又は要求されない限り、方法の実行において行われるステップの明示的又は暗示的順序付けは、それらのステップが提示された順序で行われなければならないことを含意せず、代わりに、異なる順序で又は並行して行われ得るということを理解されたい。
本開示全体を通して、構成要素又はモジュールへの言及は、概して、機能又は関連する機能のグループを実行するために論理的に一緒にグループ化され得る項目を指す。同様の参照番号は、概して、同一又は類似の構成要素を指すことが意図される。コンポーネント及びモジュールは、ソフトウェア、ハードウェア、又はソフトウェアとハードウェアの組み合わせの形で実装することができる。「ソフトウェア」という用語は、実行可能コード、例えば、機械実行可能命令又は機械解釈可能命令だけでなく、ファームウェア及び埋め込みソフトウェアを含む任意の好適な電子フォーマットで記憶されたデータ構造、データストア、及びコンピューティング命令も含むように拡張的に使用される。「情報」及び「データ」という用語は、拡張的に使用され、実行可能コード、特に、テキスト、ビデオデータ、及びオーディオデータなどのコンテンツ、並びに様々なコード又はフラグを含む、多種多様な電子情報を含む。「情報」、「データ」、及び「コンテンツ」という用語は、文脈によって許容される場合、交換可能に使用されることがある。
本明細書で開示する態様に関して説明する様々な例示的な論理、論理ブロック、モジュール、及び回路を実装するために使用されるハードウェアは、汎用プロセッサ、デジタル信号プロセッサ(digital signal processor、DSP)、特定用途向け集積回路(application specific integrated circuit、ASIC)若しくはフィールドプログラマブルゲートアレイ(programmable gate array、FPGA)などの専用プロセッサ、プログラマブル論理デバイス、ディスクリートゲート若しくはトランジスタ論理、ディスクリートハードウェア構成要素、又は本明細書で説明する機能を実行するように設計されたそれらの任意の組み合わせを含むことができる。汎用プロセッサは、マイクロプロセッサであり得るが、代替として、プロセッサは、任意のプロセッサ、コントローラ、マイクロコントローラ、又は状態機械であり得る。プロセッサは、コンピューティングデバイスの組み合わせ、例えば、DSPとマイクロプロセッサとの組み合わせ、複数のマイクロプロセッサ、DSPコアと併せた1つ以上のマイクロプロセッサ、又は任意の他のかかる構成として実施されてよい。代替的又は追加的に、一部のステップ又は方法は、所与の機能に特異的な回路によって実行され得る。
1つ以上の例示的な実施形態では、本明細書で説明される機能は、専用ハードウェア、又はファームウェア若しくは他のソフトウェアによってプログラムされたハードウェアの組み合わせによって実装され得る。ファームウェア又は他のソフトウェアに依存する実装形態では、機能は、1つ以上の非一時的コンピュータ可読媒体及び/又は1つ以上の非一時的プロセッサ可読媒体に記憶された1つ以上の命令の実行の結果として実行され得る。これらの命令は、1つ以上の非一時的コンピュータ可読又はプロセッサ可読記憶媒体上に常駐する1つ以上のプロセッサ実行可能ソフトウェアモジュールによって具現化され得る。非一時的コンピュータ可読又はプロセッサ可読記憶媒体は、この点に関して、コンピュータ又はプロセッサによってアクセスされ得る任意の記憶媒体を含むことができる。限定ではなく例として、そのような非一時的コンピュータ可読媒体又はプロセッサ可読媒体は、ランダムアクセスメモリ(random access memory、RAM)、読取り専用メモリ(read-only memory、ROM)、電気的消去可能プログラマブル読取り専用メモリ(electrically erasable programmable read-only memory、EEPROM)、フラッシュメモリ、ディスク記憶装置、磁気記憶デバイスなどを含むことができる。本明細書で使用されるディスク記憶装置は、コンパクトディスク(compact disc、CD)、レーザディスク、光ディスク、デジタル多用途ディスク(digital versatile disc、DVD)、フロッピーディスク、及びBlu-ray disc(商標)、又はレーザを用いてデータを磁気的又は光学的に記憶する他の記憶装置を含む。上記のタイプの媒体の組み合わせも、非一時的コンピュータ可読媒体及びプロセッサ可読媒体という用語の範囲内に含まれる。加えて、1つ以上の非一時的プロセッサ可読媒体又はコンピュータ可読媒体上に記憶された命令の任意の組み合わせは、本明細書ではコンピュータプログラム製品と称されることがある。
本明細書で説明する本発明の多くの修正例及び他の実施形態は、前述の説明及び関連付けられた図面に提示される教示の利益を有する、これらの発明に関係がある当業者に着想されるであろう。図面は、本明細書で説明する装置及びシステムの特定の構成要素のみを示すが、様々な他の構成要素が供給管理システムと併せて使用され得ることが理解される。したがって、本発明、開示される特定の実施形態に限定されるものではないこと、並びに修正例及び他の実施形態は、添付の特許請求の範囲の範囲内に含まれることが意図されることを理解されたい。更に、上述の方法におけるステップは、必ずしも添付の図面に示された順序で行われる必要はなく、場合によっては、示されたステップの1つ又は複数が実質的に同時に行われてもよく、又は追加のステップが含まれてもよい。特定の用語が本明細書で用いられているが、これらは一般的かつ記述的な意味でのみ使用され、限定の目的では使用されない。
本明細書及び実施例は例示的なものに過ぎず、本開示の真の範囲及び趣旨は以下の特許請求の範囲によって示されることが意図されている。

Claims (20)

  1. 方法であって、
    1つ以上のプロセッサとメモリとを有するデバイスにおいて、
    1つ以上のデータソースに関連付けられた異種データのフォーマットされたバージョンに関する1つ以上のインサイトを取得する要求を受信することであって、前記要求が、
    前記1つ以上のインサイトの目標を記述するインサイト記述子を含む、受信することと、
    前記要求に応答して、
    前記1つ以上のインサイトを提供するように、前記異種データの前記フォーマットされたバージョンの態様を相関させることであって、前記関連付けられた態様が、前記目標、及び前記異種データの前記フォーマットされたバージョンの前記態様間の関係によって決定される、相関させることと、
    前記1つ以上のインサイトに基づいて1つ以上のアクションを実行することと、を含む、方法。
  2. 前記1つ以上のデータソースからの前記異種データを集約することと、
    前記異種データの1つ以上の部分をフォーマットすることであって、前記フォーマットすることが、定義されたフォーマットに関連付けられた前記異種データの前記フォーマットされたバージョンを提供する、フォーマットすることと、
    前記異種データの前記フォーマットされたバージョンについての1つ以上のマッピング推奨を決定することと、を更に含む、請求項1に記載の方法。
  3. 前記異種データの前記1つ以上の部分を前記フォーマットすることが、
    前記1つ以上のデータソースからの前記異種データにおける1つ以上の異なるデータフィールドを識別することであって、前記1つ以上の異なるデータフィールドが、対応する主題を記述する、識別することと、
    前記1つ以上のデータソースから1つ以上の不完全なデータフィールドを決定することであって、前記1つ以上の不完全なデータフィールドが、前記識別された1つ以上の異なるデータフィールドに対応する、決定することと、
    前記1つ以上のデータソースからの前記1つ以上の決定された不完全なデータフィールドが、前記識別された1つ以上の異なるデータフィールドに対応するという決定に従って、識別されたデータフィールドからのデータを不完全なデータフィールドに追加することと、を含む、請求項1に記載の方法。
  4. 前記異種データの前記1つ以上の部分を前記フォーマットすることが、
    前記異種データ内での異なるデータ間の関係を捉えるオントロジーツリー構造に基づいて前記異種データの前記フォーマットされたバージョンを整理することを含む、請求項1に記載の方法。
  5. 前記1つ以上のデータソースに関連付けられた前記異種データのフォーマット構造に関連付けられた1つ以上の特徴を生成することと、
    前記1つ以上の特徴に基づいて、前記異種データの前記フォーマットされたバージョンを提供するように前記異種データのそれぞれの部分をマッピングすることと、を更に含む、請求項1に記載の方法。
  6. 前記1つ以上のインサイトに基づいて、前記異種データの前記フォーマットされたバージョンについての1つ以上のマッピング推奨を提供することと、
    前記1つ以上のマッピング推奨に基づいて前記1つ以上の特徴を更新することと、を更に含む、請求項5に記載の方法。
  7. 前記フォーマット構造についての列名に関連付けられた1つ以上のテキスト埋め込みを生成することを更に含み、
    前記マッピングすることが、前記フォーマット構造についての前記列名に関連付けられた前記1つ以上のテキスト埋め込みに基づいて、前記異種データの前記それぞれの部分をマッピングすることを含む、請求項5に記載の方法。
  8. 前記1つ以上のインサイトの視覚表現をレンダリングするユーザ対話型電子インターフェースを生成することを更に含む、請求項1に記載の方法。
  9. 前記1つ以上のインサイトに関連付けられた1つ以上の特徴を決定することと、
    前記1つ以上のインサイトに関連付けられた前記1つ以上の特徴に基づいて、前記異種データに関連付けられた資産についての条件を予測することと、を更に含む、請求項1に記載の方法。
  10. システムであって、
    1つ以上のプロセッサと、
    メモリと、
    前記メモリに記憶された1つ以上のプログラムと、を備え、前記1つ以上のプログラムが、命令を含み、前記命令が、
    1つ以上のデータソースに関連付けられた異種データのフォーマットされたバージョンに関する1つ以上のインサイトを取得する要求を受信することであって、前記要求が、
    前記1つ以上のインサイトの目標を記述するインサイト記述子を含む、受信することと、
    前記要求に応答して、
    前記1つ以上のインサイトを提供するように、前記異種データの前記フォーマットされたバージョンの態様を相関させることであって、前記関連付けられた態様が、前記目標、及び前記異種データの前記フォーマットされたバージョンの前記態様間の関係によって決定される、相関させることと、
    前記1つ以上のインサイトに基づいて1つ以上のアクションを実行することと、を行うように構成されている、システム。
  11. 前記1つ以上のプログラムが、命令を更に含み、前記命令が、
    前記1つ以上のデータソースからの前記異種データを集約することと、
    前記異種データの1つ以上の部分をフォーマットすることであって、前記フォーマットすることが、定義されたフォーマットに関連付けられた前記異種データの前記フォーマットされたバージョンを提供する、フォーマットすることと、
    前記異種データの前記フォーマットされたバージョンについての1つ以上のマッピング推奨を決定することと、を行うように構成されている、請求項10に記載のシステム。
  12. 前記1つ以上のプログラムが、命令を更に含み、前記命令が、
    前記1つ以上のデータソースからの前記異種データにおける1つ以上の異なるデータフィールドを識別することであって、前記1つ以上の異なるデータフィールドが、対応する主題を記述する、識別することと、
    前記1つ以上のデータソースから1つ以上の不完全なデータフィールドを決定することであって、前記1つ以上の不完全なデータフィールドが、前記識別された1つ以上の異なるデータフィールドに対応する、決定することと、
    前記1つ以上のデータソースからの前記1つ以上の決定された不完全なデータフィールドが前記識別された1つ以上の異なるデータフィールドに対応するという決定に従って、識別されたデータフィールドからのデータを不完全なデータフィールドに追加することと、を行うように構成されている、請求項10に記載のシステム。
  13. 前記1つ以上のプログラムが、命令を更に含み、前記命令が、
    前記異種データ内での異なるデータ間の関係を捉えるオントロジーツリー構造に基づいて前記異種データの前記フォーマットされたバージョンを整理するように構成されている、請求項10に記載のシステム。
  14. 前記1つ以上のプログラムが、命令を更に含み、前記命令が、
    前記1つ以上のデータソースに関連付けられた前記異種データについてのフォーマット構造に関連付けられた1つ以上の特徴を生成することと、
    前記1つ以上の特徴に基づいて、前記異種データの前記フォーマットされたバージョンを提供するように前記異種データのそれぞれの部分をマッピングすることと、を行うように構成されている、請求項10に記載のシステム。
  15. 前記1つ以上のプログラムが、命令を更に含み、前記命令が、
    前記1つ以上のインサイトに基づいて、前記異種データの前記フォーマットされたバージョンについて1つ以上のマッピング推奨を提供することと、
    前記1つ以上のマッピング推奨に基づいて前記1つ以上の特徴を更新することと、を行うように構成されている、請求項14に記載のシステム。
  16. 前記1つ以上のプログラムが、命令を更に含み、前記命令が、
    前記フォーマット構造についての列名に関連付けられた1つ以上のテキスト埋め込みを生成するように構成されており、
    前記マップが、前記フォーマット構造についての前記列名に関連付けられた前記1つ以上のテキスト埋め込みに基づいて前記異種データの前記それぞれの部分をマッピングすることを含む、請求項14に記載のシステム。
  17. デバイスの1つ以上のプロセッサによる実行のための1つ以上のプログラムを含む非一時的コンピュータ可読記憶媒体であって、前記1つ以上のプログラムが、命令を含み、前記命令が、前記1つ以上のプロセッサによって実行されたときに、前記デバイスに、
    1つ以上のデータソースに関連付けられた異種データのフォーマットされたバージョンに関する1つ以上のインサイトを取得する要求を受信することであって、前記要求が、
    前記1つ以上のインサイトの目標を記述するインサイト記述子を含む、受信することと、
    前記要求に応答して、
    前記1つ以上のインサイトを提供するように、前記異種データの前記フォーマットされたバージョンの態様を相関させることであって、前記関連付けられた態様が、前記目標、及び前記異種データの前記フォーマットされたバージョンの前記態様間の関係によって決定される、相関させることと、
    前記1つ以上のインサイトに基づいて1つ以上のアクションを実行することと、を行わせる、非一時的コンピュータ可読記憶媒体。
  18. 前記1つ以上のプログラムが、命令を更に含み、前記命令が、前記1つ以上のプロセッサによって実行されたときに、前記デバイスに、
    前記1つ以上のデータソースからの前記異種データにおける1つ以上の異なるデータフィールドを識別することであって、前記1つ以上の異なるデータフィールドが、対応する主題を記述する、識別することと、
    前記1つ以上のデータソースから1つ以上の不完全なデータフィールドを決定することであって、前記1つ以上の不完全なデータフィールドが、前記識別された1つ以上の異なるデータフィールドに対応する、決定することと、
    前記1つ以上のデータソースからの前記1つ以上の決定された不完全なデータフィールドが前記識別された1つ以上の異なるデータフィールドに対応するという決定に従って、識別されたデータフィールドからのデータを不完全なデータフィールドに追加することと、を行わせる、請求項17に記載の非一時的コンピュータ可読記憶媒体。
  19. 前記1つ以上のプログラムが、命令を更に含み、前記命令が、前記1つ以上のプロセッサによって実行されたときに、前記デバイスに、
    前記異種データ内での異なるデータ間の関係を捉えるオントロジーツリー構造に基づいて前記異種データの前記フォーマットされたバージョンを整理させる、請求項17に記載の非一時的コンピュータ可読記憶媒体。
  20. 前記1つ以上のプログラムが、命令を更に含み、前記命令が、前記1つ以上のプロセッサによって実行されたときに、前記デバイスに、
    前記1つ以上のデータソースに関連付けられた前記異種データについてのフォーマット構造に関連付けられた1つ以上の特徴を生成することと、
    前記1つ以上の特徴に基づいて、前記異種データの前記フォーマットされたバージョンを提供するように前記異種データのそれぞれの部分をマッピングすることと、を行わせる、請求項17に記載の非一時的コンピュータ可読記憶媒体。
JP2023513643A 2020-08-31 2021-08-31 企業支出の最適化及びマッピングモデルアーキテクチャ Pending JP2023539284A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063072560P 2020-08-31 2020-08-31
US63/072,560 2020-08-31
US202163149004P 2021-02-12 2021-02-12
US63/149,004 2021-02-12
PCT/US2021/048405 WO2022047369A1 (en) 2020-08-31 2021-08-31 Enterprise spend optimization and mapping model architecture

Publications (1)

Publication Number Publication Date
JP2023539284A true JP2023539284A (ja) 2023-09-13

Family

ID=77951818

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023513643A Pending JP2023539284A (ja) 2020-08-31 2021-08-31 企業支出の最適化及びマッピングモデルアーキテクチャ

Country Status (6)

Country Link
US (1) US20220067626A1 (ja)
EP (1) EP4205055A1 (ja)
JP (1) JP2023539284A (ja)
CN (1) CN116075842A (ja)
AU (1) AU2021331645A1 (ja)
WO (1) WO2022047369A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220292422A1 (en) * 2021-03-15 2022-09-15 Leadership Connect, Inc. Advanced search engine for federal spend and user interface for the same

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220391820A1 (en) * 2021-06-02 2022-12-08 Sustainment Technologies, Inc. Data-driven requirements analysis and matching
US20220391821A1 (en) * 2021-06-02 2022-12-08 Sustainment Technologies, Inc. Data-driven requirements analysis and matching
US11620601B2 (en) * 2021-06-05 2023-04-04 Bloom Value Corporation System for enterprise value optimization
US11928009B2 (en) * 2021-08-06 2024-03-12 International Business Machines Corporation Predicting a root cause of an alert using a recurrent neural network
US20230111167A1 (en) * 2021-10-13 2023-04-13 Sap Se Feature sensor efficiency optimization for recommendation system using data envelopment analysis
US20230289832A1 (en) * 2022-03-09 2023-09-14 International Business Machines Corporation Determining locations for offerings using artificial intelligence
US20230297346A1 (en) * 2022-03-18 2023-09-21 C3.Ai, Inc. Intelligent data processing system with metadata generation from iterative data analysis
US20230408985A1 (en) * 2022-06-17 2023-12-21 Honeywell International Inc. Apparatus and method for calculating asset capability using model predictive control and/or industrial process optimization
CN116069071B (zh) * 2023-03-24 2023-06-30 冠鲁建设股份有限公司 一种基于大数据的施工优化系统、方法、装置和介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140279622A1 (en) * 2013-03-08 2014-09-18 Sudhakar Bharadwaj System and method for semantic processing of personalized social data and generating probability models of personal context to generate recommendations in searching applications
EP3278213A4 (en) * 2015-06-05 2019-01-30 C3 IoT, Inc. SYSTEMS, METHODS AND DEVICES FOR AN APPLICATION DEVELOPMENT PLATFORM OF AN INTERNET OF THE THINGS OF A COMPANY
US10885463B2 (en) * 2016-07-08 2021-01-05 Microsoft Technology Licensing, Llc Metadata-driven machine learning for systems
US10459939B1 (en) * 2016-07-31 2019-10-29 Splunk Inc. Parallel coordinates chart visualization for machine data search and analysis system
US10395287B1 (en) * 2018-04-30 2019-08-27 Capital One Services, Llc Systems and methods for improving invoice management using enhanced analytical insight
US11816436B2 (en) * 2018-07-24 2023-11-14 MachEye, Inc. Automated summarization of extracted insight data
US11580147B2 (en) * 2018-11-13 2023-02-14 Thoughtspot, Inc. Conversational database analysis
US20210097456A1 (en) * 2019-09-30 2021-04-01 Rockwell Automation Technologies, Inc. Progressive contextualization and analytics of industrial data
US11263267B1 (en) * 2021-03-29 2022-03-01 Atlassian Pty Ltd. Apparatuses, methods, and computer program products for generating interaction vectors within a multi-component system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220292422A1 (en) * 2021-03-15 2022-09-15 Leadership Connect, Inc. Advanced search engine for federal spend and user interface for the same

Also Published As

Publication number Publication date
CN116075842A (zh) 2023-05-05
WO2022047369A1 (en) 2022-03-03
EP4205055A1 (en) 2023-07-05
AU2021331645A1 (en) 2023-03-02
US20220067626A1 (en) 2022-03-03

Similar Documents

Publication Publication Date Title
JP2023539284A (ja) 企業支出の最適化及びマッピングモデルアーキテクチャ
US20220076165A1 (en) Systems and methods for automating data science machine learning analytical workflows
US10977293B2 (en) Technology incident management platform
US11640494B1 (en) Systems and methods for construction, maintenance, and improvement of knowledge representations
Wang et al. Industrial big data analytics: challenges, methodologies, and applications
US9535902B1 (en) Systems and methods for entity resolution using attributes from structured and unstructured data
AU2020380139A1 (en) Data preparation using semantic roles
US20230075005A1 (en) Intelligent asset anomaly prediction via feature generation
CN116483028A (zh) 用于资产管理的性能度量保证
US20230161777A1 (en) Adaptive ontology driven dimensions acquisition, automated schema creation, and enriched data in time series databases
US20230055641A1 (en) Real-time generation of digital twins based on input data captured by user device
US20220374402A1 (en) Contextualized time series database and/or multi-tenant server system deployment
CN116266194A (zh) 用于完整性操作窗口优化的人工智能系统
US20240104480A1 (en) Systems and methods for knowledge graph-enabled cross-domain analytics using machine learning
US20230161645A1 (en) Classification of events by pattern recognition in multivariate time series data
US20240118680A1 (en) Data modeling and digital asset template generation to provide asset instance inheritance for assets within an industrial environment
US20230214096A1 (en) Systems and methods for navigating a graphical user interface
US20230222135A1 (en) Method and search system with metadata driven application programming interface (api)
US20230408989A1 (en) Recommendation system for advanced process control limits using instance-based learning
EP4213035A1 (en) Systems and methods for navigating a graphical user interface
CN116166724A (zh) 时间序列数据库中的自适应本体驱动维度获取、自动化模式创建和富集数据
WO2023023042A1 (en) Real-time generation of digital twins based on input data captured by user device
Wang et al. Research on the application of big data in the petroleum industry
Goniwada Datafication Principles and Patterns
JP2024507114A (ja) 資産挙動モデリング

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230227

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230227

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20230407

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20230411

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240305