JP2023531100A - エンティティがターゲットパラメータを充足しない確率を計算するための機械学習モデルアンサンブル - Google Patents
エンティティがターゲットパラメータを充足しない確率を計算するための機械学習モデルアンサンブル Download PDFInfo
- Publication number
- JP2023531100A JP2023531100A JP2023521978A JP2023521978A JP2023531100A JP 2023531100 A JP2023531100 A JP 2023531100A JP 2023521978 A JP2023521978 A JP 2023521978A JP 2023521978 A JP2023521978 A JP 2023521978A JP 2023531100 A JP2023531100 A JP 2023531100A
- Authority
- JP
- Japan
- Prior art keywords
- sub
- values
- entity
- simulated
- data elements
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010801 machine learning Methods 0.000 title claims abstract description 348
- 238000000034 method Methods 0.000 claims abstract description 84
- 238000012549 training Methods 0.000 claims abstract description 50
- 238000004458 analytical method Methods 0.000 claims abstract description 41
- 230000004044 response Effects 0.000 claims description 47
- 230000006870 function Effects 0.000 claims description 27
- 238000009826 distribution Methods 0.000 claims description 23
- 238000013459 approach Methods 0.000 claims description 20
- 238000004088 simulation Methods 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 10
- 238000012544 monitoring process Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 239000000463 material Substances 0.000 claims description 6
- 230000010354 integration Effects 0.000 claims description 5
- 230000007774 longterm Effects 0.000 claims description 4
- 238000007726 management method Methods 0.000 claims description 4
- 230000003247 decreasing effect Effects 0.000 claims description 3
- 230000002452 interceptive effect Effects 0.000 claims description 3
- 238000003860 storage Methods 0.000 description 24
- 230000000875 corresponding effect Effects 0.000 description 22
- 238000010586 diagram Methods 0.000 description 19
- 230000008569 process Effects 0.000 description 13
- 238000012545 processing Methods 0.000 description 13
- 230000001960 triggered effect Effects 0.000 description 8
- 238000012706 support-vector machine Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 230000002776 aggregation Effects 0.000 description 4
- 238000004220 aggregation Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000000342 Monte Carlo simulation Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 238000007477 logistic regression Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000010183 spectrum analysis Methods 0.000 description 2
- 230000003442 weekly effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- MWRWFPQBGSZWNV-UHFFFAOYSA-N Dinitrosopentamethylenetetramine Chemical compound C1N2CN(N=O)CN1CN(N=O)C2 MWRWFPQBGSZWNV-UHFFFAOYSA-N 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002902 bimodal effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000002542 deteriorative effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000002948 stochastic simulation Methods 0.000 description 1
- 238000009662 stress testing Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
- G06Q10/06375—Prediction of business process outcome or impact based on a proposed change
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/087—Inventory or stock management, e.g. order filling, procurement or balancing against orders
- G06Q10/0875—Itemisation or classification of parts, supplies or services, e.g. bill of materials
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
- G06Q30/015—Providing customer assistance, e.g. assisting a customer within a business location or via helpdesk
- G06Q30/016—After-sales
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/12—Accounting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Data Mining & Analysis (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Technology Law (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Algebra (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
エンティティがターゲットパラメータを充足しない確率を計算するための機械学習(ML)モデルアンサンブルを生成する方法であって、生データ要素の入力に対して各々がサブ値を出力する複数のMLサブモデルを訓練することと、サンプルエンティティに対してMLサブ値と対応するエンティティパラメータとを含む訓練データセットを利用して、サブ値の入力に対してターゲットパラメータに対応するエンティティパラメータの値を出力するメインMLモデルを訓練することと、各自のサブ値を取得するため、エンティティに関連する生データ要素をMLサブモデルに入力することと、繰り返しにおいて、エンティティパラメータのシミュレートされた値を取得するためメインMLモデルに入力される調整されたサブ値を生成するため、サブ値に対するシミュレートされた調整を計算し、エンティティパラメータに対するシミュレート値の分析に従って、エンティティがターゲットパラメータを充足しない確率を生成するリスク分類器を生成することと、を有する方法が提供される。
Description
[関連出願]
本出願は、その内容が参照によってここに援用される、2020年6月21日に出願された米国仮特許出願第16/907,251号の優先権の利益を主張する。
本出願は、その内容が参照によってここに援用される、2020年6月21日に出願された米国仮特許出願第16/907,251号の優先権の利益を主張する。
本発明は、それのいくつかの実施例において、機械学習(ML)に関し、より詳細には、限定することなく、エンティティがターゲットパラメータを充足しないリスクを計算するためのMLモデルアンサンブルを訓練及び利用するシステム及び方法に関する。
特定のエンティティがターゲット値を充足可能な否かの予測は、通常はエンティティの履歴分析に基づいている。過去のターゲットの充足における過去の成功は、ターゲットの充足における将来の成功を示し、ターゲット履歴の充足における失敗の履歴は、通常は将来においてターゲットを充足ための予測される失敗を示す。他のアプローチは、他のエンティティを観察することである。他のエンティティがそれらのターゲット履歴の充足において成功又は失敗したかは、それ自体のターゲットを充足する現在のエンティティの能力に対する指示として利用される。
第1の態様によると、エンティティがターゲットパラメータを充足しない確率(likelihood)を計算するための機械学習(ML)モデルアンサンブルを生成する方法は、生データ要素の入力に応答して各々がサブ値を出力する複数のMLサブモデルを訓練することと、複数のサンプルエンティティのそれぞれに対して、前記複数のMLサブ値と対応するエンティティパラメータとを含む訓練データセットを利用して、前記複数のMLサブモデルによって出力された前記複数のサブ値の入力に応答して、前記ターゲットパラメータに対応するエンティティパラメータの値を出力するメインMLモデルを訓練することと、各自のサブ値の出力を取得するため、前記エンティティに関連する複数の生データ要素を前記複数のMLサブモデルに入力することと、複数の繰り返しにおいて、複数の調整されたサブ値を生成するため、前記複数の取得されたサブ値に対する複数のシミュレートされた調整を計算し、前記複数の調整されたサブ値を前記メインMLモデルに入力し、前記複数の繰り返しにおいて前記メインMLモデルから前記エンティティパラメータに対する複数のシミュレート値を取得することと、前記エンティティパラメータに対する前記複数のシミュレートされた値の分析に従って、前記エンティティが前記ターゲットパラメータを充足しない確率を生成するリスク分類器を生成することと、を有する。
第2の態様によると、エンティティがターゲットパラメータを充足しない確率を計算するためのMLモデルアンサンブルを動的及び繰り返し利用する方法は、複数の第1の繰り返しにおいて、ターゲットパラメータを取得するためのリクエストをエンティティから受信することと、複数のネットワークノード上にインストールされるコードセンサによって抽出され、リアルタイムにサーバに投入される複数の生データ要素を受信することと、前記複数の生データ要素を複数のMLサブモデルに入力することと、前記複数のMLサブモデルから複数のサブ値を取得することと、複数の第2の繰り返しにおいて、複数の調整されたサブ値を生成するため、前記複数の取得されたサブ値に対する複数のシミュレートされた調整を計算することと、前記複数の調整されたサブ値をメインMLモデルに入力することと、前記複数の第2の繰り返しにおける前記メインMLモデルから、前記エンティティパラメータの複数のシミュレートされた値を取得することと、前記エンティティパラメータの前記複数のシミュレートされた値の分析に従って、前記エンティティが前記ターゲットパラメータを充足しない確率を計算するリスク分類器に前記複数のシミュレートされた値を入力することと、前記確率が閾値を下回るとき、前記エンティティに前記ターゲットパラメータを自動的に提供することと、前記確率が前記閾値を上回るとき、前記ターゲットパラメータに対するリクエストを自動的に否定することと、を有する。
第3の態様によると、エンティティがターゲットパラメータを充足しない確率を計算するための機械学習(ML)モデルアンサンブルを生成するシステムは、生データ要素の入力に応答して、それぞれがサブ値を出力する複数のMLサブモデルを訓練することと、複数のサンプルエンティティのそれぞれに対して複数のMLサブ値と対応するエンティティパラメータとを含む訓練データセットを利用して、前記複数のMLサブモデルによって出力される前記複数のサブ値の入力に応答して、前記ターゲットパラメータに対応するエンティティパラメータの値を出力するメインMLモデルを訓練することと、各サブ値の出力を取得するため、前記複数のMLサブモデルに前記エンティティに関連する複数の生データ要素を入力することと、複数の繰り返しにおいて、複数の調整されたサブ値を生成するため、前記複数の取得されたサブ値に対する複数のシミュレートされた調整を計算することと、前記メインMLモデルに前記複数の調整されたサブ値を入力することと、前記複数の繰り返しにおける前記メインMLモデルから、前記エンティティパラメータの複数のシミュレートされた値を取得することと、前記エンティティパラメータの前記複数のシミュレートされた値の分析に従って、前記エンティティが前記ターゲットパラメータを充足しない確率を生成するリスク分類器を生成することと、のためのコードを実行する少なくとも1つのハードウェアプロセッサを有する。
第4の態様によると、エンティティがターゲットパラメータを充足しない確率を計算するための機械学習(ML)モデルアンサンブルを生成する方法は、生データ要素の入力に応答して、それぞれがサブ値を出力する複数のMLサブモデルを訓練することと、複数のサンプルエンティティのそれぞれに対して複数のMLサブ値と対応するエンティティパラメータとを含む訓練データセットを利用して、前記複数のMLサブモデルによって出力される前記複数のサブ値の入力に応答して、前記ターゲットパラメータに対応するエンティティパラメータの値を出力するメインMLモデルを訓練することと、各サブ値の出力を取得するため、前記複数のMLサブモデルに前記エンティティに関連する複数の生データ要素を入力することと、複数の繰り返しにおいて、確率的シミュレーションモデルと事前分布のセットとに基づいて、前記生データ要素から提供又は計算されると、前記複数のMLサブモデルによって出力された前記複数の取得されたサブ値に対して複数のシミュレートされた調整を計算することと、前記複数の取得されたサブ値に対して複数の調整されたサブ値を生成するため、前記複数のMLサブモデルによって出力される前記複数の取得されたサブ値に前記複数のシミュレートされた調整のそれぞれを適用することと、前記複数のMLサブモデルの出力に前記複数のシミュレートされた調整を適用することによって計算される前記複数の取得されたサブ値の前記複数の調整されたサブ値を前記メインMLモデルに入力することと、前記複数のMLサブモデルの出力に前記複数のシミュレートされた調整を適用することによって計算される前記複数の取得されたサブ値に対する前記複数の調整されたサブ値の入力に応答して、前記複数の繰り返しにおける前記メインMLモデルから、前記エンティティパラメータの複数のシミュレートされた値を取得することと、前記複数のMLサブモデルによって出力されるサブ値に前記複数のシミュレートされた調整のそれぞれを適用することによって計算される前記複数の取得されたサブ値の前記複数の調整されたサブ値の入力に応答して、前記複数の繰り返しにおいて前記メインMLモデルによって出力された前記エンティティパラメータの前記複数のシミュレートされた値の分析に従って、前記エンティティが前記ターゲットパラメータを充足しない確率を生成するリスク分類器を生成することと、を有する。
第5の態様によると、エンティティがターゲットパラメータを充足しない確率を計算するためのMLモデルアンサンブルを動的及び繰り返し利用する方法は、複数の第1の繰り返しにおいて、ターゲットパラメータを取得するためのリクエストをエンティティから受信することと、複数のネットワークノード上にインストールされたコードセンサによって抽出され、リアルタイムにサーバに投入された複数の生データ要素を受信することと、複数のMLサブモデルに前記複数の生データ要素を入力することと、前記複数のMLサブモデルから複数のサブ値を取得することと、複数の第2の繰り返しにおいて、前記生データ要素から提供又は計算されると、確率的シミュレーションモデルと事前分布のセットとに基づいて、前記複数のMLサブモデルによって出力される前記複数の取得されたサブ値に対して複数のシミュレートされた調整を計算することと、前記複数の取得されたサブ値の複数の調整されたサブ値を生成するため、前記複数のMLサブモデルによって出力される前記複数の取得されたサブ値に前記複数のシミュレートされた調整のそれぞれを適用することと、前記複数のMLサブモデルの出力に前記複数のシミュレートされた調整を適用することによって計算される前記複数の取得されたサブ値の前記複数の調整されたサブ値をメインMLモデルに入力することと、前記複数のMLサブモデルの出力に前記複数のシミュレートされた調整を適用することによって計算される前記複数の取得されたサブ値の前記複数の調整されたサブ値の入力に応答して、前記複数の第2の繰り返しにおいて前記メインMLモデルから、エンティティパラメータの複数のシミュレートされた値を取得することと、前記エンティティパラメータの前記複数のシミュレートされた値の分析に従って前記エンティティが前記ターゲットパラメータを充足しない確率を計算するリスク分類器に、前記複数のMLサブモデルによって出力されるサブ値に前記複数のシミュレートされた調整のそれぞれを適用することによって計算される前記複数の取得されたサブ値の前記複数の調整されたサブ値の入力に応答して、前記複数の繰り返しにおいて前記メインMLモデルによって出力される前記複数のシミュレートされた値を入力することと、前記確率が閾値を下回るとき、前記エンティティに前記ターゲットパラメータを自動的に提供することと、前記確率が前記閾値を上回るとき、前記ターゲットパラメータに対するリクエストを自動的に拒否することと、を有する。
第1、第2、第3、第4及び第5の態様の更なる実現形態において、前記リスク分類器は、前記複数の生データ要素が提供されると、前記複数のシミュレートされた調整のそれぞれを前記複数のMLサブモデルに適用することによって計算された前記複数の取得されたサブ値に対する前記複数の調整されたサブ値の入力に応答して、前記複数の繰り返しにおいて前記メインMLモデルによって出力される前記エンティティパラメータに対する前記複数のシミュレートされた値を計算及び利用することによって前記リスク分類器を生成するための追加的な合成データを生成することによって、初期的な入力として前記複数の生データ要素を利用して少数のショット又は単一のショット訓練アプローチに基づいて生成される。
第1、第2、第3、第4及び第5の態様の更なる実現形態において、複数のシミュレートされた調整のそれぞれは、前記複数の取得されたサブ値の個別の各サブ値に対して計算され、前記複数のシミュレートされた調整のそれぞれは、各サブ値に対して複数の調整されたサブ値を生成するため、前記複数のMLサブモデルによって出力される前記複数の取得されたサブ値の前記各サブ値に適用される。
第1、第2、第3、第4及び第5の態様の更なる実現形態において、調整されたサブ値のセットのそれぞれは、前記複数のサブ値のそれぞれに対して、前記複数のサブ値のそれぞれの前記複数のシミュレートされた調整のセットのそれぞれを計算し、前記複数のシミュレートされた調整のそれぞれを前記複数のサブ値の対応するものに適用することによって計算される。
第1、第2、第3、第4及び第5の態様の更なる実現形態において、前記複数のサブ値の各サブ値に対する前記複数のシミュレートされた調整は、前記各サブ値の増加、前記各サブ値の減少及び新たなサブ値の作成からなる群から選択される。
第1、第2、第3、第4及び第5の態様の更なる実現形態において、前記エンティティパラメータに対して最も大きな影響を有する前記複数の生データ要素の少なくとも1つの最も影響力のある生データ要素を特定することを更に含み、前記複数のシミュレートされた調整を計算することは、入力として前記少なくとも1つの最も影響力のある生データ要素を受信する前記複数のMLサブモデルの少なくとも1つのMLサブモデルによって出力されるサブ値に対して実行される。
第1、第2、第3、第4及び第5の態様の更なる実現形態において、前記複数の生データ要素の更新を繰り返し取得することと、更新された各サブ値を取得するため、前記複数のMLサブモデルに前記複数の生データ要素の更新を繰り返し入力することと、複数の更新された繰り返しにおいて、複数の調整された更新されたサブ値を取得するため、前記複数の更新されたサブ値のそれぞれに対する前記複数のシミュレートされた調整を計算することと、前記複数の調整された更新されたサブ値を前記メインMLモデルに入力することと、前記エンティティパラメータに対して複数のシミュレートされた更新された値を取得することと、前記エンティティが前記ターゲットパラメータを充足しない更新された確率を生成するため、前記複数のシミュレートされた更新された値の更新された分析を利用して、前記リスク分類器の更新を生成することと、を更に含む。
第1、第2、第3、第4及び第5の態様の更なる実現形態において、前記メインMLモデルは、前記複数のMLサブモデルによって出力される前記複数のサブ値に関連する複数のパラメータであって、複数のウェイトに関連する前記複数のパラメータの関数を含み、前記メインMLモデルを訓練することは、前記複数のウェイトを学習することを含む。
第1、第2、第3、第4及び第5の態様の更なる実現形態において、前記関数の前記複数のウェイトは、前記エンティティパラメータに影響を与える自動化された組み合わせ的変形シナリオに基づいて計算される。
第1、第2、第3、第4及び第5の態様の更なる実現形態において、前記エンティティが前記ターゲットパラメータを充足しないリスクを示す閾値を受信することを更に含み、前記分析は、シミュレートされた値のセット全体に対して前記閾値を上回る又は下回る前記シミュレートされた値に基づいてエンティティスコアを計算することによって、前記確率を計算することを含む。
第1、第2、第3、第4及び第5の態様の更なる実現形態において、前記エンティティスコアが前記ターゲットパラメータを上回るとき、前記エンティティが前記ターゲットパラメータを充足する確率を決定することを更に含む。
第1、第2、第3、第4及び第5の態様の更なる実現形態において、前記エンティティに関連する前記複数の生データ要素は、前記エンティティのデータを格納する構造化データソースから取得された構造化データ、前記エンティティの数値データを計算するデータソースから取得された数値データ、及び、オープンソース及び/又はソーシャルネットワークから取得された非構造化データからなる群から選択される。
第1、第2、第3、第4及び第5の態様の更なる実現形態において、前記複数のMLサブモデルの少なくとも1つは、(i)第1の時間間隔の間に取得される特定のタイプの前記生データ要素の値と、前記第1の時間間隔より以前の少なくとも1つの第2の時間間隔の間に取得される前記特定のタイプの生データ要素の値との間の相関ウィンドウに基づいて各メトリックを出力すること、(ii)規定されたタイプのセットの生データ要素の値が提供されると、各メトリックを計算すること、(iii)前記エンティティのタイプに従って選択された複数のサブサブモデルの組み合わせの集まりによって各メトリックを計算すること、(iv)選択されたセットの生データ要素が提供されると、前記エンティティが前記ターゲットパラメータを充足する確率を出力するサブ分類器であって、複数のサンプルエンティティのそれぞれに対して、各サンプルエンティティに関連するサンプルデータ要素と、前記各サンプルエンティティに提供される各ターゲットパラメータを充足するという指示とを含む訓練データセットに対して訓練されるサブ分類器、(v)前記エンティティパラメータに対する前記エンティティの複数のコンポーネントの1つのコンポーネントの失敗のリスクを出力すること、(vi)前記エンティティに関連するウェブサイトにアクセスするユーザを示す生データ要素の分析に基づいて、指標及び/又は予測パラメータを出力すること、(vii)外部のソーシャルネットワークサーバによって運営されるソーシャルネットワーク上で投稿されるユーザのプロファイルの分析に基づいて、前記エンティティ内のユーザの指示を出力すること、及び、(viii)前記エンティティに関連する広告及び/又はプロモーションとやりとりするユーザを示すマーケティング要素の分析に基づいて、指標及び/又は予測パラメータを出力すること、からなる群から選択される。
第1、第2、第3、第4及び第5の態様の更なる実現形態において、前記複数のシミュレートされた調整は、生データから計算又は提供されると、確率的シミュレーションモデルと事前分布のセットとに基づいて計算される。
第1、第2、第3、第4及び第5の態様の更なる実現形態において、前記方法の特徴は、サーバ上で実行される少なくとも1つのハードウェアプロセッサによって実現され、前記生データ要素は、複数のネットワークノード上にインストールされたコードセンサによって抽出され、リアルタイムにサーバに投入される。
第1、第2、第3、第4及び第5の態様の更なる実現形態において、前記エンティティは会社を含み、リクエストに規定される前記ターゲットパラメータは、前記企業に資金提供する資金調達リクエストに規定される資金を含み、前記エンティティパラメータは、前記資金調達リクエストの資金を返済するのに利用される前記エンティティの金融資産を含む。
第1、第2、第3、第4及び第5の態様の更なる実現形態において、前記エンティティに関連する前記複数の生データ要素は、前記企業の顧客を示すデータ要素、前記企業の財務詳細を示すデータ要素、及び、前記企業に関連する第三者ソースから取得されるデータ要素からなる群から選択される。
第1、第2、第3、第4及び第5の態様の更なる実現形態において、前記複数のMLサブモデルの少なくとも1つは、(i)第1の時間間隔の間の収入と、前記第1の時間間隔より以前の少なくとも1つの第2の時間間隔の間に取得される収入との間のレシオとして計算される前記企業の成長の指示であって、前記収入は、課金及び/又は請求システム統合から取得されるインボイス及び/又は支払いを含む複数の第1のタイプの生データ要素に基づいて計算される、指示、(ii)顧客情報管理(CRM)システムから取得されるインボイス、支払い及び/又はデータを含む複数の第2のタイプの生データ要素に基づいて計算される顧客チャーンの指示、(iii)複数の第3のタイプの生データ要素に基づいて計算される粗利益の指示、(iv)前記企業のビジネスタイプに従って選択される複数のサブサブモデルの組み合わせの集まりとして計算されるユニットエコノミクスの指示、(v)複数の第4のタイプの生データ要素が提供されると、前記企業がファンドを上昇させる確率を出力するサブ分類器であって、複数のサンプル企業のそれぞれに対して、前記第4のタイプのデータ要素の値と、前記それぞれの企業によって上昇されたファンドの指示とを含む訓練データセットに対して訓練されるサブ分類器、(vi)複数の第5のタイプのデータ要素が提供されると、複数の収入生成ユニットの統計分布の計算に基づいて、前記企業の複数の収入生成ユニットの1つの収入生成ユニットの前記企業に対する失敗のリスクを出力すること、(vii)前記企業に関連するウェブサイトにアクセスするユーザを示す第6のタイプのデータ要素の分析に基づいて、及び/又は提供された広告とやりとりするユーザを示す第7のタイプのデータ要素の分析に基づいて、指標及び/又は予測パラメータを出力すること、(viii)外部ソーシャルネットワークサーバによって運営されるソーシャルネットワーク及び/又はネットワークノードによって運営される更なる外部ソース上に投稿される従業員プロファイルの分析に基づいて、前記企業内の従業員の配置転換の指示を出力すること、(ix)企業リソースプラニング(ERP)システム統合を介し取得される契約及び/又は購入注文を含むコミットメントの分析に基づいて、リアルタイム短期及び/又は長期コスト予測、外部請負業者の対比による検出された予想される重要コスト、供給されるサービス価格の変更、部品表(BOM)及び/又は進行中の購入注文の指示を出力すること、からなる群から選択されるそれぞれの指標及び/又は予測パラメータを出力する。
第1、第2、第3、第4及び第5の態様の更なる実現形態において、前記リスク分類器は、前記複数の生データ要素が提供されると、前記複数のシミュレートされた調整のそれぞれを前記複数のMLサブモデルに適用することによって計算された前記複数の取得されたサブ値に対する前記複数の調整されたサブ値の入力に応答して、前記複数の繰り返しにおいて前記メインMLモデルによって出力される前記エンティティパラメータに対する前記複数のシミュレートされた値を計算及び利用することによって前記リスク分類器を生成するための追加的な合成データを生成することによって、初期的な入力として前記複数の生データ要素を利用して少数のショット又は単一のショット訓練アプローチに基づいて生成される。
第1、第2、第3、第4及び第5の態様の更なる実現形態において、複数のシミュレートされた調整のそれぞれは、前記複数の取得されたサブ値の個別の各サブ値に対して計算され、前記複数のシミュレートされた調整のそれぞれは、各サブ値に対して複数の調整されたサブ値を生成するため、前記複数のMLサブモデルによって出力される前記複数の取得されたサブ値の前記各サブ値に適用される。
第1、第2、第3、第4及び第5の態様の更なる実現形態において、前記複数の生データ要素の更新を繰り返し取得することと、更新された各サブ値を取得するため、前記複数のMLサブモデルに前記複数の生データ要素の更新を繰り返し入力することと、複数の更新された繰り返しにおいて、複数の調整された更新されたサブ値を取得するため、前記複数の更新されたサブ値のそれぞれに対する前記複数のシミュレートされた調整を計算することと、前記複数の調整された更新されたサブ値を前記メインMLモデルに入力することと、前記エンティティパラメータに対して複数のシミュレートされた更新された値を取得することと、前記エンティティパラメータの複数のシミュレートされた更新された値の分析に従って、前記エンティティが前記ターゲットパラメータを充足しない更新された確率を生成するための前記リスク分類器に前記複数のシミュレートされた更新された値を入力することと、を更に含む。
第1、第2、第3、第4及び第5の態様の更なる実現形態において、前記エンティティパラメータが前記ターゲットパラメータを充足しない繰り返し計算された更新された確率に従ってトレンドを計算し、前記エンティティが前記ターゲットパラメータを充足しない確率が閾値を上回るとき、トレンドを予測するための将来時間に前記トレンドを外挿することを更に含む。
第1、第2、第3、第4及び第5の態様の更なる実現形態において、前記複数の生データ要素の少なくとも1つの統計量の変化をモニタリングすることと、前記変化に応答して、及び/又は前記統計量の変化が有意であるとき、繰り返しをトリガすることと、を更に含む。
第1、第2、第3、第4及び第5の態様の更なる実現形態において、前記エンティティパラメータの値に最も影響する複数の影響力のあるウェイトを特定するため、前記関数の複数のウェイトを分析することと、各サブ関数が少なくとも1つの生データ要素と前記エンティティパラメータの値との間を相関させるための特定の影響力のあるウェイトに対応する、サブ関数のセットを計算することと、を更に含む。
第1、第2、第3、第4及び第5の態様の更なる実現形態において、前記複数の生データ要素の更新を繰り返し取得することに応答して、クライアント端末のディスプレイ上で提示されるインタラクティブグラフィカルユーザインタフェース(GUI)が、前記エンティティが前記ターゲットパラメータを充足しない確率を示すエンティティスコアと、事前に承認された資金調達を返済するのに十分な金融資産を取得する動的に計算された確率に基づいて決定される企業に利用可能な事前に承認された資金調達の金額との指示によって動的に更新される。
第1、第2、第3、第4及び第5の態様の更なる実現形態において、前記GUIを介し前記GUIに提示された前記事前に承認された資金調達の金額までの資金調達の金額に対するリクエストを受信することと、前記企業の口座に前記資金調達の金額を自動的に提供することと、を更に含む。
別段の断りがない場合、ここで使用される全ての技術的及び/又は科学的な用語は、本発明が属する技術分野の当業者によって一般に理解されるのと同じ意味を有する。ここに記載されるものと同様又は同等の方法及び題材が、本発明の実施例の実施又は試験において使用可能であるが、例示的な方法及び/又は題材が後述される。矛盾する場合、定義を含む本特許明細書が優先する。加えて、題材、方法及び具体例は、例示にすぎず、必ずしも限定することを意図するものではない。
本発明のいくつかの実施例は、添付の図面を参照して、単なる例示としてここに記載される。ここで図面をより詳細に参照して、図示された詳細は、例示のためであり、本発明の実施例の説明のためであることが強調される。この点に関して、図面を用いた説明は本発明の実施例がどのように実施され得るかを当業者に明らかにする。
本発明は、それのいくつかの実施例において機械学習(ML)に関し、より詳細には、限定することなく、エンティティがターゲットパラメータを充足しないリスクを計算するためのMLモデルアンサンブルを訓練及び利用するシステム及び方法に関する。
本発明のいくつかの実施例の態様は、エンティティがターゲットパラメータを充足しない確率を計算するための機械学習モデルアンサンブルを生成する(確率の計算という用語は、リスクの予測という用語と互換可能であることがある)システム、方法、装置及び/又はコード命令(メモリに格納され、1つ以上のハードウェアプロセッサによって実行可能である)に関する。MLモデルアンサンブルは、以下のコンポーネント、(i)生データ要素の入力に応答してサブ値の結果を生成するMLサブモデル、(ii)MLサブモデルによって出力されたサブ値の入力に応答して、ターゲットパラメータに対応するエンティティパラメータの値の結果を生成するメインMLモデル、及び(iii)エンティティパラメータのシミュレートされた値の分析に従って、エンティティがターゲットパラメータを充足しない確率を生成するリスク分類器、を含む。シミュレートされた値は、取得されたサブ値に対するシミュレートされた調整を計算して、調整されたサブ値を生成することによって生成される。調整されたサブ値は、シミュレートされた値を取得するためにMLモデルに入力される。MLモデルアンサンブルは、カスタマイズされ、すなわち、エンティティごとに計算されてもよい。MLモデルアンサンブルは、生データ要素に対する動的な調整に従って、エンティティがターゲットパラメータを充足しない確率を動的に計算するため、動的に更新及び利用される。リアルタイムの確率は、生データ要素のリアルタイム状況に従って生成される。
複数のシミュレートされた調整は、例えば、モンテカルロシミュレーションモデルに従って、生データ要素から提供又は計算されると、MLサブモデルによって、任意選択的には確率的シミュレーションモデルと事前分布のセットとによって出力されたサブ値に対して計算される。シミュレートされた調整の数は、サブ値の数より、例えば、約2~100、10~50、5~25又は他のファクタだけ大きい。複数のシミュレートされた調整は、一対多及び/又は多対多アプローチで計算されてもよく、すなわち、複数のシミュレートされた調整は、個別の各サブ値及び/又は各単一のサブ値について計算され、及び/又は、複数のシミュレートされた調整がサブ値について計算される。複数のシミュレートされた調整は、MLサブモデルによって出力された複数のサブ値に適用されて、それぞれのサブ値ごとに調整されたサブ値を生成する。MLサブモデルの出力にシミュレートされた調整を適用することによって計算された調整されたサブ値は、メインMLモデルに入力される。調整されたサブ値(MLサブモデルの出力にシミュレートされた調整を適用することによって計算される)の入力に応答して、エンティティパラメータのシミュレートされた値が、メインMLモデルから取得される。シミュレートされた調整を使用して、エンティティパラメータのシミュレートされた値の数は、サブ値の数よりも、例えば、約2~100、10~50、5~25又は他のファクタだけ有意に大きい。シミュレートされた値は、例えば、利用可能なサブ値、すなわち、シミュレートされていない値のみを使用してリスク分類器を訓練することと比較して、リスク分類器を訓練するのに利用可能なデータの量を増加させる。
エンティティパラメータのシミュレートされた調整、調整されたサブ値及びシミュレートされた値は、単一ショット又は少数ショットの学習と同様に、グラウンドトゥルース(ground truth)が利用可能でないか、又はグラウンドトゥルースがエンティティに対してほとんど利用可能でないとき、エンティティがターゲットパラメータを充足しない予測を計算することを可能にする。MLモデルアンサンブルは、以前の予測及び/又は履歴データが過去に充足されたか否かの履歴データなく、予測を計算する。無限の可能なエンティティパラメータ結果のサブサンプリングされた分布“空間”を示す複数シミュレーション値が、エンティティがターゲットパラメータを充足しない集計された全体的確率を計算するため分析されてもよい。調整されたサブ値を取得するためのサブ値に対するシミュレートされた調整は、ターゲットパラメータを充足するためのグラウンドトゥルースデータがエンティティのために実際に利用可能でないか、又はほとんどない場合であっても、エンティティがターゲットパラメータを充足しない確率を生成するリスク分類器を計算するための充分なデータを生成することを可能にする。
MLモデルアンサンブルは、以下の例示的なプロセスを使用して生成されうる。それぞれが対応する生データ要素の入力に応答してサブ値を出力する複数のMLサブモデルが訓練される。メインMLモデルは、MLサブモデルによって出力されたサブ値の入力に応答して、ターゲットパラメータに対応するエンティティパラメータの値を出力し、訓練される。メインMLモデルは、サンプルエンティティの各々について、MLサブ値(各サンプルエンティティに関連する生データ要素の入力に応答してMLサブモデルによって出力される)及び対応するエンティティパラメータ(すなわち、グラウンドトゥルースとしての役割を果たす)を含む訓練データセットを使用して訓練されうる。エンティティに関連する生データ要素は、訓練されたMLサブモデルに入力され、各サブ値の出力を取得する。複数の繰り返しにおいて、取得されたサブ値に対するシミュレートされた調整が計算され、調整されたサブ値を生成する。調整されたサブ値は、メインMLモデルに入力される。エンティティパラメータに対する多数のシミュレートされた値のセットが、繰り返しにわたってメインMLモデルの結果として取得される。エンティティがターゲットパラメータを充足しない確率を生成するリスク分類器は、エンティティパラメータのシミュレートされた値のセットを分析するためのプロセスとして生成される。MLサブモデル、メインMLモデル及びリスク分類器を含むMLモデルアンサンブルが提供される。
MLモデルアンサンブルは、以下の例示的な処理を使用して、エンティティがターゲットパラメータを充足しない確率を計算するため使用されうる。ターゲットパラメータを取得するためのエンティティからのリクエストが受信される。任意選択的には、ネットワークノード上にインストールされるコードセンサによって抽出され、リアルタイムにサーバに投入される生データ要素が受信される。生データ要素は、MLサブモデルに入力される。サブ値は、MLサブモデルの結果として取得される。
取得されたサブ値に対するシミュレートされた調整は、調整されたサブ値を生成するため計算されてもよく、それは、エンティティパラメータに対するシミュレートされた値を取得するためメインMLモデルに入力される。シミュレートされた調整を計算するプロセスは、エンティティパラメータのシミュレートされた値のセットを取得するため繰り替えされてもよい。シミュレートされた値のセットは、エンティティがターゲットパラメータを充足しない確率を計算するリスク分類器に入力される。リスク分類器は、エンティティパラメータについての設定されたシミュレートされた値の分析に従って確率を計算する。リスク分類器は、エンティティがターゲットパラメータを充足しない確率を示すエンティティスコアを計算してもよい。エンティティスコアは、閾値を上回るシミュレートされた各値のサブセットと、ターゲットパラメータを充足する又は充足しないバイナリ条件を規定する閾値を下回るシミュレートされた各値の他のサブセットとに適用される関数によって計算されてもよい。プロセスの特徴は、例えば、更新されたリクエストに応答して、及び/又は、生データ要素の値の更新に応答して、エンティティがターゲットパラメータを充足しない確率に対する動的な更新を取得するため、動的に繰り替えされてもよい。ターゲットパラメータは、確率が閾値を下回るとき、エンティティに自動的に提供されてもよい。あるいは、ターゲットパラメータに対するリクエストは、確率が閾値を上回るときに自動的に拒否されてもよい。
一例では、エンティティは、会社、例えば、個人事業主、スタートアップ、企業及び/又は他の事業関連組織である。ターゲットパラメータは、企業の資金調達のための資金調達リクエストに示される金銭的資金に関連する。エンティティパラメータは、資金調達リクエストの資金を返済するために使用されるエンティティの金融資産を示す。MLモデルアンサンブルは、既存及び/又は予測された金融資産を使用して、会社が資金を返済する能力と、会社が所与の資金を返済できない関連するリスクとのリアルタイムな指示を提供する。例えば、MLモデルアンサンブルは、会社に資金を提供するためのリアルタイムの継続的な引受プロセスを提供する。MLモデルアンサンブルは、会社が現在及び将来/追加の資金を返済できないリスクを決定する。任意選択的には、許容可能なリスクによって、会社が返済することができる資金額のリアルタイム予測は、GUIに提示される。許容可能なリスクは、例えば、ここに記載される閾値として、資金調達エンティティによって決定されうる。GUIは、MLモデルアンサンブルによって出力される許容可能なリスクで会社が引き出すために利用可能な資金額の予測に対する継続的な変更に基づいて事前承認された資金額を提示するように動的に更新されうる。会社は、GUIに提示されるリアルタイム資金の事前額までを要求してもよい。当該金額は、会社の口座に自動的に預け入れされてもよい。
ここに記載されるシステム、方法、装置及び/又はコード命令の少なくともいくつかの実施形態は、単一ショット又は少数ショット学習のコンセプトと同様に、エンティティのためにグラウンドトゥルースが利用可能でない、又は、グラウンドトゥルースがほとんど利用可能でないときに、エンティティがターゲットパラメータを充足しない予測を動的に効率的に計算する技術的問題に関する。ここに記載されるシステム、方法、装置及び/又はコード命令の少なくともいくつかの実施形態は、生データ要素の値が動的に適応される環境において、エンティティのターゲットパラメータに対する予測を動的に効率的に計算する技術的問題に関する。ここに記載されるシステム、方法、装置及び/又はコード命令の少なくともいくつかの実施形態は、グラウンドトゥルースが利用可能でないとき、エンティティによってターゲット値に達する確率を予測するMLモデルアンサンブルを計算することによって、機械学習の分野を改善する。予測は、会社が将来資金を返済するのに十分な資産を蓄積する確率に対するものであってもよい。このような場合、会社が比較的新しく、ローンを取得し、それを返済した履歴がほとんどないか、又は全くない場合、グランドトゥルースは利用可能でないかもしれない。MLモデルアンサンブルは、例えば、過去に資金を受け取っていない、及び/又は、過去の財務データがほとんど又は全く利用可能でない新規の会社(例えば、スタートアップ)について、過去の予測及び/又は履歴データが過去に充足されていたか否かの履歴データがなくても、予測を計算する。(それぞれのエンティティごとにカスタマイズされうる)メインMLモデルに入力される調整されたサブ値を生成するため、MLサブモデルによって出力されるサブ値に対するシミュレートされた調整、任意選択的にはベイズシミュレートされた調整は、エンティティパラメータのための複数のシミュレートされた値を生成することを可能にする。シミュレートされた各値は、シミュレートされた調整によって表される可能な予測シナリオに基づいて、エンティティパラメータについての1つの可能な予測を表す。無限に可能なエンティティパラメータ結果のサブサンプリングされた分布“空間”を示す複数のシミュレートされた値は、エンティティがターゲットパラメータを充足しない集計された確率全体を計算するため分析されてもよい。複数のシミュレートされた値は、ターゲットパラメータを充足するためのグラウンドトゥルースデータが実際にエンティティに利用可能でないとき、又はほとんど利用可能でないときであっても、リスク分類器を計算するため、エンティティがターゲットパラメータを充足しない確率を計算するため、及び/又は、MLモデルアンサンブルを計算するため(すなわち、エンティティがターゲット値を充足する確率を予測するため)、十分なデータを提供する。
ここに記載されるシステム、方法、装置及び/又はコード命令の少なくともいくつかの実施形態は、エンティティがターゲット値を充足しない確率を予測する精度を向上させる技術的問題に関する。ここに記載されるシステム、方法、装置及び/又はコード命令の少なくともいくつかの実施形態は、エンティティにカスタマイズされるMLモデルアンサンブルを計算することによって、機械学習の分野を改善する。(ここで説明されるように)調整されたサブ値を取得するためのサブ値に対するシミュレートされた調整は、エンティティがターゲットパラメータを充足しない確率を生成するリスク分類器を計算するのに十分なデータを生成することを可能にする。サブ値に対するシミュレートされた調整は、特定のエンティティにカスタマイズされ、必ずしも他のエンティティのデータに依存しない。他のエンティティのデータが、メインMLモデルを作成するのに利用されてもよく、複数の調整されたサブ値が、特定のエンティティのエンティティパラメータのシミュレートされた値のセットを取得するためメインMLモデルに繰り返し入力される。対照的に、ニューラルネットワーク及び/又は他の標準的な分類器などの標準的アプローチを利用して、値の予測は、特定のエンティティの予測をするためサンプルエンティティのデータを使用する試みにおいて、グラウンドトゥルースとしてターゲットを充足した及び充足しなかった他のサンプルエンティティのデータについて訓練することによって直接的に取得される。特定のエンティティのサブ値のシミュレートされた調整は、標準的なアプローチでは実行されない。他のエンティティは、分析される現在のエンティティとは本質的に異なっているため、他のエンティティのデータに対して訓練されたこのような標準的な分類器は、本質的にここに記載されるMLモデルアンサンブルよりも精度が低い。他のエンティティがターゲットを充足したか否かのデータのみを用いることは、分析されている現在のエンティティがターゲットを充足するか否かの確率のより低い推定精度を提供する。エンティティパラメータのシミュレートされた値のセットを取得するためメインMLモデルに入力される調整されたサブ値を生成するためのサブ値に対するシミュレーション調整は、当該セットが全体として分析されるとき、エンティティパラメータのシミュレートされた値のより正確なセットを提供する。シミュレートされた値のセットは、発生し得る多くの予測シナリオを表す。予測されたシナリオの集約は、エンティティがターゲットパラメータを充足しない確率全体のより正確な計算を提供する。対照的に、標準的なアプローチは、複数の予測シナリオを考慮しないが、確率値を直接的に出力する標準的な分類器を使用する。
ここに記載されるシステム、方法、装置及び/又はコード命令の少なくともいくつかの実施形態は、コンピュータを使用するユーザの体験を改善する。この改善は、サーバ上で実行されるMLモデルアンサンブルにデータ要素が提供されると、取得されたデータ要素を使用してMLモデルアンサンブルによって予測されるターゲット値をエンティティが充足する確率のリアルタイムな更新のため、ネットワークノードからデータ要素を取得するコードセンサ及び/又は他のコードによって少なくとも取得される。例えば、会社が取得しうる追加の資金額は、ネットワークノードソースからのデータ要素の更新に基づいてリアルタイムに計算される。追加の資金調達は、会社が追加の資金調達を返済するのに十分な将来の資産を有する確率に基づいて、MLモデルアンサンブルによって計算されてもよい。リアルタイムな更新は、グラフィカルユーザインタフェース、例えば、ダッシュボードに提示されてもよい。コードセンサは、ユーザインタフェースのリアルタイムな更新のため、MLモデルアンサンブルへの更新されたデータ要素のリアルタイムな提供を可能にする。例えば、コードセンサは、ユーザインタフェースのストリーミング更新のため、動的に収集されたデータ要素をMLモデルアンサンブルにストリーミングしてもよい。リアルタイムな更新は、コードセンサによって取得されたリアルタイムデータ、例えば、ユーザによる会社のウェブサイトへのリアルタイムアクセス、収入のリアルタイム成長などに基づいて、会社の実質的にリアルタイム状態を反映する。将来の資金返済能力の変化の予測は、過去のリアルタイム予測の傾向に基づいて計算されてもよく、将来の資金予測を可能にしうる。例えば、ある会社が潜在的な資金の月次増加に換算される支払い能力の月次増加を経験すると、その会社が非常に多額の返済を行う可能性が高いと予測される時期について予測を行うことができる。ユーザは、当該予測に基づいて、非常に多額が利用可能になるまで待機することを選択してもよい。ユーザは、十分な履歴結果が利用可能になるまで待つ必要なく、リアルタイムで追加の資金を要求し、承認されうる。
ここに記載されるシステム、方法、装置及び/又はコード命令の少なくともいくつかの実施形態は、会社を引き受けるために十分なデータを取得する技術的問題に関し、任意選択的には、継続的に引き受け、特に、会社に対するリアルタイムの引き受けを提供するためにどのようにリアルタイムデータを取得及び使用するか、及び/又は引き受けに影響を及ぼす会社のリスクの変化をどのように監視するかに関する。また、標準的なアプローチは、新しい会社については利用可能出なく、会社に影響を及ぼす可能性のある将来のシナリオを正確に予測することができない会社の履歴データを利用することに基づいている。他の会社のデータを使用することに基づく他の標準的なアプローチは、そのようなデータが評価される会社に必ずしも適用可能ではないため、不正確である。ここで説明されるシステム、方法、装置及び/又はコード命令の少なくともいくつかの実施形態は、サブ値を取得するためMLサブモデルに会社に関連する生提供された生データ要素を使用し、調整されたサブ値を取得するためサブ値に対するシミュレートされた調整を計算することによって、技術的問題に対する解決策を提供する。シミュレートされた分布に基づく調整は、例えば、単一の予測を試みるのではなく、複数の異なる妥当な予測シナリオを表す。調整されたサブ値は、他の会社のデータ又は共同する専門家の知識を使用して訓練されたメインMLモデルに入力され、他の会社のデータ及び/又は多くの主題の専門家の分析技術(強化学習)に基づく予測を提供してもよい。メインMLモデルから取得される複数のシミュレートされた値は、会社の無限のシナリオ空間のもっともらしい(局所的)サブサンプリングされた空間を表す企業に対する多くの異なる予測を表す。生成されたリスク分類器は、エンティティがターゲットパラメータを充足しない全体的な(例えば、単一の)予測確率を表す全体的に最も可能性の高いシナリオに到達するため、複数のシミュレートされた値を分析する。ここに記載されるMLモデルアンサンブルは、例えば、標準的な引受アプローチと比較して、エンティティがターゲットパラメータを充足しない確率の増加された精度、及び/又はエンティティがターゲットパラメータを充足しない確率のリアルタイム監視の増加した精度を提供する。
本発明の少なくとも1つの実施例を詳細に説明する前に、本発明は、その出願において以下の説明に記載され、及び/又は図面及び/又は具体例に示される構成要素及び/又は方法の構成及び配置の詳細に必ずしも限定されないことを理解されたい。本発明は、他の実施例が可能であり、又は様々な方法で実施又は実行することが可能である。
本発明は、システム、方法及び/又はコンピュータプログラム製品であってもよい。コンピュータプログラム製品は、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令を有するコンピュータ可読記憶媒体(又はメディア)を含んでもよい。
コンピュータ可読記憶媒体は、命令実行デバイスによる使用のための命令を保持及び記憶することができる有形のデバイスでありうる。コンピュータ可読記憶媒体は、例えば、電子記憶デバイス、磁気記憶デバイス、光記憶デバイス、電磁気記憶デバイス、半導体記憶、又はこれらの任意の適した組合せであってもよいが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例の非網羅的なリストは、ポータブルコンピュータディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、読取専用メモリ(ROM)、消去可能プログラマブル読取専用メモリ(EPROM又はフラッシュメモリ)、スタティックランダムアクセスメモリ(SRAM)、ポータブルコンパクトディスク読取専用メモリ(CD-ROM)、デジタル多用途ディスク(DVD)、メモリスティック、フロッピーディスク、及び上述した任意の適した組合せを含む。ここで用いられるようなコンピュータ可読記憶媒体は、電波又は他の自由に伝播する電磁波、導波管又は他の伝送媒体(例えば、光ファイバケーブルを通過する光パルス)を伝播する電磁波、又はワイヤを介して伝送される電気信号など、それ自体が一時的な信号であると解釈されるべきではない。
ここで説明されるコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体から各計算/処理デバイスに、又は、ネットワーク、例えば、インターネット、ローカルエリアネットワーク、ワイドエリアネットワーク及び/又は無線ネットワークを介して外部コンピュータ又は外部記憶デバイスにダウンロードされうる。ネットワークは、銅伝送ケーブル、光伝送ファイバ、無線伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイコンピュータ及び/又はエッジサーバを含んでもよい。各計算/処理デバイスにおけるネットワークアダプタカード又はネットワークインタフェースは、ネットワークからコンピュータ可読プログラム命令を受信し、それぞれの計算/処理デバイス内のコンピュータ可読記憶媒体に記憶するためコンピュータ可読プログラム命令を転送する。
本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、マシーン命令、マシーン依存命令、マイクロコード、ファームウェア命令、状態設定データ、又は、Smalltalk、C++などのオブジェクト指向プログラミング言語と“C”プログラミング言語又は同様のプログラミング言語などの従来の手続き型プログラミング言語を含む、1つ以上のプログラミング言語の任意の組合せで記述されたソースコード又はオブジェクトコードの何れかであってもよい。コンピュータ可読プログラム命令は、完全にユーザのコンピュータ上で、部分的にユーザのコンピュータ上で、スタンドアロンソフトウェアパッケージとして、部分的にユーザのコンピュータ上で、部分的にリモートコンピュータ上で、又は、完全にリモートコンピュータ若しくはサーバ上で実行されてもよい。後者のシナリオでは、リモートコンピュータは、ローカルエリアネットワーク(LAN)又はワイドエリアネットワーク(WAN)を含む任意のタイプのネットワークを介してユーザのコンピュータに接続されてもよいし、あるいは、外部コンピュータ(例えば、インターネットサービスプロバイダを用いてインターネットを介して)に接続されてもよい。いくつかの実施例では、例えば、プログラマブル論理回路、フィールドプログラマブルゲートアレイ(FPGA)、又はプログラマブル論理アレイ(PLA)を含む電子回路が、本発明の態様を実行するため、電子回路をパーソナライズするためのコンピュータ可読プログラム命令の状態情報を利用することによって、コンピュータ可読プログラム命令を実行してもよい。
本発明の態様は、本発明の実施例による方法、装置(システム)及びコンピュータプログラム製品のフローチャート及び/又はブロック図を参照してここに記載される。フローチャート及び/又はブロック図の各ブロック並びにフローチャート及び/又はブロック図のブロックの組合せは、コンピュータ可読プログラム命令によって実現可能であることを理解されたい。
これらのコンピュータ可読プログラム命令は、汎用コンピュータ、専用コンピュータ又は他のプログラマブルデータ処理装置のプロセッサに提供され、コンピュータ又は他のプログラマブルデータ処理装置のプロセッサを介して実行される命令が、フローチャート及び/又はブロック図のブロックに指定された機能/動作を実現するための手段を作成するように、マシーンを生成してもよい。これらのコンピュータ可読プログラム命令は、コンピュータ、プログラマブルデータ処理装置及び/又は他のデバイスに特定の方法で機能するように指示することが可能なコンピュータ可読記憶媒体に記憶されてもよく、命令を記憶したコンピュータ可読記憶媒体は、フローチャート及び/又はブロック図のブロックにおいて指定された機能/動作の態様を実現する命令を含む製品を含む。
コンピュータ可読プログラム命令はまた、コンピュータ、他のプログラマブルデータ処理装置又は他のデバイス上にロードされて、処理ステップの系列をコンピュータ、他のプログラマブル装置又は他のデバイス上で実行させ、コンピュータ、他のプログラマブルデータ処理装置又は他のデバイス上で実行される命令がフローチャート及び/又はブロック図のブロックで指定された機能/動作を実現するように、コンピュータにより実現される処理を生成する。
図におけるフローチャート及びブロック図は、本発明の各種実施例によるシステム、方法及びコンピュータプログラム製品の可能な実施形態のアーキテクチャ、機能及び動作を示す。この点に関して、フローチャート又はブロック図の各ブロックは、指定された論理機能を実現するための1つ以上の実行可能命令を備えるモジュール、セグメント又は命令の一部を表しうる。いくつかの代替的な実施形態では、ブロックに記載された機能は、図に記載された順序から外れて実行されてもよい。例えば、連続して示される2つのブロックは、実際には、実質的に同時に実行されてもよく、あるいは、ブロックは、関与する機能に応じて逆の順序で実行されてもよい。ブロック図及び/又はフローチャートの各ブロックと、ブロック図及び/又はフローチャートのブロックの組合せとは、指定された機能若しくは動作を実行するか、あるいは、専用ハードウェアとコンピュータ命令との組合せを実行する専用ハードウェアベースのシステムによって実現可能であることにも留意されたい。
ここで、本発明のいくつかの実施例によるエンティティがターゲットパラメータを充足しない確率を計算するためのMLモデルアンサンブルを生成する方法のフローチャートである図1Aが参照される。また、本発明のいくつかの実施例によるエンティティがターゲットパラメータを充足しない確率を計算するためのMLモデルアンサンブルを使用する方法のフローチャートである図1Bが参照される。また、本発明のいくつかの実施例によるエンティティがターゲットパラメータを充足しない確率を計算するためのMLモデルアンサンブルを生成及び/又は使用するシステム200のブロック図である図2が参照される。システム200は、記憶デバイス206(メモリ及び/又はプログラムストアとも呼ばれる)に記憶されるコード命令206Aを実行する計算デバイス204のプロセッサ202による図1A及び/又は図1Bを参照して説明される方法の動作を実現してもよい。
計算デバイス204に基づくシステム200の複数のアーキテクチャが実現されてもよい。例示的な実施形態では、コード206Aを記憶する計算デバイス204は、例えば、ソフトウェアをサービス(SaaS)としてクライアント端末212に提供したり、ソフトウェアインタフェース(例えば、アプリケーションプログラミングインタフェース(API)、ソフトウェアデベロップメントキット(SDK))を使用してアクセス可能なソフトウェアサービスを提供したり、クライアント端末212にローカルダウンロードのためのアプリケーションを提供したり、及び/又は、ウェブブラウザなどを介してクライアント端末212にリモートアクセスセッションを使用して機能を提供するなど、ネットワーク214を介し1つ以上のクライアント端末212にサービス(例えば、図1A及び/又は図1Bを参照して説明される動作の1つ以上)を提供する1つ以上のサーバ(例えば、ネットワークサーバ、ウェブサーバ、コンピューティングクラウド、仮想サーバ)として実装されてもよい。例えば、複数のユーザが、それぞれのクライアント端末212を使用して、計算デバイス204によって集中的に提供されるサービスに加入する。警告及び/又は更新が、計算デバイス204によってそれぞれのクライアント端末212に提供される。他の実施形態では、計算デバイス204は、例えば、クライアント端末のユーザによって使用されるように設計された自己完結型のクライアント端末として、図1A及び/又は図1Bを参照して説明される動作の1つ以上を実行するローカルに記憶されたソフトウェア(例えば、コード206A)を含んでもよい。
別の実施形態では、各クライアント端末212は、ローカルの設置及び使用のため、計算デバイス204(ここで説明されるようなMLモデルアンサンブル216Aを計算及び/又は更新しうる)から、カスタマイズされうるそれぞれのMLモデルアンサンブル216Aを取得してもよい。各クライアント端末212は、ローカルの使用のためそれ自体のカスタム計算された訓練済みMLモデル216Aアンサンブルを記憶してもよい。
各MLモデルアンサンブル216Aは、ここに説明されるようなMLサブモデル216A-1、メインMLモデル216A-2及びリスク分類器216A-3の1つ以上を含んでもよい。
各MLモデルアンサンブル216A又はその構成要素は、エンティティ毎にカスタム作成されてもよい。例示的な実施形態では、アンサンブル216AのMLサブモデル216A-1は、MLサブモデル216A-1が複数の異なるエンティティに関連するデータを使用して作成され、異なるエンティティに使用されるという意味で、カスタマイズされない。メインMLモデル216A-2及びリスク分類器216A-3は、各エンティティに対してカスタマイズされうる。そのような実施形態では、複数のカスタマイズされたMLモデルアンサンブル216Aは、共通のMLサブモデル216A-1を共有し、カスタマイズされたメインMLモデル216A-2及びカスタマイズされたリスク分類器216A-3を含んでもよい。サーバ210(ここでは、ネットワークノードとも呼ばれる)は、生データ要素を抽出するコードセンサ210A(例えば、サーバ210のデータ記憶デバイス上にインストールされ、サーバ210のハードウェアプロセッサによって実行される)と関連付けされてもよい。生データ要素は、ここで説明されるように、例えば、API及び/又はSDKを介し、ネットワーク214を介して計算デバイス204に送信される。
計算デバイス204のプロセッサ202は、例えば、中央処理ユニット(CPU)、グラフィック処理ユニット(GPU)、フィールドプログラマブルゲートアレイ(FPGA)、デジタル信号プロセッサ(DSP)及び特定用途向け集積回路(ASIC)として実現されうる。プロセッサ202は、クラスタ及び/又は1つ以上のマルチコア処理デバイスとして、並列処理のため構成された単一のプロセッサ又は複数の(同種又は異種の)プロセッサを含みうる。
データ記憶デバイス206は、プロセッサ202によって実行可能なコード命令を記憶し、例えば、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)及び/又は記憶デバイス、例えば、不揮発性メモリ、磁気媒体、半導体記憶デバイス、ハードドライブ、着脱可能なストレージ及び光学媒体(例えば、DVD、CD-ROM)などでありうる。記憶デバイス206は、例えば、相関の計算、シミュレートされた調整の計算、シミュレートされた値の計算、カスタマイズされたMLモデルの訓練、GUIの提示及び/又はGUIの計算日のための命令の生成、及び/又は図1A~1Bを参照して説明された他の機能など、プロセッサ202によって実行されると、図1A~1Bを参照して説明した方法の1つ以上の機能及び/又は動作を実現するコード206Aを記憶する。
計算デバイス204は、例えば、ここで説明されるように計算及び/又は更新されるMLモデルアンサンブル216A、MLモデルアンサンブル216Aを訓練するため及び/又は関連するMLサブモデル216A-2(例えば、受信された生データ要素)を訓練するためのデータを記憶する訓練データセット216C、及び/又はここに説明されるGUIを実行するためのGUIコード216D(例えば、各クライアント端末212にローカル、リモート及び/又はダウンロードするため)の1つ以上など、データを記憶するためのデータリポジトリ216を含みうる。データリポジトリ216は、例えば、メモリ、ローカルハードドライブ、仮想ストレージ、着脱可能なストレージユニット、光ディスク、ストレージデバイス、リモートサーバ及び/又はコンピューティングクラウド(例えば、ネットワーク接続を利用してアクセスされる)として実現されてもよい。
ネットワーク214は、例えば、インターネット、ローカルエリアネットワーク、仮想プライベートネットワーク、無線ネットワーク、セルラネットワーク、ローカルバス、ポイント・ツー・ポイントリンク(例えば、有線)及び/又は上述の組み合わせとして実現されてもよい。
計算デバイス204は、例えば、ネットワークインタフェースカード、無線ネットワークに接続するための無線インタフェース、ネットワーク接続のためのケーブルに接続するための物理インタフェース、ソフトウェアで実現される仮想インタフェース、ネットワーク接続の上位レイヤを提供するネットワーク通信ソフトウェア及び/又は他の実施形態の1つ以上など、ネットワーク214に接続するためのネットワークインタフェース218を含みうる。
計算デバイス204は、
・(構造化及び/又は非構造化データ)生データ要素の取得元のサーバ210
・ここに説明されるような計算デバイス204にリモートアクセスするユーザによって利用されうるクライアント端末212
の1つ以上と、ダイレクトリンク(例えば、ケーブル、無線)及び/又は非ダイレクトリンク(例えば、サーバ及び/又はストレージデバイスなどの仲介する計算ユニットを介し)を介してなど、ネットワーク214(又は他の通信チャネル)を利用して接続する。
・(構造化及び/又は非構造化データ)生データ要素の取得元のサーバ210
・ここに説明されるような計算デバイス204にリモートアクセスするユーザによって利用されうるクライアント端末212
の1つ以上と、ダイレクトリンク(例えば、ケーブル、無線)及び/又は非ダイレクトリンク(例えば、サーバ及び/又はストレージデバイスなどの仲介する計算ユニットを介し)を介してなど、ネットワーク214(又は他の通信チャネル)を利用して接続する。
計算デバイス204及び/又はクライアント端末212は、ユーザがデータを入力し、及び/又はデータを閲覧するための機構(例えば、生成されたアラート、自動化されたアクション及び/又は手動で必要とされる承認)を任意選択的にGUI内に含む1つ以上の物理ユーザインタフェース208を含む、及び/又はそれと通信する。例示的なユーザインタフェース208は、例えば、タッチスクリーン、ディスプレイ、キーボード、マウス、及び、スピーカとマイクロホンとを使用する音声により起動するソフトウェアの1つ以上を含む。
本発明のいくつかの実施例によるエンティティがターゲットパラメータを充足しない確率を計算するための機械学習モデルアンサンブルを生成する方法のフローチャートである図1Aが参照される。また、本発明のいくつかの実施例によるエンティティがターゲットパラメータを充足しない確率を計算するための機械学習モデルを使用する方法のフローチャートである図1Bが参照される。
少なくともいくつかの実施例では、ここに説明されるMLモデルアンサンブルは、動的に更新され、動的に使用され、訓練フェーズと推論フェーズとの組み合わせを提供する。図1Aと同様のMLモデルアンサンブルの生成は、図1Bと同様のMLモデルアンサンブルの使用と同時、順次、並列、以降及び/又は組み合わせて実現されうることに留意されたい。例えば、いくつかの訓練の特徴は、推論の特徴と統合され(例えば、同時、以前、以降、並列)、MLモデルアンサンブルの動的な更新及び使用のための方法を提供する。
ここで図1Aに戻って参照すると、102において、複数のMLサブモデルが訓及び/又は提供される。各MLサブモデルは、それぞれの生データ要素の入力に応答してサブ値を出力する。
MLサブモデルは、例えば、実行されると、生データ要素から1つ以上のサブ値のそれぞれを計算するコードとして実現されてもよい。MLサブモデルの例示的な実施形態は、ルールのセット、関数、分類器、各種アーキテクチャのニューラルネットワーク(例えば、人工、深層、畳み込み、完全接続)、マルコフチェーン、サポートベクタマシーン(SVM)、回帰(例えば、線形、リッジ、ラソン、アイソトニックなど)、ロジスティック回帰、k最近傍、特異スペクトル解析(SSA)、フィールドアウェア分解マシーン(FFM)及び決定木の1つ以上又は組み合せを含む。
例示的なMLサブモデルは、以下の1つ以上を含む。
(i)第1の時間間隔の間に取得された特定のタイプの生データ要素の値と、第1の時間間隔以前の少なくとも1つの第2の時間間隔の間に取得された特定のタイプの生データ要素の値との間の相関ウィンドウに基づいて各自のメトリックを出力するMLサブモデル。例えば、ウィンドウ内の値がどれだけ密接に相関しているかを示す値(例えば、0は相関がないことを示し、1は完全な相関を示す)、及び/又は、ウィンドウ間の値の関係を示す値、例えば、ウィンドウ間の値のパーセンテージの増加又は減少(例えば、前のウィンドウに対する現在のウィンドウの30%の増加)。
(i)第1の時間間隔の間に取得された特定のタイプの生データ要素の値と、第1の時間間隔以前の少なくとも1つの第2の時間間隔の間に取得された特定のタイプの生データ要素の値との間の相関ウィンドウに基づいて各自のメトリックを出力するMLサブモデル。例えば、ウィンドウ内の値がどれだけ密接に相関しているかを示す値(例えば、0は相関がないことを示し、1は完全な相関を示す)、及び/又は、ウィンドウ間の値の関係を示す値、例えば、ウィンドウ間の値のパーセンテージの増加又は減少(例えば、前のウィンドウに対する現在のウィンドウの30%の増加)。
エンティティが会社である例では、MLサブモデルは、第1の時間間隔の間の収入と、第1の時間間隔の以前の少なくとも1つの第2の時間間隔の間に取得された収入との間の比率として計算された当該会社の成長の指示を出力する。収入は、複数の第1のタイプの生データ要素、例えば、インボイス及び/又は支払い(例えば、銀行取引、会計システムで検証された)などの収入の流れに基づいて計算されてもよく、これは、請求及び/又は会計システムから(例えば、システムとの統合を介して)取得されてもよい。
(ii)例えば、関数及び/又は他の数学的関係を使用して、規定されたタイプの生データ要素のセットの値が提供されると、それぞれのメトリックを計算するMLサブモデル。
エンティティが企業である例では、MLサブモデルは、第2のタイプの生データ要素、例えば、請求書、支払い、及び/又は顧客情報管理(CRM)システムからのデータの入力に基づいて計算された顧客チャーンの指示を出力する。例えば、MLサブモデルは、新しい顧客の対話(例えば、登録、購入など)を集団(例えば、ユーザのセット)のための期間(すなわち、ウィンドウ)にグループ化するようにインボイスデータを処理することによって計算される顧客行動モデルとして実現されてもよい。各集団について、MLサブモデルは、当該集団から戻った顧客の数及び収入、並びに後続のウィンドウにおいて経時的に収入がどのように変化したかを反映するように計算される。時間ウィンドウの変化は、集団毎の戻った顧客の数、顧客の平均寿命値、及び/又は収入に関する平均及び/又は限界的な寿命値に関するチャーン/解約(churn)を示す。
エンティティが会社である別の例では、MLサブモデルは、第3のタイプの生データ要素に基づいて計算された粗利益の指示を出力する。例えば、MLサブモデルは、収入及び/又は経費の流れ(例えば、COGS、OPEXなどオーガニック製品の販売収入)にセグメント化された会計及び/又は銀行データから計算されるビジネス指向モデルとして実現されてもよい。MLサブモデルは、期間(すなわち、相関ウィンドウ)にわたる粗利益(gross margin)の変化を示しうる。粗利益は、売上収入の合計から売上収入によって除算されたウィンドウの全ての関連する売上原価を差し引いたものとして計算されてもよい。収入予測のためのサブモデル及び売上原価/コスト予測のサブモデルを使用することによって、予想される将来の粗利益を経時的に予測するためのモデルが得られる。
(iii)エンティティのタイプに従って選択された複数のサブサブモデルの出力の組み合わせの集約によって各自のメトリックを計算するMLサブモデル。サブサブモデルの共通のセットが規定されてもよく、そこからサブセットはエンティティのタイプに応じて選択される。異なるサブセットが、異なるタイプのエンティティから選択されてもよい。集約は、例えば、サブセットのメンバーによって出力された値の平均、及び/又はサブセットのメンバーの出力が提供されると、値を出力する関数であってもよい。
エンティティが会社である例では、サブサブモデルのサブセットは、例えば、会社の構造(例えば、個人の所有者、企業、非プロファイル)及び/又は会社の業種(例えば、レストラン、ハイテク、サービス)など、会社のタイプに応じて選択されてもよい。MLサブモデルは、会社の業種に従って選択されたサブサブモデルの出力の組み合わせの集約として計算されたユニットエコノミクスの指示を出力してもよい。
例えば、MLサブモデルは、基本的なビジネスオファーを測定するビジネス指向モデルとして実現されうる。ユニットエコノミクス(unit economics)は、業種間で異なる(例えば、製品指向ビジネス対資産指向ビジネス、すなわち、消費者への製品販売対消費者への賃貸)。ユニットエコノミクスMLサブモデルは、選択されたビジネスクラス(例えば、SaaS、Eコマース、不動産など)について計算されうる。MLサブモデルは、会社の基本的な収入生成ユニットを示すMLサブモデルを計算するため、例えば、経時的なARPA、ARPU、CACなどの複数のサブサブモデルを含む。ユニットエコノミクスMLサブモデルの生成に含まれるサブサブモデル間の基本ユニット及び相互作用を評価することによって、ここに記載されるように、会社のコア単位エコノミクスを評価し、ビジネスモデルユニットエコノミクスがビジネスの目標(すなわち、成長)を支援することができない境界を見つけることを可能にし、及び/又は、融資又は負債を支払う前に会社を債務不履行にさせうる制約された選択されたランダムシナリオ(モンテカルロアルゴリズム)の大きな集合(ここに記載されるように)がシミュレートされてもよい。
(iv)選択されたセットの生データ要素が提供されると、エンティティがターゲットパラメータを充足する確率を出力するサブ分類器として実現されるMLサブモデル。サブ分類器は、複数のサンプルエンティティのそれぞれについて、各サンプルエンティティに関連するサンプルデータ要素と、各サンプルエンティティに提供されたそれぞれのターゲットパラメータを充足することの指示(例えば、ターゲットパラメータが充足されるか否か)とを含む訓練データセット上で訓練されうる。
エンティティが会社である例では、サブ分類器は、サブ分類器に第4のタイプの生データ要素の入力が提供されると、会社が資金を調達する可能性を示す確率(例えば、パーセント又は可能性が高い若しくは可能性が低いことを示すバイナリ値)を出力してもよい。サブ分類器は、複数のサンプル会社のそれぞれについて、第4のタイプのデータ要素の値と、各会社によって調達された資金の指示とを含む訓練データセットに対して訓練されうる。サンプル会社は、会社エンティティと類似する会社(例えば、類似のサイズ、発展段階、業種、地域)であってもよいし、会社エンティティと必ずしも類似しない会社を含んでもよい。
例えば、MLサブモデルは、外部タイプモデルとして実現されてもよい。資金調達可能性MLサブモデルは、会社の資金調達能力を評価している。例えば、資金調達ラウンド、資金調達金融機関、誰がデフォルトしたか、IPO、会社の購入、負債比率に対する評価への資金調達、及び他のパラメータを含む、他の会社の多く(例えば、数万又は他の値)に関する詳細な情報の入力を用いてMLサブモデルを訓練することによって、MLサブモデルは、訓練データを使用して生成される。MLサブモデルは、会社パラメータを入力として受け取り、企業が資金を調達する確率を出力する。MLサブモデル結果は、会社についての関連情報の新しい部分(例えば、コードセンサによって抽出された生データ要素)が取得されたときに更新されてもよい。
(v)エンティティパラメータに対するエンティティの複数のコンポーネントの1つのコンポーネントの失敗のリスクを出力するMLサブモデル。
エンティティが会社である例では、MLサブモデルは、企業の複数の収入生成ユニットの1つの収入生成ユニット又は会社全体の失敗のリスクを出力する。当該出力は、複数の第5のタイプのデータ要素が提供されると、収入生成ユニットの統計分布を計算するMLサブモデルによって生成される。
例えば、MLサブモデルは、会社の収入生成ユニット(例えば、顧客、特定の場所における資産、又は異なるタイプの資産)の統計分布を測定するビジネス指向MLサブモデルとして実現されるジニインデックスに基づく。MLサブモデルは、インデックスの値を出力することによって、会社全体の1つの収入生成ユニットの失敗に関連するリスクを計算する。MLサブモデルによって出力されるインデックスの値が高いほど、顧客又は資産の損失が収入に重大な影響をもたらす確率が低くなる。
(vi)エンティティに関連するウェブサイトにアクセスするユーザを示す生データ要素の分析に基づいて測定及び/又は予測パラメータを出力するMLサブモデル。
エンティティが会社である例では、MLサブモデルは、会社に関連するウェブサイト(例えば、サイト分析)にアクセスするユーザを示す第6のタイプのデータ要素の入力の分析に基づいて、測定及び/又は予測パラメータを出力する。例えば、会社によって提供される製品のオンライン購入を提供するウェブサイト、及び/又は会社によって提供される製品及び/又はサービスを説明するウェブサイトである。
エンティティが会社である別の例では、MLサブモデルは、提示された広告(例えば、データ分析)と対話するユーザを示す第7のタイプのデータ要素の分析に基づいて、測定及び/又は予測パラメータを出力する。
例えば、MLサブモデルは、会社のウェブサイトのウェブサイト分析を計算してもよい。MLサブモデルは、顧客行動モデルとして実現されてもよい。以下は、サイト分析に基づく顧客行動の測定及び/又は予測のセットの一例である。
・マーケティングCAC-MLサブモデルは、会社サイトへの新規顧客のトラフィックに対するマーケティング予算の影響を予測するために計算される。CACは、オンライン広告マーケティング予算を、各マーケティングチャネルのセグメント化されたターゲット視聴者の合計(例えば、検索エンジン結果上の広告、ソーシャルネットワーク上の広告、ソーシャルネットワークページ上の投稿)によって正規化されたウェブサイトにおける新しいユニークな顧客の数によって、オンライン広告マーケティング予算を除算することによって計算される。時間間隔にわたって順次取得される上述されたポイントを使用して、将来のCACは、マーケティング予算(企業P&L)、CAC及び/又は視聴者の疲弊の入力に応答して、MLサブモデルによって予測されうる。
・収入安定性-例えば、バウンスレート、再訪問、サイトでの時間、ページビュー、コンバージョンレート、ライフタイム値、地理、デバイスタイプなど、顧客の取得に関連するコスによって調整される会社のウェブサイトに到着する新しいユニークな日々のユーザの数を分析することによって、及び/又は新しいユニークな日々のユーザのウェブサイト活動を追跡することによって、経時的な収入安定性のMLサブモデルが計算される。MLサブモデルは、収入に対するCACの影響を計算し、成長する能力に関して会社の状態を検出してもよい。概念的には、MLサブモデルの出力は、会社が現在の市場内で成長する余地があるか、CACレベルが何れか、及び/又は、会社がすでにそれの成長を尽くしたかの理解の指示を提供する。
(vii)外部のソーシャルネットワークサーバによって運営されるソーシャルネットワーク上に投稿されたユーザのプロファイルの分析にもろづいてエンティティ内のユーザの指示を出力するMLサブモデル。
(viii)エンティティに関連する広告及び/又はプロモーションとやりとりするユーザを示すマーケティング要素の分析に基づいて測定及び/又は予測パラメータを出力するMLサブモデル。
エンティティが会社である例では、MLサブモデルは、外部のソーシャルネットワークサーバによって運営されるソーシャルネットワーク上に投稿された従業員プロファイルの分析に基づいて会社内の従業員配置転換の指示を出力する。例えば、MLサブモデルは、会社の従業員の職務置換率を計算しうる。MLサブモデルは、外部タイプモデルとして実現されてもよい。会社の従業員プロフィール(例えば、ソーシャルネットワークに掲載される)を見つけて追跡することによって、及び/又は、転職する従業員の数及び/又は従業員が新しい仕事を見つけるのにかかる平均時間を監視することによって、会社に何か悪いことが起こっていることを示唆しうる内部の会社の変化が検出されうる。例えば、会社はコストを削減するため従業員プールを減少させ、及び/又は、会社が悪化していると感じたため、従業員は退職している。どちらも否定的な兆候である。特に、会社を離れた人々が、すぐに新しい仕事を見つける才能ある人々である場合には、そうである。
(ix)他の例は、購入注文、長期契約及び/又はコミットメント、供給品の変化などの1つ以上など、センサの収集元のERPシステムに関する。抽出されたデータは、リアルタイム短期及び/又は長期費用予測、外部の請負業者の契約による検出された予測される重要な費用変化、供給されたサービス価格の変化、部品表(BOM)及び継続的な購入注文の1つ以上の指示を出力するMLサブモデルを計算するのに利用される。
104において、メインMLモデルが提供及び/又は訓練される。メインMLモデルは、MLサブモデルによって出力されたサブ値の入力に応答して、ターゲットパラメータに対応するエンティティパラメータの値を出力する。
メインMLモデルは、複数のサンプルエンティティについて、サブ値及び対応するエンティティパラメータ(例えば、エンティティパラメータは各サブ値のグラウンドトゥルースラベルとして機能する)を含む訓練データセットを使用して、(例えば、教師あり及び/又は教師なしアプローチを使用して)訓練されてもよい。訓練データセットは、(例えば、106を参照して説明したように)各サンプルエンティティの生データ要素を取得し、(例えば、108を参照して説明したように)MLサブモデルに各サンプルエンティティの生データ要素を入力して、対応するサブ値を取得することによって作成されうる。サブ値のセットは、例えば、利用可能なソースから取得される各エンティティに対応するエンティティパラメータのグラウンドトゥルースラベルによってラベル付けされる。例えば、資金調達を求める会社のケースでは、エンティティパラメータは、会社がローンを返済する能力及び/又は金ローンを返済する能力を示す会社の金融資産であってもよく、年次報告及び/又は会社による公的資金調達イベントなどのソースから取得されてもよい。
メインMLモデルは、MLサブモデルによって出力されるサブ値に関連する複数のパラメータの関数として実現されてもよく、及び/又はその機能を含んでもよい。当該関数は、ルールのセット、各種アーキテクチャのニューラルネットワーク(例えば、人工、深層、畳み込み、完全接続)、マルコフチェーン、サポートベクタマシーン(SVM)、ロジスティック回帰、k最近傍、決定木、フィールドアウェア因子分解マシーン(FFM)、特異スペクトル解析(SSA)、及び上述の組み合せの1つ以上として含まれ、及び/又は実現されてもよい。
パラメータは、各ウェイトに関連付けされてもよい。メインMLモデルは、ウェイトを学習することによって訓練されうる。関数のウェイトは、エンティティパラメータに影響を与える自動化された組み合せ分散シナリオに基づいて計算されうる。例えば、関数は、ウェイトが学習される回帰関数であってもよい。別の例では、関数は、ニューロンのウェイトが学習されるニューラルネットワークであってもよい。
ウェイトの数は、例えば、生データ要素とサブ値との間の関連する組み合せの大部分又は全てが評価されるとき、極めて大きくなりうる。ウェイトは、例えば、因果関係、内部相互作用、相互影響、内部影響、及び/又は上述の組み合わせを評価することによって学習されうる。
106において、エンティティに関連する生データ要素が、複数のネットワークノードのデータソースから受信される。任意選択的には、生データ要素は、エンティティ毎に抽出される。データ要素の例は、エンティティのデータを記憶する構造化データソースから得られる構造化データ、エンティティの数値データを計算するデータソースから得られる数値データ、オープンソース及び/又はソーシャルネットワークから得られる非構造化データの1つ以上が挙げられる。
任意選択的には、生データ要素は、例えば、ネットワークノードにインストールされたコードセンサによって抽出され、コードはウェブリンクを使用してネットワークをクローリングするクローリングプログラムなど、ネットワークにわたって関連データを検索する。生データ要素は、API及び/又はSDKを介して受信されうる。コードセンサは、エンティティに関連する新しい生データ要素についてデータソースを監視し、生データ要素を抽出するよう設計されうる。データ要素の抽出は、エンティティ毎にカスタマイズされてもよく、コードセンサは、エンティティ毎に設計及び/又は選択される。コードセンサは、例えば、構造化データソースからの構造化された生データ要素の抽出(例えば、値に対する変更のためフィールド内の値を監視する)、非構造化データソースからの非構造化された生データ要素の抽出(例えば、新しい投稿に対するソーシャルネットワークの監視、生データ要素を識別するための新しい投稿の分析、及び新しいポストからの生データ要素の抽出)、及び/又は、数値データを計算するデータソースからの数値データ要素の抽出のため、データソースのタイプに従って設計されうる。
生データ要素は、リアルタイム(すなわち、ほぼリアルタイム)に抽出されてもよく、及び/又はリアルタイム(すなわち、ほぼリアルタイム)にサーバに投入されてもよい。リアルタイム及び/又はほぼリアルタイムという用語は、データの伝送における遅延、例えば、ネットワーク輻輳に起因するネットワーク遅延を含みうる短い期間を指し得る。ほぼリアルタイムの例は、例えば、1、10、30、60、120、180秒未満、又は1、6、12、24時間未満、又は他の値が挙げられる。
生データ要素は、例えば、API及び/又はSDKを介しサーバに投入されてもよい。
生データ要素はアノマリを含むかもしれず、及び/又は一部の生データ要素は欠落している(完全及び/又は時々)ことに留意されたい。そのような生データ要素は、ここに用いられるとき、エンティティがターゲットパラメータを充足しない増大するリスクを表す。
例えば、エンティティは会社を含む。会社という用語は、登録された事業、事業を運営する個人、法人、非営利組織、及び政府関連組織の1つ以上を指しうる。会社について、会社に関連する以下の生データ要素、すなわち、会社の顧客を示すデータ要素、会社の財務詳細を示すデータ要素、及び会社に関連する第三者のソースから取得されたデータ要素が抽出されうる。生データ要素が抽出される例示的なデータソースは、会社のウェブサイト又はウェブアプリケーションを運営するウェブサーバ、会社を議論するニュースサイトによって運営されるオンライン記事、ソーシャルネットワーク、及び/又は会社の従業員及び/又は顧客がレビュー及び/又は格付けなどのコンテンツを掲載する他のサーバを含む。他の例示的なデータソースは、銀行口座、請求書発行及び課金システム、ウェブ分析レポート、人的資源(HR)管理システム、顧客情報管理(CRM)及び企業リソース計画(ERP)システムを含む。
エンティティが会社である例では、生データ要素は、3つのタイプのデータ、顧客行動データ(例えば、サイト分析、CRMシステム、チャーン分析などから抽出される)、ビジネス指向データ(例えば、会計及び/又は請求システム、銀行取引、ERPシステムなどから抽出される)、及びオープンソース(例えば、専門ソーシャルネットワーク、会社を評価するウェブサイト、及び会社の資金を記述するウェブサイトなどの当該会社に関連する第三者ソースから抽出される)に分類されてもよい。
エンティティが会社である例では、ここに説明されるターゲットパラメータは、リクエストにおいて規定されてもよく、会社に資金調達するための資金調達リクエストにおいて示される金銭的資金を含んでもよい。ここに説明されるエンティティパラメータは、ローンリクエストの資金を返済するために利用されるエンティティの金融資産を含みうる。
108において、エンティティに関連する生データ要素は、例えば、メトリック及び/又は予測パラメータなど、各サブ値の出力を取得するため、MLサブモデルに入力される。MLサブモデルは、生データ要素を受信するサーバのハードウェアプロセッサによって実現されてもよい。
任意選択的には、異なる生データ要素は、各MLサブモデルの入力指定に従って1つ以上のMLサブモデルに向けられる。各生データ要素は、1つ以上のMLサブモデルに提供されてもよい。生データ要素は、例えば、生データ要素のタイプ(例えば、構造化、非構造化、数値)、生データ要素のソース及び/又は生データ要素の宛先を規定する生データ要素に関連するタグ(例えば、メタデータ)に基づいて、対応するMLサブモデルに提供されうる。別の例では、仮想チャネル及び/又はトンネルは、それらのソースから対応するMLサブモデルに生要素をストリーミングするため設定されてもよい。
110において、計算されたシミュレートされた調整を取得されたサブ値に適用することによって、調整されたサブ値が生成される。複数のシミュレートされた調整及び/又は調整されたサブ値は、それぞれの取得されたサブ値について計算されうる。任意選択的には、複数のシミュレートされた調整及び/又は調整されたサブ値が、個別(例えば、各個人)の取得されたサブ値について計算される。サブ値は、一対多(すなわち、個々のサブ値は、複数のシミュレートされた調整及び/又は複数の調整されたサブ値を生成する)又は多対多(すなわち、複数のサブ値は、複数のシミュレートされた調整及び/又は複数の調整されたサブ値を生成する)アプローチにおいて、複数のシミュレートされた調整及び/又は調整されたサブ値を生成するため利用されうる。
シミュレートされた調整及び/又は調整されたサブ値の数は、例えば、2以上、2~100、5~50、25~75、10~50、10以上、50以上、100以上の係数又は他の係数だけ、サブ値の数より有意に大きくてもよい。
複数のシミュレートされた調整及び/又は調整されたサブ値は、シミュレートされた調整が行われない場合に利用可能であるよりもはるかに大きい(ここに説明されるように)リスク分類器を訓練するため使用されるデータの量を大幅に増加させることを可能にする。これは、利用可能なデータがないか、又はほとんどない場合、ゼロショット又は少数ショットアプローチを使用してリスク分類器を訓練することを可能にする。
任意選択的には、シミュレートされた調整は、確率的シミュレーションモデル(例えば、モンテカルロシミュレーション)及び/又は生データから提供及び/又は計算された事前分布のセットに基づいて計算される。
任意選択的には、図1Bの特徴172は、特徴110の前、後及び/又はパラレルに実現される。図1Bの特徴172は、エンティティパラメータに対して最大の影響を有する最も影響力のある生データ要素を特定するため実現されうる。シミュレートされた調整は、特定された最も影響力のある生データ要素の入力を受信するMLサブモデルによって出力されるサブ値に対して行われてもよい。代替的又は追加的に、当該調整は、サブ値の全て又はサブ値のサブセットに対して行われる。
ここで図1Aの110を再び参照すると、シミュレートされた調整を計算するために使用される分布は、例えば、生データ要素及び/又はサブ値の値の可能な範囲、生データ要素及び/又はサブ値の値の過去の変化(例えば、異なる値の履歴分析及び/又は生データ要素及び/又はサブ値の値の変化)、生データ要素及び/又はサブ値の可能な将来の値の予測(例えば、専門家によって手動で実行され、及び/又は訓練されたサブ機械学習モデルによって予測される)、及び/又は生データを一般的な分布に適合させること(例えば、正規、ベータ、一様、指数、カイ二乗など)などであってもよい。調整は、生データ要素及び/又はサブ値についての可能な値の統計分布、例えば、正規分布、幾何学的分布、二峰性分布、及び/又は他の統計分布から、生データ要素及び/又はサブ値をランダムに選択することによって行われてもよい。分布は、推定値及び/又は過去の値に基づくものであってもよい。代替的又は追加的に、生データ要素及び/又はサブ値に対する調整は、統計分布から選択される。選択された調整は、各生データ要素及び/又はサブ値に適用される。
調整の例は、生データ要素及び/又はサブ値の増加、生データ要素及び/又はサブ値の減少、生データ要素及び/又はサブ値のタイプの変化、並びに生データ要素及び/又はサブ値の新しいタイプの出現を含む。
112において、調整されたサブ値は、メインMLモデルに入力される。
114において、メインMLモデルの結果が取得される。メインMLモデルの結果は、調整されたサブ値のセットに基づいてエンティティパラメータのシミュレートされた値である。
シミュレートされた調整を使用すると、シミュレートされた調整なくサブ値のみを使用する場合と比較して、はるかに多数のシミュレートされた値が取得される。シミュレートされた値の数は、例えば、2以上、2~100、5~50、25~75、10~50、10以上、50以上、100以上の係数又は他の係数だけ、サブ値の数より有意に大きくてもよい。
任意選択的には、複数のシミュレートされた値は、個々(例えば、各個人)のサブ値について計算される。サブ値は、一対多(すなわち、各サブ値は、複数のシミュレートされた値を生成する)又は多対多(すなわち、複数のサブ値は、複数のシミュレートされた値を生成する)アプローチにおいて、複数のシミュレートされた値を生成するため使用されてもよい。
複数のシミュレートされた値は、シミュレートされた調整が行われない場合に利用可能であるよりもはるかに大きい(ここに説明されるように)リスク分類器を訓練するため使用されるデータの量を大幅に増加させることを可能にする。これは、利用可能なデータがないか、又はほとんどない場合、ゼロショット又は少数ショットアプローチを使用してリスク分類器を訓練することを可能にする。
サブ値に対する調整をシミュレートし、エンティティパラメータに対する対応するシミュレートされた値を取得するプロセスは、ストレステストと呼ばれることがある。
116において、110~114を参照して説明された特徴は、エンティティパラメータのための複数のシミュレートされた値を生成するため繰り返される。各繰り返しの間、調整されたサブ値の他のセットが、シミュレートされた調整の他のセットをサブ値に適用することによって生成される。調整されたサブ値の各セットは、エンティティパラメータのそれぞれのシミュレートされた値を取得するため、メインMLモデルに入力される。複数の繰り返しは、エンティティパラメータのシミュレーションされた値のセットを生成する。概念的には、エンティティパラメータの複数のシミュレートされた値は、起こり得るエンティティのエンティティパラメータの可能な予測値のセットを表す。
118において、リスク分類器は、エンティティパラメータについて計算されたシミュレートされた値のセットの分析に従って、及び/又は、数式及び/又はML分類器として生成される。リスク分類器は、エンティティがターゲットパラメータを充足しない確率を生成する。例えば、エンティティが会社であるとき、会社がフルローン債務を履行できない(すなわち、フルローン全額を返済できない)可能性がある。会社の金融資産がローン全額を下回ると予測されるとき、会社がフルローン全額を充足しない確率が決定される。
リスク分類器は、繰り返しにおいてメインMLモデルによって取得されるエンティティパラメータのシミュレートされた値を計算及び利用することによって、リスク分類器を生成するための追加的な合成データを生成することによって、初期的な入力として生データ要素を利用する少数ショット又は単一ショット訓練アプローチに基づいて生成される。シミュレートされた値は、生データ要素が提供されると、MLサブモデルにそれぞれのシミュレートされた調整を適用することによって計算された取得されたサブ値に対する調整されたサブ値の入力に応答して、メインMLモデルから取得される。
任意選択的には、エンティティがターゲットパラメータを充足しないリスクを示す閾値が受信され、例えば、ユーザによって手動で入力され、予め設定された値としてメモリに記憶され、及び/又はコードによって自動的に(例えば、最適化として)計算される。分析は、エンティティパラメータについて計算されたシミュレートされた値のセットを受信し、エンティティスコアを出力するリスク分類器を使用することによって確率を計算することを指しうる。一例では、リスク分類器は、例えば、図4を参照して説明されるように、エンティティスコアを計算するためシミュレートされた値のセット全体に対して設定された閾値を上回る(又は下回る)シミュレートされた値を評価するオーバ・アンダーパーセンテージ(over-under percentage)分類器として実現される。任意選択的には、エンティティがターゲットパラメータを充足する確率は、エンティティスコアがターゲットパラメータを上回るときに決定される。
リスク分類器は、例えば、ルールのセット、各種アーキテクチャのニューラルネットワーク(例えば、人工、深層、畳み込み、完全接続)、マルコフチェーン、サポートベクタマシーン(SVM)、ロジスティック回帰、k最近傍、決定木、及び上述の組み合わせにより実現されてもよい。
120において、102~118の1つ以上、例えば、106~118を参照して説明されるML特徴が繰り返されてもよい。新しい生データが利用可能であるとき、当該繰り返しが、更新されたMLサブモデル、更新されたメインMLモデル及び/又は更新されたリスク分類器を生成するため実行されうる。当該繰り返しは、例えば、新しい生データが利用可能になったとき、イベントによって(例えば、毎日、週、月)、ルールのセットに基づいて(例えば、新しい生データが過去の生データと統計的に有意に異なるとき)、1つ以上の監視された生データ要素の変化、例えば、その値の変化、新しいデータ要素、及び/又は以前のデータ要素の除去が検出されたとき、トリガされてもよい。例えば、データソースは、生データ要素に対する変化を検出するためコードセンサによって(例えば、ほぼリアルタイムで)スキャンされる。変化が検出されると、繰り返しがトリガされてもよい。
122において、MLモデルアンサンブルが提供され、例えば、データ記憶デバイスに格納され、別のサーバに転送され、及び/又は別の処理による使用のために提供される。MLモデルアンサンブルは、MLサブモデル、メインMLモデル及びリスク分類器を含む。MLモデルアンサンブルは、それが特定のエンティティのMLサブモデルのセットに基づいているため、特定のエンティティのための使用される特定のエンティティ(例えば、会社)のためにMLモデルアンサンブルが作成されるという意味で、カスタマイズされうる。カスタマイズされたMLモデルアンサンブルは、それぞれのカスタマイズされたMLモデルアンサンブルが作成されうる他のエンティティに関連しなくてもよい。
MLモデルアンサンブルは、図1Bを参照して説明されるように、例えば、入力生データ要素が提供されたことに応答して、エンティティパラメータの予測値を出力するため利用される。
MLモデルアンサンブルは、例えば、生データ要素が提供されると、エンティティパラメータを集中的に計算するために、サーバによって集中的に記憶されて提供されてもよい。他の実施形態では、カスタマイズされたMLモデルは、生データ要素を提供されると、エンティティパラメータのローカル計算のため、ローカル記憶及び/又は実行のためにクライアント端末(例えば、スマートフォン、デスクトップコンピュータ)に提供されてもよい。
ここで図1Bを再び参照すると、152において、リクエストが受信されうる。リクエストは、エンティティから受信される。当該リクエストは、ターゲットパラメータを取得するためのものである。リクエストは、例えば、グラフィカルユーザインタフェース(GUI)などのユーザインタフェースを介し受信されてもよい。リクエストは、手動及び/又は自動的に入力されてもよい。
ここに記載の例では、エンティティは、例えば、個人所有者、スタートアップ、法人及び/又は他の事業関連組織などの会社である。そのような場合、リクエストは、任意選択的には、(例えば、GUIに提示される)事前に承認された資金額までの資金額に対するものであってもよい。事前承認された資金額は、ここに説明されるように、動的に計算及び更新されうる。
会社は、資金(例えば、ローン)を要求するためのユーザアカウントを設定してもよく、及び/又は資金を要求するための資金調達サービスによって認識される。ターゲットパラメータは、会社の資金調達のための資金調達リクエストに示される金銭的資金に関連する。資金調達リクエストは、例えば、ユーザアカウントのユーザインタフェースを介して提出されてもよく、及び/又は資金調達サービスに提出されてもよい。エンティティパラメータは、例えば、現在の金融資産及び/又は予測される将来の金融資産に基づいて資金を返済する会社の能力を示す。
図1Aを参照して説明した特徴は、リクエストの受信に応答してトリガされてもよい。あるいは、図1Aを参照して説明した最初の特徴は、リクエストに先行してエンティティ自身に応答してトリガされてもよい。例えば、エンティティはユーザアカウントを設定し、及び/又はエンティティが認識される。任意選択的には、MLモデルアンサンブルは、リクエストの受信に応答して計算される。ターゲットパラメータに対するリクエストは、例えば、図1Aを参照して説明した特徴の実現の前及び/又はパラレルに受信されてもよい。リクエストは、例えば、エンティティのユーザアカウントを介して受信されてもよい。
任意選択的には、初期段階では、1つ以上の特徴154~168が、エンティティパラメータの初期評価として実現される。ここに説明されるように、要求されたターゲットパラメータが提供されてもよく、又は、エンティティパラメータに対応する値が提供されてもよい。この例では、会社は資金を要求する。資金を返済する会社の能力は、ここに記載されるように評価される。資金の全額は、会社が全額を返済することができると決定されたときに提供されてもよく、又は、会社が全額を返済することができないと予測されたとき、資金を返済するための会社の決定された能力に従って、資金の一部の値が提供されてもよい。1つ以上の第2の段階では、170A~Bを参照して説明された特徴に続いて、1つ以上の特徴152~178が、エンティティパラメータの継続的な監視として実現される。この例では、会社が資金を返済する能力が監視される。会社が改善し、MLモデルアンサンブルが、要求された資金よりも多くの資金を会社が返済することができると予測したとき、追加の資金は、リクエストに応じて自動的に付与されてもよい。あるいは、要求された資金の全額(又は提供された金額)を返済する会社の能力が低下すると、自動化された追加資金調達に対する会社のリクエストが拒否される(又は承認のために必要な手動による介入)。
154において、図1Aの106を参照して説明されるように、生データ要素が受信される。生データ要素は、ネットワークノード上にインストールされたコードセンサによって抽出され、リアルタイムにサーバに投入される。
任意選択的には、生データ要素は、MLモデルアンサンブルを作成するのに利用されなかった新たな生データ要素である。代替的又は追加的には、図1Aの120を参照して説明されるように、新たな生データ要素が、MLモデルアンサンブルを更新するため利用される。
156において、図1Aの108を参照して説明されるように、生データ要素が、例えば、訓練されたMLサブモデルに入力される。
任意選択的には、生データ要素は、MLサブモデルに順次提供される。生データ要素は、動的に抽出され、MLサブモデルにストリーミングされてもよい。他の例では、生データ要素のセットが、例えば、時間間隔にわたって最初に収集され、その後、当該セットはMLサブモデルのセットに提供される。生データ要素のセットは、例えば、毎時、毎日又は毎週などの順次的な時間間隔にわたって順次取得されてもよい。
158において、例えば、図1Aの108を参照して説明されるように、サブ値が、訓練されたMLサブモデルの結果として取得される。
160において、例えば、図1Aの110を参照して説明されるように、調整されたサブ値が、取得されたサブ値にシミュレートされた調整を適用することによって生成される。
162において、例えば、図1Aの112を参照して説明されるように、調整されたサブ値が、訓練されたメインMLモデルに入力される。
164において、例えば、図1Aの114を参照して説明されるように、エンティティパラメータのシミュレートされた値が、メインMLモデルの結果として取得される。
166において、例えば、図1Aの116を参照して説明されるように、160~164を参照して説明された特徴が、エンティティパラメータの複数のシミュレートされた値を取得するため、繰り返される。
168において、例えば、図1Aの118を参照して説明されるように、複数のシミュレートされた値が、エンティティがターゲットパラメータを充足しない確率を計算するリスク分類器に入力される。
170Aにおいて、エンティティがターゲットパラメータを充足しない確率が閾値を下回ることに応答して(例えば、図1Aの118を参照して説明されるような閾値)、ターゲットパラメータが、任意選択的には自動的に提供されるなど、エンティティに提供されてもよい(すなわち、リクエストに応じて)。例えば、資金額は、会社の口座に自動的に預入される。
あるいは、170Bにおいて、エンティティがターゲットパラメータを充足しない確率が閾値を上回ることに応答して、ターゲットパラメータに対するリクエストが拒否され、任意選択的には、自動的に拒否される。
例えば、エンティティが会社であるケースについて、エンティティパラメータの予測値は、エンティティの金融資産を含む。ターゲットパラメータは、ローンにおいて要求される金銭的な資金を含む。会社の金融資産が要求されたローン資金未満であるとMLモデルによって予測されると、会社がローン債務を充足しないリスク(すなわち、会社がそれのローンを返済できない)が決定される。
任意選択的には、そのようなケースでは、リスク分類器は、エンティティが充足する可能性のあるターゲットパラメータの値を評価するのに利用されてもよい。エンティティには、要求された他0ゲットパラメータ未満であるターゲットパラメータの評価値が提供されてもよい。例えば、会社がローン債務全額を充足できないと予測されるとき、会社に提供されるローン額は、会社が充足する可能性のある予測額に従って決定されてもよい(例えば、会社の予測される金融資産)。会社に提供されるローン額は、要求される全額でなく、会社が返済できる予測される能力に従うものであってもよい。
172において、トレンドが、例えば、リスク分類器の順次的な出力など、エンティティパラメータがターゲットパラメータを充足しない繰り返し計算された更新された確率に従って計算されてもよい。
任意選択的には、トレンドは、エンティティがターゲットパラメータを充足しない確率が閾値を上回るか又は下回る時点を予測するため将来時間に外挿される。トレンドは、例えば、ローンを現在は返済できる可能性がある会社がローンを返済できなくなるときを予測するため、及び/又は要求されたローンを現在は返済できる可能性のない会社が要求されたローンを返済できるようになる時を予測するため、分析されてもよい。そのような会社は、例えば、ローンをリコール(recall)するため、及び/又はより大きなローンをオファーするため、監視されてもよい。
任意選択的には、アラートがトレンドに従って生成される。例えば、会社がトレンドに基づいて将来にローンを返済できないと予測されるときなどである。アラートは、例えば、GUIにおけるメッセージ、画面上のポップアップメッセージ、電子メール、通話及び/又はモバイルデバイスに送信されるメッセージなどであってもよい。
174において、メインMLモデルの関数のウェイトは、エンティティパラメータに最も影響する影響力のあるウェイトを特定するのに分析されてもよい。サブ関数のセットが計算されてもよく、各サブ関数は、生データ要素とエンティティパラメータの値との間を相関させる特定の影響力のあるウェイトに対応する。
特定された最も影響力のある生データ要素は、エンティティパラメータに対する変化の確率の予測子として監視されてもよい。影響力のある生データ要素の変化は、例えば、154~168を繰り返すことによって、リスクの再計算をトリガしうる。
176において、クライアント端末のディスプレイ上に提示されるインタラクティブGUIは、動的に更新されてもよい。
GUIは、例えば、事前承認された資金を返済するのに十分な金融資産を取得する動的に計算された確率に基づいて決定されるなど、会社が返済できる可能性のある会社に利用可能な事前承認された資金額を示す、リスク分類器によって計算されるリスクの指示によって動的に更新されてもよい。
GUIは、例えば、178を参照して説明されるように、トリガされた繰り返しに応答して動的に更新される。
エンティティが会社である場合、GUIは、会社に利用可能な事前承認された資金額の指示を提示するよう更新されてもよい。事前承認された資金額は、MLモデルアンサンブルによって出力される事前承認された資金を返済するのに十分な金融資産を取得する動的に計算された確率に基づいて決定されてもよい。GUIは、リアルタイム生データ要素に基づいてリアルタイムの事前承認された資金を提示してもよい。
任意選択的には、GUIに提示された事前承認された資金額までの資金額に対するリクエスト(例えば、152を参照して説明されるような)は、例えば、GUIを介し受信される。事前承認された資金額は、170Aを参照して説明されるように、会社の口座に自動的に預け入れされてもよい。
任意選択的には、エンティティがターゲットパラメータを充足しない予測された確率が変化すると、アラートがユーザインタフェースに生成される。アラートは、例えば、178を参照して説明されるように、リスク分類器の出力の繰り返しのモニタリング中に生成されてもよい。例では、会社がローンの全額を返済する能力(予測される金融資産がローンの値を上回るため)が変更され、会社はローン全額を返済できないと現在予測される(予測される金融資産がローンの値を下回るため)。このようなケースでは、1つ以上の自動化及び/又は手動のアクションがトリガされてもよい。例えば、会社は、将来の支払い能力に対応するローンの一部を返すことが要求され、及び/又は会社は追加的な資金調達要求について自動的に拒否される。
178において、152~176を参照して説明される1つ以上の特徴が繰り返される。
当該繰り返しは、例えば、エンティティによるターゲットパラメータに対する新たなリクエストに応答して実行されてもよい。任意選択的には、生データ要素の1つ以上の統計量の変化、例えば、統計的に有意な変化が監視される(例えば、コードセンサによって)。繰り返しは、検出された統計的に有意な変化、すなわち、156と同様に訓練済みMLサブモデルへの生データ要素の変化した値の入力に応答してトリガされてもよい。
当該繰り返しは、毎日、毎週、毎月、四半期毎又は毎年など、例えば、時間間隔毎にリスクを動的に再計算するため実行されてもよい。
任意選択的には、繰り返しは以下のように実行される。154において、生データ要素の更新が繰り返し取得される。156において、生データ要素の更新が、MLサブモデルに入力される。158において、更新された各サブ値が取得される。160において、シミュレートされた調整が、調整された更新されたサブ値を取得するため、更新されたサブ値に適用される。162において、調整された更新されたサブ値が、メインMLモデルに入力される。164において、エンティティパラメータに対するシミュレートされた更新された値が、メインMLモデルの結果として取得される。166において、160~164が、エンティティパラメータに対する複数のシミュレートされた更新された値を取得するため繰り返される。168において、シミュレートされた更新された値が、エンティティがターゲットパラメータを充足しない更新された確率を生成するためリスク分類器に入力される(例えば、エンティティパラメータのシミュレートされた更新された値の分析に従って)。
任意選択的には、当該繰り返しは、例えば、追加的な資金調達を要求する会社など、増加及び/又は追加的なターゲットパラメータなどの新たなリクエストに応答してトリガされる。本発明のいくつかの実施例によるエンティティがターゲットパラメータを充足しない確率を計算するためのMLモデルアンサンブルを生成するための一例となるデータフローを示すデータフロー図である図3が参照される。図3を参照して説明されるデータフロー図の特徴の1つ以上は、例えば、ここに説明されるように、図1Aを参照して説明された方法の特徴に対応してもよい。図3を参照して説明されるデータフローは、図2を参照して説明されるシステムの1つ以上のコンポーネントによって実現されてもよい。
302において、エンティティに関連する生データ要素が、例えば、図1Aの106を参照して説明されるように、複数のネットワークノードのデータソースから受信される(また、図3において“生データ”として参照される)。
304において、例えば、図1Aの108を参照して説明されるように、生データ要素が、サブ(また、図3において“モデル生成器”として参照される)に提供される。MLサブモデルは、図1Aの102を参照して説明されるように訓練されてもよいことに留意されたい。
306において、例えば、図1Aの108を参照して説明されるように、サブ値がMLサブモデルの結果として取得される。サブ値は又、“ターゲット予測子”として参照されてもよい。
308において、例えば、図1Aの112を参照して説明されるように、サブ値がメインMLモデル(また、図3における“リスクモデル”として参照される)に入力される。
リスクモデルは、例えば、MLサブモデルによって出力されるサブ値の組み合わせをエンティティパラメータにマッピングする関数など、機械学習モデル及び/又は数学モデルであってもよい。例えば、リスクモデルは、“利益=収入-費用”の概念モデルに基づくモデルあり、利益はエンティティパラメータに対応し、収入及び費用は、生データ要素が提供されるとMLサブモデルによって出力されるサブ値及び/又は生データ要素に対する調整に対応する。
310において、サブ値に対するシミュレートされた調整は、例えば、図1Aの110を参照して説明されるように、モンテカルロシミュレーション及び分布などのシミュレータコードによって計算される。
311A及び311Bにおいて、306,308及び310を参照して説明される特徴が、例えば、図1Aの116を参照して説明されるように、エンティティパラメータの複数のシミュレートされた値を生成するため繰り返されてもよい。
312において、リスク分類器は、例えば、図1Aの118を参照して説明されるように、エンティティパラメータに対して計算されたシミュレートされた値のセットを利用して生成される。
314において、リスク分類器は、例えば、図1Aの118を参照して説明されるように、エンティティがターゲットパラメータを充足しない確率を生成する(また、“リスクスコア+リスク分析”として参照される)。リスクスコアという用語は、エンティティスコアという用語と互換的であってもよい。
MLサブモデル、メインMLモデル及びリスク分類器を含むMLモデルアンサンブルが、例えば、図1Bを参照して説明されるように、リクエストにおいて受信されうるエンティティがターゲットパラメータを充足しない確率を計算するため提供される。
本発明のいくつかの実施例によるリスク分類器を生成するのに利用されるストレステスト処理の結果を示す概略図(調整されたサブ値が、エンティティパラメータのシミュレートされた値を取得するためメインMLモデルに入力される)である図4が参照される。ストレステストは、例えば、図1Aを参照して説明される特徴110、112、114及び116、及び/又は図1Bを参照して説明される特徴160、162、164及び166に対応する。
ストレステストは、時間軸402に沿って示されるt1,t2及びt3として示される3つの時間間隔において取得される生データ要素を用いて実行される。各時間間隔において、エンティティパラメータ404に対する複数のシミュレートされた値が計算される。シミュレートされた値404は、サブ値(生データ要素をMLサブモデルに入力することによって取得された)を調整し、サブ値をメインMLモデルに入力することによって取得される。シミュレートされた値は、ここに説明されるように、メインMLモデルの結果として取得される。
リスク分類器は、シミュレートされた値404の分析に従ってエンティティスコアを計算してもよい。エンティティスコアは、エンティティがターゲットパラメータを充足しない確率を示すものであってもよい。エンティティパラメータ404のシミュレートされた値は、例えば、0~800、0~100又は他の値の範囲内など、規定されたスケール406A-B内に正規化されてもよい。エンティティスコアは、スケール内に設定された閾値408に対して計算されてもよい。閾値408は、ターゲットパラメータの実際の値から独立して、及び/又はターゲットパラメータが実際に何であるかを知ることなく、ターゲットパラメータがエンティティパラメータに基づいてエンティティによって充足される可能性を示す確率を表すものであってもよい。例えば、エンティティが会社である例について、計算されるエンティティパラメータが利用可能な現金を表すとき、閾値408は、3倍の運営支出を表し、利用可能な現金が閾値を下回るとき、会社は、論額にかかわらずローンを返済できない可能性がある(すなわち、代わりの現金が残っていない)。利用可能な現金が閾値を上回るとき、会社は、ローンを返済できる可能性がある(すなわち、運営支出をカバーするだけの十分な現金と、利用可能な十分な追加的な現金)。エンティティスコアは、複数のシミュレートされたエンティティパラメータ404から計算される式410を利用して計算されてもよく、エンティティパラメータが閾値408を上回る又は下回るかの確率を示してもよい。
シミュレートされた値404の入力に応答してエンティティスコアを出力しうる生成されたリスク分類器は、式410と閾値408とを含んでもよい。
エンティティスコアは、ここに説明される他の値から独立して計算されてもよい。エンティティスコアは、ディスプレイ上のGUI内に提示されてもよい。
本発明のいくつかの実施例によるエンティティがターゲットパラメータを充足しない確率を特定のエンティティのエンティティスコアが表すか否かを決定するための閾値508のための処理を示す概略図である図5が参照される。複数のエンティティ(図1B及び/又は図4を参照して説明されるように)に対して計算されるエンティティスコア504が取得される。各エンティティスコア504は、各エンティティに対して、図1B及び/又は図4を参照して説明される特徴を繰り返すことによって、他のエンティティに対して計算される。エンティティスコア504は、範囲506A-B(例えば、0~800、0~100又はその他)内に属し、及び/又は範囲506A-Bに属するよう正規化されてもよい。閾値508は、エンティティスコアの分布に従って設定されてもよく、例えば、エンティティスコアの下位5%は閾値508を下回り、上位95%は閾値508を上回る。例えば、25/75%、50/50%又はその他などの他の閾値が利用されてもよい。
各エンティティに対して計算される各エンティティスコア504は、各エンティティスコアが閾値508を上回るか又は下回るかを判定するため、他のエンティティの他のエンティティスコアに対して評価されてもよい。例えば、各エンティティのエンティティスコア対他のエンティティのエンティティスコアの状態は、GUIにおいて分析及び/又は提示されてもよい。例えば、各エンティティスコア504が閾値508を下回るとき、各エンティティスコアに対応するエンティティは、ターゲットパラメータをおそらく充足しないと決定されてもよく、各エンティティが閾値を上回るとき、エンティティは、ターゲットパラメータをおそらく充足するとして決定されてもよい。
本発明の各種実施例の説明が、例示のために提供されたが、開示された実施例に対して限定されたり、網羅的なものであることを意図するものでない。多くの修正及び変形が、説明された実施例の範囲及び趣旨から逸脱することなく当業者に明らかであろう。ここに用いられる用語は、実施例の原理、市場において見つけられた技術に対する実践的な応用又は技術的改善を最もよく説明するため、又はここに開示された実施例を当業者が理解することを可能にするため選択された。
本出願から生じる特許の存続中、多くの関連するMLモデルが開発され、MLモデルという用語の範囲は、そのような新たな技術の全てを事前に含むと意図されることが期待される。
ここで使用されるように、“約”という用語は、±10%を指す。
“構成する”、“含む”、“有する”及びそれらの結合体は、“限定することなく、含む”を意味する。この用語は、「からなる」及び「から本質的になる」という用語を包含する。
“から本質的になる”という語句は、組成物又は方法が、追加の成分及び/又はステップを含んでもよいが、追加の成分及び/又はステップが、請求される組成物又は方法の基本的及び新規な特徴を実質的に変更しない場合に限る。
ここで使用される場合、単数形“ある(a,an)”及び“その(the)”は、文脈が明らかに別段の指示をしない限り、複数の参照を含む。例えば、”化合物“又は”少なくとも1つの化合物“は、その混合物を含む複数の化合物を含みうる。
“例示的”という用語は、ここでは、“例、事例又は例示として供する”を意味するのに使用される。“例示的”として記載された何れの実施例も、必ずしも他の実施例よりも好ましい又は効果的であると解釈されるべきではなく、及び/又は他の実施例から特徴の搭載を除外するものでない。
“任意選択的には”という用語は、ここでは“いくつかの実施例において提供され、他の実施例では提供されない”ことを意味するのに使用される。このような特徴が矛盾しない限り、本発明の何れか特定の実施例は、複数の“任意選択的”特徴を含みうる。
本出願を通して、本発明の各種実施例が範囲形式において提示されうる。範囲形式での説明は、単に便宜上及び簡潔にするためのものであり、本発明の範囲に対する柔軟性のない限定として解釈されるべきではないことを理解されたい。従って、範囲の説明は、全ての可能な部分範囲と共にその範囲内の個々の数値が具体的に開示されたと考えられるべきである。例えば、1~6などの範囲の説明は、1~3、1~4、1~5、2~4、2~6、3~6などの部分範囲及びその範囲内の個々の数、例えば、1、2、3、4、5及び6が具体的に開示されているとみなされるべきである。このことは、範囲の広さにかかわらず適用される。
数値範囲がここに示されるときはいつでも、示された範囲内の任意の引用された数字(分数又は整数)を含むことが意味される。第1の指示番号と第2の指示番号との間の“範囲”という語句は、第1の指示番号から第2の指示番号までの“範囲”という語句は、ここでは互換的に使用され、第1の指示番号、第2の指示番号及びそれらの間の全ての分数及び整数を含むことを意味する。
明確にするために別々の実施例の文脈で説明される本発明の特定の特徴は、単一の実施例で組み合わせて提供されてもよいことが理解される。逆に、簡潔にするために単一の実施例の文脈で記載されている本発明の各種特徴は、本発明の他の何れか記載された実施例又は何れか適切なサブコンビネーションにおいて別々に提供されてもよい。各種実施例の文脈で説明される特定の特徴は、本実施例がこれらの要素なしに動作不能でない限り、それらの本実施例の必須の特徴と見なされるべきではない。
本発明がその特定の実施例に関して説明されたが、多くの代替、修正及び変形が当業者に明らかであることは明らかである。従って、本発明は、添付の請求項の精神及び広い範囲内にあるそのような代替、修正及び変形例の全てを包含することを意図している。
本明細書において言及される全ての刊行物、特許及び特許出願は、個々の刊行物、特許又は特許出願が、参照によりここに援用されることが具体的及び個々に示されるのと同程度に、参照によりその全体が本明細書に援用される。さらに、本出願における何れかの参照の引用又は特定は、そのような参照が本発明の先行技術として利用可能であることの自認として解釈されるべきではない。セクション見出しが使用される限りにおいて、それらは、必ずしも限定するものとして解釈されるべきではない。さらに、本出願の何れの優先権書類もその全体が参照によりここに援用される。
Claims (32)
- エンティティがターゲットパラメータを充足しない確率を計算するための機械学習(ML)モデルアンサンブルを生成する方法であって、
生データ要素の入力に応答して各々がサブ値を出力する複数のMLサブモデルを訓練することと、
複数のサンプルエンティティのそれぞれに対して、前記複数のMLサブ値と対応するエンティティパラメータとを含む訓練データセットを利用して、前記複数のMLサブモデルによって出力された前記複数のサブ値の入力に応答して、前記ターゲットパラメータに対応するエンティティパラメータの値を出力するメインMLモデルを訓練することと、
各自のサブ値の出力を取得するため、前記エンティティに関連する複数の生データ要素を前記複数のMLサブモデルに入力することと、
複数の繰り返しにおいて、複数の調整されたサブ値を生成するため、前記複数の取得されたサブ値に対する複数のシミュレートされた調整を計算し、前記複数の調整されたサブ値を前記メインMLモデルに入力し、前記複数の繰り返しにおいて前記メインMLモデルから前記エンティティパラメータに対する複数のシミュレート値を取得することと、
前記エンティティパラメータに対する前記複数のシミュレートされた値の分析に従って、前記エンティティが前記ターゲットパラメータを充足しない確率を生成するリスク分類器を生成することと、
を有する方法。 - 前記リスク分類器は、前記複数の生データ要素が提供されると、前記複数のシミュレートされた調整のそれぞれを前記複数のMLサブモデルに適用することによって計算された前記複数の取得されたサブ値に対する前記複数の調整されたサブ値の入力に応答して、前記複数の繰り返しにおいて前記メインMLモデルによって出力される前記エンティティパラメータに対する前記複数のシミュレートされた値を計算及び利用することによって前記リスク分類器を生成するための追加的な合成データを生成することによって、初期的な入力として前記複数の生データ要素を利用して少数のショット又は単一のショット訓練アプローチに基づいて生成される、請求項1に記載の方法。
- 複数のシミュレートされた調整のそれぞれは、前記複数の取得されたサブ値の個別の各サブ値に対して計算され、前記複数のシミュレートされた調整のそれぞれは、各サブ値に対して複数の調整されたサブ値を生成するため、前記複数のMLサブモデルによって出力される前記複数の取得されたサブ値の前記各サブ値に適用される、請求項1に記載の方法。
- 調整されたサブ値のセットのそれぞれは、前記複数のサブ値のそれぞれに対して、前記複数のサブ値のそれぞれの前記複数のシミュレートされた調整のセットのそれぞれを計算し、前記複数のシミュレートされた調整のそれぞれを前記複数のサブ値の対応するものに適用することによって計算される、請求項1に記載の方法。
- 前記複数のサブ値の各サブ値に対する前記複数のシミュレートされた調整は、前記各サブ値の増加、前記各サブ値の減少及び新たなサブ値の作成からなる群から選択される、請求項1に記載の方法。
- 前記エンティティパラメータに対して最も大きな影響を有する前記複数の生データ要素の少なくとも1つの最も影響力のある生データ要素を特定することを更に含み、
前記複数のシミュレートされた調整を計算することは、入力として前記少なくとも1つの最も影響力のある生データ要素を受信する前記複数のMLサブモデルの少なくとも1つのMLサブモデルによって出力されるサブ値に対して実行される、請求項1に記載の方法。 - 前記複数の生データ要素の更新を繰り返し取得することと、
更新された各サブ値を取得するため、前記複数のMLサブモデルに前記複数の生データ要素の更新を繰り返し入力することと、
複数の更新された繰り返しにおいて、
複数の調整された更新されたサブ値を取得するため、前記複数の更新されたサブ値のそれぞれに対する前記複数のシミュレートされた調整を計算することと、
前記複数の調整された更新されたサブ値を前記メインMLモデルに入力することと、
前記エンティティパラメータに対して複数のシミュレートされた更新された値を取得することと、
前記エンティティが前記ターゲットパラメータを充足しない更新された確率を生成するため、前記複数のシミュレートされた更新された値の更新された分析を利用して、前記リスク分類器の更新を生成することと、
を更に含む、請求項1に記載の方法。 - 前記メインMLモデルは、前記複数のMLサブモデルによって出力される前記複数のサブ値に関連する複数のパラメータであって、複数のウェイトに関連する前記複数のパラメータの関数を含み、前記メインMLモデルを訓練することは、前記複数のウェイトを学習することを含む、請求項1に記載の方法。
- 前記関数の前記複数のウェイトは、前記エンティティパラメータに影響を与える自動化された組み合わせ的変形シナリオに基づいて計算される、請求項8に記載の方法。
- 前記エンティティが前記ターゲットパラメータを充足しないリスクを示す閾値を受信することを更に含み、前記分析は、シミュレートされた値のセット全体に対して前記閾値を上回る又は下回る前記シミュレートされた値に基づいてエンティティスコアを計算することによって、前記確率を計算することを含む、請求項1に記載の方法。
- 前記エンティティスコアが前記ターゲットパラメータを上回るとき、前記エンティティが前記ターゲットパラメータを充足する確率を決定することを更に含む、請求項10に記載の方法。
- 前記エンティティに関連する前記複数の生データ要素は、前記エンティティのデータを格納する構造化データソースから取得された構造化データ、前記エンティティの数値データを計算するデータソースから取得された数値データ、及び、オープンソース及び/又はソーシャルネットワークから取得された非構造化データからなる群から選択される、請求項1に記載の方法。
- 前記複数のMLサブモデルの少なくとも1つは、
(i)第1の時間間隔の間に取得される特定のタイプの前記生データ要素の値と、前記第1の時間間隔より以前の少なくとも1つの第2の時間間隔の間に取得される前記特定のタイプの生データ要素の値との間の相関ウィンドウに基づいて各メトリックを出力すること、
(ii)規定されたタイプのセットの生データ要素の値が提供されると、各メトリックを計算すること、
(iii)前記エンティティのタイプに従って選択された複数のサブサブモデルの組み合わせの集まりによって各メトリックを計算すること、
(iv)選択されたセットの生データ要素が提供されると、前記エンティティが前記ターゲットパラメータを充足する確率を出力するサブ分類器であって、複数のサンプルエンティティのそれぞれに対して、各サンプルエンティティに関連するサンプルデータ要素と、前記各サンプルエンティティに提供される各ターゲットパラメータを充足するという指示とを含む訓練データセットに対して訓練されるサブ分類器、
(v)前記エンティティパラメータに対する前記エンティティの複数のコンポーネントの1つのコンポーネントの失敗のリスクを出力すること、
(vi)前記エンティティに関連するウェブサイトにアクセスするユーザを示す生データ要素の分析に基づいて、指標及び/又は予測パラメータを出力すること、
(vii)外部のソーシャルネットワークサーバによって運営されるソーシャルネットワーク上で投稿されるユーザのプロファイルの分析に基づいて、前記エンティティ内のユーザの指示を出力すること、及び、
(viii)前記エンティティに関連する広告及び/又はプロモーションとやりとりするユーザを示すマーケティング要素の分析に基づいて、指標及び/又は予測パラメータを出力すること、
からなる群から選択される、請求項1に記載の方法。 - 前記複数のシミュレートされた調整は、生データから計算又は提供されると、確率的シミュレーションモデルと事前分布のセットとに基づいて計算される、請求項1に記載の方法。
- 前記方法の特徴は、サーバ上で実行される少なくとも1つのハードウェアプロセッサによって実現され、前記生データ要素は、複数のネットワークノード上にインストールされたコードセンサによって抽出され、リアルタイムにサーバに投入される、請求項1に記載の方法。
- 前記エンティティは会社を含み、リクエストに規定される前記ターゲットパラメータは、前記会社に資金提供する資金調達リクエストに規定される資金を含み、前記エンティティパラメータは、前記資金調達リクエストの資金を返済するのに利用される前記エンティティの金融資産を含む、請求項1に記載の方法。
- 前記エンティティに関連する前記複数の生データ要素は、前記会社の顧客を示すデータ要素、前記会社の財務詳細を示すデータ要素、及び、前記会社に関連する第三者ソースから取得されるデータ要素からなる群から選択される、請求項16に記載の方法。
- 前記複数のMLサブモデルの少なくとも1つは、
(i)第1の時間間隔の間の収入と、前記第1の時間間隔より以前の少なくとも1つの第2の時間間隔の間に取得される収入との間のレシオとして計算される前記会社の成長の指示であって、前記収入は、課金及び/又は請求システム統合から取得されるインボイス及び/又は支払いを含む複数の第1のタイプの生データ要素に基づいて計算される、指示、
(ii)顧客情報管理(CRM)システムから取得されるインボイス、支払い及び/又はデータを含む複数の第2のタイプの生データ要素に基づいて計算される顧客チャーンの指示、
(iii)複数の第3のタイプの生データ要素に基づいて計算される粗利益の指示、
(iv)前記会社のビジネスタイプに従って選択される複数のサブサブモデルの組み合わせの集まりとして計算されるユニットエコノミクスの指示、
(v)複数の第4のタイプの生データ要素が提供されると、前記会社がファンドを上昇させる確率を出力するサブ分類器であって、複数のサンプル会社のそれぞれに対して、前記第4のタイプのデータ要素の値と、前記それぞれの会社によって上昇されたファンドの指示とを含む訓練データセットに対して訓練されるサブ分類器、
(vi)複数の第5のタイプのデータ要素が提供されると、複数の収入生成ユニットの統計分布の計算に基づいて、前記会社の複数の収入生成ユニットの1つの収入生成ユニットの前記会社に対する失敗のリスクを出力すること、
(vii)前記会社に関連するウェブサイトにアクセスするユーザを示す第6のタイプのデータ要素の分析に基づいて、及び/又は提供された広告とやりとりするユーザを示す第7のタイプのデータ要素の分析に基づいて、指標及び/又は予測パラメータを出力すること、
(viii)外部ソーシャルネットワークサーバによって運営されるソーシャルネットワーク及び/又はネットワークノードによって運営される更なる外部ソース上に投稿される従業員プロファイルの分析に基づいて、前記会社内の従業員の配置転換の指示を出力すること、
(ix)企業リソースプラニング(ERP)システム統合を介し取得される契約及び/又は購入注文を含むコミットメントの分析に基づいて、リアルタイム短期及び/又は長期コスト予測、外部請負業者の対比による検出された予想される重要コスト、供給されるサービス価格の変更、部品表(BOM)及び/又は進行中の購入注文の指示を出力すること、
からなる群から選択されるそれぞれの指標及び/又は予測パラメータを出力する、請求項16に記載の方法。 - エンティティがターゲットパラメータを充足しない確率を計算するためのMLモデルアンサンブルを動的及び繰り返し利用する方法であって、
複数の第1の繰り返しにおいて、
ターゲットパラメータを取得するためのリクエストをエンティティから受信することと、
複数のネットワークノード上にインストールされるコードセンサによって抽出され、リアルタイムにサーバに投入される複数の生データ要素を受信することと、
前記複数の生データ要素を複数のMLサブモデルに入力することと、
前記複数のMLサブモデルから複数のサブ値を取得することと、
複数の第2の繰り返しにおいて、
複数の調整されたサブ値を生成するため、前記複数の取得されたサブ値に対する複数のシミュレートされた調整を計算することと、
前記複数の調整されたサブ値をメインMLモデルに入力することと、
前記複数の第2の繰り返しにおける前記メインMLモデルから、エンティティパラメータの複数のシミュレートされた値を取得することと、
前記エンティティパラメータの前記複数のシミュレートされた値の分析に従って、前記エンティティが前記ターゲットパラメータを充足しない確率を計算するリスク分類器に前記複数のシミュレートされた値を入力することと、
前記確率が閾値を下回るとき、前記エンティティに前記ターゲットパラメータを自動的に提供することと、
前記確率が前記閾値を上回るとき、前記ターゲットパラメータに対するリクエストを自動的に否定することと、
を有する、方法。 - 前記リスク分類器は、前記複数の生データ要素が提供されると、前記複数のシミュレートされた調整のそれぞれを前記複数のMLサブモデルに適用することによって計算された前記複数の取得されたサブ値に対する前記複数の調整されたサブ値の入力に応答して、前記複数の繰り返しにおいて前記メインMLモデルによって出力される前記エンティティパラメータに対する前記複数のシミュレートされた値を計算及び利用することによって前記リスク分類器を生成するための追加的な合成データを生成することによって、初期的な入力として前記複数の生データ要素を利用して少数のショット又は単一のショット訓練アプローチに基づいて生成される、請求項19に記載の方法。
- 複数のシミュレートされた調整のそれぞれは、前記複数の取得されたサブ値の個別の各サブ値に対して計算され、前記複数のシミュレートされた調整のそれぞれは、各サブ値に対して複数の調整されたサブ値を生成するため、前記複数のMLサブモデルによって出力される前記複数の取得されたサブ値の前記各サブ値に適用される、請求項19に記載の方法。
- 前記複数の生データ要素の更新を繰り返し取得することと、
更新された各サブ値を取得するため、前記複数のMLサブモデルに前記複数の生データ要素の更新を繰り返し入力することと、
複数の更新された繰り返しにおいて、
複数の調整された更新されたサブ値を取得するため、前記複数の更新されたサブ値のそれぞれに対する前記複数のシミュレートされた調整を計算することと、
前記複数の調整された更新されたサブ値を前記メインMLモデルに入力することと、
前記エンティティパラメータに対して複数のシミュレートされた更新された値を取得することと、
前記エンティティパラメータの複数のシミュレートされた更新された値の分析に従って、前記エンティティが前記ターゲットパラメータを充足しない更新された確率を生成するための前記リスク分類器に前記複数のシミュレートされた更新された値を入力することと、
を更に含む、請求項19に記載の方法。 - 前記エンティティパラメータが前記ターゲットパラメータを充足しない繰り返し計算された更新された確率に従ってトレンドを計算し、前記エンティティが前記ターゲットパラメータを充足しない確率が閾値を上回るとき、トレンドを予測するための将来時間に前記トレンドを外挿することを更に含む、請求項19に記載の方法。
- 前記複数の生データ要素の少なくとも1つの統計量の変化をモニタリングすることと、
前記変化に応答して、及び/又は前記統計量の変化が有意であるとき、繰り返しをトリガすることと、
を更に含む、請求項19に記載の方法。 - 前記エンティティパラメータの値に最も影響する複数の影響力のあるウェイトを特定するため、関数の複数のウェイトを分析することと、
各サブ関数が少なくとも1つの生データ要素と前記エンティティパラメータの値との間を相関させるための特定の影響力のあるウェイトに対応する、サブ関数のセットを計算することと、
を更に含む、請求項19に記載の方法。 - 前記複数の生データ要素の更新を繰り返し取得することに応答して、クライアント端末のディスプレイ上で提示されるインタラクティブグラフィカルユーザインタフェース(GUI)が、前記エンティティが前記ターゲットパラメータを充足しない確率を示すエンティティスコアと、事前に承認された資金を返済するのに十分な金融資産を取得する動的に計算された確率に基づいて決定される企業に利用可能な事前に承認された資金調達の金額との指示によって動的に更新される、請求項19に記載の方法。
- 前記GUIを介し前記GUIに提示された前記事前に承認された資金調達の金額までの資金調達の金額に対するリクエストを受信することと、
前記企業の口座に前記資金調達の金額を自動的に提供することと、
を更に含む、請求項26に記載の方法。 - エンティティがターゲットパラメータを充足しない確率を計算するための機械学習(ML)モデルアンサンブルを生成するシステムであって、
生データ要素の入力に応答して、それぞれがサブ値を出力する複数のMLサブモデルを訓練することと、
複数のサンプルエンティティのそれぞれに対して複数のMLサブ値と対応するエンティティパラメータとを含む訓練データセットを利用して、前記複数のMLサブモデルによって出力される前記複数のサブ値の入力に応答して、前記ターゲットパラメータに対応するエンティティパラメータの値を出力するメインMLモデルを訓練することと、
各サブ値の出力を取得するため、前記複数のMLサブモデルに前記エンティティに関連する複数の生データ要素を入力することと、
複数の繰り返しにおいて、
複数の調整されたサブ値を生成するため、前記複数の取得されたサブ値に対する複数のシミュレートされた調整を計算することと、
前記メインMLモデルに前記複数の調整されたサブ値を入力することと、
前記複数の繰り返しにおける前記メインMLモデルから、前記エンティティパラメータの複数のシミュレートされた値を取得することと、
前記エンティティパラメータの前記複数のシミュレートされた値の分析に従って、前記エンティティが前記ターゲットパラメータを充足しない確率を生成するリスク分類器を生成することと、
のためのコードを実行する少なくとも1つのハードウェアプロセッサを有するシステム。 - エンティティがターゲットパラメータを充足しない確率を計算するための機械学習(ML)モデルアンサンブルを生成する方法であって、
生データ要素の入力に応答して、それぞれがサブ値を出力する複数のMLサブモデルを訓練することと、
複数のサンプルエンティティのそれぞれに対して複数のMLサブ値と対応するエンティティパラメータとを含む訓練データセットを利用して、前記複数のMLサブモデルによって出力される前記複数のサブ値の入力に応答して、前記ターゲットパラメータに対応するエンティティパラメータの値を出力するメインMLモデルを訓練することと、
各サブ値の出力を取得するため、前記複数のMLサブモデルに前記エンティティに関連する複数の生データ要素を入力することと、
複数の繰り返しにおいて、
確率的シミュレーションモデルと事前分布のセットとに基づいて、前記生データ要素から提供又は計算されると、前記複数のMLサブモデルによって出力された前記複数の取得されたサブ値に対して複数のシミュレートされた調整を計算することと、
前記複数の取得されたサブ値に対して複数の調整されたサブ値を生成するため、前記複数のMLサブモデルによって出力される前記複数の取得されたサブ値に前記複数のシミュレートされた調整のそれぞれを適用することと、
前記複数のMLサブモデルの出力に前記複数のシミュレートされた調整を適用することによって計算される前記複数の取得されたサブ値の前記複数の調整されたサブ値を前記メインMLモデルに入力することと、
前記複数のMLサブモデルの出力に前記複数のシミュレートされた調整を適用することによって計算される前記複数の取得されたサブ値に対する前記複数の調整されたサブ値の入力に応答して、前記複数の繰り返しにおける前記メインMLモデルから、前記エンティティパラメータの複数のシミュレートされた値を取得することと、
前記複数のMLサブモデルによって出力されるサブ値に前記複数のシミュレートされた調整のそれぞれを適用することによって計算される前記複数の取得されたサブ値の前記複数の調整されたサブ値の入力に応答して、前記複数の繰り返しにおいて前記メインMLモデルによって出力された前記エンティティパラメータの前記複数のシミュレートされた値の分析に従って、前記エンティティが前記ターゲットパラメータを充足しない確率を生成するリスク分類器を生成することと、
を有する方法。 - 前記リスク分類器は、前記複数の生データ要素が提供されると、前記複数のシミュレートされた調整のそれぞれを前記複数のMLサブモデルに適用することによって計算された前記複数の取得されたサブ値に対する前記複数の調整されたサブ値の入力に応答して、前記複数の繰り返しにおいて前記メインMLモデルによって出力される前記エンティティパラメータに対する前記複数のシミュレートされた値を計算及び利用することによって前記リスク分類器を生成するための追加的な合成データを生成することによって、初期的な入力として前記複数の生データ要素を利用して少数のショット又は単一のショット訓練アプローチに基づいて生成される、請求項29に記載の方法。
- エンティティがターゲットパラメータを充足しない確率を計算するためのMLモデルアンサンブルを動的及び繰り返し利用する方法であって、
複数の第1の繰り返しにおいて、
ターゲットパラメータを取得するため、エンティティからリクエストを受信することと、
複数のネットワークノード上にインストールされたコードセンサによって抽出され、リアルタイムにサーバに投入された複数の生データ要素を受信することと、
複数のMLサブモデルに前記複数の生データ要素を入力することと、
前記複数のMLサブモデルから複数のサブ値を取得することと、
複数の第2の繰り返しにおいて、
前記生データ要素から提供又は計算されると、確率的シミュレーションモデルと事前分布のセットとに基づいて、前記複数のMLサブモデルによって出力される前記複数の取得されたサブ値に対して複数のシミュレートされた調整を計算することと、
前記複数の取得されたサブ値の複数の調整されたサブ値を生成するため、前記複数のMLサブモデルによって出力される前記複数の取得されたサブ値に前記複数のシミュレートされた調整のそれぞれを適用することと、
前記複数のMLサブモデルの出力に前記複数のシミュレートされた調整を適用することによって計算される前記複数の取得されたサブ値の前記複数の調整されたサブ値をメインMLモデルに入力することと、
前記複数のMLサブモデルの出力に前記複数のシミュレートされた調整を適用することによって計算される前記複数の取得されたサブ値の前記複数の調整されたサブ値の入力に応答して、前記複数の第2の繰り返しにおいて前記メインMLモデルから、エンティティパラメータの複数のシミュレートされた値を取得することと、
前記エンティティパラメータの前記複数のシミュレートされた値の分析に従って前記エンティティが前記ターゲットパラメータを充足しない確率を計算するリスク分類器に、前記複数のMLサブモデルによって出力されるサブ値に前記複数のシミュレートされた調整のそれぞれを適用することによって計算される前記複数の取得されたサブ値の前記複数の調整されたサブ値の入力に応答して、前記複数の繰り返しにおいて前記メインMLモデルによって出力される前記複数のシミュレートされた値を入力することと、
前記確率が閾値を下回るとき、前記エンティティに前記ターゲットパラメータを自動的に提供することと、
前記確率が前記閾値を上回るとき、前記ターゲットパラメータに対するリクエストを自動的に拒否することと、
を有する方法。 - 前記リスク分類器は、前記複数の生データ要素が提供されると、前記複数のシミュレートされた調整のそれぞれを前記複数のMLサブモデルに適用することによって計算された前記複数の取得されたサブ値に対する前記複数の調整されたサブ値の入力に応答して、前記複数の繰り返しにおいて前記メインMLモデルによって出力される前記エンティティパラメータに対する前記複数のシミュレートされた値を計算及び利用することによって前記リスク分類器を生成するための追加的な合成データを生成することによって、初期的な入力として前記複数の生データ要素を利用して少数のショット又は単一のショット訓練アプローチに基づいて生成される、請求項31に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/907,251 | 2020-06-21 | ||
US16/907,251 US11176495B1 (en) | 2020-06-21 | 2020-06-21 | Machine learning model ensemble for computing likelihood of an entity failing to meet a target parameter |
PCT/IL2021/050729 WO2021260678A1 (en) | 2020-06-21 | 2021-06-16 | Machine learning model ensemble for computing likelihood of an entity failing to meet a target parameter |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023531100A true JP2023531100A (ja) | 2023-07-20 |
JPWO2021260678A5 JPWO2021260678A5 (ja) | 2024-06-21 |
Family
ID=78524054
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023521978A Pending JP2023531100A (ja) | 2020-06-21 | 2021-06-16 | エンティティがターゲットパラメータを充足しない確率を計算するための機械学習モデルアンサンブル |
Country Status (3)
Country | Link |
---|---|
US (1) | US11176495B1 (ja) |
JP (1) | JP2023531100A (ja) |
WO (1) | WO2021260678A1 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11556825B2 (en) * | 2019-11-26 | 2023-01-17 | International Business Machines Corporation | Data label verification using few-shot learners |
US11394774B2 (en) * | 2020-02-10 | 2022-07-19 | Subash Sundaresan | System and method of certification for incremental training of machine learning models at edge devices in a peer to peer network |
JP7127080B2 (ja) * | 2020-03-19 | 2022-08-29 | ヤフー株式会社 | 判定装置、判定方法及び判定プログラム |
US20210350426A1 (en) | 2020-05-07 | 2021-11-11 | Nowcasting.ai, Inc. | Architecture for data processing and user experience to provide decision support |
US12099955B2 (en) * | 2021-04-05 | 2024-09-24 | Mastercard International Incorporated | Machine learning models based methods and systems for determining prospective acquisitions between business entities |
US20230004991A1 (en) * | 2021-06-30 | 2023-01-05 | EMC IP Holding Company LLC | Methods and systems for identifying breakpoints in variable impact on model results |
US20230084370A1 (en) * | 2021-09-16 | 2023-03-16 | Rain Technologies Inc. | Dynamically updating account access based on employment data |
US20230094635A1 (en) * | 2021-09-28 | 2023-03-30 | Intuit Inc. | Subscriber retention and future action prediction |
US11531943B1 (en) * | 2021-11-18 | 2022-12-20 | Slate Technologies Inc. | Intelligence driven method and system for multi-factor optimization of schedules and resource recommendations for smart construction |
US11868686B2 (en) * | 2022-03-04 | 2024-01-09 | Slate Technologies Inc. | System and method for manufacture and customization of construction assemblies in a computing environment |
US11907885B1 (en) | 2022-03-29 | 2024-02-20 | Slate Technologies Inc. | System and method for computational simulation and augmented/virtual reality in a construction environment |
CN114708608B (zh) * | 2022-06-06 | 2022-09-16 | 浙商银行股份有限公司 | 一种银行票据全自动化特征工程方法及装置 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7761351B2 (en) * | 2004-04-29 | 2010-07-20 | Ford Motor Company | Method and system for assessing the risk of a vehicle dealership defaulting on a financial obligation |
US7457808B2 (en) * | 2004-12-17 | 2008-11-25 | Xerox Corporation | Method and apparatus for explaining categorization decisions |
IL188726A (en) * | 2008-01-10 | 2013-05-30 | Deutsche Telekom Ag | A stacking scheme for tasks was classified |
AU2012203348B2 (en) * | 2011-06-08 | 2013-11-07 | Accenture Global Services Limited | High-risk procurement analytics and scoring system |
WO2014075108A2 (en) * | 2012-11-09 | 2014-05-15 | The Trustees Of Columbia University In The City Of New York | Forecasting system using machine learning and ensemble methods |
US9256838B2 (en) * | 2013-03-15 | 2016-02-09 | International Business Machines Corporation | Scalable online hierarchical meta-learning |
US20150095210A1 (en) * | 2013-09-27 | 2015-04-02 | Brian Grech | Merchant loan management and processing |
US20150095229A1 (en) * | 2013-09-27 | 2015-04-02 | Insperity Services, L.P. | Method, apparatus and system for automated notification of funding request and/or approval |
US9449344B2 (en) * | 2013-12-23 | 2016-09-20 | Sap Se | Dynamically retraining a prediction model based on real time transaction data |
WO2018085643A1 (en) * | 2016-11-04 | 2018-05-11 | Google Llc | Mixture of experts neural networks |
US20190073714A1 (en) * | 2017-06-05 | 2019-03-07 | Mo Tecnologias, Llc | System and method for issuing a loan to a consumer determined to be creditworthy onto a transaction card |
US11244388B2 (en) * | 2017-06-08 | 2022-02-08 | Flowcast, Inc. | Methods and systems for assessing performance and risk in financing supply chain |
US11270188B2 (en) * | 2017-09-28 | 2022-03-08 | D5Ai Llc | Joint optimization of ensembles in deep learning |
US20190114704A1 (en) * | 2017-10-13 | 2019-04-18 | QCash Financial, LLC | Statistical model for making lending decisions |
AU2019264923B2 (en) * | 2018-05-10 | 2024-07-25 | Equifax Inc. | Training or using sets of explainable machine-learning modeling algorithms for predicting timing of events |
US11741398B2 (en) * | 2018-08-03 | 2023-08-29 | Samsung Electronics Co., Ltd. | Multi-layered machine learning system to support ensemble learning |
US20200065897A1 (en) * | 2018-08-24 | 2020-02-27 | Zetatango Technology Inc. | Financial instrument pricing |
US11468371B2 (en) * | 2018-09-22 | 2022-10-11 | Securonix, Inc. | Prediction explainer for ensemble learning |
-
2020
- 2020-06-21 US US16/907,251 patent/US11176495B1/en active Active
-
2021
- 2021-06-16 JP JP2023521978A patent/JP2023531100A/ja active Pending
- 2021-06-16 WO PCT/IL2021/050729 patent/WO2021260678A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
US11176495B1 (en) | 2021-11-16 |
WO2021260678A1 (en) | 2021-12-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11176495B1 (en) | Machine learning model ensemble for computing likelihood of an entity failing to meet a target parameter | |
Shirazi et al. | A big data analytics model for customer churn prediction in the retiree segment | |
US20200349641A1 (en) | System and method for determining credit and issuing a business loan using tokens and machine learning | |
US11107166B2 (en) | Multi-step day sales outstanding forecasting | |
US8498954B2 (en) | Managing operations of a system using non-linear modeling techniques | |
US8010324B1 (en) | Computer-implemented system and method for storing data analysis models | |
US8504408B2 (en) | Customer analytics solution for enterprises | |
US20120278091A1 (en) | Sales prediction and recommendation system | |
US20200234218A1 (en) | Systems and methods for entity performance and risk scoring | |
US20130238476A1 (en) | Counterfactual testing of finances using financial objects | |
US20190385080A1 (en) | K-lstm architecture for purchase prediction | |
US8984022B1 (en) | Automating growth and evaluation of segmentation trees | |
US20230409906A1 (en) | Machine learning based approach for identification of extremely rare events in high-dimensional space | |
US20190244131A1 (en) | Method and system for applying machine learning approach to routing webpage traffic based on visitor attributes | |
US10614402B2 (en) | Human steering dashboard to analyze 360-degree market view for merchants based on financial transactions | |
Heinrich et al. | A quantitative approach for modelling the influence of currency of information on decision-making under uncertainty | |
WO2020150597A1 (en) | Systems and methods for entity performance and risk scoring | |
Leventhal | Predictive Analytics for Marketers: Using Data Mining for Business Advantage | |
US20220067756A1 (en) | System and method for intelligent resource management | |
US20130238460A1 (en) | Determining shopping intent based on financial objects | |
Khan | A short review of the electronic banking system | |
US11838170B1 (en) | Messaging segmentation based on data flow informatics | |
US20130238434A1 (en) | Financial outcome based on shared financial objects | |
Dang et al. | Constructing and understanding customer spending prediction models | |
Aguirre et al. | Predictive analysis for calculating the valuation of the affiliated fund of a private pension system using machine learning techniques and tools |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20230217 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7426 Effective date: 20230217 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240613 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240613 |