JP2020524346A

JP2020524346A - 短期利益を予測する方法、装置、コンピューターデバイス、プログラムおよび記憶媒体

Info

Publication number: JP2020524346A
Application number: JP2019570544A
Authority: JP
Inventors: ▲義▼文王; 健宗王; 京肖
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2018-04-17
Filing date: 2018-07-12
Publication date: 2020-08-13
Anticipated expiration: 2038-07-12
Also published as: CN108710965A; WO2019200742A1; JP6855604B2

Abstract

本出願は、短期利益を予測する方法、装置、コンピューターデバイス、プログラムおよび記憶媒体を開示し、ここで、予測方法は、ブロックチェーンから融資対象に関連する第１の関連データを取得するステップと、第１の関連データをＫ−ｍｅａｎｓアルゴリズムに入力し、１回目のクラスタリング計算を行うステップと、１回目のクラスタリング計算によって取得された各クラスタに対して事前に設定された方法で回帰予測を行い、第１の予測結果を得るステップと、第１の予測結果に従って融資対象の短期収益性を決定するステップと、を含む。

Description

本出願は、２０１８年４月１７日に中国特許庁に出願された、「短期利益を予測する方法、装置、コンピューターデバイスおよび記憶媒体」と題された申請番号第２０１８１０３４５２５７９号に基づく優先権を主張し、その全ての内容は参照により本出願に組み込まれる。
本出願は、インターネット技術の分野に関し、特に、短期利益を予測する方法、装置、コンピューターデバイス、プログラムおよび記憶媒体に関する。

ブロックチェーンは、分散化された、信頼を必要としない新しいデータアーキテクチャであり、ネットワークにおける全てのノードによって共有、管理および監視され、単一の方面によって制御されない。ブロックチェーンは新しいデータアーキテクチャであるため、ブロックチェーンをレイアウトする初期段階でのデータ量が少なく、銀行などの金融機関は現在の「スモールデータ」を通じて短期的な利益予測をすることが難しく、適切な融資額を貸すことができないという問題がある。

本出願の主な目的は、ブロックチェーンをレイアウトする初期段階で企業に関連するデータ量が少ない場合に、企業の短期利益を予測する方法、装置、コンピューターデバイス、プログラムおよび記憶媒体を提供することである。

本出願は、短期利益の予測方法を提供し、当該方法は、ブロックチェーンから取得された融資対象に関連するデータ量がプリセット量よりも少ない場合に使用され、前記予測方法は、ブロックチェーンから融資対象に関連する第１の関連データを取得するステップと、
前記第１の関連データをＫ−ｍｅａｎｓアルゴリズムに入力し、１回目のクラスタリング計算を行うステップと、
１回目のクラスタリング計算によって取得された各クラスタに対して事前に設定された方法で回帰予測を行い、第１の予測結果を得るステップと、
前記第１の予測結果に従って融資対象の短期収益性を決定するステップと、を含む。

本出願は、短期利益の予測装置をさらに提供し、当該予測装置は、ブロックチェーンから取得された融資対象に関連するデータ量がプリセット量よりも少ない場合に使用され、前記予測装置は、
ブロックチェーンから融資対象に関連する第１の関連データを取得するための取得手段と、
前記第１の関連データをＫ−ｍｅａｎｓアルゴリズムに入力し、１回目のクラスタリング計算を行うためのクラスタリング手段と、
１回目のクラスタリング計算によって取得された各クラスタに対して事前に設定された方法で回帰予測を行い、第１の予測結果を得るための回帰手段と、
前記第１の予測結果に従って融資対象の短期収益性を決定するための決定手段と、を含む。

本出願は、メモリおよびプロセッサを含むコンピューターデバイスをさらに提供し、前記メモリにコンピューター読み取り可能な命令即ちコンピュータープログラムが記憶され、前記プロセッサは前記コンピューター読み取り可能な命令を行うときに上記予測方法のステップを実現する。
本出願は、コンピューター読み取り可能な命令が記憶される不揮発性コンピューター読み取り可能な記憶媒体をさらに提供し、前記コンピューター読み取り可能な命令は、プロセッサによって実行されるときに上記予測方法のステップを実現することを特徴とする。

本出願に係る短期利益を予測する方法、装置、コンピューターデバイス、プログラムおよび記憶媒体は、最初に取得された少量のデータに対してＫ−ｍｅａｎｓアルゴリズムによってクラスタリングし、次いでに回帰アルゴリズムによって予測して予測結果を取得し、最後に予測結果に従って融資対象の短期収益性を決定する。各企業のデータリンクをレイアウトする初期段階に関連するデータが少ない場合、銀行などの金融機関は融資企業の短期収益性を正確に予測できないという問題を解決し、融資対象の融資額を比較的正確に限定し、銀行機構の融資リスクを低減することに資する。

本発明の一実施例による短期利益の予測方法を示すフローチャートである。本発明の一実施例による短期利益の予測方法を示すフローチャートである。本発明の一実施例による短期利益の予測装置の構造を示すブロック図である。本発明の一実施例による回帰部ユニットの構造を示すブロック図である。本発明の一実施例によるクラスタリング部の構造を示すブロック図である本発明の一実施例による短期利益の予測装置の構造を示すブロック図である。本発明の一実施例によるコンピューターデバイスの構造を示すブロック図である。

図１を参照し、本出願は、短期利益の予測方法を提供し、ブロックチェーンから取得された融資対象に関連するデータ量がプリセット量よりも少ない場合に使用される。
本出願において、銀行などの金融機関の運転資金融資は、通常、一時融資、短期融資および中期貸款に分けられ、そのうち、短期融資は、期限が通常３ヶ月から１年（３ヶ月を除き、１年を含む）となる運転資金融資である。市場の変化は不規則であるため、歴史データを利用して抽出されたルールは一定の期間において正確であるが、一定の期間が経過すると、その正確性が低下する。予測時間の範囲の長さに応じて、短期予測、中期予測および長期予測の３種類に分けることができる。一般に、予測時間の範囲が短いほど、予測品質が高くなり、逆に、予測結果の精度が低くなる。本出願において、ブロックチェーン上のデータ量がプリセット量よりも少ないことを限定条件として、本方法は、各企業のデータリンクをレイアウトする初期段階で、様々なデータが比較的少ない場合に使用されることが限定され、本出願において「プリセット量よりも少ないデータ量」は、現在の「ビッグデータ」と比較して「スモールデータ」と呼ばれることがある。

上記の予測方法は、
Ｓ１、ブロックチェーンから融資対象に関連する第１の関連データを取得するステップと、
Ｓ２、前記第１の関連データをＫ−ｍｅａｎｓアルゴリズムに入力し、１回目のクラスタリング計算を行うステップと、
Ｓ３、１回目のクラスタリング計算によって取得された各クラスタに対して事前に設定された方法で回帰予測を行い、第１の予測結果を得るステップと、
Ｓ４、前記第１の予測結果に従って融資対象の短期収益性を決定するステップと、を含む。

上記のステップＳ１で説明したように、上記の融資対象は、銀行などの金融機関に融資する必要のある企業または個人である。上記の第１の関連データは、ブロックチェーン上の融資対象に関連する全てのデータであってもよく、指定された要件に従って検索されたデータであってもよく、例えば、異なる企業またはプロジェクトに従って、ブロックチェーン上の異なるデータを取得し、調達代理融資企業を例に挙げて、それは金融機関ブロックデータ、中核企業ブロックデータ、倉庫物流ブロックデータ、ディーラーブロックデータなどを取得できる。

上記のステップＳ２で説明したように、上記のＫ−ｍｅａｎｓアルゴリズムは、クラスタの数ｋ、およびｎ個のデータ対象を含むデータベースを入力し、分散の最小標準を満たすｋ個のクラスタを出力するアルゴリズムである。ｋ−ｍｅａｎｓアルゴリズムは入力量ｋを受け入れ、次いで、取得されたクラスタについて、同じクラスタ内の対象の類似性が高いが、異なるクラスタ内の対象の類似性が低いということを満たすように、ｎ個のデータ対象をｋ個のクラスタに分割する。その原理は次のとおりである：最初にいくつかの中心の位置を設定し、全ての点からこれらの中心までの距離を計算し、次いで、これらの中心に属する点を見つけ、例えば、Ａ点は、中心１との距離が最も近ければ、１番に属する。１番に属する全ての点を平均して、新しい中心点を取得する。各中心に属する中心点が変更されなくなるまで繰り返し、最終的な中心位置を取得し、データのクラスタリングを完了する。

本出願において、上記のステップＳ２の具体的なプロセスは以下のとおりである：
Ｓ２１、与えられた、ｎ個のｄ次元のデータ点を含む関連データのデータセット（第１の関連データ）Ｘ＝｛ｘ_１、ｘ_２、…、ｘ_ｎ｝に対して、ここで、ｘ_ｉ∈Ｒ^ｄ、データセットにおけるＫ個の点を選択して初期のクラスタ中心として、各対象は１種類の中心μ_ｋ（ｋ＝１、２、…、Ｋ）を表す。

Ｓ２２、各点から中心μ_ｋまでのユークリッド距離を計算し、距離の最も近い基準に従ってそれらを最も類似したクラスタ中心で表されるクラスにそれぞれ割り当てて、Ｋ個のクラスタＣ＝｛ｃ_ｋ、ｋ＝１、２、…、ｋ｝を形成する。各クラスタｃ_ｋは１つのクラスを表す。当該クラスの各点からクラスタ中心μ_ｋまでの距離の二乗和Ｊ（ｃ_ｋ）を計算する。すなわち、

Ｓ２３、各クラスのサンプルからそれが属するクラスのクラスタ中心μｋまでの合計距離の二乗和を最小になるまで計算する。

式おいて、

の場合、クラス内の全ての対象の平均値を当該クラスの新しいクラスタ中心として計算する。
Ｓ２４、クラスタ中心と値が変化したかどうかを判断し、変化した場合はステップＳ２２に戻り、変化しなかった場合にクラスタを終了する。

本出願は、Ｋ−ｍｅａｎｓアルゴリズムを利用してデータのクラスタリングを行い、簡単かつ迅速で、アルゴリズムはスケーラビリティと高効率を維持し、クラスタがガウス分布に近づける場合、より良い効果が得られる。
上記のステップＳ３で説明したように、上記の回帰予測は、予測の関連性の原則に基づいて、予測目標に影響を与える各要因を見つけて、次いで、これらの要因と予測目標との間の関数関係の類似表現を見つけて、数学の方法で見つける。上記の第１の予測結果は、１回目のクラスタリング計算により得られた各クラスタを事前に設定された方法の回帰予測によって算出された結果であり、また、上記の第１の関連データが融資対象の関連データであるため、第１の予測結果は、ある程度、融資対象の短期間内の収益性を反映できる。回帰予測の基本的なステップは以下のとおりである、すなわち、１、予測目標に従って、独立変数および従属変数を決定する。具体的には、予測される特定の目標を決定し、従属変数も決定される。予測される特定の目標が次年度の販売量である場合、販売量Ｙは従属変数である。市場調査と資料調査を通じて、予測目標に関連する影響因子、つまり独立変数を見つけ、その中から主な影響因子を選択する。２、回帰予測モデルを確立する。具体的には、独立変数および従属変数の履歴統計資料に従って計算し、これに基づいて回帰分析方程式、すなわち回帰予測モデルを確立する。３、相関分析を行う。具体的には、回帰分析は、因果関係を有する影響因子（独立変数）および予測対象（従属変数）に対して実行される数学的統計分析処理である。確立された回帰方程式は、変数と従属変数との間に関係がある場合のみ意味がある。従って、独立変数としての要因が従属変数としての予測対象に関連するかどうか、どの程度関連するか、およびこのような関連程度を判断する把握性は、回帰分析を行うときに解決する必要がある問題となる。通常、相関分析には相関関係の算出が必要であり、相関係数の大きさに従って独立変数と従属変数との間の関連程度を判断する。４、回帰予測モデルを検証し、予測誤差を計算する。具体的には、回帰予測モデルが実際の予測に使用できるかどうかは、回帰予測モデルに対する検証および予測誤差への計算によって決められる。回帰方程式は、様々な検証に合格し、予測誤差が小さい場合のみ、回帰方程式を予測モデルとして予測できる。５、予測値を計算して決定する。具体的には、回帰予測モデルを利用して予測値を計算し、予測値を総合的に分析し、最終的な予測値を決定する。本出願において、まずデータをクラスタリングし、次いでにクラスタリングされた後のデータを回帰予測し、予測速度がより速くなる。

上記のステップＳ４で説明したように、第１の予測結果に従って融資対象の短期収益性を決定する。そして、銀行などの金融機関はその収益性に従って上記の融資対象の融資額、つまり上記の融資対象の融資額上限を決定できる。上記の第１の予測結果はレベルを表す数字であってよく、例えば、レベル１〜１０に分けられ、レベルが上がると、融資対象の短期収益性が高くなり、それに応じてその融資額も高くなり、本実施例では、融資額はさらに融資対象の登録資本、市場価値などのデータに関連する。

本実施例では、上記の１回目のクラスタリング計算によって取得された各クラスタに対して事前に設定された方法で回帰予測を行うステップＳ３は、
算出された各クラスタを事前に設定されたＳＶＲ予測モデルに入力して回帰予測を行うステップＳ３１を含む。

上記のステップＳ３１に説明したように、上記のＳＶＲ（ＳｕｐｐｏｒｔＶｅｃｔｏｒＲｅｇｒｅｓｓｉｏｎ、サポートベクトル回帰）は、サポートベクターマシン（ＳＶＭ）の重要な応用ブランチである。本実施例では、目的関数を最小化することによって回帰関数を決定し、回帰関数はｆ（ｘ）＝ｗｘ＋ｂである。その具体的なプロセスは次のとおりである：

２００２年に提出されたｖ−ＳＶＣと同様に、

の不等式は等式で置き換えることができる。しかも、ユーザーはしばしば C＝１に類似した小さな定数を選択するため、C/lが小さすぎることになる。従って、ＬＩＢＳＶＭ（台湾大学のＬｉｎＣｈｉｈ−Ｊｅｎ教授らによって開発および設計された、簡単で使いやすく、高速で効率的なＳＶＭモード認識および回帰のソフトウェアパッケージ）では、ユーザーが指定したパラメータをC/lとし、つまり、

はユーザーによって指定され、ＬＩＢＳＶＭは次の問題を解決する：

ε-SVRがパラメータ

の下で取得された解は、v-SVRがパラメータ

の下で取得された解と同様である。

上式において、ｌはトレーニングサンプルの数であり、ここでｌ＝ｋ、Ｃは平衡モデルの複雑さ(1/2)w^Twとトレーニング誤差項の重みパラメータであり、εは不感損失関数であり、ζは緩和因子である。K(x_i,x)はカーネル関数である。
上記のＳＶＲ（サポートベクトル回帰アルゴリズム）は主に、クラスタリング結果を次元上げして、高次元空間で線形決定関数を構築することによって線形回帰を実現し、ｅ不感損失関数を使用する場合、その基本は主にｅ不感損失関数およびカーネル関数アルゴリズムである。フィッティングした数学モデルが多次元空間でのある曲線を表す場合、ｅ不感損失関数から得られた結果は、当該曲線およびトレーニング点の「ｅパイプ」を含む。全てのサンプル点のうち、「パイプ壁」に分布するサンプル点の部分のみによってパイプの位置を決定する。トレーニングサンプルのこの部分は、「サポートベクトル」と呼ばれる。トレーニングサンプル集合の非線形に対応するために、従来のフィッティング方法では通常、線形方程式の後に高次項を追加する。この方法は効果的であるが、調整可能なパラメータを増やすとオーバーフィッティングのリスクが高まる。ＳＶＲはカーネル関数を採用することによってこの矛盾を解決した。線形方程式中の線形項をカーネル関数で置き換えると、元の線形アルゴリズムを「非線形化」にすることができ、つまり、非線形回帰を実行できる。同時に、カーネル関数の導入は「次元上げ」の目的を達成し、増加した調整可能なパラメータはオーバーフィッティングでも制御されることができる。本出願では、成熟した技術を備えたＳＶＲアルゴリズムが使用され、計算結果は信頼でき、さらに正確な予測の効果を達成できる。

一実施例において、上記の前記第１の関連データをＫ−ｍｅａｎｓアルゴリズムに入力し、１回目のクラスタリング計算を行うステップＳ２は、
前記第１の関連データに対して特徴抽出を行うステップＳ２１と、
抽出された特徴データに対して関連性分析を行い、他の特徴データに関連しない無相関特徴データを得るステップＳ２２と、
前記第１の関連データにおいて前記無相関特徴データに対応する第１の関連データをクリアした後、Ｋ−ｍｅａｎｓアルゴリズムに入力し、１回目のクラスタリング計算を行うステップＳ２３と、を含む。

上記のステップＳ２０１からＳ２０３に説明したように、上記の融資対象に関連する第１の関連データに対して特徴抽出を行い、関連性分析を行い特徴データにおいて他の特徴データに関連しない無相関特徴データを見つけて、次いで、これらの無相関特徴データに対応する第１の関連データを第１の関連データから削除し、残された第１の関連データを使用してクラスタリング計算し、得られたクラスタがより正確になり、無相関特徴データに対応する第１の関連データが削除されたため、クラスタリング計算の効率を向上させる。

本実施例では、第１の関連データに対して特徴抽出を行う方法は、具体的に、Ｒｅｌｉｅｆアルゴリズム（Ｒｅｌｉｅｆアルゴリズムは特徴重みアルゴリズム（Ｆｅａｔｕｒｅｗｅｉｇｈｔｉｎｇａｌｇｏｒｉｔｈｍｓである）であり、各特徴およびクラスの関連性に従って特徴の異なる重みを与え、重みが特定の閾値より小さい特徴は削除される）を使用して特徴抽出を行う。Ｒｅｌｉｅｆアルゴリズムは、トレーニング集合ＤからサンプルＲをランダムに選択し、そして、Ｒと同じクラスに属するサンプルからＮｅａｒＨｉｔと呼ばれる最近傍サンプルＨを検索し、Ｒと異なるクラスに属するサンプルからＮｅａｒＭｉｓｓと呼ばれる最近傍サンプルＭを検索し、その後、次のルールに従って各特徴の重みを更新する。すなわち、特定の特徴でＲとＮｅａｒＨｉｔとの間の距離がＲとＮｅａｒＭｉｓｓとの間の距離より小さい場合、当該特徴が同じクラスと異なるクラスの最近傍を区別することに役立つことが示され、当該特徴の重みを増やす。逆に、特定の特徴でＲとＮｅａｒＨｉｔとの間の距離がＲとＮｅａｒＭｉｓｓとの間の距離より大きい場合、当該特徴が同じクラスと異なるクラスの最近傍を区別することにマイナスの影響を与えることが示され、当該特徴の重みを減らす。上記のプロセスをｍ回繰り返し、最後に各特徴の平均重みを取得する。特徴の重みが大きいほど、当該特徴の分類能力が強くなり、逆に、当該特徴の分類能力が弱くなる。Ｒｅｌｉｅｆアルゴリズムの実行時間は、サンプルのサンプリング回数ｍおよび元の特徴の数Ｎの増加につれて線形増加するため、実行効率が非常に高くなる。具体的なアルゴリズムは以下のとおりである：

トレーニングデータセットをＤとし、サンプルのサンプリング回数をｍとし、特徴重みの閾値をδとし、最近傍サンプルの数を各特性の特徴重みＴとして出力される：
１、全ての特徴重みを０に設定し、Ｔを空集合とする。
２、ｆｏｒｉ＝１ｔｏｍｄｏ
１）、サンプルＲをランダムに選択する；
２）、同じクラスに属するサンプル集合からＲの最近傍Ｈを見つけて、異なるクラスに属するサンプル集合から最近傍サンプルＭを見つける。
３）、ｆｏｒＡ＝１ｔｏＮｄｏ
W(A)=W(A)-diff(A,R,H)/m+diff(A,R,M)/m
３、ｆｏｒＡ＝１ｔｏＮｄｏ
ｉｆ W(A)≧δ
Ａ番目の特徴をＴに追加する。

一実施例において、上記の抽出された特徴データに対して関連性分析を行い、他の特徴データに関連しない無相関特徴データを得るステップＳ２０２は、以下を含む：
Ｓ２０２１、前記特徴データを散布図として作成し、前記散布図における離散点に対応する特徴データを前記無相関特徴データとして記録する。

上記のステップＳ２０２１で説明したように、上記の散布図（ｓｃａｔｔｅｒｄｉａｇｒａｍ）は、回帰分析においてデカルト座標系平面上のデータ点の分布を指し、通常はクラス間の集計データを比較するために使用される。散布図に含まれるデータが多いほど、比較する効果がよりよくなる。本実施例において、上記の特徴データは一般に行列であり、この場合、散布図行列を利用して各独立変数間の散布図を同時に描くことができ、こうして複数の変数間の主な関連性を迅速に見つけることができる。上記の特徴データを散布図に作成するプロセスは視覚化のプロセスであり、特徴データが視覚化されるため、肉眼でグラフまたは画像上の離散点の存在を直感的に識別し、そして離散点を選択することができ、コンピューターデバイスは、選択された離散点に対応する特徴データを無相関特徴データとして記録する。

別の実施例において、上記の抽出された特徴データに対して関連性分析を行い、他の特徴データに関連しない無相関特徴データを得るステップＳ２０２は、以下を含む：
Ｓ２０２２、前記特徴データに対して関連行列分析を行い、他の特徴データに関連しない前記無相関特徴データを抽出する。

上記のステップＳ２０２２で説明したように、上記の関連行列は、相関係数行列とも呼ばれ、行列の各列間の相関係数から構成される。つまり、関連行列のｉ行目のｊ列目の要素は、元の行列のｉ列目とｊ列目の相関係数である。本実施例において、普通は、共分散行列を用いて分析し、共分散は、２つの変数の全体誤差を測定するために使用され、２つの変数の変化傾向が一致する場合、共分散は正の値であり、２つの変数が正の相関であることが示される。２つの変数が反対方向に変化する場合、共分散は負の値であり、２つの変数が負の相関であることが示される。２つの変数が互いに独立している場合、共分散は０であり、２つの変数が無関係であることが示され、変数が３組以上である場合、対応する共分散行列が使用される。

図２を参照し、在本実施例では、上記の前記第１の予測結果に従って融資対象の短期収益性を決定するステップＳ４の後、以下を含む：
Ｓ５、非ブロックチェーン上の前記融資対象に関連する第２の関連データを取得する。
Ｓ６、前記第２の関連データをＫ−ｍｅａｎｓアルゴリズムに入力し、２回目のクラスタリング計算を行う。
Ｓ７、２回目のクラスタリング計算によって得られた各クラスタに対して事前に設定された方法で回帰予測を行い、第２の予測結果を取得する。
Ｓ８、前記第１の予測結果と前記第２の予測結果との差が事前に設定された閾値よりも小さいかどうかを判断する。
Ｓ９、前記差が前記閾値よりも小さい場合、前記第１の予測結果に従って融資対象の短期収益性を決定した結果は使用可能な結果であると判断する。

上記のステップＳ５からＳ９で説明したように、上記の非ブロックチェーン上の第２の関連データとは、ブロックチェーンに記録されていないデータ、通常はビッグデータネットワーク内のデータを指す。第２の関連データのクラスタリングアルゴリズムおよび回帰予測方法は、上記の第１の関連データと同一であり、ここで再度の説明を省略する。本実施例では、第１の関連データに従って得られた第１の予測結果を第２の関連データに従って得られた第２の予測結果と比較し、つまり、第１の予測結果が利用可能かどうかを判断するための検証ステップを設定する。本出願において、主にブロックチェーンをレイアウトする初期段階を狙うため、各企業の歴史データの多くは、企業自身のサーバーや企業に関連する他の企業のサーバーなどのビッグデータのインターネット上に存在し、インターネット環境にある限り、入手することが可能である。本ステップにおいて、主にインターネット上の「ビッグデータ」を利用して得られた第２の予測結果によって、ブロックチェーン上の「スモールデータ」を利用して得られた第１の予測結果を検証し、第２の予測結果と第１の予測結果との差が事前に設定された閾値よりも小さい場合のみ、第１の予測結果が実質的に正しく、使用できると判断する。

一実施例において、上記の前記第１の関連データをＫ−ｍｅａｎｓアルゴリズムに入力し、１回目のクラスタリング計算を行うステップＳ２の前、以下を含む：
Ｓ２０１、前記第１の関連データのデータ量が事前に設定されたデータ閾値よりも大きいかどうかを判断する。
Ｓ２０２、そうであれば、前記第１の関連データを事前に設定されたビッグデータに基づく予測アルゴリズムに入力して予測する。

上記のステップＳ２０１およびＳ２０２で説明したように、データ閾値が設定され、取得された第１の関連データのデータ量がデータ閾値よりも大きい場合、上記の短期利益の予測方法が適用される「スモールデータ」の範囲から逸脱しているため、その後のクラスタリング、回帰予測などのステップを停止し、予測方法を切り替える。具体的な切り替え方法は、取得された第１の関連データを、ＴＤ−ＡＢＣモデルに基づく企業利益モデルなどの事前に設定された既存の比較的成熟した予測モデルに入力してよい。

一実施例において、上記の第１の関連データには不正データが含まれるかどうかをさらに分析してもよく、具体的な方法として、取得された第１の関連データに対して特徴抽出を行い、特徴データを得て、前記特徴データから他の特徴データに関連しない無相関特徴データを抽出して、次いで、Ｖｏｒｏｎｏｉアルゴリズムによって前記無相関特徴データに対して外れ値の認識を行い、不正データを得る。不正データの量によって、融資対象の評判値を分析できる。そして、評判値と短期収益性に基づいて、融資対象の融資額を決定する。

特定の実施例において、企業ａは、銀行Ｐから融資する必要があり、銀行Ｐは、企業ａを評価する必要があり、その評価のプロセスは次のとおりである：１、ブロックチェーンから企業ａの販売データ、生産データ、財務データなど、当該企業ａに関連する全てのデータを収集する。その後、取得されたデータに対して特徴抽出を行い、不要なデータを事前に削除し、後続のクラスタリング計算の速度および効率を高める。具体的な削除方法は、最初に抽出されたデータを散布図として視覚的に形成し、その後、散布図中の離散点を削除する。２、ブロックチェーンから取得された企業ａのデータに対してＫ−ｍｅａｎｓアルゴリズムによってクラスタリング計算を行う。３、クラスタリング計算の結果に対してＳＶＲ回帰予測を行い、さらに当該企業ａの収益性などの結果を得る。４、上記の不正データの認識方法を通じて企業ａの信用などをさらに判断する。５、銀行Ｐは、企業ａの信用、収益性などに従って、企業ａに融資できるかどうか、および最大融資限度などを決定する。具体的には、企業ａの信用がプリセット値よりも小さい場合、企業ａへの融資が拒否される。企業ａの信用がプリセット値である場合、企業ａに融資ができ、この場合、当該企業ａの収益性と組み合わせて、最大の融資限度などを計算することによって、リスクを回避する銀行Ｐの能力を効果的に向上させる。具体的には、取得された企業ａのデータリンク上のデータは、調達する商品の種類や当該調達資金のデータ、税関輸出品、関税、輸入品、関税、国内販売データ、販売製品データ、融資データ、返済信用データ、在庫データ、物流関連データ（倉庫の数量、倉庫の地理的分布、各倉庫の保管データ、販売地域の分布）などを含む。

本出願に係る短期利益の予測方法は、最初に取得された「スモールデータ」に対してＫ−ｍｅａｎｓアルゴリズムによってクラスタリングを行い、その後、回帰アルゴリズムによって予測して予測結果を得て、最後に予測結果に従って融資対象の短期収益性を決定する。各企業のデータリンクをレイアウトする初期段階に関連するデータが少ない場合、銀行などの金融機関は融資企業の短期収益性を正確に予測できないという問題を解決し、融資対象の融資額を比較的正確に限定し、銀行機構の融資リスクを低減することに資する。

図３を参照し、本出願の実施例は短期利益の予測装置をさらに提供し、ブロックチェーンから取得された融資対象に関連するデータ量がプリセット量よりも少ない場合に使用される。
本出願において、銀行などの金融機関の運転資金融資は、通常、一時融資、短期融資および中期貸款に分類され、そのうち、短期融資は、期限が通常３ヶ月から１年（３ヶ月を除き、１年を含む）となる運転資金融資である。市場の変化は不規則であるため、歴史データを利用して抽出されたルールは一定の期間において正確であるが、一定の期間が経過すると、その正確性が低下する。予測時間の範囲の長さに応じて、短期予測、中期予測および長期予測の３種類に分けることができる。普通は、予測時間の範囲が短いほど、予測品質が高くなり、逆に、予測結果の精度が低くなる。本出願において、ブロックチェーン上のデータ量がプリセット量よりも少ないことを限定条件として、本方法は、各企業のデータリンクをレイアウトする初期段階で、様々なデータが比較的少ない場合に使用されることが限定され、本出願において「プリセット量よりも少ないデータ量」は、現在の「ビッグデータ」と比較して「スモールデータ」と呼ばれることがある。

上記の予測装置は、
ブロックチェーンから融資対象に関連する第１の関連データを取得するための取得部１０と、
前記第１の関連データをＫ−ｍｅａｎｓアルゴリズムに入力し、１回目のクラスタリング計算を行うためのクラスタリング部２０と、
１回目のクラスタリング計算によって取得された各クラスタに対して事前に設定された方法で回帰予測を行い、第１の予測結果を得るための回帰部３０と、
前記第１の予測結果に従って融資対象の短期収益性を決定するための決定部４０と、を含む。

上記の取得部１０において、上記の融資対象は、銀行などの金融機関から融資する必要がある企業または個人である。上記の第１の関連データは、ブロックチェーン上の融資対象に関連する全てのデータであってもよく、指定された要件に従って検索されたデータであってもよく、例えば、異なる企業またはプロジェクトに従って、ブロックチェーン上の異なるデータを取得し、調達代理融資企業を例に挙げて、それは金融機関ブロックデータ、中核企業ブロックデータ、倉庫物流ブロックデータ、ディーラーブロックデータなどを取得できる。

上記のクラスタリング部２０において、上記のＫ−ｍｅａｎｓアルゴリズムは、クラスタの数ｋ、およびｎ個のデータ対象を含むデータベースを入力し、分散の最小標準を満たすｋ個のクラスタを出力するアルゴリズムである。ｋ−ｍｅａｎｓアルゴリズムは入力量ｋを受け入れ、次いでに、取得されたクラスタについて、同じクラスタ内の対象の類似性が高いが、異なるクラスタ内の対象の類似性が低いということを満たすように、ｎ個のデータ対象をｋ個のクラスタに分割する。その原理は次のとおりである：最初にいくつかの中心の位置を設定し、全ての点からこれらの中心までの距離を計算し、次いでにこれらの中心に属する点を見つけ、例えば、Ａ点は、中心１との距離が最も近ければ、１番に属する。１番に属する全ての点を平均して、新しい中心点を取得する。各中心に属する中心点が変更されなくなるまで繰り返し、最終的な中心位置を取得し、データのクラスタリングを完了する。

本出願において、上記のクラスタリング部２０の具体的なプロセスは以下のとおりである：
（１）、与えられた、ｎ個のｄ次元のデータ点を含む関連データのデータセット（第１の関連データ）Ｘ＝｛ｘ_１、ｘ_２、…、ｘ_ｎ｝に対して、ここで、ｘ_ｉ∈Ｒ^ｄ、データセットにおけるＫ個の点を初期のクラスタ中心として選択し、各対象は１種類の中心μ_ｋ（ｋ＝１、２、…、Ｋ）を表す。
（２）、各点から中心μ_ｋまでのユークリッド距離を計算し、距離の最も近い基準に従ってそれらを最も類似したクラスタ中心で表されるクラスにそれぞれ割り当てて、Ｋ個のクラスタＣ＝｛ｃ_ｋ、ｋ＝１、２、…、ｋ｝を形成する。各クラスタｃ_ｋは１つのクラスを表す。当該クラスの各点からクラスタ中心μ_ｋまでの距離の二乗和Ｊ（ｃ_ｋ）を計算する。すなわち、

（３）、各クラスのサンプルからその属するクラスのクラスタ中心μｋまでの合計距離の二乗和を最小になるまで計算する。

式おいて、

の場合、クラス内の全ての対象の平均値を当該クラスの新しいクラスタ中心として計算する。
（４）、クラスタ中心と値が変化したかどうかを判断し、変化した場合はステップＳ２２に戻り、変化しなかった場合にクラスタを終了する。

本出願は、Ｋ−ｍｅａｎｓアルゴリズムを利用してデータのクラスタリングを行い、簡単かつ迅速で、アルゴリズムはスケーラビリティと高効率を維持し、クラスタがガウス分布に近い場合、より良い効果が得られる。
上記の回帰部３０において、上記の回帰予測は、予測の関連性の原則に基づいて、予測目標に影響を与える各要因を見つけて、次いでにこれらの要因と予測目標との間の関数関係の類似表現を見つけて、数学の方法で見つける。上記の第１の予測結果は、１回目のクラスタリング計算により得られた各クラスタを事前に設定された方法の回帰予測によって算出された結果であり、また、上記の第１の関連データが融資対象の関連データであるため、第１の予測結果は、ある程度、融資対象の短期間内の収益性を反映できる。回帰予測の基本的なステップは以下のとおりである、すなわち、（１）予測目標に従って、独立変数および従属変数を決定する。具体的には、予測の特定の目標を決定し、従属変数も決定される。予測の特定の目標が次年度の販売量である場合、販売量Ｙは従属変数である。市場調査と資料調査を通じて、予測目標に関連する影響因子、つまり独立変数を見つけ、その中から主な影響因子を選択する。（２）回帰予測モデルを確立する。具体的には、独立変数および従属変数の履歴統計資料に従って計算し、これに基づいて回帰分析方程式、すなわち回帰予測モデルを確立する。（３）相関分析を行う。具体的には、回帰分析は、因果関係を有する影響因子（独立変数）および予測対象（従属変数）に対して行われる数学的統計分析処理である。確立された回帰方程式は、変数と従属変数との間に関係がある場合のみ意味がある。従って、独立変数としての要因が従属変数としての予測対象に関連するかどうか、どの程度関連するか、およびこのような関連程度を判断する把握性は、回帰分析を行うときに解決する必要がある問題となる。通常、相関分析には相関関係の算出が必要であり、相関係数の大きさに従って独立変数と従属変数との間の関連程度を判断する。（４）回帰予測モデルを検証し、予測誤差を計算する。具体的には、回帰予測モデルが実際の予測に使用できるかどうかは、回帰予測モデルに対する検証および予測誤差への計算によって決められる。回帰方程式は、様々な検証に合格し、予測誤差が小さい場合のみ、回帰方程式を予測モデルとして予測できる。（５）予測値を計算して決定する。具体的には、回帰予測モデルを利用して予測値を計算し、予測値を総合的に分析し、最終的な予測値を決定する。本出願において、まずデータをクラスタリングし、次いでにクラスタリングされた後のデータを回帰予測し、予測速度がより速くなる。

上記の決定部４０において、第１の予測結果に従って融資対象の短期収益性を決定する。そして、銀行などの金融機関はその収益性に従って上記の融資対象の融資額、つまり上記の融資対象の融資額上限を決定できる。上記の第１の予測結果はレベルを表す数字であってよく、例えば、レベル１〜１０に分けられ、レベルが上がると、融資対象の短期収益性が強くなり、それに応じてその融資額も高くなり、本実施例では、融資額はさらに融資対象の登録資本、市場価値などのデータに関連する。

図４を参照し、本実施例では、上記の回帰部３０は、
算出された各クラスタを事前に設定されたＳＶＲ予測モデルに入力して回帰予測を行うためのＳＶＲ予測モジュール３１を含む。

上記のＳＶＲ予測モジュール３１において、上記のＳＶＲ（ＳｕｐｐｏｒｔＶｅｃｔｏｒＲｅｇｒｅｓｓｉｏｎ、サポートベクトル回帰）は、サポートベクターマシン（ＳＶＭ）の重要な応用ブランチである。本実施例では、目的関数を最小化することによって回帰関数を決定し、回帰関数はｆ（ｘ）＝ｗｘ＋ｂである。その具体的なプロセスは次のとおりである：

２００２年に提出されたｖ−ＳＶＣと同様に、e^T(α＋α^*)≦Cvの不等式は等式で置き換えることができる。しかも、ユーザーはしばしば C＝１に類似した小さな定数を選択するため、C/lが小さすぎる。従って、ＬＩＢＳＶＭでは、ユーザーが指定したパラメータをC/lとし、つまり、

ε-SVRがパラメータ

の下で取得された解は、v-SVRがパラメータ

の下で取得された解と同様である。

上式において、ｌはトレーニングサンプルの数であり、ここでｌ＝ｋ、Ｃは平衡モデルの複雑さ（１／２）ｗ^Ｔｗとトレーニング誤差項の重みパラメータであり、εは不感損失関数であり、ζは緩和因子である。Ｋ（ｘ_ｉ、ｘ）はカーネル関数である。

上記のＳＶＲ（サポートベクトル回帰アルゴリズム）は主に、クラスタリング結果を次元上げして、高次元空間で線形決定関数を構築することによって線形回帰を実現し、ｅ不感損失関数を使用する場合、その基本は主にｅ不感損失関数およびカーネル関数アルゴリズムである。フィッティングした数学モデルが多次元空間でのある曲線を表す場合、ｅ不感損失関数から得られた結果は、当該曲線およびトレーニング点の「ｅパイプ」を含む。全てのサンプル点のうち、「パイプ壁」に分布するサンプル点の部分のみによってパイプの位置を決定する。トレーニングサンプルのこの部分は、「サポートベクトル」と呼ばれる。トレーニングサンプル集合の非線形に対応するために、従来のフィッティング方法では通常、線形方程式の後に高次項を追加する。この方法は効果的であるが、調整可能なパラメータを増やすとオーバーフィッティングのリスクが高まる。ＳＶＲはカーネル関数を採用することによってこの矛盾を解決する。線形方程式中の線形項をカーネル関数で置き換えると、元の線形アルゴリズムを「非線形化」にすることができ、つまり、非線形回帰を実行できる。同時に、カーネル関数の導入は「次元上げ」の目的を達成し、増加した調整可能なパラメータはオーバーフィッティングでも制御されることができる。本出願では、成熟した技術を備えたＳＶＲアルゴリズムが使用され、計算結果は信頼でき、さらに正確な予測の効果を達成できる。

図５を参照し、一実施例において、上記のクラスタリング部２０は、
前記第１の関連データに対して特徴抽出を行うための抽出モジュール２１と、
抽出された特徴データに対して関連性分析を行い、他の特徴データに関連しない無相関特徴データを得るための分析モジュール２２と、
前記第１の関連データにおいて前記無相関特徴データに対応する第１の関連データをクリアした後、Ｋ−ｍｅａｎｓアルゴリズムに入力し、１回目のクラスタリング計算を行うためのクラスタリングモジュール２３と、を含む。

上記の抽出モジュール２１、分析モジュール２２およびクラスタリングモジュール２３において、上記の融資対象に関連する第１の関連データに対して特徴抽出を行い、関連性分析を行いて特徴データにおける他の特徴データに関連しない無相関特徴データを見つけて、次いでに、これらの無相関特徴データに対応する第１の関連データを第１の関連データから削除し、残された第１の関連データを使用してクラスタリング計算し、得られたクラスタがより正確になり、無相関特徴データに対応する第１の関連データが削除されるため、クラスタリング計算の効率を向上させる。本実施例では、第１の関連データに対して特徴抽出を行う方法は、具体的に、Ｒｅｌｉｅｆアルゴリズム（Ｒｅｌｉｅｆアルゴリズムは特徴重みアルゴリズム（Ｆｅａｔｕｒｅｗｅｉｇｈｔｉｎｇａｌｇｏｒｉｔｈｍｓである）であり、各特徴およびクラスの関連性に従って特徴の異なる重みを割り当て、重みが特定の閾値より小さい特徴は削除される）を使用して特徴抽出を行う。Ｒｅｌｉｅｆアルゴリズムは、トレーニング集合ＤからサンプルＲをランダムに選択し、そして、Ｒと同じクラスに属するサンプルからＮｅａｒＨｉｔと呼ばれる最近傍サンプルＨを検索し、Ｒと異なるクラスに属するサンプルからＮｅａｒＭｉｓｓと呼ばれる最近傍サンプルＭを検索し、その後、次のルールに従って各特徴の重みを更新する。すなわち、特定の特徴でＲとＮｅａｒＨｉｔとの間の距離がＲとＮｅａｒＭｉｓｓとの間の距離より小さい場合、当該特徴が同じクラスと異なるクラスの最近傍を区別することに役立つことが示され、当該特徴の重みを増やす。逆に、特定の特徴でＲとＮｅａｒＨｉｔとの間の距離がＲとＮｅａｒＭｉｓｓとの間の距離より大きい場合、当該特徴が同じクラスと異なるクラスの最近傍を区別することにマイナスの影響を与えることが示され、当該特徴の重みを減らす。上記のプロセスをｍ回繰り返し、最後に各特徴の平均重みを取得する。特徴の重みが大きいほど、当該特徴の分類能力が強くなり、逆に、当該特徴の分類能力が弱くなる。Ｒｅｌｉｅｆアルゴリズムの実行時間は、サンプルのサンプリング回数ｍおよび元の特徴の数Ｎの増加につれて線形増加するため、実行効率が非常に高くなる。具体的なアルゴリズムは既に方法の実施例で説明されているため、再度の説明を省略する。

一実施例において、上記の分析モジュール２２は、前記特徴データを散布図として作成し、前記散布図において離散点に対応する特徴データを前記無相関特徴データとして記録するための視覚分析サブモジュールを含む。
上記の視覚分析サブモジュールにおいて、上記の散布図（ｓｃａｔｔｅｒｄｉａｇｒａｍ）は、回帰分析においてデカルト座標系平面上のデータ点の分布を指し、通常はクラス間の集計データを比較するために使用される。散布図に含まれるデータが多いほど、比較する効果がよりよくなる。本実施例において、上記の特徴データは一般に行列であり、この場合、散布図行列を利用して各独立変数間の散布図を同時に描くことができ、こうして複数の変数間の主な関連性を迅速に見つけることができる。上記の特徴データを散布図に作成するプロセスは即ち視覚化のプロセスであり、特徴データが視覚化されるため、肉眼でグラフまたは画像上の離散点の存在を直感的に識別し、そして離散点を選択することができ、コンピューターデバイスは、選択された離散点に対応する特徴データを無相関特徴データとして記録する。

別の実施例において、上記の分析モジュール２２は、前記特徴データに対して関連行列分析を行い、他の特徴データに関連しない前記無相関特徴データを抽出するための行列分析サブモジュールを含む。
上記の行列分析サブモジュールにおいて、上記の関連行列は、相関係数行列とも呼ばれ、行列の各列間の相関係数から構成される。つまり、関連行列のｉ行目のｊ列目の要素は、元の行列のｉ列目とｊ列目の相関係数である。本実施例において、一般に共分散行列を用いて分析し、共分散は、２つの変数の全体誤差を測定するために使用され、２つの変数の変化傾向が一致する場合、共分散は正の値であり、２つの変数が正の相関であることが示される。２つの変数が反対方向に変化する場合、共分散は負の値であり、２つの変数が負の相関であることが示される。２つの変数が互いに独立している場合、共分散は０であり、２つの変数が無関係であることが示され、変数が３組以上である場合、対応する共分散行列が使用される。

図６を参照し、本実施例では、上記の短期利益の予測装置は、
非ブロックチェーン上の前記融資対象に関連する第２の関連データを取得するためのデータ取得部５０と、
前記第２の関連データをＫ−ｍｅａｎｓアルゴリズムに入力し、２回目のクラスタリング計算を行うためのデータクラスタリング部６０と、
２回目のクラスタリング計算によって得られた各クラスタに対して事前に設定された方法で回帰予測を行い、第２の予測結果を取得するためのクラスタリング回帰部７０と、
前記第１の予測結果と前記第２の予測結果との差が事前に設定された閾値よりも小さいかどうかを判断するための比較部８０と、
前記差が前記閾値よりも小さい場合、前記第１の予測結果に従って融資対象の短期収益性を決定した結果は使用可能な結果であると判断するための判定部９０と、をさらに含む。

上記の非ブロックチェーン上の第２の関連データとは、ブロックチェーンに記録されていないデータ、通常はビッグデータネットワーク内のデータを指す。第２の関連データのクラスタリングアルゴリズムおよび回帰予測方法は、上記の第１の関連データと同一であり、ここで再度の説明を省略する。本実施例では、第１の関連データに従って得られた第１の予測結果を第２の関連データに従って得られた第２の予測結果と比較し、つまり、第１の予測結果が利用可能かどうかを判断するための検証ステップを設定する。本出願において、主にブロックチェーンをレイアウトする初期段階を狙うため、各企業の歴史データの多くは、企業自身のサーバーや企業に関連する他の企業のサーバーなどのビッグデータのインターネット上に存在し、インターネット環境にある限り、入手することが可能である。本ステップにおいて、主にインターネット上の「ビッグデータ」を利用して得られた第２の予測結果によって、ブロックチェーン上の「スモールデータ」を利用して得られた第１の予測結果を検証し、第２の予測結果と第１の予測結果との差が事前に設定された閾値よりも小さい場合のみ、第１の予測結果が実質的に正しく、使用できると判断する。

一実施例において、上記の短期利益の予測装置は、
前記第１の関連データのデータ量が事前に設定されたデータ閾値よりも大きいかどうかを判断するための判断部と、
前記第１の関連データを事前に設定されたビッグデータに基づく予測アルゴリズムに入力して予測するための切替部と、をさらに含む。

上記の判断部および切替部において、データ閾値が設定され、取得された第１の関連データのデータ量がデータ閾値よりも大きい場合、上記の短期利益の予測装置が適用される「スモールデータ」の範囲から逸脱しているため、その後のクラスタリング、回帰予測などの予測プロセスを停止して、予測方法を切り替える。具体的な切り替え方法は、取得された第１の関連データを、ＴＤ−ＡＢＣモデルに基づく企業利益モデルなどの事前に設定された既存の比較的に成熟した予測モデルに入力してよい。

一実施例において、上記の短期利益の予測装置は、以下をさらに含む。
不正分析部であって、上記の第１の関連データには不正データが含まれるかどうかを分析するために使用され、具体的な方法として、取得された第１の関連データに対して特徴抽出を行い、特徴データを得て、前記特徴データから他の特徴データに関連しない無相関特徴データを抽出して、次いでにＶｏｒｏｎｏｉアルゴリズムによって前記無相関特徴データに対して外れ値の認識を行い、不正データを得る。不正データの量によって、融資対象の評判値を分析できる。そして、評判値と短期収益性に基づいて、融資対象の融資額を決定する。

特定の実施例において、企業ａは、銀行Ｐから融資する必要があり、銀行Ｐは、企業ａを評価する必要があり、その評価のプロセスは次のとおりである：１、ブロックチェーンから企業ａの販売データ、生産データ、財務データなど、当該企業ａに関連する全てのデータを収集する。その後、取得されたデータに対して特徴抽出を行い、不要なデータを事前に削除し、後続のクラスタリング計算の速度および効率を高める。具体的な削除方法は、最初に抽出されたデータを散布図として視覚的に形成し、その後、散布図中の離散点を削除する。２、ブロックチェーンから取得された企業ａのデータに対してＫ−ｍｅａｎｓアルゴリズムによってクラスタリング計算を行う。３、クラスタリング計算の結果に対してＳＶＲ回帰予測を行い、さらに当該企業ａの収益性などの結果を得る。４、上記の不正データの認識方法を通じて企業ａの信用などをさらに判断する。５、銀行Ｐは、企業ａの信用、収益性などに従って、企業ａに融資できるかどうか、および最大融資限度などを決定する。具体的には、企業ａの信用がプリセット値よりも小さい場合、企業ａへの融資が拒否される。企業ａの信用がプリセット値である場合、企業ａに融資でき、この場合、当該企業ａの収益性と組み合わせて、最大の融資限度などを計算することによって、リスクを回避する銀行Ｐの能力が効果的に向上させる。具体的には、取得された企業ａのデータリンク上のデータは、調達商品の種類や当該調達資金のデータ、税関輸出品、関税、輸入品、関税、国内販売データ、販売製品データ、融資データ、返済信用データ、在庫データ、物流関連データ（倉庫の数量、倉庫の地理的分布、各倉庫の保管データ、販売地域の分布）などを含む。

本出願に係る短期利益の予測装置は、最初に取得された「スモールデータ」に対してＫ−ｍｅａｎｓアルゴリズムによってクラスタリングを行い、その後、回帰アルゴリズムによって予測して予測結果を得て、最後に予測結果に従って融資対象の短期収益性を決定する。各企業のデータリンクをレイアウトする初期段階に関連するデータが少ない場合、銀行などの金融機関は融資企業の短期収益性を正確に予測できないという問題を解決し、融資対象の融資額を比較的正確に限定し、銀行機構の融資リスクを低減することに資する。

図７を参照し、本発明の実施例は、コンピューターデバイスをさらに提供し、当該コンピューターデバイスはサーバーであってよく、その内部構造は図７に示すとおりである。当該コンピューターデバイスは、システムバスを介して接続されたプロセッサと、メモリと、ネットワークインターフェースと、データベースと、を含む。ここで、当該コンピューターにおけるプロセッサは、計算および制御能力を提供するために使用される。当該コンピューターデバイスのメモリは、不揮発性記憶媒体と、内部メモリとを含む。当該不揮発性記憶媒体には、オペレーティングシステムと、コンピューター読み取り可能な命令、およびデータベースが記憶されている。当該内部メモリは、不揮発性記憶媒体におけるオペレーティングシステムおよびコンピューター読み取り可能な命令に対して動作環境を提供する。当該コンピューターデバイスのデータベースは、取得された第１の関連データ、第２の関連データ、およびＫ−ｍｅａｎｓアルゴリズムモデルなどのデータを記憶するために使用される。当該コンピューターデバイスのネットワークインターフェースは、ネットワーク接続を介して外部端末と通信するために使用される。当該コンピューター読み取り可能な命令は、上記の各方法の実施例のフローを実現するために、プロセッサによって実行される。

本発明の一実施例は、コンピューター読み取り可能な命令が記憶される不揮発性コンピューター読み取り可能な記憶媒体をさらに提供し、コンピューター読み取り可能な命令がプロセッサによって実行されるときに、上記の各方法の実施例のフローを実現する。
上記の説明は本出願の好適な実施例に過ぎず、本出願の特許範囲を限定するものではなく、本出願の明細書および図面の内容によってなされる同等の構造または同等のプロセス変換、或いは、他の関連する技術分野に直接または間接的に適用されるものは、いずれも本出願の特許請求の範囲に含まれる。

１０取得部
２０クラスタリング部
２１抽出モジュール
２２分析モジュール
２３クラスタリングモジュール
３０回帰部
３１ＳＶＲ予測モジュール
４０決定部
５０データ取得部
６０データクラスタリング部
７０クラスタリング回帰部
８０比較部
９０判定部

Claims

ブロックチェーンから取得された融資対象に関連するデータ量がプリセット量よりも少ない場合に使用され、
ブロックチェーンから融資対象に関連する第１の関連データを取得するステップと、
前記第１の関連データをＫ−ｍｅａｎｓアルゴリズムに入力し、１回目のクラスタリング計算を行うステップと、
１回目のクラスタリング計算によって取得された各クラスタに対して事前に設定された方法で回帰予測を行い、第１の予測結果を得るステップと、
前記第１の予測結果に従って融資対象の短期収益性を決定するステップと、を含むことを特徴とする短期利益の予測方法。
前記の１回目のクラスタリング計算によって取得された各クラスタに対して事前に設定された方法で回帰予測を行うステップは、
算出された各クラスタを事前に設定されたＳＶＲ予測モデルに入力して回帰予測を行うステップを含むことを特徴とする請求項１に記載の短期利益の予測方法。
前記第１の関連データをＫ−ｍｅａｎｓアルゴリズムに入力し、１回目のクラスタリング計算を行うステップは、
前記第１の関連データに対して特徴抽出を行うステップと、
抽出された特徴データに対して関連性分析を行い、前記特徴データにおいて他の特徴データに関連しない無相関特徴データを得るステップと、
前記第１の関連データにおいて前記無相関特徴データに対応する目標データをクリアした後、Ｋ−ｍｅａｎｓアルゴリズムに入力し、１回目のクラスタリング計算を行うステップと、を含むことを特徴とする請求項１に記載の短期利益の予測方法。
前記抽出された特徴データに対して関連性分析を行い、他の特徴データに関連しない無相関特徴データを得るステップは、
前記特徴データを散布図として作成し、前記散布図において離散点に対応する特徴データを前記無相関特徴データとして記録するステップを含むことを特徴とする請求項３に記載の短期利益の予測方法。
前記抽出された特徴データに対して関連性分析を行い、他の特徴データに関連しない無相関特徴データを得るステップは、
前記特徴データに対して関連行列分析を行い、他の特徴データに関連しない前記無相関特徴データを抽出するステップを含むことを特徴とする請求項３に記載の短期利益の予測方法。
前記第１の予測結果に従って融資対象の短期収益性を決定するステップの後、
非ブロックチェーン上の前記融資対象に関連する第２の関連データを取得するステップと、
前記第２の関連データをＫ−ｍｅａｎｓアルゴリズムに入力し、２回目のクラスタリング計算を行うステップと、
２回目のクラスタリング計算によって得られた各クラスタに対して事前に設定された方法で回帰予測を行い、第２の予測結果を取得するステップと、
前記第１の予測結果と前記第２の予測結果との差が事前に設定された閾値よりも小さいかどうかを判断するステップと、
前記差が前記閾値よりも小さい場合、前記第１の予測結果に従って融資対象の短期収益性を決定した結果は使用可能な結果であると判断するステップと、を含むことを特徴とする請求項１に記載の短期利益の予測方法。
前記第１の関連データをＫ−ｍｅａｎｓアルゴリズムに入力し、１回目のクラスタリング計算を行うステップの前、
前記第１の関連データのデータ量が事前に設定されたデータ閾値よりも大きいかどうかを判断するステップと、
そうであれば、前記第１の関連データを事前に設定されたビッグデータに基づく予測アルゴリズムに入力して予測するステップと、を含むことを特徴とする請求項１に記載の短期利益の予測方法。
ブロックチェーンから取得された融資対象に関連するデータ量がプリセット量よりも少ない場合に使用され、
ブロックチェーンから融資対象に関連する第１の関連データを取得するための取得手段と、
前記第１の関連データをＫ−ｍｅａｎｓアルゴリズムに入力し、１回目のクラスタリング計算を行うためのクラスタリング手段と、
１回目のクラスタリング計算によって取得された各クラスタに対して事前に設定された方法で回帰予測を行い、第１の予測結果を得るための回帰手段と、
前記第１の予測結果に従って融資対象の短期収益性を決定するための決定手段と、を含むことを特徴とする短期利益の予測装置。
前記回帰手段は、
算出された各クラスタを事前に設定されたＳＶＲ予測モデルに入力して回帰予測を行うためのＳＶＲ予測モジュールを含むことを特徴とする請求項８に記載の短期利益の予測装置。
前記クラスタリング手段は、
前記第１の関連データに対して特徴抽出を行うための抽出モジュールと、
抽出された特徴データに対して関連性分析を行い、他の特徴データに関連しない無相関特徴データを得るための分析モジュールと、
前記第１の関連データにおいて前記無相関特徴データに対応する第１の関連データをクリアした後、Ｋ−ｍｅａｎｓアルゴリズムに入力し、１回目のクラスタリング計算を行うためのクラスタリングモジュールと、を含むことを特徴とする請求項８に記載の短期利益の予測装置。
前記分析モジュールは、
前記特徴データに対して関連行列分析を行い、他の特徴データに関連しない前記無相関特徴データを抽出するための行列分析サブモジュールを含むことを特徴とする請求項１０に記載の短期利益の予測装置。
前記抽出された特徴データに対して関連性分析を行い、他の特徴データに関連しない無相関特徴データを得ることは、
前記特徴データに対して関連行列分析を行い、他の特徴データに関連しない前記無相関特徴データを抽出することを含むことを特徴とする請求項１０に記載の短期利益の予測装置。
ブロックチェーンから融資対象に関連する第１の関連データを取得するための取得手段と、
前記第１の関連データをＫ−ｍｅａｎｓアルゴリズムに入力し、１回目のクラスタリング計算を行うためのクラスタリング手段と、
１回目のクラスタリング計算によって取得された各クラスタに対して事前に設定された方法で回帰予測を行い、第１の予測結果を得るための回帰手段と、
前記第１の予測結果に従って融資対象の短期収益性を決定するための決定手段と、を含むことを特徴とするコンピューターデバイス。
ブロックチェーンから融資対象に関連する第１の関連データを取得する機能と、
前記第１の関連データをＫ−ｍｅａｎｓアルゴリズムに入力し、１回目のクラスタリング計算を行う機能と、
１回目のクラスタリング計算によって取得された各クラスタに対して事前に設定された方法で回帰予測を行い、第１の予測結果を得る機能と、
前記第１の予測結果に従って融資対象の短期収益性を決定する機能と、をコンピュータによって実行させるプログラム。
ブロックチェーンから融資対象に関連する第１の関連データを取得する機能と、
前記第１の関連データをＫ−ｍｅａｎｓアルゴリズムに入力し、１回目のクラスタリング計算を行う機能と、
１回目のクラスタリング計算によって取得された各クラスタに対して事前に設定された方法で回帰予測を行い、第１の予測結果を得る機能と、
前記第１の予測結果に従って融資対象の短期収益性を決定する機能と、をコンピュータによって実行させるプログラムを格納する読み取り可能な記憶媒体。