JP2020524346A - 短期利益を予測する方法、装置、コンピューターデバイス、プログラムおよび記憶媒体 - Google Patents

短期利益を予測する方法、装置、コンピューターデバイス、プログラムおよび記憶媒体 Download PDF

Info

Publication number
JP2020524346A
JP2020524346A JP2019570544A JP2019570544A JP2020524346A JP 2020524346 A JP2020524346 A JP 2020524346A JP 2019570544 A JP2019570544 A JP 2019570544A JP 2019570544 A JP2019570544 A JP 2019570544A JP 2020524346 A JP2020524346 A JP 2020524346A
Authority
JP
Japan
Prior art keywords
data
prediction
feature data
short
regression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019570544A
Other languages
English (en)
Other versions
JP6855604B2 (ja
Inventor
▲義▼文 王
▲義▼文 王
健宗 王
健宗 王
京 肖
京 肖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Publication of JP2020524346A publication Critical patent/JP2020524346A/ja
Application granted granted Critical
Publication of JP6855604B2 publication Critical patent/JP6855604B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Abstract

本出願は、短期利益を予測する方法、装置、コンピューターデバイス、プログラムおよび記憶媒体を開示し、ここで、予測方法は、ブロックチェーンから融資対象に関連する第1の関連データを取得するステップと、第1の関連データをK−meansアルゴリズムに入力し、1回目のクラスタリング計算を行うステップと、1回目のクラスタリング計算によって取得された各クラスタに対して事前に設定された方法で回帰予測を行い、第1の予測結果を得るステップと、第1の予測結果に従って融資対象の短期収益性を決定するステップと、を含む。

Description

本出願は、2018年4月17日に中国特許庁に出願された、「短期利益を予測する方法、装置、コンピューターデバイスおよび記憶媒体」と題された申請番号第2018103452579号に基づく優先権を主張し、その全ての内容は参照により本出願に組み込まれる。
本出願は、インターネット技術の分野に関し、特に、短期利益を予測する方法、装置、コンピューターデバイス、プログラムおよび記憶媒体に関する。
ブロックチェーンは、分散化された、信頼を必要としない新しいデータアーキテクチャであり、ネットワークにおける全てのノードによって共有、管理および監視され、単一の方面によって制御されない。ブロックチェーンは新しいデータアーキテクチャであるため、ブロックチェーンをレイアウトする初期段階でのデータ量が少なく、銀行などの金融機関は現在の「スモールデータ」を通じて短期的な利益予測をすることが難しく、適切な融資額を貸すことができないという問題がある。
本出願の主な目的は、ブロックチェーンをレイアウトする初期段階で企業に関連するデータ量が少ない場合に、企業の短期利益を予測する方法、装置、コンピューターデバイス、プログラムおよび記憶媒体を提供することである。
本出願は、短期利益の予測方法を提供し、当該方法は、ブロックチェーンから取得された融資対象に関連するデータ量がプリセット量よりも少ない場合に使用され、前記予測方法は、ブロックチェーンから融資対象に関連する第1の関連データを取得するステップと、
前記第1の関連データをK−meansアルゴリズムに入力し、1回目のクラスタリング計算を行うステップと、
1回目のクラスタリング計算によって取得された各クラスタに対して事前に設定された方法で回帰予測を行い、第1の予測結果を得るステップと、
前記第1の予測結果に従って融資対象の短期収益性を決定するステップと、を含む。
本出願は、短期利益の予測装置をさらに提供し、当該予測装置は、ブロックチェーンから取得された融資対象に関連するデータ量がプリセット量よりも少ない場合に使用され、前記予測装置は、
ブロックチェーンから融資対象に関連する第1の関連データを取得するための取得手段と、
前記第1の関連データをK−meansアルゴリズムに入力し、1回目のクラスタリング計算を行うためのクラスタリング手段と、
1回目のクラスタリング計算によって取得された各クラスタに対して事前に設定された方法で回帰予測を行い、第1の予測結果を得るための回帰手段と、
前記第1の予測結果に従って融資対象の短期収益性を決定するための決定手段と、を含む。
本出願は、メモリおよびプロセッサを含むコンピューターデバイスをさらに提供し、前記メモリにコンピューター読み取り可能な命令即ちコンピュータープログラムが記憶され、前記プロセッサは前記コンピューター読み取り可能な命令を行うときに上記予測方法のステップを実現する。
本出願は、コンピューター読み取り可能な命令が記憶される不揮発性コンピューター読み取り可能な記憶媒体をさらに提供し、前記コンピューター読み取り可能な命令は、プロセッサによって実行されるときに上記予測方法のステップを実現することを特徴とする。
本出願に係る短期利益を予測する方法、装置、コンピューターデバイス、プログラムおよび記憶媒体は、最初に取得された少量のデータに対してK−meansアルゴリズムによってクラスタリングし、次いでに回帰アルゴリズムによって予測して予測結果を取得し、最後に予測結果に従って融資対象の短期収益性を決定する。各企業のデータリンクをレイアウトする初期段階に関連するデータが少ない場合、銀行などの金融機関は融資企業の短期収益性を正確に予測できないという問題を解決し、融資対象の融資額を比較的正確に限定し、銀行機構の融資リスクを低減することに資する。
本発明の一実施例による短期利益の予測方法を示すフローチャートである。 本発明の一実施例による短期利益の予測方法を示すフローチャートである。 本発明の一実施例による短期利益の予測装置の構造を示すブロック図である。 本発明の一実施例による回帰部ユニットの構造を示すブロック図である。 本発明の一実施例によるクラスタリング部の構造を示すブロック図である 本発明の一実施例による短期利益の予測装置の構造を示すブロック図である。 本発明の一実施例によるコンピューターデバイスの構造を示すブロック図である。
図1を参照し、本出願は、短期利益の予測方法を提供し、ブロックチェーンから取得された融資対象に関連するデータ量がプリセット量よりも少ない場合に使用される。
本出願において、銀行などの金融機関の運転資金融資は、通常、一時融資、短期融資および中期貸款に分けられ、そのうち、短期融資は、期限が通常3ヶ月から1年(3ヶ月を除き、1年を含む)となる運転資金融資である。市場の変化は不規則であるため、歴史データを利用して抽出されたルールは一定の期間において正確であるが、一定の期間が経過すると、その正確性が低下する。予測時間の範囲の長さに応じて、短期予測、中期予測および長期予測の3種類に分けることができる。一般に、予測時間の範囲が短いほど、予測品質が高くなり、逆に、予測結果の精度が低くなる。本出願において、ブロックチェーン上のデータ量がプリセット量よりも少ないことを限定条件として、本方法は、各企業のデータリンクをレイアウトする初期段階で、様々なデータが比較的少ない場合に使用されることが限定され、本出願において「プリセット量よりも少ないデータ量」は、現在の「ビッグデータ」と比較して「スモールデータ」と呼ばれることがある。
上記の予測方法は、
S1、ブロックチェーンから融資対象に関連する第1の関連データを取得するステップと、
S2、前記第1の関連データをK−meansアルゴリズムに入力し、1回目のクラスタリング計算を行うステップと、
S3、1回目のクラスタリング計算によって取得された各クラスタに対して事前に設定された方法で回帰予測を行い、第1の予測結果を得るステップと、
S4、前記第1の予測結果に従って融資対象の短期収益性を決定するステップと、を含む。
上記のステップS1で説明したように、上記の融資対象は、銀行などの金融機関に融資する必要のある企業または個人である。上記の第1の関連データは、ブロックチェーン上の融資対象に関連する全てのデータであってもよく、指定された要件に従って検索されたデータであってもよく、例えば、異なる企業またはプロジェクトに従って、ブロックチェーン上の異なるデータを取得し、調達代理融資企業を例に挙げて、それは金融機関ブロックデータ、中核企業ブロックデータ、倉庫物流ブロックデータ、ディーラーブロックデータなどを取得できる。
上記のステップS2で説明したように、上記のK−meansアルゴリズムは、クラスタの数k、およびn個のデータ対象を含むデータベースを入力し、分散の最小標準を満たすk個のクラスタを出力するアルゴリズムである。k−meansアルゴリズムは入力量kを受け入れ、次いで、取得されたクラスタについて、同じクラスタ内の対象の類似性が高いが、異なるクラスタ内の対象の類似性が低いということを満たすように、n個のデータ対象をk個のクラスタに分割する。その原理は次のとおりである:最初にいくつかの中心の位置を設定し、全ての点からこれらの中心までの距離を計算し、次いで、これらの中心に属する点を見つけ、例えば、A点は、中心1との距離が最も近ければ、1番に属する。1番に属する全ての点を平均して、新しい中心点を取得する。各中心に属する中心点が変更されなくなるまで繰り返し、最終的な中心位置を取得し、データのクラスタリングを完了する。
本出願において、上記のステップS2の具体的なプロセスは以下のとおりである:
S21、与えられた、n個のd次元のデータ点を含む関連データのデータセット(第1の関連データ)X={x、x、…、x}に対して、ここで、x∈R、データセットにおけるK個の点を選択して初期のクラスタ中心として、各対象は1種類の中心μ(k=1、2、…、K)を表す。
S22、各点から中心μまでのユークリッド距離を計算し、距離の最も近い基準に従ってそれらを最も類似したクラスタ中心で表されるクラスにそれぞれ割り当てて、K個のクラスタC={c、k=1、2、…、k}を形成する。各クラスタcは1つのクラスを表す。当該クラスの各点からクラスタ中心μまでの距離の二乗和J(c)を計算する。すなわち、
Figure 2020524346
S23、各クラスのサンプルからそれが属するクラスのクラスタ中心μkまでの合計距離の二乗和を最小になるまで計算する。
Figure 2020524346
式おいて、
Figure 2020524346
の場合、クラス内の全ての対象の平均値を当該クラスの新しいクラスタ中心として計算する。
S24、クラスタ中心と値が変化したかどうかを判断し、変化した場合はステップS22に戻り、変化しなかった場合にクラスタを終了する。
本出願は、K−meansアルゴリズムを利用してデータのクラスタリングを行い、簡単かつ迅速で、アルゴリズムはスケーラビリティと高効率を維持し、クラスタがガウス分布に近づける場合、より良い効果が得られる。
上記のステップS3で説明したように、上記の回帰予測は、予測の関連性の原則に基づいて、予測目標に影響を与える各要因を見つけて、次いで、これらの要因と予測目標との間の関数関係の類似表現を見つけて、数学の方法で見つける。上記の第1の予測結果は、1回目のクラスタリング計算により得られた各クラスタを事前に設定された方法の回帰予測によって算出された結果であり、また、上記の第1の関連データが融資対象の関連データであるため、第1の予測結果は、ある程度、融資対象の短期間内の収益性を反映できる。回帰予測の基本的なステップは以下のとおりである、すなわち、1、予測目標に従って、独立変数および従属変数を決定する。具体的には、予測される特定の目標を決定し、従属変数も決定される。予測される特定の目標が次年度の販売量である場合、販売量Yは従属変数である。市場調査と資料調査を通じて、予測目標に関連する影響因子、つまり独立変数を見つけ、その中から主な影響因子を選択する。2、回帰予測モデルを確立する。具体的には、独立変数および従属変数の履歴統計資料に従って計算し、これに基づいて回帰分析方程式、すなわち回帰予測モデルを確立する。3、相関分析を行う。具体的には、回帰分析は、因果関係を有する影響因子(独立変数)および予測対象(従属変数)に対して実行される数学的統計分析処理である。確立された回帰方程式は、変数と従属変数との間に関係がある場合のみ意味がある。従って、独立変数としての要因が従属変数としての予測対象に関連するかどうか、どの程度関連するか、およびこのような関連程度を判断する把握性は、回帰分析を行うときに解決する必要がある問題となる。通常、相関分析には相関関係の算出が必要であり、相関係数の大きさに従って独立変数と従属変数との間の関連程度を判断する。4、回帰予測モデルを検証し、予測誤差を計算する。具体的には、回帰予測モデルが実際の予測に使用できるかどうかは、回帰予測モデルに対する検証および予測誤差への計算によって決められる。回帰方程式は、様々な検証に合格し、予測誤差が小さい場合のみ、回帰方程式を予測モデルとして予測できる。5、予測値を計算して決定する。具体的には、回帰予測モデルを利用して予測値を計算し、予測値を総合的に分析し、最終的な予測値を決定する。本出願において、まずデータをクラスタリングし、次いでにクラスタリングされた後のデータを回帰予測し、予測速度がより速くなる。
上記のステップS4で説明したように、第1の予測結果に従って融資対象の短期収益性を決定する。そして、銀行などの金融機関はその収益性に従って上記の融資対象の融資額、つまり上記の融資対象の融資額上限を決定できる。上記の第1の予測結果はレベルを表す数字であってよく、例えば、レベル1〜10に分けられ、レベルが上がると、融資対象の短期収益性が高くなり、それに応じてその融資額も高くなり、本実施例では、融資額はさらに融資対象の登録資本、市場価値などのデータに関連する。
本実施例では、上記の1回目のクラスタリング計算によって取得された各クラスタに対して事前に設定された方法で回帰予測を行うステップS3は、
算出された各クラスタを事前に設定されたSVR予測モデルに入力して回帰予測を行うステップS31を含む。
上記のステップS31に説明したように、上記のSVR(Support Vector Regression、サポートベクトル回帰)は、サポートベクターマシン(SVM)の重要な応用ブランチである。本実施例では、目的関数を最小化することによって回帰関数を決定し、回帰関数はf(x)=wx+bである。その具体的なプロセスは次のとおりである:
Figure 2020524346
2002年に提出されたv−SVCと同様に、
Figure 2020524346
の不等式は等式で置き換えることができる。しかも、ユーザーはしばしば C=1に類似した小さな定数を選択するため、C/lが小さすぎることになる。従って、LIBSVM(台湾大学のLin Chih−Jen教授らによって開発および設計された、簡単で使いやすく、高速で効率的なSVMモード認識および回帰のソフトウェアパッケージ)では、ユーザーが指定したパラメータをC/lとし、つまり、
Figure 2020524346
はユーザーによって指定され、LIBSVMは次の問題を解決する:
Figure 2020524346
ε-SVRがパラメータ
Figure 2020524346
の下で取得された解は、v-SVRがパラメータ
Figure 2020524346
の下で取得された解と同様である。
上式において、lはトレーニングサンプルの数であり、ここでl=k、Cは平衡モデルの複雑さ(1/2)wTwとトレーニング誤差項の重みパラメータであり、εは不感損失関数であり、ζは緩和因子である。K(xi,x)はカーネル関数である。
上記のSVR(サポートベクトル回帰アルゴリズム)は主に、クラスタリング結果を次元上げして、高次元空間で線形決定関数を構築することによって線形回帰を実現し、e不感損失関数を使用する場合、その基本は主にe不感損失関数およびカーネル関数アルゴリズムである。フィッティングした数学モデルが多次元空間でのある曲線を表す場合、e不感損失関数から得られた結果は、当該曲線およびトレーニング点の「eパイプ」を含む。全てのサンプル点のうち、「パイプ壁」に分布するサンプル点の部分のみによってパイプの位置を決定する。トレーニングサンプルのこの部分は、「サポートベクトル」と呼ばれる。トレーニングサンプル集合の非線形に対応するために、従来のフィッティング方法では通常、線形方程式の後に高次項を追加する。この方法は効果的であるが、調整可能なパラメータを増やすとオーバーフィッティングのリスクが高まる。SVRはカーネル関数を採用することによってこの矛盾を解決した。線形方程式中の線形項をカーネル関数で置き換えると、元の線形アルゴリズムを「非線形化」にすることができ、つまり、非線形回帰を実行できる。同時に、カーネル関数の導入は「次元上げ」の目的を達成し、増加した調整可能なパラメータはオーバーフィッティングでも制御されることができる。本出願では、成熟した技術を備えたSVRアルゴリズムが使用され、計算結果は信頼でき、さらに正確な予測の効果を達成できる。
一実施例において、上記の前記第1の関連データをK−meansアルゴリズムに入力し、1回目のクラスタリング計算を行うステップS2は、
前記第1の関連データに対して特徴抽出を行うステップS21と、
抽出された特徴データに対して関連性分析を行い、他の特徴データに関連しない無相関特徴データを得るステップS22と、
前記第1の関連データにおいて前記無相関特徴データに対応する第1の関連データをクリアした後、K−meansアルゴリズムに入力し、1回目のクラスタリング計算を行うステップS23と、を含む。
上記のステップS201からS203に説明したように、上記の融資対象に関連する第1の関連データに対して特徴抽出を行い、関連性分析を行い特徴データにおいて他の特徴データに関連しない無相関特徴データを見つけて、次いで、これらの無相関特徴データに対応する第1の関連データを第1の関連データから削除し、残された第1の関連データを使用してクラスタリング計算し、得られたクラスタがより正確になり、無相関特徴データに対応する第1の関連データが削除されたため、クラスタリング計算の効率を向上させる。
本実施例では、第1の関連データに対して特徴抽出を行う方法は、具体的に、Reliefアルゴリズム(Reliefアルゴリズムは特徴重みアルゴリズム(Feature weighting algorithmsである)であり、各特徴およびクラスの関連性に従って特徴の異なる重みを与え、重みが特定の閾値より小さい特徴は削除される)を使用して特徴抽出を行う。Reliefアルゴリズムは、トレーニング集合DからサンプルRをランダムに選択し、そして、Rと同じクラスに属するサンプルからNear Hitと呼ばれる最近傍サンプルHを検索し、Rと異なるクラスに属するサンプルからNearMissと呼ばれる最近傍サンプルMを検索し、その後、次のルールに従って各特徴の重みを更新する。すなわち、特定の特徴でRとNear Hitとの間の距離がRとNear Missとの間の距離より小さい場合、当該特徴が同じクラスと異なるクラスの最近傍を区別することに役立つことが示され、当該特徴の重みを増やす。逆に、特定の特徴でRとNear Hitとの間の距離がRとNear Missとの間の距離より大きい場合、当該特徴が同じクラスと異なるクラスの最近傍を区別することにマイナスの影響を与えることが示され、当該特徴の重みを減らす。上記のプロセスをm回繰り返し、最後に各特徴の平均重みを取得する。特徴の重みが大きいほど、当該特徴の分類能力が強くなり、逆に、当該特徴の分類能力が弱くなる。Reliefアルゴリズムの実行時間は、サンプルのサンプリング回数mおよび元の特徴の数Nの増加につれて線形増加するため、実行効率が非常に高くなる。具体的なアルゴリズムは以下のとおりである:
トレーニングデータセットをDとし、サンプルのサンプリング回数をmとし、特徴重みの閾値をδとし、最近傍サンプルの数を各特性の特徴重みTとして出力される:
1、全ての特徴重みを0に設定し、Tを空集合とする。
2、for i=1 to m do
1)、サンプルRをランダムに選択する;
2)、同じクラスに属するサンプル集合からRの最近傍Hを見つけて、異なるクラスに属するサンプル集合から最近傍サンプルMを見つける。
3)、for A=1 to N do
W(A)=W(A)-diff(A,R,H)/m+diff(A,R,M)/m
3、for A=1 to N do
if W(A)≧δ
A番目の特徴をTに追加する。
一実施例において、上記の抽出された特徴データに対して関連性分析を行い、他の特徴データに関連しない無相関特徴データを得るステップS202は、以下を含む:
S2021、前記特徴データを散布図として作成し、前記散布図における離散点に対応する特徴データを前記無相関特徴データとして記録する。
上記のステップS2021で説明したように、上記の散布図(scatter diagram)は、回帰分析においてデカルト座標系平面上のデータ点の分布を指し、通常はクラス間の集計データを比較するために使用される。散布図に含まれるデータが多いほど、比較する効果がよりよくなる。本実施例において、上記の特徴データは一般に行列であり、この場合、散布図行列を利用して各独立変数間の散布図を同時に描くことができ、こうして複数の変数間の主な関連性を迅速に見つけることができる。上記の特徴データを散布図に作成するプロセスは視覚化のプロセスであり、特徴データが視覚化されるため、肉眼でグラフまたは画像上の離散点の存在を直感的に識別し、そして離散点を選択することができ、コンピューターデバイスは、選択された離散点に対応する特徴データを無相関特徴データとして記録する。
別の実施例において、上記の抽出された特徴データに対して関連性分析を行い、他の特徴データに関連しない無相関特徴データを得るステップS202は、以下を含む:
S2022、前記特徴データに対して関連行列分析を行い、他の特徴データに関連しない前記無相関特徴データを抽出する。
上記のステップS2022で説明したように、上記の関連行列は、相関係数行列とも呼ばれ、行列の各列間の相関係数から構成される。つまり、関連行列のi行目のj列目の要素は、元の行列のi列目とj列目の相関係数である。本実施例において、普通は、共分散行列を用いて分析し、共分散は、2つの変数の全体誤差を測定するために使用され、2つの変数の変化傾向が一致する場合、共分散は正の値であり、2つの変数が正の相関であることが示される。2つの変数が反対方向に変化する場合、共分散は負の値であり、2つの変数が負の相関であることが示される。2つの変数が互いに独立している場合、共分散は0であり、2つの変数が無関係であることが示され、変数が3組以上である場合、対応する共分散行列が使用される。
図2を参照し、在本実施例では、上記の前記第1の予測結果に従って融資対象の短期収益性を決定するステップS4の後、以下を含む:
S5、非ブロックチェーン上の前記融資対象に関連する第2の関連データを取得する。
S6、前記第2の関連データをK−meansアルゴリズムに入力し、2回目のクラスタリング計算を行う。
S7、2回目のクラスタリング計算によって得られた各クラスタに対して事前に設定された方法で回帰予測を行い、第2の予測結果を取得する。
S8、前記第1の予測結果と前記第2の予測結果との差が事前に設定された閾値よりも小さいかどうかを判断する。
S9、前記差が前記閾値よりも小さい場合、前記第1の予測結果に従って融資対象の短期収益性を決定した結果は使用可能な結果であると判断する。
上記のステップS5からS9で説明したように、上記の非ブロックチェーン上の第2の関連データとは、ブロックチェーンに記録されていないデータ、通常はビッグデータネットワーク内のデータを指す。第2の関連データのクラスタリングアルゴリズムおよび回帰予測方法は、上記の第1の関連データと同一であり、ここで再度の説明を省略する。本実施例では、第1の関連データに従って得られた第1の予測結果を第2の関連データに従って得られた第2の予測結果と比較し、つまり、第1の予測結果が利用可能かどうかを判断するための検証ステップを設定する。本出願において、主にブロックチェーンをレイアウトする初期段階を狙うため、各企業の歴史データの多くは、企業自身のサーバーや企業に関連する他の企業のサーバーなどのビッグデータのインターネット上に存在し、インターネット環境にある限り、入手することが可能である。本ステップにおいて、主にインターネット上の「ビッグデータ」を利用して得られた第2の予測結果によって、ブロックチェーン上の「スモールデータ」を利用して得られた第1の予測結果を検証し、第2の予測結果と第1の予測結果との差が事前に設定された閾値よりも小さい場合のみ、第1の予測結果が実質的に正しく、使用できると判断する。
一実施例において、上記の前記第1の関連データをK−meansアルゴリズムに入力し、1回目のクラスタリング計算を行うステップS2の前、以下を含む:
S201、前記第1の関連データのデータ量が事前に設定されたデータ閾値よりも大きいかどうかを判断する。
S202、そうであれば、前記第1の関連データを事前に設定されたビッグデータに基づく予測アルゴリズムに入力して予測する。
上記のステップS201およびS202で説明したように、データ閾値が設定され、取得された第1の関連データのデータ量がデータ閾値よりも大きい場合、上記の短期利益の予測方法が適用される「スモールデータ」の範囲から逸脱しているため、その後のクラスタリング、回帰予測などのステップを停止し、予測方法を切り替える。具体的な切り替え方法は、取得された第1の関連データを、TD−ABCモデルに基づく企業利益モデルなどの事前に設定された既存の比較的成熟した予測モデルに入力してよい。
一実施例において、上記の第1の関連データには不正データが含まれるかどうかをさらに分析してもよく、具体的な方法として、取得された第1の関連データに対して特徴抽出を行い、特徴データを得て、前記特徴データから他の特徴データに関連しない無相関特徴データを抽出して、次いで、Voronoiアルゴリズムによって前記無相関特徴データに対して外れ値の認識を行い、不正データを得る。不正データの量によって、融資対象の評判値を分析できる。そして、評判値と短期収益性に基づいて、融資対象の融資額を決定する。
特定の実施例において、企業aは、銀行Pから融資する必要があり、銀行Pは、企業aを評価する必要があり、その評価のプロセスは次のとおりである:1、ブロックチェーンから企業aの販売データ、生産データ、財務データなど、当該企業aに関連する全てのデータを収集する。その後、取得されたデータに対して特徴抽出を行い、不要なデータを事前に削除し、後続のクラスタリング計算の速度および効率を高める。具体的な削除方法は、最初に抽出されたデータを散布図として視覚的に形成し、その後、散布図中の離散点を削除する。2、ブロックチェーンから取得された企業aのデータに対してK−meansアルゴリズムによってクラスタリング計算を行う。3、クラスタリング計算の結果に対してSVR回帰予測を行い、さらに当該企業aの収益性などの結果を得る。4、上記の不正データの認識方法を通じて企業aの信用などをさらに判断する。5、銀行Pは、企業aの信用、収益性などに従って、企業aに融資できるかどうか、および最大融資限度などを決定する。具体的には、企業aの信用がプリセット値よりも小さい場合、企業aへの融資が拒否される。企業aの信用がプリセット値である場合、企業aに融資ができ、この場合、当該企業aの収益性と組み合わせて、最大の融資限度などを計算することによって、リスクを回避する銀行Pの能力を効果的に向上させる。具体的には、取得された企業aのデータリンク上のデータは、調達する商品の種類や当該調達資金のデータ、税関輸出品、関税、輸入品、関税、国内販売データ、販売製品データ、融資データ、返済信用データ、在庫データ、物流関連データ(倉庫の数量、倉庫の地理的分布、各倉庫の保管データ、販売地域の分布)などを含む。
本出願に係る短期利益の予測方法は、最初に取得された「スモールデータ」に対してK−meansアルゴリズムによってクラスタリングを行い、その後、回帰アルゴリズムによって予測して予測結果を得て、最後に予測結果に従って融資対象の短期収益性を決定する。各企業のデータリンクをレイアウトする初期段階に関連するデータが少ない場合、銀行などの金融機関は融資企業の短期収益性を正確に予測できないという問題を解決し、融資対象の融資額を比較的正確に限定し、銀行機構の融資リスクを低減することに資する。
図3を参照し、本出願の実施例は短期利益の予測装置をさらに提供し、ブロックチェーンから取得された融資対象に関連するデータ量がプリセット量よりも少ない場合に使用される。
本出願において、銀行などの金融機関の運転資金融資は、通常、一時融資、短期融資および中期貸款に分類され、そのうち、短期融資は、期限が通常3ヶ月から1年(3ヶ月を除き、1年を含む)となる運転資金融資である。市場の変化は不規則であるため、歴史データを利用して抽出されたルールは一定の期間において正確であるが、一定の期間が経過すると、その正確性が低下する。予測時間の範囲の長さに応じて、短期予測、中期予測および長期予測の3種類に分けることができる。普通は、予測時間の範囲が短いほど、予測品質が高くなり、逆に、予測結果の精度が低くなる。本出願において、ブロックチェーン上のデータ量がプリセット量よりも少ないことを限定条件として、本方法は、各企業のデータリンクをレイアウトする初期段階で、様々なデータが比較的少ない場合に使用されることが限定され、本出願において「プリセット量よりも少ないデータ量」は、現在の「ビッグデータ」と比較して「スモールデータ」と呼ばれることがある。
上記の予測装置は、
ブロックチェーンから融資対象に関連する第1の関連データを取得するための取得部10と、
前記第1の関連データをK−meansアルゴリズムに入力し、1回目のクラスタリング計算を行うためのクラスタリング部20と、
1回目のクラスタリング計算によって取得された各クラスタに対して事前に設定された方法で回帰予測を行い、第1の予測結果を得るための回帰部30と、
前記第1の予測結果に従って融資対象の短期収益性を決定するための決定部40と、を含む。
上記の取得部10において、上記の融資対象は、銀行などの金融機関から融資する必要がある企業または個人である。上記の第1の関連データは、ブロックチェーン上の融資対象に関連する全てのデータであってもよく、指定された要件に従って検索されたデータであってもよく、例えば、異なる企業またはプロジェクトに従って、ブロックチェーン上の異なるデータを取得し、調達代理融資企業を例に挙げて、それは金融機関ブロックデータ、中核企業ブロックデータ、倉庫物流ブロックデータ、ディーラーブロックデータなどを取得できる。
上記のクラスタリング部20において、上記のK−meansアルゴリズムは、クラスタの数k、およびn個のデータ対象を含むデータベースを入力し、分散の最小標準を満たすk個のクラスタを出力するアルゴリズムである。k−meansアルゴリズムは入力量kを受け入れ、次いでに、取得されたクラスタについて、同じクラスタ内の対象の類似性が高いが、異なるクラスタ内の対象の類似性が低いということを満たすように、n個のデータ対象をk個のクラスタに分割する。その原理は次のとおりである:最初にいくつかの中心の位置を設定し、全ての点からこれらの中心までの距離を計算し、次いでにこれらの中心に属する点を見つけ、例えば、A点は、中心1との距離が最も近ければ、1番に属する。1番に属する全ての点を平均して、新しい中心点を取得する。各中心に属する中心点が変更されなくなるまで繰り返し、最終的な中心位置を取得し、データのクラスタリングを完了する。
本出願において、上記のクラスタリング部20の具体的なプロセスは以下のとおりである:
(1)、与えられた、n個のd次元のデータ点を含む関連データのデータセット(第1の関連データ)X={x、x、…、x}に対して、ここで、x∈R、データセットにおけるK個の点を初期のクラスタ中心として選択し、各対象は1種類の中心μ(k=1、2、…、K)を表す。
(2)、各点から中心μまでのユークリッド距離を計算し、距離の最も近い基準に従ってそれらを最も類似したクラスタ中心で表されるクラスにそれぞれ割り当てて、K個のクラスタC={c、k=1、2、…、k}を形成する。各クラスタcは1つのクラスを表す。当該クラスの各点からクラスタ中心μまでの距離の二乗和J(c)を計算する。すなわち、
Figure 2020524346
(3)、各クラスのサンプルからその属するクラスのクラスタ中心μkまでの合計距離の二乗和を最小になるまで計算する。
Figure 2020524346
式おいて、
Figure 2020524346
の場合、クラス内の全ての対象の平均値を当該クラスの新しいクラスタ中心として計算する。
(4)、クラスタ中心と値が変化したかどうかを判断し、変化した場合はステップS22に戻り、変化しなかった場合にクラスタを終了する。
本出願は、K−meansアルゴリズムを利用してデータのクラスタリングを行い、簡単かつ迅速で、アルゴリズムはスケーラビリティと高効率を維持し、クラスタがガウス分布に近い場合、より良い効果が得られる。
上記の回帰部30において、上記の回帰予測は、予測の関連性の原則に基づいて、予測目標に影響を与える各要因を見つけて、次いでにこれらの要因と予測目標との間の関数関係の類似表現を見つけて、数学の方法で見つける。上記の第1の予測結果は、1回目のクラスタリング計算により得られた各クラスタを事前に設定された方法の回帰予測によって算出された結果であり、また、上記の第1の関連データが融資対象の関連データであるため、第1の予測結果は、ある程度、融資対象の短期間内の収益性を反映できる。回帰予測の基本的なステップは以下のとおりである、すなわち、(1)予測目標に従って、独立変数および従属変数を決定する。具体的には、予測の特定の目標を決定し、従属変数も決定される。予測の特定の目標が次年度の販売量である場合、販売量Yは従属変数である。市場調査と資料調査を通じて、予測目標に関連する影響因子、つまり独立変数を見つけ、その中から主な影響因子を選択する。(2)回帰予測モデルを確立する。具体的には、独立変数および従属変数の履歴統計資料に従って計算し、これに基づいて回帰分析方程式、すなわち回帰予測モデルを確立する。(3)相関分析を行う。具体的には、回帰分析は、因果関係を有する影響因子(独立変数)および予測対象(従属変数)に対して行われる数学的統計分析処理である。確立された回帰方程式は、変数と従属変数との間に関係がある場合のみ意味がある。従って、独立変数としての要因が従属変数としての予測対象に関連するかどうか、どの程度関連するか、およびこのような関連程度を判断する把握性は、回帰分析を行うときに解決する必要がある問題となる。通常、相関分析には相関関係の算出が必要であり、相関係数の大きさに従って独立変数と従属変数との間の関連程度を判断する。(4)回帰予測モデルを検証し、予測誤差を計算する。具体的には、回帰予測モデルが実際の予測に使用できるかどうかは、回帰予測モデルに対する検証および予測誤差への計算によって決められる。回帰方程式は、様々な検証に合格し、予測誤差が小さい場合のみ、回帰方程式を予測モデルとして予測できる。(5)予測値を計算して決定する。具体的には、回帰予測モデルを利用して予測値を計算し、予測値を総合的に分析し、最終的な予測値を決定する。本出願において、まずデータをクラスタリングし、次いでにクラスタリングされた後のデータを回帰予測し、予測速度がより速くなる。
上記の決定部40において、第1の予測結果に従って融資対象の短期収益性を決定する。そして、銀行などの金融機関はその収益性に従って上記の融資対象の融資額、つまり上記の融資対象の融資額上限を決定できる。上記の第1の予測結果はレベルを表す数字であってよく、例えば、レベル1〜10に分けられ、レベルが上がると、融資対象の短期収益性が強くなり、それに応じてその融資額も高くなり、本実施例では、融資額はさらに融資対象の登録資本、市場価値などのデータに関連する。
図4を参照し、本実施例では、上記の回帰部30は、
算出された各クラスタを事前に設定されたSVR予測モデルに入力して回帰予測を行うためのSVR予測モジュール31を含む。
上記のSVR予測モジュール31において、上記のSVR(Support Vector Regression、サポートベクトル回帰)は、サポートベクターマシン(SVM)の重要な応用ブランチである。本実施例では、目的関数を最小化することによって回帰関数を決定し、回帰関数はf(x)=wx+bである。その具体的なプロセスは次のとおりである:
Figure 2020524346
2002年に提出されたv−SVCと同様に、eT(α+α*)≦Cvの不等式は等式で置き換えることができる。しかも、ユーザーはしばしば C=1に類似した小さな定数を選択するため、C/lが小さすぎる。従って、LIBSVMでは、ユーザーが指定したパラメータをC/lとし、つまり、
Figure 2020524346
はユーザーによって指定され、LIBSVMは次の問題を解決する:
Figure 2020524346
ε-SVRがパラメータ
Figure 2020524346
の下で取得された解は、v-SVRがパラメータ
Figure 2020524346
の下で取得された解と同様である。
上式において、lはトレーニングサンプルの数であり、ここでl=k、Cは平衡モデルの複雑さ(1/2)wwとトレーニング誤差項の重みパラメータであり、εは不感損失関数であり、ζは緩和因子である。K(x、x)はカーネル関数である。
上記のSVR(サポートベクトル回帰アルゴリズム)は主に、クラスタリング結果を次元上げして、高次元空間で線形決定関数を構築することによって線形回帰を実現し、e不感損失関数を使用する場合、その基本は主にe不感損失関数およびカーネル関数アルゴリズムである。フィッティングした数学モデルが多次元空間でのある曲線を表す場合、e不感損失関数から得られた結果は、当該曲線およびトレーニング点の「eパイプ」を含む。全てのサンプル点のうち、「パイプ壁」に分布するサンプル点の部分のみによってパイプの位置を決定する。トレーニングサンプルのこの部分は、「サポートベクトル」と呼ばれる。トレーニングサンプル集合の非線形に対応するために、従来のフィッティング方法では通常、線形方程式の後に高次項を追加する。この方法は効果的であるが、調整可能なパラメータを増やすとオーバーフィッティングのリスクが高まる。SVRはカーネル関数を採用することによってこの矛盾を解決する。線形方程式中の線形項をカーネル関数で置き換えると、元の線形アルゴリズムを「非線形化」にすることができ、つまり、非線形回帰を実行できる。同時に、カーネル関数の導入は「次元上げ」の目的を達成し、増加した調整可能なパラメータはオーバーフィッティングでも制御されることができる。本出願では、成熟した技術を備えたSVRアルゴリズムが使用され、計算結果は信頼でき、さらに正確な予測の効果を達成できる。
図5を参照し、一実施例において、上記のクラスタリング部20は、
前記第1の関連データに対して特徴抽出を行うための抽出モジュール21と、
抽出された特徴データに対して関連性分析を行い、他の特徴データに関連しない無相関特徴データを得るための分析モジュール22と、
前記第1の関連データにおいて前記無相関特徴データに対応する第1の関連データをクリアした後、K−meansアルゴリズムに入力し、1回目のクラスタリング計算を行うためのクラスタリングモジュール23と、を含む。
上記の抽出モジュール21、分析モジュール22およびクラスタリングモジュール23において、上記の融資対象に関連する第1の関連データに対して特徴抽出を行い、関連性分析を行いて特徴データにおける他の特徴データに関連しない無相関特徴データを見つけて、次いでに、これらの無相関特徴データに対応する第1の関連データを第1の関連データから削除し、残された第1の関連データを使用してクラスタリング計算し、得られたクラスタがより正確になり、無相関特徴データに対応する第1の関連データが削除されるため、クラスタリング計算の効率を向上させる。本実施例では、第1の関連データに対して特徴抽出を行う方法は、具体的に、Reliefアルゴリズム(Reliefアルゴリズムは特徴重みアルゴリズム(Feature weighting algorithmsである)であり、各特徴およびクラスの関連性に従って特徴の異なる重みを割り当て、重みが特定の閾値より小さい特徴は削除される)を使用して特徴抽出を行う。Reliefアルゴリズムは、トレーニング集合DからサンプルRをランダムに選択し、そして、Rと同じクラスに属するサンプルからNear Hitと呼ばれる最近傍サンプルHを検索し、Rと異なるクラスに属するサンプルからNearMissと呼ばれる最近傍サンプルMを検索し、その後、次のルールに従って各特徴の重みを更新する。すなわち、特定の特徴でRとNear Hitとの間の距離がRとNear Missとの間の距離より小さい場合、当該特徴が同じクラスと異なるクラスの最近傍を区別することに役立つことが示され、当該特徴の重みを増やす。逆に、特定の特徴でRとNear Hitとの間の距離がRとNear Missとの間の距離より大きい場合、当該特徴が同じクラスと異なるクラスの最近傍を区別することにマイナスの影響を与えることが示され、当該特徴の重みを減らす。上記のプロセスをm回繰り返し、最後に各特徴の平均重みを取得する。特徴の重みが大きいほど、当該特徴の分類能力が強くなり、逆に、当該特徴の分類能力が弱くなる。Reliefアルゴリズムの実行時間は、サンプルのサンプリング回数mおよび元の特徴の数Nの増加につれて線形増加するため、実行効率が非常に高くなる。具体的なアルゴリズムは既に方法の実施例で説明されているため、再度の説明を省略する。
一実施例において、上記の分析モジュール22は、前記特徴データを散布図として作成し、前記散布図において離散点に対応する特徴データを前記無相関特徴データとして記録するための視覚分析サブモジュールを含む。
上記の視覚分析サブモジュールにおいて、上記の散布図(scatter diagram)は、回帰分析においてデカルト座標系平面上のデータ点の分布を指し、通常はクラス間の集計データを比較するために使用される。散布図に含まれるデータが多いほど、比較する効果がよりよくなる。本実施例において、上記の特徴データは一般に行列であり、この場合、散布図行列を利用して各独立変数間の散布図を同時に描くことができ、こうして複数の変数間の主な関連性を迅速に見つけることができる。上記の特徴データを散布図に作成するプロセスは即ち視覚化のプロセスであり、特徴データが視覚化されるため、肉眼でグラフまたは画像上の離散点の存在を直感的に識別し、そして離散点を選択することができ、コンピューターデバイスは、選択された離散点に対応する特徴データを無相関特徴データとして記録する。
別の実施例において、上記の分析モジュール22は、前記特徴データに対して関連行列分析を行い、他の特徴データに関連しない前記無相関特徴データを抽出するための行列分析サブモジュールを含む。
上記の行列分析サブモジュールにおいて、上記の関連行列は、相関係数行列とも呼ばれ、行列の各列間の相関係数から構成される。つまり、関連行列のi行目のj列目の要素は、元の行列のi列目とj列目の相関係数である。本実施例において、一般に共分散行列を用いて分析し、共分散は、2つの変数の全体誤差を測定するために使用され、2つの変数の変化傾向が一致する場合、共分散は正の値であり、2つの変数が正の相関であることが示される。2つの変数が反対方向に変化する場合、共分散は負の値であり、2つの変数が負の相関であることが示される。2つの変数が互いに独立している場合、共分散は0であり、2つの変数が無関係であることが示され、変数が3組以上である場合、対応する共分散行列が使用される。
図6を参照し、本実施例では、上記の短期利益の予測装置は、
非ブロックチェーン上の前記融資対象に関連する第2の関連データを取得するためのデータ取得部50と、
前記第2の関連データをK−meansアルゴリズムに入力し、2回目のクラスタリング計算を行うためのデータクラスタリング部60と、
2回目のクラスタリング計算によって得られた各クラスタに対して事前に設定された方法で回帰予測を行い、第2の予測結果を取得するためのクラスタリング回帰部70と、
前記第1の予測結果と前記第2の予測結果との差が事前に設定された閾値よりも小さいかどうかを判断するための比較部80と、
前記差が前記閾値よりも小さい場合、前記第1の予測結果に従って融資対象の短期収益性を決定した結果は使用可能な結果であると判断するための判定部90と、をさらに含む。
上記の非ブロックチェーン上の第2の関連データとは、ブロックチェーンに記録されていないデータ、通常はビッグデータネットワーク内のデータを指す。第2の関連データのクラスタリングアルゴリズムおよび回帰予測方法は、上記の第1の関連データと同一であり、ここで再度の説明を省略する。本実施例では、第1の関連データに従って得られた第1の予測結果を第2の関連データに従って得られた第2の予測結果と比較し、つまり、第1の予測結果が利用可能かどうかを判断するための検証ステップを設定する。本出願において、主にブロックチェーンをレイアウトする初期段階を狙うため、各企業の歴史データの多くは、企業自身のサーバーや企業に関連する他の企業のサーバーなどのビッグデータのインターネット上に存在し、インターネット環境にある限り、入手することが可能である。本ステップにおいて、主にインターネット上の「ビッグデータ」を利用して得られた第2の予測結果によって、ブロックチェーン上の「スモールデータ」を利用して得られた第1の予測結果を検証し、第2の予測結果と第1の予測結果との差が事前に設定された閾値よりも小さい場合のみ、第1の予測結果が実質的に正しく、使用できると判断する。
一実施例において、上記の短期利益の予測装置は、
前記第1の関連データのデータ量が事前に設定されたデータ閾値よりも大きいかどうかを判断するための判断部と、
前記第1の関連データを事前に設定されたビッグデータに基づく予測アルゴリズムに入力して予測するための切替部と、をさらに含む。
上記の判断部および切替部において、データ閾値が設定され、取得された第1の関連データのデータ量がデータ閾値よりも大きい場合、上記の短期利益の予測装置が適用される「スモールデータ」の範囲から逸脱しているため、その後のクラスタリング、回帰予測などの予測プロセスを停止して、予測方法を切り替える。具体的な切り替え方法は、取得された第1の関連データを、TD−ABCモデルに基づく企業利益モデルなどの事前に設定された既存の比較的に成熟した予測モデルに入力してよい。
一実施例において、上記の短期利益の予測装置は、以下をさらに含む。
不正分析部であって、上記の第1の関連データには不正データが含まれるかどうかを分析するために使用され、具体的な方法として、取得された第1の関連データに対して特徴抽出を行い、特徴データを得て、前記特徴データから他の特徴データに関連しない無相関特徴データを抽出して、次いでにVoronoiアルゴリズムによって前記無相関特徴データに対して外れ値の認識を行い、不正データを得る。不正データの量によって、融資対象の評判値を分析できる。そして、評判値と短期収益性に基づいて、融資対象の融資額を決定する。
特定の実施例において、企業aは、銀行Pから融資する必要があり、銀行Pは、企業aを評価する必要があり、その評価のプロセスは次のとおりである:1、ブロックチェーンから企業aの販売データ、生産データ、財務データなど、当該企業aに関連する全てのデータを収集する。その後、取得されたデータに対して特徴抽出を行い、不要なデータを事前に削除し、後続のクラスタリング計算の速度および効率を高める。具体的な削除方法は、最初に抽出されたデータを散布図として視覚的に形成し、その後、散布図中の離散点を削除する。2、ブロックチェーンから取得された企業aのデータに対してK−meansアルゴリズムによってクラスタリング計算を行う。3、クラスタリング計算の結果に対してSVR回帰予測を行い、さらに当該企業aの収益性などの結果を得る。4、上記の不正データの認識方法を通じて企業aの信用などをさらに判断する。5、銀行Pは、企業aの信用、収益性などに従って、企業aに融資できるかどうか、および最大融資限度などを決定する。具体的には、企業aの信用がプリセット値よりも小さい場合、企業aへの融資が拒否される。企業aの信用がプリセット値である場合、企業aに融資でき、この場合、当該企業aの収益性と組み合わせて、最大の融資限度などを計算することによって、リスクを回避する銀行Pの能力が効果的に向上させる。具体的には、取得された企業aのデータリンク上のデータは、調達商品の種類や当該調達資金のデータ、税関輸出品、関税、輸入品、関税、国内販売データ、販売製品データ、融資データ、返済信用データ、在庫データ、物流関連データ(倉庫の数量、倉庫の地理的分布、各倉庫の保管データ、販売地域の分布)などを含む。
本出願に係る短期利益の予測装置は、最初に取得された「スモールデータ」に対してK−meansアルゴリズムによってクラスタリングを行い、その後、回帰アルゴリズムによって予測して予測結果を得て、最後に予測結果に従って融資対象の短期収益性を決定する。各企業のデータリンクをレイアウトする初期段階に関連するデータが少ない場合、銀行などの金融機関は融資企業の短期収益性を正確に予測できないという問題を解決し、融資対象の融資額を比較的正確に限定し、銀行機構の融資リスクを低減することに資する。
図7を参照し、本発明の実施例は、コンピューターデバイスをさらに提供し、当該コンピューターデバイスはサーバーであってよく、その内部構造は図7に示すとおりである。当該コンピューターデバイスは、システムバスを介して接続されたプロセッサと、メモリと、ネットワークインターフェースと、データベースと、を含む。ここで、当該コンピューターにおけるプロセッサは、計算および制御能力を提供するために使用される。当該コンピューターデバイスのメモリは、不揮発性記憶媒体と、内部メモリとを含む。当該不揮発性記憶媒体には、オペレーティングシステムと、コンピューター読み取り可能な命令、およびデータベースが記憶されている。当該内部メモリは、不揮発性記憶媒体におけるオペレーティングシステムおよびコンピューター読み取り可能な命令に対して動作環境を提供する。当該コンピューターデバイスのデータベースは、取得された第1の関連データ、第2の関連データ、およびK−meansアルゴリズムモデルなどのデータを記憶するために使用される。当該コンピューターデバイスのネットワークインターフェースは、ネットワーク接続を介して外部端末と通信するために使用される。当該コンピューター読み取り可能な命令は、上記の各方法の実施例のフローを実現するために、プロセッサによって実行される。
本発明の一実施例は、コンピューター読み取り可能な命令が記憶される不揮発性コンピューター読み取り可能な記憶媒体をさらに提供し、コンピューター読み取り可能な命令がプロセッサによって実行されるときに、上記の各方法の実施例のフローを実現する。
上記の説明は本出願の好適な実施例に過ぎず、本出願の特許範囲を限定するものではなく、本出願の明細書および図面の内容によってなされる同等の構造または同等のプロセス変換、或いは、他の関連する技術分野に直接または間接的に適用されるものは、いずれも本出願の特許請求の範囲に含まれる。
10 取得部
20 クラスタリング部
21 抽出モジュール
22 分析モジュール
23 クラスタリングモジュール
30 回帰部
31 SVR予測モジュール
40 決定部
50 データ取得部
60 データクラスタリング部
70 クラスタリング回帰部
80 比較部
90 判定部

Claims (15)

  1. ブロックチェーンから取得された融資対象に関連するデータ量がプリセット量よりも少ない場合に使用され、
    ブロックチェーンから融資対象に関連する第1の関連データを取得するステップと、
    前記第1の関連データをK−meansアルゴリズムに入力し、1回目のクラスタリング計算を行うステップと、
    1回目のクラスタリング計算によって取得された各クラスタに対して事前に設定された方法で回帰予測を行い、第1の予測結果を得るステップと、
    前記第1の予測結果に従って融資対象の短期収益性を決定するステップと、を含むことを特徴とする短期利益の予測方法。
  2. 前記の1回目のクラスタリング計算によって取得された各クラスタに対して事前に設定された方法で回帰予測を行うステップは、
    算出された各クラスタを事前に設定されたSVR予測モデルに入力して回帰予測を行うステップを含むことを特徴とする請求項1に記載の短期利益の予測方法。
  3. 前記第1の関連データをK−meansアルゴリズムに入力し、1回目のクラスタリング計算を行うステップは、
    前記第1の関連データに対して特徴抽出を行うステップと、
    抽出された特徴データに対して関連性分析を行い、前記特徴データにおいて他の特徴データに関連しない無相関特徴データを得るステップと、
    前記第1の関連データにおいて前記無相関特徴データに対応する目標データをクリアした後、K−meansアルゴリズムに入力し、1回目のクラスタリング計算を行うステップと、を含むことを特徴とする請求項1に記載の短期利益の予測方法。
  4. 前記抽出された特徴データに対して関連性分析を行い、他の特徴データに関連しない無相関特徴データを得るステップは、
    前記特徴データを散布図として作成し、前記散布図において離散点に対応する特徴データを前記無相関特徴データとして記録するステップを含むことを特徴とする請求項3に記載の短期利益の予測方法。
  5. 前記抽出された特徴データに対して関連性分析を行い、他の特徴データに関連しない無相関特徴データを得るステップは、
    前記特徴データに対して関連行列分析を行い、他の特徴データに関連しない前記無相関特徴データを抽出するステップを含むことを特徴とする請求項3に記載の短期利益の予測方法。
  6. 前記第1の予測結果に従って融資対象の短期収益性を決定するステップの後、
    非ブロックチェーン上の前記融資対象に関連する第2の関連データを取得するステップと、
    前記第2の関連データをK−meansアルゴリズムに入力し、2回目のクラスタリング計算を行うステップと、
    2回目のクラスタリング計算によって得られた各クラスタに対して事前に設定された方法で回帰予測を行い、第2の予測結果を取得するステップと、
    前記第1の予測結果と前記第2の予測結果との差が事前に設定された閾値よりも小さいかどうかを判断するステップと、
    前記差が前記閾値よりも小さい場合、前記第1の予測結果に従って融資対象の短期収益性を決定した結果は使用可能な結果であると判断するステップと、を含むことを特徴とする請求項1に記載の短期利益の予測方法。
  7. 前記第1の関連データをK−meansアルゴリズムに入力し、1回目のクラスタリング計算を行うステップの前、
    前記第1の関連データのデータ量が事前に設定されたデータ閾値よりも大きいかどうかを判断するステップと、
    そうであれば、前記第1の関連データを事前に設定されたビッグデータに基づく予測アルゴリズムに入力して予測するステップと、を含むことを特徴とする請求項1に記載の短期利益の予測方法。
  8. ブロックチェーンから取得された融資対象に関連するデータ量がプリセット量よりも少ない場合に使用され、
    ブロックチェーンから融資対象に関連する第1の関連データを取得するための取得手段と、
    前記第1の関連データをK−meansアルゴリズムに入力し、1回目のクラスタリング計算を行うためのクラスタリング手段と、
    1回目のクラスタリング計算によって取得された各クラスタに対して事前に設定された方法で回帰予測を行い、第1の予測結果を得るための回帰手段と、
    前記第1の予測結果に従って融資対象の短期収益性を決定するための決定手段と、を含むことを特徴とする短期利益の予測装置。
  9. 前記回帰手段は、
    算出された各クラスタを事前に設定されたSVR予測モデルに入力して回帰予測を行うためのSVR予測モジュールを含むことを特徴とする請求項8に記載の短期利益の予測装置。
  10. 前記クラスタリング手段は、
    前記第1の関連データに対して特徴抽出を行うための抽出モジュールと、
    抽出された特徴データに対して関連性分析を行い、他の特徴データに関連しない無相関特徴データを得るための分析モジュールと、
    前記第1の関連データにおいて前記無相関特徴データに対応する第1の関連データをクリアした後、K−meansアルゴリズムに入力し、1回目のクラスタリング計算を行うためのクラスタリングモジュールと、を含むことを特徴とする請求項8に記載の短期利益の予測装置。
  11. 前記分析モジュールは、
    前記特徴データに対して関連行列分析を行い、他の特徴データに関連しない前記無相関特徴データを抽出するための行列分析サブモジュールを含むことを特徴とする請求項10に記載の短期利益の予測装置。
  12. 前記抽出された特徴データに対して関連性分析を行い、他の特徴データに関連しない無相関特徴データを得ることは、
    前記特徴データに対して関連行列分析を行い、他の特徴データに関連しない前記無相関特徴データを抽出することを含むことを特徴とする請求項10に記載の短期利益の予測装置。
  13. ブロックチェーンから融資対象に関連する第1の関連データを取得するための取得手段と、
    前記第1の関連データをK−meansアルゴリズムに入力し、1回目のクラスタリング計算を行うためのクラスタリング手段と、
    1回目のクラスタリング計算によって取得された各クラスタに対して事前に設定された方法で回帰予測を行い、第1の予測結果を得るための回帰手段と、
    前記第1の予測結果に従って融資対象の短期収益性を決定するための決定手段と、を含むことを特徴とするコンピューターデバイス。
  14. ブロックチェーンから融資対象に関連する第1の関連データを取得する機能と、
    前記第1の関連データをK−meansアルゴリズムに入力し、1回目のクラスタリング計算を行う機能と、
    1回目のクラスタリング計算によって取得された各クラスタに対して事前に設定された方法で回帰予測を行い、第1の予測結果を得る機能と、
    前記第1の予測結果に従って融資対象の短期収益性を決定する機能と、をコンピュータによって実行させるプログラム。
  15. ブロックチェーンから融資対象に関連する第1の関連データを取得する機能と、
    前記第1の関連データをK−meansアルゴリズムに入力し、1回目のクラスタリング計算を行う機能と、
    1回目のクラスタリング計算によって取得された各クラスタに対して事前に設定された方法で回帰予測を行い、第1の予測結果を得る機能と、
    前記第1の予測結果に従って融資対象の短期収益性を決定する機能と、をコンピュータによって実行させるプログラムを格納する読み取り可能な記憶媒体。
JP2019570544A 2018-04-17 2018-07-12 短期利益を予測する方法、装置、コンピューターデバイス、プログラムおよび記憶媒体 Active JP6855604B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201810345257.9A CN108710965A (zh) 2018-04-17 2018-04-17 短期盈利的预测方法、装置、计算机设备和存储介质
CN201810345257.9 2018-04-17
PCT/CN2018/095483 WO2019200742A1 (zh) 2018-04-17 2018-07-12 短期盈利的预测方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
JP2020524346A true JP2020524346A (ja) 2020-08-13
JP6855604B2 JP6855604B2 (ja) 2021-04-07

Family

ID=63866732

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019570544A Active JP6855604B2 (ja) 2018-04-17 2018-07-12 短期利益を予測する方法、装置、コンピューターデバイス、プログラムおよび記憶媒体

Country Status (3)

Country Link
JP (1) JP6855604B2 (ja)
CN (1) CN108710965A (ja)
WO (1) WO2019200742A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110991744B (zh) * 2019-12-05 2022-07-12 中国银行股份有限公司 一种交易限额的设置方法及系统
CN111444963B (zh) * 2020-03-27 2023-08-25 中南大学 一种基于ssa-svr模型的高炉铁水硅含量预测方法
CN112199812B (zh) * 2020-08-18 2022-10-28 华电电力科学研究院有限公司 基于趋势回归分析的燃气能源系统工业蒸汽负荷预测方法
CN113037840B (zh) * 2021-03-08 2022-06-10 中国联合网络通信集团有限公司 通信数据传输方法、通信终端和通信平台
CN116166960B (zh) * 2023-02-07 2023-09-29 山东经鼎智能科技有限公司 用于神经网络训练的大数据特征清洗方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004078435A (ja) * 2002-08-13 2004-03-11 Ibm Japan Ltd リスク管理装置、リスク管理システム、リスク管理方法、将来期待利益算出方法、およびプログラム
JP2010227326A (ja) * 2009-03-27 2010-10-14 Advanced Telecommunication Research Institute International 行動識別システム
JP2011039934A (ja) * 2009-08-17 2011-02-24 Tokai Univ 感情推定システム及びそれを利用した学習システム
JP2012242528A (ja) * 2011-05-18 2012-12-10 Nippon Telegr & Teleph Corp <Ntt> 対話評価装置、方法及びプログラム
WO2016120918A1 (ja) * 2015-01-27 2016-08-04 日本電気株式会社 予測システム、予測方法及びコンピュータ読み取り可能記録媒体
US20170024824A1 (en) * 2015-07-21 2017-01-26 Palantir Technologies Inc. Systems and models for data analytics
WO2017090329A1 (ja) * 2015-11-24 2017-06-01 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
JP2017151871A (ja) * 2016-02-26 2017-08-31 沖電気工業株式会社 情報処理装置、情報処理システム、及びプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106127380A (zh) * 2016-06-22 2016-11-16 北京拓明科技有限公司 一种大数据风险分析方法
CN106980909A (zh) * 2017-03-30 2017-07-25 重庆大学 一种基于模糊线性回归的电影票房预测方法
CN107844836A (zh) * 2017-10-24 2018-03-27 信雅达系统工程股份有限公司 一种基于机器学习的系统及学习方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004078435A (ja) * 2002-08-13 2004-03-11 Ibm Japan Ltd リスク管理装置、リスク管理システム、リスク管理方法、将来期待利益算出方法、およびプログラム
JP2010227326A (ja) * 2009-03-27 2010-10-14 Advanced Telecommunication Research Institute International 行動識別システム
JP2011039934A (ja) * 2009-08-17 2011-02-24 Tokai Univ 感情推定システム及びそれを利用した学習システム
JP2012242528A (ja) * 2011-05-18 2012-12-10 Nippon Telegr & Teleph Corp <Ntt> 対話評価装置、方法及びプログラム
WO2016120918A1 (ja) * 2015-01-27 2016-08-04 日本電気株式会社 予測システム、予測方法及びコンピュータ読み取り可能記録媒体
US20170024824A1 (en) * 2015-07-21 2017-01-26 Palantir Technologies Inc. Systems and models for data analytics
WO2017090329A1 (ja) * 2015-11-24 2017-06-01 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
JP2017151871A (ja) * 2016-02-26 2017-08-31 沖電気工業株式会社 情報処理装置、情報処理システム、及びプログラム

Also Published As

Publication number Publication date
CN108710965A (zh) 2018-10-26
WO2019200742A1 (zh) 2019-10-24
JP6855604B2 (ja) 2021-04-07

Similar Documents

Publication Publication Date Title
Mudassir et al. Time-series forecasting of Bitcoin prices using high-dimensional features: a machine learning approach
JP6855604B2 (ja) 短期利益を予測する方法、装置、コンピューターデバイス、プログラムおよび記憶媒体
US11210368B2 (en) Computational model optimizations
AU2019100362A4 (en) Personal Credit Rating System Based on The Logistic Regression
Zhao et al. Price trend prediction of stock market using outlier data mining algorithm
US11481707B2 (en) Risk prediction system and operation method thereof
Abbasimehr et al. A new framework for predicting customer behavior in terms of RFM by considering the temporal aspect based on time series techniques
CN111401600A (zh) 基于关联关系的企业信用风险评价方法和系统
CN110930038A (zh) 一种贷款需求识别方法、装置、终端及存储介质
Louati et al. Price forecasting for real estate using machine learning: A case study on Riyadh city
Akerkar Advanced data analytics for business
Zhang et al. Credit scoring model based on a novel group feature selection method: The case of Chinese small-sized manufacturing enterprises
Özlem et al. Predicting cash holdings using supervised machine learning algorithms
Weng et al. Mining time series data for segmentation by using Ant Colony Optimization
CN117235608B (zh) 风险检测方法、装置、电子设备及存储介质
Anderies et al. Telekom-net: The embedded bi-lstm and expert knowledge model for stock forecasting and suggestion
KR20110114181A (ko) 예측 정확성이 향상된 대출 심사 방법
Mokheleli et al. Machine learning approach for credit score predictions
CN114529399A (zh) 用户数据处理方法、装置、计算机设备和存储介质
Liu Design of XGBoost prediction model for financial operation fraud of listed companies
CN113052512A (zh) 风险预测方法、装置和电子设备
Chang et al. PSO based time series models applied in exchange rate forecasting for business performance management
Li et al. Research on listed companies’ credit ratings, considering classification performance and interpretability
Li The price prediction of virtual currency base on improved support vector regression
Harsha et al. Addressing Challenges in Stock Selection: A Financial Decision Support System Approach

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191219

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210215

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210317

R150 Certificate of patent or registration of utility model

Ref document number: 6855604

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250