JP6932680B2 - 売買審査装置、売買審査方法及び売買審査プログラム - Google Patents

売買審査装置、売買審査方法及び売買審査プログラム Download PDF

Info

Publication number
JP6932680B2
JP6932680B2 JP2018206232A JP2018206232A JP6932680B2 JP 6932680 B2 JP6932680 B2 JP 6932680B2 JP 2018206232 A JP2018206232 A JP 2018206232A JP 2018206232 A JP2018206232 A JP 2018206232A JP 6932680 B2 JP6932680 B2 JP 6932680B2
Authority
JP
Japan
Prior art keywords
data
transaction
suspected
transaction data
trading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018206232A
Other languages
English (en)
Other versions
JP2020071751A (ja
Inventor
健一 中原
健一 中原
史也 島田
史也 島田
邦洋 宮崎
邦洋 宮崎
正之 関根
正之 関根
大澤 昇平
昇平 大澤
眞 大島
眞 大島
豊 松尾
豊 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Tokyo NUC
Original Assignee
University of Tokyo NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Tokyo NUC filed Critical University of Tokyo NUC
Priority to JP2018206232A priority Critical patent/JP6932680B2/ja
Publication of JP2020071751A publication Critical patent/JP2020071751A/ja
Application granted granted Critical
Publication of JP6932680B2 publication Critical patent/JP6932680B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Description

本発明は、売買審査装置、売買審査方法及び売買審査プログラムに関する。
従来、株式市場等の金融商品市場における不公正取引の疑いがある取引を検出するため、売買審査が行われている。売買審査は、不公正取引が疑われる事案を抽出する調査段階と、抽出された事案を詳細に分析する審査段階を含む。
調査段階を自動化する試みとして、下記非特許文献1には、不公正取引の疑いがある取引に関するデータであるか否かを示すラベルを取引データに付与して、不公正取引が疑われる事案を抽出するモデルを教師有り学習によって生成する技術が記載されている。
J. Zhai, Y. Cao, Y. Yao, X. Ding, and Y. Li, "Computational intelligent hybrid model for detecting disruptive trading activity", Decision Support Systems, 2017, Vol. 93, p. 26-41
非特許文献1に記載の技術では、不公正取引の疑いがある取引に関するデータであるか否かを示すラベルを取引データに付与して教師データを作成する必要がある。そのため、教師データを作成するコストが過大となる。
また、予め定められた抽出基準に従って不公正取引が疑われる取引を抽出する方法が実務で採用されているが、これは、市場全体を統一的に取り扱っているものの、売買高20%関与率等の数値的な基準に基づく抽出であり、不公正取引の疑いのある取引も疑いのない取引も同時に抽出され、抽出結果は不公正取引の疑いのない取引が大部分を占めている。従って、既存の手法では、不公正取引の疑いのある取引を効率良く抽出することが困難である。
そこで、本発明は、教師データを必要としない学習モデルによって不公正取引が疑われる取引データであるか判定する売買審査装置、売買審査方法及び売買審査プログラムを提供する。
本発明の一態様に係る売買審査装置は、金融商品の売買に関する第1取引データと、金融商品の売買に関し、第1取引データと異なる第2取引データとに基づいて、密度比関数により第1取引データの確率分布と第2取引データの確率分布との密度比を推定する推定部と、密度比関数に基づき、第2取引データの異常度を算出する算出部と、異常度に基づき、第2取引データに不公正取引が疑われる第1被疑データが含まれるか判定する第1判定部と、を備える。
この態様によれば、第1取引データの確率分布と第2取引データの確率分布との密度比を推定することで、第1取引データの確率分布と第2取引データの確率分布とを直接推定する必要がなくなり、教師データを必要としない学習モデルによって第2取引データの異常度を算出することができる。これにより、教師データを必要としない学習モデルによって、第2取引データに不公正取引が疑われる第1被疑データが含まれるか判定することができる。
上記態様において、第1取引データは、第2取引データよりも長い期間の取引データであってもよい。
この態様によれば、第1取引データの期間が第2取引データの期間よりも長いことで、第1取引データの確率分布によって通常の取引の確率分布を表すことができ、第2取引データの異常度を適切に算出することができる。
上記態様において、第1取引データ及び第2取引データは、所定期間の売買注文量に関するデータを含んでもよい。
この態様によれば、売買注文量の急増や急減を捉えることができ、第2取引データに見せ玉等の不公正取引が疑われる第1被疑データが含まれるか判定することができる。
上記態様において、第1取引データ及び第2取引データは、所定期間の売買注文のキャンセル量に関するデータを含んでもよい。
この態様によれば、売買注文のキャンセル量の急増や急減を捉えることができ、第2取引データに見せ玉等の不公正取引が疑われる第1被疑データが含まれるか判定することができる。
上記態様において、第1判定部は、第2取引データに含まれるデータのうち、異常度が上位所定割合に属するデータを第1被疑データと判定してもよい。
この態様によれば、異常度について絶対的な閾値を設定することなく、第2取引データに不公正取引が疑われる第1被疑データが含まれるか判定することができる。
上記態様において、第1判定部は、第2取引データに含まれるデータのうち、異常度が上位所定割合に属し、所定期間の値幅が第1閾値以上であるデータを第1被疑データと判定してもよい。
この態様によれば、異常度について絶対的な閾値を設定せずに、値幅について第1閾値を設定することで、第2取引データに不公正取引が疑われる第1被疑データが含まれるかより高精度に判定することができる。
上記態様において、第1判定部は、第2取引データに含まれるデータのうち、異常度が上位所定割合に属し、所定期間の出来高が第2閾値以上であるデータを第1被疑データと判定してもよい。
この態様によれば、異常度について絶対的な閾値を設定せずに、出来高について第2閾値を設定することで、第2取引データに不公正取引が疑われる第1被疑データが含まれるかより高精度に判定することができる。
上記態様において、異常度の時間変化を示す第1グラフを生成するグラフ生成部をさらに備えてもよい。
この態様によれば、異常度の時間変化が直感的に把握できるようになり、不公正取引が疑われる期間が一目で把握できるようになる。
上記態様において、グラフ生成部は、第2取引データの時間変化を示し、第2取引データのうち第1被疑データを識別可能に示す第2グラフをさらに生成してもよい。
この態様によれば、第2取引データのうち第1被疑データを識別可能に示す第2グラフによって、不公正取引が疑われる箇所が一目で把握できるようになる。
上記態様において、予め定められた基準に基づき、第2取引データに不公正取引が疑われる第2被疑データが含まれるか判定する第2判定部をさらに備え、第2グラフは、第1被疑データ、第2被疑データ及び第1被疑データと第2被疑データの重なりを識別可能に示してもよい。
この態様によれば、第1被疑データ、第2被疑データ及び第1被疑データと第2被疑データの重なりを識別可能に示すことで、学習モデルによって抽出された第1被疑データと、予め定められた基準に基づきで抽出された第2被疑データとの共通点と相違点を一目で把握することができる。
上記態様において、第2取引データの時間変化を示し、第2取引データのうち第1被疑データを識別可能に示す取引明細表を生成する明細表生成部をさらに備えてもよい。
この態様によれば、第2取引データのうち第1被疑データを識別可能に示す取引明細表によって、不公正取引が疑われる箇所が一目で把握できるようになる。
上記態様において、予め定められた基準に基づき、第2取引データに不公正取引が疑われる第2被疑データが含まれるか判定する第2判定部をさらに備え、取引明細表は、第1被疑データ、第2被疑データ及び第1被疑データと第2被疑データの重なりを識別可能に示してもよい。
この態様によれば、第1被疑データ、第2被疑データ及び第1被疑データと第2被疑データの重なりを識別可能に示すことで、学習モデルによって抽出された第1被疑データと、予め定められた基準に基づき抽出された第2被疑データとの共通点と相違点を一目で把握することができる。
本発明の他の態様に係る売買審査方法は、金融商品の売買に関する第1取引データと、金融商品の売買に関し、第1取引データと異なる第2取引データとに基づいて、密度比関数により第1取引データの確率分布と第2取引データの確率分布との密度比を推定することと、密度比関数に基づき、第2取引データの異常度を算出することと、異常度に基づき、第2取引データに不公正取引が疑われる第1被疑データが含まれるか判定することと、を含む。
この態様によれば、第1取引データの確率分布と第2取引データの確率分布との密度比を推定することで、第1取引データの確率分布と第2取引データの確率分布とを直接推定する必要がなくなり、教師データを必要としない学習モデルによって第2取引データの異常度を算出することができる。これにより、教師データを必要としない学習モデルによって、第2取引データに不公正取引が疑われる第1被疑データが含まれるか判定することができる。
本発明の他の態様に係る売買審査プログラムは、金融商品の売買に関する第1取引データと、金融商品の売買に関し、第1取引データと異なる第2取引データとに基づいて、密度比関数により第1取引データの確率分布と第2取引データの確率分布との密度比を推定する推定部、密度比関数に基づき、第2取引データの異常度を算出する算出部、及び異常度に基づき、第2取引データに不公正取引が疑われる第1被疑データが含まれるか判定する第1判定部、として機能させる。
この態様によれば、第1取引データの確率分布と第2取引データの確率分布との密度比を推定することで、第1取引データの確率分布と第2取引データの確率分布とを直接推定する必要がなくなり、教師データを必要としない学習モデルによって第2取引データの異常度を算出することができる。これにより、教師データを必要としない学習モデルによって、第2取引データに不公正取引が疑われる第1被疑データが含まれるか判定することができる。
本発明によれば、教師データを必要としない学習モデルによって不公正取引が疑われる取引データであるか判定する売買審査装置、売買審査方法及び売買審査プログラムが提供される。
本発明の実施形態に係る売買審査システムの概要を示す図である。 本実施形態に係る売買審査装置の機能ブロックを示す図である。 本実施形態に係る売買審査装置の物理的構成を示す図である。 本実施形態に係る売買審査装置により実行される第1処理のフローチャートである。 本実施形態に係る売買審査装置により実行される第1被疑データの判定処理のフローチャートである。 本実施形態に係る売買審査装置により実行される第2処理のフローチャートである。 本実施形態に係る売買審査装置による取引データの分類を示す図である。 本実施形態に係る売買審査装置により生成される取引明細表を示す図である。 本実施形態に係る売買審査装置により生成される第1グラフを示す図である。 本実施形態に係る売買審査装置により生成される第2グラフを示す図である。
以下、本発明の一側面に係る実施の形態(以下、「本実施形態」と表記する。)を、図面に基づいて説明する。なお、各図において、同一の符号を付したものは、同一又は同様の構成を有する。
図1は、本発明の実施形態に係る売買審査システム100の概要を示す図である。売買審査システム100は、売買審査装置10、第1ユーザ端末20、第2ユーザ端末30、証券会社データベース40及び情報ベンダデータベース50を備える。なお、同図に示す構成は、売買審査システム100の一例であり、売買審査システム100は、これ以外の構成を含んでもよいし、この中の一部の構成を備えなくてもよい。
売買審査装置10は、金融商品の売買に関する取引データを解析し、取引データに不公正取引が疑われる被疑データが含まれるか判定する。不公正取引としては、インサイダー取引、相場操縦取引、風説の流布、仮名取引等が含まれる。本実施形態では、売買審査装置10によって、取引データに見せ玉による相場操縦取引が疑われる被疑データが含まれるか判定する場合について説明する。
第1ユーザ端末20及び第2ユーザ端末30は、売買審査を行う事業者が用いる端末である。第1ユーザ端末20及び第2ユーザ端末30は、それぞれ独立に、異なる取引データについて不公正取引が行われていないか審査するため、売買審査装置10に対して被疑データの抽出を依頼する。
証券会社データベース40は、顧客データDB1及び取引データDB2を有する。証券会社データベース40は、顧客に関する情報を顧客データDB1に記憶し、顧客の識別情報と関連付けて、その顧客の取引データを取引データDB2に記憶している。証券会社データベース40は、必要に応じて匿名加工処理を施した後、取引データを売買審査装置10に提供する。
情報ベンダデータベース50は、マーケットデータDB3を有する。情報ベンダデータベース50は、金融商品の気配情報及び注文情報(以下「板情報」という。)並びに約定情報等の相場情報を時系列データとしてマーケットデータDB3に記憶している。情報ベンダデータベース50は、任意の時間間隔で記録された金融商品の板情報及び相場情報を売買審査装置10に提供する。
図2は、本実施形態に係る売買審査装置10の機能ブロックを示す図である。売買審査装置10は、取得部11、推定部12、算出部13、第1判定部14、第2判定部15、明細表生成部16及びグラフ生成部17を備える。
取得部11は、顧客データDB1、取引データDB2及びマーケットデータDB3から、顧客情報、取引データ及びマーケットデータを取得する。なお、取得部11は、少なくとも金融商品の板情報及び相場情報を含む取引データを取得し、顧客情報については必ずしも取得しなくてもよい。
推定部12は、金融商品の売買に関する第1取引データと、金融商品の売買に関し、第1取引データと異なる第2取引データとに基づいて、密度比関数により第1取引データの確率分布と第2取引データの確率分布との密度比を推定する。ここで、第1取引データは、第2取引データよりも長い期間の取引データであってよい。例えば、第2取引データは、株式の一日分の取引データであってよく、第1取引データは、それ以前一週間分の同じ株式に関する取引データであってよい。第1取引データ及び第2取引データは、無作為に選択されてよい。その場合、第1取引データに不公正取引が疑われる取引データが含まれる場合があり得るが、第1取引データの期間が第2取引データの期間よりも長いことで、第1取引データの確率分布によって通常の取引の確率分布を近似することができ、第2取引データの異常度を適切に算出することができる。
第1取引データ及び第2取引データは、所定期間の売買注文量に関するデータを含んでよい。これにより、売買注文量の急増や急減を捉えることができ、第2取引データに見せ玉の不公正取引が疑われる第1被疑データが含まれるか判定することができる。
また、第1取引データ及び第2取引データは、所定期間の売買注文のキャンセル量に関するデータを含んでよい。これにより、売買注文のキャンセル量の急増や急減を捉えることができ、第2取引データに見せ玉等の不公正取引が疑われる第1被疑データが含まれるか判定することができる。
第1取引データをxi(i=1〜n)と表し、第2取引データをx´i(i=1〜n´)と表し、第1取引データの確率分布をq(x)と表し、第2取引データの確率分布をq´(x)と表し、密度比関数をr(x)=q´(x)/q(x)と定義する。このとき、推定部12は、所定の基底関数φk(x)(k=1〜b)を用いて、r(x)=Σk=1 bkφk(x)のwkを算出することで、密度比関数を算出してよい。ここで、基底関数は、例えば、第2取引データをx´iから無作為にb個のデータck(k=1〜b)を抽出し、
φk(x)=Kσ(x,ck)と選んでよい。ここで、Kσは、標準偏差がσであるガウスカーネルである。
推定部12は、密度比関数の二乗誤差を最小化するようにwkを算出してよい。このとき、wkに関する二次の正則化項を追加すると、wkの解析解は以下の数式(1)で与えられる。
Figure 0006932680
数式(1)において太字で示した量は、ベクトル又は行列であることを表している。ここで、右辺の行列Hは、以下の数式(2)で与えられる量である。
Figure 0006932680
すなわち、行列Hは、b×b行列であり、基底関数φkに第1取引データxiを代入した値により構成される。
また、数式(1)の右辺のベクトルhは、以下の数式(3)で与えられる量である。
Figure 0006932680
すなわち、ベクトルhは、基底関数φkに第2取引データx´iを代入した値により構成される。
また、数式(1)の右辺のIbは、b×bの単位行列を表し、係数λは、二次の正則化項のラグランジュ未定乗数である。
なお、数式(1)によりベクトルwの成分が負になる場合、その成分を0に置き換えてよい。このようにして、推定部12は、第1取引データ及び第2取引データを与えられた場合に、密度比を高速に推定することができる。
算出部13は、密度比関数に基づき、第2取引データの異常度を算出する。第2取引データをxと表し、密度比関数をr(x)と表し、異常度をa(x)と表すとき、算出部13は、a(x)=−log[r(x)]により異常度を算出してよい。ここで、logは自然対数であってよい。このように異常度を算出することで、密度比関数が1に近い場合に、異常度はほぼ0であり、密度比関数が1より小さくなった場合に、異常度が正のピークを示す。すなわち、第1取引データの確率分布と第2取引データの確率分布の差が小さい場合に異常度はほぼ0であり、第1取引データの確率分布と第2取引データの確率分布の乖離が大きい場合に、異常度が正のピークを示す。
第1判定部14は、異常度に基づき、第2取引データに不公正取引が疑われる第1被疑データが含まれるか判定する。より具体的には、第1判定部14は、第2取引データに含まれるデータのうち、異常度が上位所定割合に属するデータを第1被疑データと判定してよい。このように判定することで、異常度について絶対的な閾値を設定することなく、第2取引データに不公正取引が疑われる第1被疑データが含まれるか判定することができる。
第1判定部14は、第2取引データに含まれるデータのうち、異常度が上位所定割合に属し、所定期間の値幅が第1閾値以上であるデータを第1被疑データと判定してもよい。このように、異常度について絶対的な閾値を設定せずに、値幅について第1閾値を設定することで、第2取引データに不公正取引が疑われる第1被疑データが含まれるかより高精度に判定することができる。
また、第1判定部14は、第2取引データに含まれるデータのうち、異常度が上位所定割合に属し、所定期間の出来高が第2閾値以上であるデータを第1被疑データと判定してもよい。このように、異常度について絶対的な閾値を設定せずに、出来高について第2閾値を設定することで、第2取引データに不公正取引が疑われる第1被疑データが含まれるかより高精度に判定することができる。
第2判定部15は、予め定められた基準に基づき、第2取引データに不公正取引が疑われる第2被疑データが含まれるか判定する。第2判定部15は、例えば、所定期間の売買注文量が閾値以上であるか、所定期間の売買注文のキャンセル量が閾値以上であるか、所定期間の値幅が閾値以上であるか、所定期間の出来高が閾値以上であるかといった基準を用いて、第2取引データに不公正取引が疑われる第2被疑データが含まれるか判定してよい。
明細表生成部16は、第2取引データの時間変化を示し、第2取引データのうち第1被疑データを識別可能に示す取引明細表を生成する。取引明細表は、第1ユーザ端末20及び第2ユーザ端末30に送信されてよい。取引明細表は、例えば、株式の取引データの時間変化を表すものであってよく、市場、銘柄の識別情報、顧客の識別情報、注文の識別情報、取引日時、出来高及び約定価格を含んでよいが、その他の情報を含んでもよい。取引明細表は、特定の銘柄についての約定の履歴を表すいわゆる歩み値を示す表であってよい。明細表生成部16は、第2取引データのうち第1被疑データをハイライト表示したり、大きく表示したりすることで、強調して表示してよい。第2取引データのうち第1被疑データを識別可能に示す取引明細表によって、不公正取引が疑われる箇所が一目で把握できるようになる。
取引明細表は、第1被疑データ、第2被疑データ及び第1被疑データと第2被疑データの重なりを識別可能に示すものであってもよい。取引明細表は、例えば、第1被疑データを第1の色(例えばオレンジ)でハイライト表示し、第2被疑データを第2の色(例えば黄)でハイライト表示し、第1被疑データと第2被疑データの重なりを第3の色(例えば赤)でハイライト表示するものであってよい。第1被疑データ、第2被疑データ及び第1被疑データと第2被疑データの重なりを識別可能に示すことで、学習モデルによって抽出された第1被疑データと、予め定められた基準に基づき抽出された第2被疑データとの共通点と相違点を一目で把握することができる。
グラフ生成部17は、異常度の時間変化を示す第1グラフを生成する。第1グラフは、第1ユーザ端末20及び第2ユーザ端末30に送信されてよい。第1グラフは、例えば1秒毎に第2取引データの異常度をプロットしたグラフであってよい。第1グラフにより、異常度の時間変化が直感的に把握できるようになり、不公正取引が疑われる期間が一目で把握できるようになる。
グラフ生成部17は、第2取引データの時間変化を示し、第2取引データのうち第1被疑データを識別可能に示す第2グラフをさらに生成してよい。第2グラフは、例えば株式の価格変動を示すグラフであってよく、第1被疑データに相当する区間をハイライト表示するものであってよい。第2取引データのうち第1被疑データを識別可能に示す第2グラフによって、不公正取引が疑われる箇所が一目で把握できるようになる。
第2グラフは、第1被疑データ、第2被疑データ及び第1被疑データと第2被疑データの重なりを識別可能に示すものであってもよい。第2グラフは、例えば、第1被疑データの区間を第1の色(例えばオレンジ)でハイライト表示し、第2被疑データの区間を第2の色(例えば黄)でハイライト表示し、第1被疑データと第2被疑データが重なる区間を第3の色(例えば赤)でハイライト表示するものであってよい。第2グラフは、取引明細表と対応する態様で、第1被疑データ、第2被疑データ及び第1被疑データと第2被疑データの重なりを識別可能に示すものであってよい。第1被疑データ、第2被疑データ及び第1被疑データと第2被疑データの重なりを識別可能に示すことで、学習モデルによって抽出された第1被疑データと、予め定められた基準に基づき抽出された第2被疑データとの共通点と相違点を一目で把握することができる。
図3は、本実施形態に係る売買審査装置10の物理的構成を示す図である。売買審査装置10は、演算部に相当するCPU(Central Processing Unit)10aと、記憶部に相当するRAM(Random Access Memory)10bと、記憶部に相当するROM(Read Only Memory)10cと、通信部10dと、入力部10eと、表示部10fと、を有する。これらの各構成は、バスを介して相互にデータ送受信可能に接続される。なお、本例では売買審査装置10が一台のコンピュータで構成される場合について説明するが、売買審査装置10は、複数のコンピュータが組み合わされて実現されてもよい。また、図3で示す構成は一例であり、売買審査装置10はこれら以外の構成を有してもよいし、これらの構成のうち一部を有さなくてもよい。
CPU10aは、RAM10b又はROM10cに記憶されたプログラムの実行に関する制御やデータの演算、加工を行う制御部である。CPU10aは、取引データに不公正取引が疑われるデータが含まれるか判定するプログラム(売買審査プログラム)を実行する演算部である。CPU10aは、入力部10eや通信部10dから種々のデータを受け取り、データの演算結果を表示部10fに表示したり、RAM10bやROM10cに格納したりする。
RAM10bは、記憶部のうちデータの書き換えが可能なものであり、例えば半導体記憶素子で構成されてよい。RAM10bは、CPU10aが実行する売買審査プログラム、取引データといったデータを記憶してよい。なお、これらは例示であって、RAM10bには、これら以外のデータが記憶されていてもよいし、これらの一部が記憶されていなくてもよい。
ROM10cは、記憶部のうちデータの読み出しが可能なものであり、例えば半導体記憶素子で構成されてよい。ROM10cは、例えば売買審査プログラムや、書き換えが行われないデータを記憶してよい。
通信部10dは、売買審査装置10を他の機器に接続するインターフェースである。通信部10dは、インターネット等の通信ネットワークNに接続されてよい。
入力部10eは、ユーザからデータの入力を受け付けるものであり、例えば、キーボード及びタッチパネルを含んでよい。
表示部10fは、CPU10aによる演算結果を視覚的に表示するものであり、例えば、LCD(Liquid Crystal Display)により構成されてよい。表示部10fは、取引データの取引明細表と、異常度の第1グラフと、取引データの第2グラフとを表示してよい。
売買審査プログラムは、RAM10bやROM10c等のコンピュータによって読み取り可能な記憶媒体に記憶されて提供されてもよいし、通信部10dにより接続される通信ネットワークを介して提供されてもよい。売買審査装置10では、CPU10aが売買審査プログラムを実行することにより、図2を用いて説明した様々な動作が実現される。なお、これらの物理的な構成は例示であって、必ずしも独立した構成でなくてもよい。例えば、売買審査装置10は、CPU10aとRAM10bやROM10cが一体化したLSI(Large-Scale Integration)を備えていてもよい。
図4は、本実施形態に係る売買審査装置10により実行される第1処理のフローチャートである。はじめに、売買審査装置10は、1週間分の第1取引データを取得し(S10)、それに続く1日分の第2取引データを取得する(S11)。
その後、売買審査装置10は、第1取引データと第2取引データに基づいて、密度比関数により第1取引データの確率分布と第2取引データの確率分布との密度比を推定する(S12)。また、売買審査装置10は、密度比関数により得られた密度比に基づき、第2取引データの異常度を算出する(S13)。
さらに、売買審査装置10は、異常度に基づき、第2取引データに不公正取引が疑われる第1被疑データが含まれるか判定する(S14)。このように、本実施形態に係る売買審査装置10によれば、変量に対して確率分布を仮定せずに第1取引データの確率分布と第2取引データの確率分布との密度比を推定することで、第1取引データの確率分布と第2取引データの確率分布とを直接推定する必要がなくなり、教師データを必要としない学習モデルによって第2取引データの異常度を算出することができる。これにより、教師データを必要としない学習モデルによって、第2取引データに不公正取引が疑われる第1被疑データが含まれるか判定することができる。
図5は、本実施形態に係る売買審査装置10により実行される第1被疑データの判定処理のフローチャートである。同図では、図4に示した、第2取引データに不公正取引が疑われる第1被疑データが含まれるか判定する処理(S14)の詳細を示している。
はじめに、売買審査装置10は、異常度の上位50%に属するデータを抽出する(S141)。もっとも、異常度が上位何割に属するデータを抽出するかは、適宜調整することができる。
売買審査装置10は、異常度が上位50%に属するデータのうち、値幅が第1閾値以上のデータに絞り込みを行う(S142)。さらに、売買審査装置10は、出来高が第2閾値以上のデータに絞り込みを行う(S143)。そして、売買審査装置10は、絞り込まれたデータを第1被疑データと判定する(S144)。
図6は、本実施形態に係る売買審査装置10により実行される第2処理のフローチャートである。同図では、図4に示した第1処理の後に行われる第2処理を示している。
はじめに、売買審査装置10は、異常度の時間変化を示す第1グラフを生成する(S15)。また、売買審査装置10は、予め定められた基準に基づき、第2取引データに不公正取引が疑われる第2被疑データが含まれるか判定する(S16)。
そして、売買審査装置10は、第1被疑データ、第2被疑データ及び第1被疑データと第2被疑データの重なりを識別可能に示す取引明細表を生成する(S17)。また、売買審査装置10は、第1被疑データ、第2被疑データ及び第1被疑データと第2被疑データの重なりを識別可能に示すグラフを生成する(S18)。
最後に、売買審査装置10は、生成した第1グラフ、第2グラフ及び取引明細表をユーザ端末に送信する(S19)。以上により、第2処理が終了する。
図7は、本実施形態に係る売買審査装置10による取引データの分類を示す図である。売買審査装置10は、第1判定部14によって、第2取引データに不公正取引が疑われる第1被疑データが含まれるか判定し、第2判定部15によって、第2取引データに不公正取引が疑われる第2被疑データが含まれるか判定する。同図では、第1判定部14によって不公正取引の疑いありと判定され、かつ、第2判定部15によって不公正取引の疑いありと判定された場合を(1)と表している。このように、第1被疑データかつ第2被疑データである場合を第1種被疑データと呼ぶ。
また、第1判定部14によって不公正取引の疑いなしと判定されたが、第2判定部15によって不公正取引の疑いありと判定された場合を(2)と表している。このように、第1被疑データではないが第2被疑データである場合を第2種被疑データと呼ぶ。
また、第1判定部14によって不公正取引の疑いありと判定されたが、第2判定部15によって不公正取引の疑いなしと判定された場合を(3)と表している。このように、第1被疑データであるが第2被疑データでない場合を第3種被疑データと呼ぶ。
最後に、第1判定部14によって不公正取引の疑いなしと判定され、かつ、第2判定部15によって不公正取引の疑いなしと判定された場合を(4)と表している。
以下に示す表1は、第2判定部15により第2取引データに不公正取引が疑われるデータが含まれるか判定した結果と、同じ第2取引データを専門家が分析し、不公正取引が疑われるデータが含まれるか判定した結果とをまとめた表である。
Figure 0006932680
表1によれば、ルールベースの第2判定部15による判定では、専門家が不公正取引の疑なしと判断した91件中84件が、不公正取引が疑われるデータとして抽出されている。
反対に、ルールベースの第2判定部15による判定では、専門家が不公正取引の疑いありと判断した27件中25件が、不公正取引が疑われるデータとして抽出されている。
これらの数値から、第2判定部15による判定について、不公正取引が疑われるデータの取り逃がしがないか表すRecall Rateは、(25)/(25+2)×100=92.59%と高いが、不公正取引が疑われるデータの取り間違いがないか表すPrecision Rateは、(25)/(25+84)×100=22.94%と低いことがわかる。すなわち、ルールベースの第2判定部15による判定は、取り逃しをほとんどしないが、取り間違いが多いことを意味している。そのため、従来の売買審査業務では、不公正取引が疑われるデータの中から不公正取引の疑いがないデータを取り除く作業に多大な時間が費やされている。
次に、以下に示す表2は、第1判定部14により、異常度に基づいて第2取引データに不公正取引が疑われるデータが含まれるか判定した結果と、同じ第2取引データを専門家が分析し、不公正取引が疑われるデータが含まれるか判定した結果とをまとめた表である。
Figure 0006932680
表2によれば、異常度に基づく第1判定部14による判定では、専門家が不公正取引の疑なしと判断した91件中37件が、不公正取引が疑われるデータとして抽出されている。
反対に、異常度に基づく第1判定部14による判定では、専門家が不公正取引の疑いありと判断した27件中22件が、不公正取引が疑われるデータとして抽出されている。
これらの数値から、異常度に基づく第1判定部14による判定について、不公正取引が疑われるデータの取り逃がしがないか表すRecall Rateは、(22)/(22+5)×100=81.48%と高く、不公正取引が疑われるデータの取り間違いがないか表すPrecision Rateも、(22)/(22+37)×100=37.29%と高いことがわかる。すなわち、異常度に基づく第1判定部14による判定は、取り逃しをほとんどせず、ルールベースの場合に比較して取り間違いも少なく、より実用に適していることを意味している。
次に、以下に示す表3は、第1判定部14により、異常度、値幅及び出来高に基づいて第2取引データに不公正取引が疑われるデータが含まれるか判定した結果と、同じ第2取引データを専門家が分析し、不公正取引が疑われるデータが含まれるか判定した結果とをまとめた表である。
Figure 0006932680
表3によれば、異常度、値幅及び出来高に基づく第1判定部14による判定では、専門家が不公正取引の疑なしと判断した91件中17件が、不公正取引が疑われるデータとして抽出されている。
反対に、異常度、値幅及び出来高に基づく第1判定部14による判定では、専門家が不公正取引の疑いありと判断した27件中22件が、不公正取引が疑われるデータとして抽出されている。
これらの数値から、異常度、値幅及び出来高に基づく第1判定部14による判定について、不公正取引が疑われるデータの取り逃がしがないか表すRecall Rateは、(22)/(22+5)×100=81.48%と高く、不公正取引が疑われるデータの取り間違いがないか表すPrecision Rateも、(22)/(22+17)×100=56.41%と高いことがわかる。すなわち、異常度、値幅及び出来高に基づく第1判定部14による判定は、取り逃しをほとんどせず、取り間違いもルールベースの場合に比べて2.46倍(56.41%/22.94%=2.46)少ないことを意味している。このように、本実施形態に売買審査装置10によれば、不公正取引が疑われるデータの取り逃がしを少なくしつつ、取り間違いも少なくして、売買審査業務の効率化に資することができる。
図8は、本実施形態に係る売買審査装置10により生成される取引明細表を示す図である。売買審査装置10の明細表生成部16は、第2取引データの時間変化を示し、第2取引データのうち第1被疑データを識別可能に示す取引明細表を生成する。本例の取引明細表は、株式の取引データの時間変化を表すものであり、「市場」、「銘柄」の識別情報、「顧客」の識別情報、「注文」の受付番号(識別情報)、「取引日」、「受注時間」、「売買区分」、「訂正区分」、「数量」及び「単価」を含む。具体的には、「市場」は「東証M」すなわち東証マザーズであり、「銘柄」は「AAAA」(証券コード)であり、「顧客」の識別情報は、「92345678」等の8桁の番号であり、「受付番号」は「987654321」等の9桁の連続番号である。また、「取引日」は「2014/6/17」(2014年6月17日)であり、「受注時間」は「8:01:54」(8時1分54秒)等である。さらに、「売買区分」は「買」又は「売」であり、「訂正区分」は「訂正」又は「取消」である。「数量」は、売買注文の数量を表し、「100」等であり、「単価」は、指値注文の場合に「14,200」(1万4千2百円)等であり、成り行き注文の場合に「成行」である。
取引明細表は、第1被疑データ、第2被疑データ及び第1被疑データと第2被疑データの重なりを識別可能に示すものであってよい。本例では、取引明細表は、第1被疑データを破線で示す第1領域Aにより強調表示し、第1被疑データと第2被疑データの重なりを一点鎖線で示す第2領域Bにより強調表示し、第2被疑データを二点鎖線で示す第3領域Cにより強調表示している。このように、第1被疑データ、第2被疑データ及び第1被疑データと第2被疑データの重なりを識別可能に示すことで、学習モデルによって抽出された第1被疑データと、予め定められた基準に基づき抽出された第2被疑データとの共通点と相違点を一目で把握することができる。なお、本例では、図示を簡明にするため第1領域A、第2領域B及び第3領域Cによって第1被疑データ、第1被疑データと第2被疑データの重なり及び第2被疑データを識別可能に示しているが、売買審査装置10は、これらのデータをハイライト表示したり、大きく表示したりすることで、強調して表示してもよい。
図9は、本実施形態に係る売買審査装置10により生成される第1グラフを示す図である。売買審査装置10のグラフ生成部17は、異常度の時間変化を示す第1グラフを生成する。第1グラフは、例えば1秒毎に第2取引データの異常度をプロットしたグラフであってよい。本例では、横軸に時刻を示し、縦軸に異常度の数値を示して、買い注文の取り消し数量に関する異常度a1を実線で示し、売り注文の取り消し数量に関する異常度a2を破線で示し、買い気配数量に関する異常度a3を一点鎖線で示し、売り気配数量に関する異常度a4を二点鎖線で示している。
本例の第1グラフによれば、9時頃に買い気配数量に関する異常度a3及び売り気配数量に関する異常度a4が二本のピークを形成している。また、10時頃から10時半頃に4種類の異常度全てが複数のピークを形成している。さらに、13時半頃に売り気配数量に関する異常度a4がピークを形成しており、14時半頃に買い気配数量に関する異常度a3がピークを形成している。このように、第1グラフにより、異常度の時間変化が直感的に把握できるようになり、不公正取引が疑われる期間が一目で把握できるようになる。
図10は、本実施形態に係る売買審査装置10により生成される第2グラフを示す図である。売買審査装置10のグラフ生成部17は、第2取引データの時間変化を示し、第2取引データのうち第1被疑データを識別可能に示す第2グラフをさらに生成してよい。本例の第2グラフは、横軸に時刻を示し、縦軸に種々の取引データの値を示している。具体的には、上段から順に、買い気配数量と売り気配数量(quote volume)、買い注文の取り消し数量と売り注文の取り消し数量(cancel volume)、買い注文の約定待ち数量に対する取り消し数量の比と売り注文の約定待ち数量に対する取り消し数量の比(cancel volume ratio over order book volume)、買い注文の約定待ち上位10注文の数量と売り注文の約定待ち上位10注文の数量(order book volume on 10 levels)、出来高(traded volume)及び価格推移(price transition)を含む。
本例では、第2グラフは、第1被疑データを破線で示す第1領域Aにより強調表示し、第1被疑データと第2被疑データの重なりを一点鎖線で示す第2領域Bにより強調表示し、第2被疑データを二点鎖線で示す第3領域Cにより強調表示している。このように、第1被疑データ、第2被疑データ及び第1被疑データと第2被疑データの重なりを識別可能に示すことで、学習モデルによって抽出された第1被疑データと、予め定められた基準に基づき抽出された第2被疑データとの共通点と相違点を一目で把握することができる。なお、本例では、図示を簡明にするため第1領域A、第2領域B及び第3領域Cによって第1被疑データ、第1被疑データと第2被疑データの重なり及び第2被疑データを識別可能に示しているが、売買審査装置10は、これらのデータをハイライト表示したり、大きく表示したりすることで、強調して表示してもよい。
第2グラフに表示されている第1領域A、第2領域B及び第3領域Cは、図8に示す取引明細表に表示されている第1領域A、第2領域B及び第3領域Cと対応している。このように、第2グラフ及び取引明細表の両方で第1被疑データ、第2被疑データ及び第1被疑データと第2被疑データの重なりを識別可能に示すことで、第2グラフ及び取引明細表で情報を補完しながら被疑データの詳細を確認することができる。
なお、本例では、図9に示す第1グラフと図10に示す第2グラフとを別々に図示しているが、第1グラフと第2グラフは、横軸を共有するように並べて表示されてよい。第1グラフ及び第2グラフを、横軸を共有するように表示することで、異常度がピークを形成している時刻と、第1被疑データ、第2被疑データ及び第1被疑データと第2被疑データの重なりとを容易に比較することができる。
以上説明した実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。実施形態が備える各要素並びにその配置、材料、条件、形状及びサイズ等は、例示したものに限定されるわけではなく適宜変更することができる。また、異なる実施形態で示した構成同士を部分的に置換し又は組み合わせることが可能である。
10…売買審査装置、10a…CPU、10b…RAM、10c…ROM、10d…通信部、10e…入力部、10f…表示部、11…取得部、12…推定部、13…算出部、14…第1判定部、15…第2判定部、16…明細表生成部、17…グラフ生成部、20…第1ユーザ端末、30…第2ユーザ端末、40…証券会社データベース、50…情報ベンダデータベース、100…売買審査システム、DB1…顧客データ、DB2…取引データ、DB3…マーケットデータ

Claims (14)

  1. 金融商品の取引に基づく前記金融商品の板情報及び相場情報を時系列データとして含む、前記金融商品のマーケットデータのうち、所定の期間における前記金融商品の取引を示す第1取引データと、前記金融商品の売買審査の対象となり、前記所定の期間より後の期間における前記金融商品の取引を示す第2取引データとに基づいて、密度比関数により前記第1取引データの確率分布と前記第2取引データの確率分布との密度比を推定する推定部と、
    前記密度比関数に基づき、前記第2取引データの異常度を算出する算出部と、
    前記異常度に基づき、前記第2取引データに、相場操縦取引が疑われる第1被疑データが含まれるか判定する第1判定部と、
    を備える売買審査装置。
  2. 前記第1取引データは、前記第2取引データよりも長い期間におけるデータである、
    請求項1に記載の売買審査装置。
  3. 前記第1取引データ及び前記第2取引データは、売買注文量を示すデータを含む、
    請求項1又は2に記載の売買審査装置。
  4. 前記第1取引データ及び前記第2取引データは、売買注文のキャンセル量を示すデータを含む、
    請求項1から3のいずれか一項に記載の売買審査装置。
  5. 前記第1判定部は、前記第2取引データのうち、前記異常度が上位所定割合に属するデータを前記第1被疑データと判定する、
    請求項1から4のいずれか一項に記載の売買審査装置。
  6. 前記第1判定部は、前記第2取引データのうち、前記異常度が上位所定割合に属し、所定期間の値幅が第1閾値以上であるデータを前記第1被疑データと判定する、
    請求項5に記載の売買審査装置。
  7. 前記第1判定部は、前記第2取引データのうち、前記異常度が上位所定割合に属し、所定期間の出来高が第2閾値以上であるデータを前記第1被疑データと判定する、
    請求項5又は6に記載の売買審査装置。
  8. 前記異常度の時間変化を示す第1グラフを生成するグラフ生成部をさらに備える、
    請求項1から7のいずれか一項に記載の売買審査装置。
  9. 前記グラフ生成部は、前記第2取引データの時間変化を示し、前記第2取引データのうち、前記金融商品の銘柄ごとの、注文量、キャンセル量、前記板情報に基づく一以上の価格における注文量、及び価格変動の項目について、前記第1被疑データを識別可能に示す第2グラフをさらに生成する、
    請求項8に記載の売買審査装置。
  10. 所定の証券会社における予め定められた基準に基づき抽出された第2被疑データのうち、相場操縦取引が疑われる前記第1被疑データが含まれるか判定する第2判定部をさらに備え、
    前記第2グラフは、前記第1被疑データ、前記第2被疑データ及び前記第1被疑データと前記第2被疑データの時系列における重なりを識別可能に示す、
    請求項9に記載の売買審査装置。
  11. 所定の証券会社における予め定められた基準に基づき抽出された第2被疑データのうち、相場操縦取引が疑われる前記第1被疑データが含まれるか判定する第2判定部と、
    前記第2被疑データのうち、前記取引の時刻が前記第1被疑データの前記取引の時刻と一致する前記第2被疑データを識別可能に示す取引明細表を生成する明細表生成部と、をさらに備える、
    請求項1から10のいずれか一項に記載の売買審査装置。
  12. 前記推定部は、前記密度比を、非制約最小二乗密度比推定法を用いて算出する、
    請求項1から11のいずれか一項に記載の売買審査装置。
  13. コンピュータが、
    金融商品の取引に基づく前記金融商品の板情報及び相場情報を時系列データとして含む、前記金融商品のマーケットデータのうち、所定の期間における前記金融商品の取引を示す第1取引データと、前記金融商品の売買審査の対象となり、前記所定の期間より後の期間における前記金融商品の取引を示す第2取引データとに基づいて、密度比関数により前記第1取引データの確率分布と前記第2取引データの確率分布との密度比を推定することと、
    前記密度比関数に基づき、前記第2取引データの異常度を算出することと、
    前記異常度に基づき、前記第2取引データに、相場操縦取引が疑われる第1被疑データが含まれるか判定することと、
    を含む売買審査方法。
  14. 売買審査装置に備えられたコンピュータを、
    金融商品の取引に基づく前記金融商品の板情報及び相場情報を時系列データとして含む、前記金融商品のマーケットデータのうち、所定の期間における前記金融商品の取引を示す第1取引データと、前記金融商品の売買審査の対象となり、前記所定の期間より後の期間における前記金融商品の取引を示す第2取引データとに基づいて、密度比関数により前記第1取引データの確率分布と前記第2取引データの確率分布との密度比を推定する推定部、
    前記密度比関数に基づき、前記第2取引データの異常度を算出する算出部、及び
    前記異常度に基づき、前記第2取引データに、相場操縦取引が疑われる第1被疑データが含まれるか判定する第1判定部、
    として機能させる売買審査プログラム。
JP2018206232A 2018-11-01 2018-11-01 売買審査装置、売買審査方法及び売買審査プログラム Active JP6932680B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018206232A JP6932680B2 (ja) 2018-11-01 2018-11-01 売買審査装置、売買審査方法及び売買審査プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018206232A JP6932680B2 (ja) 2018-11-01 2018-11-01 売買審査装置、売買審査方法及び売買審査プログラム

Publications (2)

Publication Number Publication Date
JP2020071751A JP2020071751A (ja) 2020-05-07
JP6932680B2 true JP6932680B2 (ja) 2021-09-08

Family

ID=70547867

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018206232A Active JP6932680B2 (ja) 2018-11-01 2018-11-01 売買審査装置、売買審査方法及び売買審査プログラム

Country Status (1)

Country Link
JP (1) JP6932680B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021193441A1 (ja) * 2020-03-23 2021-09-30 日本電気株式会社 不公正取引可視化装置、方法およびプログラム
JP7568501B2 (ja) * 2020-12-25 2024-10-16 マネーツリー株式会社 外部監査装置、外部監視システム、外部監査方法、及び外部監査プログラム
CN113127894B (zh) * 2021-03-03 2022-09-30 合肥工业大学 基于舆论传播模型的加密货币网络数据传播方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002269349A (ja) * 2001-03-13 2002-09-20 Artis Kk 取引執行システム及びその方法、並びにコンピュータ上で動作する取引執行プログラムを記録した記録媒体
JP2008021141A (ja) * 2006-07-13 2008-01-31 Kabu.Com Securities Co Ltd 売買注文受付システム及び売買注文受付方法
JP2010146093A (ja) * 2008-12-16 2010-07-01 Tokyo Stock Exchange Inc 有価証券取引抽出装置及び有価証券取引抽出方法ならびにそのプログラム
JP5485939B2 (ja) * 2011-05-18 2014-05-07 日立Geニュークリア・エナジー株式会社 機器異常判定装置、及び機器異常判定方法

Also Published As

Publication number Publication date
JP2020071751A (ja) 2020-05-07

Similar Documents

Publication Publication Date Title
US20230070176A1 (en) Architecture for data processing and user experience to provide decision support
JP4358475B2 (ja) 信用評価システム
US12235798B2 (en) Data conversion and distribution systems
JP6340428B2 (ja) ビジネス関係ネットワークの発見、及び関係の関連性の評価
JP2020523657A (ja) 業者を評価する方法及びシステム
CN113744024B (zh) 一种商家匹配方法、装置、计算机设备及存储介质
JP6932680B2 (ja) 売買審査装置、売買審査方法及び売買審査プログラム
JP2016099915A (ja) 与信審査用サーバと与信審査用システム及び与信審査用プログラム
CN115204978A (zh) 一种多平台数据处理方法、装置、电子设备及存储介质
JP2002366741A (ja) 資産管理支援システム、資産管理支援用サーバ装置、および資産管理支援方法
JP2011227796A (ja) 取引タイプ判別装置
JP2023168630A (ja) 金融商品取引管理装置、金融商品取引管理システム、プログラム
CN116503130A (zh) 基于电子商务的账户风险评估系统
CA3081254C (en) Data conversion and distribution systems
KR101829741B1 (ko) 중고차정보제공서버, 방법, 및 컴퓨터-판독가능매체
WO2021256493A1 (ja) 投資信託診断システム、投資信託診断プログラム及び投資信託診断方法
JP7574909B2 (ja) 情報提供サーバ、データ処理装置、情報提供方法及びプログラム
TWM557882U (zh) 權證商品價值評估系統
CN114219564A (zh) 一种数据资源处理方法、装置、电子设备及介质
KR20250153572A (ko) 디지털 보증서 기반 리테일 데이터를 활용한, 인공지능형 기업 및 경영 분석 정보 생성 방법, 장치 및 시스템
CN112330454A (zh) 股市主力变化的数据可视化方法、装置和可读存储介质
CN111784456A (zh) 一种电商商家的信誉评价方法和装置以及计算机设备
TW201918972A (zh) 權證商品價值評估系統及方法
JP2009128964A (ja) ファンド情報管理システム及びプログラム

Legal Events

Date Code Title Description
A80 Written request to apply exceptions to lack of novelty of invention

Free format text: JAPANESE INTERMEDIATE CODE: A80

Effective date: 20181119

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191129

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200923

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201117

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210305

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210730

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210818

R150 Certificate of patent or registration of utility model

Ref document number: 6932680

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150