JP7102344B2 - 機械学習モデルのモデリング方法及びデバイス - Google Patents

機械学習モデルのモデリング方法及びデバイス Download PDF

Info

Publication number
JP7102344B2
JP7102344B2 JP2018542277A JP2018542277A JP7102344B2 JP 7102344 B2 JP7102344 B2 JP 7102344B2 JP 2018542277 A JP2018542277 A JP 2018542277A JP 2018542277 A JP2018542277 A JP 2018542277A JP 7102344 B2 JP7102344 B2 JP 7102344B2
Authority
JP
Japan
Prior art keywords
initial target
machine learning
variable
target
variables
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018542277A
Other languages
English (en)
Other versions
JP2019511037A5 (ja
JP2019511037A (ja
Inventor
チャン,ケ
チュー,ウェイ
シ,シン
シエ,シュクン
シエ,フェン
Original Assignee
アリババ グループ ホウルディング リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アリババ グループ ホウルディング リミテッド filed Critical アリババ グループ ホウルディング リミテッド
Publication of JP2019511037A publication Critical patent/JP2019511037A/ja
Publication of JP2019511037A5 publication Critical patent/JP2019511037A5/ja
Application granted granted Critical
Publication of JP7102344B2 publication Critical patent/JP7102344B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operations Research (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Security & Cryptography (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本願は、「MODELING METHOD AND DEVICE FOR MACHINE LEARNING MODEL」と題された2016年2月19日に出願された中国特許出願第201610094664.8号への優先権を主張するものであり、この中国特許出願は全体として参照により本明細書に援用される。
技術分野
本願は、コンピュータ技術に関し、特に機械学習モデルのモデリング方法及びデバイスに関する。
背景技術
挙動パターンが機械学習モデルを使用することにより特定される場合、特定の目標挙動に属する様々な特定の挙動の共通の特徴が一般に抽出され、それにより、共通の特徴に従って機械学習モデルを構築する。構築された機械学習モデルは、特定の挙動が共通の特徴を有するか否かに従って、特定の挙動が目標挙動に属するか否かを判断する。
ネットワークにおける不正取引を一例として使用する。不正取引とは、取引事実の偽造又は隠匿、クレジットレコードルールの逸脱又は悪意のある使用、及びクレジットレコードオーダーの干渉又は邪魔等の不正な偽商品販売、ショップの格付け、クレジットポイント、又は商品コメント等の売り手ユーザ及び/又は買い手ユーザが不正利益を得る挙動を指す。例えば、現在、ブラッシング(brushing)、評価水増し、現金引き出し、並びに偽の注文及び融資等の不正取引の種類がある。ネットワークの取引挙動を規制するには、不正取引の挙動パターンを特定する必要がある。
様々なタイプの不正取引があり、各タイプの不正取引は、様々な特定の実施様式を有し、様々なタイプの不正取引の取引挙動は互いと大きく異なる。従来技術では、共通の特徴を抽出するように不正取引を特定する機械モデルを構築することは不可能である。したがって、従来技術では、各機械学習モデルが、不正取引の実施形態又は1つのタイプの不正取引を特定する。機械学習モデルを使用することにより不正取引が認識される場合、複数のモデルを確立する必要があり、高コスト及び低い認識効率に繋がる。
発明の概要
本発明は、目標挙動が多くの異なるタイプの実施形態を有する場合、目標挙動の包括的な特定に適用可能であり、したがって、コストを節減し、認識効率を改善した機械学習モデルを構築する、機械学習モデルのモデリング方法及びデバイスを提供する。
上記目的を達成するために、本発明の実施形態は以下の技術的解決策を採用する。
第1の態様では、機械学習モデルのモデリング方法が提供され、本方法は、
排他的中間目標変数を取得することであって、中間目標変数は不正取引タイプを示すのに使用される、取得することと、
各中間目標変数に対応する機械学習サブモデルの確率値を得るように、機械学習サブモデルをトレーニングすることであって、機械学習サブモデルは、取引挙動を記述する特徴変数に従って、対応する中間目標変数により示される不正取引タイプを特定するのに使用される、トレーニングすることと、
機械学習サブモデルの確率値を合算して、目標確率値を取得することと、
目標確率値及び特徴変数に従って、不正取引を特定する目標機械学習モデルを確立することと
を含む。
第2の態様では、機械学習モデルのモデリングデバイスが提供され、本デバイスは、
排他的中間目標変数を取得するように構成された取得モジュールであって、中間目標変数は不正取引タイプを示すのに使用される、取得モジュールと、
各中間目標変数に対応する機械学習サブモデルの確率値を得るように、機械学習サブモデルをトレーニングするように構成されたトレーニングモジュールであって、機械学習サブモデルは、取引挙動を記述する特徴変数に従って、対応する中間目標変数により示される不正取引タイプを特定するのに使用される、トレーニングモジュールと、
機械学習サブモデルの確率値を合算して、目標確率値を取得するように構成された合算モジュールと、
目標確率値及び特徴変数に従って、不正取引を特定する目標機械学習モデルを確立するように構成されたモデリングモジュールと
を含む。
本発明の実施形態において提供される機械学習モデルのモデリング方法及びデバイスでは、各中間目標変数に対応する機械学習サブモデルは、機械学習サブモデルの確率値を得るようにトレーニングされ、次に、機械学習サブモデルの確率値を合算し、目標挙動を特定する目標機械学習モデルが、合算により得られる目標確率値及び取引挙動を記述する特徴変数に従って確立される。各機械学習サブモデルは、特定のタイプの目標挙動の特定に使用され、機械学習サブモジュールの確率値は合算されて、標本が複数の目標挙動タイプのうちの少なくとも1つのタイプのものである確率を得るため、確率値に基づいて構築された機械学習モデルは、目標挙動の包括的な特定に使用することができる。例えば、モデリング方法が不正取引の応用状況に適用される場合、構築されたモデルは不正取引を包括的に特定することができ、従来技術のように不正取引の異なる実施形態又は異なるタイプに複数のモデルを構築する必要がなく、したがって、コストが節減され、不正取引の認識効率が改善する。
上記例示は、本発明の技術的解決策の単なる概要であり、本明細書の内容に従って実施されて、本発明の技術的手段をより明確に理解することができる。さらに、本発明の特定の実施様式が、本発明の上記及び他の目的、特徴、及び利点をより理解できるようにするために以下に指定される。
図面の簡単な説明
当業者は、以下の好ましい実施様式の詳細な説明を読むことにより様々な他の利点及び恩恵を明確に知ることになる。添付図面は、単に好ましい実施様式を示すために使用され、本発明を限定する意図はない。さらに、同一の参照符号は、添付図面全体を通して同一の構成要素を示すのに使用される。
本発明の実施形態1による機械学習モデルのモデリング方法の概略フローチャートである。 本発明の実施形態2による機械学習モデルのモデリング方法の概略フローチャートである。 目標変数を再構築する概略フローチャートである。 本発明の実施形態3による機械学習モデルのモデリングデバイスの概略構造図である。 本発明の実施形態4による機械学習モデルのモデリングデバイスの概略構造図である。
詳細な説明
本開示の例示的な実施形態について、添付図面を参照してより詳細に以下に説明する。本開示の例示的な実施形態は添付図面に示されるが、本開示が様々な形態で実施可能であり、本明細書に記載される実施形態により限定されるものではないことを理解されたい。逆に、実施形態は、当業者が本開示をより完全に理解するために提供され、本開示の範囲を当業者に完全に伝達することができる。
本発明の実施形態において提供される機械学習モデルのモデリング方法及びデバイスについて、添付図面を参照して以下に詳細に説明する。
実施形態1
図1は、本発明の実施形態1による機械学習モデルのモデリング方法の概略フローチャートである。この実施形態において提供される方法は、不正取引を特定するのに使用することができる。換言すれば、この実施形態において述べられる目標挙動は不正取引であり得る。この実施形態において提供される方法は、他の異常取引に更に適用可能であり得、この実施形態に限定されない。図1に示されるように、方法は以下のステップを含む。
ステップ101:各中間目標変数に対応する機械学習サブモデルが、機械学習サブモデルの確率値を得るようにトレーニングされる。
機械学習サブモデルは、取引挙動を記述する特徴変数に従って、対応する中間目標変数により示される目標挙動タイプの特定に使用される。
特に、目標挙動は様々な実施形態を有し、同様の取引挙動を有する実施形態は1つのタイプに分類し得、各タイプ内の取引挙動は同様であるが、異なるタイプの取引挙動は一般に、互いと劇的に異なっている。例えば、不正取引を特定する応用状況では、不正取引は様々な実施形態を有する。ブラッシング、現金引き出し、ローン詐欺、及び評価水増しという実施形態の中でも、評価水増し及びブラッシングの取引挙動はかなり類似しており、1つのタイプに分類することができ、一方、現金引き出し及びローン詐欺の取引挙動は大きく異なり、それぞれ1つのタイプとして使用することができる。
目標挙動が分類されるとき、目標挙動の特定の実施形態を示す初期目標変数間の互換状態又は排他状態に従って、互換性のある初期目標変数を結合して、相互に排他的な状態の中間目標変数を取得する。異なる実施形態の取引挙動が大きく異なる場合、異なる実施形態に対応する初期目標変数は排他的である。異なる実施形態の取引挙動がわずかに異なる場合、異なる実施形態に対応する初期目標変数は互換性を有する。
各中間目標変数に対応する機械学習サブモデルが構築される。機械学習サブモデルは、取引挙動を記述する特徴変数に従って、標本が、対応する中間目標変数により示される目標挙動タイプに属するか否かを判断するためのバイナリモデルである。機械学習サブモデルは、機械学習サブモデルの確率値を得るようにトレーニング標本を使用することによりトレーニングされる。
ステップ102:機械学習サブモデルの確率値を合算して、目標確率値を取得する。
各機械学習サブモデルは、対応する中間目標変数により示される目標挙動タイプの特定に使用されるため、機械学習サブモデルの確率値を合算して、複数の目標挙動タイプのうちの少なくとも1つを特定する確率、すなわち、目標確率値を取得することができる。
ステップ103:目標挙動を特定する目標機械学習モデルが、目標確率値及び特徴変数に従って確立される。
特に、目標挙動を特定する目標機械学習モデルが構築される。目標機械学習モデルはバイナリモデルである。目標機械学習モデルの確率は目標確率値であり、目標機械学習モデルの入力は、取引挙動を記述する特徴変数であり、目標機械学習モデルの出力は、取引挙動が目標挙動であるか否かを示す目標変数である。目標変数の値は0又は1である。目標変数の値が、標本の特徴変数に従って1と判断される場合、標本は肯定標本であり、すなわち、目標挙動に属し、その他の場合、標本は目標挙動ではない。
この実施形態では、各中間目標変数に対応する機械学習サブモデルは、機械学習サブモデルの確率値を得るようにトレーニングされ、次に、機械学習サブモデルの確率値を合算し、目標挙動を特定する目標機械学習モデルが、合算により得られる目標確率値及び取引挙動を記述する特徴変数に従って確立される。不正取引を特定する応用状況では、目標挙動は不正取引であり、したがって、各機械学習サブモデルは、対応する中間目標変数により示される不正取引のタイプの特定に使用され、複数の不正取引タイプのうちの少なくとも1つを特定する確率は、機械学習サブモデルの確率値を合算することにより得ることができ、確率値に基づいて構築されたモデルは、様々な不正取引タイプを特定することができ、したがって、コストを節減し、不正取引の認識効率を改善することができる。
実施形態2
図2は、本発明の実施形態2による機械学習モデルのモデリング方法の概略フローチャートである。この実施形態では、不正取引を包括的に特定するための機械学習モデルの構築は、本発明の実施形態における技術的解決策を更に説明するための一例として使用される。図2に示されるように、方法は以下のステップを含む。
ステップ201:予め設定された初期目標変数及び特徴変数が得られる。
特に、過去取引データが、過去の取引により形成された取引レコードを記録する。各取引レコードは、それぞれ買い手取引情報、売り手取引情報、及び商品取引情報である三次元の取引情報を含む。加えて、各取引レコードは、取引が、様々な不正取引の特定の実施形態に属するか否かを示す情報を更に含み、不正取引の特定の実施形態は、ブラッシング、現金引き出し、ローン詐欺、及び評価水増しを含むが、これらに限定されない。
ユーザは、過去取引データから、特徴変数xとして設定される、取引情報を記述するパラメータを抽出することができ、また、初期特徴変数yとして設定される、不正取引のタイプを記述するパラメータを抽出することができる。
例えば、ブラッシングは初期特徴変数yとして使用し得、現金引き出しは初期特徴変数yとして使用し得、ローン詐欺は初期特徴変数yとして使用し得、評価水増しは初期特徴変数yとして使用し得る。
過去情報は多数のパラメータを含むため、ユーザは、特徴変数を設定する際、可能な限り多くの、取引情報を記述するパラメータを特徴変数として抽出することができる。完全な取引情報を抽出することにより、特徴変数により記述される取引挙動はより正確である。分類等の分析動作が、それに従って確立される機械学習モデルを使用することにより行われる場合、得られた結果はより正確であることができる。
ステップ202:初期目標変数に従って、排他的な中間目標変数が取得される。
特に、初期目標変数間の互換状態又は排他状態が特定され、初期目標変数間の互換状態又は排他状態に従って、互換性のある初期目標変数を統合して、相互に排他的な状態の中間目標変数を取得する。
まず、式
Figure 0007102344000001

に従って初期目標変数間の互換状態又は排他状態が特定され、相互に排他的な状態の初期目標変数が2つごとに初期目標変数対として使用される。Numijは、初期目標変数y及び初期目標変数yが過去取引データ内で肯定標本として同時に定義される取引レコードの数を示す。Numは、初期目標変数yにより、過去取引データ内で肯定標本として定義される取引レコードの数を示し、Numは、初期目標変数yにより、過去取引データ内で肯定標本として定義される取引レコードの数を示す。i及びjの範囲は1≦i≦N、1≦j≦Nである。Nは初期特徴変数の総数である。2つの初期目標変数は、H=1である場合、排他的であり、2つの初期目標変数は、H=0である場合、互換である。加えて、上記式中の0.2は単なる好ましい閾値である。実際の使用において、別の値を選択してもよい。閾値の値が低いほど、H=1である場合に特定される2つの初期目標変数は、互いに対する排他性が高い;換言すれば、一方の初期目標変数対は、他方の初期目標変数の値に対してより小さな影響を有する。
なお、本明細書での肯定標本とは、取引レコードが、初期目標変数により示される不正取引タイプに属することを指し、その他の場合、否定標本である。本明細書での排他的とは、一方の初期目標変数の値が、他方の初期目標変数の値に対して小さな影響を有することを指し、本明細書での互換的とは、一方の初期目標変数の値が、他方の初期目標変数の値に対して大きな影響を有することを指す。
次に、分割集合が構築され、この集合は、全ての初期目標変数を含む。次に、初期目標変数対に従って分割集合を2つの次のレベルの分割集合に分割するステップが繰り返し実行され、次のレベルの分割集合は、分割が全ての初期目標変数対に対して行われるまで、次の初期目標変数対に従って分割を行うのに使用される。各分割集合は、初期目標変数対内の1つの初期目標変数、及び初期目標変数対以外の分割集合内の全ての要素を含む。相互包含関係を有する分割集合を統合して、目標部分集合を取得する。同じ目標部分集合内の初期目標変数を統合して、中間目標変数Yとして機能する。
例えば、初期目標変数がy、y、y、及びyである場合、かつ計算を通して、初期目標変数対y1及びy2、初期目標変数対y1及びy4、初期目標変数対y2及びy4、並びに初期目標変数対y3及びy4がそれぞれ相互に排他的な関係を有すると判断される場合、それに従って、分割集合{y1,y2,y3,y4}に対して分割及び統合の再構築プロセスを行い得る。図3は、目標変数を再構築する概略フローチャートである。図3に示されるように、得られた目標部分集合は{y1,y2}、{y2,y3}、及び{y4}であり、ここで、y1及びy2はY1に統合され、y2及びy3はY2に統合され、y4はY3として使用される。
ステップ203:中間目標変数に対応する機械学習サブモデルが構築される。
特に、各中間目標変数のバイナリ機械学習サブモデルが構築され、中間目標変数の機械学習サブモデルが、標本が中間目標変数の肯定標本であるか否かの判断に使用される。
機械学習サブモデルが線形モデルであることに基づいて、機械学習サブモデルの性能を改善し、機械学習サブモデルのトレーニング中、トレーニングノイズを低減するために、各中間目標変数の機械学習サブモデルの特徴変数をスクリーニングし得、スクリーニング後の各機械学習サブモデルの特徴変数は異なり得る。単なる単方向特徴変数は、特徴変数の一貫しない方向に起因するトレーニングノイズを回避するために、各機械学習サブモデルにおいて保持される。特定のスクリーニングプロセスは、特徴変数と各初期目標変数との共分散を計算し、統合して、中間目標変数を取得することと、初期目標変数間の共分散と一貫しない方向を有する特徴変数を排除することとを含む。
例えば、特徴変数はX、X、・・・、X、・・・、及びXを含み、ここで、nは特徴変数の総数である。中間目標変数は、Y、Y、・・・、Y、・・・、及びYN’を含み、ここで、N’は中間目標変数の総数である。
統合して、中間目標変数Yを得るための初期目標変数は、ysと記される。中間目標変数Yの機械学習サブモデルでは、各特徴変数Xと初期目標変数yとの共分散は、式
Figure 0007102344000002

を使用することにより計算される。
計算された共分散特徴変数Covq1、Covq2、・・・、CovqSが同じ符号を有する場合、特徴変数Xは保持され、その他の場合、特徴変数Xは排除される。
ここで、1≦q≦n、1≦s≦Sであり、Sは、統合して、中間目標変数Yを取得するための初期目標変数yの数であり、Xqkは、過去取引データ内のk番目の取引レコード内の特徴変数Xの値であり、yskは、過去取引データ内のk番目の取引レコード内の初期目標変数yの値であり、
Figure 0007102344000003

は、過去取引データ内の特徴変数Xの平均値であり、
Figure 0007102344000004

は、過去取引データ内の初期目標変数yの平均値である。
中間目標変数Yの機械学習サブモデルMが構築され、機械学習サブモデルMの入力は、スクリーニング後の特徴変数Xであり、出力は中間目標変数Yである。
ステップ204:中間目標変数に対応する機械学習サブモデルは、機械学習サブモデルの確率を得るようにトレーニングされる。
特に、過去取引データ内の各取引レコードがトレーニング標本として使用され、機械学習サブモデルは、過去取引データにより形成されるトレーニング標本集合を使用することにより、機械学習サブモデルの確率Pを得るようにトレーニングされる。
機械学習サブモデルのよりよいトレーニングシミュレーション性能を得るために、過去取引データ内の各取引レコードは、機械学習サブモデルに対応する中間目標変数を得るために統合される初期目標変数の重みに従ってコピーし得る。コピーされた過去取引データは、トレーニング標本集合として使用される。各機械学習サブモデルのトレーニング標本集合はこのようにして構築される。
重みは、初期目標変数の重大性を示すために使用され、したがって、初期目標変数が重大であるほど、コピー動作後のトレーニング標本集合内の初期目標変数の肯定標本の数は大きく、したがって、トレーニング中のトレーニングシミュレーション性能を改善する。
例えば:
中間目標変数Yの機械学習サブモデルのトレーニング標本集合が構築されるとき、中間目標変数Yを取得するために統合される初期目標変数yの重みは、W、W、・・・、W、・・・、Wsとして予め決定される。取引レコード毎に、中間目標変数Yを取得するために統合される各初期目標変数yの重みWは、式
Figure 0007102344000005

に代入される。
トレーニング標本が初期目標変数yの肯定標本である場合、y=1であり、トレーニング標本が初期目標変数yの否定標本である場合、y=0であり、標本のコピー数CNが得られる。対応するCN回分のコピーが各トレーニング標本に対して行われて、トレーニング標本集合を構築する。
次に、中間目標変数に対応する機械学習サブモデルがそれぞれ、コピーにより得られたトレーニング標本集合を使用することによりトレーニングされ、機械学習サブモデルの確率P、P、・・・、P、・・・、及びPN’を取得する。
ステップ205:機械学習サブモデルの確率を合算して、目標確率値を取得する。
特に、機械学習サブモデルの確率P、P、・・・、P、・・・、PN’を式
Figure 0007102344000006

に代入して、機械学習モデルの確率Pを計算し取得する。
ステップ206:機械学習モデルが構築される。
特に、機械学習モデルはバイナリモデルであり、機械学習モデルの確率はPであり、入力は特徴変数Xであり、出力は、取引が不正取引であるか否かを示す目標変数である。構築された機械学習モデルは、入力特徴変数により記述される取引挙動が不正取引に属するか否かを判断するのに使用される。標本は、機械学習モデルに基づいて判断される。標本が肯定標本として判断される場合、標本により示される取引が不正取引である確率が高いことを示し、標本が否定標本であると判断される場合、標本により示される取引が不正取引である確率が低いことを示す。
実施形態3
図4は、本発明の実施形態3による機械学習モデルのモデリングデバイスの概略構造図である。図4に示されるように、モデリングデバイスは、トレーニングモジュール41、合算モジュール42、及びモデリングモジュール43を含む。
トレーニングモジュール41は、機械学習サブモデルの確率値を得るように、各中間目標変数に対応する機械学習サブモデルをトレーニングするように構成される。
機械学習サブモデルは、取引挙動を記述する特徴変数に従って、対応する中間目標変数により示される目標挙動タイプを特定するのに使用される。
合算モジュール42は、機械学習サブモデルの確率値を合算して、目標確率値を取得するように構成される。
特に、合算モジュール42は、各機械学習サブモデルの確率pを式
Figure 0007102344000007

に代入して、計算により機械学習モデルの確率Pを取得するように特に構成される。
式中、N’は機械学習サブモデルの数である。
モデリングモジュール43は、目標確率値及び特徴変数に従って、目標挙動を特定するための目標機械学習モデルを確立するように構成される。
この実施形態では、各中間目標変数に対応する機械学習サブモデルは、機械学習サブモデルの確率値を得るようにトレーニングされ、次に、機械学習サブモデルの確率値が合算され、目標挙動を特定する目標機械学習モデルが、合算により得られる目標確率値及び取引挙動を記述する特徴変数に従って確立される。不正取引を特定する応用状況では、目標挙動は不正取引であり、したがって、各機械学習サブモデルは、対応する中間目標変数により示される不正取引タイプの特定に使用され、複数の不正取引タイプのうちの少なくとも1つを特定する確率は、機械学習サブモデルの確率値を合算することにより取得することができ、確率値に基づいて構築されたモデルは、様々な不正取引タイプを特定することができ、したがって、コストを節減し、不正取引の認識効率を改善する。
実施形態4
図5は、本発明の実施形態4による機械学習モデルのモデリングデバイスの概略構造図である。図5に示されるように、図4に提供される機械学習モデルのモデリングデバイスを基準に、モデリングデバイスは、取得モジュール44を更に含む。
取得モジュール44は、初期目標変数間の互換状態又は排他状態に従って、互換性のある初期目標変数を統合して、相互に排他的な状態の中間目標変数を取得するように構成され、初期目標変数は、目標挙動の実施形態を示すのに使用される。
図6は、本発明の実施形態4による機械学習モデルの別のモデリングデバイスの概略構造図である。可能な実施形態として、取得モジュール44は、計算ユニット441、結合ユニット442、構築ユニット443、分割ユニット444、統合ユニット445、及び特定ユニット446を更に含む。
計算ユニット441は、式
Figure 0007102344000008

に従って、初期目標変数間の互換状態又は排他状態を特定するように構成される。
式中、Numijは、初期目標変数y及び初期目標変数yにより、過去取引データ内で肯定標本として同時に定義される取引レコードの数を示し、Numは、初期目標変数yにより、過去取引データ内で肯定標本として定義される取引レコードの数を示し、Numは、初期目標変数yにより、過去取引データ内で肯定標本として定義される取引レコードの数を示し、1≦i≦N、1≦j≦Nであり、Nは初期特徴変数の総数であり、2つの初期目標変数は、H=1である場合、排他的であり、2つの初期目標変数は、H=0である場合、互換である。
及びTは予め設定される閾値であり、0<T<1であり、0<T<1である。好ましくは、T=T=0.2である。
結合ユニット442は、相互に排他的な状態の初期目標変数を2つごとに結合して、初期目標変数対にするように構成される。
構築ユニット443は、初期目標変数を含む分割集合を構築するように構成される。
分割ユニット444は、初期目標変数対毎に、初期目標変数対に従って分割集合を2つの次のレベルの分割集合に順次分割するステップを実行するように構成され、次のレベルの分割集合のそれぞれは、初期目標変数対内の1つの初期目標変数、及び初期目標変数対以外の分割集合内の全ての要素を含む。
ここで、次のレベルの分割集合は、次の初期目標変数対に従って分割を行うために使用される。
統合ユニット445は、相互包含関係を有する分割集合を統合して、目標部分集合を取得するように構成される。
特定ユニット446は、同じ目標部分集合内の初期目標変数を統合して、中間目標変数として機能するように構成される。
さらに、機械学習サブモデルは線形モデルである。モデリングデバイスは、共分散計算モジュール45、スクリーニングモジュール46、計算モジュール47、コピーモジュール48、及び標本モジュール49を更に含む。
共分散計算モジュール45は、特徴変数Xと各機械学習サブモデルの各初期目標変数yとの共分散を計算するように構成される。
ここで、初期目標変数yは、機械学習サブモデルに対応する中間目標変数を取得するために、統合するのに使用される。
スクリーニングモジュール46は、特徴変数Xと各初期目標変数yとの共分散の符号が異なる場合、特徴変数Xを排除し、その他の場合、特徴変数Xを保持するように構成される。
計算モジュール47は、取引レコード毎に、初期目標変数y及び初期目標変数yの重みWを式
Figure 0007102344000009

に代入して、取引レコードのコピー数CNを取得するように構成される。
ここで、取引レコードが初期目標変数yの肯定標本である場合、y=1であり、その他の場合、y=0であり、Sは初期目標変数yの数である。
コピーモジュール48は、各初期目標変数yの重みWにより決まる取引レコードのコピー数に従って、各機械学習サブモデルのために過去取引データ内の取引レコードをコピーするように構成され、初期目標変数yは、機械学習サブモデルに対応する中間目標変数を取得するために、統合するのに使用される。
標本モジュール49は、コピーされた過去取引データを機械学習サブモデルのトレーニング標本として使用するように構成される。
この実施形態において提供されるデバイスは、図1及び図2に示される方法を実行するように構成される。この実施形態において繰り返されない様々な機能モジュールの説明については、上記実施形態を参照のこと。
この実施形態では、各中間目標変数に対応する機械学習サブモデルは、機械学習サブモデルの確率値を得るようにトレーニングされ、次に、機械学習サブモデルの確率値を合算し、目標挙動を特定する目標機械学習モデルが、合算により得られる目標確率値及び取引挙動を記述する特徴変数に従って確立される。不正取引を特定する応用状況では、目標挙動は不正取引であり、したがって、各機械学習サブモデルは、対応する中間目標変数により示される不正取引タイプの特定に使用され、複数の不正取引タイプのうちの少なくとも1つを特定する確率は、機械学習サブモデルの確率値を合算することにより取得することができ、確率値に基づいて構築されたモデルは、様々な不正取引タイプを特定することができ、したがって、コストを節減し、不正取引の認識効率を改善する。
上記方法実施形態を実施するステップの全て又は一部が、関連するハードウェアに命令するプログラムを通して達成し得ることを当業者は理解し得る。プログラムは、コンピュータ可読記憶媒体に記憶し得る。プログラムは、実行されると、上記方法実施形態のステップを実行する。記憶媒体は、ROM、RAM、磁気ディスク、及び光ディスク等のプログラムコードを記憶することができる様々な媒体を含む。
最後に、上記実施形態が単に、本発明の技術的解決策を示すために使用され、本発明を限定する意図がないことに留意されたい。本発明について上記実施形態を参照して詳細に説明したが、上記実施形態において記録された技術的解決策を変更することもでき、又は同等の置換を実施形態における幾つか若しくは全ての技術的特徴に対して行い得ることを当業者は理解されたい。これらの変更又は置換は、本発明の実施形態における技術的解決策の範囲から逸脱する対応する技術的解決策の本質をなさない。

Claims (24)

  1. 機械学習モデルのモデリング方法であって、
    初期目標変数間の互換状態又は相互に排他的な状態に従って、互換性のある初期目標変数を統合して、中間目標変数を取得することであって、前記中間目標変数は、相互に排他的な状態にあり、前記初期目標変数のうちの少なくとも1つは、目標挙動の実施形態を示すのに使用される、前記中間目標変数を取得することと、
    複数の機械学習サブモデルのそれぞれの確率値を得るように、前記複数の機械学習サブモデルをトレーニングすることであって、 前記複数の機械学習サブモデルのそれぞれは、前記中間目標変数の1つに対応することと、
    前記複数の機械学習サブモデルをトレーニングすることから取得された確率値に基づいて、目標確率値を取得することと、
    前記目標確率値及び特徴変数に従って、前記目標挙動を特定する目標機械学習モデルを構築することと
    を含む、方法。
  2. 前記互換性のある初期目標変数を統合することは、
    相互に排他的な状態の2つの初期目標変数ごとに初期目標変数対を構築することと、
    前記初期目標変数を含む分割集合を構築することと、
    初期目標変数対毎に、前記初期目標変数対に従って分割集合を2つの次のレベルの分割集合に分割することであって、前記次のレベルの分割集合のそれぞれは、前記初期目標変数対中の1つの初期目標変数、及び前記分割集合内の1つ以上の要素を含み、前記次のレベルの分割集合は、次の初期目標変数対に従って分割を行うために使用される、分割することと、
    相互包含関係を有する分割集合を統合して、目標部分集合を取得することと、
    前記目標部分集合内の初期目標変数を統合して、前記中間目標変数のうちの少なくとも1つを取得することと
    を含む、請求項1に記載のモデリング方法。
  3. 前記互換性のある初期目標変数を統合することの前に、式
    Figure 0007102344000010

    に従って前記初期目標変数間の互換状態又は相互に排他的な状態を特定すること
    を更に含み、式中、Numijは、初期目標変数y及び初期目標変数yの両方により、過去取引データ内で肯定標本として定義される取引レコードの数であり、Numiは、初期目標変数yにより、前記過去取引データ内で肯定標本として定義される取引レコードの数であり、Numは、初期目標変数yにより、前記過去取引データ内で肯定標本として定義される取引レコードの数であり、1≦i≦N、1≦j≦Nであり、Nは初期特徴変数の総数であり、前記2つの初期目標変数は、H=1である場合、排他的であり、前記2つの初期目標変数は、H=0である場合、互換であり、T及びTは予め設定される閾値であり、0<T<1であり、かつ0<T<1である、請求項1に記載のモデリング方法。
  4. 前記複数の機械学習サブモデルのうちの少なくとも1つは線形モデルであり、
    前記複数の機械学習サブモデルをトレーニングすることの前に、前記複数の機械学習サブモデルのうちの前記少なくとも1つの特徴変数Xと各初期目標変数y との共分散を特定することであって、前記初期目標変数yは、前記中間目標変数を取得するのに使用される、特定することと、
    前記特徴変数Xと各初期目標変数yとの前記共分散の符号が同一ではない場合、前記特徴変数Xを排除し、前記特徴変数Xと各初期目標変数yとの前記共分散の符号が同一である場合、前記特徴変数Xを保持することと
    を更に含む、請求項1に記載のモデリング方法。
  5. 前記複数の機械学習サブモデルをトレーニングすることの前に、各初期目標変数yの重みWにより決まる取引レコードのコピー数に従って、各機械学習サブモデルのために前記過去取引データ内の取引レコードをコピーすることであって、前記初期目標変数yは、前記中間目標変数を取得するのに使用される、コピーすることと、
    前記機械学習サブモデルのトレーニング標本として、前記コピーされた過去取引データを使用することと
    を更に含む、請求項3に記載のモデリング方法。
  6. 前記取引レコードをコピーすることの前に、式
    Figure 0007102344000011

    に基づいて、前記取引レコードのコピー数を取得することであって、式中、CNはコピー数であり、Sは初期目標変数yの数であり、前記取引レコードが初期目標変数yの肯定標本である場合、y=1であり、前記取引レコードが初期目標変数yの肯定標本ではない場合、y=0である、取得すること
    を更に含む、請求項5に記載のモデリング方法。
  7. 前記目標確率値を取得することは、

    Figure 0007102344000012

    に基づいて、前記機械学習モデルの確率Pを特定することであって、式中、pは対応する機械学習サブモデルの前記確率値であり、N’は前記機械学習サブモデルの数である、特定すること
    を含む、請求項1に記載のモデリング方法。
  8. 前記目標挙動は不正取引を含み、前記複数の機械学習サブモデルのそれぞれは、取引挙動を記述する前記特徴変数のうちの少なくとも1つに従って、対応する中間目標変数により示される目標挙動タイプを特定する、請求項1に記載のモデリング方法。
  9. 機械学習モデルのモデリングデバイスであって、
    初期目標変数間の互換状態又は相互に排他的な状態に従って、互換性のある初期目標変数を統合して、中間目標変数を取得するように構成された取得モジュールであって、前記中間目標変数は、相互に排他的な状態にあり、前記初期目標変数のうちの少なくとも1つは、目標挙動の実施形態を示すのに使用される、取得モジュールと、
    複数の機械学習サブモデルのそれぞれの確率値を得るように、前記複数の機械学習サブモデルをトレーニングするように構成されたトレーニングモジュールであって、 前記複数の機械学習サブモデルのそれぞれは、前記中間目標変数の1つに対応する、トレーニングモジュールと、
    前記トレーニングモジュールによって取得された前記複数の機械学習サブモデルの前記確率値に基づいて、目標確率値を取得するように構成された合算モジュールと、
    前記目標確率値及び特徴変数に従って、前記目標挙動を特定する目標機械学習モデルを構築するように構成されたモデリングモジュールと
    を含む、モデリングデバイス。
  10. 前記取得モジュールは、
    相互に排他的な状態の2つの初期目標変数ごとに初期目標変数対を構築するように構成された結合ユニットと、
    前記初期目標変数を含む分割集合を構築するように構成された構築ユニットと、
    初期目標変数対毎に、前記初期目標変数対に従って分割集合を2つの次のレベルの分割集合に分割するように構成された分割ユニットであって、前記次のレベルの分割集合のそれぞれは、前記初期目標変数対中の1つの初期目標変数、及び前記分割集合内の1つ以上の要素を含み、前記次のレベルの分割集合は、次の初期目標変数対に従って分割を行うために使用される、分割ユニットと、
    相互包含関係を有する分割集合を統合して、目標部分集合を取得するように構成された統合ユニットと、
    前記目標部分集合内の初期目標変数を統合して、前記中間目標変数のうちの少なくとも1つを取得するように構成された特定ユニットと
    を含む、請求項9に記載のモデリングデバイス。
  11. 前記取得モジュールは、

    Figure 0007102344000013

    に従って前記初期目標変数間の互換状態又は相互に排他的な状態を特定するように構成された取得ユニット
    を更に含み、式中、Numijは、初期目標変数y及び初期目標変数yの両方により、過去取引データ内で肯定標本として定義される取引レコードの数であり、Numは、初期目標変数yにより、前記過去取引データ内で肯定標本として定義される取引レコードの数であり、Numは、初期目標変数yにより、前記過去取引データ内で肯定標本として定義される取引レコードの数であり、1≦i≦N、1≦j≦Nであり、Nは初期特徴変数の総数であり、前記2つの初期目標変数は、H=1である場合、排他的であり、前記2つの初期目標変数は、H=0である場合、互換であり、T及びTは予め設定される閾値であり、0<T<1であり、0<T<1である、請求項9に記載のモデリングデバイス。
  12. 前記複数の機械学習サブモデルのうちの少なくとも1つは線形モデルであり、前記デバイスは、
    前記複数の機械学習サブモデルのうちの前記少なくとも1つの特徴変数Xと各初期目標変数yとの共分散を特定するように構成された共分散計算モジュールであって、前記初期目標変数yは、前記中間目標変数を取得するのに使用される、共分散計算モジュールと、
    前記特徴変数Xと各初期目標変数yとの前記共分散の符号が同一ではない場合、前記特徴変数Xを排除し、前記特徴変数Xと各初期目標変数yとの前記共分散の符号が同一である場合、前記特徴変数Xを保持するように構成されたスクリーニングモジュールと
    を更に含む、請求項9に記載のモデリングデバイス。
  13. 各初期目標変数yの重みWにより決まる取引レコードのコピー数に従って、各機械学習サブモデルのために前記過去取引データ内の取引レコードをコピーするように構成されたコピーモジュールであって、前記初期目標変数yは、前記中間目標変数を取得するのに使用される、コピーモジュールと、
    前記機械学習サブモデルのトレーニング標本として、前記コピーされた過去取引データを使用するように構成された標本モジュールと
    を更に含む、請求項11に記載のモデリングデバイス。

  14. Figure 0007102344000014

    に基づいて、前記取引レコードのコピー数を取得するように構成された特定モジュールであって、式中、CNはコピー数であり、Sは初期目標変数yの数であり、前記取引レコードが前記初期目標変数yの肯定標本である場合、y=1であり、前記取引レコードが前記初期目標変数yの肯定標本ではない場合、y=0である、特定モジュール
    を更に含む、請求項13に記載のモデリングデバイス。
  15. 前記合算モジュールは、式
    Figure 0007102344000015

    に基づいて、前記機械学習モデルの確率Pを特定するように構成され、式中、pは対応する機械学習サブモデルの前記確率値であり、N’は前記機械学習サブモデルの数である、請求項9に記載のモデリングデバイス。
  16. 前記目標挙動は不正取引を含み、前記複数の機械学習サブモデルのそれぞれは、取引挙動を記述する前記特徴変数のうちの少なくとも1つに従って、対応する中間目標変数により示される目標挙動タイプを特定する、請求項9に記載のモデリングデバイス。
  17. 電子デバイスの1つ以上のプロセッサによって実行可能な命令の集合を記憶して前記電子デバイスに機械学習モデルのモデリング方法を実行させる非一時的コンピュータ可読記憶媒体であって、前記方法は、
    初期目標変数間の互換状態又は相互に排他的な状態に従って、互換性のある初期目標変数を統合して、中間目標変数を取得することであって、前記中間目標変数は、相互に排他的な状態にあり、前記初期目標変数のうちの少なくとも1つは、目標挙動の実施形態を示すのに使用される、前記中間目標変数を取得することと、
    複数の機械学習サブモデルのそれぞれの確率値を得るように、前記複数の機械学習サブモデルをトレーニングすることであって、 前記複数の機械学習サブモデルのそれぞれは、前記中間目標変数の1つに対応することと、
    前記複数の機械学習サブモデルをトレーニングすることから取得された確率値に基づいて、目標確率値を取得することと、
    前記目標確率値及び特徴変数に従って、前記目標挙動を特定する目標機械学習モデルを構築することと
    を含む、非一時的コンピュータ可読記憶媒体。
  18. 前記電子デバイスの前記1つ以上のプロセッサによって実行可能な前記命令の集合は、前記互換性のある初期目標変数を統合するために、前記電子デバイスに、
    相互に排他的な状態の2つの初期目標変数ごとに初期目標変数対を構築することと、
    前記初期目標変数を含む分割集合を構築することと、
    初期目標変数対毎に、前記初期目標変数対に従って分割集合を2つの次のレベルの分割集合に分割することであって、前記次のレベルの分割集合のそれぞれは、前記初期目標変数対中の1つの初期目標変数、及び前記分割集合内の1つ以上の要素を含み、前記次のレベルの分割集合は、次の初期目標変数対に従って分割を行うために使用される、分割することと、
    相互包含関係を有する分割集合を統合して、目標部分集合を取得することと、
    前記目標部分集合内の初期目標変数を統合して、前記中間目標変数のうちの少なくとも1つを取得することと
    を実行させる、請求項17に記載の非一時的コンピュータ可読記憶媒体。
  19. 前記電子デバイスの前記1つ以上のプロセッサによって実行可能な前記命令の集合は、前記電子デバイスに、
    前記互換性のある初期目標変数を統合することの前に、式
    Figure 0007102344000016

    に従って前記初期目標変数間の互換状態又は相互に排他的な状態を特定すること
    を更に実行させ、式中、Numijは、初期目標変数y及び初期目標変数yの両方により、過去取引データ内で肯定標本として定義される取引レコードの数であり、Numiは、初期目標変数yにより、前記過去取引データ内で肯定標本として定義される取引レコードの数であり、Numは、初期目標変数yにより、前記過去取引データ内で肯定標本として定義される取引レコードの数であり、1≦i≦N、1≦j≦Nであり、Nは初期特徴変数の総数であり、前記2つの初期目標変数は、H=1である場合、排他的であり、前記2つの初期目標変数は、H=0である場合、互換であり、T及びTは予め設定される閾値であり、0<T<1であり、かつ0<T<1である、請求項17に記載の非一時的コンピュータ可読記憶媒体。
  20. 前記複数の機械学習サブモデルのうちの少なくとも1つは線形モデルであり、前記電子デバイスの前記1つ以上のプロセッサによって実行可能な前記命令の集合は、前記電子デバイスに、
    前記複数の機械学習サブモデルをトレーニングすることの前に、前記複数の機械学習サブモデルのうちの前記少なくとも1つの特徴変数Xと各初期目標変数yとの共分散を特定することであって、前記初期目標変数yは、前記中間目標変数を取得するのに使用される、特定することと、
    前記特徴変数Xと各初期目標変数yとの前記共分散の符号が同一ではない場合、前記特徴変数Xを排除し、前記特徴変数Xと各初期目標変数yとの前記共分散の符号が同一である場合、前記特徴変数Xを保持することと
    を更に実行させる、請求項17に記載の非一時的コンピュータ可読記憶媒体。
  21. 前記電子デバイスの前記1つ以上のプロセッサによって実行可能な前記命令の集合は、前記電子デバイスに、
    前記複数の機械学習サブモデルをトレーニングすることの前に、各初期目標変数yの重みWにより決まる取引レコードのコピー数に従って、各機械学習サブモデルのために前記過去取引データ内の取引レコードをコピーすることであって、前記初期目標変数yは、前記中間目標変数を取得するのに使用される、コピーすることと、
    前記機械学習サブモデルのトレーニング標本として、前記コピーされた過去取引データを使用することと
    を更に実行させる、請求項19に記載の非一時的コンピュータ可読記憶媒体。
  22. 前記電子デバイスの前記1つ以上のプロセッサによって実行可能な前記命令の集合は、前記電子デバイスに、
    前記取引レコードをコピーすることの前に、式
    Figure 0007102344000017

    に基づいて、前記取引レコードのコピー数を取得することであって、式中、CNはコピー数であり、Sは初期目標変数yの数であり、前記取引レコードが初期目標変数yの肯定標本である場合、y=1であり、前記取引レコードが初期目標変数yの肯定標本ではない場合、y=0である、取得すること
    を更に実行させる、請求項21に記載の非一時的コンピュータ可読記憶媒体。
  23. 前記電子デバイスの前記1つ以上のプロセッサによって実行可能な前記命令の集合は、前記目標確率値を取得するために、前記電子デバイスに、

    Figure 0007102344000018

    に基づいて、前記機械学習モデルの確率Pを特定することであって、式中、pは対応する機械学習サブモデルの前記確率値であり、N’は前記機械学習サブモデルの数である、
    特定すること
    を実行させる、請求項17に記載の非一時的コンピュータ可読記憶媒体。
  24. 前記目標挙動は不正取引を含み、前記複数の機械学習サブモデルのそれぞれは、取引挙動を記述する前記特徴変数のうちの少なくとも1つに従って、対応する中間目標変数により示される目標挙動タイプを特定する、請求項17に記載の非一時的コンピュータ可読記憶媒体。
JP2018542277A 2016-02-19 2017-02-07 機械学習モデルのモデリング方法及びデバイス Active JP7102344B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201610094664.8A CN107103171B (zh) 2016-02-19 2016-02-19 机器学习模型的建模方法及装置
CN201610094664.8 2016-02-19
PCT/CN2017/073023 WO2017140222A1 (zh) 2016-02-19 2017-02-07 机器学习模型的建模方法及装置

Publications (3)

Publication Number Publication Date
JP2019511037A JP2019511037A (ja) 2019-04-18
JP2019511037A5 JP2019511037A5 (ja) 2020-03-19
JP7102344B2 true JP7102344B2 (ja) 2022-07-19

Family

ID=59624727

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018542277A Active JP7102344B2 (ja) 2016-02-19 2017-02-07 機械学習モデルのモデリング方法及びデバイス

Country Status (5)

Country Link
US (1) US20180374098A1 (ja)
JP (1) JP7102344B2 (ja)
CN (1) CN107103171B (ja)
TW (1) TWI789345B (ja)
WO (1) WO2017140222A1 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180052631A (ko) 2015-09-23 2018-05-18 얀센 파마슈티카 엔.브이. 비-헤테로아릴 치환된 1,4-벤조디아제핀 및 암의 치료를 위한 이의 용도
BR112018005637B1 (pt) 2015-09-23 2023-11-28 Janssen Pharmaceutica Nv Compostos derivados de quinoxalina, quinolina e quinazolinona,composições farmacêuticas que os compreende, e uso dos referidos compostos
CN107103171B (zh) * 2016-02-19 2020-09-25 阿里巴巴集团控股有限公司 机器学习模型的建模方法及装置
CN107423883B (zh) * 2017-06-15 2020-04-07 创新先进技术有限公司 待处理业务的风险识别方法及装置、电子设备
CN109426701B (zh) * 2017-08-30 2022-04-05 西门子(中国)有限公司 数据模型的运行方法、运行系统和存储介质
CN108228706A (zh) * 2017-11-23 2018-06-29 中国银联股份有限公司 用于识别异常交易社团的方法和装置
CN109165249B (zh) * 2018-08-07 2020-08-04 阿里巴巴集团控股有限公司 数据处理模型构建方法、装置、服务器和用户端
US11567964B2 (en) * 2018-08-31 2023-01-31 Eligible, Inc. Feature selection for artificial intelligence in healthcare management
CN109325193B (zh) * 2018-10-16 2021-02-26 杭州安恒信息技术股份有限公司 基于机器学习的waf正常流量建模方法以及装置
CN109934709A (zh) 2018-11-05 2019-06-25 阿里巴巴集团控股有限公司 基于区块链的数据处理方法、装置和服务器
US20200159690A1 (en) * 2018-11-16 2020-05-21 Sap Se Applying scoring systems using an auto-machine learning classification approach
US11593811B2 (en) * 2019-02-05 2023-02-28 International Business Machines Corporation Fraud detection based on community change analysis using a machine learning model
US11574360B2 (en) * 2019-02-05 2023-02-07 International Business Machines Corporation Fraud detection based on community change analysis
JP2020140540A (ja) * 2019-02-28 2020-09-03 富士通株式会社 判定プログラム、判定方法および情報処理装置
CN110263938B (zh) * 2019-06-19 2021-07-23 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN110991650A (zh) * 2019-11-25 2020-04-10 第四范式(北京)技术有限公司 训练养卡识别模型、识别养卡行为的方法及装置
CN111080360B (zh) * 2019-12-13 2023-12-01 中诚信征信有限公司 行为预测方法、模型训练方法、装置、服务器及存储介质
CN111860865B (zh) * 2020-07-23 2022-07-19 中国工商银行股份有限公司 模型构建和分析的方法、装置、电子设备和介质
CN112465626B (zh) * 2020-11-24 2023-08-29 平安科技(深圳)有限公司 基于客户端分类聚合的联合风险评估方法及相关设备
CN113705824A (zh) * 2021-01-23 2021-11-26 深圳市玄羽科技有限公司 一种用于构建机器学习建模过程的系统
CN113177597A (zh) * 2021-04-30 2021-07-27 平安国际融资租赁有限公司 模型训练数据确定方法、检测模型训练方法、装置及设备
WO2022249266A1 (ja) * 2021-05-25 2022-12-01 日本電気株式会社 不正検知システム、不正検知方法およびプログラム記録媒体

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001256212A (ja) 2000-03-09 2001-09-21 Fuji Electric Co Ltd ニューラルネットワークの最適化学習方法
JP2004078959A (ja) 2002-08-13 2004-03-11 Samsung Electronics Co Ltd 人工神経網を利用した顔認識法及びその装置
JP2004265190A (ja) 2003-03-03 2004-09-24 Japan Energy Electronic Materials Inc 階層型ニューラルネットワークの学習方法、そのプログラム及びそのプログラムを記録した記録媒体
JP2009122851A (ja) 2007-11-13 2009-06-04 Internatl Business Mach Corp <Ibm> データを分類する技術
JP2009271885A (ja) 2008-05-12 2009-11-19 Panasonic Corp 年齢推定方法及び年齢推定装置
JP2013156691A (ja) 2012-01-26 2013-08-15 Nippon Telegr & Teleph Corp <Ntt> 購買予測装置、方法、及びプログラム

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102467726B (zh) * 2010-11-04 2015-07-29 阿里巴巴集团控股有限公司 一种基于网上交易平台的数据处理方法和装置
US20160223554A1 (en) * 2011-08-05 2016-08-04 Nodality, Inc. Methods for diagnosis, prognosis and methods of treatment
US9916538B2 (en) * 2012-09-15 2018-03-13 Z Advanced Computing, Inc. Method and system for feature detection
CN103106365B (zh) * 2013-01-25 2015-11-25 中国科学院软件研究所 一种移动终端上的恶意应用软件的检测方法
CN103064987B (zh) * 2013-01-31 2016-09-21 五八同城信息技术有限公司 一种虚假交易信息识别方法
US20140279379A1 (en) * 2013-03-14 2014-09-18 Rami Mahdi First party fraud detection system
US20140279745A1 (en) * 2013-03-14 2014-09-18 Sm4rt Predictive Systems Classification based on prediction of accuracy of multiple data models
CN104679777B (zh) * 2013-12-02 2018-05-18 中国银联股份有限公司 一种用于检测欺诈交易的方法及系统
US20150363791A1 (en) * 2014-01-10 2015-12-17 Hybrid Application Security Ltd. Business action based fraud detection system and method
WO2015130928A1 (en) * 2014-02-26 2015-09-03 Nancy Packes, Inc. Real estate evaluating platform methods, apparatuses, and media
CN104933053A (zh) * 2014-03-18 2015-09-23 中国银联股份有限公司 非平衡类数据的分类
CN103914064B (zh) * 2014-04-01 2016-06-08 浙江大学 基于多分类器和d-s证据融合的工业过程故障诊断方法
CN104636912A (zh) * 2015-02-13 2015-05-20 银联智惠信息服务(上海)有限公司 信用卡套现识别方法和装置
CN104834918A (zh) * 2015-05-20 2015-08-12 中国科学院上海高等研究院 一种基于高斯过程分类器的人体行为识别方法
CN105022845A (zh) * 2015-08-26 2015-11-04 苏州大学张家港工业技术研究院 一种基于特征子空间的新闻分类方法及系统
US20170147941A1 (en) * 2015-11-23 2017-05-25 Alexander Bauer Subspace projection of multi-dimensional unsupervised machine learning models
CN107103171B (zh) * 2016-02-19 2020-09-25 阿里巴巴集团控股有限公司 机器学习模型的建模方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001256212A (ja) 2000-03-09 2001-09-21 Fuji Electric Co Ltd ニューラルネットワークの最適化学習方法
JP2004078959A (ja) 2002-08-13 2004-03-11 Samsung Electronics Co Ltd 人工神経網を利用した顔認識法及びその装置
JP2004265190A (ja) 2003-03-03 2004-09-24 Japan Energy Electronic Materials Inc 階層型ニューラルネットワークの学習方法、そのプログラム及びそのプログラムを記録した記録媒体
JP2009122851A (ja) 2007-11-13 2009-06-04 Internatl Business Mach Corp <Ibm> データを分類する技術
JP2009271885A (ja) 2008-05-12 2009-11-19 Panasonic Corp 年齢推定方法及び年齢推定装置
JP2013156691A (ja) 2012-01-26 2013-08-15 Nippon Telegr & Teleph Corp <Ntt> 購買予測装置、方法、及びプログラム

Also Published As

Publication number Publication date
US20180374098A1 (en) 2018-12-27
CN107103171A (zh) 2017-08-29
WO2017140222A1 (zh) 2017-08-24
JP2019511037A (ja) 2019-04-18
CN107103171B (zh) 2020-09-25
TW201734844A (zh) 2017-10-01
TWI789345B (zh) 2023-01-11

Similar Documents

Publication Publication Date Title
JP7102344B2 (ja) 機械学習モデルのモデリング方法及びデバイス
CN106709800B (zh) 一种基于特征匹配网络的社团划分方法和装置
US8341149B2 (en) Ranking with learned rules
CN105809448B (zh) 账户交易的聚类方法及其系统
CN112927072B (zh) 一种基于区块链的反洗钱仲裁方法、系统及相关装置
CA2791597A1 (en) Biometric training and matching engine
US20220217054A1 (en) Method for directed network detection, computer-readable storage medium, and related device
CN110998608A (zh) 用于各种计算机应用程序的机器学习系统
CN110084609B (zh) 一种基于表征学习的交易欺诈行为深度检测方法
CN111008898B (zh) 评估模型解释工具的方法和装置
CN111221960A (zh) 文本检测方法、相似度计算方法、模型训练方法及装置
CN113052577A (zh) 一种区块链数字货币虚拟地址的类别推测方法及系统
CN106874286B (zh) 一种筛选用户特征的方法及装置
CN109325140B (zh) 从图像中提取哈希码的方法、装置及图像检索方法、装置
CN114581086A (zh) 基于动态时序网络的钓鱼账户检测方法及系统
CN114240633A (zh) 信贷风险评估方法、系统、终端设备及存储介质
CN112766320A (zh) 一种分类模型训练方法及计算机设备
CN110033031B (zh) 群组检测方法、装置、计算设备和机器可读存储介质
CN113554099A (zh) 一种识别异常商户的方法及装置
CN111784182A (zh) 资产信息处理方法和装置
CN111369339A (zh) 一种基于过采样改进svdd的银行客户交易行为异常识别方法
CN110990164A (zh) 账户检测方法和装置、账户检测模型的训练方法和装置
Balne et al. Credit card fraud detection using autoencoders
Coello et al. Performance Analysis of Credit Card Fraud Analysis and Detection Machine Learning Algorithms
Pujun et al. Demystifying the workings of Lending Club

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200204

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200204

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210310

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210405

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210906

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220127

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20220425

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220527

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220607

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220706

R150 Certificate of patent or registration of utility model

Ref document number: 7102344

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150