JP2010508587A - 市場データにおけるアノマリーを検出するシステム及び方法 - Google Patents

市場データにおけるアノマリーを検出するシステム及び方法 Download PDF

Info

Publication number
JP2010508587A
JP2010508587A JP2009534864A JP2009534864A JP2010508587A JP 2010508587 A JP2010508587 A JP 2010508587A JP 2009534864 A JP2009534864 A JP 2009534864A JP 2009534864 A JP2009534864 A JP 2009534864A JP 2010508587 A JP2010508587 A JP 2010508587A
Authority
JP
Japan
Prior art keywords
data
statistics
market data
market
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009534864A
Other languages
English (en)
Inventor
ヘルナンデス ロバート
キャンベル ジーン
スティパ シンシア アン
Original Assignee
アイエムエス ソフトウェア サービシズ リミテッド
スティパ シンシア アン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アイエムエス ソフトウェア サービシズ リミテッド, スティパ シンシア アン filed Critical アイエムエス ソフトウェア サービシズ リミテッド
Publication of JP2010508587A publication Critical patent/JP2010508587A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0204Market segmentation

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

データ例外を特定するシステム及び方法を開示する。幾つかの実施例において、データは所定の期間に亘って監視され、当該データに関連する統計量が生成され、当該統計量が閾値を越えるか否かが判定される。幾つかの実施例において、監視ステップは、所定の期間に亘って、製品のコスト、又は製品の売上高を監視するステップを含む。幾つかの実施例において、データにおける異常値、データにおける方向傾向又はデータのばらつきに関する統計量を生成することができる。

Description

関連出願
本願は、2006年10月25日に出願された“Client View Exception and Analysis Tool and Methodology”と題する米国仮出願第60/854,241に対する優先権を主張する。
本出願は、市場データにおけるアノマリーを検出するシステム及び方法に関するものである。
市場データは、複数の異なるタイプのデータを使用して測定することができる。例えば、市場データは、製品単位当たりの平均コストにより、又は全売上高により、又は調合薬の場合には、既定の製品に対して与えられた処方箋の総数により測定できる。これらは、所定の製品の市場データを測定できる多くの方法の中のごく僅かの例である。しかし、全てのタイプの市場データが実際の市場の実態を正確に反映するわけではない。例えば、調合薬の場合に、発行された処方箋の総数は、その薬が投与される方法のために、その薬に対する需要の増減を正確には反映できない。この状況は、提供者及び/又は購入者が市場データに基づいて、購入する特定の薬の量についてビジネス決定をする場合に、深刻な問題を提起する可能性がある。従って、市場データにおけるアノマリー、即ち、異なるタイプの市場データが同じように正確に市場の実態を反映しない状況、を検出する方法に対するニーズが存在する。
市場データにおけるアノマリーを検出するシステム及び方法がここに開示されている。
幾つかの実施例において、市場データの1つ以上の組におけるアノマリーを検出する方法が開示され、当該検出方法は、所定の期間に亘って前記1つ以上の組の市場データを監視するステップと、前記1つ以上の組の市場データに関する1つ以上の統計量を生成するステップと、前記1つ以上の統計量が1つ以上の対応する閾値を越えるか否かを判定して1つ以上の統計的例外を生成するステップと、前記1つ以上の統計的例外に優先順位を付けるステップとを含む。
幾つかの実施例において、前記監視するステップは、前記所定の期間に亘って所定の製品のコストを監視するステップを含む。幾つかの実施例において、前記監視するステップは、前記所定の期間に亘って所定の製品の売上高を監視するステップを含む。幾つかの実施例において、前記1つ以上の統計量を生成するステップは、データ中の異常値に関する1つ以上の統計量を生成するステップを含む。幾つかの実施例において、前記1つ以上の統計量を生成するステップは、データにおける方向傾向に関する1つ以上の統計量を生成するステップを含む。幾つかの実施例において、前記1つ以上の統計量を生成するステップは、データのばらつきに関する統計量を生成するステップを含む。
幾つかの実施例において、1つ以上の組の市場データにおけるアノマリーを特定するシステムが開示され、このシステムは、1つ以上の組の市場データに関するデータを記憶するデータ記憶装置と、所定の期間に亘って1つ以上の組の市場データを監視し、前記1つ以上の組の市場データに関する1つ以上の統計量を生成し、前記1つ以上の統計量が1つ以上の対応する閾値を越えるか否かを判定して1つ以上の統計的例外を生成し、前記1つ以上の統計的例外の優先順位を付けるように構成され設定されたプロセッサとを具える。
幾つかの実施例において、前記プロセッサは、所定の期間に亘って所定の製品のコストを監視するように構成設定されている。幾つかの実施例において、前記プロセッサは、所定の期間に亘って所定の製品の売上高を監視するように構成設定されている。幾つかの実施例において、前記プロセッサは、前記データにおける異常値に関する1つ以上の統計量を生成するように構成設定されている。幾つかの実施例において、前記プロセッサは前記データにおける動向に関する1つ以上の統計量を生成するように構成設定されている。幾つかの実施例において、前記プロセッサは、前記データのばらつきに関する統計量を生成するように構成設定されている。幾つかの実施例において、前記プロセッサは1つ以上の通知を提供するように構成設定されている。
添付の図面は、本明細書に組み込まれ本明細書の一部を構成し、本発明の幾つかの実施例を示している。
図1は、本発明の一実施例による概略図を示している。 図2は、本発明の一実施例によるフローチャートを示している。 図3は、本発明の一実施例による依存関係を示すフローチャートである。 図4は、本発明の一実施例による構成要素階層モデルを示している。 図5は、本発明の一実施例によるフローチャートを示している。 図6は、本発明の一実施例による統計分析のために使用されるグラフを示している。 図7は、本発明の一実施例による統計分析のために使用されるグラフを示している。
以下の実施例は、全て薬剤データの使用に関して説明されている。しかし、本発明により如何なるタイプのデータも使用できることが想定されている。
図1は、本発明による市場データにおけるアノマリーを検出するシステム100の代表的な実施例である。システム100は、データを収集して保存するためのサーバ101を含む。代表的な実施例において、サーバ101は、UNIX(登録商標)サーバとすることができる。サーバ101上にデータベースシステム102が存在し、代表的な実施例においては、これは市場データを収集して記憶するために、汎用データ収集(UDA)及び汎用データベース(UDB)を含むことができる。データベースシステム102は、プロセス103を実行してデータベースシステム102からデータを抽出し変換した抽出変換ファイルセット104を生成する。代表的な実施例において、プロセス103は製品例外及び分析ツール(PEAT)の使用からなり、データベースからデータを抽出し、該データを1つ以上の兆候、例えば、所定の期間に亘って所定の供給者により処方された所定の薬の全ての処方箋を集計することのよって変換し、該データをサーバのデータ転送可能部分にロードする(このプロセスは抽出、変換及びローディング又はETLという)。サーバ101は、第2のサーバ105に接続されており、代表的な実施例において、それはNT(登録商標)サーバである。代表的な実施例において、サーバ101は、(図1において矢印Fにより示されているように)ファイル転送プロトコル(FTP)により抽出されたファイルセット104をサーバ105に転送する。
サーバ105上で、サーバ101から受信されたデータファイル106は、プロセス107に通され、代表的な実施例においては、このプロセスはデータをデータベース108にロードするために、SQL(Structure Query Language)ローダプロセスとすることができる。代表的な実施例において、データベース108は、PEATデータマート、即ち、SQLサーバ上で動作する製品例外及び分析ツール(PEAT)を使用して抽出され、変換されロードされた(ETL)データを含むデータベースとすることができ、13ヶ月周期のデータを含む。PEATデータマート108は、プロセッサシステム113に直接接続され、代表的な実施例においては、ビジネス目的のために様々なデータタイプを分析するためのプログラムを実行するコンピュータシステムである。代表的な実施例において、このプログラムは、統計分析ソフトウェアプログラムを用いて生成された特注設計のビジネス・インテリジェンス・ツール・スイート、例えば、SAS/QC,SAS/Base,及びSAS/ODBCソフトウェアモジュールを使用するSAS(登録商標)プログラムとすることができる。更なるデータ分析のために、監査チーム115は、コンピュータシステム113にアクセスすることもできる。PEATデータマート108に含まれるデータは、他のプロセス109に通すこともでき、このプロセスは、代表的な実施例においては、データを1つ以上の索引に関して要約する、例えば、特定の供給者により処方された全処方箋を集計し、データをデータベース110にロードする、SQLプロセスとすることができる。代表的な実施例において、データベース110は、要約データマート、即ち、SQLサーバ上で動作する、1つ以上の索引に関して要約されたデータを含むデータベースとすることができる。要約データマート110は、更に、データベース112に接続され、このデータベースは、代表的な実施例においては、スコアリングデータマート、即ち、SQLサーバ上で動作する、統計的な例外に対して分析されたデータ、即ち、“スコア”データを含むデータベースである。要約データマート110は、処理111を介してスコアリングデータマート112に接続され、これは、代表的な実施例において、スコアリングエンジン、即ち、様々なデータに対して統計量、又は“スコア”を生成し、スコアが対応する閾値を越えるか否かを判定し、越える場合には統計的例外を形成してその例外の順位付けをするプロセス又はプログラムである。代表的な実施例において、スコアリングエンジン111は、コンピュータ113上で動作するビジネス・インテリジェンス・ツール・スイートの一部とすることができる。スコアリングエンジン111により生成されるスコアは、次にスコアリングデータマート112上に記憶される。スコアリングデータマート112は、更にコンピュータシステム113に接続され、このシステムは、代表的な実施例においては、監査チーム115がスコアリングデータマート112上に含まれる情報にアクセスできるように作用する。
監査チーム115は、データベース114にアクセスすることもでき、このデータベースは、代表的な実施例においては、更なるデータ分析のためにコンピュータシステム113又は別のプロセッサシステムのいずれかを介して、SQLサーバ上で動作する別のスコアリングデータマートである。図1は、要約データマート110とコンピュータシステム113との間の直接回線は示していないが、本発明は、コンピュータシステム113がシステム100の全ての要素に直接アクセスできることを想定していることに更に注意されたい。更に、監査チーム115は、データベース116にアクセスし、代表的な実施例においては、“学習教訓”、即ち、過去の分析から学んだ改善を記憶するためのナレッジデータベースであり、コンピュータシステム113及びPEATデータマート108に更に接続することができる。
図2は、本発明による市場データにおけるアノマリーを検出する方法の代表的なフローチャート200である。第1のステップ210にて、UDB及びUDAがロードする。次に、ステップ212にて、UDAデータベース及びUDBデータベースに含まれるデータが処理され、データウェアハウス(例えば、図1におけるPEATデータマート)108にロードされ、代表的な実施例においては、この処理は、データベースからデータを抽出するステップと、1つ以上のカテゴリに亘って、例えば製品又は製品供給者ごとに、得られたデータを集計する、即ちデータを変換するステップとを含むことができる。次に、ステップ214にて、データは1つ以上の関連する索引に関して(例えば、製品又は処方プランごとに)要約され、要約データマート110に転送される。次に、ステップ216にて、スコアリングモデル(エンジン)111が要約されたデータに適用され、様々なデータに対して統計量、又は“スコア”を生成し、得られたスコアが対応する閾値を越えるか否かを判定し、越える場合には統計的な例外を形成し、その例外の優先順位を付けるサブステップからなる。代表的な実施例において、スコアリングエンジン111は、コンピュータシステム113上で動作するビジネス・インテリジェンス・ツール・スイートの一部として適用することができる。次に、ステップ218にて、スコアデータはスコアリングデータマート112に記憶される。次に、ステップ220にて、コンピュータシステム113は、スコアリングモデルの適用の結果を分析し、利用者が見ることができる結果の通知を生成する。代表的な実施例において、この分析(220)及び通知は、ビジネス・インテリジェンス・ツール・スイートの一部により実行することができる。ステップ222にて、この分析に基づいて、監査チーム115は、システムの調整、変化のマトリックスの編集及び市場傾向の文書化などの様々なデータ監査サービスを適用することができる。更に、ステップ224にて、監査チーム115は、新たに収集した情報を、分析からの“学習教訓”を含むことができるナレッジデータベース116に入力することができ、ステップ226にて市場の早期指標を入力するために、更にデータウェアハウス108に接続される。このように、情報ループが形成され、データ分析の結果をシステムの前部に戻すことができ、分析を更に洗練させることができる。
図3は、本発明による市場データにおけるアノマリーを検出する方法のステップに対する依存関係を示す代表的なフローチャート300である。市場の早期指標の入力(ステップ332)は、(図1に示す)ナレッジデータベース116の更新(ステップ330)に依存し、その更新は次に1つ以上の様々なデータ監査サービス(例えば、システムの調整(ステップ324)、マトリックス変化の編集(ステップ326)、及びマーケット傾向の文書化(ステップ328))の適用に依存する。1つ以上のデータ監査サービス(ステップ324,326及び328)の適用(ステップ320)は、スコアリングモデル(エンジン)111の適用の結果の監査チーム115の分析(ステップ322)、及び統計的な例外の特定(生成)(ステップ320)に依存し、これは次に、(製品及び/又はプランごとの)様々なデータの要約(ステップ318)に依存する。このステップは、UDA及びUDBからのデータの抽出、変換、及びローディング(ステップ316)に依存し、これは次に、UDBのローディング(ステップ310)及びUDAへのデータの供給及びローディング(ステップ312)に依存し、これらのデータベースに含まれるデータの認証(ステップ314)に依存させることもできる。
図4は、本発明による市場データにおけるアノマリーを検出する方法に対する構成要素階層モデル400を示している。UDA403は、UDA安全管理401の要素を有し、この要素はどの利用者がUDA403にアクセスするかを特定するために使用することができる。UDA403は、時間的に最初から最後までの階層順に、例えば、データ供給者から生データを受信するデータ受信(412)要素、例えば一貫した測定単位で測定されるようにデータを変更するデータの再フォーマット化(410)要素、医療保険の携行性と責任に関する法律(HIPAA)との整合性のためにデータを検査する要素(408)、再フォーマットされたデータを所定のトレランスに対して検査し、間違った統計的例外を生じないようにデータを編集する要素(406)、個々の商店を監視して1つ以上のカテゴリにおいてある商店が他の商店になりすましているかいないかを特定する要素(404)、変更されたデータをUDA403にロードする要素(402)を更に有する。UDA403及び例外ツール405(即ち、システム100の残り)は、データマート108への抽出及びUDB履歴417(即ち、UDBに記憶されたデータ)のローディングの要素を共有する。代表的な実施例は、データマートへの抽出(416)の要素は、UDA及びUDBデータの抽出を含むことを想定している。
例外ツール405は、製品及び/又はプランの要約(418)、スコアリングモデル(エンジン)の適用(420)、統計的な例外の特定(421)、及びデータ監査チームによる例外の再検討(422)の要素からなる。例外ツール405は、更に、例外処理423、システム100の調整(424)、変化のマトリックス編集(426)、及びマーケット傾向の文書化(428)の要素を有する。例外ツール405は、更に、知識データベース116の更新、市場傾向の早期指標の入力(432)の要素も有する。
ここで、代表的な実施例として、図5に示すスコアリングモデルの適用方法を詳細に説明する。この、又は別の実施例において、スコアリング処理と、例外生成と、UDAデータ及び/又はUDBデータの分析は、以下の技術の1つ以上を利用して実行することができる。
一実施例によれば、まずステップ510にて、1つ以上のデータタイプを監視、例えば、ステップ512にて週間単位平均コスト高(即ち、週ごとに測定される製品の所定単位の平均コスト)、及び/又はステップ514にて処方箋量(即ち、例えば1週間などの既定の期間に処方された処方箋の総数)を監視する。また、同一の又は別の実施例によれば、このような監視を、1つ以上のカテゴリのデータ、例えば、特定の製品供給者に対する1つのデータタイプの全てのデータについて実行することができる。更に、同一又は別の実施例によれば、このように監視されたデータを1つ以上のデータベース、例えばUDA及び/又はUDBデータベースに記憶することができる。更に、同一又は別の実施例によれば、プロセッサシステム、例えばコンピュータシステム113を使用して、既定の期間に亘って既定のデータタイプを監視してデータが特定の傾向を示しているか否かを判定することができる。いくつかのデータタイプは生データを直接収集して監視できるが、他のデータタイプの監視には、1つ以上のタイプの生データに対して1つ以上計算を実行する必要がある。2つのデータタイプを監視する例を以下に説明する。
一実施例によれば、処方箋量の監視をステップ512にて実行できる。週間単位平均コスト高のデータタイプは、例えば1週間などの所定の期間に亘って測定されたアウトレットコスト高(即ち、薬を購入する商店(供給者)に対するコスト)の合計を処方された処方箋の和によって除算したものと定義できる。同一又は別の実施例において、週間単位平均コスト高を、特定のデータカテゴリに関して、例えば、特定の製品(例えば、特定の薬)に対する週間単位平均コスト高を集計することができる。同一又は他の実施例において、標準的な数学公式を既定の期間に亘って測定されたデータ適用することにより平均値を計算でき、例えば、ここでは週間単位平均コスト高を計算することができる。
一実施例によれば、ステップ514にて処方箋量のデータ監視を実行できる。処方箋量のデータタイプは、例えば1週間に1回などの既定の期間に亘って処方された全処方箋量と定義することができる。同一又は別の実施例において、この値を特定のデータカテゴリ全体、例えば特定の製品供給者に対する全処方箋量データを集計することができる。同一又は他の実施例において、既定の期間に測定されたデータに標準的な数学公式を適用することにより平均値を計算することができ、例えばここでは処方箋量の平均値を測定できる。
第2に、一実施例によれば、ステップ520にて、プロセッサシステム113、例えばコンピュータシステム上で動作するプログラム、例えば、統計的分析ソフトウェアプログラム(例えば、SAS/QC、SAS/Base、及びSAS/ODBCソフトウェアモジュールを使用するSAS(登録商標)プログラム)を使用して形成されたビジネス・インテリジェンス・ツール・スイートを使用し、上述の監視されたデータに関する統計量、即ち“スコア”を生成することができる。同一又は他の実施例によれば、ステップ522にてデータにおける上昇又は下降スパイクについて、ステップ524にてデータにおける上昇又は下降傾向について、及び/又はステップ526にてデータのばらつきについて、このような統計量(スコア)を生成することができる。
代表的な実施例による、関連する統計量、即ちスコアデータを生成する方法をここで説明する。一実施例において、データ中の上昇又は下降スパイクを特定するステップ(ステップ522)は、例えば最近2週間のデータ、などの分析期間を特定するステップを含むことができる。本方法における次の段階は、平均値からの統計的距離を計算するステップを含む。所定の期間に亘る平均値からの統計的距離の差、例えば、今週と先週との間の差が、或る既定の閾値よりも大きな場合には、例外を生成することができる。
代表的な実施例によれば、この方法の使用の一例が以下に示されるが、これは単に説明目的のために提供されるものである。製品Aに対して、処方箋量平均は1000、平均値からの標準偏差は30であり、双方とも最近の16週のデータ、平均値及び標準偏差をそれぞれ計算するための標準的な公式を使用して計算されたものである。今週については、製品Aに対する週間処方箋量は1300である。先週については、製品Aに対する週間処方箋量1100であった。この例では、既定の閾値は6.0である。第1のステップは、製品Aに対する各週間処方箋量に対する平均値からの統計的距離を計算するステップである。平均値からの統計的距離を計算するための式は式(1)で与えられる。
平均値からの統計的距離=(週間処方箋量−処方箋量平均)/標準偏差 (1)
今週の平均値からの統計的距離は、即ち、この例については、(1300−1000)/30=10.0と計算される。先週の平均値からの統計的距離は、この例については、(1100−1000)/30=3.33となる。次のステップは、今週及び先週の平均値からの距離の間の差が、例えば6.0などの所定の閾値の絶対値よりも大きいか否かを判定するステップである。この分析により、6.0以上の値の差は、所定の閾値の値の選択に基づいてスパイクと見なされる。今回の場合、今週及び先週の統計的距離は、即ち、(10.0−3.33)=6.67と計算される。従って、例外が生成され、例えばスパイク値が申告される。
一実施例によれば、ステップ524での上昇又は下降傾向の特定は、所定の数の連続的なデータ点に亘って測定された特定のデータタイプが上昇又は下降傾向を示しているか否かを決定するステップを含むことができる。代表的な実施例によれば、上昇又は下降傾向のいずれかを示す6つの連続データ点は、例外の許容をもたらすのに十分であると考えることができる。上昇又は下降傾向は、6つの連続データ点によって示すことができ、各々が前のデータ点より高いか、又は、各々が前のデータ点よりも低い6つの連続データ点である。図6は、特定の製品、例えば製品Aに対する全処方箋数(TRX−CNTとラベルされているY軸)の下降傾向のグラフの例を示している。16のデータ点が示されており、16週間に亘る1週間当たりの全処方箋量であり、6つの連続データ点の下降傾向が見られる。傾向を更に明白にするために、図6に(代表的な値6756を有する)線Xで示すように、このようなグラフに平均値線を追加することができる。このような典型的な状況が発生した場合、一実施例によれば、以下に説明するように例外を生成することができる。
同一又は別の実施例において、上昇又は下降傾向の特定は、他のデータ点が既定の限界値内にある間に、1つ以上のデータ点が既定の限界値より上又は下にあるか判定するステップを含むことができる。代表的な一実施例において、データ点が平均値の標準偏差の3倍を超えた場合、傾向は例外の生成をもたらすのに十分と見なすことができる。図7は、他のデータ点が既定の限界値内にある間、幾つかのデータ点が既定の限界値より上又は下にある場合のグラフの例を示している。図7において、y軸は、(UNIT_AVG_COST_AMTでラベルされた)週間単位平均コスト高である。既定の限界値は、それぞれ点線UCL(119の代表的な値を有する上限値)及び点線LCL(109の代表的な値を有する下限値)で表されている。傾向を更に明白にするために、図7に(114の代表的な値を有する)線Xで示すように、平均値線をこのようなグラフに追加することができる。16週間に亘り1週間につき1つずつ、16のデータ点が示され、2つのデータ点が明らかに平均の標準偏差の3倍の既定の限界値の外にあることが示されている。このような典型的な状況が発生した場合、一実施例によれば、例外が生成される。
一実施例によれば、ステップ526にてデータのばらつきを特定するステップは、1つ以上のデータタイプ、例えば単位平均コスト高及び処方箋量データのばらつきを測定するステップを含むことができる。次の段階は、データの平均値からの標準偏差に対するデータのばらつき比が既定の閾値よりも大きいか否かを計算するステップを含むことができる。その結果、例外を生成することができる。同一の又は別の実施例によれば、データを特定のデータカテゴリ、例えば、特定の製品供給者に関連するデータに関連付けることができる。
代表的な実施例におけるこの方法の使用の一例が以下に示されるが、これは単に説明のために使用する。製品Aに対して、処方箋量平均は1000、標準偏差は30であり、双方とも最近の16週のデータ及び平均及び標準偏差をそれぞれ計算するための標準公式を使用して計算されたものである。この例において、既定の閾値は0.1である。製品Aのばらつき比を以下の(2)式を使用して計算することができる。
ばらつき比=(標準偏差/処方箋量平均) (2)
従って、製品Aに対して、ばらつき比は、30/1000=0.03となる。ここで、ばらつき比は0.10と計算されるため、一実施例によれば、例外は生成されない。
第3に、一実施例によれば、ステップ530にて、データ管理者が品質及び市場展望から最も重要である例外に対処するために開発した基準に基づいて、統計的例外の優先順位を付ける。本実施例による例外の優先順位を付ける方法をここで説明する。代表的な実施例によれば、特定の製品に関連するデータカテゴリは最高の優先順位又はランクを有し、その後に特定の製品供給者に関連するデータカテゴリが続く。優先順位を付けられた例外はデータベースに記憶、又はモニター上で可視できる出力、又は印刷された出力として提供することができる。ここで説明するステップの各々は、上述のステップを実行するようにプログラムされたプロセッサを有する1つ以上のコンピュータで実行することができる。
同一又は別の実施例によれば、それぞれの製品及び製品供給者のカテゴリは、以下の順序で優先付けすることができる。即ち、第1に、ステップ532にて、上昇又は下降スパイクによる例外は、最高の優先度を割り当て、例えば、最大のスパイク値に順位値1を割り当て、次に大きなスパイク値に順位値2を割り当てる、などとすることができる。第2に、ステップ534にて、上昇又は下降傾向による例外は、次に高い優先度、例えば、最高に順位付けされた最高パーセント変化を最低に順位付けされたスパイク値の順位値よりも小さな順位値を割り当てることができる。第3に、ばらつきによる例外は、ステップ536にて、次に高い優先度、例えば最高のばらつき比を最低に順位付けされた傾向値の順位値よりも小さな順位値に割り当てることができる。ここで説明した優先度は、例えばデータを分析する利用者の要求に基づいて変更することができる。
第4に、一実施例によれば、ステップ540にて、各生成された例外に対応する通知を生成することができる。同一又は他の実施例において、通知は、1組の例外の通知であり、更に、これらの例外に割り当てられた優先度の利用者に通知することができる。同一又は他の実施例において、通知を最高の優先例外、例えば閾値を2回越えたスパイクに対してのみ生成することができる。幾つかの実施例において、この発明の利用者は、その通知を見ることができる。幾つかの実施例において、利用者は通知を聞くことができる。幾つかの実施例においては、通知をデータファイルに格納することができる。
一実施例によれば、1つ以上のデータベース、例えばUDAデータベース及びUDBデータベースに関して、定期的に通知を生成することができる。例えば、一実施例において、特定時、例えば毎週日曜日の夜に、プログラム、例えばビジネス・インテリジェンス・ツール・スイートプログラムを実行する処理システム113は、複数週、例えば最近の16週分のデータをロードすることができる。同一又は別の実施例において、このようなデータは1つ以上のデータカテゴリ、例えば、製品供給者データに含まれるものとすることができ、1つ以上のデータタイプ、例えば、単位平均コスト高及び処方箋量データとすることができる。更に、同一又は他の実施例において、処理システム113は、1つ以上のデータタイプ、例えば、単位平均コスト高及び処方箋(Rx)量データに対する例外を生成することができる。次にこのデータを、プログラム、例えばビジネス・インテリジェンス・ツール・スイートプログラムを実行する処理システム113が使用し、本発明の利用者が見ることができる例外の通知を生成することができる。通知はデータベースに記憶するか、又はモニター上で可視できる出力又は印刷された出力として提供することができる。
以下の段落は、本発明の1つ以上の実施例に存在しうる更なる改良及び変更について説明しており、単に本発明の多様性を説明することを意図するものである。
代表的な実施例によれば、UDAは、生データのみを含むことができ、更に、13週分の処方箋履歴に制限することができる。UDAは、UDBに市場データを入力し、UDBは生の推定及び予測される市場データを含むことができ、24ヶ月分の市場データ履歴を記憶することができる。
プログラム、例えばビジネス・インテリジェンス・ツール・スイートプログラムを実行する処理システム113は、様々なデータタイプに対するスコアの分析を実行し、範囲外の統計的データ値を特定する能力を有することができる。一実施例において、コンピュータシステム113は、利用者のためにこのような範囲外のデータ値の優先順位を付けることができる。同一又は別の実施例において、利用者は、全ての統計的例外をデータベースからチャネル及び供給者レベルまでドリルダウン(即ち、分析するデータの範囲を狭める)能力を有することができる。更に、同一又は別の実施例において、利用者は、市場データを地域的に見る能力を有することができる。更に、同一又は別の実施例において、利用者は、データが存在するかぎり遡って監視市場データの履歴を見ることができる。
代表的な実施例によれば、製品の利用者は、役割及び責任に関して、データ品質及び市場傾向を管理及び/又は監視する責任を有するデータ管理者となることができる。同一又は別の実施例によれば、本発明の利用者は、図1に示すようにデータ監査チーム115の一員となることができる。更に、同一又は別の実施例によれば、データ管理役員が本発明を使用して、市場の現状に関する市場データの品質を決定することができ、主要な顧客が市場傾向の変化を予測し、製品及び/又は製造者に対する市場シェアを検証し、適切な品質指標及び/又は市場傾向の指標を特定しなければならないときに、先を見越した通知を提供することができる。
本発明の同一又は他の実施例において、データ監査チーム115は、本発明を使用して、製品の市場データが、量、コスト、価格、及び品質に関して矛盾のない傾向を示しているか否か、製品に関するプランが量及び単位販売の点から矛盾のない傾向を示しているか否か、所定の処方箋に認められるコストは市場の基準点、例えば平均卸売価格又は平均小売価格と同程度か否か、特定の供給者、チャネル、商店などに関して市場傾向の変化又は矛盾がないか、及び市場傾向の変化又は矛盾が処方箋、プラン、及び/又は製品に与える影響を追跡することができる。本システムは、数量編集理由コード(即ち、単位を変換する理由に対応するコード)に基づく数量変換(即ち、全ての市場データの同一の単位への変換)の数、パーセント及び型に関する統計を更に提供することができる。更に、全ての統計的例外は測定された全処方箋数に基づくことができるが、利用者は、“良好な”、例えば正しい、処方箋のみを見て、何故“不良な”、例えば、正しくない処方箋データが除外されているかの分析を実行するオプションを依然として持つことができる。
本システム又は本方法の一実施例に対するデータソースは、外部のソース又は既存のシステムデータソースとすることができる。概念的データモデルも使用できることも想定されている。処方箋データは、リテール、メール注文、及び、専売データサービス、例えば次世代処方箋サービス(NGPS)により収集された長期ケアデータを含むことができ、販売データは外部(非専売)手段の使用により収集されたデータ、例えば、卸業者からを含むことができ、国内販売展望(NSP)データやNSPに対して使用される生データなどの卸業者から販売業者への販売データを含むことができ、基準情報データは、UDAデータモデル及び/又はUDBデータモデル及び/又は辞書を含むことができ、投影方法データは、専用手段により生成された投影方法データ、例えばNGPS投影方法データを含むことができる。
ここで本システム、又は本方法の一実施例に対する情報送達を説明する。測定に関して、“1単位当たりのコスト”、“1処方箋(Rx)当たりのコスト”、及び“1日当たりの量”で始まる新たなマトリックスを導入することができる。履歴要件はUDBと同期させることができる。ここで説明した新たなUDAの機能の追加は、現行のデータ分析のための時間に影響を与えない。
同一又は別の実施例によれば、既定のデータベースに提供された詳細レベルは、UDA及び/又はUDBにおける既存の詳細レベルに準拠させることができる。時間に関しては、統計的例外は、データの分析のために割り当てられた時間内か時間外かにより特定できる。更に、ここで説明された実施例によれば、地理学的情報は既存のNGPS規格に準拠することができる。また、処方者ブリッジングに対する変更はないことが予想される。更に、分配チャネル情報の処理は、既存のNGPS規格に準拠することができる。更に、ここで説明された実施例によれば、プラン/支払者ブリッジングに対する変更はないことが予想される。
前述の説明は本発明の原理の説明のみであること、及び、当業者により、本発明の範囲及び精神から離れることなく様々な改良が可能であることが理解されよう。例えば、ここで説明したシステム及び方法は、処方箋データに対する市場傾向に関連して使用される。ここで説明した技術は、傾向又はアノマリーを検出するためのデータに関して有用であることを理解されたい。更に、ここで説明した実施例の態様は、新たな実施例への組み合わせ、及び/又は再構成が可能である。

Claims (14)

  1. 1つ以上の組の市場データにおけるアノマリーを特定する方法であって、
    前記1つ以上の組の市場データを所定の期間に亘って監視するステップと、
    前記1つ以上の組の市場データに関連する1つ以上の統計量を生成するステップと、
    前記1つ以上の統計量が1つ以上の対応する閾値を越えるか否かを判定して1つ以上の統計的例外を形成するステップと、
    前記1つ以上の統計的例外に優先順位付けするステップと、
    を含むことを特徴とする方法。
  2. 前記監視するステップが前記期間に亘って製品のコストを監視するステップを含むことを特徴とする、請求項1に記載の方法。
  3. 前記監視するステップが前記期間に亘って製品の販売量を監視するステップを含むことを特徴とする、請求項1に記載の方法。
  4. 前記1つ以上の統計量を生成するステップが前記市場データにおける異常値に関する1つ以上の統計量を生成するステップを含むことを特徴とする、請求項1に記載の方法。
  5. 前記1つ以上の統計量を生成するステップが、前記市場データにおける方向傾向に関する1つ以上の統計量を生成するステップを含むことを特徴とする、請求項1に記載の方法。
  6. 前記1つ以上の統計量を生成するステップが、前記市場データのばらつきに関する統計量を生成するステップを含むことを特徴とする、請求項1に記載の方法。
  7. 前記1つ以上の統計量が1つ以上の対応する閾値を越えるか否かを判定するステップが通知を生成するステップを含むことを特徴とする、請求項1に記載の方法。
  8. 1つ以上の組の市場データにおけるアノマリーを特定するシステムであって、
    1つ以上の組の市場データに関するデータを記憶するデータ記憶装置と、
    所定の期間に亘って1つ以上の組の市場データを監視して前記1つ以上の市場データに関連する1つ以上の統計量を生成し、前記1つ以上の統計量が1つ以上の対応する閾値を越えるか否かを判定して1つ以上の統計的例外を形成し、前記1つ以上の統計的例外に優先順位を付けるように構成設定されているプロセッサと、
    を具えることを特徴とするシステム。
  9. 前記プロセッサが所定の期間に亘って製品のコストを監視するように構成設定されていることを特徴とする、請求項8に記載のシステム。
  10. 前記プロセッサが所定の期間に亘って製品の販売量を監視するように構成設定されていることを特徴とする、請求項8に記載のシステム。
  11. 前記プロセッサが前記市場データにおける異常値に関する1つ以上の統計量を生成するように構成設定されていることを特徴とする、請求項8に記載のシステム。
  12. 前記プロセッサが前記市場データにおける方向傾向に関する1つ以上の統計量を生成するように構成設定されていることを特徴とする、請求項8に記載のシステム。
  13. 前記プロセッサが前記市場データのばらつきに関する統計量を生成するように構成設定されていることを特徴とする、請求項8に記載のシステム。
  14. 前記プロセッサが1つ以上の通知を提供するように構成設定されていることを特徴とする請求項8に記載のシステム。
JP2009534864A 2006-10-25 2007-10-25 市場データにおけるアノマリーを検出するシステム及び方法 Pending JP2010508587A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US85424106P 2006-10-25 2006-10-25
PCT/US2007/082549 WO2008052125A1 (en) 2006-10-25 2007-10-25 A system and method for detecting anomalies in market data

Publications (1)

Publication Number Publication Date
JP2010508587A true JP2010508587A (ja) 2010-03-18

Family

ID=39324944

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009534864A Pending JP2010508587A (ja) 2006-10-25 2007-10-25 市場データにおけるアノマリーを検出するシステム及び方法

Country Status (6)

Country Link
US (1) US20080103855A1 (ja)
EP (1) EP2080119A4 (ja)
JP (1) JP2010508587A (ja)
AU (1) AU2007308912A1 (ja)
CA (1) CA2667627A1 (ja)
WO (1) WO2008052125A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9323837B2 (en) * 2008-03-05 2016-04-26 Ying Zhao Multiple domain anomaly detection system and method using fusion rule and visualization
US9515754B2 (en) * 2008-08-12 2016-12-06 Iheartmedia Management Services, Inc. Measuring audience reaction
AU2012204026B2 (en) * 2011-07-18 2014-09-18 The Nielsen Company (Us), Llc Methods and apparatus to determine media impressions
US9037578B2 (en) 2012-12-03 2015-05-19 Wellclub, Llc Content suggestion engine
US10241887B2 (en) * 2013-03-29 2019-03-26 Vmware, Inc. Data-agnostic anomaly detection
CN107784510A (zh) * 2016-08-24 2018-03-09 上海零氏信息技术有限公司 基于门店零售终端的销售业绩统计分析系统及方法
CN107909472B (zh) * 2017-12-08 2020-11-03 深圳壹账通智能科技有限公司 经营数据审核方法、装置、设备及计算机可读存储介质
CN108776675A (zh) * 2018-05-24 2018-11-09 西安电子科技大学 基于k-d树的LOF离群点检测方法
US11403682B2 (en) * 2019-05-30 2022-08-02 Walmart Apollo, Llc Methods and apparatus for anomaly detections
CN111177095B (zh) * 2019-12-10 2023-10-27 中移(杭州)信息技术有限公司 日志分析方法、装置、计算机设备及存储介质
CN114020598B (zh) * 2022-01-05 2022-04-19 云智慧(北京)科技有限公司 一种时间序列数据的异常检测方法、装置及设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003044646A (ja) * 2001-08-03 2003-02-14 Business Act:Kk 経営状態警告システム
JP2005158069A (ja) * 2003-11-21 2005-06-16 General Electric Co <Ge> 事業実体の財務健全性に関する行動パターンを検出するためのシステム、方法、及びコンピュータ製品

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5987432A (en) * 1994-06-29 1999-11-16 Reuters, Ltd. Fault-tolerant central ticker plant system for distributing financial market data
US5701400A (en) * 1995-03-08 1997-12-23 Amado; Carlos Armando Method and apparatus for applying if-then-else rules to data sets in a relational data base and generating from the results of application of said rules a database of diagnostics linked to said data sets to aid executive analysis of financial data
US6597777B1 (en) * 1999-06-29 2003-07-22 Lucent Technologies Inc. Method and apparatus for detecting service anomalies in transaction-oriented networks
US7130807B1 (en) * 1999-11-22 2006-10-31 Accenture Llp Technology sharing during demand and supply planning in a network-based supply chain environment
US8271336B2 (en) * 1999-11-22 2012-09-18 Accenture Global Services Gmbh Increased visibility during order management in a network-based supply chain environment
US20040143477A1 (en) * 2002-07-08 2004-07-22 Wolff Maryann Walsh Apparatus and methods for assisting with development management and/or deployment of products and services
US7921029B2 (en) * 2005-01-22 2011-04-05 Ims Software Services Ltd. Projection factors for forecasting product demand
US7797186B2 (en) * 2005-10-18 2010-09-14 Donnelly Andrew Dybus Method and system for gathering and recording real-time market survey and other data from radio listeners and television viewers utilizing telephones including wireless cell phones
US7251584B1 (en) * 2006-03-14 2007-07-31 International Business Machines Corporation Incremental detection and visualization of problem patterns and symptoms based monitored events

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003044646A (ja) * 2001-08-03 2003-02-14 Business Act:Kk 経営状態警告システム
JP2005158069A (ja) * 2003-11-21 2005-06-16 General Electric Co <Ge> 事業実体の財務健全性に関する行動パターンを検出するためのシステム、方法、及びコンピュータ製品

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JPN6012022250; OTEY, Matthew Eric et al.: '"An Empirical Comparison of Outlier Detection Algorithms"' Workshop Notes of the ACM KDD-2005 Workshop on Data Mining Methods for Anomaly Detection , 20050821, pp. 45-52. *
JPN6012022251; SABHNANI, Maheshkumar R. et al.: '"Detecting Anomalous Patterns in Pharmacy Retail Data"' Workshop Notes of the ACM KDD-2005 Workshop on Data Mining Methods for Anomaly Detection , 20050821, pp. 58-61. *

Also Published As

Publication number Publication date
EP2080119A4 (en) 2011-10-26
CA2667627A1 (en) 2008-05-02
US20080103855A1 (en) 2008-05-01
EP2080119A1 (en) 2009-07-22
WO2008052125A1 (en) 2008-05-02
AU2007308912A1 (en) 2008-05-02

Similar Documents

Publication Publication Date Title
JP2010508587A (ja) 市場データにおけるアノマリーを検出するシステム及び方法
US8195525B2 (en) Method and apparatus upgrade assistance using critical historical product information
US10061816B2 (en) Metric recommendations in an event log analytics environment
JP4963760B2 (ja) 統合された多数の生物医学関連情報源
US7055149B2 (en) Method and apparatus for automating software upgrades
US8151141B1 (en) Resolution of computer operations problems using fault trend analysis
US20090182594A1 (en) System and method to manage assets of healthcare facility
EP3114620A1 (en) Real-time information systems and methodology based on continuous homomorphic processing in linear information spaces
US20060047715A1 (en) System and method for managing and analyzing data from an operational database
US10318908B2 (en) Prioritizing client accounts
US20060074695A1 (en) System and method for reporting and delivering sales and market research data
US20130275372A1 (en) Database Performance Analysis
US20030225651A1 (en) System and method for fulfillment value at risk scoring
US20070011176A1 (en) Business reporting under system failures
US20030208394A1 (en) Sales tracking and forecasting application tool
US7899776B2 (en) Explaining changes in measures thru data mining
US7275022B2 (en) System and method for analytically modeling data organized according to non-referred attributes
US20060036512A1 (en) System and method for interpreting sales data through the use of natural language questions
CN111145882B (zh) 一种基于多维连续钻取的医用耗材动态监管方法及系统
US20050209937A1 (en) Methods, systems, and storage mediums for providing web-based reporting services for telecommunications entities
US20070156484A1 (en) Cross company project management
CA2467735A1 (en) System and method for interpreting sales data through the use of natural language questions
CN114218489A (zh) 消息推送方法、装置、计算机设备和存储介质
CN117273615A (zh) 一种智能化的药品销售数据管理系统
EP1698088A2 (en) System and method for analyzing relationships between sourcing variables

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101022

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120419

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120508

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20121023