JP7276489B2 - 分析装置、制御方法、及びプログラム - Google Patents

分析装置、制御方法、及びプログラム Download PDF

Info

Publication number
JP7276489B2
JP7276489B2 JP2021553711A JP2021553711A JP7276489B2 JP 7276489 B2 JP7276489 B2 JP 7276489B2 JP 2021553711 A JP2021553711 A JP 2021553711A JP 2021553711 A JP2021553711 A JP 2021553711A JP 7276489 B2 JP7276489 B2 JP 7276489B2
Authority
JP
Japan
Prior art keywords
data
target data
test statistic
test
factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021553711A
Other languages
English (en)
Other versions
JPWO2021085585A1 (ja
JPWO2021085585A5 (ja
Inventor
龍太郎 瀬尾
和人 大石
雄木 小宮山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2021085585A1 publication Critical patent/JPWO2021085585A1/ja
Publication of JPWO2021085585A5 publication Critical patent/JPWO2021085585A5/ja
Application granted granted Critical
Publication of JP7276489B2 publication Critical patent/JP7276489B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • General Engineering & Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Primary Health Care (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Medical Informatics (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Manufacturing & Machinery (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)

Description

本発明はデータの分析に関する。
企業の業務内容の分析するためのシステムが開発されている。例えば特許文献1は、製品における異常の有無を検定によって判定する装置を開示している。より具体的には、特許文献1の装置は、製品の最終品質特性を表す変量について、目標値と実際の値とを比較する検定を行うことにより、異常の有無を判定する。そして、最終品質特性に異常がある場合、特許文献1の装置は、最終品質特性に関連するその他の変量についても、目標値と実際の値とを比較する検定を行うことにより、異常の有無を判定する。
特開2019-36061号公報
特許文献1では、適切な変量の値を表す目標値が予め分かっていることが前提となっている。そのため、特許文献1の装置は、変量の目標値の特定には利用できない。
本発明は上記の課題に鑑みてなされたものであり、その目的の一つは、結果に影響を及ぼす要因について、その適切な値の把握を容易にする技術を提供することである。
本発明の分析装置は、1)要因に関する値である要因データと結果に関する値である結果データとのペアを示す対象データの集合と、要因データの数値範囲を分割する個数を示す分割個数情報を取得する取得部と、2)数値範囲を個数に分割する複数の境界値それぞれについて、対象データの集合に含まれる対象データをその境界値で2分割して得られる2つの標本における、結果データに関する差異を表す検定統計量を算出する算出部と、3)境界値ごとに算出された複数の検定統計量を示す検定統計量情報を生成する生成部と、を有する。
本発明の制御方法はコンピュータによって実行される。当該制御方法は、1)要因に関する値である要因データと結果に関する値である結果データとのペアを示す対象データの集合と、要因データの数値範囲を分割する個数を示す分割個数情報を取得する取得ステップと、2)数値範囲を個数に分割する複数の境界値それぞれについて、対象データの集合に含まれる対象データをその境界値で2分割して得られる2つの標本における、結果データに関する差異を表す検定統計量を算出する算出ステップと、3)境界値ごとに算出された複数の検定統計量を示す検定統計量情報を生成する生成ステップと、を有する。
本発明のプログラムは、コンピュータに、本発明の制御方法を実行させる。
結果に影響を及ぼす要因について、その適切な値の把握を容易にする技術が提供される。
発明の実施形態の分析装置の概要を説明するための図である。 標本ペアごとに検定統計量を算出する処理を概念的に例示する図である。 実施形態1の分析装置の機能構成を例示する図である。 分析装置を実現するための計算機を例示する図である。 分析装置の利用環境を例示する図である。 実施形態1の分析装置によって実行される処理の流れを例示するフローチャートである。 テーブルとして実現される検定統計量情報を例示する図である。 検定統計量グラフとして実現される検定統計量情報を例示する図である。 ユーザに提供される画面を例示する図である。 ヒストグラムと検定統計量情報とが含まれる画面を例示する図である。 時系列グラフ、ヒストグラム、及び検定統計量グラフを含む画面を例示する図である。 変形例の分析装置2000における第1標本と第2標本を例示する図である。 2つの境界値のペアを用いて対象データ集合10を2つの標本に分けるその他の方法を例示する図である。 変形例の分析装置2000によって出力される情報を例示する図である。
以下、本発明の実施の形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。また各ブロック図において、特に説明がない限り、各ブロックは、ハードウエア単位の構成ではなく機能単位の構成を表している。
[実施形態1]
<概要>
図1は、本実施形態の分析装置2000の概要を説明するための図である。なお、図1は、分析装置2000に対する理解を容易にするための例示であり、分析装置2000の機能は図1に表されているものに限定されない。
分析装置2000は、複数の対象データ20の集合である対象データ集合10を取得する。対象データ20は、要因の値(要因データ22)と結果の値(結果データ24)とを対応づけたデータである。例えば製品の製造では、特定の材料の含有量が製品の質に影響を及ぼしうる。そこで、要因データ22としては特定の材料の含有量を示し、結果データ24としては製品が不良品であるか否かを示すフラグ(以下、不良フラグ)を扱うことが考えられる。
分析装置2000は、対象データ20をそれぞれ異なる複数のパターンで2分割し、各パターンについて、2分割して得られる2つの集合(標本)の差異を表す検定統計量を算出する。そのために、分析装置2000は、分割個数情報30をさらに取得する。分割個数情報30は、要因データ22の数値範囲をいくつに分割するかを表す個数(以下、分割個数)を示す。
分析装置2000は、分割個数情報30によって示される分割個数で要因データ22の数値範囲を分割する各境界の値を算出する。例えば、要因データ22の数値範囲が0から100であり、分割個数が4であるとする。この数値範囲を4等分する境界値は、25、50、及び75である。そのため、これら3つの境界値が分析装置2000によって特定される。
分析装置2000は、特定した複数の境界値それぞれについて、以下の処理を行う。まず、分析装置2000は、対象データ集合10を、その境界値を境界として2つの集合(以下、第1標本と第2標本)に分割する。これにより、分割個数に等しい数の第1標本と第2標本のペア(以下、標本ペア)が得られる。
さらに、分析装置2000は、境界値ごとに、その境界値に基づく分割で得られた標本ペアについて、結果データ24に関する差異を表す検定統計量を算出する。例えば結果データ24が不良フラグであるとする。この場合、例えば分析装置2000は、第1標本における製品の不良率(製品の総数に対する不良品の割合)と、第2標本における製品の不良率との差を表す検定統計量を算出する。
図2は、標本ペアごとに検定統計量を算出する処理を概念的に例示する図である。図2のグラフは、横軸に要因データ22の値を示し、縦軸に結果データ24の値を示している。結果データ24は不良率を示す。この例において、分割個数は4である。そのため、3つの境界値 b1, b2, 及び b3 が算出されている。なお、横軸における min と max はそれぞれ、要因データ22の数値範囲の上限値と下限値である。
分析装置2000は、境界値 b1 を用い、対象データ集合10を、要因データ22が b1 以下である対象データ20を含む第1標本と、要因データ22が b1 より大きい対象データ20を含む第2標本とに分割する。そして、分析装置2000は、境界値 b1 に対応する検定統計量として、上記第1標本と第2標本における結果データ24に関する差異を表す検定統計量を算出する。例えば結果データ24が、製品が不良品であるか否かを示す場合、第1標本と第2標本それぞれについて不良率を算出し、算出した不良率の差異を表す検定統計量を算出することが考えられる。同様に、分析装置2000は、境界値 b2 を用いて得られる第1標本と第2標本における結果データ24に関する差異を表す検定統計量と、境界値 b3 を用いて得られる第1標本と第2標本における結果データ24の差異を表す検定統計量も算出する。
分析装置2000は、算出した複数の検定統計量を示す検定統計量情報を生成する。例えば検定統計量情報は、境界値とその境界値を基準とした分割によって得られた標本ペアとの対応付けを示す図表である。図1では、検定統計量情報40として、横軸に境界値を示し、縦軸にその境界値について算出された検定統計量を示す折れ線グラフが生成されている。
<作用効果の一例>
本実施形態の分析装置2000によれば、「要因データ22の値に基づいて対象データ集合10を2つの標本に分割し、これら2つの標本について、結果データ24に関する差異を表す検定統計量を算出する」という処理が、それぞれ異なる境界値を用いる複数のパターンで行われる。そして、これら複数のパターンそれぞれについて得られた検定統計量を示す検定統計量情報40が出力される。このような検定統計量情報40を見たユーザは、「良い結果を得るためには要因データ22の値をどのようにすることが適切か」ということを、容易に把握することができる。すなわち、分析装置2000によれば、結果データ24との関係において、要因データ22をどのような値にすることが適切であるかということを、的確かつ容易に把握することができる。
ここで、データ分析を適切に行うためには、高度な統計知識が必要である。そのため、そのような知識を有するスペシャリスト以外がデータ分析を行おうとすると、多くの時間を要したり、分析に誤りが生じたりする恐れがある。この点、分析装置2000では、データを複数のパターンで分割する処理や、パターンごとに検定統計量を算出するといった処理が自動で行われるため、高度な統計知識を持たない人(例えば、企業の業務担当者など)であっても、結果データ24に影響を与える要因データ22について、その適切な値を的確かつ容易に把握することができる。
以下、本実施形態についてさらに詳細を述べる。
<機能構成の例>
図3は、実施形態1の分析装置2000の機能構成を例示する図である。分析装置2000は、取得部2020、算出部2040、及び生成部2060を有する。取得部2020は、対象データ集合10及び分割個数情報30を取得する。算出部2040は、要因データ22の数値範囲を分割個数情報30が示す分割個数に分割する複数の境界値を算出する。また、算出部2040は、複数の境界値それぞれについて、その境界値で対象データ集合10を2分割して得られる第1標本と第2標本における結果データ24に関する差異を表す検定統計量を算出する。生成部2060は、算出された複数の検定統計量を示す検定統計量情報を生成する。
<分析装置2000のハードウエア構成の例>
分析装置2000の各機能構成部は、各機能構成部を実現するハードウエア(例:ハードワイヤードされた電子回路など)で実現されてもよいし、ハードウエアとソフトウエアとの組み合わせ(例:電子回路とそれを制御するプログラムの組み合わせなど)で実現されてもよい。以下、分析装置2000の各機能構成部がハードウエアとソフトウエアとの組み合わせで実現される場合について、さらに説明する。
図4は、分析装置2000を実現するための計算機1000を例示する図である。計算機1000は、任意の計算機である。例えば計算機1000は、PC(Personal Computer)やサーバマシンなどといった、据え置き型の計算機である。その他にも例えば、計算機1000は、スマートフォンやタブレット端末などといった可搬型の計算機である。
計算機1000は、分析装置2000を実現するために設計された専用の計算機であってもよいし、汎用の計算機であってもよい。後者の場合、例えば、計算機1000に対して所定のアプリケーションをインストールすることにより、計算機1000で、分析装置2000の各機能が実現される。上記アプリケーションは、分析装置2000の機能構成部を実現するためのプログラムで構成される。
計算機1000は、バス1020、プロセッサ1040、メモリ1060、ストレージデバイス1080、入出力インタフェース1100、及びネットワークインタフェース1120を有する。バス1020は、プロセッサ1040、メモリ1060、ストレージデバイス1080、入出力インタフェース1100、及びネットワークインタフェース1120が、相互にデータを送受信するためのデータ伝送路である。ただし、プロセッサ1040などを互いに接続する方法は、バス接続に限定されない。
プロセッサ1040は、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、FPGA(Field-Programmable Gate Array)などの種々のプロセッサである。メモリ1060は、RAM(Random Access Memory)などを用いて実現される主記憶装置である。ストレージデバイス1080は、ハードディスク、SSD(Solid State Drive)、メモリカード、又は ROM(Read Only Memory)などを用いて実現される補助記憶装置である。
入出力インタフェース1100は、計算機1000と入出力デバイスとを接続するためのインタフェースである。例えば入出力インタフェース1100には、キーボードなどの入力装置や、ディスプレイ装置などの出力装置が接続される。
ネットワークインタフェース1120は、計算機1000を通信網に接続するためのインタフェースである。この通信網は、例えば LAN(Local Area Network)や WAN(Wide Area Network)である。
ストレージデバイス1080は、分析装置2000の各機能構成部を実現するプログラム(前述したアプリケーションを実現するプログラム)を記憶している。プロセッサ1040は、このプログラムをメモリ1060に読み出して実行することで、分析装置2000の各機能構成部を実現する。
<分析装置2000の利用環境の例>
分析装置2000の理解を容易にするため、分析装置2000の利用環境の一例を説明する。図5は、分析装置2000の利用環境を例示する図である。
図5において、分析装置2000は、ネットワークを介してユーザ端末60と接続されている。ユーザは、ユーザ端末60を操作して、対象データ集合10について検定統計量情報40を提供するように、分析装置2000に対してリクエストを送信する。例えば当該リクエストには、対象データ集合10に関する条件を表す情報及び分割個数情報30が含まれている。分析装置2000は、リクエストに示されている条件に該当する対象データ集合10を取得し、その対象データ集合10と分割個数情報30を用いて、検定統計量情報40の生成を行う。そして、分析装置2000は、生成した検定統計量情報40をユーザ端末60へ送信する。
例えば、分析装置2000は、検定統計量情報40を含む画面データ(例えば Web ページ)をユーザ端末60に対して提供する。この場合、ユーザ端末60は、受信した Web ページをブラウザで表示する。こうすることで、ユーザは、検定統計量情報40を閲覧することができる。
分析装置2000の利用環境は、図に示したものに限定されない。例えば、分析装置2000は、ユーザ端末60を介して利用されるのではなく、直接ユーザに操作されてもよい。
<処理の流れ>
図6は、実施形態1の分析装置2000によって実行される処理の流れを例示するフローチャートである。取得部2020は、対象データ集合10を取得する(S102)。取得部2020は、分割個数情報30を取得する(S104)。算出部2040は、要因データ22の数値範囲を分割個数情報30に示されている分割個数に分割する複数の境界値を算出する(S106)。
S108からS114は、各境界値について実行されるループ処理Aである。S108において、算出部2040は、既に全ての境界値を対象としてループ処理Aを実行したか否かを判定する。既に全ての境界値を対象としてループ処理Aを実行した場合、図6の処理はS116に進む。一方、まだループ処理Aの対象としていない境界値がある場合、算出部2040はその中の1つを選択する。そして、図6の処理はS110に進む。なお、ここで選択された境界値を境界値iと呼ぶ。
算出部2040は、境界値iで対象データ集合10を2分割して、第1標本と第2標本を生成する(S110)。算出部2040は、第1標本と第2標本について、結果データ24に関する検定統計量を算出する(S112)。S114はループ処理Aの終端であるため、図6の処理はS108に進む。
ループ処理Aの後、生成部2060は、算出された複数の検定統計量について検定統計量情報40を生成する(S116)。生成部2060は、検定統計量情報40を出力する(S118)。
<対象データ集合10について>
対象データ集合10は、要因データ22と結果データ24とのペアである対象データ20を複数含む集合である。各対象データ20は、例えば、同一の処理や作業をそれぞれ異なる時点で行った各ケースについてのデータを示す。例えば前述したように、対象データ20が、要因データ22と結果データ24にそれぞれ、特定の材料の含有量と、その含有量の材料を用いて製造された製品が不良品であったか否かを示しているとする。この場合、例えば各対象データ20は、それぞれ異なる時点に製造された製品について、その時点に製造した製品に使用した上記特性の材料の含有量と、その製品が不良品であるか否かとを示している。
ここで、対象データ20として、複数の説明変数の値から目的変数の値を推定する推定モデルを学習するための学習データを利用してもよい。例えば、「製品の製造条件を表す1つ上の指標それぞれに基づいて、その製造条件下で生成される製品に関する指標を推定する」という推定モデルを生成するとする。この場合、製造条件を表す各指標が説明変数を表し、製造された製品に関する指標が目的変数を表す。製造条件を表す指標は、例えば、気温や湿度などの環境や、各材料の含有量などである。製品に関する指標は、例えば、製品が不良品であるか否かのフラグ、製品に関する特定の性能を表す指標などである。
上述した説明変数の値と目的変数の値はそれぞれ、要因データ22と結果データ24として捉えることができる。そこで例えば、このような推定モデルの生成に利用される学習データを、対象データ20として利用することができる。
取得部2020は、対象データ集合10を取得する(S102)。取得部2020が対象データ集合10を取得する方法は様々である。例えば取得部2020は、対象データ集合10が格納されている記憶装置から対象データ集合10を取得する。その他にも例えば、取得部2020は、他の装置から送信された対象データ集合10を受信することで、対象データ集合10を取得してもよい。
ここで、記憶装置に複数の対象データ集合10が格納されている場合、取得部2020は、検定統計量情報40の生成対象とすべき対象データ集合10を特定し、特定した対象データ集合10を記憶装置から取得する。この場合、例えば取得部2020は、取得すべき対象データ集合10についての条件を取得し、その条件に合致する対象データ集合10を取得する。
対象データ集合10についての条件は、例えば、対象データ集合10の識別情報(名称など)、対象データ集合10が得られた期間、対象データ集合10に関連する場所(例えば、製品の製造場所など)などといった条件である。ここで、対象データ集合10が推定モデルの生成に利用される場合、対象データ集合10の識別情報として、対象データ集合10を利用して生成された推定モデルの識別情報を利用してもよい。対象データ集合10に関するこれらの条件を表す情報は、例えば、前述したユーザ端末60から送信されるリクエストに含まれる。
なお、記憶装置に格納されている対象データ20は、対象データ集合10という単位で分けられていなくてもよい。この場合、例えば取得部2020は、対象データ集合10に含める対象データ20の条件を取得し、その条件に合致する対象データ20を記憶装置から取得する。そして、取得部2020は、取得した対象データ20のまとまりを対象データ集合10として扱う。対象データ20に関する条件は、例えば、対象データ20が得られた期間や、対象データ20に関連する場所(例えば、製品の製造場所)などである。
その他にも例えば、検定統計量情報40の生成を行う前に既に対象データ集合10を利用した何らかの処理が行われている場合、分析装置2000は、そのような別の処理から対象データ集合10を引き継ぐことで、対象データ集合10を取得してもよい。対象データ集合10を利用した別の処理としては、例えば、対象データ集合10を利用して推定モデルを生成する処理や、グラフなどを用いて対象データ集合10を可視化する処理などが考えられる。
例えば、これらの処理の結果を表す画面に、その処理で利用した対象データ集合10について検定統計量情報40の生成を要求するインタフェース(ボタンなど)を設けておく。分析装置2000は、このインタフェースを利用した要求に応じて、検定統計量情報40の生成を行って出力する。これにより、ユーザは、推定モデルの生成に利用した対象データ集合10や、可視化した対象データ集合10について、その対象データ集合10を別の観点で分析した検定統計量情報40という情報を容易に得ることができる。
なお、推定モデルの生成などの処理を行った装置が分析装置2000とは異なる装置である場合、その装置からの要求に、対象データ集合10の識別情報や対象データ集合10そのものを含めておく。これにより、分析装置2000が対象データ集合10を取得することができる。
なお、対象データ20の中に、複数種類の要因それぞれについてのデータが含まれる場合、どの要因に着目して対象データ集合10を標本分割するか(すなわち、要因データ22としてどの要因についてのデータを扱うか)を特定する必要がある。その特定方法は任意である。例えば取得部2020は、要因データ22としてどの要因についてのデータを扱うか指定する入力を、ユーザから受け付ける。その他にも例えば、前述したように別の処理から対象データ集合10を引き継ぐ場合、当該別の処理で着目していた要因についてのデータを、要因データ22として扱うようにする。例えば、或る要因についてのデータを可視化する処理から対象データ集合10を引き継いだ場合、可視化されていた要因についてのデータを要因データ22として扱う。
<分割個数情報30の取得:S104>
取得部2020は分割個数情報30を取得する(S104)。取得部2020が分割個数情報30を取得する方法は様々である。例えば取得部2020は、記憶装置に格納されている分割個数情報30を取得する。その他にも例えば、取得部2020は、分割個数を入力するユーザ操作を受け付けることで、分割個数情報30を取得してもよい。その他にも例えば、取得部2020は、他の装置から送信された分割個数情報30を受信することで、分割個数情報30を取得してもよい。この場合、例えば分割個数情報30は、前述したユーザ端末60から送信されるリクエストに含まれる。
<境界値の算出:S106>
算出部2040は、分割個数情報30に示されている分割個数で要因データ22の数値範囲を分割する複数の境界値を算出する(S106)。そのため、算出部2040は、要因データ22の数値範囲を特定する。例えば算出部2040は、対象データ集合10に含まれる要因データ22の中で最小のものを下限値とし、対象データ集合10に含まれる要因データ22の中で最大のものを上限値とする数値範囲を、要因データ22の数値範囲として扱う。
その他にも例えば、算出部2040は、対象データ集合10に含まれる対象データ20のうちの一部を除外してから、要因データ22の数値範囲を特定してもよい。この場合、例えば算出部2040は、当該除外後の対象データ集合10に含まれる要因データ22の最小値と最大値をそれぞれ下限値と上限値とする数値範囲を、要因データ22の数値範囲として扱う。対象データ集合10から除外される対象データ20は、例えば、要因データ22が外れ値を示すものである。なお、複数の数値から外れ値を特定する方法には、既存の種々の方法を利用できる。
その他にも例えば、算出部2040は、要因データ22の数値範囲を定めた情報を取得してもよい。この場合、要因データ22の数値範囲の下限値が、対象データ集合10に含まれる要因データ22の最小値よりも小さかったり、要因データ22の数値範囲の上限値が、対象データ集合10に含まれる要因データ22の最大値よりも大きかったりしてもよい。
算出部2040は、特定した要因データ22の数値範囲を分割個数情報30が示す分割個数に等分する各境界値を算出する。このような境界値は、例えば以下の式(1)で算出することができる。
b_i=(max-min)/N*i (1)
ここで、bi は、最小のものから数えて i 番目の境界値を表す。max は要因データ22の数値範囲の上限値を表し、min は要因データ22の数値範囲の下限値を表す。N は分割個数を表す。なお、境界値の数は N-1 個となる。
<標本ペアの生成:S110>
算出部2040は、各境界値について、対象データ集合10をその境界値で2分割して、標本ペア(第1標本と第2標本)を生成する(S110)。例えば算出部2040は、対象データ集合10を、境界値以下の要因データ22を示す対象データ20の集合と、境界値より大きい要因データ22を示す対象データ20の集合とに2分割する。前者が第1標本として扱われ、後者が第2標本として扱われる。ただし、算出部2040は、境界値より小さい要因データ22を示す対象データ20の集合を生成して第1標本とし、境界値以上の要因データ22を示す対象データ20の集合を生成して第2標本としてもよい。
<検定統計量の算出:S112>
算出部2040は、各境界値について、その境界値を用いて生成された第1標本と第2標本における結果データ24に関する差異を表す検定統計量を算出する(S112)。ここで、このように2つの標本を比較する検定としては、比率の差の検定や、平均値の差の検定などがある。算出部2040は、これらの検定に利用できる検定統計量を算出する。検定統計量の種類としては、2標本t検定量などといった種々の種類を採用できる。
例えば、第1標本と第2標本について比率の差の検定を行うとする。この場合、算出部2040は、第1標本に含まれる結果データ24に関する所定の種類の比率と、第2標本に含まれる結果データ24に関する所定の種類の比率との差異を表す検定統計量を算出する。例えば、結果データ24が不良フラグである場合、結果データ24に関する所定の種類の比率として、不良率(標本に含まれる対象データ20の総数に対する、要因データ22が不良品であることを示している対象データ20の数の割合)を利用できる。
なお、検定の種類や検定統計量の種類は、予め固定で定められていてもよいし、ユーザ入力等によって指定可能であってもよい。
<検定統計量情報40の生成:S116>
生成部2060は、境界値ごとに算出された検定統計量を示す検定統計量情報40を生成する(S116)。検定統計量情報40は、境界値と、その境界値について算出された検定統計量とを対応づけて表す。このような情報には、図表などといった種々の形式の情報を採用できる。
例えば検定統計量情報40は、境界値と検定統計量との対応付けを表すテーブルを含む。図7は、テーブルとして実現される検定統計量情報40を例示する図である。図7のテーブルをテーブル50と呼ぶ。テーブル50は、境界値52及び検定統計量54を有する。図7において、テーブル50の1つのレコードは、境界値と、その境界値で対象データ集合10を分割して得た2つの標本について算出された検定統計量とを対応づけて示す。
検定統計量情報40は、境界値と検定統計量との対応付けを表すグラフ(以下、検定統計量グラフ)であってもよい。図8は、検定統計量グラフ70として実現される検定統計量情報40を例示する図である。検定統計量グラフ70において、X軸は境界値を表し、Y軸は検定統計量を表す。
検定統計量グラフ70では、境界値と検定統計量との各対応付けがプロットされており、これらのプロットを連結した折れ線が表示されている。なお、グラフの種類は折れ線グラフに限定されず、棒グラフなどといった様々な種類のグラフを採用できる。
検定統計量グラフ70には、さらに、検定統計量の閾値を表す閾値表示74が含まれる。閾値表示74は、有意水準に基づいて得られる検定統計量の閾値を表す。検定統計量グラフ70において、閾値表示74が表す閾値以上の検定統計量は、統計的に有意な値である。すなわち、検定統計量が閾値を超えている場合、その検定統計量に対応する境界値で分けられた2つの標本には、統計的に有意な差があるといえる。このように検定統計量グラフ70に閾値表示74を含めることで、各境界値に対応する検定統計量が統計的に有意な値であるか否かを、容易に把握することができる。
例えば図8において、結果データ24は不良フラグであり、要因データ22は成分Aの含有量を表しているとする。また、標本間で不良率の差の検定が行われているとする。また、第2標本の方が第1標本よりも不良率が高い場合に、検定統計量が正の値になるとする。
検定統計量グラフ70を見ると、境界値が b3 以下のケースでは、検定統計量が閾値より小さくなっている。一方、境界値が b4 以上のケースでは、検定統計量が閾値よりも大きくなっている。このことから、成分Aの含有量が b4 以上である製品と、成分Aの含有量が b4 未満である製品とを比較すると、製品の不良率に有意な差があることが分かる。そのため、図8の検定統計量グラフ70を見ることで、ユーザは、「不良率を低くするためには、成分Aの含有量を b4 未満にすることで好適である」ということを容易に把握することができる。
なお、図8では、閾値表示74よりも上のエリアに色(図示の都合上、パターン)を付けることで、統計検定量が閾値以上である箇所とそれ以外をより容易に把握できるようにしている。色付けは、閾値表示74よりも下のエリアに対してさらに行われてもよい。また、色づけは、閾値表示74よりも上のエリアについては行わず、下のエリアのみに行うようにしてもよい。
また、生成部2060は、検定統計量グラフ70において、閾値以上の検定統計量を表すプロットを強調表示してもよい。強調表示の方法としては、プロットのサイズを大きくする、プロットの形状を変える、プロットを点滅させるなどといった種々の方法を採用できる。
検定統計量の閾値は、有意水準を検定統計量に変換することで得ることができる。例えば有意水準が 5% であり、検定統計量の種類が t 値であるとする。この場合、5 % という有意水準を表す p 値=0.05 を t 値に変換することで、t 値の閾値を得ることができる。なお、有意水準を表す値を検定統計量に変換する具体的な方法には、検定統計量の種類に応じた既存の手法を利用することができる。
有意水準は、予め固定で定められていてもよいし、ユーザによって指定されてもよい。例えば分析装置2000は、分割個数、検定の種類、及び有意水準などといった情報を指定できる画面をユーザに提供する。
図9は、ユーザに提供される画面を例示する図である。図9の画面80には、入力エリア82、84、及び86が含まれている。これらはそれぞれ、検定の種類、有意水準、及び分割個数を指定できる入力エリアである。なお、分割個数は検定の粒度とも言えるため、図9では「検定粒度」と表記されている。ユーザは、これらの入力エリアに情報を入力した後、検定を実行するためのボタン88を押下する。その結果、図8で説明した検定統計量グラフ70が表示されている。なお、検定統計量グラフ70は、画面80内に表示されてもよいし、画面80とは別の画面に表示されてもよい。なお、ボタン88は必須ではなく、各入力エリアに入力が行われたら、その内容を反映した検定統計量グラフ70が自動的に生成・表示されるようにしてもよい。
<検定統計量情報40の出力:118>
生成部2060は、生成した検定統計量情報40を出力する(S118)。検定統計量情報40の出力先は任意である。例えば生成部2060は、分析装置2000からアクセス可能なディスプレイ装置に、検定統計量情報40を表示させる。その他にも例えば、生成部2060は、分析装置2000からアクセス可能な記憶装置に検定統計量情報40を格納する。その他にも例えば、生成部2060は、分析装置2000からアクセス可能な他の装置(例えばユーザ端末60)に検定統計量情報40を送信する。
<ヒストグラムの表示>
生成部2060は、対象データ集合10に含まれる要因データ22についてのヒストグラムを生成し、このヒストグラムと検定統計量情報40を一緒に出力してもよい。例えばヒストグラムと検定統計量情報40は、同一の画面に含めて出力される。図10は、ヒストグラム90と検定統計量情報40とが含まれる画面を例示する図である。図10において、ヒストグラム90は、前述した検定統計量グラフ70の中に含められている。なお、後述する図11に示すように、検定統計量グラフ70とヒストグラム90は、分けて表示されてもよい。
ヒストグラム90は、例えば次のようにして生成される。まず生成部2060は、要因データ22の数値範囲を各境界値で分割して、部分範囲を生成する。生成部2060は、各部分範囲について、要因データ22がその部分範囲に属する対象データ20の個数をカウントする。そして、生成部2060は、部分範囲と対象データ20の個数との対応付けを表すヒストグラム90を生成する。
このように、検定統計量情報40に加えてヒストグラム90を出力することにより、ユーザは、要因データ22がどのように分布しているのかを把握しつつ、その要因データ22をどのような値にすることで結果を良くすることができるのかを、的確かつ容易に把握することができる。
<より具体的な出力の例>
生成部2060は、前述した情報だけでなく、その他にも様々な情報を生成してもよい。図11は、生成部2060によって生成される情報について、より具体的な例を示す図である。この例では、生成部2060によって、画面130が生成されている。画面130は、表示エリア131、表示エリア132、表示エリア133、表示エリア134、及び表示エリア135を含む。
表示エリア131には、対象データ20の時間変化を表す時系列グラフ100が示されている。時系列グラフ100において、折れ線102は、要因データ22の時間変化を表している。この場合、例えば対象データ集合10は、各対象データ20が時間と対応づけられている時系列データである。ただし、特定の周期でデータを集計することにより、時系列データとみなして利用してもよい。
表示エリア132には、ヒストグラム90が表示されている。表示エリア133には、検定方法と検定粒度(分割個数に相当)を指定する入力インタフェース、及び検定の実行を指示するためのボタンが表示されている。
表示エリア134には、有意水準を指定するための入力インタフェースと、検定統計量グラフ70とが表示されている。図11の検定統計量グラフ70は、バー72及び説明表示76を含む。バー72は、着目したい境界値を指定するためのインタフェースである。ユーザは、バー72を左右に移動させることで、着目したい境界値を変更することができる。説明表示76は、バー72で指定されている境界値について、境界値と検定統計量を示す。
ヒストグラム90は、バー72で指定した境界値よりも小さいランクと大きいランクとで、表示態様が異なっている。具体的には、バー72で指定した境界値 b3 よりも小さい各ランクのデータと、境界値 b3 よりも大きい各ランクのデータとで、異なる模様が付されている。なお、異ならせる表示態様はパターンには限定されず、色や枠線の種類などであってもよい。
また、表示エリア132には、ヒストグラム90と重畳させて、ランクごとの不良率を示す折れ線110が示されている。さらに、各ランクにおける不良率の信頼区間が点線で示されている。
表示エリア135は、バー72で指定した境界値に基づいて、結果データ24に関する値の改善度合いのシミュレーションを示している。例えば、不良率について検定統計量が算出されているとする。また、要因データ22の値をより小さくすることで、不良率が下がるとする。この場合、表示エリア135には、対象データ20全体における不良率などを示す表示エリア136と、要因データ22をバー72で指定した境界値以下の値に制限した場合の不良率などを示す表示エリア137が含まれる。
表示エリア137に示される情報は、要因データ22を指定された境界値以下とするように要因(この例では、成分Aの含有量)を調整することによってどの程度の改善が期待できるのかを表していると言える。よって、このような表示によれば、要因の調整によって期待できる効果(この例では不良率の改善)を容易に把握することができる。
ここで、前述したように、ユーザはバー72を左右に動かすことで、指定する境界値を変更することができる。生成部2060は、表示エリア137の内容を、バー72が動かされたこと(境界値の指定が変更されたこと)に応じて変更する。そのため、ユーザは、バー72を動かしながら、要因の調整によって期待できる効果を確認することができる。
また、生成部2060は、バー72が動かされたことに応じて、ヒストグラム90におけるデータの表示態様も変更する。このようにすることで、ユーザは、改善のシミュレーションに利用されている標本を容易に確認することができる。
なお、図11の例では、要因データ22をより小さくすることで不良率が下がるため、表示エリア137において「b3 以下に調整」と表示されている。この点、要因データ22をより大きくすることで不良率が下がる場合には、この表示は「b3 以上に調整」となる。
改善のために要因データ22を小さくすべきかそれとも大きくすべきかを特定するための情報は、予め取得しておく。例えば前述したように、対象データ20として、複数の説明変数の値から目的変数の値を推定する推定モデルを学習するための学習データを利用するとする。この場合、推定モデルにおいて或る説明変数が目的変数に対して正負どちらの影響を与えているかによって、改善のためにその説明変数に対応する要因データ22を小さくすべきか又は大きくすべきかを特定することができる。
[変形例]
これまでに説明した例において、対象データ20は、1つの要因データ22と1つの結果データ24を対応づけていた。しかしながら、対象データ20は、2つの要因データ22と1つの結果データ24とを対応づけたものであってもよい。この場合、対象データ集合10を2つの標本に分割する際に、2つの要因に着目して分割が行われる。以下、このような処理を行う分析装置2000を、変形例の分析装置2000と呼ぶ。
変形例の分析装置2000において、取得部2020は、第1の要因データ22(以下、要因データ22-1)、第2の要因データ22(以下、要因データ22-2)、及び結果データ24を対応づけた対象データ20を複数含む対象データ集合10を取得する。
算出部2040は、分割個数情報30によって示される分割個数で、要因データ22-1の数値範囲と要因データ22-2の数値範囲のそれぞれを分割する。なお、分割個数情報30は、要因データ22-1と要因データ22-2について共通の分割個数を示してもよいし、それぞれについて別の分割個数を示してもよい。例えば要因データ22-1の分割個数が4であり、要因データ22-2の分割個数が5であるとする。この場合、算出部2040は、要因データ22-1の数値範囲を4等分し、要因データ22-2の数値範囲を5等分する。すなわち、算出部2040は、要因データ22-1について3つの境界値を特定し、要因データ22-2について4つの境界値を特定する。
算出部2040は、要因データ22-1についての境界値と要因データ22-2についての境界値の複数通りのペアそれぞれについて、そのペアで定められた境界で対象データ集合10を2分割して、第1標本と第2標本を生成する。そして、生成した第1標本と第2標本について、前述したように、検定統計量の算出を行う。
図12は、変形例の分析装置2000における第1標本と第2標本を例示する図である。この例では、要因データ22-1の境界値 b2 と、要因データ22-2についての境界値 c2 とのペアで定まる境界で、第1標本と第2標本が生成されている。具体的には、算出部2040は、「要因データ22-1が b2 以下であり、かつ、要因データ22-2が c2 以下である」という条件を満たす対象データ20の集合を第1標本12として生成し、「要因データ22-1が b2 より大きい、又は、要因データ22-2が c2 より大きい」という条件を満たす対象データ20の集合を第2標本14として生成している。
ただし、前述の様に2つの境界値のペアを利用して対象データ集合10を2つの標本に分ける方法には、図1で例示した方法(以下、第1の方法)以外も採用しうる。図13は、2つの境界値のペアを用いて対象データ集合10を2つの標本に分けるその他の方法を例示する図である。図13に示すように、前述した方法以外にも、「要因データ22-1が境界値以下、かつ、要因データ22-2が境界値以上」と「要因データ22-1が境界値より大きい、又は、要因データ22-2が境界値より小さい」に分ける第2の方法、「要因データ22-1が境界値以上、かつ、要因データ22-2が境界値以下」と「要因データ22-1が境界値より小さい、又は、要因データ22-2が境界値より大きい」に分ける第3の方法、及び「要因データ22-1が境界値以上、かつ、要因データ22-2が境界値以上」と「要因データ22-1が境界値より小さい、又は、要因データ22-2が境界値より小さい」に分ける第4の方法などがある。これらのうちのどの方法で対象データ集合10を分割するのかは、予め定められていてもよいし、ユーザによって選択されてもよい。
図14は、変形例の分析装置2000によって出力される情報を例示する図である。図14が示す画面140は、図11の画面130で表した情報を、2つの要因を利用するケースに適用したものである。
画面140は、表示エリア141から145を有する。表示エリア141は、要因データ22-1と要因データ22-2それぞれについての時間変化を表す時系列グラフ100を含む。表示エリア142は、要因データ22-1についてのヒストグラム90-1と、要因データ22-2についてのヒストグラム90-2を含む。
表示エリア143は、表示エリア133と同様に、検定方法と検定粒度を指定する入力インタフェース、及び検定の実行を指示するためのボタンを含む。さらに、表示エリア143は、第1標本と第2標本の分割方法を指定する入力インタフェース146を含む。ユーザは、入力インタフェース146は、4分割された長方形から成る4つのエリアを有し、4つのエリアのいずれか1つが指定できるようになっている。指定されたエリアには、色が付されるようになっている。
入力インタフェース146は、図12や図13で例示した、2つの要因データ22の数値範囲から成る平面を模している。ユーザが4つのエリアのいずれか1つを指定すると、2つの要因データ22の数値範囲から成る平面を、指定されたエリアとそれ以外のエリアに分けるように、対象データ集合10が2つの標本に分割される。例えば図14の例では、左上のエリアが指定されている。そのため、対象データ集合10は、「要因データ22-1が境界値以下、かつ、要因データ22-2が境界値以下」とそれ以外という2つの標本に分割されている。
表示エリア144は、検定統計量グラフ150を表す。算出部2040は、要因データ22-1の境界値と要因データ22-2の境界値の複数のペアそれぞれについて、そのペアで得られた2つの標本についての検定統計量を算出し、それら複数の検定統計量を表す統計情報40(ここでは検定統計量グラフ150)を生成する。検定統計量グラフ150の各セルは、そのセルに対応する境界値のペアについて得られた検定統計量を表す。例えば図14の例において、各セルは、そのセルの右下端が表す境界値のペアについて得られた検定統計量の大きさを表す。
検定統計量グラフ150において、検定統計量の大きさは色や模様などで表される。例えば、検定統計量が大きいほど色を濃くしたり、模様を密にしたりする。図14の例では、検定統計量が大きいセルほど、より大きなドットの模様が付されている。また、検定統計量が閾値 th 以上であるセルには、枠152が付されている。
ユーザは、着目したい境界値のペアを指定することができる。具体的には、ユーザは、着目したい境界値のペアに対応する1つのセルを指定する。生成部2060は、この指定に応じて、指定されたセル及び指定された標本分割の方法で生成される標本ペアについて、不良率の改善に関する情報を生成する。
図14の例では、「成分Aの境界値=b2、成分Bの境界値=c2」という境界値のペアを表すセルが指定されている。また、数値範囲の平面を左上とそれ以外に分割する方法が指定されている。そこで、「成分Aの値≦b2、かつ、成分Bの値≦c2」の標本と、「成分Aの値>b2、又は、成分Bの値>c2」の標本に分割されている。なお、この指定に応じて、ヒストグラム90-1と90-2の表示態様が変更される。具体的には、実施形態1で説明したように、指定された境界値以下のランクとそれ以外とで、色や模様が互いに異なるものに設定される。
生成部2060は、上述した分割について、不良率の改善のシミュレーションを示す情報を、表示エリア145に表示する。表示エリア145には、「成分Aを b2 以下にし、かつ、成分Bを c2 以下にする」という条件を満たす対象データ20と、全ての対象データ20における不良率とについて、不良品の数、良品の数、及び不良率の比較が示されている。このような比較により、ユーザは、「成分Aを b2 以下にし、かつ、成分Bを c2 以下にする」という製造条件で製品を製造することによって不良率をどの程度改善できるのかを、容易に把握することができる。
以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記各実施形態の組み合わせ、又は上記以外の様々な構成を採用することもできる。
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
1. 要因に関する値である要因データと結果に関する値である結果データとのペアを示す対象データの集合と、前記要因データの数値範囲を分割する個数を示す分割個数情報を取得する取得部と、
前記数値範囲を前記個数に分割する複数の境界値それぞれについて、前記対象データの集合に含まれる対象データをその境界値で2分割して得られる2つの標本における、前記結果データに関する差異を表す検定統計量を算出する算出部と、
前記境界値ごとに算出された複数の検定統計量を示す検定統計量情報を生成する生成部と、を有する分析装置。
2. 前記結果データは不良の有無を示しており、
前記算出部は、境界値ごとに、2つの標本それぞれにおける不良率を算出し、算出した2つのエラー率の差を表す検定統計量を算出する、1.に記載の分析装置。
3. 前記要因データは、製品の製造条件を表す指標の値を示し、
前記結果データは、前記製品が不良品であるか否かを示す、2.に記載の分析装置。
4. 前記検定統計量情報は、前記境界値と前記検定統計量の組み合わせを示すグラフである、1.から3いずれか一つに記載の分析装置。
5. 前記生成部は、前記グラフに、有意水準を表す前記検定統計量の閾値を表す表示を含める、4.に記載の分析装置。
6. 前記生成部は、前記グラフと共に、前記要因データの分布を表すヒストグラムを出力する、4.又は5.に記載の分析装置。
7. 前記生成部は、
前記グラフに対して境界値を指定する入力を受け付け、
前記入力を受け付けたことに応じ、前記ヒストグラムにおいて、前記指定された境界値以下の各境界値に対応するランクのデータの表示態様と、前記指定された境界値より大きい各境界値に対応するランクのデータの表示態様とを異なるものにする、6.に記載の分析装置。
8. 前記対象データは、第1の前記要因データ、第2の前記要因データ、及び前記結果データの組みを示し、
前記算出部は、第1の前記要因データの数値範囲を前記個数に分割する複数の第1の境界値と、第2の前記要因データの数値範囲を前記個数に分割する複数の第2の境界値との各組みについて、前記対象データの集合に含まれる対象データをその境界値の組みに基づいて2分割して得られる2つの標本について前記検定統計量を算出する、1.から7.いずれか1つに記載の分析装置。
9. コンピュータによって実行される制御方法であって、
要因に関する値である要因データと結果に関する値である結果データとのペアを示す対象データの集合と、前記要因データの数値範囲を分割する個数を示す分割個数情報を取得する取得ステップと、
前記数値範囲を前記個数に分割する複数の境界値それぞれについて、前記対象データの集合に含まれる対象データをその境界値で2分割して得られる2つの標本における、前記結果データに関する差異を表す検定統計量を算出する算出ステップと、
前記境界値ごとに算出された複数の検定統計量を示す検定統計量情報を生成する生成ステップと、を有する制御方法。
10. 前記結果データは不良の有無を示しており、
前記算出ステップにおいて、境界値ごとに、2つの標本それぞれにおける不良率を算出し、算出した2つのエラー率の差を表す検定統計量を算出する、9.に記載の制御方法。
11. 前記要因データは、製品の製造条件を表す指標の値を示し、
前記結果データは、前記製品が不良品であるか否かを示す、10.に記載の制御方法。
12. 前記検定統計量情報は、前記境界値と前記検定統計量の組み合わせを示すグラフである、9.から11.いずれか一つに記載の制御方法。
13. 前記生成ステップにおいて、前記グラフに、有意水準を表す前記検定統計量の閾値を表す表示を含める、12.に記載の制御方法。
14. 前記生成ステップにおいて、前記グラフと共に、前記要因データの分布を表すヒストグラムを出力する、12.又は13.に記載の制御方法。
15. 前記生成ステップにおいて、
前記グラフに対して境界値を指定する入力を受け付け、
前記入力を受け付けたことに応じ、前記ヒストグラムにおいて、前記指定された境界値以下の各境界値に対応するランクのデータの表示態様と、前記指定された境界値より大きい各境界値に対応するランクのデータの表示態様とを異なるものにする、14.に記載の制御方法。
16. 前記対象データは、第1の前記要因データ、第2の前記要因データ、及び前記結果データの組みを示し、
前記算出ステップにおいて、第1の前記要因データの数値範囲を前記個数に分割する複数の第1の境界値と、第2の前記要因データの数値範囲を前記個数に分割する複数の第2の境界値との各組みについて、前記対象データの集合に含まれる対象データをその境界値の組みに基づいて2分割して得られる2つの標本について前記検定統計量を算出する、9.から15.いずれか1つに記載の制御方法。
17. 9.から16.いずれか一つに記載の制御方法をコンピュータに実行させるプログラム。
この出願は、2019年11月1日に出願された日本出願特願2019-199613号を基礎とする優先権を主張し、その開示の全てをここに取り込む。
10 対象データ集合
12 第1標本
14 第2標本
20 対象データ
22 要因データ
24 結果データ
30 分割個数情報
40 検定統計量情報
50 テーブル
52 境界値
54 検定統計量
60 ユーザ端末
70 検定統計量グラ
2 バー
74 閾値表示
76 説明表示
80 画面
82、84、86 入力エリア
88 ボタン
90 ヒストグラム
100 時系列グラフ
102 折れ線
110 折れ線
130 画面
131、132、133、134、135、136、137 表示エリア
140 画面
141、142、143、144、145 表示エリア
146 入力インタフェース
150 検定統計量グラフ
152 枠
1000 計算機
1020 バス
1040 プロセッサ
1060 メモリ
1080 ストレージデバイス
1100 入出力インタフェース
1120 ネットワークインタフェース
2000 分析装置
2020 取得部
2040 算出部
2060 生成部

Claims (8)

  1. 要因に関する値である要因データと結果に関する値である結果データとのペアを示す対象データの集合と、前記要因データの数値範囲を分割する個数を示す分割個数情報を取得する取得部と、
    前記数値範囲を前記個数に分割する複数の境界値それぞれについて、前記対象データの集合に含まれる対象データをその境界値で2分割して得られる2つの標本における、前記結果データに関する差異を表す検定統計量を算出する算出部と、
    前記境界値ごとに算出された複数の検定統計量を示す検定統計量情報を生成する生成部と、を有する分析装置。
  2. 前記結果データは不良の有無を示しており、
    前記算出部は、境界値ごとに、2つの標本それぞれにおける不良率を算出し、算出した2つのエラー率の差を表す検定統計量を算出する、請求項1に記載の分析装置。
  3. 前記要因データは、製品の製造条件を表す指標の値を示し、
    前記結果データは、前記製品が不良品であるか否かを示す、請求項2に記載の分析装置。
  4. 前記検定統計量情報は、前記境界値と前記検定統計量の組み合わせを示すグラフである、請求項1から3いずれか一項に記載の分析装置。
  5. 前記生成部は、前記グラフに、有意水準を表す前記検定統計量の閾値を表す表示を含める、請求項4に記載の分析装置。
  6. 前記生成部は、前記グラフと共に、前記要因データの分布を表すヒストグラムを出力する、請求項4又は5に記載の分析装置。
  7. コンピュータによって実行される制御方法であって、
    要因に関する値である要因データと結果に関する値である結果データとのペアを示す対象データの集合と、前記要因データの数値範囲を分割する個数を示す分割個数情報を取得する取得ステップと、
    前記数値範囲を前記個数に分割する複数の境界値それぞれについて、前記対象データの集合に含まれる対象データをその境界値で2分割して得られる2つの標本における、前記結果データに関する差異を表す検定統計量を算出する算出ステップと、
    前記境界値ごとに算出された複数の検定統計量を示す検定統計量情報を生成する生成ステップと、を有する制御方法。
  8. 請求項7に記載の制御方法をコンピュータに実行させるプログラム。
JP2021553711A 2019-11-01 2020-10-30 分析装置、制御方法、及びプログラム Active JP7276489B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2019199613 2019-11-01
JP2019199613 2019-11-01
PCT/JP2020/040767 WO2021085585A1 (ja) 2019-11-01 2020-10-30 分析装置、制御方法、及びプログラム

Publications (3)

Publication Number Publication Date
JPWO2021085585A1 JPWO2021085585A1 (ja) 2021-05-06
JPWO2021085585A5 JPWO2021085585A5 (ja) 2022-06-27
JP7276489B2 true JP7276489B2 (ja) 2023-05-18

Family

ID=75715215

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021553711A Active JP7276489B2 (ja) 2019-11-01 2020-10-30 分析装置、制御方法、及びプログラム

Country Status (5)

Country Link
US (1) US20240070590A1 (ja)
EP (1) EP4053764A4 (ja)
JP (1) JP7276489B2 (ja)
CN (1) CN114600101A (ja)
WO (1) WO2021085585A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009116842A (ja) 2007-03-09 2009-05-28 Omron Corp 要因推定支援装置およびその制御方法、ならびに要因推定支援プログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5429869B2 (ja) * 2008-12-22 2014-02-26 株式会社 Ngr パターン検査装置および方法
JP5615252B2 (ja) * 2011-12-02 2014-10-29 株式会社トプコン 外観検査装置
US10109493B2 (en) 2015-01-12 2018-10-23 Versum Materials Us, Llc Composite abrasive particles for chemical mechanical planarization composition and method of use thereof
JP6833642B2 (ja) 2017-08-10 2021-02-24 株式会社東芝 要因分析装置、要因分析方法、およびプログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009116842A (ja) 2007-03-09 2009-05-28 Omron Corp 要因推定支援装置およびその制御方法、ならびに要因推定支援プログラム

Also Published As

Publication number Publication date
CN114600101A (zh) 2022-06-07
JPWO2021085585A1 (ja) 2021-05-06
WO2021085585A1 (ja) 2021-05-06
EP4053764A1 (en) 2022-09-07
EP4053764A4 (en) 2022-12-21
US20240070590A1 (en) 2024-02-29

Similar Documents

Publication Publication Date Title
US7107187B1 (en) Method for modeling system performance
Hoßfeld et al. Speed index: Relating the industrial standard for user perceived web performance to web qoe
CN102955902B (zh) 雷达模拟设备可信度的评估方法及评估系统
CN112884092B (zh) Ai模型生成方法、电子设备及存储介质
CN107194430B (zh) 一种样本筛选方法及装置,电子设备
CN109446812A (zh) 一种嵌入式系统固件安全分析方法及系统
EP4120653A1 (en) Communication network performance and fault analysis using learning models with model interpretation
Menezes et al. On the globalization of stock markets: an application of vector error correction model, mutual information and singular spectrum analysis to the G7 countries
CN107944005B (zh) 一种数据展示方法及装置
US20190012622A1 (en) Computer-readable recording medium for visualization of manufacturing-process, method of visualizing manufacturing process, and manufacturing-process visualizing system
CN110244185A (zh) 一种多源谐波责任划分方法、终端设备及存储介质
CN110909005B (zh) 一种模型特征分析方法、装置、设备及介质
KR20190060548A (ko) 변수 구간별 불량 발생 지수를 도출하여 공정 불량 원인을 파악하고 시각화하는 방법
CN110189031A (zh) 一种基于因子回归分析的配电网诊断指标分类方法
JP7276489B2 (ja) 分析装置、制御方法、及びプログラム
CN108509732A (zh) 汽轮机故障严重程度的评估方法、终端设备及存储介质
CN116319255A (zh) 一种基于kpi的根因定位方法、装置、设备及存储介质
CN110971483B (zh) 一种压力测试的方法、装置及计算机系统
CN112860531B (zh) 基于深度异构图神经网络的区块链广泛共识性能评测方法
US20220076049A1 (en) Importance analysis apparatus, method, and non-transitory computer readable medium
CN115270923A (zh) 一种基于场景的可视化智能决策方法及系统
WO2021079966A1 (ja) 分析装置、制御方法、及びプログラム
CN106855840B (zh) 一种系统cpu分析方法和装置
JP4893695B2 (ja) カバレージ測定装置、カバレージ測定方法、カバレージ測定プログラム
CN110688302B (zh) 一种字段库自动化测试方法及装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220421

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220421

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230404

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230417

R151 Written notification of patent or utility model registration

Ref document number: 7276489

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151