JP6904331B2 - 要因分析装置、要因分析方法、およびプログラム - Google Patents

要因分析装置、要因分析方法、およびプログラム Download PDF

Info

Publication number
JP6904331B2
JP6904331B2 JP2018507295A JP2018507295A JP6904331B2 JP 6904331 B2 JP6904331 B2 JP 6904331B2 JP 2018507295 A JP2018507295 A JP 2018507295A JP 2018507295 A JP2018507295 A JP 2018507295A JP 6904331 B2 JP6904331 B2 JP 6904331B2
Authority
JP
Japan
Prior art keywords
time series
group
data
influence
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018507295A
Other languages
English (en)
Other versions
JPWO2017164095A1 (ja
Inventor
毅彦 溝口
毅彦 溝口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2017164095A1 publication Critical patent/JPWO2017164095A1/ja
Application granted granted Critical
Publication of JP6904331B2 publication Critical patent/JP6904331B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/045Explanation of inference; Explainable artificial intelligence [XAI]; Interpretable artificial intelligence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Quality & Reliability (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Medical Informatics (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Manufacturing & Machinery (AREA)
  • Automation & Control Theory (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • General Factory Administration (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本開示は、要因分析装置、要因分析方法およびプログラムに関し、特に目的変数の値の変化に寄与する説明変数を特定する要因分析装置、要因分析方法およびプログラムに関する。
目的変数と説明変数との関係を明らかにし、目的変数の値の変化に強い影響を持つ説明変数を特定するための技術として、回帰分析などの統計的手法が、物品の製造現場における品質管理やシステム管理等において広く利用されている。
例えば、物を製造するプロセスにおいて、製造品の品質に影響を与える要因を特定するために、センサなどの計測器によって観測できる様々な項目について観測値を取得し分析する統計的手法が、用いられる(特許文献1、2)。複数の項目が品質に影響を与えると考えられる場合には、品質を表す項目を目的変数とし、複数の項目を説明変数とした、多変量解析を行うのが一般的である。分析者は、多変量解析によってそれぞれの説明変数の寄与率や関連の度合い等を算出することで、説明変数それぞれの、目的変数の値の変化に与える影響の程度(すなわち、説明変数それぞれの影響度)を知ることができる。
ところで、製造プロセスなどの工程では、品質や生産効率などの指標に強い影響を持つ項目が、強い影響を持つことが既知である項目であったり、値の制御が不能な項目であったりする場合がある。したがって、強い影響を持つ項目以外の項目についても、その項目が指標にどのような、また、どの程度、影響を持つものであるか、知見を得ることが重要である。
しかし、一般に、多変量解析手法では、目的変数の値の変化に著しく強い影響をもつ項目が説明変数に含まれる場合、その変数の寄与率(その説明変数が目的変数の値を決定づけている度合)が大きく算出される。その結果、他の説明変数の寄与率は相対的に小さく算出され、目的変数の値に強い影響を持つ説明変数(影響要因)であっても、影響要因でないと判断される場合がある。
このように、要因分析においては、すべての項目を説明変数として行う解析によっては発見することが難しい影響要因が存在しうる。この問題に対し、目的変数の値の変化に著しく強い影響を持たない項目のみを用いて解析を行っても、解析結果である関数のあてはまりが十分でなかったり、精度のよい解析ができなかったりする可能性があり、正しく影響要因を特定することはできない。
特許文献3および4には、影響要因でありながら寄与率が低いために大きな影響要因に隠れてしまう説明変数を見つける技術が記載されている。この技術では、目的変数に対する寄与率の高い説明変数を用いて重回帰式を求め、計算して得られる目的変数の予測値と実測値との差を新たに目的変数とした重回帰分析を、残りの説明変数を新たな説明変数として行う。
特許文献5には、製造工程における多数の項目について、測定順序または工程順序を踏まえつつ項目間で重回帰分析を行うことで、項目間の階層的な関係を可視化する技術が記載されている。
特開2009−258890号公報 特開2002−110493号公報 特開2007−329415号公報 米国特許出願公開第2007/0288105号明細書 特開2011−150496号公報
特許文献3および4に記載の技術は、寄与率が大きい説明変数のそれぞれとの関連度が小さな説明変数が、隠れていた影響要因として特定されやすい技術である。しかし、寄与率が大きい説明変数のいずれかと関連度が大きい説明変数は、この技術によっても隠されやすく、発見されにくい。
特許文献5に記載の技術は、各項目間で影響度を算出するものの、影響要因の候補となるすべての項目を説明変数として重回帰分析を行うため、強い影響を持つ項目と強い関連度を有している項目は影響度が過小評価されやすい。特に、時間的な前後がなく、因果関係が明確でない説明変数の組に対しては、関係づけが正しく算出されにくいと考えられる。
したがって、強い影響要因に隠れてしまう影響要因を特定できる、上記特許文献とは異なる方法が望まれる。
また、解析によって影響度が大きいと判断された要因が、指標を改善する上で制御不可能な項目の値である場合がある。この場合、目的変数の値を制御する上で、制御不可能でない項目のそれぞれが、当該制御不可能な項目にどの程度寄与するかを知ることが肝要である。
そこで、本発明は、多変量解析において、それぞれのデータの影響度に関するより有用な知見を得ることが可能な要因分析装置、要因分析方法およびプログラムを提供することを目的の一つとする。
本発明の一実施態様に係る要因分析装置は、データの種類を第1グループ、または第2グループに分類する分類手段と、前記第2グループに分類される種類のデータの、前記第1グループの種類のデータに対する影響度を目的データへの影響度として算出する影響度算出手段と、を備えることを特徴とする。
本発明の一実施態様に係る要因分析方法は、データの種類を第1グループ、または第2グループに分類し、前記第2グループに分類される種類のデータの、前記第1グループの種類のデータに対する影響度を目的データへの影響度として算出する影響度算出手段する、ことを特徴とする。
本発明の一実施態様に係るプログラムは、データの種類を第1グループ、または第2グループに分類する分類処理と、前記第2グループに分類される種類のデータの、前記第1グループの種類のデータに対する影響度を目的データへの影響度として算出する影響度算出処理と、をコンピュータに実行させることを特徴とする。
本発明によれば、それぞれのデータの影響度に関するより有用な知見を得ることができる。
本発明の第1の実施形態の要因分析装置の構成を示すブロック図である。 第1の実施形態で用いられる時系列の例を表す図である。 グラフとして可視化された時系列の例である。 第1の実施形態のデータ記憶部におけるデータの格納の形態の例を示す図である。 第1の実施形態のデータ記憶部におけるデータの格納の形態の別の例を示す図である。 第1の実施形態の要因分析装置によるデータの蓄積の処理の流れを示すフローチャートである。 第1の実施形態の要因分析装置による要因分析の処理の流れを示すフローチャートである。 第1の実施形態の影響度記憶部に保存された、第2グループの説明時系列のそれぞれの、代表時系列の値の変化に対する影響度の表の例を示す図である。 第1の実施形態の出力装置により影響度記憶部から出力された解析結果の例を示す図である。 本発明の第2の実施形態の要因分析装置の構成を示すブロック図である。 第2の実施形態の要因分析装置による要因分析の処理の流れを示すフローチャートである。 本発明の各実施形態の各部を構成するハードウェアの例を示すブロック図である。 第1の実施形態の各部を回路で構成した場合のブロック図である。 第2の実施形態の各部を回路で構成した場合のブロック図である。
<<第1の実施形態>>
本発明の第1の実施形態を詳細に説明する。
本実施形態では、例として、要因分析装置が、ある製品の製造工程における品質管理に適用される場合を説明する。ただし、本発明の用途は、製造工程における分析や品質管理に限定されない。
<構成>
図1は、本実施形態の要因分析装置10の構成例を示すブロック図である。要因分析装置10は、1つ以上のデータ取得部20と通信可能に接続される。
データ取得部20は、製造工程における様々な項目に関する値を、たとえば計測することによって取得する。データ取得部20は、製品工程における様々な項目に関し設定された値を取得してもよい。データ取得部20は、取得した値を要因分析装置10に送信する。
値を取得する対象となる項目は、製造品の品質指標または製造条件に分類される。品質指標とは、製品の品質または製品に対する評価を示す項目である。どのような項目を品質指標とするかは、製品の特徴に応じて様々な観点によって決められてよい。品質指標に分類される項目の例は、製品の導電性、耐水性、耐熱性、および正常に動作するか否かを示す製品状態等である。品質指標の項目に関する値は、数値の大きさで表すことができる定量的な値でもよいし、「正常/異常」などの定性的な(質的な)値でもよい。製造条件とは、製品の品質指標の値を左右する可能性のある因子を表す項目である。製造条件に分類される項目の例は、例えば、温度、圧力、ガス流量、電圧、材料の粘度または特定の操作を行っているか否かを示す操作状況等である。製造条件を示す項目は、値が取得可能なあらゆる項目の中から選択されうる。製造条件は、数値で示される量的な値でもよいし、「有/無」などの質的な値でもよい。
データ取得部20がそれぞれの項目に関する値を取得する方法は、例えばセンサを用いた計測によってもよいし、保守員による判定や設定によってもよい。例えば、データ取得部20はセンサを備え、そのセンサにより項目に関する値を取得してもよい。例えば、データ取得部20は入力インタフェースを備え、保守員が入力した判定の結果や設定を、項目に関する値として取得してもよい。あるいは、ソフトウェア・プログラム等が製造条件を変化させたり、取得したりできる場合、データ取得部20は、当該ソフトウェア・プログラム等からその製造条件に関する値を取得してもよい。また、データ取得部20は複数存在してもよいし、1つのデータ取得部20が複数の項目に関する値を取得してもよい。
以下、データ取得部20によって取得された値を観測値と呼ぶ。
本実施形態では、データ取得部20は、観測値を、たとえば、観測値を取得し次第、または、随時(たとえば、所定の時間ごとに)、要因分析装置10へ送信する。データ取得部20は、観測値に、その観測値を取得した時刻を関連づけてもよい。
これにより、本実施形態の要因分析装置10の、例えば後述されるデータ分類部102が、複数の項目の観測値を、時刻の情報に基づいて互いに関連づけることができる。データ取得部20が観測値を取得し次第観測値を送信する場合は、要因分析装置10のデータ分類部102が、観測値を受信した時刻をその観測値に関連づけてもよい。
本実施形態では、取得された観測値を時刻順に並べたデータを「時系列」と呼ぶ。図2は、ある項目の時系列(時系列1)の例を表す図である。データ分類部102は、例えば図2に示す例のように、観測値が取得された時刻と、取得された時刻に関連づけられた観測値との列を、時系列としてデータ記憶部111に記録する。図3は、グラフとして可視化された時系列の例である。
また、本実施形態では、上述の品質指標に係る項目の時系列を「目的時系列」、上述の製造条件に係る項目の時系列を「説明時系列」と呼ぶ。すなわち、「目的時系列」は、分析者がその値の変化に影響する要因を分析しようとする時系列である。「説明時系列」は、「目的時系列」の値の変化に影響する可能性があると考えられる項目に係る時系列である。
要因分析装置10は、データ取得部20が取得した観測値を受信する。要因分析装置10は、たとえば製造ラインに併設され、データ取得部20から観測値を直接取得してもよい。要因分析装置10は、遠隔のサーバに実装されていてもよい。要因分析装置10が遠隔のサーバ上に実装される場合、たとえば、データ取得部20にて取得した観測値を、分析者が製造ラインに併設された端末から通信ネットワークを介してサーバの要因分析装置10に送信すればよい。
要因分析装置10は、例えば、プログラムがロードされたメモリと、プログラムに従って処理を実行する中央演算装置(CPU;Central Processing Unit)によって実現される。また、要因分析装置10は、プログラムに基づくCPUの制御によって動作するコンピュータによって実現されてもよい。
図1を参照して、要因分析装置10の構成を説明する。要因分析装置10は、受信部101と、データ分類部102と、時系列分類部103と、説明時系列分類部104と、代表時系列選択部105と、影響度算出部106と、解析部107と、データ記憶部111と、影響度記憶部112とを含む。データ分類部102、時系列分類部103、説明時系列分類部104、代表時系列選択部105、影響度算出部106、および解析部107は、例えば、プログラム制御に従って処理を実行するCPUによって実現される。データ記憶部111および影響度記憶部112は、例えば、RAM(Random Access Memory)等の記憶装置で実現される。データ記憶部111および影響度記憶部112を構成する記憶装置は1個でも複数個でもよい。
受信部101は、データ取得部20が取得した観測値を受信する。
データ分類部102は、受信部101が取得した観測値がどの項目に関する観測値であるかを識別し、取得した観測値を、識別した項目の時系列を構成する観測値としてデータ記憶部111に保存する。たとえば、観測値には項目を識別できる情報がデータ取得部20によって関連づけられていてもよい。データ分類部102は、その情報によって識別された項目の時系列に、その観測値を追加する。あるいは、たとえば、データ分類部102は、受信した観測値がどのデータ取得部20から送信された観測値であるかを認識し、認識した情報に関連づけられる項目の時系列に、観測値を追加してもよい。データ分類部102は、受信した観測値がどのセンサにより観測された観測値であるかを認識し、認識した情報に関連づけられる項目の時系列に、観測値を追加してもよい。データ分類部102は、このように観測値をデータ記憶部111に蓄積することで、項目別に時系列を生成する。このように、項目は時系列の種類を表すといえる。本発明の各実施形態では、項目を「種類」と表記することもある。なお、データ分類部102は、時系列を生成してから、生成した時系列をデータ記憶部111に保存してもよい。
データ記憶部111は、項目ごとに、時系列を構成する観測値を記憶する。
図4は、データ記憶部111における観測値の格納の形態の例を示す図である。データ記憶部111は、項目ごとに、データ分類部102から受信する観測値の値を、その値が観測された時刻とともに記憶する。観測値は観測された時刻順に記憶されることで、時系列を成す。
データ記憶部111は、それぞれの時系列について、その時系列の種別情報を関連づけて記憶する。種別情報は、時系列が目的時系列であるか説明時系列であるかを示す情報である。それぞれの時系列の種別情報は、後述する時系列分類部103によって決定される。図4に示す例において、「種別」の値は、時系列の種別情報を表す。図4に示す表の「種別」の欄を参照すると、時系列0が目的時系列であり、時系列1〜4が説明時系列であることがわかる。
データ記憶部111は、それぞれの説明時系列について、グループ情報を関連づけて記憶する。グループ情報は、説明時系列が第1グループに属するか、第2グループに属するかを示す情報である。グループ情報は、後述する説明時系列分類部104によって決定される。図4に示す例において、「グループ」の値は、時系列が属するグループを表す。図4に示す表の「グループ」の欄を参照すると、時系列1,2が第1グループに属し、時系列3,4が第2グループに属することがわかる。
データ記憶部111は、第1グループに属する説明時系列について、その時系列が代表時系列であるか否かを示す情報を関連づけて記憶する。代表時系列は、代表時系列選択部105によって、説明時系列から選ばれる時系列である。代表時系列であるか否かを示す情報は、後述する代表時系列選択部105によって決定される。図4に示す例では、「代表時系列」の欄において、代表時系列である時系列には「Y」、代表時系列でない時系列には「N」が関連付けられている。図4に示す例では、時系列1が「代表時系列」であることがわかる。
図5は、データ記憶部111におけるデータの格納の形態の別の例を示す図である。図5に示す例では、目的時系列の欄に時系列0が含まれ、説明時系列の欄に時系列1〜4が含まれる。説明時系列の欄は、第1グループまたは第2グループの欄に分かれる。第1グループの欄は、代表時系列の欄または代表時系列でない欄に分かれる。図5に示す例では、目的時系列は時系列0で、第1グループの説明時系列は時系列1,2で、第2グループの説明時系列は時系列3,4であることがわかる。また、代表時系列は時系列1であることがわかる。
図4および図5は一例であり、時系列の記憶の態様はこれらの例に限定されない。データ記憶部111は、それぞれの時系列について、種別やグループ等の情報がわかるように記憶すればよい。
時系列分類部103は、データ記憶部111の時系列を、目的時系列または説明時系列に分類する。たとえば、ある時系列が製品条件に関する時系列である場合、時系列分類部103は、その時系列を説明時系列であると判定する。判定のため、観測値には時系列の種別を判定できる情報がデータ取得部20によって関連づけられていてもよい。そして、時系列分類部103は、たとえば、図4で示されるように、時系列に種別情報を関連づける。あるいは、時系列分類部103は、図5で示されるように、種別情報が関連付けられた領域に時系列を配置する。
説明時系列分類部104は、説明時系列を、第1グループ、または第2グループに分類する。具体的には、説明時系列分類部104は、それぞれの説明時系列について、その説明時系列が第1グループまたは第2グループのいずれのグループに属するかを判定する。
本実施形態では、説明時系列を第1グループまたは第2グループに分類する基準は、その説明時系列が目的時系列に対する影響要因であることが明らかであると特定されたか否か、であるとする。説明時系列が目的時系列に対する影響要因であることが明らかであるか否かは、たとえば分析者および説明時系列分類部104のいずれか一方または双方によって判定されればよい。
たとえば、説明時系列が目的時系列に影響を与えることが分析者にとって既知である場合、分析者が、説明時系列を分類してもよい。この場合、分析者は、たとえば、過去の解析結果等によって目的時系列との相関が強いとわかっている説明時系列を、影響要因であることが明らかである説明時系列として特定する。そして、分析者は、特定した説明時系列を、要因分析装置10の入出力インタフェース等を介して説明時系列分類部104に指示すればよい。説明時系列分類部104は、指示された説明時系列を、第1グループに分類する。
説明時系列分類部104が、それぞれの説明時系列が、目的時系列に対する影響要因であることが明らかであるか否かを判定してもよい。説明時系列分類部104は、分析者によって特定されなかった説明時系列の中から、目的時系列に対する影響要因である説明時系列を特定してもよい。説明時系列分類部104は、目的時系列に対する影響要因であることが明らかである説明時系列の特定を、たとえば、事前に定義されたルールに基づいて行えばよい。
たとえば、説明時系列分類部104は、事前に定義された条件を満たす説明時系列を、目的時系列に対する影響要因であることが明らかな説明時系列として特定する。事前に定義された条件は、予め分析者等が要因分析装置10に対し設定すればよい。
上記条件は、説明時系列の属性に対する条件であってもよい。属性は、例えば、説明時系列のデータを取得したデータ取得部20に付与された名称(ラベル)または識別子、使用されたセンサの種類、センサに付与された名称、時系列として取得されたデータの種類(項目)、そのデータに付与された名称(項目名)、のいずれか一つまたは複数であってもよい。この場合、たとえばデータ分類部102が、説明時系列等の時系列に属性を付与すればよい。
条件は、属性の値によって表されていてもよい。その場合、説明時系列分類部104は、条件に一致する属性の値を持つ説明時系列を、影響要因であることが明らかである説明時系列として特定すればよい。条件は、正規表現によって表された属性の値であってもよい。その場合、説明時系列分類部104は、条件にマッチする属性の値を持つ説明時系列を、影響要因であることが明らかである説明時系列として特定すればよい。例えば、条件として、センサの名称が「*流量*」と指定された場合、たとえば名称が「超音波流量計」であるセンサによって取得されたデータの時系列は、影響要因であることが明らかな説明時系列として特定される。
複数の条件があってもよい。その場合、説明時系列分類部104は、いずれかの条件にマッチする属性の値を持つ説明時系列を、影響要因であることが明らかである説明時系列として特定すればよい。また、説明時系列分類部104は、複数の条件を表の形で保持していてもよい。分析者は、表の形で表された複数の条件を要因分析装置10に入力してもよい。条件は、複数の論理式によって表されていてもよい
説明時系列が目的時系列に対する影響要因であることが明らかであることは、説明時系列分類部104による計算や、観測結果によって判定されてもよい。
たとえば、説明時系列の値の変化に応じて目的時系列の値が変化することが観測された場合に、説明時系列分類部104は、その説明時系列を目的時系列に対する影響要因であるとして特定してもよい。たとえば、説明時系列分類部104は、説明時系列の値の変化に応じた目的時系列の値の変化の量や割合が、事前に定義された条件を満たす場合に、その説明時系列を、目的時系列に対する影響要因であることが明らかな説明時系列であると特定してもよい。説明時系列分類部104は、たとえば、説明時系列の値の変化の大きさに対する、その変化が生じた時の目的時系列の値の変化の割合を算出すればよい。そして、説明時系列分類部104は、算出した割合が、事前に定められた閾値より大きい場合に、その説明時系列を、目的時系列に対する影響要因であることが明らかな説明時系列として特定すればよい。
説明時系列分類部104は、目的時系列と説明時系列との間で計算できる情報量、たとえば相互情報量に基づいて、影響要因であることが明らかな説明時系列を特定してもよい。相互情報量は、例えば、MIC(Maximal Information Coefficient)法により算出可能である。説明時系列分類部104は、たとえば、観測されたすべての説明時系列に対して、目的時系列との相互情報量を計算し、相互情報量が所定の閾値より大きい説明時系列を第1グループに分類し、それ以外を第2グループに分類してもよい。
あるいは、説明時系列分類部104は、すべての説明変数を用いて目的変数に対する多変量解析を実行し、多変量解析の結果算出される、それぞれの説明変数の係数やp値に基づいて、それぞれの説明変数が影響要因であることが明らかであるか否かを判定してもよい。
グループの分類は、以上に説明した分類方法の組み合わせにより行われてよい。
説明時系列分類部104は、新たな時系列がデータ記憶部111に追加された場合や、まだ分類されていない時系列がある場合に、その時系列を分類すればよい。
説明時系列分類部104は、説明時系列がいずれのグループに属するかを判定した場合、その説明時系列がどちらのグループに属するかを示す情報(グループ情報)を、その説明時系列に関連づける。説明時系列分類部104は、たとえば、図4で示されるように、時系列にグループ情報を関連づける。あるいは、説明時系列分類部104は、図5で示されるように、グループ情報が関連付けられた領域に時系列を配置する。
代表時系列選択部105は、第1グループの説明時系列のうちの1つを代表時系列として選択する。
本実施形態では、例として、代表時系列選択部105は、目的時系列の値の変化に最も強く影響する時系列を代表時系列として選択する。代表時系列選択部105は、目的時系列の値の変化に最も強く影響する時系列を特定できる手法によって特定された説明時系列を、代表時系列として選択すればよい。たとえば、代表時系列選択部105は、第1グループの説明時系列のそれぞれの、目的時系列に対する影響度を算出する。影響度とは、影響の度合いを表す値である。第1グループの説明時系列の目的時系列に対する影響度とは、第1グループの説明時系列の値の変化が、目的時系列の値の変化に与える影響の度合いを表す値であると理解されてもよい。影響度は、たとえば、統計的な解析によって算出可能である。
たとえば、代表時系列選択部105は、目的時系列を目的変数とし、第1グループの説明時系列を説明変数とした多変量解析を実行する。代表時系列選択部105は、多変量解析手法として、目的変数の値の変化に対する説明変数の影響度を算出する方法であれば、いかなる手法を用いてもよい。たとえば、目的時系列が量的データである場合、代表時系列選択部105は、多変量解析として重回帰分析を用いることができる。重回帰分析が用いられた場合、代表時系列選択部105は、それぞれの説明変数について算出されるp値の逆数またはt値を、影響度と見なすことができる。目的時系列が質的データである場合、代表時系列選択部105は、たとえば、多変量解析としてロジスティック回帰分析を用いることができる。ロジスティック回帰分析が用いられた場合、代表時系列選択部105は、それぞれの説明変数について算出されるp値の逆数またはWald統計量を、影響度と見なすことができる。
本実施形態の説明では、説明変数が目的変数の値変化に対して与える影響が大きいほど、その説明変数の影響度の値は大きい。
代表時系列選択部105は、算出された影響度に基づき、目的時系列の値の変化に与える影響が最も大きい説明時系列を、代表時系列として選択すればよい。具体的には、代表時系列選択部105は、例えば上記のような方法で算出された影響度が最も大きい説明時系列を特定し、特定した説明時系列を代表時系列として選択すればよい。
なお、ある説明変数が質的データである場合は、代表時系列選択部105は、その説明変数をダミー変数に変換してから、多変量解析を行えばよい。
また、代表時系列選択部105が用いる多変量解析手法を1つに限る必要はない。代表時系列選択部105は、2つ以上の多変量解析手法を用いて、個別に影響度を算出し、算出された2つ以上の影響度を統合してもよい。影響度を統合する際は、代表時系列選択部105は、たとえば、それぞれの多変量解析手法において、算出された影響度を、最大値が1、最小値が0になるように正規化し、正規化された影響度の和あるいは平均をとればよい。代表時系列選択部105は、多変量解析手法に重みづけを行ってもよい。代表時系列選択部105は、多変量解析手法に設定された重みを、その多変量解析手法によって算出された影響に掛け、重みが掛けられた影響度を統合してもよい。
代表時系列選択部105は、代表時系列を選択したら、選択した代表時系列がいずれであるかを示す情報をデータ記憶部111に記録する。代表時系列選択部105は、影響度算出部106に当該情報を送信してもよい。
影響度算出部106は、第2グループの説明時系列のそれぞれの、代表時系列に対する影響度を算出する。具体的には、影響度算出部106は、データ記憶部111から、第2グループの説明時系列および代表説明時系列を読み出す。そして、影響度算出部106は、第2グループの説明時系列を説明変数、代表時系列を目的変数とした、多変量解析を実行し、その多変量解析の結果からそれぞれの説明時系列の影響度を算出する。影響度算出部106による影響度の算出の方法については、既に代表時系列選択部105で説明された方法と同様でよい。
影響度算出部106は、算出したそれぞれの影響度を、影響度記憶部112に保存する。この際、影響度算出部106は、算出した影響度(複数の多変量解析により複数の影響度が算出された場合は、統合された影響度)が大きい順に、第2グループの説明時系列をソートし、ソートされた説明時系列を影響度記憶部112に格納してもよい。
影響度記憶部112は、影響度算出部106によって算出された影響度を記憶する。
解析部107は、影響度算出部106による算出の結果を解析する。具体的には、解析部107は、算出された影響度に基づき、代表時系列の値の変化に対する影響が基準よりも大きい説明時系列を特定する。たとえば、解析部107は、算出された代表時系列に対する影響度が閾値を超える説明時系列を特定する。代表時系列は目的時系列に影響を与える影響要因であるため、代表時系列に対する影響度は、目的時系列に対する影響度の1つと見なすことができる。したがって、代表時系列に対する影響度が高い時系列は、目的時系列に対する影響度が高い時系列であるといえる。
上記の閾値は、分析者によって指定されていればよい。あるいは、閾値は、目的時系列に対する代表時系列の影響度に応じて決定されてもよい。たとえば、分析者はある値αを代表時系列に対する影響要因である可能性の判定に使用される閾値の基準(以下、「基準閾値」と表記)として指定しておく。代表時系列選択部105によって算出された代表時系列の、目的時系列に対する正規化された影響度がβである場合、解析部107は、αをβで割った値を上記の閾値とすればよい。解析部107の解析によってこの閾値に基づいて特定された時系列は、目的時系列に対して強い影響を与える時系列である可能性が高い。
あるいは、解析部107は、上述の基準閾値を、上述の判定の閾値として使用してもよい。その場合、解析部107は、代表時系列に対する影響度を補正し、補正した値を解析に用いてもよい。たとえば、代表時系列の、目的時系列に対する正規化された影響度がβである場合、解析部107は、それぞれの説明時系列の影響度をβで割った値を、基準閾値αと比較してもよい。
解析部107は、特定された説明時系列が目的時系列に対する影響が高い可能性があることを示す情報を、影響度記憶部112に記録する。
また、解析部107は、特定された説明時系列が目的時系列に対する影響要因であるか否かをさらに解析してもよい。たとえば、解析部107は、代表時系列を除いた第1グループの説明時系列と、当該特定された説明時系列とを説明変数とした、目的時系列に対する多変量解析を行う。この多変量解析により算出された、特定された説明時系列の目的時系列に対する寄与率が、有意である(たとえば、所定の閾値を超える)場合、特定された説明時系列は目的時系列に対する影響要因であるといえる。解析部107は、このように解析した結果を、影響度記憶部112に記録してもよい。
出力装置30は、影響度記憶部112に記憶された情報を分析者等に向けて出力する。出力装置30は、表示部等を有していてもよい。分析者等は、出力された情報によって、要因分析装置10による分析結果を確認できる。
なお、本実施の形態では、要因分析装置10と出力装置30とは別個の装置として記載されるが、要因分析装置10は、出力装置30を表示部として含んでいてもよい。
<動作>
次に、本実施形態の要因分析装置10の動作を、具体的なデータの例を示しながら説明する。
(データの蓄積)
図6は、要因分析装置10によるデータの蓄積の処理の流れを示すフローチャートである。まず、要因分析装置10の受信部101が、データ取得部20から観測値を受信する(ステップS61)。以下で説明する具体例では、56種類の項目が存在する。項目のうち、品質指標である項目が1つある。この項目が示す値は「正常」または「異常」の2値のいずれかであるとする。すなわち、この項目に係る観測値は質的データである。他の55個の項目は、製造条件に関する項目である。これら55個の項目は、量的なデータであってもよいし、質的なデータであってもよい。
次に、データ分類部102が、受信した観測値を、項目別に時系列としてデータ記憶部111に保存する(ステップS62)。こうして、56個の時系列がデータ記憶部111に記憶されたとする。
(分析)
次に、要因分析装置10が要因分析を行う処理を説明する。図7は、要因分析装置10による要因分析の処理の流れを示すフローチャートである。
なお、ステップS71以降の処理は、分析の対象となる1つの目的時系列および複数の説明時系列が解析に十分な数のデータで生成されてから開始するとよい。当処理は、図示しない分析者の指示によって開始してもよい。要因分析装置10が、十分なデータが蓄積されたと判断した場合(たとえば、全ての時系列の観測値の数が閾値に達した場合)に、ステップS71以降の処理を開始してもよい。
まず、時系列分類部103は、時系列を目的時系列または説明時系列に分類する(ステップS71)。ただし、時系列の分類は、必ずしも図7に示す動作のフローの開始後に行われなくともよい。時系列分類部103は、得られた時系列(または観測値)がデータ記憶部111に記録された時点で、その時系列(または観測値)の種別をデータ記憶部111に記録してもよい。
上記ステップS71の処理によって、データ記憶部111において、1つの目的時系列と、55個の説明時系列とが識別された状態となる。
次に、説明時系列分類部104は、要因分析の対象となる説明時系列のそれぞれを、第1グループまたは第2グループに分類する(ステップS72)。
説明時系列分類部104は、説明時系列をいずれかのグループに分類した場合、その説明時系列の分類先のグループを示す情報(グループ情報)をデータ記憶部111に記録する。
なお、説明時系列の分類は、必ずしも図7に示す動作のフローの開始後に行われなくともよい。たとえば、説明時系列分類部104は、項目のグループ情報や分類基準がわかっている場合は、わかっている情報をデータ取得部20に予め通知してもよい。その場合、データ取得部20がグループ情報を観測値に関連づけて観測値をデータ分類部102に送信することができる。説明時系列分類部104は、わかっている情報をデータ分類部102に予め通知してもよい。その場合、データ分類部102は、グループ情報を観測値に含めて観測値をデータ記憶部111に記録できる。
また、説明時系列分類部104は、説明時系列の分類を、すべての時系列の種別情報が決定する前に行ってもよい。たとえば、説明時系列分類部104は、時系列分類部103が時系列を説明時系列へと分類した時に、可能であれば、その時点でその説明時系列の分類を行ってもよい。
上記ステップS72の処理によって、たとえば5つの説明時系列t1、t2、t3、t4、およびt5が、第1グループに分類され、他の説明時系列1〜50が第2グループに分類されたとする。すなわち、説明時系列t1、t2、t3、t4、およびt5は、目的変数の値の影響要因であることが明らかである説明時系列であり、説明時系列1〜50は、目的変数の値の影響要因であることが明らかでない説明時系列である。
説明時系列のグループの分類が完了した場合、次に、代表時系列選択部105は、第1グループの説明時系列の中から1つを、代表時系列として選択する(ステップS73)。
本実施形態では、代表時系列は、目的時系列の値の変化に最も強く影響する説明時系列である。したがって、代表時系列選択部105は、説明時系列t1、t2、t3、t4、およびt5を説明変数として、目的時系列の回帰分析を行う。目的時系列は質的データであるため、代表時系列選択部105は、たとえば、L1正則化ロジスティック回帰分析を行えばよい。代表時系列選択部105は、この分析によって求められた回帰式における係数の値が最も高かった説明時系列を、代表時系列として選択する。
次に、影響度算出部106は、ステップS73で選択された代表時系列の値の変化に対する、第2グループの説明時系列の影響度を算出する(ステップS74)。そして、影響度算出部106は、算出したそれぞれの説明時系列の影響度を、影響度記憶部112に保存する(ステップS75)。
ステップS74において、影響度算出部106は、2つ以上の多変量解析手法を用いて、個別に影響度を求めてもよい。そして、影響度算出部106は、求めた2つ以上の影響度を統合してもよい。その場合、ステップS75において、影響度算出部106は、統合された影響度を、説明時系列の影響度として、影響度記憶部112に保存する。
図8は、ステップS75によって影響度記憶部112に記憶された影響度の例を示す表である。図8の例において、「順位」は、影響度の序列を表す。「時系列番号」は、時系列に付された、時系列を識別する番号を表す。「影響度」は、「時系列番号」により特定される時系列の影響度を表す。
そして、解析部107が、影響度算出部による影響度の算出結果を解析する(ステップS76)。そして、解析部107は、解析結果を影響度記憶部112に記録する。
解析が終了したら、解析結果は出力装置30によって、例えば分析者に出力される。
図9は、出力装置30によって出力された解析結果の例である。図9の例では、「順位」「時系列番号」「形状」「影響度」「改善提案」が出力されている。「順位」は、影響度の大きさの序列を表す。「時系列番号」は、時系列に付された、時系列を識別する番号を表す。「形状」には、「時系列番号」により特定される時系列のグラフの形状が記載される。「影響度」には、その時系列の影響度が記載される。解析部107は、図7の表の「改善提案」の欄で示されるように、代表時系列の値を変化させる(たとえば大きくする)ために、その時系列の項目の値をどのように変化させたら良いかを示した提案を解析結果に含めてもよい。改善提案に記載される内容は、時系列の形状や、説明時系列の値の変化に伴う代表時系列の値の変化に基づいて決定されればよい。このように、解析部107は、分析者の分析結果への理解を助けるための様々な情報が出力されるよう、影響度記憶部112に情報を付加してよい。
分析結果が出力されることにより、出力先の分析者等は、目的時系列の値の変化に対する寄与の程度が明らかでない説明変数について、代表時系列(すなわち、目的時系列の値の変化に影響を与える説明時系列の1つ)に対する影響度の序列を把握できる。
図9に示される例において、「時系列番号」が「8」である説明時系列が代表時系列に対して最も大きな影響度を持つことや、「時系列番号」が「22」である説明時系列が代表時系列に対して2番目に大きな影響度を持つことがわかる。また、「形状」および「影響度」および「改善提案」を参照することにより、分析者は、それぞれの時系列番号の説明時系列の、目的時系列に対する影響要因である可能性を検討できる。さらに、分析者は、時系列番号が「8」である説明時系列の振幅を大きくすることにより、目的時系列の値を変化させることができる可能性があることを理解できる。このようにして、分析者は、製品の品質を改善するための方策をより具体的に理解することができる。
<効果>
第1の実施形態の効果を説明する。
本実施形態における要因分析装置10は、影響要因であることが明らかでなかった説明時系列について、影響要因である可能性が高い項目を特定できる。その理由は、影響要因であることが明らかでない項目を説明変数として、影響要因であることが明らかである項目の1つに対する多変量解析を実行することで、影響要因であることが明らかである項目の1つに対して影響度の高い項目を算出するからである。特に、目的変数に強い影響を与える影響要因と強い関連がある項目は、すべての項目を説明変数とした多変量解析によっては影響要因と判定されにくいが、本実施形態の要因分析装置10によって特定することができる。
これにより、製品の管理者は、製品の品質に関わる影響要因をより正しく把握することができる。
また、要因分析装置10は、影響要因と特定された第2グループの項目を第1グループに分類し直し、再びステップS73〜S76を実行してもよい。そうすることで、要因分析装置10は、隠れている影響要因をさらに見つけられる可能性がある。
要因分析装置10は、目的時系列に対する第1グループの説明時系列による回帰式と、代表時系列に対する第2グループの回帰式を、出力装置30を介して、出力先に提示するようにしてもよい。これによれば、出力先の分析者は、特定された項目に係る観測値の変化がどの程度品質基準の値に寄与するかを、より具体的に推量することができる。
その理由は、目的変数の値が主要な影響要因の関数で記述でき、その主要な影響要因の1つが特定された項目の関数で記述できることにより、目的時系列と特定された項目の時系列が定量的に関連づけられるからである。(たとえば、目的時系列をY、説明時系列の集合をX、第1グループの説明時系列の集合をT⊂X、第2グループの説明時系列の集合をF=X\T、代表時系列をt∈T、とする。「\」は、差集合を表す記号である。このとき、関数的入出力関係としてy=f(T)およびt=g(F)が言えるならば、y=f(T)=f(T\t,g(F))であるから、ある関数hを用いてy=h(T\t,F)と記述できる。)
以上のように、本実施形態の要因分析装置10によって、製品の管理者は、それぞれのデータの影響度に関するより有用な知見を得ることができる。
なお、第1の実施形態において、第1グループと第2グループとを分類する基準は上記に示した例に限られない。以下に、分類の基準の変形例およびその効果をそれぞれ説明する。
<変形例1>
説明時系列分類部104による説明時系列の分類の基準は、必ずしも影響要因であることが明らかであると特定されたか否かでなくともよい。たとえば、説明時系列分類部104は、第1グループに分類された説明時系列と目的時系列との間の関係の大きさが、第2グループに分類された説明時系列と目的時系列との間の関係の大きさより大きくなるよう説明時系列の分類を行ってもよい。この場合、たとえば、説明時系列分類部104は、説明時系列と目的時系列との間の関係の大きさを表す値の大きさに基づいて、説明時系列を分類する。影響要因であることが明らかな説明時系列と目的時系列との間の関係の大きさを表す値は、影響要因であることが明らかでない説明時系列と目的時系列との間の関係の大きさを表す値よりも大きいことが期待される。したがって、影響要因であることが明らかな説明時系列は、第2グループではなく第1グループに分類されることが期待される。
また、上記分類の基準は、影響要因であることが明らかであると特定されたか否かという基準と組み合わされてもよい。たとえば、説明時系列分類部104は、第1グループに分類された説明時系列と目的時系列との間の関係の大きさが、第2グループに分類された説明時系列と目的時系列との間の関係の大きさより大きくなるよう説明時系列の分類を行ったあと、影響要因であることが明らかであると特定できる第2グループの説明時系列を第1グループに分類し直してもよい。
<変形例2>
第1グループの項目の値に対する影響度が高い第2グループの項目が明らかになれば、その第2グループの項目の値を制御することで、その第1グループの項目の値を間接的に制御することができる。そして、その第1グループの項目が目的項目の影響要因である場合、その第1グループの項目の値に対する影響度が高い第2グループの項目の値を制御し、その第1グループの項目の値を間接的に制御することによって、目的項目の値を間接的に制御できる可能性がある。
説明時系列分類部104は、値を直接制御することができない項目の時系列を第1グループに分類するように設計されてもよい。たとえば、要因分析装置10は、分析者等が各項目について、項目の値を直接制御することができるか否かを表す情報を設定し、説明時系列分類部104がその情報を認識できるように、設計されていればよい。説明時系列分類部104は、その情報に基づいて、値を直接制御できない項目の時系列を第1グループに分類する。
上記のような構成により、第2グループには、値を直接制御できる項目のみが含まれる。このような状況で、第1の実施形態の要因分析装置10による分析を行えば、第1グループの項目の説明時系列に対して、直接制御することができる項目の説明時系列のみを説明変数とした解析の解析結果が得られる。この解析によって、影響要因であって値を直接制御することができない第1グループの項目の値に対して、影響度が大きい第2グループの項目が明らかになれば、その第2グループの項目の値を制御することによって、目的項目の値を間接的に制御できる可能性がある。
影響度算出部106は、第1グループの説明時系列のすべてについて、第2グループの説明時系列の影響度を算出してもよい。解析部107は、その結果に基づいて、第1グループの説明時系列のいずれかの値を制御することにより目的時系列の値を間接的に制御できる可能性がある第2グループの説明時系列を特定してもよい。これにより、分析者は、直接制御可能であって、間接的に品質基準を制御できる可能性がある項目を、知ることができる。また、たとえば、分析者は、影響要因である項目の値を変化させたい場合にその項目が制御不可能であったとき、代わりに制御することでその値を間接的に制御できる項目を特定できる。
<変形例3>
説明時系列分類部104は、関連度の強い項目どうしでクラスタを作成し、それぞれのクラスタから目的変数に対して最も強い影響を与える変数の時系列を第1グループに分類し、それ以外を第2グループに分類してもよい。このような分類によれば、強い影響要因の存在によって、全項目を説明変数とする解析において影響要因であると判定されなかった項目を見つけることができる可能性がある。
<その他、変更されうる事項>
代表時系列は、分析者によって指定されてもよい。たとえば、第1の実施形態において、分析者は、影響要因とわかっている第1グループの説明時系列のうち、直接制御することができない項目の1つについて、その項目を指定する情報を要因分析装置10に対して送信する。要因分析装置10の代表時系列選択部105は、指定された項目を代表時系列として選択する。影響度算出部106は、第2グループの説明時系列の、代表時系列に対する影響度を算出する。これにより、分析者は、影響要因であるが直接制御することができない項目に対する影響度が高い項目を、影響要因とわかっていない項目の中から特定することができる。
また、影響度算出部106は、第1グループの説明時系列に対する多変量解析を、回帰分析によって行う場合、生成する回帰モデルの適合の良さを示す指標である重寄与率を計算してもよい。影響度算出部106が、第1グループの説明時系列すべてについて、第2グループの説明時系列による回帰モデルの重寄与率を明らかにすれば、第2グループの説明時系列とは関連度の低い、第1グループの説明時系列が明らかになる。この時、解析部107は、算出された重寄与率が所定値以上である項目と、重寄与率が所定値未満である項目とが区別されて出力されるよう、第1グループに分類される項目を影響度記憶手段に格納してもよい。これにより、出力先の分析者は、第2グループの説明時系列のみによって値を説明できる説明時系列と、第2グループの説明時系列のみによっては値を説明できない説明時系列とを知得することができる。この結果に基づいて、分析者は、重寄与率が所定値以下である第1グループの説明時系列と、第2グループの説明時系列とを説明変数として、目的時系列に対する多変量解析を実行することができる。第1の実施形態のもとでこの解析を行えば、分析者は、第2グループの説明時系列と関連度の高い影響要因が説明変数に含まれないため、第2グループの説明時系列から影響要因を見つけやすい。また、分析者は、変形例2のもとでこの解析を行えば、全ての説明時系列を説明変数とした多変量解析に比べ、値を直接制御できる項目の累積寄与率がより大きい回帰式を作ることができる。
また、本実施形態で記載した解析手法は、一例であり、本発明を実施するために可能な手法であれば他の解析手法を用いてよい。たとえば、影響度算出部106は、多変量解析手法として、ランダムフォレストを用いることができる。また、目的時系列が量的なデータである場合は、代表時系列選択部105は、重回帰分析法を用いて代表時系列を選択することができる。
また、本実施形態では、温度、ガス流量などの製造条件を観測する複数のセンサが使用される製造工程を分析対象としたが、本要因分析装置は、ある変数の値の変動の要因を特定するために多変量のデータが用いられる様々な場面に適用可能である。たとえば、本要因分析装置は、製品の試験や、ITシステムやプラントシステムの管理に用いられてよい。たとえば本要因分析装置は、製品の耐水試験において「製品が壊れたか否か」を品質基準として、水の温度、浸水時間、製品に与えていた振動、または製品の向き等の条件の継時的な変化の観測データを基に、品質基準に関わる影響要因を分析することができる。たとえばITシステムにおいて、本要因分析装置は、CPU使用率、メモリ使用率、ディスクアクセス頻度や使用量などの時系列を用いて、性能指標である消費電力量や演算時間などに関わる要因を特定する場面で用いられ得る。
要因分析装置10は、代表時系列を選び直してもよい。たとえば、ステップS76の後、要因分析装置10は、選択された代表時系列とは異なる代表時系列を選択し、再びステップS74〜S76の処理を実行してもよい。これにより、最初に選ばれた代表時系列に基づいた分析では発見されなかった影響要因を解析部107が発見できる可能性がある。
本実施形態では、1つの目的時系列が分析対象であるが、複数の目的時系列が分析対象であってもよい。目的時系列が複数ある場合、要因分析装置10は、それぞれの目的時系列に対して別々にステップS72〜S76の処理を行うことで、それぞれの目的時系列の値の変化に影響する説明時系列を特定できる。
本実施形態では、時刻と観測値とが関連づけられたデータである時系列を分析に用いたが、分析に用いるのは必ずしも時系列でなくてよい。たとえば、異なる条件で製造された製品の一つ一つについて、製品の品質に影響を与える要因について分析する場合は、製品番号によって、項目のデータどうしが関連づけられればよい。すなわち、要因分析装置10は、製品番号と観測値のデータを用いて、上述の実施形態に示した分析と同様の分析を行うことができる。
<<第2の実施形態>>
前述の実施形態に係る主要部を含む要因分析装置を、本発明の第2の実施形態として説明する。図10は、本発明の第2の実施形態の要因分析装置9の構成を示すブロック図である。図10に示すように、要因分析装置9は、分類部92と、影響度算出部93とを備える。データ記憶部91は要因装置の外部で、要因分析装置9と通信可能な状態で接続されていてもよい。
分類部92は、データの種類を、所定の基準に従って、第1グループ、または第2グループに分類する。
影響度算出部93は、第2グループに分類される種類のデータの、第1グループの種類のデータに対する影響度を、目的データへの影響度として算出する。目的データとは、値が変化するデータであって、その値の変化が、第1グループおよび第2グループの種類のデータの値の変化から影響を受ける可能性があるデータである。
たとえば、影響度算出部93は、第1グループに分類される種類のデータのうち目的データの値に影響を与える要因である1つの種類のデータを対象として、第2グループのる種類のデータを説明変数とした多変量解析を行う。そして、影響度算出部93は、第2グループの種類のデータのそれぞれの、対象に対する影響度をそれぞれ算出する。算出された影響度は、目的データへの影響度と見なされる。
影響度算出部93は、算出された影響度が所定の閾値を超えるデータの種類を、目的データの値に影響を与える要因の候補として特定してもよい。
要因分析装置9の動作の流れは図11に示されるとおりである。まず、分類部92が、データの種類を第1グループ、または第2グループに分類する(ステップS111)。次に、影響度算出部93が、第2グループに分類される種類のデータの、第1グループの種類のデータに対する影響度を、目的データへの影響度として算出する(ステップS112)。
本要因分析装置によれば、それぞれのデータの影響度に関するより有用な知見を得ることができる。その理由は、目的データに対する影響度の高いデータの種類に隠れやすいデータの種類が、特定の種類を除いたグループのデータによる、当該特定の種類のデータへの影響度の算出によって、見つけられやすいからである。
以上、説明した本発明の各実施形態において、各装置の各構成要素は、機能単位のブロックを示している。各装置の各構成要素の一部または全部は、例えば図12に示すようなコンピュータ1200とプログラムとの可能な組み合わせにより実現される。コンピュータ1200は、一例として、以下のような構成を含む。
・CPU1201
・ROM(Read Only Memory)1202
・RAM1203
・RAM1203にロードされるプログラム1204Aおよび記憶情報1204B
・プログラム1204Aおよび記憶情報1204Bを格納する記憶装置1205
・記録媒体1206の読み書きを行うドライブ装置1207
・通信ネットワーク1209と接続する通信インタフェース1208
・データの入出力を行う入出力インタフェース1210
・各構成要素を接続するバス1211
各実施形態における各装置の各構成要素は、これらの機能を実現するプログラム1204AをCPU1201がRAM1203にロードして実行することで実現される。各装置の各構成要素の機能を実現するプログラム1204Aは、例えば、予め記憶装置1205やROM1202に格納されており、必要に応じてCPU1201が読み出す。なお、プログラム1204Aは、通信ネットワーク1209を介してCPU1201に供給されてもよいし、予め記録媒体1206に格納されており、ドライブ装置1207が当該プログラムを読み出してCPU1201に供給してもよい。
各装置の実現方法には、様々な変形例がある。例えば、各装置は、構成要素毎にそれぞれ別個のコンピュータ1200とプログラムとの可能な組み合わせにより実現されてもよい。また、各装置が備える複数の構成要素が、一つのコンピュータ1200とプログラムとの可能な組み合わせにより実現されてもよい。
また、各装置の各構成要素の一部または全部は、その他の汎用または専用の回路、コンピュータ等やこれらの組み合わせによって実現される。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。
各実施形態の各構成要素の一部または全部の機能は、図13および図14のように、上述した回路等とプログラムとの組み合わせによって実現されてもよい。
図13は、本発明の第1の実施形態の要因分析装置10の各構成要素を回路で構成した場合を表すブロック図である。図13において、受信回路131は受信部101として機能する。データ分類回路132はデータ分類部102として機能する。時系列分類回路133は時系列分類部103として機能する。説明時系列分類回路134は説明時系列分類部104として機能する。代表時系列選択回路135は代表時系列選択部105として機能する。影響度算出回路136は影響度算出部106として機能する。解析回路137は解析部107として機能する。データ記憶回路138はデータ記憶部111として機能する。影響度記憶回路139は影響度記憶部112として機能する。
図14は、本発明の第2の実施形態の要因分析装置9の各構成要素を回路で構成した場合を表すブロック図である。図14において、分類回路142は分類部92として機能する。影響度算出回路143は影響度算出部93として機能する。
各装置の各構成要素の一部または全部が複数のコンピュータや回路等により実現される場合には、複数のコンピュータや回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、コンピュータや回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。
本願発明は以上に説明した実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
本出願は、2016年3月23日に出願された日本出願特願2016−057937を基礎とする優先権を主張し、その開示の全てをここに取り込む。
上記実施形態の一部または全部は以下の付記のようにも記載され得るが、以下には限られない。
[付記1]
データの種類を第1グループ、または第2グループに分類する分類手段と、
前記第2グループに分類される種類のデータの、前記第1グループの種類のデータに対する影響度を目的データへの影響度として算出する影響度算出手段と、
を備えることを特徴とする要因分析装置。
[付記2]
前記分類手段は、前記目的データに影響があることが明らかな前記種類として特定された前記種類を前記第1グループに分類する、
ことを特徴とする付記1に記載の要因分析装置。
[付記3]
前記分類手段は、前記第1グループに分類される前記種類のデータの前記目的データへの影響が、前記第2グループに分類される前記種類のデータの前記目的データへの影響より大きくなるように前記データの種類を分類する、
ことを特徴とする付記1または2に記載の要因分析装置。
[付記4]
前記分類手段は、前記目的データに影響があることが明らかであると判断される前記データの種類を前記第1グループに分類する、
ことを特徴とする付記1から3のいずれか一項に記載の要因分析装置。
[付記5]
前記目的データへの影響度として算出された前記影響度に基づき、前記第1グループに分類された前記種類のデータへの影響が基準より大きい前記第2グループの種類のデータを、前記目的データに影響を与える影響要因として特定する解析手段をさらに備える、
ことを特徴とする付記1から4のいずれか一項に記載の要因分析装置。
[付記6]
データの種類を第1グループ、または第2グループに分類し、
前記第2グループに分類される種類のデータの、前記第1グループの種類のデータに対する影響度を目的データへの影響度として算出する、
ことを特徴とする要因分析方法。
[付記7]
前記目的データに影響があることが明らかな前記種類として特定された前記種類を前記第1グループに分類する、
ことを特徴とする付記6に記載の要因分析方法。
[付記8]
前記第1グループに分類される前記種類のデータの前記目的データへの影響が、前記第2グループに分類される前記種類のデータの前記目的データへの影響より大きくなるように前記データの種類を分類する、
ことを特徴とする付記6または7に記載の要因分析方法。
[付記9]
前記目的データへの影響度として算出された前記影響度に基づき、前記第1グループに分類された前記種類のデータへの影響が基準より大きい前記第2グループの種類のデータを、前記目的データに影響を与える影響要因として特定する、
ことを特徴とする付記6から8のいずれか一項に記載の要因分析方法。
[付記10]
前記データの種類は、データの値の変化を直接制御できる種類と直接制御できない種類とを含み、
データの値の変化を直接制御できる前記種類を前記第1グループに分類し、
前記影響度算出手段は、前記第2グループに分類される種類のデータの、前記第1グループの種類のデータに対する影響度を算出する、
ことを特徴とする付記6から9のいずれか一項に記載の要因分析方法。
[付記11]
コンピュータに、
データの種類を第1グループ、または第2グループに分類する分類処理と、
前記第2グループに分類される種類のデータの、前記第1グループの種類のデータに対する影響度を目的データへの影響度として算出する影響度算出処理と、
を実行させることを特徴とするプログラム。
[付記12]
前記分類処理は、前記目的データに影響があることが明らかな前記種類として特定された前記種類を前記第1グループに分類する、
ことを特徴とする付記11に記載のプログラム。
[付記13]
前記分類処理は、前記第1グループに分類される前記種類のデータの前記目的データへの影響が、前記第2グループに分類される前記種類のデータの前記目的データへの影響より大きくなるように前記データの種類を分類する、
ことを特徴とする付記11または12に記載のプログラム。
[付記14]
前記コンピュータに、
前記目的データへの影響度として算出された前記影響度に基づき、前記第1グループに分類された前記種類のデータへの影響が基準より大きい前記第2グループの種類のデータを、前記目的データに影響を与える影響要因として特定する解析処理を実行させる、
ことを特徴とする付記11から13のいずれか一項に記載のプログラム。
[付記15]
前記データの種類は、データの値の変化を直接制御できる種類と直接制御できない種類とを含み、
前記分類処理は、データの値の変化を直接制御できる前記種類を前記第1グループに分類し、
前記影響度算出処理は、前記第2グループに分類される種類のデータの、前記第1グループの種類のデータに対する影響度を算出する、
ことを特徴とする付記11から14のいずれか一項に記載のプログラム。
9 要因分析装置
10 要因分析装置
20 データ取得部
30 出力装置
92 分類部
93 影響度算出部
101 受信部
102 データ分類部
103 時系列分類部
104 説明時系列分類部
105 代表時系列選択部
106 影響度算出部
107 解析部
111 データ記憶部
112 影響度記憶部
131 受信回路
132 データ分類回路
133 時系列分類回路
134 説明時系列分類回路
135 代表時系列選択回路
136 影響度算出回路
137 解析回路
138 データ記憶回路
139 影響度記憶回路
142 分類回路
143 影響度算出回路
1200 コンピュータ
1201 CPU
1202 ROM
1203 RAM
1204A プログラム
1204B 記憶情報
1205 記憶装置
1206 記録媒体
1207 ドライブ装置
1208 通信インタフェース
1209 通信ネットワーク
1210 入出力インタフェース
1211 バス

Claims (10)

  1. 複数のデータの種類を第1グループ、または第2グループのいずれかに分類する分類手段と、
    前記第1グループに分類される種類から目的データへの影響が最も大きい種類を選択する代表時系列選択手段と、
    前記第2グループに分類される種類のデータの、前記第1グループから選択された種類のデータに対する影響度を算出する影響度算出手段と、
    を備えることを特徴とする要因分析装置。
  2. 前記分類手段は、前記目的データに影響があることが明らかな前記種類として特定された前記種類を前記第1グループに分類する、
    ことを特徴とする請求項1に記載の要因分析装置。
  3. 前記分類手段は、前記第1グループに分類される前記種類のデータの前記目的データへの影響が、前記第2グループに分類される前記種類のデータの前記目的データへの影響より大きくなるように前記データの種類を分類する、
    ことを特徴とする請求項1または2に記載の要因分析装置。
  4. 前記目的データへの影響度として算出された前記影響度に基づき、前記第1グループに分類された前記種類のデータへの影響が基準より大きい前記第2グループの種類のデータを、前記目的データに影響を与える影響要因として特定する解析手段をさらに備える、
    ことを特徴とする請求項1から3のいずれか一項に記載の要因分析装置。
  5. 前記データの種類は、データの値の変化を直接制御できる種類と直接制御できない種類とを含み、
    前記分類手段は、データの値の変化を直接制御できる前記種類を前記第1グループに分類し、
    前記影響度算出手段は、前記第2グループに分類される種類のデータの、前記第1グループの種類のデータに対する影響度を算出する、
    ことを特徴とする請求項1から4のいずれか一項に記載の要因分析装置。
  6. コンピュータが、
    複数のデータの種類を第1グループ、または第2グループのいずれかに分類し、
    前記第1グループに分類される種類から目的データへの影響が最も大きい種類を選択し、
    前記第2グループに分類される種類のデータの、前記第1グループから選択された種類のデータに対する影響度を算出する、
    ことを特徴とする要因分析方法。
  7. 前記コンピュータが、
    前記目的データに影響があることが明らかな前記種類として特定された前記種類を前記第1グループに分類する、
    ことを特徴とする請求項6に記載の要因分析方法。
  8. コンピュータに、
    複数のデータの種類を第1グループ、または第2グループのいずれかに分類する分類処理と、
    前記第1グループに分類される種類から目的データへの影響が最も大きい種類を選択する処理と、
    前記第2グループに分類される種類のデータの、前記第1グループから選択された種類のデータに対する影響度を算出する影響度算出処理と、
    を実行させることを特徴とするプログラム。
  9. 前記分類処理は、前記目的データに影響があることが明らかな前記種類として特定された前記種類を前記第1グループに分類する、
    ことを特徴とする請求項8に記載のプログラム。
  10. 前記分類処理は、前記第1グループに分類される前記種類のデータの前記目的データへの影響が、前記第2グループに分類される前記種類のデータの前記目的データへの影響より大きくなるように前記データの種類を分類する、
    ことを特徴とする請求項8または9に記載のプログラム。
JP2018507295A 2016-03-23 2017-03-17 要因分析装置、要因分析方法、およびプログラム Active JP6904331B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2016057937 2016-03-23
JP2016057937 2016-03-23
PCT/JP2017/010833 WO2017164095A1 (ja) 2016-03-23 2017-03-17 要因分析装置、要因分析方法、およびプログラムを記憶した記憶媒体

Publications (2)

Publication Number Publication Date
JPWO2017164095A1 JPWO2017164095A1 (ja) 2019-01-31
JP6904331B2 true JP6904331B2 (ja) 2021-07-14

Family

ID=59900361

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018507295A Active JP6904331B2 (ja) 2016-03-23 2017-03-17 要因分析装置、要因分析方法、およびプログラム

Country Status (3)

Country Link
US (1) US11580414B2 (ja)
JP (1) JP6904331B2 (ja)
WO (1) WO2017164095A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7283105B2 (ja) * 2018-02-16 2023-05-30 富士電機株式会社 分析装置および分析方法
WO2020027207A1 (ja) * 2018-08-03 2020-02-06 パナソニックIpマネジメント株式会社 異常検出方法、情報処理装置及び異常検出システム
JP6995100B2 (ja) * 2019-09-30 2022-01-14 エヌ・ティ・ティ・コミュニケーションズ株式会社 情報処理装置、算出方法および算出プログラム

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002110493A (ja) 2000-10-04 2002-04-12 Matsushita Electric Ind Co Ltd 加工プロセス工程の異常抽出方法及び装置
JP4417897B2 (ja) * 2005-09-14 2010-02-17 富士通マイクロエレクトロニクス株式会社 製造データ解析方法及び製造データ解析装置
JP5011830B2 (ja) 2006-06-09 2012-08-29 富士通セミコンダクター株式会社 データ処理方法、データ処理プログラム、該プログラムを記録した記録媒体およびデータ処理装置
JP5017939B2 (ja) 2006-06-22 2012-09-05 オムロン株式会社 因果構造獲得装置、因果構造獲得方法、因果構造獲得プログラムおよびそれを記録したコンピュータ読み取り可能な記録媒体
JP5130851B2 (ja) * 2007-09-27 2013-01-30 富士通株式会社 モデル作成支援システム、モデル作成支援方法、モデル作成支援プログラム
JP4872944B2 (ja) * 2008-02-25 2012-02-08 日本電気株式会社 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム
JP4394728B2 (ja) 2008-04-15 2010-01-06 シャープ株式会社 影響要因特定装置
JP5192476B2 (ja) * 2009-10-22 2013-05-08 株式会社日立製作所 作業支援システム、作業支援方法、および作業支援プログラム
JP5352485B2 (ja) 2010-01-21 2013-11-27 株式会社日立製作所 要因分析装置
JP2012093905A (ja) 2010-10-26 2012-05-17 Oki Electric Ind Co Ltd エネルギー利用状況分析システム及びプログラム
JP2015154845A (ja) 2014-02-20 2015-08-27 パナソニックヘルスケア株式会社 健康管理支援装置およびその制御方法
EP3118750A4 (en) 2014-03-14 2017-11-08 Nec Corporation Factor analysis device, factor analysis method, and factor analysis program
JP6330456B2 (ja) 2014-04-30 2018-05-30 富士通株式会社 相関係数算出方法、相関係数算出プログラムおよび相関係数算出装置
JP6740157B2 (ja) * 2017-03-13 2020-08-12 株式会社東芝 解析装置、解析方法、及び、プログラム

Also Published As

Publication number Publication date
US11580414B2 (en) 2023-02-14
US20200293909A1 (en) 2020-09-17
JPWO2017164095A1 (ja) 2019-01-31
WO2017164095A1 (ja) 2017-09-28

Similar Documents

Publication Publication Date Title
US9753801B2 (en) Detection method and information processing device
CN111177714B (zh) 异常行为检测方法、装置、计算机设备和存储介质
CN102265227B (zh) 用于在机器状况监视中创建状态估计模型的方法和设备
US20070185990A1 (en) Computer-readable recording medium with recorded performance analyzing program, performance analyzing method, and performance analyzing apparatus
JP6904331B2 (ja) 要因分析装置、要因分析方法、およびプログラム
TW201327451A (zh) 確定用戶群體、資訊查詢及推薦的方法及系統
US11170332B2 (en) Data analysis system and apparatus for analyzing manufacturing defects based on key performance indicators
EP1958034B1 (en) Use of sequential clustering for instance selection in machine condition monitoring
JP6315528B1 (ja) 異常検知モデル構築装置、異常検知モデル構築方法及びプログラム
JP6835098B2 (ja) 要因分析方法、要因分析装置および要因分析プログラム
JP6737277B2 (ja) 製造プロセス分析装置、製造プロセス分析方法、及び、製造プロセス分析プログラム
CN110249276A (zh) 不良状况要因推定装置及不良状况要因推定方法
Jiang et al. Independent component analysis-based non-Gaussian process monitoring with preselecting optimal components and support vector data description
KR102470763B1 (ko) 데이터 이상치 탐색 장치 및 방법
Haridy et al. Development of a multiattribute synthetic-np chart
Wolcott et al. Modeling time-dependent and-independent indicators to facilitate identification of breakthrough research papers
Atzmueller et al. Anomaly detection and structural analysis in industrial production environments
CN114492764A (zh) 人工智能模型测试方法、装置、电子设备和存储介质
Sylligardos et al. Choose wisely: An extensive evaluation of model selection for anomaly detection in time series
CN109976986B (zh) 异常设备的检测方法及装置
Apeji et al. An entropy-based approach for assessing operational visibility in sustainable supply chain
US11244235B2 (en) Data analysis device and analysis method
CN114048085B (zh) 一种磁盘故障分析方法、装置、设备及可读存储介质
CN113296990A (zh) 时序数据的异常识别方法及装置
Dreesman et al. Challenges for signal generation from medical social media data

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180907

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210423

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210525

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210607

R150 Certificate of patent or registration of utility model

Ref document number: 6904331

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150