JP2006011492A - 分布適合度検定装置、消耗品補給タイミング判定装置、画像形成装置、分布適合度検定方法及びプログラム - Google Patents

分布適合度検定装置、消耗品補給タイミング判定装置、画像形成装置、分布適合度検定方法及びプログラム Download PDF

Info

Publication number
JP2006011492A
JP2006011492A JP2004183148A JP2004183148A JP2006011492A JP 2006011492 A JP2006011492 A JP 2006011492A JP 2004183148 A JP2004183148 A JP 2004183148A JP 2004183148 A JP2004183148 A JP 2004183148A JP 2006011492 A JP2006011492 A JP 2006011492A
Authority
JP
Japan
Prior art keywords
distribution
data
total
probability
aggregation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004183148A
Other languages
English (en)
Other versions
JP4349216B2 (ja
Inventor
Masakazu Fujimoto
正和 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2004183148A priority Critical patent/JP4349216B2/ja
Priority to US11/002,146 priority patent/US7231315B2/en
Publication of JP2006011492A publication Critical patent/JP2006011492A/ja
Application granted granted Critical
Publication of JP4349216B2 publication Critical patent/JP4349216B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Accessory Devices And Overall Control Thereof (AREA)

Abstract

【課題】 適合度検定の検定可能範囲を広げた分布適合度検定装置を提供する。
【解決手段】 データ保持部2から観測データを読み出して到着率λの推定を行う分布推定部3と、観測データを集計する集計区間の幅を、観測したデータ数に応じて決定する集計区間決定部4と、決定した各集計区間のデータ数を集計するデータ集計部と、各集計区間のデータ数を用いて適合度検定を行う適合度検定部6とを有する構成としている。集計区間決定部4は、各集計区間の幅が、推定した確率分布上で等確率になるように集計区間を決定しているので、時間的に確率分布が変動する分布であっても、一様分布に変換して適合度検定を行うことが可能となる。応用として、プリンタのトナーや用紙などの消耗品補給タイミング判定がある。
【選択図】 図2

Description

本発明は、測定したデータが2項分布やポアソン分布などの離散分布に従っているか否かを、カイ二乗分布への近似に基づいて判定する分布適合度検定装置に関する。
従来より、測定して得られたデータが2項分布やポアソン分布などの離散分布に従っているか否かを、カイ二乗分布に近似して適合度を検定するカイ二乗適合度検定が用いられている。この検定方法では、一定間隔で到着する人、車、パケットなどのトランザクションが多項分布に従うかどうかをカイ二乗分布に近似して適合度を検定している。
カイ二乗検定を用いたポアソン分布への適合度検定の方法を具体例を挙げて説明する。表1に、ある電話回線に、平日1日にかかってくる電話の到着数を30日間調べた結果を示す。また、これを到着数で分類した表を表2に示す。
Figure 2006011492
Figure 2006011492
従来のカイ二乗検定を用いたポアソン分布の適合度検定では、まず、到着率をΣ(到着数×観測度数))/(総観測度数)と推定する。表2に到着数と観測度数とを積算した値を示す。この積算値を足し合わせると「150」となるので、総観測度数の「30」で除算して到着率λを「5」と推定する。図1に到着率λ=5のポアソン分布と、実際に観測された観測値とを重ねて表示したグラフを示す。なお、到着率とは、単位時間に到着する到着数の平均値であり、ポアソン分布の平均値に当たる。
次に、推定した到着率から期待度数を求める。到着率が推定されると、この到着率からポアソン分布の分布形状が決まる。期待度数は、推定したポアソン分布上での観測度数の値となる。例えば、表1に示す観測データでは、到着数が「4」の時を2回観測しているが、推定したポアソン分布上での到着数「4」の期待度数は、「5.264021093」回となる。期待度数は、以下の数1により求めることができる。各到着数での期待度数を表2に示す。
Figure 2006011492
次に、以下に示す式(2)を用いて検定統計量を求める。ここで、Xは、到着数の集計区間iにおける観測度数、Eは到着数の集計区間iにおける期待度数を示す。期待度数が1以上の集計区間はそのままで、期待度数が1未満の集計区間を一つにまとめ、集計区間の総数をmとする。
Figure 2006011492
この検定統計量を自由度m−2のカイ二乗値χ(m−2,α)と比較し、検定統計量がカイ二乗値χ(m−2,α)よりも大きければ、「推定したポアソン分布に従わない」、検定統計量がカイ二乗値χ(m−2,α)よりも小さければ「推定したポアソン分布に従わないとは言えない」と判定する。なお、αは危険率を示す。
上述した例では、検定統計量χ =9.208023<χ(8,0.05)=15.50731249となり、「ポアソン分布に従わないとは言えない」という検定結果になる。
特許文献1には、順序統計量かつ打ち切りデータとなるバグデータの性質を利用して、ソフトウェア信頼度成長曲線の適合度を検定する方法が記載されている。
特許文献2には、観測条件を変えて同じ回数観測して得られた2つのデータを比較することで、観測条件の違いが事象の起こり方に影響を及ぼすか否かを判定する方法が提案されている。
特許公報第2693435号公報 特開2003−281116号公報
カイ二乗分布への近似を行うための検定統計量は、期待度数が10以上ないと精度が不十分となる。このため、データ数を分類数×10以上にする必要がある。しかしながら、分類数が多い場合には、データ収集に時間やコストがかかるという問題が生じる。さらに、観測されるデータは各分類区間で一様に得られる分けではないため、データ数を増やしても期待度数が大きくならない分類区間もある。この場合、期待度数が少ない分類を併合する処理が必要となり、処理に手間がかかるという問題が生じる。
また、電車やバスのダイアグラムを見ても分かるように、通常到着率(単位時間内に到着する到着数の平均値)は一定ではなく、到着率の変動する非斉時ポアソン過程に従っている。しかしながら、非斉時ポアソン過程では、到着率の変化に従って分布形状自体が変化してしまうため、そのままカイ二乗適合度検定を適用することができなかった。
特許文献1及び2にもこのような課題を解決するための技術は開示されていない。
本発明は上記事情に鑑みてなされたものであり、適合度検定の検定可能範囲を広げた分布適合度検定装置、消耗品補給タイミング判定装置、画像形成装置、分布適合度検定方法及びプログラムを提供することを目的とする。
かかる目的を達成するために本発明の分布適合度検定装置は、測定したデータが、推定する確率分布に適合するかどうかを検定する分布適合度検定装置であって、前記測定したデータを集計する集計区間の幅を、前記測定したデータのデータ数に応じて決定する集計区間決定手段と、決定した各集計区間のデータ数を集計する集計手段と、前記各集計区間のデータ数を用いて適合度検定を行う適合度検定手段とを有する構成としている。
請求項1記載の発明は、データを集計する集計区間幅を、測定したデータ数に応じて決定している。従って、測定で得られたデータ数が少ない場合や、得られたデータ数が少ない集計区間が存在しても集計区間幅を変更することで精度の高い検定が可能となる。このため適合度検定の検定可能範囲を広げることができる。
請求項2記載の分布適合度検定装置は、測定したデータが、推定する確率分布に適合するかどうかを検定する分布適合度検定装置であって、前記測定したデータを集計する集計区間の幅を、前記推定する確率分布に応じて決定する集計区間決定手段と、決定した各集計区間のデータ数を集計する集計手段と、前記各集計区間のデータ数を用いて適合度検定を行う適合度検定手段とを有する構成としている。
請求項2記載の発明は、測定したデータを集計する集計区間の幅を、測定する確率分布に応じて決定している。集計区間の幅を推定する確率分布に応じて変更して、例えば、推定する確率分布上での各集計区間の確率が等確率となるようにすれば、確率分布の分布形状によらず適合度検定を行うことが可能となる。このため時間的に変動する確率分布に対しても適合度検定を行うことが可能となり、適合度検定の検定可能範囲を広げることができる。
請求項3記載の分布適合度検定装置は、測定したデータが、推定する確率分布に適合するかどうかを検定する分布適合度検定装置であって、前記測定したデータを集計する集計区間の幅を、前記推定する確率分布と前記測定したデータのデータ数とに応じて決定する集計区間決定手段と、決定した各集計区間のデータ数を集計する集計手段と、前記各集計区間のデータ数を用いて適合度検定を行う適合度検定手段とを有する構成としている。
請求項3記載の発明は、データを集計する集計区間幅を、測定したデータのデータ数と推定する確率分布とに応じて決定している。集計区間幅を、測定したデータ数に応じて変更することで、測定で得られたデータ数が少ない場合や、得られたデータ数が少ない集計区間が存在しても集計区間幅を変更することで精度の高い検定が可能となる。また、集計区間幅を、推定する確率分布に応じて変更し、例えば、推定する確率分布上での各集計区間の確率が等確率となるようにすれば、確率分布の分布形状によらず適合度検定を行うことが可能となる。このため時間的に変動する確率分布に対しても適合度検定を行うことが可能となり、適合度検定の検定可能範囲を広げることができる。
請求項4記載の分布適合度検定装置は、請求項1から3のいずれか一項に記載の分布適合度検定装置において、前記集計区間決定手段は、前記各集計区間の幅が、前記推定した確率分布上で等確率になるように前記集計区間を決定するとよい。
請求項4記載の発明は、各集計区間の幅が、推定した確率分布上で等確率になるように集計区間を決定している。従って、時間的に確率分布が変動する分布であっても、一様分布に変換して適合度検定を行うことが可能となる。このため、適合度検定の検定可能範囲を広げることができる。
請求項5記載の分布適合度検定装置は、請求項1から4のいずれか一項に記載の分布適合度検定装置において、前記集計区間決定手段は、測定したデータのデータ数に応じた所定の分割数mを決定し、前記推定する確率分布を1/mの確率ずつの等確率区間に分割して前記各集計区間幅を決定するとよい。
請求項5記載の発明は、測定したデータのデータ数に応じて分割数mを決定している。測定で得られたデータのデータ数が少ない場合に分割数を変更することで精度の高い検定を行うことができる。また、推定する確率分布を1/mの確率ずつの等確率区間に分割して各集計区間幅を決定している。従って、時間的に確率分布が変動する分布であっても、一様分布に変換して適合度検定を行うことが可能となる。このため、適合度検定の検定可能範囲を広げることができる。
請求項6記載の分布適合度検定装置は、請求項5記載の分布適合度検定装置において、前記データ集計手段は、前記測定データの計数値がkであった場合に、0からkまでの累積確率が含まれる前記等確率区間を判定して、前記測定データを前記集計区間に分類するとよい。
請求項6記載の発明は、計数値の累積確率を求めることで、測定データを集計区間に分類することができる。
請求項7記載の分布適合度検定装置は、請求項1から6のいずれか一項に記載の分布適合度検定装置において、前記集計区間決定手段は、測定したデータが複数の確率分布に従うものと仮定し、該仮定した確率分布ごとに集計区間幅を変更するとよい。
請求項7記載の発明は、仮定した確率分布ごとに集計区間幅を変更してデータの集計を行うことで、推定する確率分布上での各集計区間の確率が等確率となるようにすることができる。従って、時間的に確率分布が変動する分布であっても、一様分布に変換して適合度検定を行うことが可能となる。このため、適合度検定の検定可能範囲を広げることができる。
請求項8記載の分布適合度検定装置は、請求項1から7のいずれか一項に記載の分布適合度検定装置において、前記データ集計手段は、前記測定データの計数値が、複数の集計区間にまたがる場合に、複数の集計区間に分割して集計するとよい。
請求項8記載の発明は、測定データの計数値を取る確率が、複数の集計区間にまたがる場合に、複数の集計区間に分割して集計することで、誤差を小さくすることができる。
請求項9記載の分布適合度検定装置は、請求項5又は6記載の分布適合度検定装置において、前記データ集計手段は、前記測定データの計数値が、前記複数の集計区間にまたがる場合に、前記測定データの計数値を取る確率が、前記等確率区間に含まれる割合を求め、前記測定データを前記複数の集計区間に分割して集計するとよい。
請求項9記載の発明は、測定データの計数値を取る確率が、各集計区間に含まれる割合によって測定データを複数の集計区間に分割して集計している。従って、測定データを精度よく複数の集計区間に分割することができ、誤差をさらに小さくすることができる。
請求項10記載の分布適合度検定装置は、請求項1から9のいずれか一項に記載の分布適合度検定装置において、前記適合度検定手段は、集計したデータをカイ二乗適合度検定によって検定するとよい。
集計したデータをカイ二乗適合度検定によって検定することで、一般的に用いられている検定方法を用いて検定することができる。
請求項11記載の分布適合度検定装置は、請求項1から10のいずれか一項に記載の分布適合度検定装置において、前記推定する確率分布が、時間的に変動する確率分布であるとよい。
推定する確率分布が、時間的に変動する確率分布であっても、各集計区間の幅が、推定した確率分布上で等確率になるように集計区間幅を決定することで、一様分布に変換して適合度検定を行うことが可能となる。
請求項12記載の分布適合度検定装置は、請求項1から11のいずれか一項に記載の分布適合度検定装置において、前記推定する確率分布が、非斉時ポアソン過程に従うとよい。
推定する確率分布が、非斉時ポアソン過程に従うものであっても適合度検定を実施することが可能となる。
本発明の消耗品補給タイミング判定装置は、測定した単位時間当たりの消耗品の消費数と、前記消耗品の過去の単位時間当たりの消費率の平均値とから適合度検定を行う請求項1から12のいずれか一項記載の分布適合度検定装置と、前記適合度検定により現在の消費率と過去の消費率とに有意差があると判定した場合に、前記現在の消耗品の消費率と前記過去の消耗品の消費率との比率から予測補給時間を算出し、補給の予測時間を通知する制御手段と、を有する構成としている。
適合度検定により現在の消費率と過去の消費率とに有意差があるか否かを判定して、有意差があると判定した場合に、現在の消耗品の消費率と過去の消耗品の消費率との比率から予測補給時間を算出することで、補給の予測時間を精度よく算出することができる。
本発明の画像形成装置は、請求項13記載の消耗品補給タイミング判定装置を備えている。
請求項13記載の消耗品補給タイミング判定装置を備えることで、トナーや用紙などの補給タイミングを精度よく判定して、ユーザに補給のタイミングを通知することができる。
本発明の分布適合度検定方法は、測定したデータが、推定する確率分布に適合するかどうかを検定する分布適合度検定方法であって、前記測定したデータを集計する集計区間の幅を、前記推定する確率分布と前記測定したデータのデータ数とに応じて決定する集計区間決定工程と、決定した各集計区間のデータのデータ数を集計する集計工程と、前記各集計区間のデータ数を用いて適合度検定を行う適合度検定工程とを有することを特徴としている。
請求項15記載の発明は、データを集計する集計区間幅を、測定したデータのデータ数と推定する確率分布とに応じて決定している。集計区間幅を、測定したデータ数に応じて変更することで、測定で得られたデータ数が少ない場合や、得られたデータ数が少ない集計区間が存在しても集計区間幅を変更することで精度の高い検定が可能となる。また、集計区間幅を、推定する確率分布に応じて変更し、例えば、推定する確率分布上での各集計区間の確率が等確率となるようにすれば、確率分布の分布形状によらず適合度検定を行うことが可能となる。このため時間的に変動する確率分布に対しても適合度検定を行うことが可能となり、適合度検定の検定可能範囲を広げることができる。
請求項16記載の分布適合度検定方法は、請求項15記載の分布適合度検定方法において、前記集計区間決定工程は、前記各集計区間の幅が、前記推定した確率分布上で等確率になるように前記集計区間を決定するとよい。
請求項16記載の発明は、各集計区間の幅が、推定した確率分布上で等確率になるように集計区間を決定している。従って、時間的に確率分布が変動する分布であっても、一様分布に変換して適合度検定を行うことが可能となる。このため、適合度検定の検定可能範囲を広げることができる。
請求項17記載の分布適合度検定方法は、請求項15又は16記載の分布適合度検定方法において、前記集計区間決定工程は、測定したデータが複数の確率分布に従うものと仮定し、該仮定した確率分布ごとに集計区間幅を決定するとよい。
請求項17記載の発明は、仮定した確率分布ごとに集計区間幅を変更してデータの集計を行うことで、推定する確率分布上での各集計区間の確率が等確率となるようにすることができる。従って、時間的に確率分布が変動する分布であっても、一様分布に変換して適合度検定を行うことが可能となる。このため、適合度検定の検定可能範囲を広げることができる。
請求項18記載の分布適合度検定方法は、請求項15から17のいずれか一項に記載の分布適合度検定方法において、前記データ集計工程は、前記測定データの計数値が、複数の集計区間にまたがる場合に、複数の集計区間に分割して集計するとよい。
請求項18記載の発明は、測定データの計数値を取る確率が、複数の集計区間にまたがる場合に、複数の集計区間に分割して集計することで、誤差を小さくすることができる。
本発明の分布適合度検定プログラムは、測定したデータが、推定する確率分布に適合するかどうかを検定する分布適合度検定プログラムであって、前記測定したデータを集計する集計区間の幅を、前記推定する確率分布と前記測定したデータのデータ数とに応じて決定する集計区間決定処理と、決定した各集計区間のデータ数を集計する集計処理と、前記各集計区間のデータ数を用いて適合度検定を行う適合度検定処理とを実行することを特徴としている。
請求項19記載の発明は、データを集計する集計区間幅を、測定したデータのデータ数と推定する確率分布とに応じて決定している。集計区間幅を、測定したデータ数に応じて変更することで、測定で得られたデータ数が少ない場合や、得られたデータ数が少ない集計区間が存在しても集計区間幅を変更することで精度の高い検定が可能となる。また、集計区間幅を、推定する確率分布に応じて変更し、例えば、推定する確率分布上での各集計区間の確率が等確率となるようにすれば、確率分布の分布形状によらず適合度検定を行うことが可能となる。このため時間的に変動する確率分布に対しても適合度検定を行うことが可能となり、適合度検定の検定可能範囲を広げることができる。
請求項20記載の分布適合度検定プログラムは、請求項19記載の分布適合度検定プログラムにおいて、前記集計区間決定処理は、前記各集計区間の幅が、前記推定した確率分布上で等確率になるように前記集計区間を決定するとよい。
請求項20記載の発明は、各集計区間の幅が、推定した確率分布上で等確率になるように集計区間を決定している。従って、時間的に確率分布が変動する分布であっても、一様分布に変換して適合度検定を行うことが可能となる。このため、適合度検定の検定可能範囲を広げることができる。
請求項21記載の分布適合度検定プログラムは、請求項19又は20記載の分布適合度検定プログラムにおいて、前記集計区間決定処理は、測定したデータが複数の確率分布に従うものと仮定し、該仮定した確率分布ごとに集計区間幅を決定するとよい。
請求項21記載の発明は、仮定した確率分布ごとに集計区間幅を変更してデータの集計を行うことで、推定する確率分布上での各集計区間の確率が等確率となるようにすることができる。従って、時間的に確率分布が変動する分布であっても、一様分布に変換して適合度検定を行うことが可能となる。このため、適合度検定の検定可能範囲を広げることができる。
請求項22記載の分布適合度検定プログラムは、請求項19から21のいずれか一項に記載の分布適合度検定プログラムにおいて、前記データ集計処理は、前記測定データの計数値が、複数の集計区間にまたがる場合に、複数の集計区間に分割して集計するとよい。
請求項22記載の発明は、測定データの計数値を取る確率が、複数の集計区間にまたがる場合に、複数の集計区間に分割して集計することで、誤差を小さくすることができる。
本発明は、集計区間幅を変更することで、適合度検定の検定可能範囲を広げることができる。
次に、添付図面を参照しながら本発明の最良の実施例を説明する。
まず、図2を参照しながら分布適合度検定装置1の構成を説明する。分布適合度検定装置1は、図2に示すようにデータ保持部2と、分布推定部3と、集計区間決定部4と、データ集計部5と、適合度決定部6とを備えている。
データ保持部2には、観測して得られたデータが記録されている。分布推定部3は、データ保持部2から観測データを読み出して到着率λの推定を行う。分布推定部3は、観測データの時間帯ごとの平均到着率を求めたり、メーリングリストにおいて参加者数に比例すると仮定した発言率を求めたりする。なお、到着率λとは、単位時間に到着する到着数の平均値であり、ポアソン分布の平均値に当たる。
集計区間決定部4は、分布推定部3によって離散分布が推定されると、図3に示すように各集計区間の幅が推定する離散分布において等確率になるように集計区間を決定する。
非斉時ポアソン分布の場合、到着率λによって分布形状が変化してしまう。すなわち、時間的に離散分布が変動する。このため、そのままではカイ二乗適合度検定を適用することができない。図4に到着率λが1、2、5、10の場合のポアソン分布の形状を示す。図4に示すように到着率λが変わることで、ポアソン分布の形状も大きく変化する。そこで、図3に示すように各集計区間の幅が推定する離散分布上において等確率になるように集計区間を決定し、測定したデータを集計区間ごとに分類する。これにより、推定される複数の離散分布を図3に示すような離散的な一様分布に変換することができ、この一様分布との適合度検定としてカイ二乗適合度検定を行うことができる。従って、到着率λの変動により分布形状が変動しても、カイ二乗適合度検定を適用することができる。なお、カイ二乗適合度検定を用いる場合、カイ二乗分布への近似精度を高めるために、集計区間数mは、(データ数/10)以下にするとよい。
データ集計部5では、集計区間決定部4で決定した集計区間それぞれのデータ数を集計する。適合度検定部6では、カイ二乗適合度検定などの検定方法を用いて集計データを検定する。区間数をmとして、以下に示す数式から得られる検定統計量を自由度m−1のカイ二乗値χ(m−1,α)と比較する。検定統計量が、カイ二乗値よりも大きければ推定した離散分布には従っていないと判定する。なお、Xiは、i番目の区間に入るデータ数、nはデータの総数、mは区間数、αは危険率を表す。危険率αは0.05(5%)もしくは0.01(1%)が用いられている。
Figure 2006011492
次に、図5に示すフローチャートを参照しながら分布適合度検定装置の処理手順を説明する。分布適合度推定処理では、まず、観測値などから離散分布のパラメータ(到着率)を推定する(ステップS1)。到着率が一定のポアソン過程(斉時ポアソン過程)の場合には、到着率λの推定を行う。非斉時ポアソン過程の場合には、変動する到着率λの推定を行う。例えば、非斉時ポアソン過程の観測データの時間帯ごとの平均到着率を求めたり、メーリングリストにおいて参加者数に比例すると仮定した発言率を求めたりする。
次に、集計区間決定処理では、推定した分布において等確率になるように集計区間を決定する(ステップS2)。まず、集計区間の数を決めるために(観測度数÷10)以下の2以上の自然数を選択する(ステップS3)。ここで観測データの数が19以下であると区間数が1となるため(ステップS3/NO)、検定を実施せずに終了する。この場合、検定が不可能なことを表示もしくは通知するようにしても構わない。
集計区間数mが決まると、各区間の期待値が等しい、すなわち等確率となるように区間幅を決定する。非斉時ポアソン過程を例にとると、tからt+sの時間幅に到着する到着数がiとなる確率を、
P[N(t+s)−N(t)=i] ・・・(4)
として、i=0からの累積確率が1/mを超えない区間、その次の1/mを超えない区間もしくは累積確率が2/mを超えない区間として、以下の式(5),(6),(7),(8),(9)、または(10),(11),(12),(13)のk,k,・・・km−1を決定する。
Figure 2006011492
Figure 2006011492
区間データ集計処理では、決定した集計区間それぞれのデータ数を集計する(ステップS4)。カイ二乗検定処理では、カイ二乗適合度検定を行う(ステップS5)。カイ二乗適合度検定の場合、区間数をmとして検定統計量をカイ二乗値χ(m−1,α)と比較する(ステップS5)。検定統計量がカイ二乗値よりも大きければ推定した分布ではないと判定する。
このように本実施例は、従来の計数値による分割では分割数に比べて十分なデータ数が得られていない場合でも、分割数を減らすことができるため、精度の高い検定が可能になる。また、時間的に変動する離散分布を1/m(mは分割数)の一様分布に変換することで、時間的に変動する離散分布に対しても検定を行うことができる。このため、観測後のデータを用いて推定した変動パラメータを持つ分布関数に従うかどうかを、容易に統計的に検定できる。これにより時間的に変化するものの、時間帯ごとの変動に周期性があるような場合に、定常状態から大きな変化があるかどうかなどを診断することができる。
なお、上述した方法を使わなければ、計数時に観測時間間隔を変更しない限り、変動パラメータを持つ分布関数への適合度検定は困難である。観測時にパラメータを推定しながら時間間隔を変更することは不可能に近いため、時間的に連続して記録するなど大量の記憶容量を必要としたり、パラメータの変化を推定した後に再度計数を行うなど、コストがかかる方法をとらざるを得ない。
[具体例1]
次に、上述した分布適合度検定方法を用いた検定の具体例を説明する。まず、表1に示した到着率が一定のポアソン過程に従う統計データを本発明に従って適合検定する場合について説明する。表1には、ある電話回線に平日1日にかかってくる電話の到着数が示されている。また以下に示す表3には、一日ごとの到着数xと、この到着数の累積ポアソン確率と、本発明に従って分類した集計区間の番号とを示す。また、表4には、表3に示す分類に従って、データを集計した表を示す。
Figure 2006011492
Figure 2006011492
まず、到着率λは、上述したようにΣ(到着数×観測度数)/(総観測度数)で求め、5とする。また分類数、すなわち集計区間数は観測度数が合計30であるため、カイ二乗分布への近似精度から、30/10以下にする必要があるため3とする。
累積ポアソン確率は、ポアソン過程を仮定した場合において、到着数をkとし、発言数が0以上k以下になる累積確率を表している。0から表3に示す各xの値までの累積ポアソン確率を求めている。例えば、xの値が3までの累積ポアソン確率は、
Figure 2006011492
となる。
また、分類される集計区間の決定は、推定する分布における集計区間の区切りを直接計算しなくても、累積ポアソン確率が計算できていれば、累積ポアソン確率×区間数に1を加えた整数部分が区間の番号となる。
判定の結果は、表4に示すように、χ(3-1,0.05)=5.991476357> 0となり、従来の方法と同じで「ポアソン分布に従わないとはいえない」という結果になり、到着率に変動がない場合でも矛盾を生じない。
[具体例2]
具体例2として、週ごとのメーリングリストの新規発言数が非斉時ポアソン過程に従うかを検定する例を説明する。メーリングリストにおいて、人数が多いほど発言が増えると考えられるので、発言率(到着率)すなわち平均発言数が参加人数に比例して変動すると過程した場合を検証する。但し、返信は前の発言の影響による所が大きいので新規発言を対象にする。週ごとの登録者数と発言数が分かっていて、発言の発生率(到着率)が登録者数に比例する非斉時ポアソン過程に適合するかどうかを検定する。表5に、発言数と、登録者数と、期待値と、累積ポアソン確率とを週ごとにまとめた表を示す。
Figure 2006011492
期待値は、発言の発生率(到着率)が登録者数に比例すると仮定した場合に、登録者数から計算される発言数の期待値を示す。計算式は、以下のようになる。
期待値=(総発言数)×(その時の登録者数)/(総登録者数)
累積ポアソン確率は、ポアソン確率を仮定した場合において、発言数をkとして、発言数が0以上k以下になる累積確率を表している。この例では、期待値、すなわち到着率λが変動するため、これに応じてポアソン分布も変動する。このため、累積確率も期待値(到着率)に応じたポアソン分布を求めて、この分布から累積確率を求めなければならない。
また分類する集計区間の算出は、累積ポアソン確率の値に区間数をかけて1を加えることで求められる。分割数は、データ総数に基づいて決定する。期待度数が10以上になれば実用上カイ二乗分布に近似して差し支えないので、分割数の最大値を(データ数/10)とする。この例では、データ総数は、30件であり、分割数≦3.0から分割数を3とする。
分割数を3としてカイ二乗検定を行うと、以下の表6のようになる。
Figure 2006011492
期待度数は、等確率であることを前提とするため、全件数÷分類数(集計区間数)で10である。ここで、Xをそれぞれの観測度数として、
(X−n/m)/(n/m)
の合計を検定統計量とし、カイ二乗値比較することで適合度を検定する。この例では、χ(3-1,0.05)=5.991476357>1.4となるので、非斉時ポアソン過程に適合すると判定できる。このようにして、既に一定時間間隔で集計されたデータに対しても非斉時ポアソン過程に適合するかどうかを検定することができる。
なお、図6〜図12に、各期待度数λの時のポアソン分布の形状と、このポアソン分布に従うと推定した観測の観測値とその度数とを示す。また、図13、図14には、図6〜図12をまとめて各期待度数の時のポアソン分布の形状を示す。
[具体例3]
実施例3として、プリンタの利用度合いが在席者数に基づく非斉時ポアソン過程に従うか検定する例を示す。プリンタの利用度合いも、人数が多いほど出力数が増えると考えられるので、平均出力回数が在席人数に比例して変動すると仮定して検証を行う。ここでは、平日の稼働時間ごとの平均在席人数と出力数が分かっており、出力の発生率が在席人数に比例する非斉時ポアソン過程と適合するかどうかを検定すればよい。表7に出力数と、在席人数と、期待値と、累積ポアソン確率とを週ごとにまとめた表を示す。
Figure 2006011492
表7に示す期待値は、出力の発生率(到着率)が在席人数に比例すると仮定した場合に、在席人数から計算される出力数の期待値を示している。計算方法は、
(総出力数)×(その時点の在席者数)/(のべ在席者数)
である。
累積ポアソン確率は、上述したように、ポアソン仮定を仮定した場合において、出力数をkとして、出力数が0以上k以下になる累積確率を表している。また、分類は、累積ポアソン確率に区間数をかけて1を加えることで分類される集計区間を算出している。また、分割数は、データ総数に基づいて決定する。期待度数が10以上になれば、実用上カイ二乗分布に近似して差し支えないため、分割数の最大値を(データ数/10)とする。この例では、データ総数は30件であり、分割数≦3.0から、分割数を3とする。
分割数を3としてカイ二乗適合度検定を行うと、以下に示す表8のようになる。
Figure 2006011492
期待度数は等確率であることを前提とするため、全件数÷分類数(集計区間数)である。ここで、Xiをそれぞれの観測度数として、
(X−n/m)/(n/m)
の合計を検定統計量とし、カイ二乗値比較することで適合度を検定する。この例では、χ(3-1,0.05)=5.991476357>5.6であるから、非斉時ポアソン過程に適合すると判定されることがわかる。
添付図面を参照しながら本実施例の詳細を説明する。本実施例は、計数値のポアソン確率が複数の集計区間にまたがる場合に、計数値のポアソン確率が各集計区間に含まれる割合を求めて、各集計区間に分類している。
例えば、図15に示すように到着率1の場合、計数値が0になるポアソン確率は約0.368である。分割数を4とした場合、4等分なのでポアソン確率上での各集計区間の幅は、0.25となる。この場合、計数値0のポアソン確率は約0.368なので、集計区間1と集計区間2とに含まれることになる。そこで、計数値のポアソン確率0.368が各集計区間に含まれる割合を求める。集計区間1に含まれる割合は、(0.25/0.368)であり、集計区間2に含まれる割合は、(0.368−0.25)/0.368である。
このようにして集計区間のどちらか一方に集計してしまうと誤差が大きくなるような場合に、複数の集計区間に分割して集計することができるので、誤差を小さくすることができる。
図16に示すフローチャートを参照しながら計数値のポアソン確率の分割の手順を説明する。まず、初期設定を行う(ステップS10)。計数値がk以下になる累積ポアソン確率をPとして、P=0とおく。また、分割数をmとして、集計のための記憶領域を初期化し、X=X=・・・=X=0とする。次に、係数iをk−1とする(ステップS2)。kは、これから集計するデータの計数値であり、iは、kよりも1少ない値とする。
次に、h=int(mPi+1)+1を計算する。関数int(x)は、xの小数点以下を切り捨てる関数を示す。また、hは、1〜mの値を取り、集計区間を示す係数である。計数値がk以下になる累積確率に分割数をかけて1を加算し、計数値kのポアソン確率が含まれる集計区間を求める。
次に、int(mP)とint(mPi+1)とを比較し、これらがイコールであるか否かを判定する(ステップS14)。計数値を1つ増やしても集計区間が変化しなければ(ステップS14/YES)、計数値kのポアソン確率はすべてhの集計区間に含まれる。このときは、計数値kのポアソン確率は、すべて1つの計数区間に含まれるのでXhを1に設定する(ステップS15)。
また、int(mP)とint(mPi+1)がイコールではなかった場合(ステップS14/NO)、計数値kのポアソン確率が複数の集計区間をまたぐことになる。この場合、計数値kのポアソン確率が各集計区間に含まれる割合を求めて、各集計区間に分類しなければならない。
まず、計数値kのポアソン確率が集計区間hに含まれる割合を求める。この値は、(h/m−P)/(Pi+1−P)となる(ステップS17)。(h/m−P)は、k−1の累積確率から集計区間の間のしきい値(h/m)までの集計区間の幅を示し、Pi+1−Pは、計数値kのポアソン確率を示している。図15に示すλ=1でm=4の例で、k=0とすると0.25/(0.368−0)の部分に該当する。
次に、初期値1の変数j(jは1以上の整数)(ステップS18)を用いて、集計区間hに1以上の整数値を加えて、計数値kのポアソン確率が2つ以上の集計区間にまたがっているか否かを判定する。すなわち、次の集計区間のしきい値がkの累積ポアソン確率よりも小さいかどうかを判定する(ステップS19)。判定式は、(h+j)/m≦Pi+1である。
集計区間hに1以上の整数を加えて、次の集計区間のしきい値がkの累積ポアソン確率よりも小さければ(ステップS19/YES)、次のしきい値をまたぐためしきい値からしきい値までの幅を計数値kのポアソン確率の幅で割って、割合を求める。この割合は、(1/m)/(Pi+1−P)となる(ステップS20)。jに1を加えて(ステップS21)、この処理をしきい値がkの累積ポアソン確率よりも大きくなるまで繰り返す。
また集計区間hに1以上の整数を加えて、次の集計区間のしきい値がkの累積ポアソン確率よりも大きければ(ステップS19/NO)、最後にまたいだしきい値からkの累積ポアソン確率までの幅を求め、それをk−1からkまでの累積ポアソン確率の差(幅)で割って、割合を出す。この割合は、
{Pi+1−(h+j−1)}/m/(Pi+1−P
となる(ステップS22)。これを全ての観測データで行い、全データの集計が終了すると(ステップS16/YES)、処理を終了する。
[具体例4]
次に、上述した区間データ集計処理によって、複数の集計区間に分割して集計した実例を説明する。表9に、実例3で挙げたプリンタの利用度合いと在席者数との関係を示すデータを示し、表10に分割した各集計区間での集計値を示す。
Figure 2006011492
Figure 2006011492
表9に示す分類1、分類2、分類3は、それぞれの集計区間1、2、3に計数値のポアソン確率が含まれる割合に応じて集計される数値を示している。この結果、表10に示すように、χ(3-1,0.05)=5.991476357>0.225092885であるから非斉時ポアソン過程によく適合すると判定することができる。
[具体例5]
具体例5として、本社の喫煙室の利用度合いが非斉時ポアソン過程に適合するかどうかを検定する例を示す。ある会社の本社喫煙室の利用度合いも、人数が多いほど利用者数が増えると考えられるので、時間当たりの平均利用人数が居室の在室人数に比例して変動すると仮定して検証を行う。ただし、喫煙室の場合は、非喫煙者は利用しないと考えられるため、在室する人数に喫煙者率をかけたものを期待人数とする。ここでは、平日の稼動時間毎の平均期待人数と利用者数が分かっており、利用率が期待人数に比例する非斉時ポアソン過程と適合するかどうかを検定すればよい。
表11に、一日ごとの利用者数と、期待人数と、期待値と、計数値k−1までの累積ポアソン確率と、計数値kまでの累積ポアソン確率と、計数値kの累積ポアソン確率が集計区間1、2、3に含まれる割合とを示す。また、表12に、集計区間1、2、3にデータを再編集した表を示す。
Figure 2006011492
Figure 2006011492
期待値は、利用率(到着率)が期待人数に比例するとした場合に、期待人数から計算される利用者の期待値を示す。計算方法は、(総利用者数)÷(延べ期待人数)×(その時点の期待人数)である。また、分類1、分類2、分類3は、それぞれの集計区間1、2、3に集計される数値をそれぞれについて示すものである。
この結果、χ(3-1,0.05)=5.991476357>0.627617であるから、非斉時ポアソン過程によく適合すると判定されることがわかる。
[具体例6]
具体例6として、事業所の喫煙室の利用度合いが非斉時ポアソン過程に適合するかどうかを検定する例を示す。ある会社の別の事業所の喫煙室の利用度合いも、人数が多いほど利用者数が増えると考えられるので、時間当たりの平均利用人数が居室の在室人数に比例して変動すると仮定して検証を行う。
表13に、一日ごとの利用者数と、期待人数と、期待値と、計数値k−1までの累積ポアソン確率と、計数値kまでの累積ポアソン確率と、計数値kの累積ポアソン確率が集計区間1、2、3に含まれる割合とを示す。また、表14に、分類1、2、3にデータを再編集した表を示す。
Figure 2006011492
Figure 2006011492
前の例と同様に喫煙室の場合は、非喫煙者は利用しないと考えられるため、在室する人数に喫煙者率をかけたものを期待人数とする。ここでは、平日の稼動時間毎の平均期待人数と利用者数が分かっており、利用率が期待人数に比例する非斉時ポアソン過程と適合するかどうかを検定する。
期待値は、利用率(到着率)が期待人数に比例するとした場合に、期待人数から計算される利用者の期待値を示す。計算方法は、(総利用者数)÷(延べ期待人数)×(その時点の期待人数)である。
分類1、分類2、分類3は、それぞれの集計区間に集計される数値をそれぞれについて示すものである。
この結果、χ(3-1,0.05)=5.991476357>0.033977973であるから、非斉時ポアソン過程によく適合すると判定されることがわかる。
[具体例7]
具体例7として、具体例5と具体例6の観測データを合わせて、本社と事業所の喫煙室の利用度合いが同じ非斉時ポアソン過程といえるかどうかを検定する例を示す。ある会社の本社と別の事業所の喫煙室の利用度合いが、時間当たりの平均利用人数が居室の在室人数に比例して同様に変動すると仮定して、同じ分布に従うかどうかを検証する例を示す。利用人数と期待人数は前の2つの例のデータである。
表15に、本社の一日ごとの利用者数と、期待人数と、期待値と、計数値k−1までの累積ポアソン確率と、計数値kまでの累積ポアソン確率と、計数値kの累積ポアソン確率が集計区間1、2、3に含まれる割合とを示す。また、表16に、事業所の一日ごとの利用者数と、期待人数と、期待値と、計数値k−1までの累積ポアソン確率と、計数値kまでの累積ポアソン確率と、計数値kの累積ポアソン確率が集計区間1、2、3に含まれる割合とを示す。また、表17に、集計区間1、2、3に本社のデータと事業所のデータを再編集した表を示す。
Figure 2006011492
Figure 2006011492
Figure 2006011492
ここでの期待値は、本社のデータと事業所のデータを合わせて、期待人数から計算される利用者の期待値を示す。計算方法は、本社と事業所の両方のデータを合わせて、(総利用者数)÷(延べ期待人数)×(その時点の期待人数)である。
表15と表16とから明らかなように、人数あたりの平均利用率が本社のみの場合や事業所のみの場合と異なるため、期待値以降の計算値が異なる。この結果、χ(3-1,0.05)=5.991476357<10.15032733であるから、利用率が期待人数に比例する非斉時ポアソン過程には適合しないことがわかる。
前の2つの例では、それぞれの拠点において利用率が期待人数に比例する非斉時ポアソン過程に適合することが言えるので、本社と事業所では、期待人数あたりの利用率が大きく異なるという結論が導き出せる。このようにして、変動のある分布同士の比較を行うことも可能となる。
[具体例8]
具体例8として、過去の駐車場の利用率と現在の利用率の比較を行う例を示す。
Figure 2006011492
Figure 2006011492
Figure 2006011492
表18は、車の到着が非斉時ポアソン過程にしたがう、時間貸し駐車場の過去の平均到着率と現在の車の到着数を比較するものである。集計区間の求め方は、他の例と同様に仮定した分布パラメータ(過去の平均)に合わせて確率的に振り分けるものとし、途中の計算結果を一部省略したものを表19に示す。
この結果、表20に示す様に、χ(3-1,0.05)=5.991476357<9.450539092であるから、利用率が過去の平均で示される非斉時ポアソン過程には適合しないといえる。これにより、ここ数日間の駐車場の到着数で見た利用傾向は、過去の平均とは傾向が異なることがわかる。
[具体例9]
具体例9として、プリンタの利用度合いが2項分布に対して適合するかを検定する例を示す。
Figure 2006011492
Figure 2006011492
在席人数が少ない場合、一人が一定時間にプリントアウトする確率をPとおいた2項分布として扱うほうが妥当な場合がある。ここでは、確率Pを(延べ出力数)/(延べ在席人数)=0.091039427とし、試行数nを在席人数とする2項分布への適合度を検定する例を示す。ポアソン分布と同様に累積確率を用いて、確率的に3つに分類している。
この結果、χ(3-1,0.05)=5.991476357>0.184554564であるから、試行数nを在席人数とする2項分布によく適合すると判定される。
以上のように本実施例は、時間ごとの到着率が推定できるので、最も混雑する時間帯のパラメータを考慮して、例えば顧客に対して、出力枚数の統計量を加味して、必要なプリンタのスピードなどの仕様を提案したり、プリンタの設計部門において、出力ファイルサイズの統計量を加味して、プリンタのキューに必要なメモリサイズなどの仕様を決定したりすることができる。
また、逆にプリンタなどに組み込んで、時間ごとの統計量を集計するようにして、例えばある日の出力数が通常の利用状況と異なるかどうかを検定することも可能である。これを例えばオンラインでモニタすることにより、紙やトナーなどの消耗品の補給タイミングを早めたり、メンテナンスのタイミングを早めたりするようなサービスも可能になる。
同様にして、電車の乗降客数や店舗への来客数といったような、時間ごとに変動のある確率過程でも、時間帯ごとの平均到着数を求めて到着率の推定値とし、非斉時ポアソン過程として扱えるかどうか検定を行ったり、ある日のデータが定常状態から離れたデータであるかどうかを診断したり、複数の店舗での顧客の到着度合いの比較を行ったりすることが可能となる。
次に、上述した分布適合度検定装置1をプリンタ装置10に設けた実施例について説明する。図17には、プリンタ装置10の構成を示す。図17に示すようにプリンタ装置10には、通信部11と、原稿格納部12と、制御部13と、画像処理部14と、出力部15と、通知部16と、上述した分布適合度検定装置1と演算部17とを備えた消耗品補給タイミング判定装置20とが設けられている。
通信部11は、クライアント装置としてのPCと直接あるいはネットワークを通じてデータをやりとりする。通信部11を介して受信した原稿を原稿格納部12に格納する。制御部13は、通信部11を介してプリントジョブを受け取り、順次プリントアウトできるようにするためプリントジョブをプリントキューに格納する。プリントーキューは、プリントジョブを記憶しておき、順次プリントアウトできるようにするためのプログラムである。プリントキューは、原稿の格納を完了した時間を分布適合度検定装置1に送り、画像処理部14が処理中ではない状態になるまで待ち、原稿格納部12に格納した原稿データを画像処理部14に送る。
画像処理部14は、プリント出力するために原稿データを色分解してラスタ画像に変換し、出力部15に送る。出力部15は、紙の上などに印刷を行う機能部である。また、画像処理部14は、出力部15に送ったラスタ画像のページ数の情報を分布適合度検定装置1に送る。
消耗品補給タイミング判定装置20は、上述した分布適合度判定装置1と、演算部17とを有している。演算部17は、原稿格納部12への原稿の格納時間に基づいて、用紙の補給から次の補給までの間の一定時間ごとの定常状態の平均値と、一回あたりのページ数の平均値を求める。これらのデータを用いて分布推定部3で到着分布を推定し、データ保持部2に格納しておく。
また演算部17は、求めた統計データと、最後の用紙補給からの原稿到着の時間データとを本発明の検定方法によって比較し、定常状態と有意に到着分布が異なり通常より多い場合や、平均ページ数が多い場合、すなわち消費が早い場合に、通知部16から警告を行う。
また、通知部16の代わりにネットワーク接続し、ネットワーク経由で通知することにより、用紙がなくなる前に配送するサービスを行ったり、ページ数をインクやトナーの使用量にすることで、消耗品全体の配送サービスを行うことも可能である。
フローチャートを参照しながら各処理の詳細な手順を説明する。まず、図18に示すフローチャートを参照しながら制御部13による原稿受け入れ処理の手順を説明する。制御部13は、原稿の送付要求を受けると、キューの空きを調べる
(ステップS21)。キューが空いていない場合には(ステップS21/NO)、原稿の受け入れが不可能であることを通信部11を通して通知する(ステップS24)。原稿の受け入れが可能であれば(ステップS21/YES)、キューにプリントジョブを追加し(ステップS22)、格納完了した時刻を分布適度度検定装置1に送る(ステップS23)。
次に、図19に示すフローチャートを参照しながら画像処理部14によるプリント処理の手順を説明する。
プリント処理では、画像処理部14がプリントキューに格納されたプリントジョブに従って、原稿格納部12に原稿が格納されているか調べる(ステップS31)。原稿があれば(ステップS31/YES)、プリントキューから原稿を1件取り出す(ステップS32)。通常は、プリントキューに最も早く到着した原稿を取り出す。ここで、原稿の情報によって、紙切れしているサイズの原稿などを飛ばして、その時点で出力可能な原稿を取り出すようにしても構わない。
取り出した原稿は、出力のための色分解やページ割付処理による出力画像生成を行う(ステップS33)。出力画像の生成により得られたページ数の情報を、分布適合度検定装置1に送付した後(ステップS34)、出力部15によりプリントアウトなどによって出力される(ステップS35)。原稿画像を出力した後、再びキューにプリントジョブがあるかどうかを調べるステップへ戻り、プリントジョブがなくなると処理を終了する。
次に、図20に示すフローチャートを参照しながら演算部17で行われる定常データの算出手順を説明する。
定常データの算出は、演算部17において用紙の補給タイミングで行われる。まず、前回の補給時刻からの時間を求め、これまでの平均補給時間間隔を更新する(ステップS41)。続いて、前回用紙を補給したタイミングからの原稿の数と原稿のページ数をこれまでの累積値に加算し(ステップS42、43)、累積の平均原稿枚数を算出する(ステップS44)。さらに、原稿の原稿格納部12への格納時刻を集計し(ステップS45)、時間ごとの平均原稿数と、曜日ごとの平均原稿数を算出し(ステップS46、47、48)、検定のための期待度数データとしてデータ保持部2に記録する(ステップS49)。
次に、図21に示すフローチャートを参照しながら演算部17で行われるページ数集計の手順を説明する。演算部17は、画像処理部14から送られたページ数データを元に、補給後の原稿数とページ数を集計し(ステップS51、S52)、補給後のページ数の平均を算出して記録する(ステップS53、54)。
次に、図22に示すフローチャートを参照しながら演算部17で行われる到着時間記録の手順を説明する。演算部17では、原稿格納部12からから送られた格納完了時刻に基づいて、該当時間と該当日の到着数を集計し(ステップS61)、記録する(ステップS62)。
次に、図23に示すフローチャートを参照しながら演算部17で行われる補給判別の手順について説明する。演算部17は、
処理がないアイドリング状態や、各原稿の出力処理の間などに以下に示す補給判別処理を行う。まず、20時間目、30時間目、20日目などの区切り時間かどうかを判別し(ステップS71)、区切り時間以外の場合には(ステップS71/NO)、処理を終了する。ここでの区切り時間は、検定を行うタイミングであり、検定の精度を向上するため、[分類数(集計区間数)m×10]件以上のデータが必要であることから、10の分類数倍(分類数≧2)を満たすものとする。本実施例では、時間と日の両方を対象とし、時間に関する検定タイミングおよび日付に関する検定タイミングがある。
続いて、分布適合度検定装置1を制御して分布適合度検定処理を実行させる(ステップS72)。分布適合度検定処理により有意差があった場合には(ステップS73/YES)、到着率が定常状態と異なるため、平均消費率として最後に補給してからの平均到着率×原稿平均ページ数を求め、定常状態の平均到着率×原稿平均ページ数との比率を算出し(ステップS78)、平均補給時間間隔にかけ、前回の補給時間に加えたものを予想補給時間とする(ステップS75)。
また、検定の結果、有意差がなかった場合には(ステップS73/NO)、到着率が定常状態と同じとして、現在の原稿平均ページ数と定常状態の原稿平均ページ数との比率を算出し(ステップS74)、平均補給時間間隔にかけ、前回の補給時間に加えたものを予想補給時間とする(ステップS75)。この予想補給時間を現在の時刻と比較し、例えば1週間を切っていれば(ステップS76/YES)補給の必要な予測時間などを通知部16のパネルを通して警告し、ユーザに準備を促す(ステップS77)。
[具体例10]
上述したステップS72の分布適合度検定の具体例を示す。
Figure 2006011492
Figure 2006011492
表23は、プリンタの稼動時間内の出力数を、定常状態である過去の平均値と比較し検定するデータの例である。表24に示すように、検定の結果、χ(3-1,0.05)=5.991476357> 0.158053238であるから、非斉時ポアソン過程によく適合すると判定されることがわかる。このため、本実施例では補給タイミングを原稿あたりの平均ページ数の比率のみで算出することとなる。

なお、複数の用紙トレーを持つプリンタの場合には、それぞれの用紙ごとに統計量をとり、検定を行うことで、どの用紙の補給タイミングかを区別することができる。同様に、用紙だけではなく、トナーもしくはインクなども色ごとに統計量をとり、検定を行い、それぞれの補給タイミングを警告することができる。また、これらをネットワーク上で供給元に通知することで、使用状況に合わせたタイミングで配送するサービスを実施することも容易である。
次に、実施例4について説明する。本実施例は、分布適合度検定プログラムの実施例であり、図24に示すコンピュータ装置30による処理で分布適合度検定の処理が実行される。コンピュータ装置30は、図24に示すようにCPU31、ROM32、RAM33、操作部34、I/F部35等を有している。ROM32には、分布適合度検定プログラムが記録されており、このプログラムをCPU31がROM32から読み出して処理を実行する。CPU31は、RAM33に記録した測定データや統計データを読み出して、図5に示すフローチャートに従った分布適合度検定処理を実施する。このようにして本実施例でも上述した各実施例と同様の効果を得ることができる。



なお、上述した実施例は本発明の好適な実施例である。但し、これに限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変形実施可能である。例えば、上述した実施例では、非斉時ポアソン分布や二項分布等の離散分布について述べたが、連続分布であっても区間を区切って合計することで離散分布の様に扱えるので、本発明を充分に適用可能となる。
到着率5のポアソン分布と、観測データを重ね合わせて表示したグラフを示す図である。 本実施例の分布適合度検定装置1の構成を示すブロック図である。 本発明の原理を説明するための図である。 到着率の変化による分布形状の変化を示す図である。 分布適合度検定装置の動作手順を示すフローチャートである。 期待度数λの時のポアソン分布の形状と、このポアソン分布に従うと推定した観測の観測値とその度数とを示す図である。 期待度数λの時のポアソン分布の形状と、このポアソン分布に従うと推定した観測の観測値とその度数とを示す図である。 期待度数λの時のポアソン分布の形状と、このポアソン分布に従うと推定した観測の観測値とその度数とを示す図である。 期待度数λの時のポアソン分布の形状と、このポアソン分布に従うと推定した観測の観測値とその度数とを示す図である。 期待度数λの時のポアソン分布の形状と、このポアソン分布に従うと推定した観測の観測値とその度数とを示す図である。 期待度数λの時のポアソン分布の形状と、このポアソン分布に従うと推定した観測の観測値とその度数とを示す図である。 期待度数λの時のポアソン分布の形状と、このポアソン分布に従うと推定した観測の観測値とその度数とを示す図である。 各期待度数の時のポアソン分布の形状をまとめて示す図である。 各期待度数の時のポアソン分布の形状をまとめて示す図である。 到着率1のポアソン分布を示す図である。 区間データ集計処理の手順を示すフローチャートである。 プリンタ装置10の構成を示すブロック図である。 原稿受入処理の手順を示すフローチャートである。 プリント処理の手順を示すフローチャートである。 定常データ算出処理の手順を示すフローチャートである。 ページ数集計処理の手順を示すフローチャートである。 到着時間記録処理の手順を示すフローチャートである。 補給判別処理の手順を示すフローチャートである。 プログラムを実行するコンピュータの全体構成を示す図である。
符号の説明
1 分布適合度検定装置 2 データ保持部
3 分布推定部 4 集計区間決定部
5 データ集計部 6 適合度検定部
10 プリンタ装置 11 通信部
12 原稿格納部 13 制御部
14 画像処理部 15 出力部
16 通知部 17 演算部
20 消耗品補給タイミング判定装置

Claims (22)

  1. 測定したデータが、推定する確率分布に適合するかどうかを検定する分布適合度検定装置であって、
    前記測定したデータを集計する集計区間の幅を、前記測定したデータのデータ数に応じて決定する集計区間決定手段と、
    決定した各集計区間のデータ数を集計する集計手段と、
    前記各集計区間のデータ数を用いて適合度検定を行う適合度検定手段とを有することを特徴とする分布適合度検定装置。
  2. 測定したデータが、推定する確率分布に適合するかどうかを検定する分布適合度検定装置であって、
    前記測定したデータを集計する集計区間の幅を、前記推定する確率分布に応じて決定する集計区間決定手段と、
    決定した各集計区間のデータ数を集計する集計手段と、
    前記各集計区間のデータ数を用いて適合度検定を行う適合度検定手段とを有することを特徴とする分布適合度検定装置。
  3. 測定したデータが、推定する確率分布に適合するかどうかを検定する分布適合度検定装置であって、
    前記測定したデータを集計する集計区間の幅を、前記推定する確率分布と前記測定したデータのデータ数とに応じて決定する集計区間決定手段と、
    決定した各集計区間のデータ数を集計する集計手段と、
    前記各集計区間のデータ数を用いて適合度検定を行う適合度検定手段とを有することを特徴とする分布適合度検定装置。
  4. 前記集計区間決定手段は、前記各集計区間の幅が、前記推定した確率分布上で等確率になるように前記集計区間を決定することを特徴とする請求項1から3のいずれか一項に記載の分布適合度検定装置。
  5. 前記集計区間決定手段は、前記データ数に応じた所定の分割数mを決定し、前記推定する確率分布を1/mの確率ずつの等確率区間に分割して前記各集計区間幅を決定することを特徴とする請求項1から4のいずれか一項に記載の分布適合度検定装置。
  6. 前記データ集計手段は、前記測定データの計数値がkであった場合に、0からkまでの累積確率が含まれる前記等確率区間を判定して、前記測定データを前記集計区間に分類することを特徴とする請求項5記載の分布適合度検定装置。
  7. 前記集計区間決定手段は、測定したデータが複数の確率分布に従うものと仮定し、該仮定した確率分布ごとに集計区間幅を変更することを特徴とする請求項1から6のいずれかに記載の分布適合度検定装置。
  8. 前記データ集計手段は、前記測定データの計数値が、複数の集計区間にまたがる場合に、複数の集計区間に分割して集計することを特徴とする請求項1から7のいずれか一項に記載の分布適合度検定装置。
  9. 前記データ集計手段は、前記測定データの計数値が、前記複数の集計区間にまたがる場合に、前記測定データの計数値を取る確率が、前記等確率区間に含まれる割合を求め、前記測定データを前記複数の集計区間に分割して集計することを特徴とする請求項5又は6記載の分布適合度検定装置。
  10. 前記適合度検定手段は、集計したデータをカイ二乗適合度検定によって検定することを特徴とする請求項1から9のいずれか一項に記載の分布適合度検定装置。
  11. 前記推定する確率分布が、時間的に変動する確率分布であることを特徴とする請求項1から10のいずれか一項に記載の分布適合度検定装置。
  12. 前記推定する確率分布が、非斉時ポアソン過程に従うことを特徴とする請求項1から11のいずれか一項に記載の分布適合度検定装置。
  13. 測定した単位時間当たりの消耗品の消費数と、前記消耗品の過去の単位時間当たりの消費率の平均値とから適合度検定を行う請求項1から12のいずれか一項記載の分布適合度検定装置と、
    前記適合度検定により現在の消費率と過去の消費率とに有意差があると判定した場合に、前記現在の消耗品の消費率と前記過去の消耗品の消費率との比率から予測補給時間を算出し、補給の予測時間を通知する制御手段と、を有することを特徴とする消耗品補給タイミング判定装置。
  14. 請求項13記載の消耗品補給タイミング判定装置を備えることを特徴とする画像形成装置。
  15. 測定したデータが、推定する確率分布に適合するかどうかを検定する分布適合度検定方法であって、
    前記測定したデータを集計する集計区間の幅を、前記推定する確率分布と前記測定したデータのデータ数とに応じて決定する集計区間決定工程と、
    決定した各集計区間のデータ数を集計する集計工程と、
    前記各集計区間のデータ数を用いて適合度検定を行う適合度検定工程とを有することを特徴とする分布適合度検定方法。
  16. 前記集計区間決定工程は、前記各集計区間の幅が、前記推定した確率分布上で等確率になるように前記集計区間を決定することを特徴とする請求項15記載の分布適合度検定方法。
  17. 前記集計区間決定工程は、測定したデータが複数の確率分布に従うものと仮定し、該仮定した確率分布ごとに集計区間幅を決定するすることを特徴とする請求項15又は16記載の分布適合度検定方法。
  18. 前記データ集計工程は、前記測定データの計数値が、複数の集計区間にまたがる場合に、複数の集計区間に分割して集計することを特徴とする請求項15から17のいずれか一項に記載の分布適合度検定方法。
  19. 測定したデータが、推定する確率分布に適合するかどうかを検定する分布適合度検定プログラムであって、
    前記測定したデータを集計する集計区間の幅を、前記推定する確率分布と前記測定したデータのデータ数とに応じて決定する集計区間決定処理と、
    決定した各集計区間のデータ数を集計する集計処理と、
    前記各集計区間のデータ数を用いて適合度検定を行う適合度検定処理とを実行することを特徴とする分布適合度検定プログラム。
  20. 前記集計区間決定処理は、前記各集計区間の幅が、前記推定した確率分布上で等確率になるように前記集計区間を決定することを特徴とする請求項19記載の分布適合度検定プログラム。
  21. 前記集計区間決定処理は、測定したデータが複数の確率分布に従うものと仮定し、該仮定した確率分布ごとに集計区間幅を決定することを特徴とする請求項19又は20記載の分布適合度検定プログラム。
  22. 前記データ集計処理は、前記測定データの計数値が、複数の集計区間にまたがる場合に、複数の集計区間に分割して集計することを特徴とする請求項19から21のいずれか一項に記載の分布適合度検定プログラム。
JP2004183148A 2004-06-21 2004-06-21 分布適合度検定装置、消耗品補給タイミング判定装置、画像形成装置、分布適合度検定方法及びプログラム Expired - Fee Related JP4349216B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004183148A JP4349216B2 (ja) 2004-06-21 2004-06-21 分布適合度検定装置、消耗品補給タイミング判定装置、画像形成装置、分布適合度検定方法及びプログラム
US11/002,146 US7231315B2 (en) 2004-06-21 2004-12-03 Distribution goodness-of-fit test device, consumable goods supply timing judgment device, image forming device, distribution goodness-of-fit test method and distribution goodness-of-fit test program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004183148A JP4349216B2 (ja) 2004-06-21 2004-06-21 分布適合度検定装置、消耗品補給タイミング判定装置、画像形成装置、分布適合度検定方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2006011492A true JP2006011492A (ja) 2006-01-12
JP4349216B2 JP4349216B2 (ja) 2009-10-21

Family

ID=35481852

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004183148A Expired - Fee Related JP4349216B2 (ja) 2004-06-21 2004-06-21 分布適合度検定装置、消耗品補給タイミング判定装置、画像形成装置、分布適合度検定方法及びプログラム

Country Status (2)

Country Link
US (1) US7231315B2 (ja)
JP (1) JP4349216B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007299078A (ja) * 2006-04-28 2007-11-15 Fuji Xerox Co Ltd 推定分布適合度検定装置、装置状態判定装置、その方法及びプログラム
WO2008087948A1 (ja) * 2007-01-15 2008-07-24 Anritsu Corporation ランダムエラー分布評価方法及びその評価装置
JP2009020769A (ja) * 2007-07-13 2009-01-29 Toshiba Corp パターン探索装置及びその方法
WO2012039232A1 (ja) * 2010-09-24 2012-03-29 株式会社日立ソリューションズ オペレーショナルリスク分析サーバおよびオペレーショナルリスク分析システム
WO2012132352A1 (ja) * 2011-03-29 2012-10-04 日本電気株式会社 リスク管理装置
WO2012132355A1 (ja) * 2011-03-29 2012-10-04 日本電気株式会社 リスク管理装置
WO2013145629A1 (ja) * 2012-03-30 2013-10-03 日本電気株式会社 負荷評価を実行する情報処理装置及び負荷評価方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9349114B2 (en) * 2006-10-31 2016-05-24 Hewlett Packard Enterprise Development Lp Systems and methods for managing event messages
JP4284367B2 (ja) * 2007-01-12 2009-06-24 シャープ株式会社 画像形成装置
US7810095B2 (en) * 2007-09-12 2010-10-05 Xerox Corporation Method and system for characterizing elements of a print production queuing model
US20120053951A1 (en) * 2010-08-26 2012-03-01 Twenty-Ten, Inc. System and method for identifying a targeted prospect
US20150046480A1 (en) * 2012-03-30 2015-02-12 Nec Corporation Information processing device for executing load evaluation, and load evaluation method
CN105447293A (zh) * 2014-08-19 2016-03-30 中国石油化工股份有限公司 一种资源量参数分布模型的过滤方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4736437A (en) * 1982-11-22 1988-04-05 View Engineering, Inc. High speed pattern recognizer
US4718094A (en) * 1984-11-19 1988-01-05 International Business Machines Corp. Speech recognition system
US4805219A (en) * 1987-04-03 1989-02-14 Dragon Systems, Inc. Method for speech recognition
JP2693435B2 (ja) 1987-05-01 1997-12-24 株式会社リコー ソフトウェア信頼度成長曲線の適合度検定方法
US4972082A (en) * 1989-03-16 1990-11-20 Schlumberger Technology Corporation Methods and apparatus for epithermal neutron logging
US5121443A (en) * 1989-04-25 1992-06-09 Spectra-Physics, Inc. Neural net system for analyzing chromatographic peaks
US6260013B1 (en) * 1997-03-14 2001-07-10 Lernout & Hauspie Speech Products N.V. Speech recognition system employing discriminatively trained models
US6192103B1 (en) * 1999-06-03 2001-02-20 Bede Scientific, Inc. Fitting of X-ray scattering data using evolutionary algorithms
US6434488B1 (en) * 1999-12-03 2002-08-13 International Business Machines Corporation Alignment free methodology for rapid determination of differences between a test data set and known data sets
US6868380B2 (en) * 2000-03-24 2005-03-15 Eliza Corporation Speech recognition system and method for generating phonotic estimates
US7010483B2 (en) * 2000-06-02 2006-03-07 Canon Kabushiki Kaisha Speech processing system
JP4459390B2 (ja) * 2000-06-08 2010-04-28 浜松ホトニクス株式会社 蛍光測定方法、蛍光測定装置及びそれを用いた試料評価装置
US6714941B1 (en) * 2000-07-19 2004-03-30 University Of Southern California Learning data prototypes for information extraction
US6433710B1 (en) * 2000-11-03 2002-08-13 The University Court Of The University Of Edinburgh Data compression and multiple parameter estimation
EP1384155A4 (en) * 2001-03-01 2007-02-28 Health Discovery Corp SPECTRAL KNIVES FOR LEARNING MACHINES
US7818224B2 (en) * 2001-03-22 2010-10-19 Boerner Sean T Method and system to identify discrete trends in time series
US6631647B2 (en) * 2001-04-26 2003-10-14 Joseph B. Seale System and method for quantifying material properties
US7451065B2 (en) * 2002-03-11 2008-11-11 International Business Machines Corporation Method for constructing segmentation-based predictive models
JP2003281116A (ja) 2002-03-25 2003-10-03 Tama Tlo Kk データ処理装置、その方法およびそのプログラム

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007299078A (ja) * 2006-04-28 2007-11-15 Fuji Xerox Co Ltd 推定分布適合度検定装置、装置状態判定装置、その方法及びプログラム
JP4529939B2 (ja) * 2006-04-28 2010-08-25 富士ゼロックス株式会社 装置状態判定装置及びプログラム
JP4797070B2 (ja) * 2007-01-15 2011-10-19 アンリツ株式会社 ランダムエラー分布評価方法及びその評価装置
WO2008087948A1 (ja) * 2007-01-15 2008-07-24 Anritsu Corporation ランダムエラー分布評価方法及びその評価装置
JPWO2008087948A1 (ja) * 2007-01-15 2010-05-06 アンリツ株式会社 ランダムエラー分布評価方法及びその評価装置
US7987395B2 (en) 2007-01-15 2011-07-26 Anritsu Corporation Evaluation method of random error distribution and evaluation apparatus thereof
US8510311B2 (en) 2007-07-13 2013-08-13 Kabushiki Kaisha Toshiba Pattern search apparatus and method thereof
JP2009020769A (ja) * 2007-07-13 2009-01-29 Toshiba Corp パターン探索装置及びその方法
WO2012039232A1 (ja) * 2010-09-24 2012-03-29 株式会社日立ソリューションズ オペレーショナルリスク分析サーバおよびオペレーショナルリスク分析システム
JP5523574B2 (ja) * 2010-09-24 2014-06-18 株式会社日立ソリューションズ オペレーショナルリスク分析サーバおよびオペレーショナルリスク分析システム
WO2012132352A1 (ja) * 2011-03-29 2012-10-04 日本電気株式会社 リスク管理装置
WO2012132355A1 (ja) * 2011-03-29 2012-10-04 日本電気株式会社 リスク管理装置
JP2012208644A (ja) * 2011-03-29 2012-10-25 Nec Corp リスク管理装置
JP2012208641A (ja) * 2011-03-29 2012-10-25 Nec Corp リスク管理装置
KR101368103B1 (ko) 2011-03-29 2014-02-27 닛본 덴끼 가부시끼가이샤 리스크 관리 디바이스
KR101383525B1 (ko) 2011-03-29 2014-04-08 닛본 덴끼 가부시끼가이샤 리스크 관리 장치
WO2013145629A1 (ja) * 2012-03-30 2013-10-03 日本電気株式会社 負荷評価を実行する情報処理装置及び負荷評価方法

Also Published As

Publication number Publication date
US7231315B2 (en) 2007-06-12
US20050283505A1 (en) 2005-12-22
JP4349216B2 (ja) 2009-10-21

Similar Documents

Publication Publication Date Title
JP4349216B2 (ja) 分布適合度検定装置、消耗品補給タイミング判定装置、画像形成装置、分布適合度検定方法及びプログラム
US7865089B2 (en) Soft failure detection in a network of devices
US11164112B2 (en) Leave of absence prediction system, prediction rule learning device, prediction device, leave of absence prediction method, and computer-readable recording medium
US8127012B2 (en) System and methods for efficient and adequate data collection in document production environments
JP6318674B2 (ja) 障害予測システム、障害予測装置およびプログラム
Sayarshad et al. Survey and empirical evaluation of nonhomogeneous arrival process models with taxi data
JP2008165352A (ja) 定期点検データ分析装置およびその方法
US8233669B2 (en) System and method to detect changes in image quality
US10462309B2 (en) System and method for diagnosing a printing device based on a correlation coefficient between print volume and error rate
EP3913557A1 (en) Future quality of service determination method and determination program
CN112116440A (zh) 缴费提醒方法、装置、设备及存储介质
JP2017138896A (ja) 情報処理システム、情報処理装置、及びプログラム
US20130236198A1 (en) Systems and methods for forecasting supply or service consumption for a printing device
US20120109697A1 (en) Assessing health of projects
US7925460B2 (en) System and method for improving print shop operability
Hopp et al. A simple, robust leadtime-quoting policy
Gandesrukma et al. Implementation of Time Series Forecasting Using Single Moving Average Model-A Case Study in Printing Industry
Abbring et al. A simple procedure for the evaluation of treatment effects on duration variables
US20140316877A1 (en) Methods of promoting print device usage during non-peak times
CN109684549A (zh) 目标数据预测方法、装置、电子设备及计算机存储介质
JP2006133925A (ja) 情報処理システム及び情報処理方法、並びにコンピュータ・プログラム
US7810095B2 (en) Method and system for characterizing elements of a print production queuing model
US20230214789A1 (en) System and method for economically driven predictive device servicing
JP4529939B2 (ja) 装置状態判定装置及びプログラム
CN114358659B (zh) 一种单据核验信息处理方法及系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070517

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090317

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090406

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090630

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090713

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120731

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4349216

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120731

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130731

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees