JP5571230B1 - 評価システムおよび評価方法 - Google Patents

評価システムおよび評価方法 Download PDF

Info

Publication number
JP5571230B1
JP5571230B1 JP2013120483A JP2013120483A JP5571230B1 JP 5571230 B1 JP5571230 B1 JP 5571230B1 JP 2013120483 A JP2013120483 A JP 2013120483A JP 2013120483 A JP2013120483 A JP 2013120483A JP 5571230 B1 JP5571230 B1 JP 5571230B1
Authority
JP
Japan
Prior art keywords
quality information
evaluation
service quality
data
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013120483A
Other languages
English (en)
Other versions
JP2014238688A (ja
Inventor
裕一 首藤
邦夫 波戸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013120483A priority Critical patent/JP5571230B1/ja
Application granted granted Critical
Publication of JP5571230B1 publication Critical patent/JP5571230B1/ja
Publication of JP2014238688A publication Critical patent/JP2014238688A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】自己申告データの信頼度を保障する期間を拡大し、自己申告データの検証精度を向上させることを目的とする。
【解決手段】評価装置10は、ネットワーク2を介してサービスを提供するサービス提供システム1のサービスの品質を示すサービス品質情報を測定する。また、評価装置10は、測定されたサービス品質情報を他の評価装置10a〜10cに公開する。また、評価装置10は、他の評価装置10a〜10cが公開するサービス品質情報を収集する。そして、評価装置10は、評価装置10a〜10cから収集されたサービス品質情報と評価装置10が測定したサービス品質情報とを用いて、サービス提供システム1によって測定されたサービス品質情報の信頼度を評価する。
【選択図】 図1

Description

本発明は、評価システムおよび評価方法に関する。
近年、クラウドコンピューティングに代表されるように、ネットワークを経由して各種サービスを提供するサービス提供システムが知られている。このようなサービス提供システムの一例として、ネットワークを経由して仮想マシンの実行環境をユーザに提供するIaaS(Infrastructure as a Service)が知られている。
また、CPU(Central Processing Unit)処理速度、メモリ転送速度、ネットワークの帯域等、サービス提供システムにより提供されるサービスの品質を示すサービス品質情報をユーザに提供する技術が知られている。このような技術の一例として、サービス提供システムの運営者が測定したサービスの品質と、第三者である評価機関が測定したサービスの品質とを用いて、サービス提供システムの利用者に信頼度の高いサービス品質情報を提供する統計監査方式が知られている。
例えば、統計監査方式では、サービス提供システムが提供するサービスの品質をシステム運営者が測定し、測定値を自己申告データとして公開する。一方、評価機関は、サービス提供システムが提供するサービスの品質を抜き打ちで測定し、測定値を監査データとする。そして、評価機関は、公開された自己申告データと監査データとを比較することで、システム運営者による自己申告データの偽装を検証する。
首藤裕一,波戸邦夫,小林秀承,桑名栄二,"インタークラウドにおけるリソース性能測定方式", 電子情報通信学会技術研究報告,Vol.112, No.393,IN2012-153, 平成25年1月 首藤裕一,波戸邦夫,"インタークラウドにおけるリソース性能測定方式の評価", 電子情報通信学会技術研究報告,Vol.112, No.464,IN2012-156, 平成25年3月
しかしながら、評価機関が抜き打ちで測定を行った場合は、測定を行った期間については自己申告データの信頼度が保障されるものの、評価機関が抜き打ちで測定を行っていない期間については、自己申告データの信頼度が保障されないという課題がある。
なお、評価機関は、仮説検定を用いて自己申告データの検証を行う場合は、サービス提供システムが提供するサービスの品質を測定する頻度が多いほど、検証精度を向上させることができる。しかしながら、評価機関は、サービス提供システムが提供するサービスの品質を測定する頻度に比例して、測定に要するコストを増加させてしまう。
開示の実施形態は、上述に鑑みてなされたものであって、自己申告データの信頼度を保障する期間を拡大し、自己申告データの検証精度を向上させることを目的とする。
開示する評価システムは、一つの態様において、サービス提供システムがネットワークを介して提供するサービスの品質を評価する複数の評価装置を有する。評価装置は、測定部と、公開部と、収集部と、自己申告データ評価部とを有する。測定部は、サービスの品質を示すサービス品質情報を所定の頻度で測定する。公開部は、測定部が測定したサービス品質情報を他の評価装置に公開する。収集部は、他の評価装置が公開するサービス品質情報を収集する。自己申告データ評価部は、収集部が収集したサービス品質情報と測定部が測定したサービス品質情報とを用いて、サービス提供システムが公開するサービス品質情報の信頼度を評価する。
開示する評価システムの一つの態様によれば、自己申告データの信頼度を保障する期間を拡大し、自己申告データの検証精度を向上させるという効果を奏する。
図1は、第1の実施形態に係る評価システムを説明する図である。 図2は、第1の実施形態に係る評価装置の機能構成を説明する図である。 図3は、第1の実施形態における自己申告データの一例を説明する図である。 図4は、偽装が含まれる自己申告データの一例を説明する図である。 図5は、第1の実施形態に係る監査データの一例を説明する第1の図である。 図6は、第1の実施形態に係る監査データの一例を説明する第2の図である。 図7は、第1の実施形態に係る総合データの一例を説明する図である。 図8は、第1の実施形態に係る評価装置の効果を説明する図である。 図9は、第1の実施形態に係る評価装置が実行する処理の流れを説明するフローチャートである。 図10は、第1の実施形態に係る評価装置が信頼できる監査データを抽出する処理の流れを説明するフローチャートである。 図11は、実施形態に係る評価プログラムを実行するコンピュータを示す図である。
以下に添付図面を参照して評価システムおよび評価方法について説明する。なお、本実施形態により開示する発明が限定されるものではない。各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
(第1の実施形態)
以下、図1を用いて、サービス提供システムがネットワークを介して提供するサービスの評価を行う評価システムの一例について説明する。図1は、第1の実施形態に係る評価システムを説明する図である。図1に示す例では、評価システム100は、ネットワーク2を介して、サービス提供システム1、ユーザ端末3と接続されている。
また、評価システム100は、それぞれネットワーク2に接続された複数の評価装置10と、評価装置10と同様の機能を発揮する評価装置10a〜10cを有する。なお、図1では省略したが、評価システム100は、他にも、評価装置10と同様の評価装置を有してもよい。また、評価装置10a〜10cは、評価装置10と同様の機能を発揮するものとして、以下の説明を省略する。
サービス提供システム1は、ネットワーク2を介して、ユーザ端末3に各種サービスの提供を行う。例えば、サービス提供システム1は、ネットワーク2を介してVM(Virtual Machine)等の仮想リソースをユーザ端末3に提供する。なお、サービス提供システム1は、物理的に1つの情報処理装置である必要はない。また、サービス提供システム1は、例えば、IaaS等のクラウドシステムであってもよい。
ここで、サービス提供システム1は、所定の頻度で、サービス提供システム1が提供するサービスの品質を示すサービス品質情報を測定し、測定したサービス品質情報を公開する。例えば、サービス提供システム1は、利用者に対して提供するVMのベンチマークを常時測定し、測定内容を示すサービス品質情報を公開する。
ここで、サービス品質情報が示す測定内容の例としては、VMが有する仮想的なCPU(Central Processing Unit)処理速度、メモリ転送速度及びネットワーク帯域等の項目が測定した時刻とともに含まれる。なお、以下の説明では、サービス提供システム1が公開するサービス品質情報の集合を、自己申告データと記載する。
一方、評価装置10は、抜き打ちで、サービス提供システム1が提供するサービスの品質を示すサービス品質情報を測定する。例えば、評価装置10は、1ヶ月間当たり3日間の頻度で、サービス提供システム1が利用者に提供するVMのベンチマークを抜き打ちで測定し、測定内容を示すサービス品質情報を生成する。
そして、評価装置10は、生成したサービス品質情報と、同時期にサービス提供システム1が測定した自己申告データとを比較して、自己申告データの信頼度を評価する。すなわち、評価装置10は、評価値の水増し等が行われている場合は、自己申告データと生成したサービス品質情報との間に有意差が生じるので、自己申告データと生成したサービス品質情報とを比較することで、自己申告データの偽証等を検証する。
ここで、評価装置10が抜き打ちでサービス品質情報を測定しなかった期間については、一定の抑止力が働くものの、自己申告データの信頼度は保障されていない。また、評価装置10がサービス品質情報を測定する頻度を増やした場合は、自己申告データの偽証を精度良く検定することができるものの、測定コストを増加させてしまう。
そこで、評価装置10は、以下の処理を実行する。まず、評価装置10は、評価装置10が抜き打ちで測定したサービス品質情報を他の評価装置10a〜10cに公開する。また、他の評価装置10a〜10cも同様に、抜き打ちで測定したサービス品質情報を公開する。そして、評価装置10は、他の評価装置10a〜10cが公開するサービス品質情報を収集し、収集したサービス品質情報と、評価装置10が測定したサービス品質情報とを統合した統合データを生成する。その後、評価装置10は、生成した統合データと自己申告データとを比較することで、自己申告データの信頼度を評価する。
すなわち、各評価装置10、10a〜10cがサービス品質情報を測定するタイミングは、それぞれ異なると考えられる。このため、評価装置10は、各評価装置10、10a〜10cが測定したサービス品質情報を共有し、共有したサービス品質情報を用いて、自己申告データの信頼度を評価した場合は、自己申告データの信頼性を保障する期間を拡大することができる。この結果、評価装置10は、測定コストの増加を抑えつつ、自己申告データの偽証を精度良く検証できる。
ここで、例えば、一部の評価装置とサービス提供システム1とが癒着状態にある等、各評価装置10、10a〜10cが共有するサービス品質情報に偽装が含まれる事態が考えられる。また、ベンチマークソフトウェアのバグ等により、一部の評価装置によって測定されたサービス品質情報が他の評価装置によって測定されたサービス品質情報と大きく異なる事態が考えられる。このように、各評価装置10、10a〜10cが共有するサービス品質情報に偽装やノイズが含まれる場合は、評価装置10による自己申告データの信頼度を検証する精度が低下する。
そこで、評価装置10は、各評価装置10、10a〜10cが測定したサービス品質情報同士をそれぞれ比較することで、偽装が含まれるサービス品質情報やノイズとなるサービス品質情報等、信頼度の低いサービス品質情報を検出する。そして、評価装置10は、各評価装置10、10a〜10cが測定したサービス品質情報から、信頼度の低いサービス品質情報を除外し、信頼度の高いサービス品質情報と自己申告データとを比較することで、自己申告データの信頼度を検証する精度を向上させる。
以下、サービス提供システム1が発揮する機能の一例、および、評価装置10が発揮する機能の一例について説明するが、実施の形態は、このような実施形態に限定されるものではない。例えば、各評価装置10、10a〜10bはユーザ端末3と同様に、サービス提供システム1の利用者が使用する端末装置であってもよい。また、以下の説明では、評価装置10が測定したサービス品質情報の集合を監査データと記載する。
また、以下の説明では、評価装置10は、同時期に測定された監査データと自己申告データとを比較する際、監査データの平均値と自己申告データの平均値とに有意な差が存在するか否かをマン・ホイットニーのU検定により検定する例について説明する。しかしながら、実施の形態はこれに限定されるものではなく、例えば、評価装置10は、各データの平均値ではなく、各データの分散値を用いても良い。また、例えば、評価装置10は、マン・ホイットニーのU検定ではなく、例えば、ウェルチの検定等、他の検定手法を用いても良い。
また、以下の説明では、自己申告データ、および、監査データには、サービス提供システム1が稼動させるVM上で所定のベンチマークソフトウェアを実行し、ベンチマークソフトウェアが算出した所定項目におけるベンチマークの値が格納されているものとする。
図2は、第1の実施形態に係る評価装置の機能構成を説明する図である。図2に示す例では、サービス提供システム1は、自己申告データ公開DB(DataBase)4、システム制御部5、サービス提供部6、通信部7を有する。また、システム制御部5は、自己測定部8、公開部9を有する。また、サービス提供部6は、複数のVM6a、6bを稼動させる。なお、図2では、サービス提供部6が稼動させるVM6a、6bを記載したが、サービス提供部6は、他にも複数のVMを稼動させるものとする。
一方、評価装置10は、通信部11、制御部12、監査データ公開DB13を有する。また、制御部12は、測定部14、公開部15、収集部16、連携システム評価部17、出力部18、自己申告データ評価部19を有する。
まず、サービス提供システム1の機能構成について説明する。自己申告データ公開DB4は、サービス提供システム1が測定した自己申告データを記憶するデータベースである。例えば、自己申告データ公開DB4には、サービス提供システム1が測定した自己申告データが、測定時刻を示す時刻情報とともに格納されている。システム制御部5は、サービス提供システム1が提供するサービスの品質を測定し、測定値を示す自己申告データの生成、および、公開を行う。
サービス提供部6は、各種サービスの提供を行う。具体的には、サービス提供部6は、ネットワーク2を介して、ユーザ端末3や評価装置10からサービス提供要求を受け付けると、新たなVMを稼動させ、稼動させたVMを要求元であるユーザ端末3や評価装置10に割り当てる。かかる場合、ユーザ端末3は、割り当てられたVMに各種プログラムを実行させることができる。また、評価装置10は、割り当てられたVMに、VMの品質(CPU処理速度やメモリ転送速度など)を測定するためのベンチマークソフトウェアを実行させ、ベンチマークの値を取得する。
通信部7は、サービス提供システム1の通信を制御する。例えば、通信部7は、ネットワーク2を介して、ユーザ端末3や評価装置10からサービス提供要求を受信すると、受信したサービス提供要求をサービス提供部6に出力する。そして、通信部7は、ユーザ端末3や評価装置10とVMとの間におけるデータ通信を中継する。また、通信部7は、自己申告データ公開DB4に格納された自己申告データの送信を要求する送信要求を受信すると、受信した送信要求を公開部9に出力する。かかる場合は、通信部7は、公開部9から自己申告データを受信するので、受信した自己申告データを送信要求の要求元となる評価装置へ送信する。
自己測定部8は、所定の頻度で、自己申告データを測定し、測定した自己申告データを自己申告データ公開DB4に格納する。例えば、自己測定部8は、1時間に一度の頻度でサービス提供部6にサービス提供要求を発行し、VMの割り当てを受ける。すると、自己測定部8は、割り当てられたVMに所定の期間ベンチマークソフトウェアを実行させ、ベンチマークの値を取得する。
そして、自己測定部8は、取得したベンチマークの値と測定時刻を示す時刻情報とを対応付けたサービス品質情報の集合である自己申告データを生成し、生成した自己申告データを自己申告データ公開DB4に格納する。なお、他の例では、自己測定部8は、サービス提供部6から割り当てられたVMに常時ベンチマークソフトウェアを実行させ、取得したベンチマークの値と測定時刻とを対応付けた自己申告データを自己申告データ効果DB4に格納し続けても良い。また、以下の説明では、時刻情報は、ベンチマークの測定を行った年、月、日、時間、分を示すものとする。
公開部9は、自己申告データ公開DB4に格納された自己申告データを公開する。例えば、公開部9は、通信部7を介して、自己申告データの送信を要求する送信要求を受信する。かかる場合は、公開部9は、自己申告データ公開DB4に格納された自己申告データを読出し、読出した自己申告データを通信部7に出力する。
ここで、サービス提供システム1が公開するサービス品質情報には、サービス提供システム1の運営者がVMの品質を良く見せようとして、ベンチマークの測定値を20パーセント程向上させる等、偽装を加える場合が考えられる。以下、図3及び図4を用いて、サービス提供システム1が公開するサービス品質情報の例と、偽装を加えたサービス品質情報の例について説明する。
例えば、図3は、第1の実施形態における自己申告データの一例を説明する図である。なお、図3に示す例では、横軸方向を測定日時とし、縦軸方向を測定されたサービス品質の測定値、すなわち、ベンチマークスコアとして、サービス提供システム1が公開する自己申告データをプロットした。例えば、図3に示す例では、自己申告データは、ベンチマークスコアの値が約60から約140の間に分布している。
一方、図4は、偽装が含まれる自己申告データの一例を説明する図である。なお、図4に示す例では、図3と同様に、横軸方向を測定日時とし、縦軸方向を測定されたベンチマークスコアとして、偽装が含まれる自己申告データをプロットした。詳細には、各ベンチマークスコアを一律で20パーセント向上させた自己申告データをプロットした。例えば、図4に示す例では、自己申告データは、ベンチマークスコアの値が約80から約160の間に分布している。このため、偽装が含まれる自己申告データと偽装が含まれない自己申告データとでは、ベンチマークスコアの分布に有意差が存在する。
図2に戻り、評価装置10が有する機能構成について説明する。通信部11は、評価装置10の通信を制御する。例えば、通信部11は、測定部14からサービス提供要求を受信すると、ネットワーク2を介して、サービス提供要求をサービス提供システム1に送信する。また、通信部11は、他の評価装置10a〜10cから、監査データの取得要求を受信すると、受信した取得要求を公開部15に送信し、応答として監査データを受信すると、受信した監査データを取得要求の送信元となる評価装置へ送信する。
また、通信部11は、収集部16から監査データの取得要求を受信すると、ネットワーク2を介して、受信した取得要求を各評価装置10a〜10cへ送信し、応答として各評価装置10a〜10cから監査データを受信すると、受信した監査データを収集部16に出力する。また、通信部11は、自己申告データ評価部19から、自己申告データの送信要求を受信すると、ネットワーク2を介して、受信した送信要求をサービス提供システム1に送信し、応答として自己申告データを受信すると、受信した自己申告データを自己申告データ評価部19に出力する。
制御部12は、評価装置10が発揮する機能の制御を行う。また、監査データ公開DB13は、サービス提供システム1が提供するサービスの品質を評価装置10が測定した際の評価値を含む監査データを記憶するデータベースである。
測定部14は、サービス提供システム1が提供するサービスの品質を示すサービス品質情報の測定を行う。例えば、測定部14は、通信部11及びネットワーク2を介して、サービス提供要求を所定の頻度でサービス提供システム1に送信する。そして、測定部14は、サービス提供システム1から割り当てられたVMに、ベンチマークソフトウェアを実行させ、実行結果として取得されるベンチマークの値を取得する。また、測定部14は、取得したベンチマークの値とベンチマークの値を測定した時刻とを対応付け、監査データ公開DB13に格納する。
公開部15は、測定部14が測定したサービス品質情報を他の評価装置10a〜10cに公開する。例えば、公開部15は、ネットワーク2及び通信部11を介して、他の評価装置10a〜10cから、監査データの取得要求を受信すると、監査データ公開DB13から監査データを読み出す。そして、公開部15は、読み出した監査データを通信部11に出力する。
収集部16は、他の評価装置10a〜10cが測定したサービス品質情報を収集する。例えば、収集部16は、測定部14がサービス品質情報の測定を実行した場合は、通信部11に対して監査データの取得要求を出力し、他の評価装置10a〜10cがそれぞれ測定したサービス品質情報を含む複数の監査データを受信する。そして、収集部16は、受信した各監査データを連携システム評価部17に出力する。
連携システム評価部17は、収集部16が収集したサービス品質情報と測定部14が測定したサービス品質情報との比較結果に基づいて、収集部16が収集したサービス品質情報の信頼度をそれぞれ評価する。具体的には、連携システム評価部17は、各評価装置10a〜10cから取得した監査データから、評価対象となる監査データを選択する。また、連携システム評価部17は、各評価装置10a〜10cから取得した監査データのうち、評価対象となる監査データ以外の監査データと、評価装置10の監査データとを統合した統合データを生成する。
そして、連携システム評価部17は、評価対象となる監査データと統合データとを比較し、両データの平均値や分散値などに有意差が存在するか否かを判定する。その後、連携システム評価部17は、両データの平均値や分散値などに有意差が存在する場合は、選択した監査データの信頼度が低いと判定し、判定結果を出力部18に通知する。
以下、連携システム評価部17が実行する処理の一例を詳細に説明する。なお、以下の説明では、収集部16が各評価装置10a〜10cから収集した監査データのうち、評価装置10aが測定した監査データを監査データDaと記載し、評価装置10bが測定した監査データを監査データDbと記載し、評価装置10cが測定した監査データを監査データDcと記載する。また、以下の説明では、評価装置10が測定した監査データを監査データDxと記載する。
なお、以下の説明では、3つの監査データDa、Db、Dcから信頼度の低い監査データを検出する例について説明するが、実施形態はこれに限定されるものではない。すなわち、連携システム評価部17は、以下に説明する処理と同様の処理を実行することで、任意の数の監査データから信頼度の低い監査データを検出することができる。
例えば、連携システム評価部17は、収集部16から、監査データDa、Db、Dcを受信する。また、連携システム評価部17は、監査データ公開DB13から監査データDxを取得する。続いて、連携システム評価部17は、監査データDa、Db、Dcから検証対象となる監査データDaを選択する。
そして、連携システム評価部17は、選択した監査データDaと、監査データDa以外の監査データDx、Db、Dcの和集合である統合データとを比較し、両データの平均値や分散値に有意差が存在するか否かを判定する。なお、以下の説明では、監査データの和集合をプラス記号で示す。例えば、以下の説明では、監査データDbと監査データDcとの和集合を総合データDb+Dcと記載する。
ここで、図5、図6を用いて、総合データDb、Dcの一例について説明する。図5は、第1の実施形態に係る監査データの一例を説明する第1の図である。また、図6は、第1の実施形態に係る監査データの一例を説明する第2の図である。なお、図5には、監査データDbの一例を図3、図4と同様にプロットし、図6には、監査データDcの一例を図3、図4と同様にプロットした。
図5に示す例では、評価装置10bは、測定日5日、15日、20日の3日間、サービス提供システム1が提供するサービスの品質を測定した。このため、監査データDbには、図5に示すように、測定日5日、15日、20日において、ベンチマークスコアが約100となるサービス品質情報が含まれる。
一方、図6に示す例では、評価装置10cは、測定日4日、6日、22日の3日間、サービス提供システム1が提供するサービスの品質を測定した。このため、監査データDcには、図6に示すように、測定日4日、6日、22日において、ベンチマークスコアが約90となるサービス品質情報が含まれる。
ここで、連携システム評価部17は、評価装置10bが測定した監査データDbと、評価装置10cが測定した監査データDcとの和集合を算出する。この結果、例えば、連携システム評価部17は、図7に示す総合データを取得する。図7は、第1の実施形態に係る総合データの一例を説明する図である。連携システム評価部17は、監査データDbと監査データDcとの和集合を算出することで、例えば、図7に示すように、図5に示した監査データDbと図6に示した監査データDcとを重ね合わせた総合データDb+Dcを得る。
さらに、連携システム評価部17は、総合データDb+Dcと監査データDxとの和集合を算出し、統合データDx+Db+Dcを取得する。次に、連携システム評価部17は、監査データDaに含まれるサービス品質情報が測定された時刻と統合データDx+Db+Dcに含まれるサービス品質情報が測定された時刻とに共通する期間を全て抽出し、抽出した期間の集合を共通測定期間とする。そして、連携システム評価部17は、共通測定期間内に測定されたサービス品質情報を監査データDaおよび統合データDx+Db+Dcから抽出し、抽出したサービス品質情報に有意差の検証を行う。
例えば、連携システム評価部17は、監査データDaに含まれるサービス品質情報の時刻情報と、統合データDx+Db+Dcに含まれるサービス品質情報の時刻情報とを比較し、年、月、日、時間が共通する期間を全て抽出する。詳細な例では、連携システム評価部17は、監査データDaに平成25年3月1日19時20分に測定したサービス品質情報が含まれ、統合データDx+Db+Dcに平成25年3月1日19時35分に測定したサービス品質情報が含まれる際に、共通測定期間の粒度を1時間とする場合は、共通測定期間として、平成25年3月1日19時00分00秒〜平成25年3月1日19時59分59秒を抽出する。
そして、連携システム評価部17は、監査データDaおよび統合データDx+Db+Dcから共通測定期間に測定されたサービス品質情報をそれぞれ抽出し、抽出したサービス品質情報同士の有意差を示す値としてp値を仮説検定により算出する。すなわち、連携システム評価部17は、監査データDaと統合データDx+Db+Dcとに差がないと仮定した際に差があると結論づけられる確率の近似値を算出する。その後、連携システム評価部17は、p値の値が所定の閾値よりも小さいか否かを判定し、所定の閾値よりも小さい場合は、監査データDaの信頼度が低いと判定する。
また、連携システム評価部17は、他の監査データDb、Dcについても、監査データDaと同様に、他の監査データの和集合である統合データとの統計量に有意な差が存在するか否かを仮説検定により判定することで、信頼度の判定を行う。そして、連携システム評価部17は、各監査データDx、Da、Db、Dcを出力部18に出力するとともに、各監査データDx、Da、Db、Dcの信頼度が高いか低いかを通知する。
ここで、連携システム評価部17は、信頼度が低いと判定した監査データについては、他の監査データの信頼度を判断する際に統合データから除外して判定を行う。例えば、連携システム評価部17は、監査データDaの信頼度が低いと判定した場合は、監査データDbの信頼度を判定する際に、監査データDbと統合データDx+Dcとの比較を行う。かかる場合、連携システム評価部17は、各監査データの信頼度をどのような順番で判定しても良い。また、連携システム評価部17は、仮説検定を実行する際に、任意のパラメータ値を採用することができる。
なお、他の例では、連携システム評価部17は、全ての監査データについて信頼度を判定してから、信頼度が低いと判定されたもののうち、信頼度が最も低い監査データを割愛し、残りの全監査データについて、再度信頼度を判定してもよい。かかる場合、連携システム評価部17は、マン・ホイットニーのU検定等の仮説検定を用いて、各監査データの信頼度をp値という定量的な値で算出できるので、監査データの信頼度の順位付けを容易に行うことができる。
また、他の例では、連携システム評価部17は、複数のサービス提供システムが提供するサービスの品質を、複数の評価装置が評価する場合、サービス提供システムと評価装置との組ごとに、監査データの信頼度を評価する。そして、連携システム評価部17は、信頼度の評価結果が低い監査データを測定した評価装置による全ての評価データを統合データから除外してもよい。
また、他の例では、連携システム評価部17は、統合データに含まれるサービス品質情報の数を任意の測定期間ごとに計数し、ある期間内に測定されたサービス品質情報の数が所定の閾値よりも多い場合は、かかる期間内に測定されたサービス品質情報のうち、ランダムに選択した所定の数のサービス品質情報以外のサービス品質情報を削除することで、統合データに含まれるサービス品質情報の時間的な偏りを軽減してもよい。
以下、連携システム評価部17がある期間内に測定されたサービス品質情報から所定の数のサービス品質情報をランダムに選択する処理について説明する。なお、以下の説明では、サービス品質情報の数が所定の閾値よりも多い期間を重複測定期間と記載する。また、以下の説明では、連携システム評価部17は、評価装置10、10b、10cのうち2つ以上の評価装置がサービス品質情報を測定した重複測定期間を抽出し、抽出した重複測定期間内のサービス品質情報から1つのサービス品質情報を選択する例について説明する。
例えば、連携システム評価部17は、統合データDx+Db+Dcに含まれる各サービス品質情報が測定された時刻を参照し、2つ以上のサービス品質情報が測定された重複期間を抽出する。そして、連携システム評価部17は、抽出した重複測定期間ごとに、重複測定期間内に測定されたサービス品質情報から、1つのサービス品質情報をランダムに選択する。その後、連携システム評価部17は、重複測定期間内に測定されたサービス品質情報から、選択したサービス品質情報以外のサービス品質情報を削除した統合データDx+Db+Dcを生成する。
例えば、連携システム評価部17は、統合データDx+Db+Dcに平成25年3月1日19時台に測定されたサービス品質情報が2つ以上含まれる場合は、重複測定期間である平成25年3月1日19時台に測定されたサービス品質情報からランダムに1つのサービス品質情報を選択する。そして、連携システム評価部17は、統合データDx+Db+Dcに含まれる平成25年3月1日19時台に測定されたサービス品質情報のうち、選択したサービス品質情報以外のサービス品質情報を削除する。その後、連携システム評価部17は、統合データDx+Db+Dcと監査データDaとの比較を行う。
このように、連携システム評価部17は、各期間におけるサービス品質情報の数をそろえた統合データを生成し、生成した統合データと監査データとを比較することで、監査データの信頼度を評価する。かかる処理を行った場合、評価装置10は、監査データの評価に用いるサービス品質情報の測定時刻の偏りを軽減するので、監査データの信頼度を精度良く評価できる。
例えば、一部の測定期間において、複数の評価装置がサービス品質情報を重複して測定した場合は、監査データの評価に用いるサービス品質情報に測定時間の偏りが生じる結果、監査データの信頼度の評価精度を悪化させてしまう。そこで、連携システム評価部17は、重複測定期間内に測定されたサービス品質情報から所定の数のサービス品質情報をランダムに選択することで、監査データの評価に用いる統合データに含まれるサービス品質情報の時間的な偏りを解消する結果、監査データの信頼度の評価精度を向上させることができる。
なお、連携システム評価部17は、測定されたサービス品質情報の数を計数する測定期間の長さを任意に設定してよい。例えば、連携システム評価部17は、時間単位ではなく、日単位で測定されたサービス品質情報の数を計数してもよい。また、連携システム評価部17は、重複測定期間内に測定されたサービス品質情報から、任意の数のサービス品質情報を測定してよい。また、連携システム評価部17は、上述した任意の処理を矛盾しない範囲で組み合わせて実行することができる。
図2に戻り、出力部18は、収集部16が収集した監査データのうち、信頼度が所定の閾値よりも高い監査データと、測定部14が測定した監査データとの和集合を統合データとして算出し、算出した統合データを自己申告データ評価部19に出力する。例えば、出力部18は、連携システム評価部17から、監査データDx、Da、Db、Dcを受信する。また、出力部18は、連携システム評価部17から、監査データDaの信頼度が低い旨の通知を受信する。かかる場合は、出力部18は、監査データDaを除く各監査データDx、Db、Dcを統合した統合データDx+Db+Dcを算出し、算出した統合データDx+Db+Dcを自己申告データ評価部19に出力する。
自己申告データ評価部19は、収集部16が収集した監査データと測定部14が測定した監査データとを用いて、サービス提供システム1が公開する自己申告データの信頼度を評価する。具体的には、自己申告データ評価部19は、出力部18から、信頼度が所定の閾値よりも高い監査データを統合した統合データを受信する。かかる場合、自己申告データ評価部19は、通信部11に対し、自己申告データの送信要求を出力し、自己申告データを受信する。そして、自己申告データ評価部19は、出力部18から受信した統合データと受信した自己申告データとを比較し、自己申告データの信頼度を評価する。その後、自己申告データ評価部19は、例えば、自己申告データの評価結果をユーザ端末3等に通知する。
なお、自己申告データ評価部19は、例えば、マン・ホイットニーのU検定等の統計的検定により、自己申告データと統合データとの平均値や分散値などに有意差が存在するか否かによって、自己申告データの信頼度を評価する。詳細な例を挙げると、自己申告データ評価部19は、連携システム評価部17と同様に、自己申告データと統合データとから共通測定期間を抽出する。そして、自己申告データ評価部19は、抽出した共通測定期間内に測定されたサービス品質情報を自己申告データと統合データとから抽出し、抽出したサービス品質情報の有意差を示す値としてp値を仮説検定により算出する。
その後、自己申告データ評価部19は、p値が所定の閾値よりも低い場合は、自己申告データの信頼度が低いと評価する。一方、自己申告データ評価部19は、p値が所定の閾値よりも高い場合は、自己申告データと統合データとに有意差がないと判断し、自己申告データの信頼度が高いと評価する。
なお、自己申告データ評価部19は、連携システム評価部17と同様に、以下の処理を行っても良い。すなわち、自己申告データ評価部19は、出力部18から受信した統合データに含まれるサービス品質情報の測定日時を参照し、所定の閾値以上の数のサービス品質情報が測定された重複測定期間を抽出する。また、自己申告データ評価部19は、統合データに含まれるサービス品質情報のうち、抽出した重複測定期間内に測定されたサービス品質情報からランダムに所定の数のサービス品質情報を選択する。そして、自己申告データ評価部19は、抽出した重複測定期間内に測定されたサービス品質情報のうち、選択したサービス品質情報以外のサービス品質情報を削除する。
その後、自己申告データ評価部19は、自己申告データと統合データとを比較することで、自己申告データの信頼度を評価する。かかる処理を実行することで、評価装置10は、統合データからサービス品質情報を測定した時間的な偏りを軽減するので、自己申告データの信頼度を評価する精度を向上させることができる。
次に、図8を用いて、評価装置10の効果について説明する。図8は、第1の実施形態に係る評価装置の効果を説明する図である。なお、図8に示す例では、サービス提供システム1がサービス品質情報を常時測定する例について説明する。例えば、従来の評価機関は、図8中(A)に示すように、所定の頻度でサービス品質情報を測定した監査データと、自己申告データとを比較する。このため、従来の評価機関は、図8中(A)で網掛けした範囲についてのみ自己申告データが正しいか否かを保障するが、他の部分については、保証することができない。
一方、図8中(B)に示すように、評価装置10は、評価装置10、10a〜10cの監査データを統合して自己申告データが正しいか否かを判定する。このため、評価装置10は、図8中(C)に示すように、評価装置10がサービス品質情報の測定を行った範囲だけではなく、評価装置10a〜10cがサービス品質情報の測定を行った範囲についても自己申告データが正しいか否かを保障することができる。この結果、評価装置10は、図8中(B)の網掛けした範囲に示すように、自己申告データが正しいか否かを保障する期間を拡大する結果、自己申告データの検査精度を向上させることができる。
また、評価装置10は、評価装置10、10a〜10cの監査データをそれぞれ比較し、信頼度の高い監査データのみを統合した統合データを生成する。そして、評価装置10は、生成した統合データと自己申告データとを比較して、自己申告データの信頼度を評価する。この結果、評価装置10は、偽装を行う評価装置やサービス品質情報の測定精度が悪い評価装置の監査データを除外して自己申告データの信頼度を評価するので、検査制度の悪化を防ぐことができる。
ここで、図8中(C)に示す範囲には、監査装置10aと監査装置10bとがサービス品質情報の測定を行った重複測定期間が存在し、かかる期間だけ複数のサービス品質情報が存在するので、統合データにサービス品質情報の時間的な偏りが存在する。そこで、評価装置10は、重複測定期間内に測定されたサービス品質情報のうち、監査装置10aが測定したサービス品質情報と監査装置10bが測定したサービス品質情報とのいずれか一方を選択し、他方のサービス品質情報を統合データから削除する。この結果、評価装置10は、統合データに含まれるサービス品質情報の時間的な偏りを解消できるので、自己申告データの信頼度を評価する精度を向上させることができる。
次に、図9を用いて、評価装置10が実行する処理の流れについて説明する。図9は、第1の実施形態に係る評価装置が実行する処理の流れを説明するフローチャートである。例えば、評価装置10は、他の評価装置10a〜10cから監査データを収集する(ステップS101)。次に、評価装置10は、収集した監査データと自装置の監査データとを用いて、信頼できる監査データの抽出を行う(ステップS102)。
また、評価装置10は、抽出した信頼できる監査データと自装置の監査データとを統合した統合データを生成する(ステップS103)。そして、評価装置10は、サービス提供システム1から自己申告データを取得し(ステップS104)、統合データと自己申告データとを比較して自己申告データの信頼度を評価する(ステップS105)。その後、評価装置10は、評価結果を出力し(ステップS106)、処理を終了する。
次に、図10を用いて、評価装置10が信頼できる監査データの抽出を行う処理の一例について説明する。図10は、第1の実施形態に係る評価装置が信頼できる監査データを抽出する処理の流れを説明するフローチャートである。なお、図10に示す処理は、図9中ステップS102に示す処理を詳細にしたものである。
また、図10に示す処理は、処理を一般化するため、評価装置の集合をE,E、…,Eとし、サービス提供システムの集合をI,I,…,Iとする。また、図10に示す例では、評価装置Eによるサービス提供システムIの監査データをDi,jと記載した。また、図10に示す例では、監査データDi,jの信頼度を評価する際に用いる統合データをDall(i,j)と記載した。
まず、評価装置10は、初期値をi=1、j=1として図10に示す処理を開始する(ステップS201)。次に、評価装置10は、Di,jが、後述するステップS212の処理によって除外されているか否かを判定する(ステップS202)。そして、評価装置10は、Di,jが、後述するステップS212の処理によって除外されていない場合は(ステップS202:否定)、統合データDall(i,j)の算出を行う(ステップS203)。
詳細には、評価装置10は、統合データDall(i,j)=Σk≠ik,j=D1,j+D2,j+…Di−1,j+Di+1,j+…Dm,jを算出する。この際、評価装置10は、ステップS212にて除外されたDi’,j’については無視して加算を行わない。すなわち、評価装置10は、サービス提供システムIに対する全評価装置10、10a〜10cの監査データのうち、信頼度の評価対象となる監査データDi,jと、信頼度が低いと判断された監査データDi’,j’とを除外した監査データの総和を統合データDall(i,j)として算出する。次に、評価装置10は、Dall(i,j)とDi,jとから共通測定期間に測定された測定値を抽出し、抽出したデータに対して仮説検定を実行し(ステップS204)、仮説検定の結果をpi,jとして記憶する(ステップS205)。
次に、評価装置10は、j=nであるか否かを判定する(ステップS206)。すなわち、評価装置10は、評価装置Eが測定した全ての監査データについて、信頼度の評価を行ったか否かを判定する。そして、評価装置10は、j=nではない場合(ステップS206:No)、すなわち、評価装置Eが測定した他の監査データについて信頼度の評価を行っていない場合は、jの値に1を加算し(ステップS207)、ステップS202を実行する。また、評価装置10は、j=nである場合は(ステップS206:Yes)、i=mであるか否かを判定する(ステップS208)。すなわち、評価装置10は、サービス提供システムIについての全ての監査データについて、信頼度の評価を行ったか否かを判定する。そして、評価装置10は、i=mではない場合(ステップS208:No)、すなわち、サービス提供システムIについて測定された監査データのうち、信頼度の評価が行われていない監査データが存在する場合は、iの値に1を加算し(ステップS209)、ステップS202を実行する。
また、評価装置10は、i=mである場合(ステップS208:Yes)、すなわち、全ての評価装置と全てのサービス提供システムとの組について、仮説検定の結果を算出した場合は、記憶したpi,jのうち、最小の値を選択する(ステップS210)。続いて、評価装置10は、選択したpi,jの値が所定の閾値以下か否かを判定し(ステップS211)、選択したpi,jの値が所定の閾値以下である場合は(ステップS211:Yes)、Di,1、Di,2…、Di,nを処理の対象から除外する(ステップS212)。すなわち、評価装置10は、仮説検定の結果、信頼度が所定の閾値よりも低く、かつ、信頼度が最も低い監査データを測定した評価装置により測定された全ての監査データをDi’,j’として処理の対象から除外する。
その後、評価装置10は、記憶した全てのpi,jを消去して(ステップS213)、ステップS201から処理を再度実行する。一方、評価装置10は、選択したpi,jの値が所定の閾値より大きい場合は(ステップS211:No)、ステップS212にて除外したDi’,j’を信頼度が低い監査データとして出力し(ステップS214)、処理を終了する。なお、評価装置10は、Di,jが、ステップS212の処理によって除外されている場合は(ステップS202:肯定)、ステップS203〜S205の処理をスキップし、ステップS206を実行する。
[評価装置10の効果]
上述したように、評価装置10は、サービス提供システム1のサービス品質情報を測定する。また、評価装置10は、測定したサービス品質情報を公開する。また、評価装置10は、他の評価装置10a〜10cが測定したサービス品質情報を収集し、収集したサービス品質情報と測定したサービス品質情報とを用いて、サービス提供システム1が測定したサービス品質情報である自己申告データの信頼度を評価する。
このため、評価装置10は、自己申告データの信頼度を保障する期間を拡大し、自己申告データの検証精度を向上させることができる。また、評価装置10は、評価装置10、10a〜10cの監査データを統合することで、監査データに含まれるサービス品質情報の標本数が増加するので、自己申告データの検査制度を向上させることができる。
また、評価装置10は、他の評価装置10a〜10cが測定したサービス品質情報と評価装置10が測定したサービス品質情報との比較結果に基づいて、他の評価装置10a〜10cが測定したサービス品質情報の信頼度をそれぞれ評価する。そして、評価装置10は、信頼度が所定の閾値よりも高いサービス品質情報と、評価装置10が測定したサービス品質情報とを用いて、自己申告データの信頼度を評価する。このため、評価装置10は、偽装が含まれるサービス品質情報や、測定精度が悪いサービス品質情報等、ノイズとなるサービス品質情報を除外して自己申告データの信頼度を検証するので、自己申告データの検証精度を向上させることができる。
また、評価装置10は、統合データに含まれるサービス品質情報と、評価対象となるサービス品質情報とから、共通測定期間内に測定されたサービス品質情報を抽出し、抽出したサービス品質情報の比較結果に応じて、評価対象となるサービス品質情報の信頼度を評価する。すなわち、評価装置10は、同時期に測定されたサービス品質情報の比較結果に応じて、各評価装置10a〜10cが測定したサービス品質情報の信頼度を評価するので、より適切にサービス品質情報の信頼度を評価できる。
また、評価装置10は、統合データに含まれるサービス品質情報から、所定の閾値よりも多くのサービス品質情報が測定された重複測定期間を抽出し、重複測定期間内に測定されたサービス品質情報から所定の数のサービス品質情報をランダムに選択する。また、評価装置10は、重複測定期間内に測定されたサービス品質情報のうち、選択したサービス品質情報以外のサービス品質情報を削除する。その後、評価装置10は、統合データと評価対象となる監査データとの比較結果に応じて、評価対象となる監査データの信頼度を評価する。このため、評価装置10は、監査データの評価を行う際に時間的な偏りを解消するので、監査データの評価を精度良く実行できる。
また、評価装置10は、信頼度が所定の閾値よりも高いと評価された監査データの和集合である統合データに含まれるサービス品質情報から、所定の閾値よりも多くのサービス品質情報が測定された重複測定期間を抽出し、重複測定期間内に測定されたサービス品質情報から所定の数のサービス品質情報をランダムに選択する。また、評価装置10は、重複測定期間内に測定されたサービス品質情報のうち、選択したサービス品質情報以外のサービス品質情報を削除する。そして、評価装置10は、統合データと自己申告データとの比較結果に応じて、自己申告データの信頼度を評価する。このため、評価装置10は、自己申告データの評価を行う際に、各評価装置10、10a〜10cが測定した監査データの時間的な偏りを解消するので、自己申告データの評価を制度良く実行できる。
また、評価装置10は、評価装置10a〜10cが測定したサービス品質情報のうち、評価対象となるサービス品質情報および信頼度が所定の閾値よりも低いと評価されたサービス品質情報を除外したサービス品質情報と、評価装置10が測定したサービス品質情報との和集合である統合データと、評価対象となるサービス品質情報とを比較する。このため、評価装置10は、より適切にサービス品質情報の信頼度を評価できる。
(他の実施形態)
これまで第1の実施形態について説明したが、開示する発明は上述した実施形態以外にも様々な異なる形態にて実施されてよいものである。そこで、以下では他の実施形態について説明する。
(システム構成)
また、第1の実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上述文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。
(信頼度を評価する際の処理について)
評価装置10は、上述した処理以外の処理を実行することで、各監査データの評価を行っても良い。例えば、評価装置10は、複数のサービス提供システムが存在する場合は、各評価装置10a〜10cが各サービス提供システムについて測定した監査データに対する信頼度の値(p値等)の最小値や平均値、最大値を取るなどして評価装置10a〜10cごとの信頼度を算出し、算出した信頼度が所定の閾値よりも低い評価装置が測定した監査データを、統合データから除外してもよい。
また、評価装置10は、監査データの信頼度を評価する際に、仮説検定以外の処理を行っても良い。また、評価装置10は、監査データの信頼度を定量的に算出する必要はなく、任意の手法を用いて、監査データの信頼度を評価し、評価結果に応じて監査データの除外等を行ってもよい。また、評価装置10は、p値以外の値を評価値として用いてもよい。すなわち、評価装置10は、監査データや自己申告データの信頼度を示す情報が所定の閾値よりも低く、信頼度が低いと判断した場合は、監査データや自己申告データに偽装が含まれると判定しても良い。
(プログラム)
また、上記実施形態において説明した評価装置10が実行する処理をコンピュータが実行可能な言語で記述したプログラムを作成することもできる。例えば、第1の実施形態に係る評価装置10が実行する処理をコンピュータが実行可能な言語で記述した評価プログラムを作成することもできる。この場合、コンピュータが評価プログラムを実行することにより、上記実施形態と同様の効果を得ることができる。
さらに、かかる通評価プログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録された評価プログラムをコンピュータに読み込ませて実行することにより上記第1の実施形態と同様の処理を実現してもよい。以下に、評価装置10と同様の機能を実現する評価プログラムを実行するコンピュータの一例を説明する。
図11は、実施形態に係る評価プログラムを実行するコンピュータを示す図である。図11に示すように、コンピュータ1000は、例えば、メモリ1010と、CPU(Central Processing Unit)1020と、ハードディスクドライブインタフェース1030と、ディスクドライブインタフェース1040と、シリアルポートインタフェース1050と、ビデオアダプタ1060と、ネットワークインタフェース1070とを有する。これらの各部は、バス1080によって接続される。
メモリ1010は、ROM(Read Only Memory)1011およびRAM(Random Access Memory)1012を含む。ROM1011は、例えば、BIOS(Basic Input Output System)等のブートプログラムを記憶する。ハードディスクドライブインタフェース1030は、ハードディスクドライブ1090に接続される。ディスクドライブインタフェース1040は、ディスクドライブ1100に接続される。ディスクドライブ1100には、例えば、磁気ディスクや光ディスク等の着脱可能な記憶媒体が挿入される。シリアルポートインタフェース1050には、例えば、マウス1110およびキーボード1120が接続される。ビデオアダプタ1060には、例えば、ディスプレイ1130が接続される。
ここで、図11に示すように、ハードディスクドライブ1090は、例えば、OS(Operating System)1091、アプリケーションプログラム1092、プログラムモジュール1093およびプログラムデータ1094を記憶する。本実施形態に係る評価プログラムは、例えば、コンピュータ1000によって実行される指令が記述されたプログラムモジュールとして、例えばハードディスクドライブ1090に記憶される。具体的には、上記実施形態で説明した測定部14、公開部15、収集部16、連携システム評価部17、出力部19、自己申告データ評価部19が実行する各種処理を実行させるためのプログラムモジュールが、ハードディスクドライブ1090に記憶される。
また、上記実施形態で説明した監査データのように、評価プログラムによる情報処理に用いられるデータは、プログラムデータとして、例えば、ハードディスクドライブ1090に記憶される。そして、CPU1020が、ハードディスクドライブ1090に記憶されたプログラムモジュールやプログラムデータを必要に応じてRAM1012に読み出して、収集ステップと、選択ステップと、表示ステップとを実行する。
なお、評価プログラムに係るプログラムモジュールやプログラムデータは、ハードディスクドライブ1090に記憶される場合に限られず、例えば、着脱可能な記憶媒体に記憶されて、ディスクドライブ1100等を介してCPU1020によって読み出されてもよい。あるいは、情報送受信プログラムに係るプログラムモジュールやプログラムデータは、LAN(Local Area Network)やWAN(Wide Area Network)等のネットワークを介して接続された他のコンピュータに記憶され、ネットワークインタフェース1070を介してCPU1020によって読み出されてもよい。
これまでいくつかの実施形態を説明したが、本願が開示する技術はこれらの実施形態に限定されるものではない。すなわち、これらの実施形態は、その他の様々な形態で実施されることが可能であり、種々の省略、置き換え、変更を行うことができる。
例えば、各装置の分散・統合の具体的形態(例えば、図2の形態)は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的又は物理的に分散・統合することができる。一例を挙げると、測定部14と公開部15とを一つの部として統合してもよい。また、収集部16、連携システム評価部17、出力部18を1つの部として統合してもよい。
また、実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的に行うこともできる。
これらの実施形態やその変形は、本願が開示する技術に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
1 サービス提供システム
2 ネットワーク
3 ユーザ端末
4 自己申告データ公開DB
5 システム制御部
6 サービス提供部
6a、6b VM
7 通信部
8 自己測定部
9 公開部
10、10a〜10c 評価装置
11 通信部
12 制御部
13 監査データ公開DB
14 測定部
15 公開部
16 収集部
17 連携システム評価部
18 出力部
19 自己申告データ評価部
100 評価システム

Claims (8)

  1. サービス提供システムによりネットワークを介して提供されるサービスの品質を評価する複数の評価装置を備えた評価システムであって、
    前記評価装置は、
    前記サービスの品質を示すサービス品質情報を測定する測定部と、
    前記測定部が測定したサービス品質情報を他の評価装置に公開する公開部と、
    前記他の評価装置が公開するサービス品質情報を収集する収集部と、
    前記収集部が収集したサービス品質情報と前記測定部が測定したサービス品質情報とを用いて、前記サービス提供システムにより測定されたサービス品質情報の信頼度を評価する自己申告データ評価部と
    を有することを特徴とする評価システム。
  2. 前記評価装置は、
    前記収集部が収集したサービス品質情報と前記測定部が測定したサービス品質情報との比較結果に基づいて、前記収集部が収集したサービス品質情報の信頼度をそれぞれ評価する連携システム評価部を有し、
    前記自己申告データ評価部は、前記収集部が収集したサービス品質情報のうち、前記連携システム評価部により評価された信頼度が所定の閾値よりも高いサービス品質情報と、前記測定部が測定したサービス品質情報とを用いて、前記サービス提供システムが公開するサービス品質情報の信頼度を評価することを特徴とする請求項1に記載の評価システム。
  3. 前記連携システム評価部は、前記収集部が収集したサービス品質情報のうち評価対象となるサービス品質情報以外のサービス品質情報と前記測定部が測定したサービス品質情報との和集合である統合データと、前記評価対象となるサービス品質情報とを比較することで、該評価対象となるサービス品質情報の信頼度を評価することを特徴とする請求項2に記載の評価システム。
  4. 前記連携システム評価部は、前記統合データに含まれる測定値と前記評価対象となるサービス品質情報に含まれる測定値とから、共通してサービス品質情報の測定を行った期間を抽出し、前記統合データに含まれる測定値のうち抽出した期間内に測定された測定値と前記評価対象となるサービス品質情報に含まれる測定値のうち抽出した期間内に測定された測定値との比較結果に応じて、前記評価対象となるサービス品質情報の信頼度を評価することを特徴とする請求項3に記載の評価システム。
  5. 前記連携システム評価部は、前記統合データに含まれる測定値から、所定の閾値よりも多くの測定値が測定された重複測定期間を抽出し、当該重複測定期間内に測定された測定値から、ランダムに選択された所定の数の測定値以外の測定値を削除し、当該測定値の削除を行った統合データに含まれる測定値と前記評価対象となるサービス品質情報に含まれる測定値との比較結果に応じて、前記評価対象となるサービス品質情報の信頼度を評価することを特徴とする請求項3または4に記載の評価システム。
  6. 前記自己申告データ評価部は、前記連携システム評価部により信頼度が所定の閾値よりも高いと評価されたサービス品質情報と前記測定部が測定したサービス品質情報との和集合である統合データに含まれる測定値から、所定の閾値よりも多くの測定値が測定された重複測定期間を抽出し、当該重複測定期間内に測定された測定値から、ランダムに選択された所定の数の測定値以外の測定値を削除し、当該測定値の削除を行った統合データに含まれる測定値と前記サービス提供システムにより測定されたサービス品質情報に含まれる測定値との比較結果に応じて、前記サービス提供システムが公開するサービス品質情報の信頼度を評価することを特徴とする請求項2〜5のいずれか1つに記載の評価システム。
  7. 前記連携システム評価部は、前記収集部が収集したサービス品質情報のうち、評価対象となるサービス品質情報および信頼度が所定の閾値よりも低いと評価されたサービス品質情報を除くサービス品質情報と、前記測定部が測定したサービス品質情報との和集合である統合データを生成し、当該生成データと前記評価対象となるサービス品質情報とを比較することを特徴とする請求項3〜6のいずれか1つに記載の評価システム。
  8. サービス提供システムによりネットワークを介して提供されるサービスの品質を評価する複数の評価装置を有する評価システムで実行される評価方法であって、
    各評価装置が、
    前記サービスの品質を示すサービス品質情報を所定の頻度で測定する測定工程と、
    前記測定工程で測定されたサービス品質情報を他の評価装置に公開する公開工程と、
    前記他の評価装置が公開するサービス品質情報を収集する収集工程と、
    前記収集工程で収集されたサービス品質情報と前記測定工程で測定されたサービス品質情報とを用いて、前記サービス提供システムが公開するサービス品質情報の信頼度を評価する自己申告データ評価工程と
    を含むことを特徴とする評価方法。
JP2013120483A 2013-06-07 2013-06-07 評価システムおよび評価方法 Active JP5571230B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013120483A JP5571230B1 (ja) 2013-06-07 2013-06-07 評価システムおよび評価方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013120483A JP5571230B1 (ja) 2013-06-07 2013-06-07 評価システムおよび評価方法

Publications (2)

Publication Number Publication Date
JP5571230B1 true JP5571230B1 (ja) 2014-08-13
JP2014238688A JP2014238688A (ja) 2014-12-18

Family

ID=51427270

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013120483A Active JP5571230B1 (ja) 2013-06-07 2013-06-07 評価システムおよび評価方法

Country Status (1)

Country Link
JP (1) JP5571230B1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111831319A (zh) * 2020-07-20 2020-10-27 北京百度网讯科技有限公司 差异数据后验方法、装置、设备及存储介质

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6782035B2 (ja) * 2018-11-13 2020-11-11 株式会社すなおネット 商品情報管理システム及びサービス情報管理システム
JP6698991B1 (ja) * 2018-11-13 2020-05-27 株式会社すなおネット 商品情報管理システム及びサービス情報管理システム
JP6774131B2 (ja) * 2020-03-06 2020-10-21 株式会社すなおネット 商品情報管理システム及びサービス情報管理システム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004280741A (ja) * 2003-03-19 2004-10-07 Hitachi Ltd リソース信頼性判定システム及び方法
WO2013015292A1 (ja) * 2011-07-25 2013-01-31 日本電気株式会社 品質評価装置、品質評価方法及びそのためのプログラムを記録した記録媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004280741A (ja) * 2003-03-19 2004-10-07 Hitachi Ltd リソース信頼性判定システム及び方法
WO2013015292A1 (ja) * 2011-07-25 2013-01-31 日本電気株式会社 品質評価装置、品質評価方法及びそのためのプログラムを記録した記録媒体

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG201300185002; 首藤 裕一: 'インタークラウドにおけるリソース性能測定方式の評価' 電子情報通信学会技術研究報告 Vol.112 No.464 第112巻, 20130228, 13〜18, 一般社団法人電子情報通信学会 *
JPN6014026266; 首藤 裕一: 'インタークラウドにおけるリソース性能測定方式の評価' 電子情報通信学会技術研究報告 Vol.112 No.464 第112巻, 20130228, 13〜18, 一般社団法人電子情報通信学会 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111831319A (zh) * 2020-07-20 2020-10-27 北京百度网讯科技有限公司 差异数据后验方法、装置、设备及存储介质
CN111831319B (zh) * 2020-07-20 2023-08-01 北京百度网讯科技有限公司 差异数据后验方法、装置、设备及存储介质

Also Published As

Publication number Publication date
JP2014238688A (ja) 2014-12-18

Similar Documents

Publication Publication Date Title
US9405662B2 (en) Process for displaying test coverage data during code reviews
US20150095892A1 (en) Systems and methods for evaluating a change pertaining to a service or machine
US10942763B2 (en) Operation management apparatus, migration destination recommendation method, and storage medium
US9009536B2 (en) Test case production utilizing problem reports
CN107222331B (zh) 分布式应用系统性能的监控方法、装置、存储介质及设备
JP5571230B1 (ja) 評価システムおよび評価方法
US10411969B2 (en) Backend resource costs for online service offerings
US20150199251A1 (en) Techniques for monitoring a shared hardware resource
JP7278299B2 (ja) データ管理サーバ、データ利用サーバ、データ流通システム、データ管理方法及びプログラム
US10073726B2 (en) Detection of outage in cloud based service using usage data based error signals
CN115878394A (zh) 内存测试方法、装置、电子设备及存储介质
US11036701B2 (en) Data sampling in a storage system
US10445213B2 (en) Non-transitory computer-readable storage medium, evaluation method, and evaluation device
JP6775082B2 (ja) 時系列データの分析制御方法および分析制御装置
US11205018B2 (en) Device identification via chip manufacturing related fingerprints
KR102218374B1 (ko) 비정형 트랜잭션 비식별 데이터의 품질 측정 방법 및 장치
US10382311B2 (en) Benchmarking servers based on production data
Mazur et al. The robust measurement method for security metrics generation
CN115022201B (zh) 一种数据处理功能测试方法、装置、设备及存储介质
Shekhar et al. Understanding performance interference benchmarking and application profiling techniques for cloud-hosted latency-sensitive applications
JP5483780B1 (ja) サービス品質情報の品質属性特定システム及びサービス品質情報の品質属性特定方法
JP2011186712A (ja) 性能分析装置及び性能分析方法及び性能分析プログラム
Shahzad et al. Using wage rate analysis to determine software project scale
US20140067481A1 (en) Estimation of effects of process customization
US8347124B2 (en) Workload power consumption projection on information handling system

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140624

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140625

R150 Certificate of patent or registration of utility model

Ref document number: 5571230

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150