JP2018025944A - リソース制御ブログラム、リソース制御方法及びリソース制御装置 - Google Patents

リソース制御ブログラム、リソース制御方法及びリソース制御装置 Download PDF

Info

Publication number
JP2018025944A
JP2018025944A JP2016156873A JP2016156873A JP2018025944A JP 2018025944 A JP2018025944 A JP 2018025944A JP 2016156873 A JP2016156873 A JP 2016156873A JP 2016156873 A JP2016156873 A JP 2016156873A JP 2018025944 A JP2018025944 A JP 2018025944A
Authority
JP
Japan
Prior art keywords
keyword
information processing
site
resource
control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016156873A
Other languages
English (en)
Inventor
岡 繁樹
Shigeki Oka
繁樹 岡
悟 中谷
Satoru Nakatani
悟 中谷
雄貴 鈴木
Yuki Suzuki
雄貴 鈴木
章王 枩浦
Akikimi Matsuura
章王 枩浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2016156873A priority Critical patent/JP2018025944A/ja
Publication of JP2018025944A publication Critical patent/JP2018025944A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】適切なタイミングで仮想サーバのスケールアウトを実行する。【解決手段】話題性分析システム60は、他サイト(SNSやブログサイト)から、自サイトで提供されるサービスに関連するキーワードの出現頻度カウント値を取得する。また、オートスケール制御システム70は、他サイト話題性情報DB64の出現頻度カウント値が示す、他キーワードの出現数の時間的変化に応じて、Webサイトを運用する仮想サーバ14をスケールアウトさせる。【選択図】図1

Description

本発明は、リソース制御ブログラム、リソース制御方法及びリソース制御装置に関する。
クラウドサービスでは、物理サーバではなく、仮想基盤上に仮想サーバを割り当てることでサービスの提供(Webサイトの運用等)を行うことがある。仮想サーバは、複製することで簡単にサーバ台数を増やすことが可能である。このため、Webサイトの利用者の増加により、仮想サーバのCPUやメモリが過負荷になった場合、仮想サーバを複製して台数を増やす(スケールアウトする)ことで、利用者からのWebサイトへのアクセスや処理に対応することができる。特に、クラウドサービスが従量課金制の場合には、必要なときだけ仮想サーバを増やすことで、Webサイトの管理者にコスト的なメリットが生じる。
なお、特許文献1,2等には、負荷に応じてリソースを割り当てる技術について開示されている。
特開2015−95149号公報 特開2011−258119号公報
サーバの負荷状況を監視し、負荷が閾値よりも高くなったことを検知してからスケールアウトを自動的に実施する場合、仮想サーバを増やしている間の利用者からのアクセス要求を処理できず、ビジネス機会を喪失するおそれがある。
これに対応するため、閾値を低く設定したり、予め多めに仮想サーバを稼働させておくなどの対策を講じることもできる。しかしながら、このような対策を講じた場合、急激なアクセス増加には対処できるものの、従量課金制の場合には、Webサイトの管理者に余計なコストが発生してしまう。
1つの側面では、本発明は、適切なタイミングで特定の情報処理装置に割り当てるリソースの増加又は減少の制御を行うことが可能なリソース制御ブログラム、リソース制御方法及びリソース制御装置を提供することを目的とする。
一つの態様では、リソース制御ブログラムは、コンピュータに、登録されたデータの参照を許容する制御を行う情報処理装置に対して、前記情報処理装置への特定の情報処理装置により提供されるサービスに関連するキーワードの登録状況を問い合わせ、問い合わせた前記登録状況が示す、前記キーワードの登録数の時間的変化に応じて、前記特定の情報処理装置に割り当てるリソースの増加又は減少の制御を行う、処理を実行させるブログラムである。
適切なタイミングで特定の情報処理装置に割り当てるリソースの増加又は減少の制御を行うことができる。
一実施形態に係るクラウドサーバの構成を概略的に示す図である。 クラウドサーバのハードウェア構成を示す図である。 図3(a)は、ログ情報を示す図であり、図3(b)は、自サイトアクセス数DBのデータ構造を示す図である。 図4(a)は、自サイトキーワードDBのデータ構造を示す図であり、図4(b)は、他サイトキーワードDBのデータ構造を示す図である。 図5(a)は、注目キーワードDBのデータ構造を示す図であり、図5(b)は、他サイト話題性情報DBのデータ構造を示す図である。 図6(a)は、自サイト負荷相関DBのデータ構造を示す図であり、図6(b)は、話題性/アクセス相関DBのデータ構造を示す図である。 オートスケール制御部の一連の処理を示すフローチャートである。 図7の自サイト負荷相関DB作成処理(S100)の具体的処理を示すフローチャートである。 図7の自サイトキーワードDB作成処理(S200)の具体的処理を示すフローチャートである。 図7の他サイトキーワードDB作成処理(S300)の具体的処理を示すフローチャートである。 図7のメイン処理(S400)の具体的処理を示すフローチャートである。 図11のステップS410の具体的処理を示すフローチャートである。 図11のステップS440の具体的処理を示すフローチャートである。 図11のステップS450の具体的処理を示すフローチャートである。 図11のステップS460の具体的処理を示すフローチャートである。 図11のステップS470の具体的処理を示すフローチャートである。 図16のステップS472の回帰分析に用いるグラフの一例を示す図である。
以下、クラウドサーバ100の一実施形態について、図1〜図17に基づいて詳細に説明する。
図1には、本実施形態に係るクラウドサーバ100の機能ブロック図が示され、図2には、クラウドサーバ100のハードウェア構成が示されている。
クラウドサーバ100は、図2に示すように、CPU(Central Processing Unit)190、ROM(Read Only Memory)192、RAM(Random Access Memory)194、記憶部(ここではHDD(Hard Disk Drive))196、ネットワークインタフェース197、及び可搬型記憶媒体用ドライブ199等を備えている。これらクラウドサーバ100の構成各部は、バス198に接続されている。クラウドサーバ100では、ROM192あるいはHDD196に格納されているブログラム(リソース制御ブログラムを含む)、或いは可搬型記憶媒体用ドライブ199が可搬型記憶媒体191から読み取ったブログラム(リソース制御ブログラムを含む)をCPU190が実行することにより、図1に示す、各部の機能が実現される。なお、図1には、クラウドサーバ100のHDD196等に格納されている各種DB(database)も図示されている。
クラウドサーバ100では、CPU190がブログラムを実行することで、サービス提供部10、クラウド基盤制御部20、オートスケール制御部30として機能する。
サービス提供部10は、仮想基盤上に仮想サーバ14を割り当てることでサービスの提供(Webサイトの運用等)を行う。サービス提供部10は、仮想サーバへの通信の振り分けを行うロードバランサ12を有している。
クラウド基盤制御部20は、仮想サーバ14の監視や仮想サーバ14の生成、削除等を行う。具体的には、クラウド基盤制御部20は、監視システム22と、クラウド構成管理システム24と、を有する。監視システム22は、仮想サーバ14の負荷情報の収集と監視を行い、各Webサイトの負荷情報をオートスケール制御部30に送信する。クラウド構成管理システム24は、各Webサイトの負荷情報に基づいて、仮想サーバ14の生成(スケールアウト)や削除(スケールイン)を行う。すなわち、クラウド構成管理システム24は、Webサイトの管理者が利用する特定の情報処理装置に対してリソースを割り当てる制御を行っている。
オートスケール制御部30は、クラウド構成管理システム24によるスケールアウトやスケールインを制御するものである。オートスケール制御部30は、ログシステム40と、キーワード分析システム50と、話題性分析システム60と、オートスケール制御システム70と、を有する。
ログシステム40は、ロードバランサ12や、仮想サーバ14(Webサイト)のログを収集し、ログ情報42として一括保存する。また、ログシステム40は、ログ情報42から、仮想サーバ14において運用されているWebサイト(「自サイト」と呼ぶ)へのアクセス数の推移を取得し、自サイトアクセス数DB44に蓄積する。
ここで、ログ情報42は、図3(a)に示すような情報を含んでいる。具体的には、ログ情報42には、アクセスに関する情報として「タイムスタンプ」、「アクセス元情報」、「接続先URL情報」が含まれる。「タイムスタンプ」は、自サイトへのアクセス日時の情報であり、「アクセス元情報」は、自サイトにアクセスしてきた端末のIPアドレスの情報であり、「接続先URL情報」は、自サイトのURL(Uniform Resource Locator)情報である。
また、自サイトアクセス数DB44は、図3(b)に示すようなデータ構造を有する。具体的には、自サイトアクセス数DB44は、「対象の仮想サーバ識別子」、「対象URL」、「アクセス数」の各フィールドを有する。「対象の仮想サーバ識別子」のフィールドには、アクセスのあった自サイトが運用されている仮想サーバの識別子が格納される。また、「対象URL」のフィールドには、アクセスがあったページのURLが格納され、「アクセス数」のフィールドには、所定時間(例えば1分)の間における各ページへのアクセス数が格納される。
図1に戻り、キーワード分析システム50は、ログシステム40において蓄積されるログ情報42を分析して、自サイトで用いられているキーワードのうち集計のターゲットとなるキーワードを自動抽出する。そして、キーワード分析システム50は、自動抽出したキーワードを自サイトキーワードDB52に蓄積する。また、キーワード分析システム50は、インターネット上のSNS(Social Networking Service)やブログサイト(以下、「他サイト」とも呼ぶ)で人気となっているキーワードを抽出する。そして、キーワード分析システム50は、抽出したキーワードを他サイトキーワードDB54に蓄積する。なお、他サイトを提供するサーバ等は、登録されたデータ(書き込まれたワードや検索されたワード)の参照を許容する制御を行う情報処理装置であると言える。
ここで、自サイトキーワードDB52は、図4(a)に示すようなデータ構造を有する。具体的には、自サイトキーワードDB52は、「対象の仮想サーバ識別子」、「対象ページの識別情報」、「主キーワード」、「サブキーワード」の各フィールドを有する。「対象の仮想サーバ識別子」のフィールドには、自サイトを運用している仮想サーバ14の識別子が格納され、「対象ページの識別情報」のフィールドには、抽出したキーワードが存在するページの識別情報が格納される。「主キーワード」のフィールドには、キーワード分析システム50が自サイトから抽出したキーワード(タイトルや主語など、ページ内でメインとなるワード)が格納される。また、「サブキーワード」のフィールドには、主キーワードに関連するサブキーワードが格納される。サブキーワードは、例えば、主キーワードから所定範囲内に存在し、主キーワードを説明するワードなど、主キーワードに関連している可能性の高いワードを意味する。
また、他サイトキーワードDB54は、図4(b)に示すようなデータ構造を有する。具体的には、他サイトキーワードDB54は、「時刻情報」、「主キーワード」、「サブキーワード」の各フィールドを有する。「時刻情報」のフィールドには、主キーワードを抽出した日時の情報が格納される。「主キーワード」のフィールドには、キーワード分析システム50が抽出した他サイトで人気となっているキーワードが格納される。また、「サブキーワード」のフィールドには、主キーワードに関連するキーワード(例えば、主キーワードをインターネット上で検索したときに、主キーワードに付随しているキーワードなど)が格納される。なお、他サイトキーワードDB54に格納される主キーワードは、Webサイトで提供されるサービスに関連するキーワードであると言える。
図1に戻り、話題性分析システム60は、他サイトキーワードDB54から、自サイトキーワードDB52に格納されているキーワードに類似しているものを注目キーワードとして抽出し、注目キーワードDB62に蓄積する。また、話題性分析システム60は、インターネット上の他サイト(SNSやブログサイト)で単位時間あたりの注目キーワードの出現頻度をカウントし、カウントデータを他サイト話題性情報DB64に蓄積する。なお、話題性分析システム60は、他サイトに登録されたデータの登録状況を問い合わせる問い合わせ部として機能している。
注目キーワードDB62は、図5(a)に示すようなデータ構造を有する。具体的には、注目キーワードDB62は、「類似度」、「他キーワード(注目キーワード)」、「自キーワード」の各フィールドを有する。この注目キーワードDB62には、類似度が高い順に、他サイトに存在するキーワード(他キーワード)、すなわち注目キーワードと、該注目キーワードに類似する自サイトに存在するキーワード(自キーワード)とが関連付けて格納される。
また、他サイト話題性情報DB64は、図5(b)に示すようなデータ構造を有する。具体的には、他サイト話題性情報DB64は、「対象の仮想サーバ識別子」、「キーワード」、「出現頻度カウント」の各フィールドを有する。他サイト話題性情報DB64においては、注目キーワードの単位時間当たりの出現頻度(出現回数)のカウント値が、注目キーワードと類似する自キーワードに関連付けて格納されるとともに、自キーワードが存在する自サイトを運用する仮想サーバ14の識別子が格納されている。具体的には、図5(a)の注目キーワード「●○ゲーム」の単位時間当たりの出現頻度(出現回数)のカウント値がnであった場合には、「●○ゲーム」と類似する自キーワード「○○ゲーム」の出現頻度カウントとして、他サイト話題性情報DB64に値nが格納される。そして、自キーワード「○○ゲーム」が存在するWebサイトを運用する仮想サーバの識別子「vm001」も他サイト話題性情報DB64に格納される。
オートスケール制御システム70は、自サイト負荷相関DB72及び話題性/アクセス相関DB74を参照して、上述したシステム40,50,60の分析結果に基づいて、仮想サーバ14の増減の必要性を判断する。そして、オートスケール制御システム70は、判断結果に基づいて、クラウド構成管理システム24に対してスケールアウト又はスケールインの指示を出す。なお、オートスケール制御システム70は、監視システム22から取得した仮想サーバ14の負荷情報に基づいて自サイト負荷相関DB72を適宜更新する。また、オートスケール制御システム70は、他サイト話題性情報DB64と自サイトアクセス数DB44とに基づいて、話題性/アクセス相関DB74を適宜更新する。
ここで、自サイト負荷相関DB72は、図6(a)に示すようなデータを格納している。この自サイト負荷相関DB72は、過去に取得された自サイトへのアクセス数と、自サイトの負荷率(%)との関係を示すデータである。
また、話題性/アクセス相関DB74は、図6(b)に示すようなデータを格納している。この話題性/アクセス相関DB74は、過去に取得された、他サイトにおいて注目キーワードが出現した頻度(回数)と、注目キーワードと類似するキーワードが用いられている自サイトへのアクセス数との関係を示すデータである。
(オートスケール制御部30の処理について)
次に、図7〜図16のフローチャートに沿って、その他図面を適宜参照しつつ、オートスケール制御部30の処理について詳細に説明する。
図7には、オートスケール制御部30による一連の処理が示されている。図7に示すように、本実施形態においては、自サイト負荷相関DB作成処理(S100)と、自サイトキーワードDB作成処理(S200)と、他サイトキーワードDB作成処理(S300)と、メイン処理(S400)とが同時並行的に繰り返される。以下、各処理について、詳細に説明する。
(自サイト負荷相関DB作成処理(S100))
まず、ステップS100の自サイト負荷相関DB作成処理について説明する。本処理は、オートスケール制御システム70が、自サイト負荷相関DB72(図6(a)参照)を作成する処理であり、図8のフローチャートに沿って実行される。
図8の処理では、まず、ステップS102において、オートスケール制御システム70が、クラウド基盤制御部20の監視システム22から仮想サーバ14の負荷情報を収集する。
次いで、ステップS104では、オートスケール制御システム70が、自サイトアクセス数DB44を参照して、自サイトへのアクセス数が所定値(例えば、50アクセス、100アクセス、150アクセス、200アクセス…)であるか否かを判断する。すなわち、オートスケール制御システム70は、いずれかの仮想サーバ14へのアクセス数が所定値であるか否かを判断する。このステップS104の判断が肯定された場合、オートスケール制御システム70は、ステップS106に移行し、自サイト負荷相関DB72を作成(更新)する。例えば、自サイトへのアクセス数が50アクセスであり、そのときの自サイトの負荷率がn%であったとする。この場合、過去に50アクセスのときの負荷率が得られている場合には、過去の負荷率と今回の負荷率の平均値で、50アクセスのときの負荷率を更新してもよいし、今回得られた負荷率で過去に得られた負荷率を書き換えることとしてもよい。また、過去に50アクセスのときの負荷率が得られていない場合には、今回得られた負荷率を50アクセスのときの負荷率とすればよい。ステップS106の処理が終了した後は、図8の全処理が一旦終了するが、図7に示すように、図8の処理は繰り返し実行される。
一方、ステップS104の判断が否定された場合には、ステップS102に戻り、ステップS104の判断が肯定されるまでステップS102、S104の処理及び判断を繰り返す。
以上のように、自サイトへのアクセス数が所定値(50、100、150、200…)になるたびに、自サイト負荷相関DB72を更新することで、自サイト負荷相関DB72を適宜更新することが可能となる。なお、自サイト負荷相関DB72の作成処理は、常時実行しなくてもよく、例えば、所定時間毎や所定日数毎に実行してもよい。
(自サイトキーワードDB作成処理(S200))
次に、ステップS200の自サイトキーワードDB作成処理について説明する。本処理は、キーワード分析システム50が、自サイトキーワードDB52(図4(a)参照)を作成する処理であり、図9のフローチャートに沿って実行される。
図9の処理では、ステップS202において、キーワード分析システム50が、自サイト内のWebコンテンツの更新を監視する。
次いで、ステップS204では、キーワード分析システム50は、自サイト内のWebコンテンツの更新が行われたか否かを判断する。このステップS204の判断が否定された場合には、ステップS202に戻るが、肯定された場合には、ステップS206に移行する。
ステップS206に移行すると、キーワード分析システム50は、対象ページが識別できるように識別情報を生成する。具体的には、自サイトキーワードDB52(図4(a))の「対象ページの識別情報」に示すような、対象ページの識別情報を生成する。なお、識別情報は所定のルールに基づいて作成されるため、同一のページに対しては同一の識別情報が生成されるようになっている。
次いで、ステップS208では、キーワード分析システム50は、更新されたページ内のワードを収集する。次いで、ステップS210では、キーワード分析システム50は、タイトルや主語など、ページ内でメインとなるワードを「主キーワード」として抽出する。また、次のステップS212では、キーワード分析システム50は、主キーワードに関連するワードを「サブキーワード」として抽出する。サブキーワードは、タイトルや主語などの近傍に位置しているワードのうち、主キーワードを説明するワードや、主キーワードが主語であれば、その文の述語や修飾語などである。
次いで、ステップS214では、キーワード分析システム50は、対象ページの識別情報が、自サイトキーワードDB52において既に存在しているか否かを判断する。このステップS214の判断が肯定された場合には、ステップS216に移行し、キーワード分析システム50は、該当の識別情報のテーブルを更新する。例えば、自サイト内の対象ページの主キーワードが更新された場合には、主キーワードを更新する。また、サブキーワードが追加、変更等された場合には、サブキーワードを更新する。
一方、ステップS214の判断が否定された場合には、ステップS218に移行し、キーワード分析システム50は、対象ページの識別情報と、主キーワード、サブキーワードを関連付けて、自サイトキーワードDB52に追加する。
ステップS216、S218の処理が終了すると、図9の全処理が終了するが、その後は、図7に示すように、図9の処理が繰り返し実行される。
(他サイトキーワードDB作成処理(S300))
次に、ステップS300の他サイトキーワードDB作成処理について説明する。本処理は、キーワード分析システム50が、他サイトキーワードDB54(図4(b)参照)を作成する処理であり、図10のフローチャートに沿って実行される。
図10の処理では、まず、ステップS302において、キーワード分析システム50は、インターネット上の他サイトで人気となっているキーワードを収集する。他サイトで人気となっているキーワードとは、他サイトで入力(登録)される頻度の高いワードであり、例えば、検索サービスなどへの入力が多いワードや、SNSサイトにおいて多く書き込まれている(つぶやかれている)ワードなどである。キーワード分析システム50は、検索ワードのランキング上位のものやSNSサイトでトレンドとなっているワードなどを、他サイトで人気となっているキーワードとして収集する。
次いで、ステップS304では、キーワード分析システム50は、収集されたキーワードを主キーワードとして、インターネット上で検索し、主キーワードに関連するワード(付随するワード)を「サブキーワード」として抽出する。
次いで、ステップS306では、キーワード分析システム50は、主キーワードと、サブキーワードを関連付けた、他サイトキーワードDB54を作成する。この場合、時刻情報として、主キーワードが収集された時刻を格納し、主キーワードとサブキーワードとを関連付けて他サイトキーワードDB54に格納する。なお、既に他サイトキーワードDB54に格納されている主キーワードと同一の主キーワードが抽出された場合には、キーワード分析システム50は、既存の情報のうち、時刻情報とサブキーワードのみを更新すればよい。
次いで、ステップS308では、キーワード分析システム50は、他サイトキーワードDB54の時刻情報が、特定期間(例えば1日)より過去である情報があるか否かを判断する。このステップS308の判断が肯定された場合には、ステップS310に移行し、キーワード分析システム50は、該当する情報を削除する。このようにすることで、他サイトキーワードDB54に格納されている古い情報を適切なタイミングで削除することができる。その後は、図10の全処理を終了する。一方、ステップS308の判断が否定された場合には、ステップS310を経ずに、図10の全処理を終了する。
なお、図10の処理は、図7に示すように繰り返し実行される。
(メイン処理(S400))
次に、ステップS400のメイン処理について説明する。本処理は、ログシステム40、話題性分析システム60、及びオートスケール制御システム70が実行する処理であり、図11のフローチャートに沿った処理が実行される。
図11の処理では、まずステップS410において、ログシステム40が、自サイトアクセス数DB作成処理を実行する。具体的には、ログシステム40は、図12のフローチャートに沿った処理を実行する。
(自サイトアクセス数DB作成処理(S410))
図12の処理では、ステップS412において、ログシステム40が、サービス提供部10のロードバランサ12、仮想サーバ14からアクセスログを取得し、ログ情報42に蓄積する。
次いで、ステップS414では、ログシステム40は、単位時間(例えば、1分)あたりの各ページへのアクセス数をアクセスログからカウントする。次いで、ステップS416では、ログシステム40は、ページの情報と、収集したカウント値(アクセス数)を関連付けて、自サイトアクセス数DB44に格納する。
以上のように、図12の処理が終了すると、図11のステップS420に移行する。
図11のステップS420に移行すると、話題性分析システム60は、自サイトアクセス数DB44を参照し、自サイトへのアクセス数の状況を監視する。次いで、ステップS430では、話題性分析システム60は、アクセス数が予め定められている数以上上昇しているか否かを判断する。このステップS430の判断が否定された場合には、ステップS410に戻る。一方、ステップS430の判断が肯定された場合、すなわち自サイトへのアクセス集中が生じ始めている場合には、ステップS440に移行する。
ステップS440に移行すると、話題性分析システム60は、注目キーワードDB作成処理を実行する。具体的には、話題性分析システム60は、図13のフローチャートに沿った処理を実行する。
(注目キーワードDB作成処理(S440))
図13の処理では、ステップS442において、話題性分析システム60は、自サイトキーワードDB52と他サイトキーワードDB54の、主キーワード、サブキーワードの類似度を算出する。この場合、話題性分析システム60は、一例として、主キーワードに含まれる文字の一致度と、サブキーワードに含まれる文字の一致度とを求め、これらに基づいて類似率を算出することができる。
次いで、ステップS444では、話題性分析システム60が、類似度が所定の閾値(例えば80%)以上となったキーワードの情報を注目キーワードDB62に蓄積する。この場合、注目キーワードDB62には、類似度と、他サイトに存在する主キーワード(他キーワード)と、他キーワードに類似する自サイトに存在する主キーワード(自キーワード)と、が蓄積されることになる。
以上のようにして、図13の処理が終了すると、図11のステップS450に移行する。なお、図13の処理は、自サイトへのアクセス数が上昇したときに行われるので(S430:肯定)、自サイトへのアクセス集中が予想されるタイミングにおける注目キーワードを注目キーワードDB62に格納することができる。
図11のステップS450に移行すると、話題性分析システム60は、他サイト話題性情報DB作成処理を実行する。具体的には、話題性分析システム60は、図14のフローチャートに沿った処理を実行する。
(他サイト話題性情報DB作成処理(S450))
図14の処理の前提として、インターネット上の他サイト(SNSやブログサイト)のうち、話題性分析システム60が監視対象とするサイトは、監視サイト一覧に登録されているものとする。
図14の処理では、ステップS452において、話題性分析システム60が、監視サイト一覧に登録されているサイトから注目キーワードDB62に蓄積されている他キーワード(注目キーワード)を検索する。なお、監視対象がSNSである場合には、SNSの検索機能を利用し、ブログサイトである場合には、ブログのポータルサイトの検索機能を利用することができる。また、監視対象が検索サイトであれば、検索サイトにおいて検索需要のあるキーワードを取得するようにすればよい。
次いで、ステップS454では、話題性分析システム60が、検索した他キーワードの単位時間あたりの出現頻度をカウントする。
次いで、ステップS456では、話題性分析システム60は、他キーワード毎の出現頻度カウント値を、他キーワードに類似する自キーワードの出現頻度カウント値として集計し、他サイト話題性情報DB64に格納する。なお、図14の処理では、他キーワードの出現頻度を、単位時間ごとに所定回数カウントしているため、カウント値の時系列データが他サイト話題性情報DB64に格納されることになる。
以上のようにして、図14の処理が終了すると、図11のステップS460に移行する。
図11のステップS460に移行すると、オートスケール制御システム70は、話題性/アクセス相関DB作成処理を実行する。具体的には、オートスケール制御システム70は、図15のフローチャートの処理を実行する。
(話題性/アクセス相関DB作成処理(S460))
図15の処理では、ステップS462において、オートスケール制御システム70が、他サイト話題性情報DB64の出現頻度カウント値と、自サイトアクセス数DBのアクセス数とから話題性/アクセス相関DB74を作成(更新)する。
具体的には、オートスケール制御システム70は、他サイト話題性情報DB64のキーワード(例えば「○○ゲーム」)の出現頻度カウント値nと、キーワードに対応する対象の仮想サーバ識別子(例えば「vm001」)を抽出する。そして、オートスケール制御システム70は、自サイトアクセス数DB44において、抽出した仮想サーバ識別子(例えば「vm001」)のアクセス数の合計値mを抽出し、値nと値mを用いて話題性/アクセス相関DB74を更新する。これにより、Webサイトに存在するあるキーワードに類似するキーワードが他サイトで話題になったとき(トレンドになったとき)に、あるキーワードが存在する自サイトへのアクセス数がどの程度増えるかを表す図6(b)のデータベースを更新することができる。
以上のようにして、図15の処理が終了すると、図11のステップS470に移行する。
図11のステップS470に移行すると、オートスケール制御システム70は、スケールアウト/インの実施処理を実行する。具体的には、オートスケール制御システム70は、図16のフローチャートに沿った処理を実行する。
(スケールアウト/インの実施処理(S470))
ステップS472では、オートスケール制御システム70は、他サイト話題性情報DB64のカウンタデータの単位時間毎の差分(増加量、時間的変化)の回帰分析から近未来(所定時間後)の予測カウンタ数を算出する。この場合、図17に示すようなグラフに基づいて、統計的に予測カウンタ数を算出する。例えば、図17において●(黒丸)で示すように、単位時間ごとにカウンタデータが増加しているとする。この場合、次に単位時間が経過するタイミングでは、図17のグラフから、□(白抜き四角)で示すだけのカウンタデータの増加が見込まれる。したがって、オートスケール制御システム70は、□で示す増加分を現在のカウント値に加算した値を予測カウンタ数とすることができる。
次いで、ステップS474では、オートスケール制御システム70は、予測カウンタ数と、話題性/アクセス相関DB74(図6(b))及び自サイト負荷相関DB72(図6(a))から予想負荷率(%)を求める。この場合、オートスケール制御システム70は、予測カウンタ数と、話題性/アクセス相関DB74(図6(b))とを用いて、自サイトへのアクセス数を予測する。そして、オートスケール制御システム70は、予測した自サイトへのアクセス数と、自サイト負荷相関DB72(図6(a))とを用いて、自サイトの負荷率(%)を予測する。
なお、ステップS472、S474では、自キーワードと類似するキーワード(注目キーワード)の他サイトでの出現頻度の変化に基づいて、自サイトへのアクセス数や自サイトの負荷率を予測している。このように、本実施形態では、自サイトに対するアクセス数との相関が高い注目キーワードの出現頻度の変化を利用した予測を行うことで、自サイトへのアクセス数や自サイトの負荷率を適切に予測することが可能となっている。
次いで、ステップS476では、オートスケール制御システム70は、予想負荷率が閾値(例えば80%)を超えているか否かを判断する。このステップS476の判断が肯定された場合、すなわち、近未来において、仮想サーバ14のCPUやメモリが過負荷になり、リソースが不足するおそれがある場合には、ステップS478に移行する。
ステップS478に移行した場合、オートスケール制御システム70は、クラウド基盤制御部20へスケールアウト指示を行う。この場合、クラウド基盤制御部20は、過負荷になるおそれのある仮想サーバ14を複製する(スケールアウトする)。
一方、ステップS476の判断が否定された場合には、ステップS480に移行する。ステップS480では、オートスケール制御システム70は、監視システム22から送られた仮想サーバの負荷情報が一定時間(例えば30分)の間、閾値(例えば60%)以下であるか否かを判断する。すなわち、一定時間の間、リソースが所定以上過多であるか否かを判断する。このステップS480の判断が否定された場合には、ステップS472に戻るが、肯定された場合には、ステップS482に移行する。
ステップS482に移行した場合、オートスケール制御システム70は、クラウド基盤制御部20へスケールイン指示を行う。この場合、クラウド基盤制御部20は、複製されたが、利用されていない仮想サーバ14を削減する(スケールアウトする)。
以上のように、図16の処理が行われた後は、図11の全処理も終了する。なお、図7に示すように、図11の処理が終了した後も、図11の処理は繰り返し実行される。なお、図11の処理を繰り返す場合、図5(a)の注目キーワードDB62と、他サイト話題性情報DB64は、リセットされるものとする。
以上、詳細に説明したように、本実施形態によると、話題性分析システム60は、他サイト(SNSやブログサイト)から、自サイトで提供されるサービスに関連するキーワード(自キーワードに類似する他キーワード)の出現頻度カウント値を取得し(S450、図14)、オートスケール制御システム70が、他サイト話題性情報DB64の出現頻度カウント値が示す、他キーワードの出現数の時間的変化に応じて、Webサイトを運用する仮想サーバ14をスケールアウトさせる(Webサイトに割り当てるリソースを増加させる)制御を実行する(S478)。この場合、例えば、Webサイトへのアクセス集中が起こり、仮想サーバ14が過負荷になるおそれがある場合に、過負荷になる前の段階で、仮想サーバ14をスケールアウトすることができる。このように、本実施形態によれば、いつどのような話題がトレンドになるかが分からない状況でも、他サイトの話題性の変化に応じて、適切なタイミングでスケールアウトを行うことができる。これにより、Webサイトの利用者がアクセスできなくなる事態が発生するのを極力抑制することができるので、Webサイトの管理者のビジネス機会の損失を減らすことができる。また、クラウドサービスが従量課金制であっても、リソースを適切に割り当てることができるので、Webサイトの管理者のコストを適切に抑えることができる。
また、本実施形態では、自サイトで抽出されるキーワード(主キーワードとこれに関連するサブキーワード)、及び他サイトで人気となっているキーワード(主キーワードとこれに関連するサブキーワード)を抽出し、自サイトで抽出されたキーワードに類似する(類似度が閾値以上)他サイトで人気となっているキーワードの出現頻度をカウントする(S440,S450)。このように、自サイトへのアクセス数との相関が高い注目キーワードを特定し、該注目キーワードの出現頻度の変化を利用して自サイトへのアクセス数や自サイトの負荷率を予測することで、適切な予測が可能となっている。
また、本実施形態では、オートスケール制御システム70は、図17のグラフを用いて近未来において注目キーワードが出現する回数を予測する(S472)。また、オートスケール制御システム70は、図6(b)の話題性/アクセス相関DB74に基づいて、自サイトへのアクセス数を予測し、更に、図6(a)の自サイト負荷相関DB72に基づいて、自サイト負荷率(%)を予測する(S474)。そして、オートスケール制御システム70は、予測した自サイト負荷率に基づいて、クラウド構成管理システム24に対してスケールアウトの指示を出す(S478)。このように、図17のグラフや、図6(b)、図6(a)のデータベースを用いることで、簡易に自サイト負荷率を予測することが可能である。
また、本実施形態では、オートスケール制御システム70は、仮想サーバの負荷情報が一定時間の間、閾値(例えば60%)以下の場合に、クラウド構成管理システム24に対してスケールインの指示を出す(S482)。これにより、オートスケール制御システム70は、過去にスケールアウトしたが当分の間利用されない可能性が高い仮想サーバを、適切なタイミングで、スケールインすることができる。
なお、上記実施形態では、図6(a)の自サイト負荷相関DB72や、図6(b)の話題性/アクセス相関DB74をオートスケール制御システム70が作成又は適宜更新する場合について説明した。しかしながら、これに限らず、両DBは、事前に作成しておいてもよい。この場合、例えば、複数のクラウドサーバにおける平均的な値に基づいて、両DBを作成しておけばよい。
なお、上記実施形態では、注目キーワードと自キーワードとの類似度(図6(a)参照)を考慮して、自サイトへのアクセス数を予測することとしてもよい。この場合、例えば、図6(b)の話題性/アクセス相関DB74に基づいて予測される自サイトへのアクセス数に対して類似度に基づく補正を行うなどすればよい。
なお、上記実施形態では、オートスケール制御部30がクラウドサーバ100内に設けられている場合について説明したが、これに限られるものではない。例えば、クラウドサーバ100とネットワーク等で接続されている情報処理装置がオートスケール制御部30を有していてもよい。この場合、情報処理装置は、複数のクラウドサーバ100のオートスケール制御を行うこととしてもよい。
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、処理装置が有すべき機能の処理内容を記述したブログラムが提供される。そのブログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したブログラムは、コンピュータで読み取り可能な記録媒体(ただし、搬送波は除く)に記録しておくことができる。
ブログラムを流通させる場合には、例えば、そのブログラムが記録されたDVD(Digital Versatile Disc)、CD−ROM(Compact Disc Read Only Memory)などの可搬型記録媒体の形態で販売される。また、ブログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのブログラムを転送することもできる。
ブログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたブログラムもしくはサーバコンピュータから転送されたブログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からブログラムを読み取り、ブログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接ブログラムを読み取り、そのブログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからブログラムが転送されるごとに、逐次、受け取ったブログラムに従った処理を実行することもできる。
上述した実施形態は本発明の好適な実施の例である。但し、これに限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変形実施可能である。
なお、以上の実施形態の説明に関して、更に以下の付記を開示する。
(付記1) コンピュータに、
登録されたデータの参照を許容する制御を行う情報処理装置に対して、前記情報処理装置への特定の情報処理装置により提供されるサービスに関連するキーワードの登録状況を問い合わせ、
問い合わせた前記登録状況が示す、前記キーワードの登録数の時間的変化に応じて、前記特定の情報処理装置に割り当てるリソースの増加又は減少の制御を行う、
処理を実行させるリソース制御ブログラム。
(付記2) 前記特定の情報処理装置により提供されるサービスに関連するキーワードは、前記特定の情報処理装置により提供されるサービスのキーワードとの類似度が予め定められている閾値以上のキーワードであることを特徴とする付記1に記載のリソース制御ブログラム。
(付記3) 前記制御を行う処理において、
前記キーワードの登録数の時間的変化に基づいて、前記特定の情報処理装置により提供されるサービスへのアクセス数の時間的変化を予測し、
予測した前記アクセス数の時間的変化に基づいて、前記リソースの過不足を予測し、
予測した前記リソースの過不足に基づいて、前記リソースの増加又は減少の制御を行う、ことを特徴とする付記1又は2に記載のリソース制御ブログラム。
(付記4) 前記リソースの過不足を予測する処理において、前記リソースが不足することを予測した場合に、
前記制御を行う処理において、前記リソースを増加させる制御を行う、ことを特徴とする付記3に記載のリソース制御ブログラム。
(付記5) 前記制御を行う処理において、所定時間の間、前記リソースが所定以上過多である場合に、前記リソースを減少させる制御を行う、ことを特徴とする付記1〜4のいずれかに記載のリソース制御ブログラム。
(付記6) 前記類似度は、前記特定の情報処理装置により提供されるサービスのキーワード及び該キーワードに関連するワードと、前記特定の情報処理装置により提供されるサービスに関連するキーワード及び該キーワードに関連するワードと、の一致度合に基づく値である、ことを特徴とする付記2に記載のリソース制御ブログラム。
(付記7) コンピュータが、
登録されたデータの参照を許容する制御を行う情報処理装置に対して、前記情報処理装置への特定の情報処理装置により提供されるサービスに関連するキーワードの登録状況を問い合わせ、
問い合わせた前記登録状況が示す、前記キーワードの登録数の時間的変化に応じて、前記特定の情報処理装置に割り当てるリソースの増加又は減少の制御を行う、
ことを特徴とするリソース制御方法。
(付記8) 登録されたデータの参照を許容する制御を行う情報処理装置に対して、前記情報処理装置への特定の情報処理装置により提供されるサービスに関連するキーワードの登録状況を問い合わせる問い合わせ部と、
問い合わせた前記登録状況が示す、前記キーワードの登録数の時間的変化に応じて、前記特定の情報処理装置に割り当てるリソースの増加又は減少の制御を行う制御部と、
を備えるリソース制御装置。
(付記9) 前記特定の情報処理装置により提供されるサービスに関連するキーワードは、前記特定の情報処理装置により提供されるサービスのキーワードとの類似度が予め定められている閾値以上のキーワードであることを特徴とする付記8に記載のリソース制御装置。
(付記10) 前記制御部は、
前記キーワードの登録数の時間的変化に基づいて、前記特定の情報処理装置により提供されるサービスへのアクセス数の時間的変化を予測し、
予測した前記アクセス数の時間的変化に基づいて、前記リソースの過不足を予測し、
予測した前記リソースの過不足に基づいて、前記リソースの増加又は減少の制御を行う、ことを特徴とする付記8又は9に記載のリソース制御装置。
(付記11) 前記制御部は、前記リソースが不足することを予測した場合に、前記リソースを増加させる制御を行う、ことを特徴とする付記10に記載のリソース制御装置。
(付記12) 前記制御部は、所定時間の間、前記リソースが所定以上過多である場合に、前記リソースを減少させる制御を行う、ことを特徴とする付記8〜11のいずれかに記載のリソース制御装置。
(付記13) 前記類似度は、前記特定の情報処理装置により提供されるサービスのキーワード及び該キーワードに関連するワードと、前記特定の情報処理装置により提供されるサービスに関連するキーワード及び該キーワードに関連するワードと、の一致度合に基づく値である、ことを特徴とする付記9に記載のリソース制御装置。
60 話題性分析システム(問い合わせ部)
70 オートスケール制御システム(制御部)
100 クラウドサーバ(リソース制御装置)

Claims (8)

  1. コンピュータに、
    登録されたデータの参照を許容する制御を行う情報処理装置に対して、前記情報処理装置への特定の情報処理装置により提供されるサービスに関連するキーワードの登録状況を問い合わせ、
    問い合わせた前記登録状況が示す、前記キーワードの登録数の時間的変化に応じて、前記特定の情報処理装置に割り当てるリソースの増加又は減少の制御を行う、
    処理を実行させるリソース制御ブログラム。
  2. 前記特定の情報処理装置により提供されるサービスに関連するキーワードは、前記特定の情報処理装置により提供されるサービスのキーワードとの類似度が予め定められている閾値以上のキーワードであることを特徴とする請求項1に記載のリソース制御ブログラム。
  3. 前記制御を行う処理において、
    前記キーワードの登録数の時間的変化に基づいて、前記特定の情報処理装置により提供されるサービスへのアクセス数の時間的変化を予測し、
    予測した前記アクセス数の時間的変化に基づいて、前記リソースの過不足を予測し、
    予測した前記リソースの過不足に基づいて、前記リソースの増加又は減少の制御を行う、ことを特徴とする請求項1又は2に記載のリソース制御ブログラム。
  4. 前記リソースの過不足を予測する処理において、前記リソースが不足することを予測した場合に、
    前記制御を行う処理において、前記リソースを増加させる制御を行う、ことを特徴とする請求項3に記載のリソース制御ブログラム。
  5. 前記制御を行う処理において、所定時間の間、前記リソースが所定以上過多である場合に、前記リソースを減少させる制御を行う、ことを特徴とする請求項1〜4のいずれか一項に記載のリソース制御ブログラム。
  6. 前記類似度は、前記特定の情報処理装置により提供されるサービスのキーワード及び該キーワードに関連するワードと、前記特定の情報処理装置により提供されるサービスに関連するキーワード及び該キーワードに関連するワードと、の一致度合に基づく値である、ことを特徴とする請求項2に記載のリソース制御ブログラム。
  7. コンピュータが、
    登録されたデータの参照を許容する制御を行う情報処理装置に対して、前記情報処理装置への特定の情報処理装置により提供されるサービスに関連するキーワードの登録状況を問い合わせ、
    問い合わせた前記登録状況が示す、前記キーワードの登録数の時間的変化に応じて、前記特定の情報処理装置に割り当てるリソースの増加又は減少の制御を行う、
    ことを特徴とするリソース制御方法。
  8. 登録されたデータの参照を許容する制御を行う情報処理装置に対して、前記情報処理装置への特定の情報処理装置により提供されるサービスに関連するキーワードの登録状況を問い合わせる問い合わせ部と、
    問い合わせた前記登録状況が示す、前記キーワードの登録数の時間的変化に応じて、前記特定の情報処理装置に割り当てるリソースの増加又は減少の制御を行う制御部と、
    を備えるリソース制御装置。
JP2016156873A 2016-08-09 2016-08-09 リソース制御ブログラム、リソース制御方法及びリソース制御装置 Pending JP2018025944A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016156873A JP2018025944A (ja) 2016-08-09 2016-08-09 リソース制御ブログラム、リソース制御方法及びリソース制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016156873A JP2018025944A (ja) 2016-08-09 2016-08-09 リソース制御ブログラム、リソース制御方法及びリソース制御装置

Publications (1)

Publication Number Publication Date
JP2018025944A true JP2018025944A (ja) 2018-02-15

Family

ID=61194077

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016156873A Pending JP2018025944A (ja) 2016-08-09 2016-08-09 リソース制御ブログラム、リソース制御方法及びリソース制御装置

Country Status (1)

Country Link
JP (1) JP2018025944A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020024482A (ja) * 2018-08-06 2020-02-13 京セラドキュメントソリューションズ株式会社 処理実行システムおよび処理実行プログラム
JP2020071558A (ja) * 2018-10-30 2020-05-07 株式会社日立製作所 リソース管理支援装置およびリソース管理支援方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020024482A (ja) * 2018-08-06 2020-02-13 京セラドキュメントソリューションズ株式会社 処理実行システムおよび処理実行プログラム
JP2020071558A (ja) * 2018-10-30 2020-05-07 株式会社日立製作所 リソース管理支援装置およびリソース管理支援方法
JP7041607B2 (ja) 2018-10-30 2022-03-24 株式会社日立製作所 リソース管理支援装置およびリソース管理支援方法

Similar Documents

Publication Publication Date Title
US9367257B2 (en) Techniques for resource location and migration across data centers
US8112546B2 (en) Routing users to receive online services based on online behavior
JP6030144B2 (ja) 分散データストリーム処理の方法及びシステム
US9317223B2 (en) Method and apparatus for automated migration of data among storage centers
JP6262939B2 (ja) ネットワークスイッチを用いたキャッシュシステム及びキャッシュサービスの提供方法
JP5203733B2 (ja) コーディネータサーバ、データ割当方法及びプログラム
TWI557571B (zh) 用於藉由使用者歷史紀錄將網頁爬行最佳化的方法、電腦可儲存媒體及伺服器
US10171620B2 (en) Non-transitory computer-readable recording medium having stored therein control program, control apparatus and control method
US10970303B1 (en) Selecting resources hosted in different networks to perform queries according to available capacity
US9015414B2 (en) Load balancing based upon data usage
JP2016515228A (ja) 低レイテンシデータアクセス用のデータストリーム分割
CN106357789B (zh) 一种信息访问控制方法、服务器及计算机可读存储介质
JP4839585B2 (ja) 資源情報収集配信方法およびシステム
JP2018025944A (ja) リソース制御ブログラム、リソース制御方法及びリソース制御装置
JP5272428B2 (ja) アクセス頻度の高い情報を事前にキャッシュする予測型キャッシュ方法、そのシステム及びそのプログラム
CN108337100B (zh) 一种云平台监测的方法和装置
US8700954B2 (en) Common trouble case data generating method and non-transitory computer-readable medium storing common trouble case data generating program
KR102054068B1 (ko) 그래프 스트림에 대한 실시간 분산 저장을 위한 분할 방법 및 분할 장치
JP2017182160A (ja) 監視制御プログラム,監視制御装置および監視制御方法
KR100479360B1 (ko) 명령어의 유효성 판단 방법 및 그 시스템
Lee et al. A proactive request distribution (prord) using web log mining in a cluster-based web server
JP6321559B2 (ja) アクセス制御装置、アクセス制御方法及びアクセス制御プログラム
Xia et al. An optimized load balance based on data popularity on HBASE
KR101137150B1 (ko) 명령어의 유효성 판단 방법 및 그 시스템
WO2015193988A1 (ja) 計算機システム