JP2020154934A - 消費電力予測プログラム、消費電力予測方法、および消費電力予測装置 - Google Patents

消費電力予測プログラム、消費電力予測方法、および消費電力予測装置 Download PDF

Info

Publication number
JP2020154934A
JP2020154934A JP2019054266A JP2019054266A JP2020154934A JP 2020154934 A JP2020154934 A JP 2020154934A JP 2019054266 A JP2019054266 A JP 2019054266A JP 2019054266 A JP2019054266 A JP 2019054266A JP 2020154934 A JP2020154934 A JP 2020154934A
Authority
JP
Japan
Prior art keywords
topic
information
power consumption
topic distribution
job
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019054266A
Other languages
English (en)
Other versions
JP7259451B2 (ja
Inventor
成人 鈴木
Shigeto Suzuki
成人 鈴木
美智子 白神
Michiko Shirakami
美智子 白神
崇 白石
Takashi Shiraishi
崇 白石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2019054266A priority Critical patent/JP7259451B2/ja
Priority to US16/805,961 priority patent/US20200301738A1/en
Publication of JP2020154934A publication Critical patent/JP2020154934A/ja
Application granted granted Critical
Publication of JP7259451B2 publication Critical patent/JP7259451B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • G06F9/4893Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues taking into account power or heat criteria
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/28Supervision thereof, e.g. detecting power-supply failure by out of limits supervision
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computing Systems (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】ジョブの消費電力の予測を高速化する。【解決手段】消費電力予測プログラムは、過去に実行されたジョブに関する第1情報におけるトピック毎の単語出現確率を示す第1トピック分布を第1情報毎に生成し、予測対象のジョブに関する第2情報におけるトピック毎の単語出現確率を示す第2トピック分布を生成し、第1トピック分布における単語出現確率を所定のルールに基づいて複数の数値に変換した第1規格化トピック分布を生成し、第2トピック分布における単語出現確率を所定のルールに基づいて複数の数値に変換した第2規格化トピック分布を生成し、複数の第1規格化トピック分布のうち、第2規格化トピック分布に最も類似する第1規格化トピック分布を抽出し、抽出された第1規格化トピック分布に対応する第1情報が示すジョブを実行した際の消費電力に基づいて、予測対象のジョブの消費電力を予測する処理をコンピュータに実行させる。【選択図】図10

Description

本発明は、消費電力予測プログラム、消費電力予測方法、および消費電力予測装置に関する。
近年、High Performance Computer(HPC)の性能が向上したことにより、HPCを利用した際の消費電力が増加し、電気料金が高額になっている。契約電力料金は、例えば、前年のうちに最も電力を使用した所定期間(例えば、30分間)の平均消費電力の最大値に基づいて決定される。その場合、今年度の複数の所定期間のうち一度でも前年の平均消費電力の最大値を超過すれば、次年度の電力料金が増加する。
関連する技術として、入力時点で単位計算量当りの電力料金の低い順に、複数の計算機演算処理と同数のコンピュータを選択し、複数の計算機演算処理に選択したコンピュータに割り当てる技術が提案されている(例えば、特許文献1を参照)。
また、関連する技術として、複数のジョブを実行するように構成されるシステムと、設備の電力消費を管理して、電力消費が電力帯の範囲内にあるようにするコードを格納するメモリを含む設備が提案されている(例えば、特許文献2を参照)。
また、関連する技術として、予定情報と履歴情報とに基づいて所定の時間区分におけるジョブからストレージデバイスへのアクセスを推定し、推定結果に基づいてストレージデバイスへの電源供給を制御する技術が提案されている(例えば、特許文献3を参照)。
また、関連する技術として、ジョブに使用するファイルの文字列の類似度に応じて、1つのジョブの実績消費電力を取得し、取得した実績消費電力に基づいてジョブの消費電力を推定する技術が提案されている(例えば、特許文献4を参照)。
また、関連する技術として、消費電力の予測式に、タスクごとの性能情報の実測値を適用して、タスクごとの消費電力を算出する技術が提案されている(例えば、特許文献5を参照)。
特開2005−250823号公報 特表2018−501580号公報 特開2017−58710号公報 特開2018−84907号公報 特開2015−179383号公報
契約電力料金が、前年のうちに最も電力を使用した所定期間の消費電力に基づいて決定される場合、電力料金を増加させないためにジョブスケジューリングを行うことが考えられる。例えば、過去に実行されたジョブのうち、予測対象のジョブに類似したジョブの消費電力に基づいて、予測対象のジョブの消費電力を予測し、所定期間の平均消費電力が前年の最大値を超えないようにジョブスケジューリングを行うことが考えられる。
しかし、ジョブに関する様々な情報に基づいて、過去に実行されたジョブと予測対象のジョブとの類似度を算出した場合、類似度の算出に時間がかかるため、ジョブの消費電力の予測に時間がかかるという課題がある。
1つの側面として、本発明は、ジョブの消費電力の予測を高速化することを目的とする。
1つの態様では、消費電力予測プログラムは、過去に実行されたジョブに関する第1情報におけるトピック毎の単語出現確率を示す第1トピック分布を前記第1情報毎に生成し、予測対象のジョブに関する第2情報におけるトピック毎の単語出現確率を示す第2トピック分布を生成し、前記第1トピック分布における前記単語出現確率を所定のルールに基づいて複数の数値に変換した第1規格化トピック分布を生成し、前記第2トピック分布における前記単語出現確率を前記所定のルールに基づいて複数の数値に変換した第2規格化トピック分布を生成し、複数の前記第1規格化トピック分布のうち、前記第2規格化トピック分布に最も類似する前記第1規格化トピック分布を抽出し、抽出された前記第1規格化トピック分布に対応する第1情報が示すジョブを実行した際の消費電力に基づいて、前記予測対象のジョブの消費電力を予測する処理をコンピュータに実行させる。
1つの側面によれば、ジョブの消費電力の予測を高速化することができる。
関連技術における消費電力予測方法の概要を示す図である。 本実施形態における消費電力予測方法の概要を示す図である。 関連技術と本実施形態の消費電力予測の処理時間の一例を示す図である。 実施形態のシステムの全体構成の一例を示す図である。 トピックの一例を示す図である。 過去のジョブのトピック分布の規格化の一例を示す図である。 予測対象ジョブのトピック分布の規格化の一例を示す図である。 トピック生成を実行するかの判定方法の概要を示す図である。 作成するトピック数と割り当てられるトピック数の最大値との関係を示す図である。 実施形態の予測処理の一例を示すフローチャートを示す図である。 実施形態のトピック生成処理の一例を示すフローチャートである。 予測装置のハードウェア構成の一例を示す図である。
図1は、関連技術における消費電力予測方法の概要を示す図である。関連技術において消費電力の予測を行う装置(以下、関連技術の予測装置と称する)は、予め生成されたトピックモデルに、過去のジョブに関する情報を入力し、過去のジョブのトピック分布を生成する。トピック分布は、入力された情報内におけるトピック内の単語の出現確率を示す。同様に、関連技術の予測装置は、消費電力を予測する対象のジョブ(予測対象ジョブ)に関する情報をトピックモデルに入力し、予測対象ジョブのトピック分布を生成する。
関連技術の予測装置は、過去のジョブのトピック分布のうち、予測対象ジョブのトピック分布に最も類似するトピック分布を検索する。この際、関連技術の予測装置は、トピック分布内のトピック毎に、cos類似度(コサイン類似度)を計算し、cos類似度の合計をトピック分布の類似度とする。そして、予測対象ジョブのトピック分布に最も類似するトピック分布の生成元である過去のジョブの消費電力データを、予測対象ジョブの消費電力の予測データとして用いる。
例えば、トピックkとトピックk’との間の類似度Skk’は、ベクトル空間法を用いると、式(1)のように計算される。すなわち、類似度Skk’は、トピック毎の語彙vの出現ベクトルn(nk1,...,nkv,...,)の余弦で表される。
Figure 2020154934
しかし、図1に示す例を用いて、予測対象ジョブの消費電力を予測した場合、cos類似度計算の計算量が多いため、予測対象ジョブの消費電力を予測する処理に時間がかかる。
図2は、本実施形態における消費電力予測方法の概要を示す図である。本実施形態において消費電力の予測を行う装置(以下、本実施形態の予測装置と称する)は、予め生成されたトピックモデルに、過去のジョブに関する情報を入力し、過去のジョブに関するトピック分布を生成する。同様に、本実施形態の予測装置は、消費電力を予測する対象のジョブ(予測対象ジョブ)に関する情報をトピックモデルに入力し、予測対象ジョブのトピック分布を生成する。
そして、本実施形態の予測装置は、過去のジョブのトピック分布と予測対象ジョブのトピック分布をそれぞれ、複数の数値(0または1)を用いた分布に規格化する。本実施形態の予測装置は、例えば、トピック分布における単語出現確率が0である場合、単語出現確率を変換せず、トピック分布における単語出現確率が0以外である場合、単語出現確率を1に変換する。すなわち、複数の数値は、例えば2つの数値であるが、3つ以上の数値であってもよい。本実施形態の予測装置は、過去のジョブの規格化トピック分布のうち、予測対象ジョブのトピック分布に最も類似するトピック分布を検索する。この際、本実施形態の予測装置は、cos類似度計算を行わず、各トピックの単語出現確率が一致しているか否かの判定をトピック毎に行い、一致するトピックの数が最も多い過去のジョブの規格化トピック分布を抽出する。そして、本実施形態の予測装置は、抽出された規格化トピック分布の生成元である過去のジョブの消費電力データを、予測対象ジョブの消費電力の予測データとして用いる。
図2に示す方法では、cos類似度計算を行わないため、図1に示す方法と比べて、計算量が少なく、予測対象ジョブの消費電力の予測を高速化することができる。
図3は、関連技術と本実施形態の消費電力予測の処理時間の一例を示す図である。図3では、図1に示す関連技術の消費電力予測方法と、図2に示す本実施形態の消費電力予測方法で消費電力予測を行った場合の処理時間の例を示している。図3に示すように、トピック分布生成、類似ジョブ検索の処理時間は同じであるが、関連技術では、cos類似度計算に多くの時間がかかっている。その結果、本実施形態の予測装置は、関連技術の予測装置よりも、短時間で消費電力の予測を完了している。
図4は、実施形態のシステムの全体構成の一例を示す図である。実施形態のシステムは、情報処理装置3でジョブを実行した際の消費電力を予測する予測装置1と、情報処理装置3を管理する管理装置2と、ジョブを実行する情報処理装置3とを含む。予測装置1は、コンピュータの一例である。予測装置1、管理装置2は、例えば、サーバまたはパーソナルコンピュータ等である。情報処理装置3は、例えば、HPCまたは汎用コンピュータである。予測装置1は、管理装置2とLocal Area Network(LAN)、Wide Area Network(WAN)等の通信ネットワークを介して接続する。管理装置2は、情報処理装置3とLAN、WAN等の通信ネットワークを介して接続する。
予測装置1は、取得部11とトピック生成部12とトピック分布生成部13と規格化部14と抽出部15と予測部16と調整部17と送信部18と記憶部19とを含む。
取得部11は、過去に情報処理装置3で実行されたジョブに関する情報(第1情報)と、そのジョブを実行した際の消費電力を示す情報を、管理装置2から取得し、記憶部19に記憶させる。過去に情報処理装置3で実行されたジョブは、例えば、過去1か月間に実行されたジョブである。消費電力を示す情報は、例えば、実行したジョブ毎の消費電力の時系列データである。以下、過去に情報処理装置3で実行されたジョブを過去のジョブと称することがある。過去のジョブは、複数存在し、第1情報は、過去のジョブ毎に存在する。
また、取得部11は、消費電力を予測する対象のジョブに関する情報(第2情報)を取得し、記憶部19に記憶させる。以下、消費電力を予測する対象のジョブを予測対象ジョブと称する。予測対象ジョブは、例えば、実行予定のジョブである。
第1情報および第2情報は、例えば、ジョブ名、ジョブが属するグループ名、最大実行時間、優先順位、ジョブ投入時刻等を含む。
トピック生成部12は、取得部11が取得した第1情報に含まれる単語から、1または複数のトピックを生成し、そのトピックを用いて、トピック分布の生成に用いられるトピックモデルを生成し、トピックおよびトピックモデルを記憶部19に記憶する。
トピック生成部12は、例えば、複数の第1情報のそれぞれに存在する単語を形態素解析等により抽出し、各第1情報に出現する単語をカウントする。そして、トピック生成部12は、同じ第1情報内に出現する確率が高い単語をグルーピングし、トピックとする。以下の式(2)は、文書d(第1情報)における単語wd,nについてのトピックzd,nのサンプリング式である。すなわち、式(2)の右辺は、トピック内の単語が一つの文書内に出現する確率に比例する値であり、本実施形態では単語出現確率と称する。
Figure 2020154934
式(2)において、pは確率を示し、nは、単語のインデックスであり、kは、トピックのインデックスであり、vは、語彙のインデックスであり、αは、トピック分布のハイパーパラメータであり、βは、単語分布のハイパーパラメータである。また、Vは、全語彙数(文書集合に含まれる単語の種類)であり、\は、集合からの差を示す。また、Nd,kは、文書dにトピックkが割り当てられた回数であり、Nは、文書集合にトピックkが割り当てられた回数であり、Nk,vは、語彙vにトピックkが割り当てられた回数である。トピック生成部12は、各文書および各単語に関して式(2)を計算し、式(2)の右辺に示す値が高くなるようにトピックを生成する。生成するトピック数は、予め所定の数に設定されており、後述する調整部17の処理により定期的に調整される。そして、トピック生成部12は、生成したトピックを用いて、トピック分布の生成に用いられるトピックモデルを生成する。
トピック分布生成部13は、生成されたトピックモデルを用いて、第1情報におけるトピック毎の単語出現確率を示す第1トピック分布を第1情報毎に生成する。また、トピック分布生成部13は、生成されたモデルを用いて、第2情報におけるトピック毎の単語出現確率を示す第2トピック分布を生成する。単語出現確率は、あるトピック内の単語のうち、第1情報内に含まれる単語の割合である。トピック分布生成部13は、生成されたトピック内の少なくとも一つの単語が第1情報に存在する場合、そのトピックの数を第1情報に割り当てる。
規格化部14は、第1トピック分布における単語出現確率を所定のルールに基づいて複数の数値に変換した第1規格化トピック分布を生成する。規格化部14は、例えば、単語出現確率が0である場合、変換を行わず、単語出現確率が0以外である場合、単語出現確率を1に変換する。すなわち、規格化部14は、単語出現確率を0および1という二つの数値に変換する。同様に、規格化部14は、第2トピック分布における単語出現確率を所定のルールに基づいて複数の数値に変換した第2規格化トピック分布を生成する。第1規格化トピック分布の生成に用いるルールと第2規格化トピック分布の生成に用いるルールは、同じであるとする。
抽出部15は、複数の第1規格化トピック分布のうち、第2規格化トピック分布に最も類似する第1規格化トピック分布を抽出する。なお、第2規格化トピック分布に類似する第1規格化トピック分布には、第2規格化トピック分布と同一の第1規格化トピック分布が含まれるとする。複数の第1規格化トピック分布の各トピックの単語出現確率と、第2規格化トピック分布の各トピックの単語出現確率とが一致するかを判定する。そして、抽出部15は、一致するトピックの数が最も多い第1規格化トピック分布を抽出する。
予測部16は、抽出部15が抽出した第1規格化トピック分布に対応する第1情報が示すジョブを実行した際の消費電力の時系列データを記憶部19から取得し、そのデータに基づいて、予測対象ジョブの消費電力を予測する。予測部16は、記憶部19から取得した上記消費電力の時系列データを、そのまま予測対象ジョブの消費電力の予測データに適用してもよい。
トピック生成部12は、定期的に、第1情報に含まれる単語から、1または複数のトピック(第1トピック)および第1トピックを用いたトピックモデルを生成する。また、トピック生成部12は、第1情報に含まれる単語のうち、生成した第1トピックに含まれない単語から、1または複数のトピック(第2トピック)および第2トピックを用いたトピックモデルを生成する。
トピック分布生成部13は、第1情報に第1トピックを用いたトピックモデルを用いてトピック分布を生成し、さらに、第1情報に第2トピックを用いたトピックモデルを用いて、トピック分布を生成する。トピック分布生成部13は、生成された1または複数の第1トピックのうちのいずれかのトピック内の少なくとも一つの単語が第1情報に存在する場合、そのいずれかのトピックを第1情報に割り当てる。同様に、トピック分布生成部13は、生成された1または複数の第2トピックのうちのいずれかのトピック内の少なくとも一つの単語が第1情報に存在する場合、そのいずれかのトピックを第1情報に割り当てる。
調整部17は、第1トピックのうち、第1情報に割り当てられたトピック数の最大値が、第2トピックのうち、第1情報に割り当てられたトピック数の最大値未満である場合、トピックの生成に用いるトピック数を調整する。上述のように、第2トピックは、第1情報に含まれる単語のうち、生成した第1トピックに含まれない単語から生成されたトピックである。よって、第1トピックのうち第1情報に割り当てられたトピック数の最大値が、第2トピックのうち第1情報に割り当てられたトピック数の最大値未満である場合、トピックが適切でないと考えられ、トピックを生成する際のトピック数を調整することが好ましい。
トピック数の調整が行われた後、トピック生成部12は、取得部11が取得した第1情報に含まれる単語から、調整された数のトピックを生成し、そのトピックを用いたトピックモデルを生成し、記憶部19に記憶する。トピック分布生成部13は、記憶部19に記憶された最新のトピックモデルを用いて、トピック分布を生成する。
調整部17は、トピック数を調整する際、第1情報に割り当てられるトピック数が所定数(例えば、3)となるように、トピックの生成に用いるトピック数を調整する。第1情報に割り当てられるトピック数が多くなるほど、抽出部15が第1規格化トピック分布と第2規格化トピック分布を比較した際に、類似するトピック分布を抽出しづらくなるためである。
送信部18は、予測部16が予測した消費電力の予測データを、管理装置2に送信する。記憶部19は、取得部11が取得した、過去に実行されたジョブに関する情報(第1情報)、そのジョブを実行した際の消費電力を示す情報を記憶する。また、記憶部19は、トピック生成部12が生成した、トピックおよびトピックモデルを記憶する。
管理装置2は、スケジュール設定部21と制御部22と取得部23と送信部24と記憶部25とを含む。
スケジュール設定部21は、予測装置1から送信された消費電力の予測データに基づいて、所定期間(例えば、30分)の消費電力平均値が閾値を超えないように、情報処理装置3が実行するジョブのスケジュール設定を行う。閾値は、例えば、前年の所定期間の消費電力平均値の最大値である。例えば、契約電力料金が、所定期間の消費電力平均値の前年の最大値に基づいて決定される場合、スケジュール設定部21が、所定期間の消費電力平均値が前年の最大値を超えないようにすることで、契約電力料金の増加を防ぐことができる。
制御部22は、スケジュール設定部21が設定したスケジュールに基づいて、送信部24を介して情報処理装置3にジョブの実行指示を送信する。取得部23は、情報処理装置3から、実行したジョブに関する情報、ジョブ実行時間およびジョブを実行した際の消費電力を示す情報を取得する。
送信部24は、取得部23により取得された、情報処理装置3が実行したジョブおよびジョブを実行した際の消費電力を示す情報を予測装置1に送信する。記憶部25は、予測装置1から送信された消費電力の予測データ、取得部23により取得された、情報処理装置3が実行したジョブおよびジョブを実行した際の消費電力を示す情報等を記憶する。
情報処理装置3は、管理装置2から受信したジョブの実行指示に従って、ジョブを実行する。また、情報処理装置3は、実行したジョブに関する情報、ジョブ実行時間およびジョブを実行した際の消費電力を示す情報を管理装置2に送信する。
図5は、トピックの一例を示す図である。図5に示すように、トピック1〜トピック10のトピックがトピック生成部12により生成され、記憶部19に記憶されているとする。各トピックには、複数の単語が含まれている。なお、トピック数は10でなくてもよい。また、各トピック内の単語数は、異なっていてもよい。
図6は、過去のジョブのトピック分布の規格化の一例を示す図である。図6に示す例では、生成されたトピック数が10である。図6に示す例では、過去のジョブのトピック分布におけるトピック1の単語出現確率が0.4であり、トピック5の単語出現確率が0.7であり、トピック9の単語出現確率が0.9である。また、トピック1、トピック5、トピック9以外の単語出現確率は、0である。この場合、第1情報に対して割り当てられたトピック数が3(トピック1、トピック5、トピック9)となる。
上述のように、規格化部14は、過去のジョブのトピック分布における単語出現確率を、所定のルールに基づいて複数の数値に変換する。規格化部14は、例えば、単語出現確率が0である場合、変換を行わず、単語出現確率が0以外である場合、単語出現確率を1に変換する。規格化部14は、上記所定のルールに基づいて、トピック1、トピック5、トピック9以外の単語出現確率を変換せず、トピック1、トピック5、トピック9の単語出現確率を全て1に変換する。
図7は、予測対象ジョブのトピック分布の規格化の一例を示す図である。図7に示す例では、図6と同様に、生成されたトピック数が10である。図7に示す例では、予測対象ジョブのトピック分布におけるトピック1の単語出現確率が0.6であり、トピック5の単語出現確率が0.3であり、トピック9の単語出現確率が0.4である。また、トピック1、トピック5、トピック9以外の単語出現確率は、0である。この場合、第1情報に対して割り当てられたトピック数が3(トピック1、トピック5、トピック9)となる。
規格化部14は、過去のジョブのトピック分布と同様に、予測対象ジョブのトピック分布における単語出現確率を、所定のルールに基づいて複数の数値に変換する。規格化部14は、上記所定のルールに基づいて、トピック1、トピック5、トピック9以外の単語出現確率を変換せず、トピック1、トピック5、トピック9の単語出現確率を全て1に変換する。
上述のように、抽出部15は、複数の第1規格化トピック分布の各トピックの単語出現確率と、第2規格化トピック分布の各トピックの単語出現確率とが一致するかを判定する。図6、図7の例を用いた場合、規格化後のトピック分布は同一であり、図6における第1規格化トピック分布が抽出される。規格化後のトピック分布における単語出現確率は、0または1であるため、単語出現確率の比較処理は、図1に示す例のようにcos類似度を算出する場合と比べて短時間で完了する。
図8は、トピック生成を実行するかの判定方法の概要を示す図である。トピック生成部12は、定期的に、過去のジョブに関する情報(第1情報)に含まれる単語から、トピック(第1トピック)および第1トピックを用いたトピックモデル(第1トピックモデル)を生成する。また、トピック生成部12は、第1情報に含まれる単語のうち、生成した第1トピックに含まれない残りの単語から、トピック(第2トピック)および第2トピックを用いたトピックモデル(第2トピックモデル)を生成する。トピック分布生成部13は、第1情報に第1トピックモデルを用いてトピック分布(トピック分布A)を生成し、第1情報に第2トピックモデルを用いて、トピック分布(トピック分布B)を生成する。
調整部17は、トピック分布A、Bを参照し、第1トピックのうち、第1情報に割り当てられるトピック数の最大値と、第2トピックのうち、第1情報に割り当てられるトピック数の最大値を比較する。第1情報に割り当てられるトピック数は、例えば、トピック分布のうち、単語出現確率が0以外のトピックの数である。調整部17は、第1トピックのうち、第1情報に割り当てられるトピック数の最大値が、第2トピックのうち、第1情報に割り当てられるトピック数の最大値未満である場合、トピックの生成に用いるトピック数を調整する。そして、トピック生成部12は、第1情報に含まれる単語から、調整された数のトピックを生成し、そのトピックを用いたトピックモデルを生成し、記憶部19に記憶する。
第1トピックのうち第1情報に割り当てられるトピック数の最大値が、第2トピックのうち第1情報に割り当てられるトピック数の最大値未満である場合、トピックが適切でないと考えられる。よって、予測装置1は、そのような場合に、トピック数を調整し、トピックおよびトピックモデルを再生成することにより、消費電力予測の精度を向上することができる。
図9は、作成するトピック数と割り当てられるトピック数の最大値との関係を示す図である。図9に示すように、生成するトピック数が多いほど、トピック分布を生成した際に、第1情報に割り当てられるトピック数の最大値が増加する。そのため、調整部17は、トピック数を調整する際、生成するトピック数が少ない状態から開始して、徐々に作成するトピック数を増加させて、第1情報に割り当てられるトピック数が所定数(例えば、3)となるように、作成するトピック数を調整する。
第1情報に割り当てられるトピック数が多くなるほど、抽出部15が第1規格化トピック分布と第2規格化トピック分布を比較した際に、類似するトピック分布を抽出しづらくなる。よって、予測装置1は、第1情報に割り当てられるトピック数が所定値となるように、生成するトピック数を調整することで、類似するトピック分布を抽出し易くすることができる。
図10は、実施形態の予測処理の一例を示すフローチャートである。なお、図10に示す処理の前に、トピック生成部12によるトピックおよびトピックモデルの生成が少なくとも1回行われるとする。
取得部11は、消費電力を予測する対象のジョブに関する情報(第2情報)を取得する(ステップS101)。第2情報は、例えば、ユーザの指示に応じて管理装置2から送信される。予測装置1は、第2情報が送信されたことをトリガーとして図10に示す処理を開始してもよい。取得部11は、過去に実行されたジョブに関する情報(第1情報)と、そのジョブを実行した際の消費電力を示す情報を、管理装置2から取得する(ステップS102)。
トピック分布生成部13は、予め生成されたトピックモデルを用いて、第1情報におけるトピック毎の単語出現確率を示す第1トピック分布を第1情報毎に生成する(ステップS103)。トピック分布生成部13は、予め生成されたトピックモデルを用いて、第2情報におけるトピック毎の単語出現確率を示す第2トピック分布を第1情報毎に生成する(ステップS104)。
規格化部14は、第1トピック分布における単語出現確率を所定のルールに基づいて複数の数値に変換した第1規格化トピック分布を生成する(ステップS105)。規格化部14は、第2トピック分布における単語出現確率を所定のルールに基づいて複数の数値に変換した第2規格化トピック分布を生成する(ステップS106)。
抽出部15は、複数の第1規格化トピック分布のうち、第2規格化トピック分布に最も類似する第1規格化トピック分布を抽出する(ステップS107)。予測部16は、抽出部15が抽出した第1規格化トピック分布に対応する第1情報が示すジョブを実行した際の消費電力の時系列データに基づいて、予測対象のジョブの消費電力を予測する(ステップS108)。送信部18は、予測部16が予測した消費電力の予測データを、管理装置2に送信する。
以上のように、予測装置1は、所定のルールで規格化したトピック分布を比較し、予測対象ジョブに類似する過去のジョブを抽出し、抽出した過去のジョブの消費電力に基づいて、予測対象ジョブの消費電力を予測する。比較対象のトピック分布が規格化されているため、予測装置1は、ジョブの消費電力の予測を高速化することができる。
また、管理装置2が、予測装置1から送信された消費電力の予測データに基づいて、所定期間の消費電力平均値が閾値を超えないように、情報処理装置3が実行するジョブのスケジュール設定を行うため、電力料金の増加を防ぐことができる。
図11は、実施形態のトピック生成処理の一例を示すフローチャートである。図11に示す処理は、定期的に実行されるとする。トピック生成部12は、過去のジョブに関する第1情報に含まれる単語から、1または複数のトピック(第1トピック)および第1トピックを用いたトピックモデルを生成する(ステップS201)。ステップS201で生成するトピックは、例えば、50であるとする。トピック生成部12は、第1情報に含まれる単語のうち、生成した第1トピックに含まれない単語から、1または複数のトピック(第2トピック)および第2トピックを用いたトピックモデルを生成する(ステップS202)。
トピック分布生成部13は、第1情報に第1トピックを用いたトピックモデルを用いてトピック分布を生成し、第1情報にトピックを割り当てる(ステップS203)。トピック分布生成部13は、例えば、生成された1または複数の第1トピックのうちのいずれかのトピック内の少なくとも一つの単語が第1情報に存在する場合、そのいずれかのトピックを第1情報に割り当てる。
トピック生成部12は、第1情報に第2トピックを用いたトピックモデルを用いて、トピック分布を生成し、第1情報にトピックを割り当てる(ステップS204)。トピック分布生成部13は、例えば、生成された1または複数の第2トピックのうちのいずれかのトピック内の少なくとも一つの単語が第1情報に存在する場合、そのいずれかのトピックを第1情報に割り当てる。
調整部17は第1トピックのうち、第1情報に割り当てられたトピック数の最大値が、第2トピックのうち、第1情報に割り当てられたトピック数の最大値未満であるか判定する(ステップS205)。ステップS205でYESの場合、トピック生成部12は、過去のジョブに関する第1情報に含まれる単語から、トピックおよびトピックモデルを生成する(ステップS206)。ステップS206におけるトピック数の初期値は、例えば、10であるとする。
トピック分布生成部13は、第1情報にステップS206で生成したトピックおよびトピックモデルを用いて、トピック分布を生成し、第1情報にトピックを割り当てる(ステップS207)。調整部17は、第1情報に割り当てられたトピック数の最大値が所定数(例えば、3)であるか判定する(ステップS208)。ステップS208でNOの場合、調整部17は、ステップS206で生成する際のトピック数の設定値に1を加算して(ステップS209)、ステップS206の処理に戻る。
予測装置1は、ステップS208でYESとなるまで、ステップS206〜S209の処理を繰り返す。ステップS208でYESの場合、トピック生成部12は、生成したトピックおよびトピックモデルを記憶部19に記憶させる(ステップS210)。生成された最新のトピックおよびトピックモデルが、図10におけるステップS103およびS104の処理で用いられる。
予測装置1は、図11に示すトピックの生成処理を定期的に行うことにより、過去のジョブとして新たなジョブが追加されても、適切なトピックおよびトピックモデルを再生成するので、消費電力予測の精度を向上することができる。
次に、予測装置1のハードウェア構成の一例を説明する。図12は、予測装置1のハードウェア構成の一例を示す図である。図12の例に示すように、予測装置1において、バス100に、プロセッサ111とメモリ112と補助記憶装置113と通信インタフェース114と媒体接続部115と入力装置116と出力装置117とが接続される。
プロセッサ111は、メモリ112に展開されたプログラムを実行する。実行されるプログラムには、実施形態における処理を行う消費電力予測プログラムが適用されてもよい。
メモリ112は、例えば、Random Access Memory(RAM)である。補助記憶装置113は、種々の情報を記憶する記憶装置であり、例えばハードディスクドライブや半導体メモリ等が適用されてもよい。補助記憶装置113に実施形態の処理を行う消費電力予測プログラムが記憶されていてもよい。
通信インタフェース114は、Local Area Network(LAN)、Wide Area Network(WAN)等の通信ネットワークに接続され、通信に伴うデータ変換等を行う。
媒体接続部115は、可搬型記録媒体118が接続可能なインタフェースである。可搬型記録媒体118には、光学式ディスク(例えば、Compact Disc(CD)またはDigital Versatile Disc(DVD)等)、半導体メモリ等が適用されてもよい。可搬型記録媒体118に実施形態の処理を行う消費電力予測プログラムが記録されていてもよい。
入力装置116は、例えば、キーボード、ポインティングデバイス等であり、ユーザからの指示及び情報等の入力を受け付ける。出力装置117は、例えば、表示装置、プリンタ、スピーカ等であり、ユーザへの問い合わせ又は指示、及び処理結果等を出力する。
図4に示す記憶部19は、メモリ112、補助記憶装置113または可搬型記録媒体118等により実現されてもよい。図4に示す取得部11、トピック生成部12、トピック分布生成部13、規格化部14、抽出部15、予測部16、調整部17、送信部18は、メモリ112に展開された消費電力予測プログラムをプロセッサ111が実行することにより実現されてもよい。
メモリ112、補助記憶装置113および可搬型記録媒体118は、コンピュータが読み取り可能であって非一時的な有形の記憶媒体であり、信号搬送波のような一時的な媒体ではない。
なお、予測装置1が図12に示す全ての構成要素を含んでいなくてもよく、一部の構成要素が省略されていてもよい。また、一部の構成要素が予測装置1の外部装置に存在し、予測装置1が外部装置に接続して、外部装置内の構成要素を利用してもよい。また、図4に示す管理装置2および情報処理装置3のハードウェア構成は、図12に示す構成と同様であるとする。
本実施形態は、以上に述べた実施の形態に限定されるものではなく、本実施形態の要旨を逸脱しない範囲内で様々な変更、追加、省略が適用可能である。
1 予測装置
2 管理装置
3 情報処理装置
11 取得部
12 トピック生成部
13 トピック分布生成部
14 規格化部
15 抽出部
16 予測部
17 調整部
18 送信部
19 記憶部
21 スケジュール設定部
22 制御部
23 取得部
24 送信部
25 記憶部
100 バス
111 プロセッサ
112 メモリ
113 補助記憶装置
114 通信インタフェース
115 媒体接続部
116 入力装置
117 出力装置
118 可搬型記録媒体

Claims (5)

  1. 過去に実行されたジョブに関する第1情報におけるトピック毎の単語出現確率を示す第1トピック分布を前記第1情報毎に生成し、
    予測対象のジョブに関する第2情報におけるトピック毎の単語出現確率を示す第2トピック分布を生成し、
    前記第1トピック分布における前記単語出現確率を所定のルールに基づいて複数の数値に変換した第1規格化トピック分布を生成し、
    前記第2トピック分布における前記単語出現確率を前記所定のルールに基づいて複数の数値に変換した第2規格化トピック分布を生成し、
    複数の前記第1規格化トピック分布のうち、前記第2規格化トピック分布に最も類似する前記第1規格化トピック分布を抽出し、
    抽出された前記第1規格化トピック分布に対応する第1情報が示すジョブを実行した際の消費電力に基づいて、前記予測対象のジョブの消費電力を予測する
    処理をコンピュータに実行させるための消費電力予測プログラム。
  2. 前記第1情報に含まれる単語から、1または複数の第1トピックを生成し、前記単語のうち、前記第1トピックに含まれない単語から、1または複数の第2トピックを生成し、
    前記1または複数の第1トピックのうちのいずれかのトピック内の少なくとも一つの単語が第1情報に存在する場合、前記第1トピックのうちのいずれかのトピックを第1情報に割り当て、前記1または複数の第2トピックのうちのいずれかのトピック内の少なくとも一つの単語が第1情報に存在する場合、前記第2トピックのうちのいずれかのトピックを第1情報に割り当て、
    前記第1トピックのうち、前記第1情報に割り当てられたトピック数が、前記第2トピックのうち、前記第1情報に割り当てられたトピック数未満である場合、トピックの生成に用いるトピック数を調整し、調整された前記トピック数のトピックを生成し、生成したトピックを用いて、前記第1トピック分布および前記第2トピック分布の生成に用いるトピックモデルを生成する
    処理を前記コンピュータに実行させることを特徴とする請求項1記載の消費電力予測プログラム。
  3. 前記第1情報に割り当てられるトピック数が所定数となるように、前記トピックの生成に用いるトピック数を調整する
    処理を前記コンピュータに実行させることを特徴とする請求項2記載の消費電力予測プログラム。
  4. コンピュータが、
    過去に実行されたジョブに関する第1情報におけるトピック毎の単語出現確率を示す第1トピック分布を前記第1情報毎に生成し、
    予測対象のジョブに関する第2情報におけるトピック毎の単語出現確率を示す第2トピック分布を生成し、
    前記第1トピック分布における前記単語出現確率を所定のルールに基づいて複数の数値に変換した第1規格化トピック分布を生成し、
    前記第2トピック分布における前記単語出現確率を前記所定のルールに基づいて複数の数値に変換した第2規格化トピック分布を生成し、
    複数の前記第1規格化トピック分布のうち、前記第2規格化トピック分布に最も類似する前記第1規格化トピック分布を抽出し、
    抽出された前記第1規格化トピック分布に対応する第1情報が示すジョブを実行した際の消費電力に基づいて、前記予測対象のジョブの消費電力を予測する
    処理を実行することを特徴とする消費電力予測方法。
  5. 過去に実行されたジョブに関する第1情報におけるトピック毎の単語出現確率を示す第1トピック分布を前記第1情報毎に生成し、予測対象のジョブに関する第2情報におけるトピック毎の単語出現確率を示す第2トピック分布を生成するトピック分布生成部と、
    前記第1トピック分布における前記単語出現確率を所定のルールに基づいて複数の数値に変換した第1規格化トピック分布を生成し、前記第2トピック分布における前記単語出現確率を前記所定のルールに基づいて複数の数値に変換した第2規格化トピック分布を生成する規格化部と、
    複数の前記第1規格化トピック分布のうち、前記第2規格化トピック分布に最も類似する前記第1規格化トピック分布を抽出する抽出部と、
    抽出された前記第1規格化トピック分布に対応する第1情報が示すジョブを実行した際の消費電力に基づいて、前記予測対象のジョブの消費電力を予測する予測部と
    を備えることを特徴とする消費電力予測装置。
JP2019054266A 2019-03-22 2019-03-22 消費電力予測プログラム、消費電力予測方法、および消費電力予測装置 Active JP7259451B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019054266A JP7259451B2 (ja) 2019-03-22 2019-03-22 消費電力予測プログラム、消費電力予測方法、および消費電力予測装置
US16/805,961 US20200301738A1 (en) 2019-03-22 2020-03-02 Power consumption prediction method, power consumption prediction apparatus, and non-transitory computer-readable storage medium for storing power consumption prediction program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019054266A JP7259451B2 (ja) 2019-03-22 2019-03-22 消費電力予測プログラム、消費電力予測方法、および消費電力予測装置

Publications (2)

Publication Number Publication Date
JP2020154934A true JP2020154934A (ja) 2020-09-24
JP7259451B2 JP7259451B2 (ja) 2023-04-18

Family

ID=72514323

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019054266A Active JP7259451B2 (ja) 2019-03-22 2019-03-22 消費電力予測プログラム、消費電力予測方法、および消費電力予測装置

Country Status (2)

Country Link
US (1) US20200301738A1 (ja)
JP (1) JP7259451B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102350667B1 (ko) * 2021-04-08 2022-01-12 주식회사 신의테크 송전 전력 계통 기반의 전력 계통 관제 시스템

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3979021A1 (en) * 2020-09-30 2022-04-06 Ricoh Company, Ltd. Scheduling system, scheduling method, and carrier means

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017016405A (ja) * 2015-07-01 2017-01-19 富士通株式会社 業務分析プログラム、装置および方法
JP2017102600A (ja) * 2015-11-30 2017-06-08 日本電信電話株式会社 ベクトル量子化器生成方法、ベクトル量子化方法、装置、及びプログラム
JP2018084907A (ja) * 2016-11-22 2018-05-31 富士通株式会社 ジョブ消費電力推定プログラム、並列処理装置およびジョブ消費電力推定方法
JP2019003472A (ja) * 2017-06-16 2019-01-10 株式会社プリマジェスト 情報処理装置及び情報処理方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017016405A (ja) * 2015-07-01 2017-01-19 富士通株式会社 業務分析プログラム、装置および方法
JP2017102600A (ja) * 2015-11-30 2017-06-08 日本電信電話株式会社 ベクトル量子化器生成方法、ベクトル量子化方法、装置、及びプログラム
JP2018084907A (ja) * 2016-11-22 2018-05-31 富士通株式会社 ジョブ消費電力推定プログラム、並列処理装置およびジョブ消費電力推定方法
JP2019003472A (ja) * 2017-06-16 2019-01-10 株式会社プリマジェスト 情報処理装置及び情報処理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102350667B1 (ko) * 2021-04-08 2022-01-12 주식회사 신의테크 송전 전력 계통 기반의 전력 계통 관제 시스템

Also Published As

Publication number Publication date
JP7259451B2 (ja) 2023-04-18
US20200301738A1 (en) 2020-09-24

Similar Documents

Publication Publication Date Title
CN110287477B (zh) 实体情感分析方法及相关装置
US7774197B1 (en) Modular approach to building large language models
KR102323046B1 (ko) 음성 감정 검출 방법 및 장치, 컴퓨터 장치 및 저장 매체
CN107729322B (zh) 分词方法及装置、建立句子向量生成模型方法及装置
CN109753356A (zh) 一种容器资源调度方法、装置及计算机可读存储介质
US20030004902A1 (en) Outlier determination rule generation device and outlier detection device, and outlier determination rule generation method and outlier detection method thereof
CN108304890B (zh) 一种分类模型的生成方法及装置
CN111258767A (zh) 复杂系统仿真应用的云计算资源智能分配方法与装置
JP7259451B2 (ja) 消費電力予測プログラム、消費電力予測方法、および消費電力予測装置
JP2008305402A (ja) 代表的なトレースを得るための命令を識別する方法、コンピュータ・プログラム及びシステム
KR102688236B1 (ko) 인공 지능을 이용한 음성 합성 장치, 음성 합성 장치의 동작 방법 및 컴퓨터로 판독 가능한 기록 매체
CN114627863A (zh) 一种基于人工智能的语音识别方法和装置
JP6873805B2 (ja) 対話支援システム、対話支援方法、及び対話支援プログラム
CN108802282A (zh) 有害气体浓度预测的方法、装置、设备及可读存储介质
CN112687266A (zh) 语音识别方法、装置、计算机设备和存储介质
CN113362804A (zh) 一种合成语音的方法、装置、终端及存储介质
CN116307236A (zh) 故障预测方法、装置、设备及存储介质
JP6676009B2 (ja) 話者判定装置、話者判定情報生成方法、プログラム
KR102516412B1 (ko) 기계학습 추론을 위한 gpu 클럭 조절 방법 및 장치
CN107451694A (zh) 一种用于移动系统中上下文感知与自适应的应用预测方法
KR20080014680A (ko) 제곱근 디스카운트를 이용한 통계적 언어에 의한 음성 인식방법 및 시스템
Vinyals et al. Chasing the metric: Smoothing learning algorithms for keyword detection
WO2020153159A1 (ja) 系列ラベリング装置、系列ラベリング方法、およびプログラム
US11887620B2 (en) Language model score calculation apparatus, language model generation apparatus, methods therefor, program, and recording medium
Tyagi et al. Fast intent classification for spoken language understanding systems

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211208

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221027

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230307

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230320

R150 Certificate of patent or registration of utility model

Ref document number: 7259451

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150