JP7348444B2 - 機械学習モデルのハイパーパラメータ最適化過程の分析と調整のためのチューニングアルゴリズム認識視覚化方法 - Google Patents

機械学習モデルのハイパーパラメータ最適化過程の分析と調整のためのチューニングアルゴリズム認識視覚化方法 Download PDF

Info

Publication number
JP7348444B2
JP7348444B2 JP2021016212A JP2021016212A JP7348444B2 JP 7348444 B2 JP7348444 B2 JP 7348444B2 JP 2021016212 A JP2021016212 A JP 2021016212A JP 2021016212 A JP2021016212 A JP 2021016212A JP 7348444 B2 JP7348444 B2 JP 7348444B2
Authority
JP
Japan
Prior art keywords
hyperparameter
hyperparameters
algorithm
search
visualizing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021016212A
Other languages
English (en)
Other versions
JP2022065599A (ja
Inventor
興錫 朴
志訓 金
宰傑 朱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Naver Corp
Original Assignee
Naver Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Naver Corp filed Critical Naver Corp
Publication of JP2022065599A publication Critical patent/JP2022065599A/ja
Application granted granted Critical
Publication of JP7348444B2 publication Critical patent/JP7348444B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • User Interface Of Digital Computer (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Description

特許法第30条第2項適用 2020年9月4日にhttps://arxiv.org/abs/2009.02078で公開
以下の説明は、学習モデルのハイパーパラメータを最適化する技術に関する。
深層神経網モデルの研究と開発において、ハイパーパラメータ(hyperparameter)の調整はモデルの性能に極めて大きな影響を及ぼすため、実務者の多くは調整過程を手動で繰り返し行う。このようなハイパーパラメータの調整過程での苦労を和らげるために、ハイパーパラメータ探索空間(hyperparameter search space)でハイパーパラメータの最適な組み合わせを探索する、自動化された機械学習(AutoML)方式が開発された。
ところが、このような自動化された機械学習による探索は、初期構成(configuration)の設定によってその結果が多様となり、実務者が適用しようとする人工知能モデルに相応しい構成を見つけるためには、また違った手動の繰り返し過程が必要となる。過去に開発された自動化された機械学習技術は、初期構成の設定に対して明確なガイドを提供することができずにいる。
深層神経網モデルの種類と自動化された機械学習(AutoML)方法の種類に限定されない、ユーザ主導型のハイパーパラメータ調整過程を支援する、視覚的分析方法およびシステムを提供する。
自動化された機械学習の探索結果から得られた分析内容に基づき、探索空間(search space)と自動化された機械学習アルゴリズムの構成を調整する方法およびシステムを提供する。
互いに異なるハイパーパラメータの相対的な重要度分析と相互作用効果(interaction effect)分析に基づいてハイパーパラメータの探索空間を調整できる環境を造成する方法およびシステムを提供する。
コンピュータシステムが実行するハイパーパラメータ調整方法であって、前記コンピュータシステムは、メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサを含み、前記ハイパーパラメータ調整方法は、ハイパーパラメータの組み合わせを探索するためのアルゴリズムを利用して探索された複数のハイパーパラメータの組み合わせの学習モデルに基づき、アルゴリズムの探索過程を視覚化する段階、および前記視覚化されたアルゴリズムの探索過程によってハイパーパラメータまたはハイパーパラメータの組み合わせの重要度を分析し、学習モデルの性能と関連のあるハイパーパラメータの情報をガイド(guide)する段階を含んでよい。
前記視覚化する段階は、ハイパーパラメータの組み合わせを探索するための自動化された機械学習(AutoML)アルゴリズムを利用する段階を含んでよい。
前記視覚化する段階は、前記機械学習アルゴリズムを利用して探索されたハイパーパラメータ探索空間に対する設定情報を構成するように前記複数のハイパーパラメータの組み合わせの学習モデルに基づき、アルゴリズムの性能およびアルゴリズムの構成を診断するための探索過程を視覚化する段階を含んでよい。
前記視覚化する段階は、前記探索されたハイパーパラメータ探索空間と前記ハイパーパラメータに対して構成された設定情報の組み合わせを平行座標グラフ上に位置させ、前記ハイパーパラメータの相対的な重要度を前記平行座標グラフの周辺に反映させた図形形態のインタフェースを視覚化する段階を含んでよい。
前記視覚化する段階は、前記ハイパーパラメータを示すそれぞれのユーザインタフェースを前記平行座標グラフで構成し、前記構成されたそれぞれのユーザインタフェースをハイパーパラメータの相対的な重要度にしたがって予め設定された方向から位置させ、前記位置されたそれぞれのユーザインタフェースに対応して前記平行座標グラフの座標を並べる段階を含んでよい。
前記視覚化する段階は、前記ハイパーパラメータを示すそれぞれのユーザインタフェースに対するユーザとの相互作用により、ハイパーパラメータをアクティブ化させる段階を含んでよい。
前記視覚化する段階は、前記ユーザが選択したユーザインタフェースに対応するハイパーパラメータの相対的な重要度値を数値化し、前記選択されたハイパーパラメータを示すユーザインタフェースを拡大し、前記選択されたハイパーパラメータと関連性のある他のハイパーパラメータを関連性の値にしたがって配置し、前記選択されたハイパーパラメータに対する設定値の範囲を平行座標グラフと複数のバー(Bar)で構成された視覚化モジュールによって視覚化する段階を含んでよい。
前記視覚化する段階は、前記ハイパーパラメータの重要度算出結果をマトリックス形態で視覚化する段階を含んでよい。
前記視覚化する段階は、前記マトリックス形態で構成された各行に、ハイパーパラメータまたはハイパーパラメータの組み合わせの重要度と前記重要度の信頼値を視覚化し、ユーザからの相互作用によって前記各行がアクティブ化することにより、ハイパーパラメータの重要度に対する詳細情報を提供する段階を含んでよい。
前記視覚化する段階は、前記ハイパーパラメータのタイプ(type)にしたがい、前記ハイパーパラメータに対する詳細情報を互いに異なるプロットによって視覚化する段階を含んでよい。
前記視覚化する段階は、前記学習モデルの性能更新を確認するためのモニタリングビューを提供し、ユーザによって設定情報が構成された、自動化された機械学習アルゴリズムの性能更新記録を折れ線グラフによって視覚化する段階を含んでよい。
前記視覚化する段階は、前記自動化された機械学習アルゴリズムが探索ロジックを繰り返すことによって探索ロジックのインデックスをx軸に表現し、前記自動化された機械学習アルゴリズムによって探索された学習モデルの性能をy軸に表現し、探索ロジックを繰り返すことによって各インデックスで探索された学習モデルは、前記x軸とy軸の値にしたがって折れ線グラフの座標上に点(point)で位置させる段階を含んでよい。
前記視覚化する段階は、前記アルゴリズムの性能を確認するための探索ヒストリービューを提供し、自動化された機械学習アルゴリズムを実行する前に設定されたハイパーパラメータ探索空間に基づいて複数のプロットを構成し、前記構成された複数のプロットのうちのそれぞれのプロットにより、ハイパーパラメータの探索空間に対する探索ヒストリーを可視化する段階を含んでよい。
前記視覚化する段階は、前記構成された複数のプロットを学習モデルの性能向上モニタリングビューのx軸と一致させて自動化された機械学習アルゴリズムの探索ロジックのインデックスを表現し、y軸にハイパーパラメータ探索空間の範囲を表現し、探索ロジックを繰り返すことによって各インデックスで探索された学習モデルは、ハイパーパラメータの値にしたがって座標上に点(point)で位置させる段階を含んでよい。
前記視覚化する段階は、前記構成された複数のプロットでハイパーパラメータのタイプ(type)によって学習モデルに対応するそれぞれの点が重なる場合、斥力(repulsive force)を加えて点を位置させる段階を含んでよい。
前記視覚化する段階は、前記自動化された機械学習アルゴリズムの探索ロジックの特性にしたがい、点線と曲線を利用して学習モデルに対応する点を連結して学習モデルとの関係を視覚化する段階を含んでよい。
ハイパーパラメータ調整方法を前記コンピュータシステムに実行させるために非一時的なコンピュータ読み取り可能な記録媒体に記録される、コンピュータプログラムを提供する。
ハイパーパラメータ調整方法をコンピュータに実行させるためのプログラムが記録されている、非一時的なコンピュータ読み取り可能な記録媒体を提供する。
コンピュータシステムは、メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサを含み、前記少なくとも1つのプロセッサは、ハイパーパラメータの組み合わせを探索するためのアルゴリズムを利用して探索された複数のハイパーパラメータの組み合わせの学習モデルに基づき、前記アルゴリズムの探索過程を視覚化する視覚化部、および前記視覚化されたアルゴリズムの探索過程によってハイパーパラメータまたはハイパーパラメータの組み合わせの重要度を分析し、学習モデルの性能と関連のあるハイパーパラメータの情報をガイド(guide)する最適化部を含んでよい。
前記視覚化部は、ハイパーパラメータの組み合わせを探索するための自動化された機械学習(AutoML)アルゴリズムを利用してよい。
深層神経網に基づく学習モデルの種類と自動化された機械学習(AutoML)の種類に限定されない、ユーザ主導型のハイパーパラメータ調整過程を提供することができる。
自動化された機械学習の探索結果から得られた分析情報に基づき、探索空間(search space)と自動化された機械学習アルゴリズムの構成を精密に調整することができる。
互いに異なるハイパーパラメータの相対的な重要度分析と相互作用効果(interaction effect)分析に基づき、ハイパーパラメータの探索空間を効率的に調整することができる。
一実施形態における、コンピュータシステムの内部構成の一例を説明するためのブロック図である。 一実施形態における、コンピュータシステムのプロセッサが含むことのできる構成要素の例を示した図である。 一実施形態における、コンピュータシステムが実行することのできるハイパーパラメータ最適化過程の分析と調整のための視覚化方法を説明するためのフローチャートである。 一実施形態における、コンピュータシステムで学習モデルのハイパーパラメータの最適化過程と視覚的分析を実行する概略的な動作を説明するための図である。 一実施形態における、コンピュータシステムで自動化された機械学習の結果を視覚化した例示図である。 一実施形態における、コンピュータシステムで自動化された機械学習の結果を視覚化した例示図である。 一実施形態における、コンピュータシステムで自動化された機械学習の結果を視覚化した例示図である。 一実施形態における、コンピュータシステムで自動化された機械学習の結果を視覚化した例示図である。 一実施形態における、コンピュータシステムで自動化された機械学習の結果を視覚化した例示図である。 一実施形態における、コンピュータシステムで自動化された機械学習アルゴリズムの探索過程を視覚化する動作を説明するための図である。 一実施形態における、コンピュータシステムで自動化された機械学習アルゴリズムの探索結果を視覚化したものを比較するための例示図である。 一実施形態における、コンピュータシステムで自動化された機械学習アルゴリズムの探索結果を視覚化したものを比較するための例示図である。 一実施形態における、コンピュータシステムで自動化された機械学習アルゴリズムの探索結果を視覚化したものを比較するための例示図である。 一実施形態における、コンピュータシステムで自動化された機械学習アルゴリズムで探索されたハイパーパラメータの探索空間の分析と調整を視覚化する動作を説明するための図である。 一実施形態における、コンピュータシステムで自動化された機械学習アルゴリズムで探索されたハイパーパラメータの探索空間の分析と調整を視覚化する動作を説明するための図である。
以下、実施形態について、添付の図面を参照しながら詳しく説明する。
図1は、一実施形態における、コンピュータシステムの例を示したブロック図である。例えば、実施形態に係るハイパーパラメータ最適化過程の分析と調整のための視覚化システムは、図1に示したコンピュータシステム100によって実現されてよい。
図1に示すように、コンピュータシステム100は、本発明の実施形態に係るハイパーパラメータ最適化過程の分析と調整のための視覚化方法を実行するための構成要素として、メモリ110、プロセッサ120、通信インタフェース130、および入力/出力インタフェース140を含んでよい。
メモリ110は、コンピュータ読み取り可能な記録媒体であって、RAM(random access memory)、ROM(read only memory)、およびディスクドライブのような永続的大容量記録装置を含んでよい。ここで、ROMやディスクドライブのような永続的大容量記録装置は、メモリ110とは区分される別の永続的記録装置としてコンピュータシステム100に含まれてもよい。また、メモリ110には、オペレーティングシステムと、少なくとも1つのプログラムコードが記録されてよい。このようなソフトウェア構成要素は、メモリ110とは別のコンピュータ読み取り可能な記録媒体からメモリ110にロードされてよい。このような別のコンピュータ読み取り可能な記録媒体は、フロッピー(登録商標)ドライブ、ディスク、テープ、DVD/CD-ROMドライブ、メモリカードなどのコンピュータ読み取り可能な記録媒体を含んでよい。他の実施形態において、ソフトウェア構成要素は、コンピュータ読み取り可能な記録媒体ではない通信インタフェース130を通じてメモリ110にロードされてもよい。例えば、ソフトウェア構成要素は、ネットワーク160を介して受信されるファイルによってインストールされるコンピュータプログラムに基づいてコンピュータシステム100のメモリ110にロードされてよい。
プロセッサ120は、基本的な算術、ロジック、および入出力演算を実行することにより、コンピュータプログラムの命令を処理するように構成されてよい。命令は、メモリ110または通信インタフェース130によって、プロセッサ120に提供されてよい。例えば、プロセッサ120は、メモリ110のような記録装置に記録されたプログラムコードにしたがって受信される命令を実行するように構成されてよい。
通信インタフェース130は、ネットワーク160を介してコンピュータシステム100が他の装置と互いに通信するための機能を提供してよい。一例として、コンピュータシステム100のプロセッサ120がメモリ110のような記録装置に記録されたプログラムコードにしたがって生成した要求や命令、データ、ファイルなどが、通信インタフェース130の制御にしたがってネットワーク160を介して他の装置に伝達されてよい。これとは逆に、他の装置からの信号や命令、データ、ファイルなどが、ネットワーク160を経てコンピュータシステム100の通信インタフェース130を通じてコンピュータシステム100に受信されてよい。通信インタフェース130を通じて受信された信号や命令、データなどは、プロセッサ120やメモリ110に伝達されてよく、ファイルなどは、コンピュータシステム100がさらに含むことのできる記録媒体(上述した永続的記録装置)に記録されてよい。
通信方式が限定されることはなく、ネットワーク160が含むことのできる通信網(一例として、移動通信網、有線インターネット、無線インターネット、放送網)を利用する通信方式だけではなく、機器間の近距離有線/無線通信が含まれてもよい。例えば、ネットワーク160は、PAN(personal area network)、LAN(local area network)、CAN(campus area network)、MAN(metropolitan area network)、WAN(wide area network)、BBN(broadband network)、インターネットなどのネットワークのうちの1つ以上の任意のネットワークを含んでよい。さらに、ネットワーク160は、バスネットワーク、スターネットワーク、リングネットワーク、メッシュネットワーク、スター-バスネットワーク、ツリーまたは階層的ネットワークなどを含むネットワークトポロジのうちの任意の1つ以上を含んでもよいが、これらに限定されることはない。
入力/出力インタフェース140は、入力/出力装置150とのインタフェースのための手段であってよい。例えば、入力装置は、マイク、キーボード、カメラ、またはマウスなどの装置を、出力装置は、ディスプレイ、スピーカのような装置を含んでよい。他の例として、入力/出力インタフェース140は、タッチスクリーンのように入力と出力のための機能が1つに統合された装置とのインタフェースのための手段であってもよい。入力/出力装置150は、コンピュータシステム100と1つの装置で構成されてもよい。
また、他の実施形態において、コンピュータシステム100は、図1の構成要素よりも少ないか多くの構成要素を含んでもよい。しかし、大部分の従来技術の構成要素を明確に図に示す必要はない。例えば、コンピュータシステム100は、上述した入力/出力装置150のうちの少なくとも一部を含むように実現されてもよいし、トランシーバ、カメラ、各種センサ、データベースなどのような他の構成要素をさらに含んでもよい。
従来の技術は、ハイパーパラメータ(hyperparameter)の最適化作業のための強力なデータ探索であると同時に、人間の洞察力(human insight)を活用して最適化過程の透明性(transparency)を向上させることに寄与してきたが、最適化過程の分析に必要な2つの重要な側面については考慮できていなかった。
1つ目に、従来の技術は、どのようなハイパーパラメータが機械学習モデルの性能により多くの影響を与えるか、重要なハイパーパラメータが存在する場合には、この探索空間(search space)のどの範囲が追加の探索のために有望であるかについて、ユーザに明らかにガイドできていなかった。したがって、探索空間の調整は、ユーザの直観(intuition)に全面的に依存するしかなかった。2つ目に、従来の技術は、ハイパーパラメータ最適化過程とその結果に大きな影響を及ぼす、自動化された機械学習(AutoML)アルゴリズムの設定構成(configuration)と設定構成を診断することの重要性について考慮しなかった。
実施形態では、重要なハイパーパラメータと前記ハイパーパラメータの効果的な値の範囲について明確なガイダンス(explicit guidance)を提供することにより、ユーザが必要のない探索空間を発見することができ、最適化過程の全体的な効率性の向上をサポートすることができる。また、自動化された機械学習アルゴリズムは多種多様であり、それぞれのアルゴリズム特性に応じて構成方式も異なる。これにより、ハイパーパラメータの最適化を実行する前に、ユーザが、探索空間と学習モデルによる設定値を含む設定構成によって探索方式と探索結果を決定するにあたり、設定値を考慮することができる。
実施形態によると、自動化された機械学習アルゴリズムの複雑な行為に対する視覚化技法を提案する。これにより、自動化された機械学習アルゴリズムの動作方式をユーザに理解させることができ、設定した初期構成による学習モデルを診断できるようにすることで、自動化された機械学習の潜在力を最大化することができる。
図2は、一実施形態における、コンピュータシステムのプロセッサが含むことのできる構成要素の例を示した図であり、図3は、一実施形態における、コンピュータシステムが実行することのできるハイパーパラメータ最適化過程の分析と調整のための視覚化方法を説明するためのフローチャートである。
図2に示すように、プロセッサ120は、視覚化部210および最適化部220を含んでよい。このようなプロセッサ120の構成要素は、少なくとも1つのプログラムコードによって提供される制御命令にしたがってプロセッサ120によって実行される、互いに異なる機能(different functions)の表現であってよい。
プロセッサ120およびプロセッサ120の構成要素は、図3のハイパーパラメータ最適化過程の分析と調整のための視覚化方法が含む段階310~320を実行してよい。例えば、プロセッサ120およびプロセッサ120の構成要素は、メモリ110が含むオペレーティングシステムのコードと、上述した少なくとも1つのプログラムコードとによる命令(instruction)を実行するように実現されてよい。ここで、少なくとも1つのプログラムコードは、ハイパーパラメータ最適化過程の分析と調整のための視覚化方法を処理するために実現されたプログラムのコードに対応してよい。
プロセッサ120は、ハイパーパラメータ最適化過程の分析と調整のための視覚化方法のためのプログラムファイルに記録されたプログラムコードをメモリ110にロードしてよい。例えば、ハイパーパラメータ最適化過程の分析と調整のための視覚化方法のためのプログラムファイルは、メモリ110とは区分される永続的記録装置に記録されていてよく、プロセッサ120は、バスを介して永続的記録装置に記録されたプログラムファイルからプログラムコードがメモリ110にロードされるようにコンピュータシステム100を制御してよい。このとき、プロセッサ120およびプロセッサ120が含む視覚化部210および最適化部220それぞれは、メモリ110にロードされたプログラムコードのうちの対応する部分の命令を実行して以下の段階310~320を実行するためのプロセッサ120の互いに異なる機能的表現であってよい。段階310~320の実行のために、プロセッサ120およびプロセッサ120の構成要素は、制御命令による演算を直接処理するか、またはコンピュータシステム100を制御してよい。
段階310で、視覚化部210は、ハイパーパラメータの組み合わせを探索するためのアルゴリズムを利用して探索された複数のハイパーパラメータの組み合わせの学習モデルに基づき、アルゴリズムの探索過程を視覚化してよい。視覚化部210は、ハイパーパラメータの組み合わせを探索するための自動化された機械学習(AutoML)アルゴリズムを利用してよい。視覚化部210は、アルゴリズムを利用して探索されたハイパーパラメータ探索空間に対する設定情報を構成するように複数のハイパーパラメータの組み合わせの学習モデルに基づき、アルゴリズムの性能およびアルゴリズムの構成を診断するための探索過程を視覚化してよい。視覚化部210は、学習モデルの性能更新を確認するためのモニタリングビューを提供し、ユーザによって設定情報が構成された、自動化された機械学習アルゴリズムの性能更新記録を折れ線グラフによって視覚化してよい。視覚化部210は、自動化された機械学習アルゴリズムが探索ロジックを繰り返すことによって探索ロジックのインデックスをx軸に表現し、自動化された機械学習アルゴリズムによって探索された学習モデルの性能をy軸に表現し、探索ロジックを繰り返すことによって各インデックスで探索された学習モデルは、x軸とy軸の値にしたがって折れ線グラフの座標上に点(point)で位置させてよい。視覚化部210は、アルゴリズムの性能を確認するための探索ヒストリービューを提供し、自動化された機械学習アルゴリズムを実行する前に設定されたハイパーパラメータ探索空間に基づいて複数のプロットを構成し、構成された複数のプロットのそれぞれのプロットを使用してハイパーパラメータの探索空間に対する探索ヒストリーを可視化してよい。視覚化部210は、構成された複数のプロットを学習モデルの性能向上モニタリングビューのx軸と一致させて自動化された機械学習アルゴリズムの探索ロジックのインデックスを表現し、y軸にハイパーパラメータ探索空間の範囲を表現し、探索ロジックを繰り返すことによって各インデックスで探索された学習モデルは、ハイパーパラメータの値にしたがって座標上に点(point)で位置させてよい。視覚化部210は、構成された複数のプロットでハイパーパラメータのタイプ(type)によって学習モデルに対応する点が重なる場合、斥力(repulsive force)を加えて点を位置させてよい。視覚化部210は、自動化された機械学習アルゴリズムの探索ロジックの特性にしたがい、点線と曲線を利用して学習モデルに対応する点を連結して学習モデルとの関係を視覚化してよい。
段階320で、最適化部220は、視覚化されたアルゴリズムの探索過程によってハイパーパラメータまたはハイパーパラメータの組み合わせの重要度を分析し、学習モデルの性能と関連のあるハイパーパラメータの情報をガイド(guide)してよい。最適化部220は、アルゴリズムを利用して探索されたハイパーパラメータ探索空間とハイパーパラメータに対して構成された設定情報の組み合わせを平行座標グラフ上に位置させ、ハイパーパラメータの相対的な重要度を平行座標グラフの周辺に反映させた図形形態のインタフェースを視覚化してよい。最適化部220は、ハイパーパラメータを示すそれぞれのユーザインタフェースを平行座標グラフに構成し、構成されたそれぞれのユーザインタフェースをハイパーパラメータの相対的な重要度にしたがって予め設定された方向から位置させ、位置させたそれぞれのユーザインタフェースに対応して平行座標グラフの座標を並べてよい。最適化部220は、ハイパーパラメータを示すそれぞれのユーザインタフェースに対するユーザとの相互作用(例えば、ドラッグ、タッチ、クリックなど)により、ハイパーパラメータをアクティブ化させてよい。最適化部220は、ユーザから選択されたユーザインタフェースに対応するハイパーパラメータの相対的な重要度値を数値化し、選択されたハイパーパラメータを示すユーザインタフェースを拡大し、選択されたハイパーパラメータと関連性のある他のハイパーパラメータを関連性の値にしたがって配置し、選択されたハイパーパラメータに対する設定値の範囲を平行座標グラフと複数のバー(Bar)で構成された視覚化モジュールによって視覚化してよい。最適化部220は、ハイパーパラメータの重要度算出結果をマトリックス形態によって視覚化してよい。最適化部220は、マトリックス形態で構成された各行に、ハイパーパラメータまたはハイパーパラメータの組み合わせの重要度と重要度の信頼値を視覚化し、ユーザからの相互作用によって各行がアクティブ化することにより、ハイパーパラメータの重要度に対する詳細情報を提供してよい。最適化部220は、ハイパーパラメータのタイプ(type)にしたがい、ハイパーパラメータに対する詳細情報を互いに異なるプロットによって視覚化してよい。
図4は、一実施形態における、コンピュータシステムで学習モデルのハイパーパラメータの最適化過程と視覚的分析を実行する概括的な動作を説明するための図である。
コンピュータシステムは、実務者の分析要求事項を反映したハイパーパラメータの最適化過程と視覚的分析を視覚化してよい。一例として、複数名の実務者とのインタビューから複数の分析要求事項を識別してよい。実務者からの3つの分析要求事項、例えば、効果的なハイパーパラメータの識別、探索アルゴリズムの行動分析、要求事項を満たすモデルの選択などを含む分析要求事項が存在してよい。
コンピュータシステムは、ループ(loop)最適化によってハイパーパラメータ最適化のプロセスを実行した結果データを、実務者の分析要求事項を反映して視覚化してよい。視覚化によって支援されるタスクに対するユーザの洞察によってハイパーパラメータ最適化のためにユーザ介入をして探索過程を制御してよい。
図5a~5eは、一実施形態における、コンピュータシステムで自動化された機械学習の結果を視覚化した例示図である。
コンピュータシステムは、ハイパーパラメータの組み合わせを探索するためのアルゴリズムを利用して探索されたハイパーパラメータの組み合わせの学習モデルに基づき、アルゴリズムの性能およびアルゴリズムの構成を診断するためのアルゴリズムの探索過程を視覚化してよい。このとき、学習モデルとは、深層神経網に基づく機械学習モデルを意味してよい。
図5aを参照すると、ユーザインタフェースを提供する視覚化画面500に、ハイパーパラメータを最適化する自動化された機械学習プロセスの動作が視覚化されてよい。例えば、視覚化画面500は、ハイパーパラメータ最適化プロセスを追跡して分析するように設計されてよい。このような視覚化画面500に構成されたそれぞれの領域に、ハイパーパラメータ最適化過程の分析と調整のための多様な情報が視覚化されてよい。例えば、視覚化画面500に構成されたそれぞれの領域に、図5b~5eのような情報が視覚化されてよい。視覚化画面500でユーザが繰り返して相互作用する調整過程により、ハイパーパラメータの最適化が効果的に実行されるようになる。ユーザは、視覚化画面500に視覚化された情報を利用することにより、ユーザの洞察力に基づく最適なハイパーパラメータを微細調整することができる。
図5bを参照すると、コンピュータシステムは、視覚化画面500に最適化概要を提供してよい。コンピュータシステムは、視覚化画面500で、ユーザからの学習モデルの大きさおよび予測正確度を含む基準にしたがい、最適化結果の統計情報と学習モデルの分布を探索した結果を視覚化してよい。また、学習モデルの性能を実験した値が視覚化されてもよい。例えば、ユーザがハイパーパラメータの探索空間を調節した範囲内で探索された学習モデルの性能値が視覚化されてよい。図5cを参照すると、コンピュータシステムは、視覚化画面500で学習モデルの性能に対する分析を実行することにより、ハイパーパラメータとハイパーパラメータに対する範囲を明確に強調し、ユーザが探索空間を具体化できるようにサポートしてよい。図5dを参照すると、コンピュータシステムは、視覚化画面500に学習モデルを分析した結果を視覚化してよい。図5eを参照すると、コンピュータシステムは、視覚化画面500にハイパーパラメータの探索空間に対する探索履歴を視覚化してよく、使用したアルゴリズムの複雑な動作を視覚的に理解してアルゴリズムの構成差を比較できるように診断することで探索過程を調整できるようにしてよい。
図6は、一実施形態における、コンピュータシステムで自動化された機械学習アルゴリズムの探索過程を視覚化する動作を説明するための図である。
コンピュータシステムは、ハイパーパラメータの組み合わせを探索するための自動化された機械学習アルゴリズムを利用した探索過程の理解と診断をサポートするために、探索過程を視覚化してよい。コンピュータシステムは、複数の自動化された機械学習アルゴリズムの動作方式と各アルゴリズムの設定値を診断してよい。コンピュータシステムは、ハイパーパラメータ探索空間を探索し、与えられた学習モデルの性能を最大化する最適なハイパーパラメータの組み合わせを返還してよい。このとき、自動化された機械学習アルゴリズムとしては、ランダム、ベイジアン、バンディット、進化的(evolutionary)のような多様な探索アルゴリズムが含まれてよく、それぞれのアルゴリズムは、自動化された機械学習のプロセスを実行する前に構成しなければならない固有の設定項目をもつ。それぞれのアルゴリズムの設定項目に対する値により、アルゴリズムの探索過程と結果が極めて多様に現れるようになる。ユーザが自動化された機械学習アルゴリズムを効果的に使用するためには、ユーザが、最適化しようとする学習モデルの特徴、ハイパーパラメータの特徴、探索空間の大きさに応じて設定値を構成しなければならない。
コンピュータシステムは、ユーザが、多種多様な自動化された機械学習アルゴリズムの探索過程を理解し、与えられた学習モデルとハイパーパラメータ探索空間に合った設定値を構成できるように、自動化された機械学習アルゴリズムの探索過程を視覚化してよい。
図6は、自動化された機械学習アルゴリズムの探索過程を表現した例示図である。コンピュータシステムは、モデル性能向上モニタリングビュー(a)および探索ヒストリービュー(b)を含む複数のビューを区分して自動化された機械学習アルゴリズムの探索過程を表現してよい。
先ず、モデル性能向上モニタリングビュー(a)について説明する。モデル性能向上モニタリングビュー(a)とは、自動化された機械学習アルゴリズムが固有の探索ロジックによってハイパーパラメータをサンプリングしながら、学習モデルの性能が斬新的に増加するかを表現するビューを意味する。モデル性能向上モニタリングビュー(a)は、ユーザが構成した設定値にしたがい、自動化された機械学習アルゴリズムの動作を折れ線グラフによって視覚化してよい。モデル性能向上モニタリングビュー(a)により、ユーザが構成した設定値によって自動化された機械学習アルゴリズムが正しく動作しているかを迅速に把握することができる。自動化された機械学習アルゴリズムが探索ロジックを繰り返すことによって点線の区域で探索されたロジックのインデックスはx軸に、自動化された機械学習アルゴリズムによって探索された学習モデルの性能はy軸に視覚化されてよい。各探索ロジックを繰り返すことによって各インデックスで探索された学習モデルは小さな点(point)で表現され、x軸およびy軸の値にしたがって座標上に位置させてよい。
次に、探索ヒストリービュー(b)について説明する。探索ヒストリービュー(b)は、自動化された機械学習を実行する前に設定されたハイパーパラメータ探索空間の集合にしたがって複数のプロット(図6ではh1、h2)を構成してよい。探索ヒストリービュー(b)によって構成された複数のプロットのそれぞれで、それぞれのハイパーパラメータの探索空間を探索したヒストリーが視覚化されてよい。このようなプロットにモデル性能向上モニタリングビュー(a)のx軸と一致させ、自動化された機械学習アルゴリズムの繰り返された探索ロジックのインデックスを表現してよい。このような繰り返された探索ロジックのインデックスは、プロット内でグレースケール(gray scale)のグラデーション(gradation)によって区分されてよい。y軸にはハイパーパラメータを探索した探索空間の範囲が表現されてよく、各繰り返された探索ロジックのインデックスで探索された学習モデルは、ハイパーパラメータの値にしたがって位置させてよい。
コンピュータシステムは、多様な機械学習アルゴリズムに対する動作原理の理解をサポートするために、それぞれの探索アルゴリズムの特徴を視覚化してよい。図6は、進化的(evolutionary)ベースの自動化された機械学習アルゴリズムの動作原理の例を表現した図である。コンピュータシステムは、進化的ベースの自動化された機械学習アルゴリズムは、設定された人口数(population size)分だけハイパーパラメータの組み合わせをもつ学習モデルをランダムにサンプリングし、設定された訓練段階まで学習モデルを訓練させた後、学習モデルの性能を比較してよい。コンピュータシステムは、性能を比較するときに、優れた性能をもつ学習モデルは予め設定された生存率(survival rate)分だけ維持し、残りは廃棄する。例えば、コンピュータシステムは、予め設定された生存率以上であるk(kは自然数)個の学習モデルは維持し、予め設定された生存率以下であるk(kは自然数)個の学習モデルは廃棄してよい。言い換えれば、人口数から予め設定された生存率を除いた学習モデルは廃棄される。コンピュータシステムは、次の探索ロジックのインデックスで維持された学習モデルをコピーし、維持された学習モデルがもつハイパーパラメータの値を参考にしながらハイパーパラメータの値を少しずつ変更して学習モデルを生成することにより、空いた人口数を満たしてよい。このような繰り返し過程を世代数(generation size)分だけ繰り返してよい。
進化的(evolutionary)ベースの自動化された機械学習アルゴリズムの場合は、単純に繰り返された探索ロジックのインデックスによって点(ポイント)を視覚化するだけではアルゴリズムを理解し難い。コンピュータシステムは、各学習モデルがどのような学習モデルから始まったかに対するヒストリー(系譜)を視覚化してよい。以前に繰り返された探索ロジックのインデックスで維持された学習モデルの場合は、維持された学習モデルが現在繰り返されている探索ロジックのインデックスでも存在するようになる。コンピュータシステムは、学習モデルを新たに生成しないため、以前に繰り返された探索ロジックのインデックスで維持された学習モデルと現在繰り返されている探索ロジックのインデックスで存在する学習モデルとを点線で連結して性能ヒストリーを視覚化してよい。コンピュータシステムは、維持された学習モデルのハイパーパラメータの値を参考して生成された学習モデルの場合、新たに学習モデルを生成する場合であるため、以前に繰り返された探索ロジックのインデックスで維持された学習モデルと実線で連結して学習モデルの生成ヒストリーを視覚化してよい。
この他にも、異なる探索方式を採択する自動化された機械学習アルゴリズムにも適用と応用が可能である。例えば、バンディットベースの自動化された機械学習アルゴリズムの場合、学習モデルの性能を比較した後、性能が弱いモデルは漸進的に廃棄し、性能が良い学習モデルだけを維持させる方式を採択す(維持された学習モデルはコピーしない)。これにより、バンディットベースの自動化された機械学習アルゴリズムでは、点線だけを利用して性能ヒストリーの表現を可能にする。
また、ハイパーパラメータは、数値型(numerical)の他にも範疇型(categorical)が存在する。範疇型ハイパーパラメータの場合、各学習モデルの点が等しい範疇型値をもつ場合には、プロットの座標上で互いに重なり、誤認知を引き起こすことがある。実施形態では、範疇型の位置に適切な斥力(repulsive force)を与える方式を利用することで、それぞれの点の位置が重ならないようにする。
図7a~7cは、一実施形態における、コンピュータシステムで自動化された機械学習アルゴリズムの探索結果を視覚化したものを比較するための例示図である。
図7a~7cを参照すると、自動化された機械学習アルゴリズムの探索結果を多様に視覚化したものが示されている。それぞれ異なる探索方式をもつ自動化された機械学習アルゴリズムに対する初期設定によって探索過程と探索結果が異なることを確認することができる。
図7aにはランダム探索およびベイジアン最適化を利用した探索結果が、図7bにはハイパーバンド(HyperBand)、BOHBを利用した探索結果が、図7cにはPBTを利用した探索結果が示されている。一例として、図7aのランダム探索およびベイジアン最適化による探索結果を参照すると、探索パターンは殆ど現れないことを確認することができる。
図7bのバンディットベースの自動化された機械学習アルゴリズムを利用した探索結果を参照すると、有望なモデルは維持され、必要ないモデルは廃棄されたことを確認することができる。また、図7aのベイジアン最適化では探索パターンが現れなかったが、図7bのベイジアン最適化とハイパーバンドを結合したアルゴリズムであるBOHBでは、明らかな探索パターンが現れたことを確認することができる。図7cのPBTベースの自動化された機械学習アルゴリズムを利用した探索結果を参照すると、初期設定値によって探索パターンが区別されることを確認することができる。
図8a、8bは、一実施形態における、コンピュータシステムで自動化された機械学習アルゴリズムで探索されたハイパーパラメータの探索空間の分析と調整を視覚化する動作を説明するための図である。
学習モデルのハイパーパラメータは一般的に高次元の性質をもち、ハイパーパラメータの値の組み合わせは無限に近い。無限に近いハイパーパラメータの組み合わせにおいて、学習モデルの性能に最も重要なハイパーパラメータは何であるかを把握し、重要なハイパーパラメータのどの値の範囲が効果的であるかを把握することは、自動化された機械学習アルゴリズムの使用にあたってユーザが最も必要とする分析要素の1つである。
コンピュータシステムは、学習モデルの性能に影響を与えるハイパーパラメータとハイパーパラメータの効果的な値の区間をガイド(guide)してよい。これにより、ユーザは、ハイパーパラメータとハイパーパラメータに対する値の区間を調整することができ、ハイパーパラメータを最適化することができる。
コンピュータシステムは、学習モデルの性能による効果的なハイパーパラメータを探索してハイパーパラメータの重要度を分析し、複数のハイパーパラメータの相互作用効果を分析することにより、追加探索のための探索空間を具体化することができる。
図8aは探索空間概括ビューを、図8bはハイパーパラメータ重要度分析ビューを示している。図8aの最初の図面を参照すると、コンピュータシステムは、自動化された機械学習アルゴリズムを利用してハイパーパラメータ探索空間とハイパーパラメータ値の組み合わせを平行座標グラフ(parallel coordinates)上に表現してよい。追加で、コンピュータシステムは、ハイパーパラメータの重要度を計算し、ハイパーパラメータの相対的な重要度を平行座標グラフの周辺に反映させた図形(例えば、四角形)形態で並べて表現してよい。例えば、コンピュータシステムは、ハイパーパラメータの相対的な重要度を、平行座標グラフの上端に、ハイパーパラメータの相対的な重要度を反映させた棒形態のユーザインタフェースを構成することで、ハイパーパラメータの相対的な重要度にしたがって平行座標グラフの上端に構成された棒形態のユーザインタフェースが調節されるように視覚化してよい。コンピュータシステムは、視覚的認知を向上させるために、各ハイパーパラメータを示すユーザインタフェースの順を重要度にしたがって特定の方向(例えば、右側)から位置させ、平行座標グラフの座標も同じ方向から並べてよい。コンピュータシステムは、図形形態のユーザインタフェースに対応する座標情報を曲線(curved line)で表現し、曲線の太さを重要度の値に応じて調整してよい。
図8aの2つ目の図面を参照すると、ハイパーパラメータを示すユーザインタフェースの詳細分析のために、ユーザの相互作用(例えば、ドラッグ、クリック、タッチなど)によってハイパーパラメータをアクティブ化してよい。図8aには、ユーザが一番右側にあるハイパーパラメータを示すユーザインタフェースと相互作用する例を示している。コンピュータシステムは、ユーザがハイパーパラメータを示すユーザインタフェースをクリックする場合、ユーザがクリックしたユーザインタフェースに該当するハイパーパラメータの相対的な重要度値を右側に円形態で表現してよい。コンピュータシステムは、ハイパーパラメータの相対的な重要度値が表現された棒形態のユーザインタフェースの下に、クリックされたハイパーパラメータの相対的な重要度値と関連する棒形態のユーザインタフェースを拡大して表現してよい。コンピュータシステムは、拡大した棒形態のユーザインタフェースの左側領域に、クリックされたハイパーパラメータと関連性のある他のハイパーパラメータを、関連性の値にしたがって順に配置して視覚化してよい。また、コンピュータシステムは、アクティブ化されたハイパーパラメータの効果的な値の範囲を平行座標グラフと連結させて棒グラフ(bar chart)によって視覚化してよい。言い換えれば、コンピュータシステムは、アクティブ化されたパラメータ領域に対応する平行座標グラフに棒グラフをオーバーレイ(overlay)させてよい。このような視覚化により、ユーザは、学習モデルの性能に影響を与えるハイパーパラメータを直観的に把握することができ、ユーザとの相互作用によってハイパーパラメータがクリックされることにより、探索結果によってハイパーパラメータの調整を実行するガイドが提供されることで探索の効率性を増大させることができる。
図8aの3つ目の図面を参照すると、単一ハイパーパラメータがアクティブ化された状況で他のハイパーパラメータを示すユーザインタフェースがクリックされる場合、平行座標グラフ上には、互いに異なるハイパーパラメータの関連性が表現されてよい。これにより、他のパラメータとの影響を考慮しながら、ハイパーパラメータ探索空間の分析と調整が可能となる。図8aの4つ目の図面には、ハイパーパラメータ探索空間の性能を最大化する探索空間を具体化する例が示さている。
図8bには、コンピュータシステムが重要度算出結果に対する詳細な情報を視覚化する例を示している。図8bの最初の図面を参照すると、コンピュータシステムは、ハイパーパラメータの重要度算出結果をマトリックス(matrix)形態によって視覚化している。マトリックス形態を構成する各行(row)には、単一ハイパーパラメータ(または、2つのハイパーパラメータの組み合わせ)の重要度と重要度の信頼度値が表現されてよい。ユーザが各行をアクティブ化させた場合、各行に対応するハイパーパラメータの重要度に関する詳細情報が視覚化されてよい。図8bの2つ目の図面を参照すると、単一ハイパーパラメータの重要度に対する詳細情報は、数値型ハイパーパラメータの場合は折れ線グラフ(line plot)で、範疇型ハイパーパラメータの場合は箱ひげ図(box plot)で視覚化されている。図8bの3番目の図面を参照すると、2つのハイパーパラメータの組み合わせに対する詳細な情報がヒートマップ(heatmap)によって視覚化されている。
上述した装置は、ハードウェア構成要素、ソフトウェア構成要素、および/またはハードウェア構成要素とソフトウェア構成要素との組み合わせによって実現されてよい。例えば、実施形態で説明された装置および構成要素は、例えば、プロセッサ、コントローラ、ALU(arithmetic logic unit)、デジタル信号プロセッサ、マイクロコンピュータ、FPGA(field programmable gate array)、PLU(programmable logic unit)、マイクロプロセッサ、または命令を実行して応答することができる様々な装置のように、1つ以上の汎用コンピュータまたは特殊目的コンピュータを利用して実現されてよい。処理装置は、オペレーティングシステム(OS)およびOS上で実行される1つ以上のソフトウェアアプリケーションを実行してよい。また、処理装置は、ソフトウェアの実行に応答し、データにアクセスし、データを記録、操作、処理、および生成してもよい。理解の便宜のために、1つの処理装置が使用されるとして説明される場合もあるが、当業者は、処理装置が複数個の処理要素および/または複数種類の処理要素を含んでもよいことが理解できるであろう。例えば、処理装置は、複数個のプロセッサまたは1つのプロセッサおよび1つのコントローラを含んでよい。また、並列プロセッサのような、他の処理構成も可能である。
ソフトウェアは、コンピュータプログラム、コード、命令、またはこれらのうちの1つ以上の組み合わせを含んでもよく、思うままに動作するように処理装置を構成したり、独立的または集合的に処理装置に命令したりしてよい。ソフトウェアおよび/またはデータは、処理装置に基づいて解釈されたり、処理装置に命令またはデータを提供したりするために、いかなる種類の機械、コンポーネント、物理装置、コンピュータ記録媒体または装置に具現化されてよい。ソフトウェアは、ネットワークによって接続されたコンピュータシステム上に分散され、分散された状態で記録されても実行されてもよい。ソフトウェアおよびデータは、1つ以上のコンピュータ読み取り可能な記録媒体に記録されてよい。
実施形態に係る方法は、多様なコンピュータ手段によって実行可能なプログラム命令の形態で実現されてコンピュータ読み取り可能な媒体に記録されてよい。前記コンピュータ読み取り可能な媒体は、プログラム命令、データファイル、データ構造などを単独でまたは組み合わせて含んでよい。前記媒体に記録されるプログラム命令は、実施形態のために特別に設計されて構成されたものであっても、コンピュータソフトウェア当業者に公知な使用可能なものであってもよい。コンピュータ読み取り可能な記録媒体の例としては、ハードディスク、フロッピディスク、磁気テープのような磁気媒体、CD-ROM、DVDのような光媒体、フロプティカルディスク(floptical disk)のような光磁気媒体、およびROM、RAM、フラッシュメモリなどのようなプログラム命令を格納して実行するように特別に構成されたハードウェア装置が含まれる。プログラム命令の例は、コンパイラによって生成されるもののような機械語コードだけではなく、インタプリタなどを使用してコンピュータによって実行される高級言語コードを含む。
以上のように、実施形態を、限定された実施形態および図面に基づいて説明したが、当業者であれば、上述した記載から多様な修正および変形が可能であろう。例えば、説明された技術が、説明された方法とは異なる順序で実行されたり、かつ/あるいは、説明されたシステム、構造、装置、回路などの構成要素が、説明された方法とは異なる形態で結合されたりまたは組み合わされたり、他の構成要素または均等物によって対置されたり置換されたとしても、適切な結果を達成することができる。
したがって、異なる実施形態であっても、特許請求の範囲と均等なものであれば、添付される特許請求の範囲に属する。
100:コンピュータシステム
120:プロセッサ
210:視覚化部
220:最適化部

Claims (19)

  1. コンピュータシステムが実行するハイパーパラメータ調整方法であって、
    前記コンピュータシステムは、メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサを含み、
    前記ハイパーパラメータ調整方法は、
    ハイパーパラメータの組み合わせを探索するためのアルゴリズムを利用して探索された複数のハイパーパラメータ組み合わせの学習モデルに基づき、アルゴリズムの探索過程を視覚化する段階、および
    前記視覚化されたアルゴリズムの探索過程によってハイパーパラメータまたはハイパーパラメータ組み合わせの重要度を分析し、学習モデルの性能と関連のあるハイパーパラメータの情報をガイドする段階であって、前記アルゴリズムを利用して探索されたハイパーパラメータ探索空間と前記ハイパーパラメータに対して構成された設定情報の組み合わせを平行座標グラフ上に位置させ、前記ハイパーパラメータの相対的な重要度を前記平行座標グラフの周辺に反映させた図形形態のインタフェースを視覚化する段階を含む、ガイドする段階
    を含む、ハイパーパラメータ調整方法。
  2. 前記視覚化する段階は、
    ハイパーパラメータの組み合わせを探索するための自動化された機械学習アルゴリズムを利用する段階
    を含む、請求項1に記載のハイパーパラメータ調整方法。
  3. 前記視覚化する段階は、
    前記アルゴリズムを利用して探索されたハイパーパラメータ探索空間に対する設定情報を構成するように前記複数のハイパーパラメータの組み合わせの学習モデルに基づき、前記アルゴリズムの性能および前記アルゴリズムの構成を診断するためのアルゴリズムの探索過程を視覚化する段階
    を含む、請求項1に記載のハイパーパラメータ調整方法。
  4. 前記ガイドする段階は、
    前記ハイパーパラメータを示すそれぞれのユーザインタフェースを前記平行座標グラフに構成し、前記構成されたそれぞれのユーザインタフェースを前記ハイパーパラメータの相対的な重要度にしたがって予め設定された方向から位置させ、前記位置させたそれぞれのユーザインタフェースに対応して前記平行座標グラフの座標を並べる段階
    を含む、請求項1乃至3のいずれか1項に記載のハイパーパラメータ調整方法。
  5. 前記ガイドする段階は、
    前記ハイパーパラメータを示すそれぞれのユーザインタフェースに対するユーザとの相互作用により、前記ハイパーパラメータをアクティブ化させる段階
    を含む、請求項に記載のハイパーパラメータ調整方法。
  6. 前記ガイドする段階は、
    前記ユーザが選択したユーザインタフェースに対応するハイパーパラメータの相対的な重要度値を数値化し、前記選択されたハイパーパラメータを示すユーザインタフェースを拡大し、前記選択されたハイパーパラメータと関連性のある他のハイパーパラメータを関連性の値にしたがって配置し、前記選択されたハイパーパラメータに対する設定値の範囲を平行座標グラフと複数のバーで構成された視覚化モジュールによって視覚化する段階
    を含む、請求項に記載のハイパーパラメータ調整方法。
  7. 前記ガイドする段階は、
    前記ハイパーパラメータの重要度算出結果をマトリックス形態によって視覚化する段階
    を含む、請求項に記載のハイパーパラメータ調整方法。
  8. 前記ガイドする段階は、
    前記マトリックス形態で構成された各行に、前記ハイパーパラメータまたは前記ハイパーパラメータの組み合わせの重要度と前記重要度の信頼値を視覚化し、ユーザからの相互作用によって前記各行がアクティブ化することにより、前記重要度に対する詳細情報を提供する段階
    を含む、請求項に記載のハイパーパラメータ調整方法。
  9. 前記ガイドする段階は、
    前記ハイパーパラメータのタイプにしたがい、前記ハイパーパラメータに対する詳細情報を互いに異なるプロットによって視覚化する段階
    を含む、請求項に記載のハイパーパラメータ調整方法。
  10. 前記視覚化する段階は、
    前記学習モデルの性能更新を確認するためのモニタリングビューを提供し、ユーザによって設定情報が構成された、自動化された機械学習アルゴリズムの性能更新記録を折れ線グラフによって視覚化する段階
    を含む、請求項1に記載のハイパーパラメータ調整方法。
  11. 前記視覚化する段階は、
    前記自動化された機械学習アルゴリズムが探索ロジックを繰り返すことによって探索ロジックのインデックスをx軸に表現し、前記自動化された機械学習アルゴリズムによって探索された学習モデルの性能をy軸に表現し、探索ロジックを繰り返すことによって各インデックスで探索された学習モデルを前記x軸とy軸の値にしたがって折れ線グラフの座標上に点で位置させる段階
    を含む、請求項10に記載のハイパーパラメータ調整方法。
  12. 前記視覚化する段階は、
    前記アルゴリズムの性能を確認するための探索ヒストリービューを提供し、自動化された機械学習アルゴリズムを実行する前に設定されたハイパーパラメータ探索空間に基づいて複数のプロットを構成し、前記構成された複数のプロットのそれぞれのプロットによってハイパーパラメータの探索空間に対する探索ヒストリーを可視化する段階
    を含む、請求項1に記載のハイパーパラメータ調整方法。
  13. 前記視覚化する段階は、
    前記構成された複数のプロットを学習モデルの性能向上モニタリングビューのx軸と一致させて自動化された機械学習アルゴリズムの探索ロジックのインデックスを表現し、y軸にハイパーパラメータ探索空間の範囲を表現し、探索ロジックを繰り返すことによって各インデックスで探索された学習モデルをハイパーパラメータの値にしたがって座標上に点で位置させる段階
    を含む、請求項12に記載のハイパーパラメータ調整方法。
  14. 前記視覚化する段階は、
    前記構成された複数のプロットでハイパーパラメータのタイプによって学習モデルに対応するそれぞれの点が重なる場合、斥力を加えて点を位置させる段階
    を含む、請求項13に記載のハイパーパラメータ調整方法。
  15. 前記視覚化する段階は、
    前記自動化された機械学習アルゴリズムの探索ロジック特性にしたがい、点線と曲線を利用して学習モデルに対応するそれぞれの点を連結して学習モデルとの関係を視覚化する段階
    を含む、請求項13に記載のハイパーパラメータ調整方法。
  16. 請求項1~15のうちのいずれか一項に記載のハイパーパラメータ調整方法を前記コンピュータシステムに実行させる、コンピュータプログラム。
  17. 請求項1~15のうちのいずれか一項に記載のハイパーパラメータ調整方法をコンピュータに実行させるためのプログラムが記録されている、非一時的なコンピュータ読み取り
    可能な記録媒体。
  18. コンピュータシステムであって、
    メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサ
    を含み、
    前記少なくとも1つのプロセッサは、
    ハイパーパラメータの組み合わせを探索するためのアルゴリズムを利用して探索された複数のハイパーパラメータの組み合わせの学習モデルに基づき、前記アルゴリズムの探索過程を視覚化する視覚化部、および
    前記視覚化されたアルゴリズムの探索過程によってハイパーパラメータまたはハイパーパラメータの組み合わせの重要度を分析し、学習モデルの性能と関連のあるハイパーパラメータの情報をガイドする最適化部であって、前記アルゴリズムを利用して探索されたハイパーパラメータ探索空間と前記ハイパーパラメータに対して構成された設定情報の組み合わせを平行座標グラフ上に位置させ、前記ハイパーパラメータの相対的な重要度を前記平行座標グラフの周辺に反映させた図形形態のインタフェースを視覚化する、最適化部
    を含む、コンピュータシステム。
  19. 前記視覚化部は、
    ハイパーパラメータの組み合わせを探索するための自動化された機械学習アルゴリズムを利用することを特徴とする、
    請求項18に記載のコンピュータシステム。
JP2021016212A 2020-10-15 2021-02-04 機械学習モデルのハイパーパラメータ最適化過程の分析と調整のためのチューニングアルゴリズム認識視覚化方法 Active JP7348444B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020200133210A KR102560042B1 (ko) 2020-10-15 2020-10-15 기계 학습 모델의 초매개변수(hyperparameter) 최적화 과정의 분석과 조정을 위한 튜닝 알고리즘 인식 시각화 방법
KR10-2020-0133210 2020-10-15

Publications (2)

Publication Number Publication Date
JP2022065599A JP2022065599A (ja) 2022-04-27
JP7348444B2 true JP7348444B2 (ja) 2023-09-21

Family

ID=81386197

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021016212A Active JP7348444B2 (ja) 2020-10-15 2021-02-04 機械学習モデルのハイパーパラメータ最適化過程の分析と調整のためのチューニングアルゴリズム認識視覚化方法

Country Status (2)

Country Link
JP (1) JP7348444B2 (ja)
KR (1) KR102560042B1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116992253A (zh) * 2023-07-24 2023-11-03 中电金信软件有限公司 与目标业务关联的目标预测模型中超参数的取值确定方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190236487A1 (en) 2018-01-30 2019-08-01 Microsoft Technology Licensing, Llc Machine learning hyperparameter tuning tool
US20200097847A1 (en) 2018-09-21 2020-03-26 Gloudera, lnc. Hyperparameter tuning using visual analytics in a data science platform

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190236487A1 (en) 2018-01-30 2019-08-01 Microsoft Technology Licensing, Llc Machine learning hyperparameter tuning tool
US20200097847A1 (en) 2018-09-21 2020-03-26 Gloudera, lnc. Hyperparameter tuning using visual analytics in a data science platform

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PARK Heungseok et al.,HyperTendril: Visual Analytics for User-Driven Hyperparameter Optimization of Deep Neural Networks,IEEE Transactions on Visualization and Computer Graphics [online],2020年10月13日,vol. 27, no. 2,pp. 1407-1416,[2022年11月10日検索],インターネット<URL : https://ieeexplore.ieee.org/document/9222338>

Also Published As

Publication number Publication date
KR20220049737A (ko) 2022-04-22
KR102560042B1 (ko) 2023-07-27
JP2022065599A (ja) 2022-04-27

Similar Documents

Publication Publication Date Title
US11720822B2 (en) Gradient-based auto-tuning for machine learning and deep learning models
JP6555411B2 (ja) 情報処理方法および情報処理装置
JP7041473B2 (ja) 複雑なグラフ検索のための局所的な視覚グラフ・フィルタ
EP2591413A2 (en) Visualizing expressions for dynamic analytics
US11989657B2 (en) Automated machine learning pipeline for timeseries datasets utilizing point-based algorithms
JP7389522B2 (ja) 高速スクリーニングのためのドメイン固有言語インタープリタ及び対話型視覚インターフェース
JP7245961B2 (ja) 対話型機械学習
US11995547B2 (en) Predicting and visualizing outcomes using a time-aware recurrent neural network
JP2024511171A (ja) 動作認識の方法および装置
JP2023544335A (ja) 機械学習モデルの適応訓練システム及び方法
CN114897173A (zh) 基于变分量子线路确定PageRank的方法及装置
JP7348444B2 (ja) 機械学習モデルのハイパーパラメータ最適化過程の分析と調整のためのチューニングアルゴリズム認識視覚化方法
JP2022539290A (ja) ディープラーニングのためのビジュアルプログラミング
JP2022006178A (ja) 深層モデル可視化データの処理方法、装置及び電子機器
JP7317979B2 (ja) ピラミッドレイヤのアーキテクチャを生成するためのシステムおよび方法
US20220044136A1 (en) Automated data table discovery for automated machine learning
Nakariyakul Suboptimal branch and bound algorithms for feature subset selection: A comparative study
US10839936B2 (en) Evidence boosting in rational drug design and indication expansion by leveraging disease association
US20210232607A1 (en) Apparatuses, methods, and computer program products for data perspective generation and visualization
JP7463560B2 (ja) 自動機械学習:統合され、カスタマイズ可能、及び拡張可能なシステム
JP6810780B2 (ja) Cnn基盤イメージ検索方法および装置
Mohit et al. Classification of complex UCI datasets using machine learning algorithms using hadoop
US20240095277A1 (en) Exploration of large-scale data sets
US20230177388A1 (en) Visualization and editing of machine learning models
Singh et al. Design a multi-objective optimization with dynamic and global filter pruning strategy for convolutional neural network

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210204

A80 Written request to apply exceptions to lack of novelty of invention

Free format text: JAPANESE INTERMEDIATE CODE: A80

Effective date: 20210204

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20210414

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20210412

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220412

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220704

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230613

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230710

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20230809

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230810

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20230809

R150 Certificate of patent or registration of utility model

Ref document number: 7348444

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350