WO2024009632A1

WO2024009632A1 - モデル生成装置、モデル生成方法及びプログラム

Info

Publication number: WO2024009632A1
Application number: PCT/JP2023/019002
Authority: WO
Inventors: 雄一尾崎; 耀古田
Original assignee: コニカミノルタ株式会社
Priority date: 2022-07-07
Filing date: 2023-05-22
Publication date: 2024-01-11

Abstract

デバイスタイプ毎の機械学習モデルを効率的に生成するための技術が開示される。本開示の一態様は、ベースモデルを示すベースモデル情報を取得するモデル情報取得部と、前記ベースモデル情報に基づいて、複数のデバイスタイプの各々に対応する個別タイプモデルを生成可能なモデル処理部と、を有する、モデル生成装置に関する。

Description

モデル生成装置、モデル生成方法及びプログラム

　本開示は、モデル生成装置、モデル生成方法及びプログラムに関する。

　近年のディープラーニング技術の進展によって、機械学習モデルが様々な用途に利用されるようになってきている。典型的には、機械学習モデルは、利用環境などに応じて異なる計算リソース上で利用される。例えば、ある機械学習モデルは、高い計算能力を備えたＧＰＵ（Ｇｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）などによって実行される一方、他の機械学習モデルは、限定的な計算能力しか備えないエッジコンピュータなどによって実行されうる。

特開２０２１－１０３４４１号公報

https://pjreddie.com/darknet/yolo/ https://arxiv.org/pdf/1804.02767.pdf

　一般に、機械学習モデルは、利用可能な計算リソースに応じて構築されうる。すなわち、機械学習モデルを動作させるデバイスタイプとして、ＧＰＵ、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、ＦＰＧＡ（Ｆｉｅｌｄ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）などが利用されており、各デバイスタイプの仕様、演算速度、メモリ容量などは異なりうる。このため、各デバイスタイプに対応して機械学習モデルを設計する必要がある。例えば、同一のタスクに対してデバイスタイプに応じて異なる機械学習モデルを別々に構築する必要があり、同一のタスクを実行するデバイスタイプ毎の機械学習モデルを別々に訓練及び生成する必要がある。

　上記問題点に鑑み、本開示の１つの課題は、デバイスタイプ毎の機械学習モデルを効率的に生成するための技術を提供することである。

　本開示の一態様は、ベースモデルを示すベースモデル情報を取得するモデル情報取得部と、前記ベースモデル情報に基づいて、複数のデバイスタイプの各々に対応する個別タイプモデルを生成可能なモデル処理部と、を有する、モデル生成装置に関する。

　本開示によると、デバイスタイプ毎の機械学習モデルを効率的に生成することができる。

図１は、本開示の一実施例によるモデル生成システムを示す概略図である。図２は、一例となるデバイスタイプ毎の機械学習モデルの生成手順を示す概略図である。図３は、本開示の一実施例によるデバイスタイプ毎の機械学習モデルの生成手順を示す概略図である。図４は、本開示の一実施例によるモデル生成装置のハードウェア構成を示すブロック図である。図５は、本開示の一実施例によるモデル生成装置の機能構成を示すブロック図である。図６は、本開示の一実施例による個別モデル生成処理を示す図である。図７は、本開示の一実施例による個別モデル生成処理を示すフローチャートである。図８は、本開示の一実施例による個別モデル生成処理を示す図である。図９は、本開示の一実施例による個別モデル生成処理を示すフローチャートである。図１０は、本開示の一実施例による個別モデル生成処理を示す図である。図１１は、本開示の一実施例による個別モデル生成処理を示すフローチャートである。図１２は、本開示の一実施例による個別モデル生成処理を示す図である。図１３は、本開示の一実施例による個別モデル生成処理を示すフローチャートである。図１４は、本開示の一実施例による個別モデル生成処理を示す図である。図１５は、本開示の一実施例による個別モデル生成処理を示すフローチャートである。図１６は、本開示の一実施例による個別モデル更新処理を示す図である。図１７は、本開示の一実施例による個別モデル更新処理を示すフローチャートである。図１８は、本開示の一実施例による個別モデル更新処理を示す図である。図１９は、本開示の一実施例による個別モデル更新処理を示すフローチャートである。

　以下、図面を参照して本開示の実施の形態を説明する。

　以下の実施例では、対象となるデバイスタイプ（例えば、ＧＰＵ、ＣＰＵ、ＦＰＧＡなど）に共通する機械学習モデル（以降、「ベースモデル」として参照する）から、各デバイスタイプ向けの個別の機械学習モデル（以降、「個別タイプモデル」として参照する）を生成するモデル生成装置が開示される。

　より詳細には、後述される実施例によるモデル生成装置は、ベースモデルを示すベースモデル情報（例えば、ベースモデルのアーキテクチャ情報、パラメータ情報など）を取得すると、取得したベースモデル情報に基づいてベースモデルに対してモデル圧縮（例えば、枝切り処理、量子化など）などを実行し、デバイスタイプに適応化された個別タイプモデルを生成する。

　［モデル生成システム］
　まず、図１を参照して、本開示の一実施例によるモデル生成システム１０を説明する。図１は、本開示の一実施例によるモデル生成システム１０を示す概略図である。図１に示されるように、モデル生成システム１０は、モデルデータベース（ＤＢ）２０、端末３０及びモデル生成装置１００を有する。

　図１に示されるように、ユーザが、特定のタスクのためのベースモデルから特定のデバイスタイプ（例えば、ＧＰＵ、ＣＰＵ、ＦＰＧＡなど）に対応する個別タイプモデルを生成するよう端末３０に指示すると、端末３０は、当該指示をモデル生成装置１００に送信する。当該指示を受信すると、モデル生成装置１００は、モデルＤＢ２０から当該タスクに対するベースモデルのアーキテクチャ情報、パラメータ情報などを示すベースモデル情報を取得する。そして、モデル生成装置１００は、取得したベースモデル情報に基づいて、当該デバイスタイプの仕様、計算能力などに対応した個別タイプモデルを生成する。生成された個別タイプモデルは、モデルＤＢ２０に格納されると共に、操作結果として端末３０に通知されてもよい。

　従来、デバイスタイプに対応した機械学習モデルは、例えば、図２に示されるように、デバイスタイプ毎に用意された機械学習モデルを個別に訓練することによって生成される。例えば、物体検出モデル、異常検知モデルなどの特定のタスクに対して、ＧＰＵ向けモデル、ｘ８６　ＣＰＵ向けモデル、ＦＰＧＡ向けモデル、ＡＲＭ　ＣＰＵ向けモデルなどの異なる個別タイプモデルが用意され、各個別タイプモデルが、訓練データによって通常の訓練処理を介して別々に訓練される。この場合、デバイスタイプ毎の個別タイプモデルは、当該デバイスタイプの仕様、計算能力などに対応したモデルアーキテクチャを有するよう設計され、訓練データによって訓練されうる。あるいは、デバイスタイプ毎の個別タイプモデルは、特定のモデルアーキテクチャを有するよう設計され、訓練データによって訓練され、その後に軽量化及び／又は量子化によって、デバイスタイプの仕様、計算能力などに対応して圧縮されうる。

　一方、本開示による個別モデル生成処理では、図３に示されるように、特定のタスクに対してデバイスタイプに共通する機械学習モデルがベースモデルとして設計及び訓練される。そして、デバイスタイプ毎の個別タイプモデルは、当該デバイスタイプの仕様、計算能力などに対応してベースモデルを軽量化及び／又は量子化することによって生成される。これにより、デバイスタイプ毎に個別タイプモデルを別々に訓練及び生成する従来のアプローチと比較して、共通するベースモデルのみを訓練すればよく、訓練処理に要するコストを低減することが可能になる。

　なお、図１に示された実施例では、ベースモデルは、モデル生成装置１００とは異なる訓練装置（図示せず）によって予め訓練されているが、本開示によるモデル生成システム１０は、これに限定されるものでない。例えば、モデル生成装置１００が、ベースモデルを訓練及び保持してもよい。また、図示された実施例では、モデル生成装置１００は、モデルＤＢ２０からベースモデルを示すベースモデル情報を取得しているが、本開示は、これに限定されるものでない。例えば、モデル生成装置１００は、ベースモデル自体を取得及び保持してもよい。

　ここで、モデル生成装置１００は、サーバ、パーソナルコンピュータ（ＰＣ）、スマートフォン、タブレット等の計算装置によって実現されてもよく、例えば、図４に示されるようなハードウェア構成を有してもよい。すなわち、モデル生成装置１００のそれぞれは、バスＢを介し相互接続されるドライブ装置１０１、ストレージ装置１０２、メモリ装置１０３、プロセッサ１０４、ユーザインタフェース（ＵＩ）装置１０５及び通信装置１０６を有する。

　モデル生成装置１００における後述される各種機能及び処理を実現するプログラム又は指示は、ＣＤ－ＲＯＭ（Ｃｏｍｐａｃｔ　Ｄｉｓｋ－Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、フラッシュメモリ等の着脱可能な記憶媒体に格納されてもよい。当該記憶媒体がドライブ装置１０１にセットされると、プログラム又は指示が記憶媒体からドライブ装置１０１を介しストレージ装置１０２又はメモリ装置１０３にインストールされる。ただし、プログラム又は指示は、必ずしも記憶媒体からインストールされる必要はなく、ネットワークなどを介し何れかの外部装置からダウンロードされてもよい。

　ストレージ装置１０２は、ハードディスクドライブなどによって実現され、インストールされたプログラム又は指示と共に、プログラム又は指示の実行に用いられるファイル、データ等を格納する。

　メモリ装置１０３は、ランダムアクセスメモリ、スタティックメモリ等によって実現され、プログラム又は指示が起動されると、ストレージ装置１０２からプログラム又は指示、データ等を読み出して格納する。ストレージ装置１０２、メモリ装置１０３及び着脱可能な記憶媒体は、非一時的な記憶媒体（ｎｏｎ－ｔｒａｎｓｉｔｏｒｙ　ｓｔｏｒａｇｅ　ｍｅｄｉｕｍ）として総称されてもよい。

　プロセッサ１０４は、１つ以上のプロセッサコアから構成されうる１つ以上のＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、ＧＰＵ（Ｇｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、処理回路（ｐｒｏｃｅｓｓｉｎｇ　ｃｉｒｃｕｉｔｒｙ）等によって実現されてもよく、メモリ装置１０３に格納されたプログラム、指示、当該プログラム若しくは指示を実行するのに必要なパラメータなどのデータ等に従って、後述されるモデル生成装置１００の各種機能及び処理を実行する。

　ユーザインタフェース（ＵＩ）装置１０５は、キーボード、マウス、カメラ、マイクロフォン等の入力装置、ディスプレイ、スピーカ、ヘッドセット、プリンタ等の出力装置、タッチパネル等の入出力装置から構成されてもよく、ユーザとモデル生成装置１００との間のインタフェースを実現する。例えば、ユーザは、ディスプレイ又はタッチパネルに表示されたＧＵＩ（Ｇｒａｐｈｉｃａｌ　Ｕｓｅｒ　Ｉｎｔｅｒｆａｃｅ）をキーボード、マウス等を操作し、モデル生成装置１００を操作する。

　通信装置１０６は、外部装置、インターネット、ＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）、セルラーネットワーク等の通信ネットワークとの有線及び／又は無線通信処理を実行する各種通信回路により実現される。

　しかしながら、上述したハードウェア構成は単なる一例であり、本開示によるモデル生成装置１００は、他の何れか適切なハードウェア構成により実現されてもよい。

　［モデル生成装置］
　次に、図５から図７を参照して、本開示の一実施例によるモデル生成装置１００を説明する。図５は、本開示の一実施例によるモデル生成装置１００の機能構成を示すブロック図である。図５に示されるように、本実施例によるモデル生成装置１００は、モデル情報取得部１１０及びモデル処理部１２０を有する。例えば、モデル情報取得部１１０及びモデル処理部１２０の１つ以上の機能部は、１つ以上のプロセッサ１０４が１つ以上のプログラム又は指示を実行することによって実現されてもよい。

　モデル情報取得部１１０は、ベースモデルを示すベースモデル情報を取得する。具体的には、モデル情報取得部１１０は、デバイスタイプ毎の個別タイプモデルを生成するのに共通して利用されるベースモデルを示すアーキテクチャ情報、パラメータ情報などのベースモデル情報をモデルＤＢ２０から取得する。ベースモデルは、特定のタスク（例えば、物体検出、異常検知など）のために訓練された機械学習モデルであり、典型的には、最も高い計算能力、仕様などを備えたデバイスタイプ（例えば、ＧＰＵなど）向けに構築されたものであってもよい。他方、デバイスタイプ毎の個別タイプモデルは、より限定的な計算能力、仕様などを備えたデバイスタイプ（例えば、ｘ８６　ＣＰＵ、ＦＰＧＡ、ＡＲＭ　ＣＰＵなど）向けの機械学習モデルであり、ベースモデルを軽量化及び／又は量子化することによって、デバイスタイプの仕様、計算能力などに適応化されうる。

　なお、モデル情報取得部１１０は、ベースモデルのアーキテクチャ情報、パラメータ情報などのベースモデル情報の代わりに又は加えて、ベースモデル自体を取得してもよい。モデル情報取得部１１０は、取得したベースモデル自体からアーキテクチャ情報、パラメータ情報などのベースモデル情報を抽出してもよい。

　モデル処理部１２０は、ベースモデル情報に基づいて、デバイスタイプに対応する個別タイプモデルを生成する。具体的には、モデル処理部１２０は、ベースモデル情報に基づいて、ベースモデルに対して枝刈り処理（ｐｒｕｎｉｎｇ）及び量子化（ｑｕａｎｔｉｚａｔｉｏｎ）の一方又は双方を実行し、特定のデバイスタイプの計算能力、仕様などに適応化された個別タイプモデルを生成する。ベースモデル情報に基づいて、複数のデバイスタイプの各々に対応する個別タイプモデルを生成可能とは、例えば、ベースモデル情報を利用して、ＧＰＵのための個別タイプモデル、ｘ８６　ＣＰＵのための個別タイプモデル、ＦＰＧＡのための個別タイプモデル及びＡＲＭ　ＣＰＵのための個別タイプモデルの４つの個別タイプモデルを生成可能であってもよく、いずれか１つの個別タイプモデルを生成可能であってもよい。

　具体的には、モデル処理部１２０は、ベースモデルにおけるノード間の重みが小さい箇所の接続及び／又はノードを削除することによって、ベースモデルを枝刈りしてもよい。例えば、モデル処理部１２０は、特定のデバイスタイプの計算能力、仕様などに対応したノード及び／又はノード間の接続の削除量に従って、ベースモデルを枝刈りしてもよい。これにより、デバイスタイプに対応してベースモデルを軽量化することによって生成された個別タイプモデルを取得することが可能になる。なお、具体的な枝刈り処理は、何れか公知の手法に従って実行されてもよい。

　また、モデル処理部１２０は、ベースモデルのパラメータ（例えば、ノード間の重み、活性化関数のパラメータなど）をより小さいビット数により表現するようにしてもよい。例えば、ベースモデルのノード間の重みが３２ビットで表現されている場合、これを８ビットなどに量子化してもよい。具体的には、モデル処理部１２０は、特定のデバイスタイプの計算能力、仕様などに対応した量子化レベルに従って、ベースモデルのパラメータを量子化してもよい。これにより、デバイスタイプに対応してベースモデルを量子化することによって生成された個別タイプモデルを取得することが可能になる。なお、具体的な量子化処理は、何れか公知の手法に従って実行されてもよい。

　図６は、本開示の一実施例による個別モデル生成処理を示す概略図である。図６に示されるように、モデル情報取得部１１０がベースモデルを示すベースモデル情報を取得すると、モデル処理部１２０は、ベースモデル情報に基づいて個別モデル生成処理を実行し、ベースモデルから特定のデバイスタイプに対応する個別タイプモデルを生成する。図示された実施例では、モデル処理部１２０は、何れかのデバイスタイプに対応する個別モデル生成処理を実行し、共通するベースモデルから当該デバイスタイプに対応する個別タイプモデルを生成する。

　図７は、本開示の一実施例による個別モデル生成処理を示すフローチャートである。当該個別モデル生成処理は、モデル生成装置１００によって実行され、より詳細には、モデル生成装置１００の１つ以上のプロセッサ１０４が１つ以上のメモリ装置１０３に格納された１つ以上のプログラム又は指示を実行することによって実現されてもよい。

　図７に示されるように、ステップＳ１０１において、モデル生成装置１００は、ベースモデル情報を取得する。具体的には、モデル情報取得部１１０は、モデルＤＢ２０から特定のタスク（例えば、物体検出、異常検知など）のために共通して利用されるベースモデルを示すベースモデル情報（例えば、アーキテクチャ情報、パラメータ情報など）を取得する。なお、モデル情報取得部１１０は、ベースモデル情報の代わりに又は加えて、ベースモデル自体を取得してもよい。典型的には、ベースモデルは、最も高い計算能力、仕様などを備えたデバイスタイプ（例えば、ＧＰＵなど）向けに構築された機械学習モデルであってもよい。

　ステップＳ１０２において、モデル生成装置１００は、ベースモデル情報に基づいて、デバイスタイプに対応する個別タイプモデルを生成する。例えば、モデル生成装置１００は、ベースモデル情報に基づいて、複数のデバイスタイプの各々に対応する個別タイプモデルを生成可能であって、複数の個別タイプモデルを生成可能であってもよく、何れか１つの個別タイプモデルを生成可能であってもよい。具体的には、モデル処理部１２０は、ベースモデル情報に基づいてベースモデルに対して枝刈り処理（ｐｒｕｎｉｎｇ）及び量子化（ｑｕａｎｔｉｚａｔｉｏｎ）の一方又は双方を実行し、特定のデバイスタイプの計算能力、仕様などに適応化された機械学習モデルを個別タイプモデルとして生成してもよい。例えば、モデル処理部１２０は、特定のデバイスタイプの計算能力、仕様などに対応したノード及び／又はノード間の接続の削除量に従って、ベースモデルにおけるノード間の重みが小さい箇所の接続及び／又はノードを削除することによってベースモデルを枝刈りしてもよい。また、モデル処理部１２０は、特定のデバイスタイプの計算能力、仕様などに対応した量子化レベルに従って、ベースモデルの重み、活性化関数のパラメータなどを量子化してもよい。なお、具体的な枝刈り処理及び量子化処理は、何れか公知の手法に従って実行されてもよい。

　本実施例によると、特定のタスクに対して共通に利用可能な訓練済みベースモデルから、より限定的な計算能力、仕様などを備えた特定のデバイスタイプに対するデバイスタイプ向けの個別タイプモデルを効率的に取得することができる。

　［変形例１］
　次に、図８及び図９を参照して、本開示の他の実施例による個別タイプ生成処理を説明する。本実施例では、モデル生成部１２０は、ベースモデル情報に基づいて、複数のデバイスタイプの各々に対応するデバイスタイプ毎の個別タイプモデルを生成する個別モデル生成処理を実行する。

　図８は、本開示の一実施例による個別モデル生成処理を示す概略図である。図８に示されるように、モデル情報取得部１１０がベースモデルを示すベースモデル情報を取得すると、モデル処理部１２０は、ベースモデル情報に基づいて、複数のデバイスタイプの各々に対応するデバイスタイプ毎の個別モデル生成処理を実行し、ベースモデルから各デバイスタイプに対応する個別タイプモデルを生成する。図示された実施例では、モデル処理部１２０は、３つのデバイスタイプＡ，Ｂ及びＣに対応する３つの個別モデル生成処理を実行し、共通するベースモデルからデバイスタイプＡ，Ｂ及びＣ向け個別タイプモデルをそれぞれ生成する。

　例えば、３つのデバイスタイプＡ，Ｂ及びＣの計算能力ＣＡ，ＣＢ及びＣＣが、ＣＡ＞ＣＢ＞ＣＣである場合、モデル処理部１２０は、デバイスタイプＡ，Ｂ及びＣに対応する個別タイプモデルＭＡ，ＭＢ及びＭＣに対する枝切りにおいて、ノード及び／又はノード間の接続の削除量ＲＡ，ＲＢ及びＲＣをＲＣ＞ＲＢ＞ＲＡに設定し、ベースモデルを枝刈りしてもよい。同様に、３つのデバイスタイプＡ，Ｂ及びＣがそれぞれ仕様ＳＡ，ＳＢ及びＳＣである場合、モデル処理部１２０は、デバイスタイプＡ，Ｂ及びＣに対応する個別タイプモデルＭＡ，ＭＢ及びＭＣに対する量子化において、仕様ＳＡ，ＳＢ及びＳＣの量子化レベルＱＡ，ＱＢ及びＱＣに対応して共通するベースモデルのパラメータを量子化し、デバイスタイプＡ，Ｂ及びＣ向け個別タイプモデルをそれぞれ生成してもよい。

　図９は、本開示の一実施例による個別モデル生成処理を示すフローチャートである。当該個別モデル生成処理は、モデル生成装置１００によって実行され、より詳細には、モデル生成装置１００の１つ以上のプロセッサ１０４が１つ以上のメモリ装置１０３に格納された１つ以上のプログラム又は指示を実行することによって実現されてもよい。

　図９に示されるように、ステップＳ２０１において、モデル生成装置１００は、ベースモデル情報を取得する。具体的には、モデル情報取得部１１０は、モデルＤＢ２０から特定のタスクのために共通して利用されるベースモデルを示すベースモデル情報を取得する。

　ステップＳ２０２において、モデル生成装置１００は、ベースモデル情報に基づいて、複数のデバイスタイプの各々に対応する個別タイプモデルを生成する。例えば、３つのデバイスタイプＡ，Ｂ及びＣに対応する３つの個別タイプモデルを生成する場合、モデル処理部１２０は、ベースモデル情報に基づいてベースモデルに対して枝刈り処理及び量子化の一方又は双方を実行し、デバイスタイプＡ，Ｂ及びＣの各々の計算能力、仕様などに適応化された個別タイプモデルＭＡ，ＭＢ及びＭＣを生成してもよい。

　本実施例によると、特定のタスクに対して共通に利用可能な訓練済みベースモデルから、より限定的な計算能力、仕様などを備えた複数のデバイスタイプの各デバイスタイプ向けの個別タイプモデルを効率的に取得することができる。

　［変形例２］
　次に、図１０及び図１１を参照して、本開示の他の実施例による個別タイプ生成処理を説明する。本実施例では、モデル生成部１２０は、選択された個別モデル生成処理を実行する。

　図１０は、本開示の一実施例による個別モデル生成処理を示す概略図である。図１０に示されるように、モデル処理部１２０は、選択されたデバイスタイプ向け個別モデル生成処理を実行し、当該デバイスタイプ向け個別モデル生成処理に対応する個別タイプモデルを取得する。図示された実施例では、３つのデバイスタイプＡ，Ｂ及びＣのうちデバイスタイプＢ向け個別モデル生成処理がユーザによって選択され、モデル処理部１２０は、選択されたデバイスタイプＢ向け個別モデル生成処理を実行し、共通するベースモデルからデバイスタイプＢ向け個別タイプモデルを生成する。

　図１１は、本開示の一実施例による個別モデル生成処理を示すフローチャートである。当該個別モデル生成処理は、モデル生成装置１００によって実行され、より詳細には、モデル生成装置１００の１つ以上のプロセッサ１０４が１つ以上のメモリ装置１０３に格納された１つ以上のプログラム又は指示を実行することによって実現されてもよい。

　図１１に示されるように、ステップＳ３０１において、モデル生成装置１００は、ベースモデル情報を取得する。具体的には、モデル情報取得部１１０は、モデルＤＢ２０から特定のタスクのために共通して利用されるベースモデルを示すベースモデル情報を取得する。

　ステップＳ３０２において、モデル生成装置１００は、選択された個別モデル生成処理を受け付ける。具体的には、モデル処理部１２０は、ユーザなどから１つ以上の個別モデル生成処理を識別する識別情報（例えば、プロセスＩＤなど）を受け付け、受け付けた識別情報に対応するデバイスタイプ向け個別モデル生成処理を特定する。

　ステップＳ３０３において、モデル生成装置１００は、選択された個別モデル生成処理を実行する。具体的には、モデル処理部１２０は、ベースモデル情報に基づいて、受け付けた識別情報に対応するデバイスタイプ向け個別モデル生成処理を実行し、対応する個別タイプモデルを取得する。例えば、ユーザからデバイスタイプＢ向け個別モデル生成処理を示す識別情報（例えば、プロセスＩＤ＝Ｂ）を受け付けると、モデル処理部１２０は、デバイスタイプＢ向け個別モデル生成処理を実行し、ベースモデル情報に基づいて、デバイスタイプＢ向け個別タイプモデルを生成する。

　本実施例によると、特定のタスクに対して共通に利用可能なベースモデルに対して、ユーザなどによって選択されたデバイスタイプ向け個別モデル生成処理を実行して、対応する個別タイプモデルを効率的に取得することができる。

　［変形例３］
　次に、図１２及び図１３を参照して、本開示の他の実施例による個別タイプ生成処理を説明する。本実施例では、モデル処理部１２０は、選択されたデバイスタイプに対応する個別モデル生成処理を実行する。

　図１２は、本開示の一実施例による個別モデル生成処理を示す概略図である。図１２に示されるように、モデル処理部１２０は、選択されたデバイスタイプに対応する個別モデル生成処理を実行し、選択されたデバイスタイプに対応する個別タイプモデルを取得する。図示された実施例では、３つのデバイスタイプＡ，Ｂ及びＣのうちデバイスタイプＣがユーザによって選択され、モデル処理部１２０は、選択されたデバイスタイプＣ向け個別モデル生成処理を実行し、共通するベースモデルからデバイスタイプＣ向け個別タイプモデルを生成する。

　図１３は、本開示の一実施例による個別モデル生成処理を示すフローチャートである。当該個別モデル生成処理は、モデル生成装置１００によって実行され、より詳細には、モデル生成装置１００の１つ以上のプロセッサ１０４が１つ以上のメモリ装置１０３に格納された１つ以上のプログラム又は指示を実行することによって実現されてもよい。

　図１３に示されるように、ステップＳ４０１において、モデル生成装置１００は、ベースモデル情報を取得する。具体的には、モデル情報取得部１１０は、モデルＤＢ２０から特定のタスクのために共通して利用されるベースモデルを示すベースモデル情報を取得する。

　ステップＳ４０２において、モデル生成装置１００は、選択されたデバイスタイプを受け付ける。具体的には、モデル処理部１２０は、ユーザなどから１つ以上のデバイスタイプを識別する識別情報（例えば、デバイスＩＤなど）を受け付け、受け付けた識別情報に対応するデバイスタイプ向け個別モデル生成処理を特定する。

　ステップＳ４０３において、モデル生成装置１００は、選択されたデバイスタイプに対応する個別モデル生成処理を実行する。具体的には、モデル処理部１２０は、ベースモデル情報に基づいて、受け付けた識別情報に対応するデバイスタイプのデバイスタイプ向け個別モデル生成処理を実行し、対応する個別タイプモデルを取得する。例えば、ユーザからデバイスタイプＣを示す識別情報（例えば、デバイスＩＤ＝Ｃ）を受け付けると、モデル処理部１２０は、デバイスタイプＣ向け個別モデル生成処理を実行し、ベースモデル情報に基づいて、デバイスタイプＣ向け個別タイプモデルを生成する。

　本実施例によると、特定のタスクに対して共通に利用可能なベースモデルから、ユーザなどによって選択されたデバイスタイプに対応する個別モデル生成処理を実行して、対応する個別タイプモデルを効率的に取得することができる。

　［変形例４］
　次に、図１４及び図１５を参照して、本開示の他の実施例による個別タイプ生成処理を説明する。本実施例では、モデル処理部１２０は、個別タイプモデルに関するシミュレーション結果をユーザに提示する。

　図１４は、本開示の一実施例による個別モデル生成処理を示す概略図である。図１４に示されるように、モデル処理部１２０は、各デバイスタイプ向け個別タイプモデルの予測精度、計算速度などの性能を示すシミュレーション結果を予め保持し、ユーザが個別モデル生成処理又はデバイスタイプを選択する際の参考情報として、各デバイスタイプ向け個別タイプモデルのシミュレーション結果を提示してもよい。図示された実施例では、モデル処理部１２０は、３つのデバイスタイプＡ，Ｂ及びＣ向けのシミュレーション結果をユーザに提示する。ユーザは、提示されたシミュレーション結果を参照して、デバイスタイプＣ向け個別モデル生成処理又はデバイスモデルＣを選択すると、モデル処理部１２０は、選択されたデバイスタイプＣ向け個別モデル生成処理を実行し、デバイスタイプＣ向け個別タイプモデルを取得する。

　図１５は、本開示の一実施例による個別モデル生成処理を示すフローチャートである。当該個別モデル生成処理は、モデル生成装置１００によって実行され、より詳細には、モデル生成装置１００の１つ以上のプロセッサ１０４が１つ以上のメモリ装置１０３に格納された１つ以上のプログラム又は指示を実行することによって実現されてもよい。

　図１５に示されるように、ステップＳ５０１において、モデル生成装置１００は、ベースモデル情報を取得する。具体的には、モデル情報取得部１１０は、モデルＤＢ２０から特定のタスクのために共通して利用されるベースモデルを示すベースモデル情報を取得する。

　ステップＳ５０２において、モデル生成装置１００は、デバイスタイプ毎のシミュレーション結果を提示する。具体的には、モデル処理部１２０は、ユーザが個別モデル生成処理又はデバイスタイプを選択する際の参考情報として、各デバイスタイプ向け個別タイプモデルの予測精度、計算速度などの性能を示すシミュレーション結果をユーザに提示してもよい。

　ステップＳ５０３において、モデル生成装置１００は、選択された個別モデル生成処理又は選択されたデバイスタイプを受け付ける。具体的には、モデル処理部１２０は、ユーザなどから１つ以上の個別モデル生成処理を識別する識別情報（例えば、プロセスＩＤなど）、又はデバイスタイプを識別する識別情報（例えば、デバイスＩＤなど）を受け付け、受け付けた識別情報に対応するデバイスタイプ向け個別モデル生成処理を特定する。

　ステップＳ５０４において、モデル生成装置１００は、選択された個別モデル生成処理又は選択されたデバイスタイプに対応する個別モデル生成処理を実行する。具体的には、モデル処理部１２０は、ベースモデル情報に基づいて、受け付けた識別情報に対応するデバイスタイプ向け個別モデル生成処理を実行し、対応する個別タイプモデルを取得する。例えば、ユーザからデバイスタイムＣ向け個別モデル生成処理を示す識別情報（例えば、プロセスＩＤ＝Ｃ）、又はデバイスタイプＣを示す識別情報（例えば、デバイスＩＤ＝Ｃ）を受け付けると、モデル処理部１２０は、デバイスタイプＣ向け個別モデル生成処理を実行し、ベースモデル情報に基づいて、デバイスタイプＣ向け個別タイプモデルを生成する。

　本実施例によると、各デバイスモデルの個別タイプモデルに関するシミュレーション結果をユーザに提示し、特定のタスクに対して共通に利用可能なベースモデルから、ユーザなどによって選択された個別モデル生成処理、又は選択されたデバイスタイプに対応する個別モデル生成処理を実行して、対応する個別タイプモデルを効率的に取得することができる。

　［変形例５］
　次に、図１６及び図１７を参照して、本開示の一実施例による個別タイプ更新処理を説明する。本実施例では、訓練データによってベースモデルが更新されると、モデル処理部１２０は、更新されたベースモデル情報に基づいて個別タイプモデルを更新してもよい。なお、本実施例によるベースモデルの更新は、モデル生成装置１００によって実行されてもよいし、モデル生成装置１００とは別の訓練装置（図示せず）によって実行されてもよい。

　図１６は、本開示の一実施例による個別モデル更新処理を示す概略図である。図１６に示されるように、更新用訓練データによってベースモデルに対してベースモデル更新処理が実行され、更新されたベースモデルを示すベースモデル情報を取得すると、モデル処理部１２０は、更新されたベースモデル情報に基づいて個別モデル更新処理を実行し、更新されたベースモデルから特定のデバイスタイプに対応する個別タイプモデルを更新する。図示された実施例では、モデル処理部１２０は、何れかのデバイスタイプに対応する個別モデル更新処理を実行し、更新された共通するベースモデルから当該デバイスタイプに対応する個別タイプモデルを生成する。

　図１７は、本開示の一実施例による個別モデル更新処理を示すフローチャートである。当該個別モデル更新処理は、モデル生成装置１００によって実行され、より詳細には、モデル生成装置１００の１つ以上のプロセッサ１０４が１つ以上のメモリ装置１０３に格納された１つ以上のプログラム又は指示を実行することによって実現されてもよい。

　図１７に示されるように、ステップＳ６０１において、モデル生成装置１００は、更新されたベースモデル情報を取得する。具体的には、モデル情報取得部１１０は、モデルＤＢ２０から更新されたベースモデルを示すベースモデル情報（例えば、アーキテクチャ情報、パラメータ情報など）を取得する。なお、モデル情報取得部１１０は、更新されたベースモデル情報の代わりに又は加えて、更新されたベースモデル自体を取得してもよい。

　ステップＳ６０２において、モデル生成装置１００は、更新されたベースモデル情報に基づいて、デバイスタイプに対応する個別タイプモデルを更新する。具体的には、モデル処理部１２０は、更新されたベースモデル情報に基づいて、更新されたベースモデルに対して枝刈り処理及び量子化の一方又は双方を実行し、更新されたベースモデルに基づいて、特定のデバイスタイプ向け個別タイプモデルを更新してもよい。

　本実施例によると、ベースモデルの更新に対応して、個別タイプモデルもまた更新することができる。

　［変形例６］
　次に、図１８及び図１９を参照して、本開示の他の実施例による個別タイプ更新処理を説明する。本実施例では、モデル処理部１２０は、更新されたベースモデル情報に基づいて、複数のデバイスタイプの各々に対応するデバイスタイプ毎の個別タイプモデルを更新する個別モデル更新処理を実行してもよい。

　図１８は、本開示の一実施例による個別モデル更新処理を示す概略図である。図１８に示されるように、更新用訓練データによってベースモデルに対してベースモデル更新処理が実行され、更新されたベースモデルを示すベースモデル情報を取得すると、モデル処理部１２０は、更新されたベースモデル情報に基づいて、複数のデバイスタイプの各々に対応するデバイスタイプ毎の個別モデル更新処理を実行し、更新されたベースモデルから各デバイスタイプに対応する個別タイプモデルを更新する。図示された実施例では、モデル処理部１２０は、３つのデバイスタイプＡ，Ｂ及びＣに対応する３つの個別モデル更新処理を実行し、更新されたベースモデルから３つの個別タイプモデルを更新する。

　図１９は、本開示の一実施例による個別モデル更新処理を示すフローチャートである。当該個別モデル更新処理は、モデル生成装置１００によって実行され、より詳細には、モデル生成装置１００の１つ以上のプロセッサ１０４が１つ以上のメモリ装置１０３に格納された１つ以上のプログラム又は指示を実行することによって実現されてもよい。

　図１９に示されるように、ステップＳ７０１において、モデル生成装置１００は、更新されたベースモデル情報を取得する。具体的には、モデル情報取得部１１０は、モデルＤＢ２０から更新されたベースモデルを示すベースモデル情報を取得する。

　ステップＳ７０２において、モデル生成装置１００は、更新されたベースモデル情報に基づいて、複数のデバイスタイプの各々に対応する個別タイプモデルを更新する。例えば、３つのデバイスタイプＡ，Ｂ及びＣに対応する３つの個別タイプモデルを更新する場合、モデル処理部１２０は、更新されたベースモデル情報に基づいてベースモデルに対して枝刈り処理及び量子化の一方又は双方を実行し、デバイスタイプＡ，Ｂ及びＣの個別タイプモデルを更新してもよい。

　なお、上述した個別モデル更新処理は、更新されたベースモデルに対して、上述したような枝刈り処理及び／又は量子化を実行することによって実現されてもよい。また、複数の個別モデル更新処理のうち何れの個別モデル更新処理を実行するかは、個別モデル更新処理を示す識別情報（例えば、プロセスＩＤなど）又はデバイスタイプ（例えば、デバイスタイプＩＤなど）に基づいて決定されてもよい。また、ユーザが個別モデル更新処理又はデバイスタイプを選択する際、更新される個別タイプモデルのシミュレーション結果が提示されてもよい。

　本実施例によると、ベースモデルの更新に応じて、複数のデバイスタイプの各デバイスタイプ向けの個別タイプモデルもまた更新することができる。

　なお、以上の説明に関して更に以下の付記を開示する。
　（付記１）
　ベースモデルを示すベースモデル情報を取得するモデル情報取得部と、
　前記ベースモデル情報に基づいて、複数のデバイスタイプの各々に対応する個別タイプモデルを生成可能なモデル処理部と、
　を有する、モデル生成装置。
　（付記２）
　前記モデル処理部は、前記ベースモデルに対して枝刈り処理及び量子化の一方又は双方を実行する、付記１に記載のモデル生成装置。
　（付記３）
　前記モデル処理部は、前記ベースモデル情報に基づいて、複数のデバイスタイプの各々に対応する個別タイプモデルを生成する生成処理を実行する、付記１又は付記２に記載のモデル生成装置。
　（付記４）
　前記モデル処理部は、選択された前記生成処理を実行する、付記３に記載のモデル生成装置。
　（付記５）
　前記モデル処理部は、選択されたデバイスタイプに対応する前記生成処理を実行する、付記３又は付記４に記載のモデル生成装置。
　（付記６）
　前記モデル処理部は、前記個別タイプモデルに関するシミュレーション結果をユーザに提示する、付記３から付記５のいずれか１つに記載のモデル生成装置。
　（付記７）
　訓練データによって前記ベースモデルが更新されると、前記モデル処理部は、前記更新されたベースモデルによって前記個別タイプモデルを更新する、付記１から付記６のいずれか１つに記載のモデル生成装置。
　（付記８）
　前記モデル処理部は、前記更新されたベースモデル情報に基づいて、複数のデバイスタイプの各々に対応するデバイスタイプ毎の個別タイプモデルを更新する更新処理を実行する、付記７に記載のモデル生成装置。
　（付記９）
　ベースモデルを示すベースモデル情報を取得することと、
　前記ベースモデル情報に基づいて、複数のデバイスタイプの各々に対応する個別タイプモデルを生成することと、
　を有する、コンピュータが実行するモデル生成方法。
　（付記１０）
　ベースモデルを示すベースモデル情報を取得することと、
　前記ベースモデル情報に基づいて、複数のデバイスタイプの各々に対応する個別タイプモデルを生成することと、
　をコンピュータに実行させるプログラム。

　以上、本開示の実施例について詳述したが、本開示は上述した特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本開示の要旨の範囲内において、種々の変形・変更が可能である。

　２０２２年７月７日出願の特願２０２２－１０９７５１号の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。

　１０　モデル生成システム
　２０　モデルデータベース（ＤＢ）
　３０　端末
　１００　モデル生成装置
　１１０　モデル情報取得部
　１２０　モデル処理部

Claims

　ベースモデルを示すベースモデル情報を取得するモデル情報取得部と、
　前記ベースモデル情報に基づいて、複数のデバイスタイプの各々に対応する個別タイプモデルを生成可能なモデル処理部と、
　を有する、モデル生成装置。
　前記モデル処理部は、前記ベースモデルに対して枝刈り処理及び量子化の一方又は双方を実行する、請求項１に記載のモデル生成装置。
　前記モデル処理部は、前記ベースモデル情報に基づいて、複数のデバイスタイプの各々に対応する個別タイプモデルを生成する生成処理を実行する、請求項１に記載のモデル生成装置。
　前記モデル処理部は、選択された前記生成処理を実行する、請求項３に記載のモデル生成装置。
　前記モデル処理部は、選択されたデバイスタイプに対応する前記生成処理を実行する、請求項３に記載のモデル生成装置。
　前記モデル処理部は、前記個別タイプモデルに関するシミュレーション結果をユーザに提示する、請求項３に記載のモデル生成装置。
　訓練データによって前記ベースモデルが更新されると、前記モデル処理部は、前記更新されたベースモデルによって前記個別タイプモデルを更新する、請求項１に記載のモデル生成装置。
　前記モデル処理部は、前記更新されたベースモデル情報に基づいて、複数のデバイスタイプの各々に対応するデバイスタイプ毎の個別タイプモデルを更新する更新処理を実行する、請求項７に記載のモデル生成装置。
　ベースモデルを示すベースモデル情報を取得することと、
　前記ベースモデル情報に基づいて、複数のデバイスタイプの各々に対応する個別タイプモデルを生成することと、
　を有する、コンピュータが実行するモデル生成方法。
　ベースモデルを示すベースモデル情報を取得することと、
　前記ベースモデル情報に基づいて、複数のデバイスタイプの各々に対応する個別タイプモデルを生成することと、
　をコンピュータに実行させるプログラム。